MAXQDAによる単語の組合せ分析

MAXQDA Blog 翻訳版

Monday, November 21, 2022

質的内容分析は、多くの科学分野において重要な研究ツールであり、多くの異なるアプローチやテクニックを含んでいます。研究者は内容分析を用いて、単語、単語の組合せ、概念、テーマの存在、意味、関係を判断し、分析します。今月のブログでは、内容分析の一つの側面である単語の組合せ分析と、 MAXQDA を使ってどのようにそれを実行できるかに焦点を当てます。

(注: この記事中で取り上げられている機能の一部(見出し語化など)は、日本語テキストには未対応です)

単語の組合せを分析する動機

データ全体の個々の単語の頻度と分布を分析することで、テキストの一般的なトピックとセンチメント(感情)を特定することができます。頻繁に使用される単語は、テキストで議論されている重要な概念を示し、否定的な意味合いを持つ単語は、トピックに対する否定的な感情を反映している可能性が高いといえます。ただし、単一の単語の分析にとどまらずより深く掘り下げて単語間の関係を理解したい場合は、単語の組合せ分析が有効です。

データ全体でどのような単語の並びが一般的かを調べることで、その言語がどのように使用されているかについての貴重な洞察を得ることができます。例えば、繰り返し使われる言葉のパターン、つまり繰り返し使われる言葉の組合せは、言語の複雑さ、言語能力、一般的なスタイルなど、言語の基本的な特性を反映しています。単語の組合せの分析により、例えば、異なる新聞で使用されている言語の複雑さを比較することができます。

さらに、単語の組合せ分析を使用して、単一の用語や概念の理解を深めることができます。分析対象の用語の前後にどのような単語が多く含まれるかを調べることで、分析対象の用語に対する文脈や感情について貴重な知見を得ることができます。例えば、肯定的な意味を持つ単語が、ある話題に対する人の肯定的な態度を本当に反映しているのか、それとも皮肉で使われているのかは、その単語の文脈を考慮して初めて判断できます。

MAXQDAを単語の組合せ分析に使用する

質的および混合法のデータ分析に最もよく使われるソフトウェアである MAXQDA が提供する、単語の組合せ分析の様々なツールからいくつかをこの記事で紹介します。特に、MAXDictio(MAXQDA のアドオンモジュールで、定量的なコンテンツ分析のための高度な機能を持つ)のツールは、単語の組合せ分析に有用です。さらに、最頻出語に加え、頻出する単語の組合せも視覚化できる、新しい単語エクスプローラとワードクラウドを紹介します。

MAXDictioタブのツール群

Tip: MAXDictio は、MAXQDA Plus のライセンスに付属しているアドオンモジュールです。これは、言葉の組合せの分析など、定量的な内容分析のための幅広い機能を提供します。
MAXDictioの詳細(開発元のサイトへ)


おとぎ話に登場する言葉の組合せを探る

単語の組合せを分析するための模範的なデータセットとして、グリム童話を使用します。グリム童話は、1812年から1858年にかけてヤーコブ・グリムとウィルヘルム・グリムによって出版されたドイツのおとぎ話集です。童話には独特の言い回しや典型的な言葉の組合せをするという特徴があります。”Once upon a time(むかしむかし)”という単語の組合せは、おとぎ話に登場する典型的な言葉の組合せの好例です。ここでは、グリム童話の中でも特に人気のある4つの童話: 『ヘンゼルとグレーテル』、『ラプンツェル』、『かえるの王さま』、『勇ましいちびの仕立て屋』の4つの童話を取り上げます。

『グリム童話集』第1巻のタイトルページ (1819) 第2版

童話を読んでみたいですか?
グリム童話の全集はこちらでお読みいただけます。

言葉の組み合わせの分析に最適なツール

名は体を表す: MAXQDAの単語の組合せ分析

MAXDictioタブの[単語の組合せ]

単語の組合せの頻度、順位、分布の分析に関心がありますか?それなら、MAXDictioの単語の組合せツールが最適です。単語の組合せツールを使用すると、最も頻繁に使用される単語の組合せの概要を素早く把握でき、テキスト間で簡単に比較することができます。設定ダイアログには、見出し語化(同じ語幹を共有する単語の要約)や除外語リストの適用(より意味のある結果を得るため)など、単語の組合せ分析をニーズに合わせて調整するためのオプションが多数用意されています。もちろん、単語の組合せを構成する単語の数を定義することもできます。

単語の組合せ設定ウィンドウ

単語の組合せの分析の結果は、デフォルトでは頻度(降順)で並べられた表として表示されます。一度に複数の文書の語句の組合せを分析する場合、文書ごとに結果を区別することができます。この場合、結果の表は、文書ごとにそれぞれの頻度を含む個別の列で構成されます。列のヘッダー(文書名)をクリックすると、そのおとぎ話における頻度に従って、単語の組合せを並べることができます。単語の組合せの列のエントリをダブルクリックすると、クリックした単語の組合せのすべての出現回数、文脈、およびテキスト内の位置を含むリストが表示されます。単語組合せツールは、多くの場合単語組合せ分析の出発点となります。なぜなら、概要表により、詳しく調べる価値のあるキーワードや単語の組合せを特定するなど、最初の推論をすばやく行うことができるからです。

単語の組合せ表

グリム童話における単語の組合せ

グリム童話の分析では、“the little tailor(ちびの仕立て屋)”という言葉の組合せが22回と圧倒的に多いものの、この言葉の組合せは分析対象の童話のうち1つしか出てきていません(”Document(文書)”欄を参照)。どうやら、この童話では主人公が名前で呼ばれることはないようです。その代わり、主人公は職業と “little “という形容詞で表現されています。物語の中で主人公が巨人と戦うことになるので、これは興味深い点です。“the little tailor(ちびの仕立て屋)”という言葉の組合せを繰り返し使うことで、特に巨人と比べて不利である点を強調し、物語をより盛り上げています。

勇敢なちびの仕立て屋が巨人を挑発する

興味深いことに、最も頻度の高い単語の組合せの中には、”forest(森)”という単語を含むものが多く見られます(例:”into the forest (森の中へ)”、”the forest and (森と)”、”in the forest(森の中で)”、”of the forest (森の)”)。このことは、「森」がグリム童話に繰り返し登場するトピックであることを示唆しており、さらに調査する価値がありそうです。


Tip: 英語のテキストで単語の組合せを分析する場合、MAXQDAは属格の’sを、1つの単語として認識します(例: “Rapunzel’s hair(ラプンツェルの髪)”は3つの単語としてカウントされます)。セパレータ(分離標識)のリストに ” ‘ ” を追加/削除することで、ユーザーはこれを簡単に管理することができます。


最も頻度の高い単語の組合せを視覚的に

単語の組合せの結果表は、概要を把握し、文書間の出現頻度を簡単に比較することができます。しかし、出版物やポスターの場合、この表は少し退屈に見えるかもしれません。単語の組合せの分析結果を視覚的にもっと魅力的に見せるために、単語の組合せのワードクラウドをワンクリックで作成することができます。結果表のツールバーにあるワードクラウドのアイコンをクリックするだけで、結果表 のワードクラウドを作成することができます。MAXQDA では、ほとんどいつもそうですが、この視覚化ツールはインタラクティブなものです。

単語の組合せ分析のためのワードクラウド

各童話のワードクラウドを個別に作成したい場合は、各文書に対して個別に単語の組合せ分析を実行します。以下に、各おとぎ話について個別に作成したワードクラウドのスクリーンショットを掲載します。ご覧のように、童話には非常に特徴的な単語の組合せが使われています。童話に詳しい方なら、どのワードクラウドがどの童話のものか、すぐに分かるのではないでしょうか。登場人物の名前を除いても(登場人物名をス除外語リスト加える)、ワードクラウドに対応する童話に容易にマッチングさせることができます。このように、ワードクラウドは言葉の組合せに関する質的な違いがあるかを迅速に識別するために使用できます。

おとぎ話ごとの単語の組合せのワードクラウド

文脈つきキーワード: 単語の組合せ解析のために、単語と文脈語の数を定義する

MAXDictioタブの[文脈つきキーワード]

単語の組合せ分析に非常に有効なもう一つのツールは、MAXDictio のアドオンモジュールに含まれている文脈つきキーワード(Keyword-in-context)です。文脈つきキーワードでは、関連する単語を検索することができますが、最も重要なことは、その単語を文脈の中で表示することができる点です。これは、例えば、あるキーワードが様々な文章でどのように使われているのかを知るために、言葉の文脈をより深く掘り下げたい場合に特に有効な機能です。文脈語の数は自由に定義でき、文書変数を含めることも可能です。

文脈つきキーワードの設定

グリム童話の単語の組合せ分析では、”forest(森)”という言葉が最も頻出する組合せに含まれていることが分かりました。”forest(森)”という言葉がグリム童話全体に共通する魅力を持っているかどうか、言葉の文脈を深く掘り下げてみるのも面白いかもしれません。そこで、「検索語リスト」に”forest(森)”を追加し、文脈(前後7語)を定義して、「OK」をクリックしました。単語の組合せツールの結果は、テキストパッセージの位置、前の単語、キーワード、後の単語を含む表として表示されます。この表は、いつものようにインタラクティブに表示されます。項目をクリックすると、文書ブラウザで対応する文章が強調表示され、ジャンプします。

”forest(森)”の文脈つきキーワード

結果表を見て童話間の文章を比較すると、”forest(森)”という言葉が童話間で画一的な魅力を示すものではないことがわかります。『ヘンゼルとグレーテル』では森は否定的な意味を持ち、『ラプンツェル』では森は王子の憧れの場所です。『勇ましいちびの仕立て屋』では、森は巨人やユニコーンが住む神秘的な場所として描かれています。もっと詳しく言うと 『ヘンゼルとグレーテル』では、森は暗く危険な場所として描かれており、子供たちはそれを恐れています。例えば次のように説明されています。「子供たちを森に一人にしていいのか?」「森から出られず、とてもお腹が空いていた」。一方、『ラプンツェル』では、『ヘンゼルとグレーテル』のように森が登場する頻度は低く、「毎日、森に出かけていって、話を聞いていた」など、言葉の文脈はよりポジティブなものとなっています。王子が自発的に森を訪れるのは、ラプンツェルが住んでいる場所だからであり、ヘンゼルとグレーテルは非自発的に森に連れてこられたのです。


Tip: 単語ではなく、特定の単語の組合せに興味がある場合、検索キーワードとして単語の組合せを挿入すると、その単語の組合せのすべての出現箇所とそれぞれの文脈を検索することができます。


対話型単語ツリー: 枝分けを使った単語の組合せ分析

MAXDictioタブの[対話型単語ツリー]

対話型単語ツリーは、単語の組合せの分析に最適なツールです。これは、文脈つきキーワード分析をより視覚的に表現するもので、単語の組合せをそれぞれの文脈で探索し分析することができます。このツールは、単語の組合せをツリーとして視覚化し、個々の枝を簡単に探索することができます。対話型単語ツリーを開くと、最も頻度の高い単語がルートとして表示されます。その後に続く(または先行する)単語は、枝分かれしてルートに接続されています。単語をクリックして単語の組合せに追加し、その文脈を視覚的に探索することも、上部の検索フィールドに入力して特定の単語の組合せを検索することも可能です。さらに、後続のテキスト、先行するテキスト、またはその両方に興味があるかどうかを決定することができます。ワードツリーでは、単語を文脈で見るだけでなく、単語の頻度も見ることができます。単語の上にカーソルを置くと、その単語の頻度がツールチップに表示されます。

『かえるの王さま』の対話型ワードツリー

単語エクスプローラー: 単語やフレーズを分析し、最も頻繁に使用される単語の組合せを表示

分析タブの[単語エクスプローラー]

単語エクスプローラーは、MAXQDA 2022 の新しいツールの 1 つです。単語エクスプローラは、インタラクティブなダッシュボードを用いて、ある単語やフレーズが、いつ、どのように、資料の中で使われているか、また、文章の中で使われているかについて、様々な角度から表示します。このツールは、単語の出現頻度を調べるだけでなく、検索した単語が最も頻繁に組み合わされる単語を特定することができます。検索ワードを入力して[エクスプローラー]をクリックするだけです。しかし、それだけではありません。このツールは、単一の単語を分析するだけでなく、単語の組合せを検索用語として使用することもできます。これは、特定の単語の組合せに先験的に興味がある場合に特に便利です。このツールはインタラクティブに動作するため、ダッシュボードから簡単にソースや頻度リストを表示することができます。単語エクスプローラーには、停止語リストや見出し語化などの機能があり、単語の組合せの分析に磨きをかけることができます。

単語エクスプローラーによる“king” と “queen”の比較

単語エクスプローラーで“king” と“queen”を比較する

Queen(女王)、King(王)、Prince(王子)、Princess(姫)は、おとぎ話に登場する代表的な人物です。そこで、これらの用語がいつどのように使われているのか、最も頻度の高い単語の組合せも含めて調べてみました。上のスクリーンショットにあるように、分析した童話のすべてに王が登場するのに対し、女王は『勇敢なちびの仕立て屋』に一度登場するだけです。これは、グリム童話における女性権力者と男性権力者の間のアンバランスを反映しています。また、最も頻出する単語の組合せの項を見ると、”queen(女王)”という単語の一回のみ出現した箇所でも王が登場します(“queen heard her husband(女王は夫の声を聞いた)”)。それに比べ、王という言葉は“the king’s son(王の息子)“という組合せが最も多く、これも権力者である男性を表しています。このように、王は女王よりも重要視されており、当時の王政の家父長制的な構造を反映していることがわかります。

単語エクスプローラーの詳細(開発元のサイトへ)

まとめ

言葉の組合せの分析によって研究の幅を広げることは、非常に価値があります。MAXQDA を使って語句の組合せの分析をすることによって、おそらくは予期していなかったような語句間のつながりを見出すことができます。さらに、単語の組合せ分析は、単一の用語や概念に対する理解を深めるために使えます。単語の組合せ分析によって、あなたは多くの異なる研究課題に取り組むことができ、 MAXQDAでは、多くの異なるファイル形式を使を研究に用いることができます。MAXQDA Standardライセンスをお持ちの方が単語の組合せ分析に取り組みたい場合は、 MAXQDA Plus ライセンスにアップグレードできます。

MAXQDAでの単語ベースの分析についてもっと学びたいのであれば、このチュートリアルはあなたにとって興味深いものでしょう。


このサイトをフォロー

質的データ分析研究会の最新情報を受け取る

月1~2回、本サイトの更新情報、質的研究や混合研究法、ツールの使い方、イベント情報などEmailで受け取ることができます。