テキストマイニングとは、膨大なテキストデータから価値のある情報を抽出することができる手法です。
インターネットやSNSで日々増え続けるテキストデータをどのように活用できるのか、テキストマイニングの基本的な概念から手法まで解説します。
テキストマイニングとは
テキストマイニングとは、大量の自由な形式で書かれた文章を自然言語処理や機械学習の手法を活用し、単語や文節に分解して有益な情報を抽出する分析技術です。
対象となる文章はXやInstagramなどのSNS、口コミ、顧客からのアンケートの回答、コールセンター記録などがあります。
テキストマイニングは、元々データマイニング(=大量のデータから有益な情報やパターンを抽出する技術)から派生した手法で、分析対象がテキストデータに限定されてます。
テキストマイニングが重要な理由

ビックデータの分析・活用が欠かせない時代となった昨今、テキストマイニングはとても重要な要素となります。
ビッグデータにはさまざまな種類が存在しますが、数値に表される「定量データ」と数値に表すことができない感覚的な側面を持つ「定性データ」の2つに大きく分けられます。
定量データと定性データの違い
購買データを集め分析することで、「いつ・誰が・どこで・何を購入しているか」「購入者が一緒に買うことが多い商品は何か」などは数字で見えてきます。
しかし、そのデータだけでは「なぜその商品が売れているor売れていないのか」「何が購入の決め手なのか」といった数字で示すことのできない部分が把握できません。
そこで重要になってくるのが定性データです。
「売れる理由・売れない理由」を知るために最適な方法はお客様の声に耳を傾けることです。
SNSで発信された膨大な文字情報や、コールセンターに寄せられる声、アンケートの回答には商品に対する感想や不満、要望などさまざまなリアルな声が埋もれています。
このような定性データを集めることで、いつ、どのような層のユーザーから、どのような内容の意見が、どのくらいの量あるのかがテキストデータから読み解けます。
そうすることで「売れる理由・売れない理由」が可視化でき、いち早く対応策を考えることができるのです。
文字ベースである定性データは、抽出したり整理したりするのに時間がかかります。
少ないサンプル数のアンケート結果ならまだしも、1日に数百万、数千万の情報が行き交うSNS上のテキストデータを全て人の目で確認するのは不可能でしょう。
テキストマイニングの技術を使うことで、膨大な文字ベースの情報を抽出し整理することが可能になるのです。
テキストマイニングの手法
テキストマイニングでよく用いられる手法は以下の4つです。
センチメント分析
センチメント分析は、主にSNS上の文章から顧客や消費者の感情を分析する手法です。
一般的に、SNS上の特定のテーマに対するコメントを「肯定的」「中立的」「否定的」の3つに整理し、分類します。
「好き」「欲しい」は「肯定的」、「嫌い」「使いたくない」は「否定的」、それ以外は「中立的」と分けていくため、「ポジネガ分析」「ポジネガ判定」などと呼ばれることもあります。
ただ、例えば「ヤバイ」のように、前後の文脈次第で「肯定的」「否定的」どちらにも受け取れる言葉の分類は難しいという欠点もあります。
コレスポンデンス分析
コレスポンデンス分析は、アンケート結果などをクロス集計表にまとめ、散布図として視覚的にわかりやすく提示する分析手法です。
主に自社のブランドイメージや強み、競合他社と比較しながらポジションの違いを把握するために使われます。
▶︎関連記事:コレスポンデンス分析とは?メリットや注意点を詳しく解説
主成分分析
主成分分析は、多くの変数を少数の「主成分」に集約して、データの特徴をシンプルに表現する手法です。
主にビッグデータなど膨大なデータから関係性を可視化したいときに使います。
大量の複雑なデータが分析しやすいようにわかりやすく要約されますが、主要でない情報は切り捨てられてしまう可能性もあります。
共起分析
共起分析とは、文章やテキストデータ内で特定の単語同士がどのくらい一緒に使われているか(共に出現しているか)を調べる手法です。
関連性のある単語が導き出されるため、消費者の考えや意見を認識しやすくなります。
たとえば、「コーヒー」と「カフェ」という単語が頻繁に一緒に出る場合、コーヒーを思い浮かべる時はカフェが意識されていることが読み取れます。
テキストマイニングでできること

マーケティング活動において、テキストマイニングが活用できる場面を4つご紹介します。
顧客の声の分析
自社商品・サービスに対する感想を拾い上げ、満足度や不満点を抽出できることは大きなメリットの1つです。 顧客ニーズを理解し、商品改善やサービスの向上に役立てられます。
トレンドの発見
ネット上で話題となっているキーワードやテーマを抽出することで、トレンドを把握することができます。
新商品・サービスの開発のヒントになり得るでしょう。
競合分析
競合他社の商品・サービスに対する消費者の感想や評価を収集し、強みや弱みを比較して自社の戦略に活かすことができます。
広告効果の測定
キャンペーン後の消費者の反応をSNSやレビューから解析し、PR戦略がうまく伝わっているのかなど、広告効果を測定することも可能です。
テキストマイニングにはツールの活用が効率的
一説には1日1億以上の投稿がされているともいわれるSNSは、まさに情報の宝庫。
テキストマイニングはビッグデータを用いた大規模な分析が必要なため、現状ではテキストマイニングに特化したツールで行うのが効率的です。
数値化できない複雑なテキスト情報が可視化され、ユーザーのニーズや心理ストーリーが把握しやすくなります。
テキストマイニングツールはさまざまなタイプがあり、それぞれ異なる強みや特徴を持っているため、自社の課題に合ったツールを選びましょう。
まとめ
本記事では、テキストマイニングの意味や目的、分析手法などを解説しました。
テキストマイニングは、SNSなどの文章データから数値化できない有益な情報を抽出し、商品が売れる・売れない理由を分析することができる画期的な手法です。
適切なツールを選び活用しながら、ぜひデジタルマーケティングに役立てていきましょう。
ソーウェルバーでは、テキストマイニングも活用したツール「HAKURAKU」を提供しています。
SNSの投稿をAIを使って分析し、ユーザーの潜在的ニーズや関心を抽出・分析できます。
まずは貴社の状況を伺い、寄り添った支援をしていきたいと存じますのでご興味がある方はお気軽にお問い合わせください。