JP2016218853A

JP2016218853A - 情報処理装置、および情報処理方法、並びにプログラム

Info

Publication number: JP2016218853A
Application number: JP2015104709A
Authority: JP
Inventors: 亮裕渡辺; Akihiro Watanabe; 亮介三谷; Ryosuke Mitani
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2015-05-22
Filing date: 2015-05-22
Publication date: 2016-12-22
Also published as: WO2016190063A1

Abstract

【課題】多くの文章を容易で、かつ、高精度に解析し、解析結果を可視化させる。【解決手段】入力されたテキスト情報を一文ずつに分割し、分割された一文ずつの文章を句単位で解析し、概念により階層化した構造で単語が配置されたオントロジ辞書を記憶し、句単位の解析結果を、オントロジ辞書内の単語で検索し、検索結果を、文章におけるトピックとして、オントロジ辞書に対応した概念により階層化して分類し、分類結果を統計処理して可視化画像を生成する。本技術は、コメント解析技術に適用することができる。【選択図】図１

Description

本技術は、情報処理装置、および情報処理方法、並びにプログラムに関し、特に、多数の文章を容易で、かつ、高精度に解析し、解析結果を可視化できるようにした情報処理装置、および情報処理方法、並びにプログラムに関する。

インターネットの普及により、ユーザが個人の意見を発信する機会が増えている。例えば、日々の生活において、食事にいったときのレストランのコメント、旅行に行ったときのホテルのコメント、買った製品のコメント、およびイベントに参加した時のコメントなど様々な情報がインターネット上で発信されている。

それらのコメントをまとめた製品・サービスやホテル、住まいなどのレビュや口コミサイトも多く存在するが、多くのサイトでは、ユーザが特定のカテゴリに対して、採点した評価やレビュを載せるのみで、詳しい情報が知りたいユーザは全てのレビュを読まなくては自分の本当に知りたい内容を調べる方法がなかった。

そこで、様々なコメントなどの文章を分析する技術が提案されている（特許文献１参照）。

特許第５４２６２９２号

特許文献１に代表される従来の技術においては、入力文書を形態素と呼ばれる単語単位に分割し、単語の出現頻度の分布を分析する（bag-of-words）法が採用されており、この（bag-of-words）法が主流となっている。

しかしながら、分析結果をカテゴリに分けるといったことがなされていないので、どのようなカテゴリに対するコメントが多いのか、さらには、各カテゴリにおいて、どのような内容についてコメントが多いのかを認識するには、さらに個々のコメントを読んで解析する必要があった。

本技術は、このような状況に鑑みてなされたものであり、特に、多くの文章を容易で、かつ、高精度に解析し、解析結果を可視化できるようにするものである。

本技術の一側面の情報処理装置は、入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部とを含む情報処理装置である。

前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成されるようにすることができる。

前記辞書は、オントロジ辞書とすることができる。

前記解析部には、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析させ、解析結果に応じて句単位に分離させると共に、前記文章のそれぞれにおけるモダリティを解析させ、その結果をモダリティ情報として付加させるようにすることができる。

前記可視化画像生成部には、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成させるようにすることができる。

前記可視化画像生成部には、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成させるようにすることができる。

前記可視化画像生成部には、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成させるようにすることができる。

ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含ませるようにすることができ、前記可視化画像生成部には、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成させるようにすることができる。

本技術の一側面の情報処理方法は、入力されたテキスト情報からなるコメントを一文ずつに分割し、前記分割された一文ずつの文章を解析し、句単位に分離し、前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、複数の文章が概念により階層化された情報を統計処理して可視化画像を生成するステップを含む情報処理方法である。

本技術の一側面のプログラムは、入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部としてコンピュータを機能させるプログラムである。

本技術の一側面においては、入力されたテキスト情報からなるコメントが一文ずつに分割され、前記分割された一文ずつの文章が解析され、句単位に分離され、概念により階層化した構造で単語が配置された辞書が記憶され、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語が前記文章のトピックとされ、前記トピックとなる前記単語が属する前記辞書における前記階層が、前記文章の属する階層として分類されることで、前記文章が概念により階層化され、複数の文章が概念により階層化された情報が統計処理されて可視化画像が生成される。

本技術の一側面の情報処理装置は、それぞれ独立した装置であっても良いし、情報処理装置として機能するブロックであっても良い。

本技術の一側面によれば、文章を容易で、かつ、高精度に解析し、解析結果を可視化することが可能となる。

本技術を適用した情報処理システムの構成例を説明する図である。可視化画像表示処理を説明するフローチャートである。ホテル用語に関して入力されたコメントを１文ずつ分割したときの各文章の例文を説明する図である。ホテル用語の専門用語集より生成されるオントロジ辞書を説明する図である。図４のオントロジ辞書を利用して、入力されたコメントの各文章をオントロジ化結果の例を説明する図である。図５のオントロジ化結果を利用した可視化画像の例を説明する図である。図５のオントロジ化結果を利用した可視化画像の生成方法を説明する図である。ゲーム用語の専門用語集より生成されるオントロジ辞書を説明する図である。ゲーム用語に関して入力されたコメントを１文ずつ分割したときの各文章の例文を説明する図である。図８のオントロジ辞書を利用して、入力されたコメントの各文章をオントロジ化結果の例を説明する図である。図１０のオントロジ化結果を利用した可視化画像の例を説明する図である。汎用のパーソナルコンピュータの構成例を説明する図である。

＜情報処理システムの構成例＞
図１は、本技術を適用した情報処理システムの構成例を示している。図１の情報処理システムは、入力テキストとして入力される多くの文章を解析して、解析結果を可視化画像として表示するものである。

図１の情報処理システムは、情報処理装置１１、表示部１２、および操作部１３から構成されるものであり、情報処理装置１１が、図示せぬネットワークや操作入力より供給された複数のテキストからなるコメントを解析し、解析結果を可視化して表示部１２に表示する。このとき、キーボードや操作ボタンなどからなる操作部１３が操作されることにより操作内容に応じた操作信号に基づいて、情報処理装置１１は、表示部１２に表示させる内容を切り替える。

より詳細には、図１の情報処理装置１１は、文分割部３１、言語解析部３２、抽出分類部３３、オントロジ化部３４、可視化画像生成部３５、専門用語集３６、辞書生成部３７、およびオントロジ辞書３８を備えている。

文分割部３１は、供給されてくるテキストからなるコメントの入力を受け付けて、複数の文章からなるコメントを、文章毎に分割し、１文ずつ言語解析部３２に供給する。

言語解析部３２は、１文ずつ供給されてくる各文章について、形態素解析、構文解析、および意味解析といった処理を施す。言語解析部３２は、このような処理により、文節等の最小単位となる形態素に対して、入力文章の係り受け関係、主格および目的格などの格情報から文章を、句単位に分離する。また、言語解析部３２は、話している内容に対する話し手の判断や感じ方を表す言語表現であるモダリティ情報（否定、疑問、願望など）を付与して抽出分類部３３に出力する。

抽出分類部３３は、各文章（コメント）の句単位で、オントロジ辞書３８登録された単語の中から対応する単語を検索し、検索された単語を、各文章におけるトピックとして分類し、分類結果をオントロジ化部３４に供給する。

ここで、オントロジ辞書３８とは、辞書生成部３７により予めテキストデータからなる専門用語集３６などから抽出された単語が、概念による階層構造を持った構成にされた辞書であり、換言すれば、単語を概念による階層構造を持った構成で配置している辞書である。尚、オントロジ辞書については、詳細を後述する。

オントロジ化部３４は、抽出分類部３３より供給されてくる、各文章（コメント）の分類結果である、文章のトピックとなる単語に対応付けて、オントロジ辞書３８における概念により階層構造の中に配置させ、これにより文章（コメント）そのものを概念により階層化する。以下、文章（コメント）のトピックを、オントロジ辞書における概念により階層化された言葉（単語）のいずれかに分類することで、文章（コメント）をオントロジ辞書の概念による階層構造に対応付けて配置（分類）することを「文章（コメント）をオントロジ化する」と称するものとし、複数の文章がオントロジ化されている情報を「オントロジ化情報」と称する。

可視化画像生成部３５は、オントロジ化情報を統計処理し、統計処理結果より、複数の文章（コメント）の解析結果の可視化画像を生成し、生成した可視化画像を表示部１２に表示する。この際、同一のオントロジ化情報を用いても、トピックや階層により異なる統計処理結果が求められる事になるが、操作部１３の操作内容に対応した操作信号の入力を受け付けて、可視化画像生成部３５は、トピックや階層を切り替えて可視化画像を生成し、表示部１２に表示する。

＜可視化画像表示処理＞
次に、図２のフローチャートを参照して、図１の情報処理システムによる可視化画像表示処理について説明する。

ステップＳ１１において、文分割部３１は、供給されてくるテキストからなるコメントの入力を受け付けて、複数の文章からなるコメントを、文章毎に分割し、１文ずつ言語解析部３２に供給する。

例えば、「朝食は美味しくて気に入っています。駅からの立地は最高です。展望も素晴らしい。駅前でとても楽でした。眺めがとてもよい。駅前からのアクセスも非常によかった。受付の対応もよかったです。大浴場がないのが残念でした。」というコメントが入力された場合、「朝食は美味しくて気に入っています。」、「駅からの立地は最高です。」、「展望も素晴らしい。」、「駅前でとても楽でした。」、「眺めがとてもよい。」、「駅前からのアクセスも非常によかった。」、「受付の対応もよかったです。」、および、「大浴場がないのが残念でした。」といったように文章が一文ずつ分割される。

尚、以降においては、これらの分割された文章を例文Ｅｘ１乃至Ｅｘ８と称するものとする。すなわち、「朝食は美味しくて気に入っています。」を、例文Ｅｘ１として、「駅からの立地は最高です。」を、例文Ｅｘ２として、「展望も素晴らしい。」を、例文Ｅｘ３として、「駅前でとても楽でした。」を、例文Ｅｘ４として、「眺めがとてもよい。」を、例文Ｅｘ５として、「駅前からのアクセスも非常によかった。」を、例文Ｅｘ６として、「受付の対応もよかったです。」を、例文Ｅｘ７として、「大浴場がないのが残念でした。」を、例文Ｅｘ８として、それぞれ称するものとする。

ステップＳ１２において、言語解析部３２は、１文ずつ供給されてくる各文章について、形態素解析、構文解析、および意味解析といった処理を施す。言語解析部３２は、このような処理により、文節等の最小単位となる形態素に対して、入力文章の係り受け関係、主格および目的格などの格情報から文章を分離する。また、言語解析部３２は、話している内容に対する話し手の判断や感じ方を表す言語表現であるモダリティ情報（否定、疑問、願望など）を付与して抽出分類部３３に出力する。

すなわち、例文１は、「朝食は」、「美味しくて」、および「気に入っています。」に分離される。そして、「気に入っています。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。尚、例えば、「朝食は」、「美味しくて」、および「気に入っています。」は、いずれも、例文Ｅｘ１の句単位である。

また、例文Ｅｘ２は、「駅からの」、「立地は」、および「最高です。」に分離される。そして、「最高です。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。

さらに、例文Ｅｘ３は、「展望も」、および「素晴らしい。」に分離される。そして、「素晴らしい。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。

また、例文Ｅｘ４は、「駅前で」、「とても」、および「楽でした。」に分離される。そして、「楽でした。」との表現により、この文章に、ポジティブなものであり、かつ、過去のものであるとのモダリティ情報が付与される。

さらに、例文Ｅｘ５は、「眺めが」、「とても」、および「よい。」に分離される。そして、「よい」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。

また、例文Ｅｘ６は、「駅前からの」、「アクセスも」、「非常に」、および「よかった。」に分離される。そして、「よかった。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。

さらに、例文Ｅｘ７は、「受付の」、「対応も」、および「よかったです。」に分離される。そして、「よかったです。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。

また、例文Ｅｘ８は、「大浴場が」、「ないのが」、および、「残念でした。」に分離される。そして、「残念でした。」は、ネガティブなもので、かつ、過去のものであるとのモダリティ情報が付与される。

ステップＳ１３において、抽出分類部３３は、各文章について、句単位で、対応するオントロジ辞書３８に登録された単語を検索し、検索結果となる単語を文章のトピックとして分類し、各句単位の分類結果をオントロジ化部３４に供給する。

＜オントロジ辞書＞
ここで、オントロジ辞書３８について説明する。オントロジ辞書３８は、専門用語集３６などに登録された各言葉（単語）を概念により階層化して配置した辞書であり、例えば、図４で示されるようなものである。図４においては、専門用語集３６のカテゴリが「ホテル用語」である場合のオントロジ辞書３８が示されている。図４のオントロジ辞書３８における概念は、階層Ｌ１乃至Ｌ４からなる概念に階層化されている。尚、階層数は、これ以上でも良いし、これ以下でもよい。

辞書生成部３７は、専門用語集３６の情報を階層Ｌ１乃至Ｌ４の概念に階層化する。ここで、階層Ｌ１は、カテゴリを示す「ホテル用語」と示されている。

さらに、階層Ｌ２には、カテゴリが「ホテル用語」となる言葉のうち、概念として最上位となる言葉が配置されており、図４においては、「立地」、「接客」、「部屋」、「施設」、「価格」、「景色」、「展望」、および「眺め」の語が分類されている。ここで、点線の矢印で結ばれている、「景色」、「展望」、および「眺め」の語は、相互に同義語であることが示されている。

また、階層Ｌ３には、階層Ｌ２における各語の下位の概念となる言葉が樹形図のように配置されており、例えば、「立地」の語に対しては、その下位の概念として「駅前」、および「施設」の語が配置されている。また、「接客」の語に対しては、その下位の概念として「ロビー」、「スタッフ」、および「受付」の語が配置されている。ここで、「ロビー」と「受付」については相互に同義語であるものとして分類されている。

また、「部屋」の語に対しては、その下位の概念として「設備」、および「禁煙」の語が配置されている。さらに、「施設」の語に対しては、その下位の概念として「浴場」、「温泉」、および「食事」が配置されている。

さらに、階層Ｌ４には、階層Ｌ３における各語の下位の概念となる言葉が配置されており、例えば、「周辺施設」の語に対しては、その下位の概念として、コンビニエンスストアを表す「コンビニ」が配置されている。また、「ロビー」の語に対しては、その下位の概念として「チェックイン」、および「チェックアウト」の語が配置されている。さらに、「設備」の語に対しては、その下位の概念として「空気清浄機」、「バストイレ」、および「インターネット」の語が配置されている。

オントロジ辞書３８は、図４で示されるように、可視化画像表示処理を実行する前のタイミングで、予め生成されるものであると共に、専門用語集３６におけるカテゴリを変化させたり、追加させることにより、様々なカテゴリのオントロジ辞書３８を形成させることができる。

ステップＳ１４において、オントロジ化部３４は、抽出分類部３３より供給されてくる、オントロジ辞書３８に登録された単語のうち、句単位で検索された、対応する単語を、入力されたコメントのトピックとして分類し、オントロジ辞書３８の構成する概念による階層構造に文章を配置し、これにより文章（コメント）そのものを概念により階層化する（オントロジ化する）。

オントロジ化部３４は、例えば、コメントＥｘ１乃至Ｅｘ８の文章を、図４のオントロジ辞書３８を用いて、図５で示されるように各文章を概念により階層化する。

すなわち、「朝食は美味しくて気に入っています。」という例文Ｅｘ１においては、句単位である「朝食は」、「美味しくて」、および「気に入っています。」がそれぞれ検索される。そして、図５の階層Ｌ３における「食事」に分類される「朝食」という言葉が検索されることにより、例文Ｅｘ１が、「ホテル用語」という概念に含まれる「施設」の下位の「食事」に属する「朝食」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ１は、「朝食」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ３に属するものとされることで、オントロジ辞書３８の概念による階層構造に配置される（オントロジ化される）。

また、「駅からの立地は最高です。」という例文Ｅｘ２においては、「駅からの」、「立地は」、および「最高です。」の句単位がそれぞれ検索される。そして、図５の階層Ｌ２における「立地」という言葉が検索されることにより、例文Ｅｘ２が、「ホテル用語」という概念に含まれる「立地」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ２は、「立地」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ２に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

さらに、「展望も素晴らしい。」という例文Ｅｘ３においては、「展望も」、および「素晴らしい。」がそれぞれ検索される。そして、図５の階層Ｌ２における「景色」という言葉と同義語の「展望」が検索されることにより、例文Ｅｘ３が「ホテル用語」という概念に含まれる「景色」と同義語の「展望」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ３は、「展望」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ２に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

また、「駅前でとても楽でした。」という例文Ｅｘ４においては、「駅前で」、「とても」、および「楽でした。」がそれぞれ検索される。そして、図５の階層Ｌ３における「駅前」という言葉が検索されることにより、例文Ｅｘ４が「ホテル用語」という概念に含まれる「立地」の下位の「駅前」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ４は、「駅前」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ３に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

さらに、「眺めがとてもよい。」という例文Ｅｘ５においては、「眺めが」、「とても」、および「よい。」がそれぞれ検索される。そして、図５の階層Ｌ３における「景色」と同義語の「眺め」という言葉が検索されることにより、例文Ｅｘ５が「ホテル用語」という概念に含まれる「景色」と同義語の「眺め」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ５は、「朝食」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ２に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

また、「駅前からのアクセスも非常によかった。」という例文Ｅｘ６においては、「駅前からの」、「アクセスも」、「非常に」、および「よかった。」がそれぞれ検索される。そして、図５の階層Ｌ３における「駅前」という言葉が検索されることにより、例文Ｅｘ６が「ホテル用語」という概念に含まれる「立地」の下位の「駅前」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ６は、「駅前」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ３に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

さらに、「受付の対応もよかったです。」という例文Ｅｘ７においては、「受付の」、「対応も」、および「よかったです。」がそれぞれ検索される。そして、図５の階層Ｌ３における「ロビー」と同義語の「受付」が検索されることにより、例文Ｅｘ７が「ホテル用語」という概念に含まれる「接客」という言葉の下位の「ロビー」と同義語の「受付」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ７は、「受付」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ３に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

また、「大浴場がないのが残念でした。」という例文Ｅｘ８においては、「大浴場が」、「ないのが」、および、「残念でした。」がそれぞれ検索される。そして、図５の階層Ｌ４における「大浴場」という言葉が検索されることにより、例文Ｅｘ８が「ホテル用語」という概念に含まれる「施設」の下位の「浴場」の下位の「大浴場」というトピックに関する文章であることが分類される。これにより、図５で示されるように、例文Ｅｘ８は、「大浴場」という単語が属する、「ホテル用語」というカテゴリにおける階層Ｌ３に属するものとされることで、概念により階層構造に配置される（オントロジ化される）。

このように、オントロジ化部３４は、オントロジ辞書３８を利用して、入力された文章（コメント）そのものを概念により階層化することでオントロジ化し、オントロジ化結果を可視化画像生成部３５に出力する。

ステップＳ１５において、可視化画像生成部３５は、オントロジ化結果を用いて可視化画像を生成する。

例えば、図６で示されるようなオントロジ化結果である場合、可視化画像生成部３５は、可視化画像ＣＨＬ１，ＣＨＬ２，ＣＨＦを生成して表示部１２に出力して表示する。

より詳細には、図６のオントロジ化結果においては、最上位の階層Ｌ１が「ＲＯＯＴ」であり、その下の階層Ｌ２においては、言葉「Ａ」、「Ｂ」が設けられている。また、言葉「Ａ」の下位の階層Ｌ３においては、言葉「Ｃ」、「Ｄ」が設けられており、言葉「Ｂ」の下位の階層Ｌ３においては、言葉「Ｅ」、「Ｆ」が設けられている。

さらに、その下の階層Ｌ４においても、言葉「Ｃ」乃至「Ｆ」の下位の言葉が設けられている。

このような場合、可視化画像生成部３５は、例えば、階層Ｌ２については、可視化画像ＣＨＬ１で示されるようなパイチャート（円グラフ）を生成する。すなわち、階層Ｌ２においては、可視化画像生成部３５は、言葉「Ａ」、「Ｂ」をトピックとする文章の数に応じた割合を統計処理により求め、統計処理結果を中心位置からの角度の割合として示する可視化画像ＣＨＬ１を生成する。可視化画像ＣＨＬ１では、階層Ｌ２の言葉「Ａ」をトピックとする文章と、言葉「Ｂ」をトピックとする文章との数の割合が、１：３であることが示されている。

また、可視化画像生成部３５は、例えば、階層Ｌ３については、可視化画像ＣＨＬ２で示されるようなパイチャート（円グラフ）を生成する。すなわち、階層Ｌ２においては、可視化画像生成部３５は、言葉「Ｃ」乃至「Ｆ」をトピックとする文章の数に応じた割合を統計処理により求め、統計処理結果を中心位置からの角度の割合として示する可視化画像ＣＨＬ２を生成する。可視化画像ＣＨＬ２では、階層Ｌ３における言葉「Ｃ」乃至「Ｆ」をトピックとする文章の割合がＣ：Ｄ：Ｅ：Ｆ＝１：１：３：３であることが示されている。

以下、各階層に設定された言葉をトピックとする文章の数の割合を示すパイチャートが可視化画像として生成される。

さらに、可視化画像生成部３５は、例えば、各言葉に関する可視化画像として、可視化画像ＣＨＦを生成して表示部１２に表示することもできる。

ここで、可視化画像ＣＨＦには、全コメントのうち、言葉「Ｆ」について、モダリティ情報に基づいて、ポジティブなものと、ネガティブなものとの割合を示すグラフＣＨＦ−１と、詳細なモダリティ情報、すなわち、勧誘、程度、命令、主張、疑問等のいずれかを示す割合を示すグラフＣＨＦ−２とが含まれている。尚、ここでは、モダリティ情報は、ポジティブ、ネガティブ、勧誘、程度、命令、主張、疑問のいずれかが割り付けられるものとする場合の例が示されているが、これ以外のモダリティが割り付けられるようにしてもよい。

より具体的には、図７の上部で示されるように、最上位の階層Ｌ１が「ホテル用語」のカテゴリに分類される場合、その下位の階層Ｌ２には、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」の言葉が配置されることになる。ここで、可視化画像生成部３５は、図７の下部で示されるように、それぞれの言葉をトピックとする文章のうち、モダリティ情報がポジティブとなる数と、ネガティブとなる数とを、それぞれ分けてスコアにして記録する。

図７の下部においては、ポジティブなコメントについて、階層Ｌ２の「景色」、「立地」、「接客」、「価格」、「部屋」の言葉をトピックとする文章が挙げられており、それぞれ５，５，４，４，３のポイント（文章の数）が記録されている。また、ネガティブなコメントについて、階層Ｌ２の「施設」の下位である階層Ｌ３の「浴場」をトピックとする文章に４のポイントが記録されている。

したがって、この場合、可視化画像生成部３５は、階層Ｌ２について、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」のそれぞれをトピックとする文章の数（ポイント）の割合からなる可視化画像ＣＨＬ１，ＣＨＬ２に相当するパイチャートからなる可視化画像を生成する。

さらに、可視化画像生成部３５は、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」といった各言葉のそれぞれをトピックとする文章のモダリティ情報のうち、ポジティブとなる文章の数、およびネガティブの文章の数それぞれの、総数に対する割合を示すグラフを可視化画像ＣＨＦ−１として生成する。また、可視化画像生成部３５は、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」といった各言葉をトピックとする文章のモダリティ情報のそれぞれの文章の数の、総数に対する割合を示すグラフを可視化画像ＣＨＦ−２として生成する。

尚、操作部１３が操作されることにより発生される操作信号に応じて、各階層の可視化画像ＣＨＬ１，ＣＨＬ２、およびＣＧＦを同時にすべて表示する、または、それらのいずれかを選択的に表示するといったことを、可視化画像生成部３５が切り替えて表示部１２に表示するようにしてもよい。

＜他の実施の形態＞
以上においては、オントロジ辞書３８が、「ホテル用語」に基づいた専門用語集３６により生成される例について説明してきたが、それ以外の用語集に基づいて生成されたものでもよく、例えば、「ゲーム用語」の専門用語集３６に基づいて生成されたものであってもよい。

「ゲーム用語」の専門用語集３６に基づいて、オントロジ辞書３８が生成される場合、例えば、図８で示されるようなものが生成される。

図８においては、最上層の階層Ｌ１には、オントロジ辞書３８のカテゴリが「ゲーム用語集」であることが示されている。

その下の階層Ｌ２には、「ゲーム用語」の概念の最上層の言葉として、「キャラクタ」、「魔法」、および「魔物」が設けられている。

さらに、階層Ｌ２より下位の階層Ｌ３に、「キャラクタ」および「魔法」のそれぞれに下位の概念の言葉が設けられており、「キャラクタ」の下位の概念の言葉として、「装飾」、および「服装」が設けられており、「魔法」の下位の概念の言葉として「攻撃魔法」、および「回復魔法」が設けられている。ここで、「服装」という言葉と同義語として、「服」、および「衣装」が設けられている。

また、階層Ｌ４には、階層Ｌ３の各言葉の下位の概念の言葉が設けられており、「装飾」という言葉の下位には、「腕輪」、および「兜」が設けられており、「服装」の下位には、「法衣」、および「鎧」が設けられており、「攻撃魔法」の下位には、「ファイア」、および「サンダ」が設けられており、「回復魔法」の下位には、「ヒール」が設けられている。

さらに、階層Ｌ５には、階層Ｌ４の「腕輪」の下位の概念の言葉として、「賢者の腕輪」が設けられている。

ここで、ステップＳ１１において、分離されたコメントが、以下の例文Ｅｘ１１乃至Ｅｘ１８であるものとする。すなわち、例文Ｅｘ１１乃至Ｅｘ１８は、「衣装がダウンロードできず困っています。」、「法衣がダウンロード出来ません。」、「キャラクタをもっと増やして欲しい。」、「賢者の腕輪が最強じゃないとおかしくないですか。」、「色々な攻撃魔法を駆使した強い魔法が使いたい。」、「もっと派手な魔法をつくってほしい。」、「ファイアの攻撃が低すぎます。」、および「回復魔法の使用出来る回数が少なすぎる。」であるものとする。このとき、例文Ｅｘ１１乃至Ｅｘ１８は、ステップ１３の処理により図９で示されるように句単位に分離される。

すなわち、例えば、例文Ｅｘ１１の「衣装がダウンロードできず困っています。」は、「衣装が」、「ダウンロードできず」、および「困っています。」と分離されて、「ネガティブ」なものであるとのモダリティ情報が付与される。

また、例文Ｅｘ１２の「法衣がダウンロード出来ません。」は、「法衣が」、「ダウンロードできず」、および「困っています。」と分離されて、「ネガティブ」、および「不可能」なものであるとのモダリティ情報が付与される。

さらに、例文Ｅｘ１３の「キャラクタをもっと増やして欲しい。」は、「キャラクタを」、「もっと」、および「増やして欲しい。」と分離されて、「願望」であるとのモダリティ情報が付与される。

また、例文Ｅｘ１４の「賢者の腕輪が最強じゃないとおかしくないですか。」は、「賢者の腕輪が」、「最強じゃないと」、および「おかしくないですか。」と分離されて、「疑問」であるとのモダリティ情報が付与される。

さらに、例文Ｅｘ１５の「色々な攻撃魔法を駆使した強い魔法が使いたい。」は、「色々な」、「攻撃魔法を」、「駆使した」、「強い」、「魔法が」、および「使いたい。」と分離されて、「願望」であるとのモダリティ情報が付与される。

また、例文Ｅｘ１６の「もっと派手な魔法をつくってほしい。」は、「もっと」、「派手な」、「魔法を」、および「つくってほしい」と分離されて、「願望」であるとのモダリティ情報が付与される。

さらに、例文Ｅｘ１７の「ファイアの攻撃が低すぎます。」は、「ファイアの」、「攻撃が」、および「低すぎます。」と分離されて、「ネガティブ」であるとのモダリティ情報が付与される。

また、例文Ｅｘ１８の「回復魔法の使用出来る回数が少なすぎる。」は、「回復魔法の」、「使用出来る」、「回数が」、および「少なすぎる。」と分離されて、「ネガティブ」であるとのモダリティ情報が付与される。

さらに、ステップＳ１４の処理により、オントロジ化されることにより、例えば、図１０で示されるように、コメントを構成する文章Ｅｘ１１乃至Ｅｘ１８を概念により階層化する。

すなわち、「衣装がダウンロードできず困っています。」という例文Ｅｘ１１の「衣装が」、「ダウンロードできず」、および「困っています。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ３における「服装」と同義語の「衣装」という言葉が検索されることにより、例文Ｅｘ１１は「ゲーム用語」という概念に含まれる「キャラクタ」の下位の「服装」と同義語の「衣装」をトピックとする文章に分類される。

また、「法衣がダウンロード出来ません。」という例文Ｅｘ１２の「法衣が」、「ダウンロードできず」、および「困っています。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ３の「衣装」の下位の階層Ｌ４の「法衣」という言葉が検索されることにより、例文Ｅｘ１２は「ゲーム用語」という概念に含まれる「キャラクタ」の下位の「服装」の下位の「衣装」をトピックとする文章に分類される。

さらに、「キャラクタをもっと増やして欲しい。」という例文Ｅｘ１３では、「キャラクタを」、「もっと」、および「増やして欲しい。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ２の「キャラクタ」が検索されることにより、例文Ｅｘ１３は「ゲーム用語」という概念に含まれる「キャラクタ」をトピックとする文章に分類される。

また、「賢者の腕輪が最強じゃないとおかしくないですか？」という例文Ｅｘ１４では、「賢者の腕輪が」、「最強じゃないと」、および「おかしくないですか？」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ４の「賢者の腕輪が」が検索されることにより、例文Ｅｘ１４が「ゲーム用語」という概念に含まれる「キャラクタ」の下位の階層Ｌ３の「装飾」の下位の階層Ｌ４の「腕輪」の、さらに下位の階層Ｌ５の「賢者の腕輪」をトピックとする文章に分類される。

さらに、「色々な攻撃魔法を駆使した強い魔法が使いたい。」という例文Ｅｘ１５では、「色々な」、「攻撃魔法を」、「駆使した」、「強い」、「魔法が」、および「使いたい。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ３の「攻撃魔法」が検索されることにより、例文Ｅｘ１５は「ゲーム用語」という概念に含まれる「魔法」の下位の階層Ｌ４の「攻撃魔法」をトピックとする文章に分類される。

また、「もっと派手な魔法をつくってほしい。」という例文Ｅｘ１６では、「もっと」、「派手な」、「魔法を」、および「つくってほしい。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ２の「魔法」が検索されることにより、例文Ｅｘ１６は「ゲーム用語」という概念に含まれる「魔法」をトピックとする文章に分類される。

さらに、「ファイアの攻撃が低すぎます。」という例文Ｅｘ１７では、「ファイアの」、「攻撃が」、および「低すぎます。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ４の「ファイア」が検索されることにより、例文Ｅｘ１７は「ゲーム用語」という概念に含まれる「魔法」の下位の階層Ｌ３の「攻撃魔法」の下位の階層Ｌ４の「ファイア」をトピックとする文章に分類される。

また、「回復魔法の使用出来る回数が少なすぎる。」という例文Ｅｘ１８では、「回復魔法の」、「使用出来る」、「回数が」、および「少なすぎる。」に対応する単語が、それぞれオントロジ辞書３８において検索される。そして、図１０の階層Ｌ３の「回復魔法」が検索されることにより、例文Ｅｘ１８は「ゲーム用語」という概念に含まれる「魔法」の下位の階層Ｌ３の「回復魔法」をトピックとする文章に分類される。

以上のような処理により、図１０で示されるようなオントロジ化結果が生成される。

さらに、ステップＳ１５の処理により、例えば、図１１で示されるような可視化画像ＣＨ１，ＣＨ１１乃至ＣＨ１３が生成されて表示部１２に表示される。

すなわち、図１１の可視化画像ＣＨ１においては、左上部に所定の階層に係る言葉をトピックとする文章の数に応じたパイチャートが生成される。図１１の左上部のパイチャートからなる可視化画像ＣＨ１には、「キャラクタ」、「魔法」、および「魔法」のコメント数に応じた角度が割り当てられており、それぞれ、45%，35%，20%とされている。

また、図１１の右上部の可視化画像ＣＨ１１は、可視化画像ＣＨ１における「キャラクタ」に関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像ＣＨ１１−１が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像ＣＨ１１−２が設けられている。

さらに、図１１の右下部の可視化画像ＣＨ１２は、可視化画像ＣＨ１における「魔法」に関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像ＣＨ１２−１が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像ＣＨ１２−２が設けられている。

また、図１１の左下部の可視化画像ＣＨ１３は、可視化画像ＣＨ１における「魔物」にに関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像ＣＨ１３−１が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像ＣＨ１３−２が設けられている。

これらの可視化画像ＣＨ１およびＣＨ１１乃至ＣＨ１３は、いずれも操作部１３を操作することで切り替えて表示させるようにしてもよいし、例えば、可視化画像ＣＨ１における「キャラクタ」と表示された部分をポインタなどで選択するとき、可視化画像ＣＨ１１が表示されるようにしてもよい。

以上の如く、本技術の情報処理装置によれば、コメントとして入力されている複数の文章のそれぞれについて、言語解析により句単位に分離し、オントロジ辞書３８で対応する単語を検索し、検索された単語を文章のトピックであるものと分類し、トピックとなる単語により文章を、階層的に分類することで、オントロジ化するようにした。さらに、オントロジ化された結果を可視化画像とすることで表示するようにした。

この結果、コメントを構成する各文章は、オントロジ辞書を用いることで、トピックとなる言葉の概念に応じて階層的に分類することが可能となる（オントロジ化することが可能となる）。また、複数の文章のトピックとなる言葉を利用してオントロジ化することで、オントロジ化された各文章がトピックとする言葉毎の文章の分布を利用した可視化画像を生成することが可能となる。これにより、これまでは、能動的にキーワードなどを入力して検索し、検索されたコメントを読むことしかできなかったが、文章のトピックが、概念による階層化した情報（オントロジ化情報）とされ、これが可視化されることにより、ユーザが特に意識していない客観的な言葉による解析結果が可視化されることになるので、ユーザに対して客観的な解析結果を提示することが可能となる。

＜ソフトウェアにより実行させる例＞
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。

図１２は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)１００１を内蔵している。CPU１００１にはバス１００４を介して、入出力インタ-フェイス１００５が接続されている。バス１００４には、ROM(Read Only Memory)１００２およびRAM(Random Access Memory)１００３が接続されている。

入出力インタ-フェイス１００５には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部１００６、処理操作画面や処理結果の画像を表示デバイスに出力する出力部１００７、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部１００８、LAN（Local Area Network）アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部１００９が接続されている。また、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む）、光磁気ディスク（ＭＤ(Mini Disc)を含む）、もしくは半導体メモリなどのリムーバブルメディア１０１１に対してデータを読み書きするドライブ１０１０が接続されている。

CPU１００１は、ROM１００２に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア１０１１ら読み出されて記憶部１００８にインストールされ、記憶部１００８からRAM１００３にロードされたプログラムに従って各種の処理を実行する。RAM１００３にはまた、CPU１００１が各種の処理を実行する上において必要なデータなども適宜記憶される。

以上のように構成されるコンピュータでは、CPU１００１が、例えば、記憶部１００８に記憶されているプログラムを、入出力インタフェース１００５及びバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU１００１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア１０１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア１０１１をドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部１００９で受信し、記憶部１００８にインストールすることができる。その他、プログラムは、ROM１００２や記憶部１００８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

尚、本技術は、以下のような構成も取ることができる。
＜１＞入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
を含む情報処理装置。
＜２＞前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成される
＜１＞に記載の情報処理装置。
＜３＞前記辞書は、オントロジ辞書である
＜１＞または＜２＞に記載の情報処理装置。
＜４＞前記解析部は、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析し、解析結果に応じて句単位に分離すると共に、前記文章のそれぞれにおけるモダリティを解析し、その結果をモダリティ情報として付加する
＜１＞乃至＜３＞のいずれかに記載の情報処理装置。
＜５＞前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成する
＜１＞乃至＜４＞のいずれかに記載の情報処理装置。
＜６＞前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成する
＜１＞乃至＜４＞のいずれかに記載の情報処理装置。
＜７＞前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成する
＜６＞に記載の情報処理装置。
＜８＞ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含み、
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成する
＜１＞乃至＜７＞のいずれかに記載の情報処理装置。
＜９＞入力されたテキスト情報からなるコメントを一文ずつに分割し、
前記分割された一文ずつの文章を解析し、句単位に分離し、
前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、
複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する
ステップを含む情報処理方法。
＜１０＞入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
してコンピュータを機能させるプログラム。

１１情報処理装置，３１文分割部，３２言語解析部，３３抽出分類部，３４オントロジ化部，３５可視化画像生成部，３６専門用語集，３７辞書生成部，３８オントロジ辞書

Claims

入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
を含む情報処理装置。
前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成される
請求項１に記載の情報処理装置。
前記辞書は、オントロジ辞書である
請求項１に記載の情報処理装置。
前記解析部は、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析し、解析結果に応じて句単位に分離すると共に、前記文章のそれぞれにおけるモダリティを解析し、その結果をモダリティ情報として付加する
請求項１に記載の情報処理装置。
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成する
請求項１に記載の情報処理装置。
前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成する
請求項１に記載の情報処理装置。
前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成する
請求項６に記載の情報処理装置。
ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含み、
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成する
請求項１に記載の情報処理装置。
入力されたテキスト情報からなるコメントを一文ずつに分割し、
前記分割された一文ずつの文章を解析し、句単位に分離し、
前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、
複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する
ステップを含む情報処理方法。
入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
してコンピュータを機能させるプログラム。