JP2016218853A - 情報処理装置、および情報処理方法、並びにプログラム - Google Patents
情報処理装置、および情報処理方法、並びにプログラム Download PDFInfo
- Publication number
- JP2016218853A JP2016218853A JP2015104709A JP2015104709A JP2016218853A JP 2016218853 A JP2016218853 A JP 2016218853A JP 2015104709 A JP2015104709 A JP 2015104709A JP 2015104709 A JP2015104709 A JP 2015104709A JP 2016218853 A JP2016218853 A JP 2016218853A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- sentences
- word
- hierarchy
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】多くの文章を容易で、かつ、高精度に解析し、解析結果を可視化させる。【解決手段】入力されたテキスト情報を一文ずつに分割し、分割された一文ずつの文章を句単位で解析し、概念により階層化した構造で単語が配置されたオントロジ辞書を記憶し、句単位の解析結果を、オントロジ辞書内の単語で検索し、検索結果を、文章におけるトピックとして、オントロジ辞書に対応した概念により階層化して分類し、分類結果を統計処理して可視化画像を生成する。本技術は、コメント解析技術に適用することができる。【選択図】図1
Description
本技術は、情報処理装置、および情報処理方法、並びにプログラムに関し、特に、多数の文章を容易で、かつ、高精度に解析し、解析結果を可視化できるようにした情報処理装置、および情報処理方法、並びにプログラムに関する。
インターネットの普及により、ユーザが個人の意見を発信する機会が増えている。例えば、日々の生活において、食事にいったときのレストランのコメント、旅行に行ったときのホテルのコメント、買った製品のコメント、およびイベントに参加した時のコメントなど様々な情報がインターネット上で発信されている。
それらのコメントをまとめた製品・サービスやホテル、住まいなどのレビュや口コミサイトも多く存在するが、多くのサイトでは、ユーザが特定のカテゴリに対して、採点した評価やレビュを載せるのみで、詳しい情報が知りたいユーザは全てのレビュを読まなくては自分の本当に知りたい内容を調べる方法がなかった。
そこで、様々なコメントなどの文章を分析する技術が提案されている(特許文献1参照)。
特許文献1に代表される従来の技術においては、入力文書を形態素と呼ばれる単語単位に分割し、単語の出現頻度の分布を分析する(bag-of-words)法が採用されており、この(bag-of-words)法が主流となっている。
しかしながら、分析結果をカテゴリに分けるといったことがなされていないので、どのようなカテゴリに対するコメントが多いのか、さらには、各カテゴリにおいて、どのような内容についてコメントが多いのかを認識するには、さらに個々のコメントを読んで解析する必要があった。
本技術は、このような状況に鑑みてなされたものであり、特に、多くの文章を容易で、かつ、高精度に解析し、解析結果を可視化できるようにするものである。
本技術の一側面の情報処理装置は、入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部とを含む情報処理装置である。
前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成されるようにすることができる。
前記辞書は、オントロジ辞書とすることができる。
前記解析部には、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析させ、解析結果に応じて句単位に分離させると共に、前記文章のそれぞれにおけるモダリティを解析させ、その結果をモダリティ情報として付加させるようにすることができる。
前記可視化画像生成部には、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成させるようにすることができる。
前記可視化画像生成部には、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成させるようにすることができる。
前記可視化画像生成部には、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成させるようにすることができる。
ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含ませるようにすることができ、前記可視化画像生成部には、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成させるようにすることができる。
本技術の一側面の情報処理方法は、入力されたテキスト情報からなるコメントを一文ずつに分割し、前記分割された一文ずつの文章を解析し、句単位に分離し、前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、複数の文章が概念により階層化された情報を統計処理して可視化画像を生成するステップを含む情報処理方法である。
本技術の一側面のプログラムは、入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部としてコンピュータを機能させるプログラムである。
本技術の一側面においては、入力されたテキスト情報からなるコメントが一文ずつに分割され、前記分割された一文ずつの文章が解析され、句単位に分離され、概念により階層化した構造で単語が配置された辞書が記憶され、前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語が前記文章のトピックとされ、前記トピックとなる前記単語が属する前記辞書における前記階層が、前記文章の属する階層として分類されることで、前記文章が概念により階層化され、複数の文章が概念により階層化された情報が統計処理されて可視化画像が生成される。
本技術の一側面の情報処理装置は、それぞれ独立した装置であっても良いし、情報処理装置として機能するブロックであっても良い。
本技術の一側面によれば、文章を容易で、かつ、高精度に解析し、解析結果を可視化することが可能となる。
<情報処理システムの構成例>
図1は、本技術を適用した情報処理システムの構成例を示している。図1の情報処理システムは、入力テキストとして入力される多くの文章を解析して、解析結果を可視化画像として表示するものである。
図1は、本技術を適用した情報処理システムの構成例を示している。図1の情報処理システムは、入力テキストとして入力される多くの文章を解析して、解析結果を可視化画像として表示するものである。
図1の情報処理システムは、情報処理装置11、表示部12、および操作部13から構成されるものであり、情報処理装置11が、図示せぬネットワークや操作入力より供給された複数のテキストからなるコメントを解析し、解析結果を可視化して表示部12に表示する。このとき、キーボードや操作ボタンなどからなる操作部13が操作されることにより操作内容に応じた操作信号に基づいて、情報処理装置11は、表示部12に表示させる内容を切り替える。
より詳細には、図1の情報処理装置11は、文分割部31、言語解析部32、抽出分類部33、オントロジ化部34、可視化画像生成部35、専門用語集36、辞書生成部37、およびオントロジ辞書38を備えている。
文分割部31は、供給されてくるテキストからなるコメントの入力を受け付けて、複数の文章からなるコメントを、文章毎に分割し、1文ずつ言語解析部32に供給する。
言語解析部32は、1文ずつ供給されてくる各文章について、形態素解析、構文解析、および意味解析といった処理を施す。言語解析部32は、このような処理により、文節等の最小単位となる形態素に対して、入力文章の係り受け関係、主格および目的格などの格情報から文章を、句単位に分離する。また、言語解析部32は、話している内容に対する話し手の判断や感じ方を表す言語表現であるモダリティ情報(否定、疑問、願望など)を付与して抽出分類部33に出力する。
抽出分類部33は、各文章(コメント)の句単位で、オントロジ辞書38登録された単語の中から対応する単語を検索し、検索された単語を、各文章におけるトピックとして分類し、分類結果をオントロジ化部34に供給する。
ここで、オントロジ辞書38とは、辞書生成部37により予めテキストデータからなる専門用語集36などから抽出された単語が、概念による階層構造を持った構成にされた辞書であり、換言すれば、単語を概念による階層構造を持った構成で配置している辞書である。尚、オントロジ辞書については、詳細を後述する。
オントロジ化部34は、抽出分類部33より供給されてくる、各文章(コメント)の分類結果である、文章のトピックとなる単語に対応付けて、オントロジ辞書38における概念により階層構造の中に配置させ、これにより文章(コメント)そのものを概念により階層化する。以下、文章(コメント)のトピックを、オントロジ辞書における概念により階層化された言葉(単語)のいずれかに分類することで、文章(コメント)をオントロジ辞書の概念による階層構造に対応付けて配置(分類)することを「文章(コメント)をオントロジ化する」と称するものとし、複数の文章がオントロジ化されている情報を「オントロジ化情報」と称する。
可視化画像生成部35は、オントロジ化情報を統計処理し、統計処理結果より、複数の文章(コメント)の解析結果の可視化画像を生成し、生成した可視化画像を表示部12に表示する。この際、同一のオントロジ化情報を用いても、トピックや階層により異なる統計処理結果が求められる事になるが、操作部13の操作内容に対応した操作信号の入力を受け付けて、可視化画像生成部35は、トピックや階層を切り替えて可視化画像を生成し、表示部12に表示する。
<可視化画像表示処理>
次に、図2のフローチャートを参照して、図1の情報処理システムによる可視化画像表示処理について説明する。
次に、図2のフローチャートを参照して、図1の情報処理システムによる可視化画像表示処理について説明する。
ステップS11において、文分割部31は、供給されてくるテキストからなるコメントの入力を受け付けて、複数の文章からなるコメントを、文章毎に分割し、1文ずつ言語解析部32に供給する。
例えば、「朝食は美味しくて気に入っています。駅からの立地は最高です。展望も素晴らしい。駅前でとても楽でした。眺めがとてもよい。駅前からのアクセスも非常によかった。受付の対応もよかったです。大浴場がないのが残念でした。」というコメントが入力された場合、「朝食は美味しくて気に入っています。」、「駅からの立地は最高です。」、「展望も素晴らしい。」、「駅前でとても楽でした。」、「眺めがとてもよい。」、「駅前からのアクセスも非常によかった。」、「受付の対応もよかったです。」、および、「大浴場がないのが残念でした。」といったように文章が一文ずつ分割される。
尚、以降においては、これらの分割された文章を例文Ex1乃至Ex8と称するものとする。すなわち、「朝食は美味しくて気に入っています。」を、例文Ex1として、「駅からの立地は最高です。」を、例文Ex2として、「展望も素晴らしい。」を、例文Ex3として、「駅前でとても楽でした。」を、例文Ex4として、「眺めがとてもよい。」を、例文Ex5として、「駅前からのアクセスも非常によかった。」を、例文Ex6として、「受付の対応もよかったです。」を、例文Ex7として、「大浴場がないのが残念でした。」を、例文Ex8として、それぞれ称するものとする。
ステップS12において、言語解析部32は、1文ずつ供給されてくる各文章について、形態素解析、構文解析、および意味解析といった処理を施す。言語解析部32は、このような処理により、文節等の最小単位となる形態素に対して、入力文章の係り受け関係、主格および目的格などの格情報から文章を分離する。また、言語解析部32は、話している内容に対する話し手の判断や感じ方を表す言語表現であるモダリティ情報(否定、疑問、願望など)を付与して抽出分類部33に出力する。
すなわち、例文1は、「朝食は」、「美味しくて」、および「気に入っています。」に分離される。そして、「気に入っています。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。尚、例えば、「朝食は」、「美味しくて」、および「気に入っています。」は、いずれも、例文Ex1の句単位である。
また、例文Ex2は、「駅からの」、「立地は」、および「最高です。」に分離される。そして、「最高です。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。
さらに、例文Ex3は、「展望も」、および「素晴らしい。」に分離される。そして、「素晴らしい。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。
また、例文Ex4は、「駅前で」、「とても」、および「楽でした。」に分離される。そして、「楽でした。」との表現により、この文章に、ポジティブなものであり、かつ、過去のものであるとのモダリティ情報が付与される。
さらに、例文Ex5は、「眺めが」、「とても」、および「よい。」に分離される。そして、「よい」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。
また、例文Ex6は、「駅前からの」、「アクセスも」、「非常に」、および「よかった。」に分離される。そして、「よかった。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。
さらに、例文Ex7は、「受付の」、「対応も」、および「よかったです。」に分離される。そして、「よかったです。」との表現により、この文章に、ポジティブなものであるとのモダリティ情報が付与される。
また、例文Ex8は、「大浴場が」、「ないのが」、および、「残念でした。」に分離される。そして、「残念でした。」は、ネガティブなもので、かつ、過去のものであるとのモダリティ情報が付与される。
ステップS13において、抽出分類部33は、各文章について、句単位で、対応するオントロジ辞書38に登録された単語を検索し、検索結果となる単語を文章のトピックとして分類し、各句単位の分類結果をオントロジ化部34に供給する。
<オントロジ辞書>
ここで、オントロジ辞書38について説明する。オントロジ辞書38は、専門用語集36などに登録された各言葉(単語)を概念により階層化して配置した辞書であり、例えば、図4で示されるようなものである。図4においては、専門用語集36のカテゴリが「ホテル用語」である場合のオントロジ辞書38が示されている。図4のオントロジ辞書38における概念は、階層L1乃至L4からなる概念に階層化されている。尚、階層数は、これ以上でも良いし、これ以下でもよい。
ここで、オントロジ辞書38について説明する。オントロジ辞書38は、専門用語集36などに登録された各言葉(単語)を概念により階層化して配置した辞書であり、例えば、図4で示されるようなものである。図4においては、専門用語集36のカテゴリが「ホテル用語」である場合のオントロジ辞書38が示されている。図4のオントロジ辞書38における概念は、階層L1乃至L4からなる概念に階層化されている。尚、階層数は、これ以上でも良いし、これ以下でもよい。
辞書生成部37は、専門用語集36の情報を階層L1乃至L4の概念に階層化する。ここで、階層L1は、カテゴリを示す「ホテル用語」と示されている。
さらに、階層L2には、カテゴリが「ホテル用語」となる言葉のうち、概念として最上位となる言葉が配置されており、図4においては、「立地」、「接客」、「部屋」、「施設」、「価格」、「景色」、「展望」、および「眺め」の語が分類されている。ここで、点線の矢印で結ばれている、「景色」、「展望」、および「眺め」の語は、相互に同義語であることが示されている。
また、階層L3には、階層L2における各語の下位の概念となる言葉が樹形図のように配置されており、例えば、「立地」の語に対しては、その下位の概念として「駅前」、および「施設」の語が配置されている。また、「接客」の語に対しては、その下位の概念として「ロビー」、「スタッフ」、および「受付」の語が配置されている。ここで、「ロビー」と「受付」については相互に同義語であるものとして分類されている。
また、「部屋」の語に対しては、その下位の概念として「設備」、および「禁煙」の語が配置されている。さらに、「施設」の語に対しては、その下位の概念として「浴場」、「温泉」、および「食事」が配置されている。
さらに、階層L4には、階層L3における各語の下位の概念となる言葉が配置されており、例えば、「周辺施設」の語に対しては、その下位の概念として、コンビニエンスストアを表す「コンビニ」が配置されている。また、「ロビー」の語に対しては、その下位の概念として「チェックイン」、および「チェックアウト」の語が配置されている。さらに、「設備」の語に対しては、その下位の概念として「空気清浄機」、「バストイレ」、および「インターネット」の語が配置されている。
オントロジ辞書38は、図4で示されるように、可視化画像表示処理を実行する前のタイミングで、予め生成されるものであると共に、専門用語集36におけるカテゴリを変化させたり、追加させることにより、様々なカテゴリのオントロジ辞書38を形成させることができる。
ステップS14において、オントロジ化部34は、抽出分類部33より供給されてくる、オントロジ辞書38に登録された単語のうち、句単位で検索された、対応する単語を、入力されたコメントのトピックとして分類し、オントロジ辞書38の構成する概念による階層構造に文章を配置し、これにより文章(コメント)そのものを概念により階層化する(オントロジ化する)。
オントロジ化部34は、例えば、コメントEx1乃至Ex8の文章を、図4のオントロジ辞書38を用いて、図5で示されるように各文章を概念により階層化する。
すなわち、「朝食は美味しくて気に入っています。」という例文Ex1においては、句単位である「朝食は」、「美味しくて」、および「気に入っています。」がそれぞれ検索される。そして、図5の階層L3における「食事」に分類される「朝食」という言葉が検索されることにより、例文Ex1が、「ホテル用語」という概念に含まれる「施設」の下位の「食事」に属する「朝食」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex1は、「朝食」という単語が属する、「ホテル用語」というカテゴリにおける階層L3に属するものとされることで、オントロジ辞書38の概念による階層構造に配置される(オントロジ化される)。
また、「駅からの立地は最高です。」という例文Ex2においては、「駅からの」、「立地は」、および「最高です。」の句単位がそれぞれ検索される。そして、図5の階層L2における「立地」という言葉が検索されることにより、例文Ex2が、「ホテル用語」という概念に含まれる「立地」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex2は、「立地」という単語が属する、「ホテル用語」というカテゴリにおける階層L2に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
さらに、「展望も素晴らしい。」という例文Ex3においては、「展望も」、および「素晴らしい。」がそれぞれ検索される。そして、図5の階層L2における「景色」という言葉と同義語の「展望」が検索されることにより、例文Ex3が「ホテル用語」という概念に含まれる「景色」と同義語の「展望」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex3は、「展望」という単語が属する、「ホテル用語」というカテゴリにおける階層L2に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
また、「駅前でとても楽でした。」という例文Ex4においては、「駅前で」、「とても」、および「楽でした。」がそれぞれ検索される。そして、図5の階層L3における「駅前」という言葉が検索されることにより、例文Ex4が「ホテル用語」という概念に含まれる「立地」の下位の「駅前」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex4は、「駅前」という単語が属する、「ホテル用語」というカテゴリにおける階層L3に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
さらに、「眺めがとてもよい。」という例文Ex5においては、「眺めが」、「とても」、および「よい。」がそれぞれ検索される。そして、図5の階層L3における「景色」と同義語の「眺め」という言葉が検索されることにより、例文Ex5が「ホテル用語」という概念に含まれる「景色」と同義語の「眺め」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex5は、「朝食」という単語が属する、「ホテル用語」というカテゴリにおける階層L2に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
また、「駅前からのアクセスも非常によかった。」という例文Ex6においては、「駅前からの」、「アクセスも」、「非常に」、および「よかった。」がそれぞれ検索される。そして、図5の階層L3における「駅前」という言葉が検索されることにより、例文Ex6が「ホテル用語」という概念に含まれる「立地」の下位の「駅前」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex6は、「駅前」という単語が属する、「ホテル用語」というカテゴリにおける階層L3に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
さらに、「受付の対応もよかったです。」という例文Ex7においては、「受付の」、「対応も」、および「よかったです。」がそれぞれ検索される。そして、図5の階層L3における「ロビー」と同義語の「受付」が検索されることにより、例文Ex7が「ホテル用語」という概念に含まれる「接客」という言葉の下位の「ロビー」と同義語の「受付」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex7は、「受付」という単語が属する、「ホテル用語」というカテゴリにおける階層L3に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
また、「大浴場がないのが残念でした。」という例文Ex8においては、「大浴場が」、「ないのが」、および、「残念でした。」がそれぞれ検索される。そして、図5の階層L4における「大浴場」という言葉が検索されることにより、例文Ex8が「ホテル用語」という概念に含まれる「施設」の下位の「浴場」の下位の「大浴場」というトピックに関する文章であることが分類される。これにより、図5で示されるように、例文Ex8は、「大浴場」という単語が属する、「ホテル用語」というカテゴリにおける階層L3に属するものとされることで、概念により階層構造に配置される(オントロジ化される)。
このように、オントロジ化部34は、オントロジ辞書38を利用して、入力された文章(コメント)そのものを概念により階層化することでオントロジ化し、オントロジ化結果を可視化画像生成部35に出力する。
ステップS15において、可視化画像生成部35は、オントロジ化結果を用いて可視化画像を生成する。
例えば、図6で示されるようなオントロジ化結果である場合、可視化画像生成部35は、可視化画像CHL1,CHL2,CHFを生成して表示部12に出力して表示する。
より詳細には、図6のオントロジ化結果においては、最上位の階層L1が「ROOT」であり、その下の階層L2においては、言葉「A」、「B」が設けられている。また、言葉「A」の下位の階層L3においては、言葉「C」、「D」が設けられており、言葉「B」の下位の階層L3においては、言葉「E」、「F」が設けられている。
さらに、その下の階層L4においても、言葉「C」乃至「F」の下位の言葉が設けられている。
このような場合、可視化画像生成部35は、例えば、階層L2については、可視化画像CHL1で示されるようなパイチャート(円グラフ)を生成する。すなわち、階層L2においては、可視化画像生成部35は、言葉「A」、「B」をトピックとする文章の数に応じた割合を統計処理により求め、統計処理結果を中心位置からの角度の割合として示する可視化画像CHL1を生成する。可視化画像CHL1では、階層L2の言葉「A」をトピックとする文章と、言葉「B」をトピックとする文章との数の割合が、1:3であることが示されている。
また、可視化画像生成部35は、例えば、階層L3については、可視化画像CHL2で示されるようなパイチャート(円グラフ)を生成する。すなわち、階層L2においては、可視化画像生成部35は、言葉「C」乃至「F」をトピックとする文章の数に応じた割合を統計処理により求め、統計処理結果を中心位置からの角度の割合として示する可視化画像CHL2を生成する。可視化画像CHL2では、階層L3における言葉「C」乃至「F」をトピックとする文章の割合がC:D:E:F=1:1:3:3であることが示されている。
以下、各階層に設定された言葉をトピックとする文章の数の割合を示すパイチャートが可視化画像として生成される。
さらに、可視化画像生成部35は、例えば、各言葉に関する可視化画像として、可視化画像CHFを生成して表示部12に表示することもできる。
ここで、可視化画像CHFには、全コメントのうち、言葉「F」について、モダリティ情報に基づいて、ポジティブなものと、ネガティブなものとの割合を示すグラフCHF−1と、詳細なモダリティ情報、すなわち、勧誘、程度、命令、主張、疑問等のいずれかを示す割合を示すグラフCHF−2とが含まれている。尚、ここでは、モダリティ情報は、ポジティブ、ネガティブ、勧誘、程度、命令、主張、疑問のいずれかが割り付けられるものとする場合の例が示されているが、これ以外のモダリティが割り付けられるようにしてもよい。
より具体的には、図7の上部で示されるように、最上位の階層L1が「ホテル用語」のカテゴリに分類される場合、その下位の階層L2には、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」の言葉が配置されることになる。ここで、可視化画像生成部35は、図7の下部で示されるように、それぞれの言葉をトピックとする文章のうち、モダリティ情報がポジティブとなる数と、ネガティブとなる数とを、それぞれ分けてスコアにして記録する。
図7の下部においては、ポジティブなコメントについて、階層L2の「景色」、「立地」、「接客」、「価格」、「部屋」の言葉をトピックとする文章が挙げられており、それぞれ5,5,4,4,3のポイント(文章の数)が記録されている。また、ネガティブなコメントについて、階層L2の「施設」の下位である階層L3の「浴場」をトピックとする文章に4のポイントが記録されている。
したがって、この場合、可視化画像生成部35は、階層L2について、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」のそれぞれをトピックとする文章の数(ポイント)の割合からなる可視化画像CHL1,CHL2に相当するパイチャートからなる可視化画像を生成する。
さらに、可視化画像生成部35は、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」といった各言葉のそれぞれをトピックとする文章のモダリティ情報のうち、ポジティブとなる文章の数、およびネガティブの文章の数それぞれの、総数に対する割合を示すグラフを可視化画像CHF−1として生成する。また、可視化画像生成部35は、「景色」、「立地」、「接客」、「価格」、「部屋」、「施設」といった各言葉をトピックとする文章のモダリティ情報のそれぞれの文章の数の、総数に対する割合を示すグラフを可視化画像CHF−2として生成する。
尚、操作部13が操作されることにより発生される操作信号に応じて、各階層の可視化画像CHL1,CHL2、およびCGFを同時にすべて表示する、または、それらのいずれかを選択的に表示するといったことを、可視化画像生成部35が切り替えて表示部12に表示するようにしてもよい。
<他の実施の形態>
以上においては、オントロジ辞書38が、「ホテル用語」に基づいた専門用語集36により生成される例について説明してきたが、それ以外の用語集に基づいて生成されたものでもよく、例えば、「ゲーム用語」の専門用語集36に基づいて生成されたものであってもよい。
以上においては、オントロジ辞書38が、「ホテル用語」に基づいた専門用語集36により生成される例について説明してきたが、それ以外の用語集に基づいて生成されたものでもよく、例えば、「ゲーム用語」の専門用語集36に基づいて生成されたものであってもよい。
「ゲーム用語」の専門用語集36に基づいて、オントロジ辞書38が生成される場合、例えば、図8で示されるようなものが生成される。
図8においては、最上層の階層L1には、オントロジ辞書38のカテゴリが「ゲーム用語集」であることが示されている。
その下の階層L2には、「ゲーム用語」の概念の最上層の言葉として、「キャラクタ」、「魔法」、および「魔物」が設けられている。
さらに、階層L2より下位の階層L3に、「キャラクタ」および「魔法」のそれぞれに下位の概念の言葉が設けられており、「キャラクタ」の下位の概念の言葉として、「装飾」、および「服装」が設けられており、「魔法」の下位の概念の言葉として「攻撃魔法」、および「回復魔法」が設けられている。ここで、「服装」という言葉と同義語として、「服」、および「衣装」が設けられている。
また、階層L4には、階層L3の各言葉の下位の概念の言葉が設けられており、「装飾」という言葉の下位には、「腕輪」、および「兜」が設けられており、「服装」の下位には、「法衣」、および「鎧」が設けられており、「攻撃魔法」の下位には、「ファイア」、および「サンダ」が設けられており、「回復魔法」の下位には、「ヒール」が設けられている。
さらに、階層L5には、階層L4の「腕輪」の下位の概念の言葉として、「賢者の腕輪」が設けられている。
ここで、ステップS11において、分離されたコメントが、以下の例文Ex11乃至Ex18であるものとする。すなわち、例文Ex11乃至Ex18は、「衣装がダウンロードできず困っています。」、「法衣がダウンロード出来ません。」、「キャラクタをもっと増やして欲しい。」、「賢者の腕輪が最強じゃないとおかしくないですか。」、「色々な攻撃魔法を駆使した強い魔法が使いたい。」、「もっと派手な魔法をつくってほしい。」、「ファイアの攻撃が低すぎます。」、および「回復魔法の使用出来る回数が少なすぎる。」であるものとする。このとき、例文Ex11乃至Ex18は、ステップ13の処理により図9で示されるように句単位に分離される。
すなわち、例えば、例文Ex11の「衣装がダウンロードできず困っています。」は、「衣装が」、「ダウンロードできず」、および「困っています。」と分離されて、「ネガティブ」なものであるとのモダリティ情報が付与される。
また、例文Ex12の「法衣がダウンロード出来ません。」は、「法衣が」、「ダウンロードできず」、および「困っています。」と分離されて、「ネガティブ」、および「不可能」なものであるとのモダリティ情報が付与される。
さらに、例文Ex13の「キャラクタをもっと増やして欲しい。」は、「キャラクタを」、「もっと」、および「増やして欲しい。」と分離されて、「願望」であるとのモダリティ情報が付与される。
また、例文Ex14の「賢者の腕輪が最強じゃないとおかしくないですか。」は、「賢者の腕輪が」、「最強じゃないと」、および「おかしくないですか。」と分離されて、「疑問」であるとのモダリティ情報が付与される。
さらに、例文Ex15の「色々な攻撃魔法を駆使した強い魔法が使いたい。」は、「色々な」、「攻撃魔法を」、「駆使した」、「強い」、「魔法が」、および「使いたい。」と分離されて、「願望」であるとのモダリティ情報が付与される。
また、例文Ex16の「もっと派手な魔法をつくってほしい。」は、「もっと」、「派手な」、「魔法を」、および「つくってほしい」と分離されて、「願望」であるとのモダリティ情報が付与される。
さらに、例文Ex17の「ファイアの攻撃が低すぎます。」は、「ファイアの」、「攻撃が」、および「低すぎます。」と分離されて、「ネガティブ」であるとのモダリティ情報が付与される。
また、例文Ex18の「回復魔法の使用出来る回数が少なすぎる。」は、「回復魔法の」、「使用出来る」、「回数が」、および「少なすぎる。」と分離されて、「ネガティブ」であるとのモダリティ情報が付与される。
さらに、ステップS14の処理により、オントロジ化されることにより、例えば、図10で示されるように、コメントを構成する文章Ex11乃至Ex18を概念により階層化する。
すなわち、「衣装がダウンロードできず困っています。」という例文Ex11の「衣装が」、「ダウンロードできず」、および「困っています。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L3における「服装」と同義語の「衣装」という言葉が検索されることにより、例文Ex11は「ゲーム用語」という概念に含まれる「キャラクタ」の下位の「服装」と同義語の「衣装」をトピックとする文章に分類される。
また、「法衣がダウンロード出来ません。」という例文Ex12の「法衣が」、「ダウンロードできず」、および「困っています。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L3の「衣装」の下位の階層L4の「法衣」という言葉が検索されることにより、例文Ex12は「ゲーム用語」という概念に含まれる「キャラクタ」の下位の「服装」の下位の「衣装」をトピックとする文章に分類される。
さらに、「キャラクタをもっと増やして欲しい。」という例文Ex13では、「キャラクタを」、「もっと」、および「増やして欲しい。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L2の「キャラクタ」が検索されることにより、例文Ex13は「ゲーム用語」という概念に含まれる「キャラクタ」をトピックとする文章に分類される。
また、「賢者の腕輪が最強じゃないとおかしくないですか?」という例文Ex14では、「賢者の腕輪が」、「最強じゃないと」、および「おかしくないですか?」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L4の「賢者の腕輪が」が検索されることにより、例文Ex14が「ゲーム用語」という概念に含まれる「キャラクタ」の下位の階層L3の「装飾」の下位の階層L4の「腕輪」の、さらに下位の階層L5の「賢者の腕輪」をトピックとする文章に分類される。
さらに、「色々な攻撃魔法を駆使した強い魔法が使いたい。」という例文Ex15では、「色々な」、「攻撃魔法を」、「駆使した」、「強い」、「魔法が」、および「使いたい。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L3の「攻撃魔法」が検索されることにより、例文Ex15は「ゲーム用語」という概念に含まれる「魔法」の下位の階層L4の「攻撃魔法」をトピックとする文章に分類される。
また、「もっと派手な魔法をつくってほしい。」という例文Ex16では、「もっと」、「派手な」、「魔法を」、および「つくってほしい。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L2の「魔法」が検索されることにより、例文Ex16は「ゲーム用語」という概念に含まれる「魔法」をトピックとする文章に分類される。
さらに、「ファイアの攻撃が低すぎます。」という例文Ex17では、「ファイアの」、「攻撃が」、および「低すぎます。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L4の「ファイア」が検索されることにより、例文Ex17は「ゲーム用語」という概念に含まれる「魔法」の下位の階層L3の「攻撃魔法」の下位の階層L4の「ファイア」をトピックとする文章に分類される。
また、「回復魔法の使用出来る回数が少なすぎる。」という例文Ex18では、「回復魔法の」、「使用出来る」、「回数が」、および「少なすぎる。」に対応する単語が、それぞれオントロジ辞書38において検索される。そして、図10の階層L3の「回復魔法」が検索されることにより、例文Ex18は「ゲーム用語」という概念に含まれる「魔法」の下位の階層L3の「回復魔法」をトピックとする文章に分類される。
以上のような処理により、図10で示されるようなオントロジ化結果が生成される。
さらに、ステップS15の処理により、例えば、図11で示されるような可視化画像CH1,CH11乃至CH13が生成されて表示部12に表示される。
すなわち、図11の可視化画像CH1においては、左上部に所定の階層に係る言葉をトピックとする文章の数に応じたパイチャートが生成される。図11の左上部のパイチャートからなる可視化画像CH1には、「キャラクタ」、「魔法」、および「魔法」のコメント数に応じた角度が割り当てられており、それぞれ、45%,35%,20%とされている。
また、図11の右上部の可視化画像CH11は、可視化画像CH1における「キャラクタ」に関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像CH11−1が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像CH11−2が設けられている。
さらに、図11の右下部の可視化画像CH12は、可視化画像CH1における「魔法」に関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像CH12−1が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像CH12−2が設けられている。
また、図11の左下部の可視化画像CH13は、可視化画像CH1における「魔物」にに関する可視化情報であり、図中上段には、ポジティブまたはネガティブの割合を示すグラフからなる可視化画像CH13−1が設けられており、図中下段には、さらに詳細なモダリティ情報の割合を示すグラフからなる可視化画像CH13−2が設けられている。
これらの可視化画像CH1およびCH11乃至CH13は、いずれも操作部13を操作することで切り替えて表示させるようにしてもよいし、例えば、可視化画像CH1における「キャラクタ」と表示された部分をポインタなどで選択するとき、可視化画像CH11が表示されるようにしてもよい。
以上の如く、本技術の情報処理装置によれば、コメントとして入力されている複数の文章のそれぞれについて、言語解析により句単位に分離し、オントロジ辞書38で対応する単語を検索し、検索された単語を文章のトピックであるものと分類し、トピックとなる単語により文章を、階層的に分類することで、オントロジ化するようにした。さらに、オントロジ化された結果を可視化画像とすることで表示するようにした。
この結果、コメントを構成する各文章は、オントロジ辞書を用いることで、トピックとなる言葉の概念に応じて階層的に分類することが可能となる(オントロジ化することが可能となる)。また、複数の文章のトピックとなる言葉を利用してオントロジ化することで、オントロジ化された各文章がトピックとする言葉毎の文章の分布を利用した可視化画像を生成することが可能となる。これにより、これまでは、能動的にキーワードなどを入力して検索し、検索されたコメントを読むことしかできなかったが、文章のトピックが、概念による階層化した情報(オントロジ化情報)とされ、これが可視化されることにより、ユーザが特に意識していない客観的な言葉による解析結果が可視化されることになるので、ユーザに対して客観的な解析結果を提示することが可能となる。
<ソフトウェアにより実行させる例>
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
ところで、上述した一連の処理は、ハードウェアにより実行させることもできるが、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。
図12は、汎用のパーソナルコンピュータの構成例を示している。このパーソナルコンピュータは、CPU(Central Processing Unit)1001を内蔵している。CPU1001にはバス1004を介して、入出力インタ-フェイス1005が接続されている。バス1004には、ROM(Read Only Memory)1002およびRAM(Random Access Memory)1003が接続されている。
入出力インタ-フェイス1005には、ユーザが操作コマンドを入力するキーボード、マウスなどの入力デバイスよりなる入力部1006、処理操作画面や処理結果の画像を表示デバイスに出力する出力部1007、プログラムや各種データを格納するハードディスクドライブなどよりなる記憶部1008、LAN(Local Area Network)アダプタなどよりなり、インターネットに代表されるネットワークを介した通信処理を実行する通信部1009が接続されている。また、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどのリムーバブルメディア1011に対してデータを読み書きするドライブ1010が接続されている。
CPU1001は、ROM1002に記憶されているプログラム、または磁気ディスク、光ディスク、光磁気ディスク、もしくは半導体メモリ等のリムーバブルメディア1011ら読み出されて記憶部1008にインストールされ、記憶部1008からRAM1003にロードされたプログラムに従って各種の処理を実行する。RAM1003にはまた、CPU1001が各種の処理を実行する上において必要なデータなども適宜記憶される。
以上のように構成されるコンピュータでは、CPU1001が、例えば、記憶部1008に記憶されているプログラムを、入出力インタフェース1005及びバス1004を介して、RAM1003にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU1001)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア1011に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア1011をドライブ1010に装着することにより、入出力インタフェース1005を介して、記憶部1008にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部1009で受信し、記憶部1008にインストールすることができる。その他、プログラムは、ROM1002や記憶部1008に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
尚、本技術は、以下のような構成も取ることができる。
<1> 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
を含む情報処理装置。
<2> 前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成される
<1>に記載の情報処理装置。
<3> 前記辞書は、オントロジ辞書である
<1>または<2>に記載の情報処理装置。
<4> 前記解析部は、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析し、解析結果に応じて句単位に分離すると共に、前記文章のそれぞれにおけるモダリティを解析し、その結果をモダリティ情報として付加する
<1>乃至<3>のいずれかに記載の情報処理装置。
<5> 前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成する
<1>乃至<4>のいずれかに記載の情報処理装置。
<6> 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成する
<1>乃至<4>のいずれかに記載の情報処理装置。
<7> 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成する
<6>に記載の情報処理装置。
<8> ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含み、
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成する
<1>乃至<7>のいずれかに記載の情報処理装置。
<9> 入力されたテキスト情報からなるコメントを一文ずつに分割し、
前記分割された一文ずつの文章を解析し、句単位に分離し、
前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、
複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する
ステップを含む情報処理方法。
<10> 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
してコンピュータを機能させるプログラム。
<1> 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
を含む情報処理装置。
<2> 前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成される
<1>に記載の情報処理装置。
<3> 前記辞書は、オントロジ辞書である
<1>または<2>に記載の情報処理装置。
<4> 前記解析部は、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析し、解析結果に応じて句単位に分離すると共に、前記文章のそれぞれにおけるモダリティを解析し、その結果をモダリティ情報として付加する
<1>乃至<3>のいずれかに記載の情報処理装置。
<5> 前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成する
<1>乃至<4>のいずれかに記載の情報処理装置。
<6> 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成する
<1>乃至<4>のいずれかに記載の情報処理装置。
<7> 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成する
<6>に記載の情報処理装置。
<8> ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含み、
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成する
<1>乃至<7>のいずれかに記載の情報処理装置。
<9> 入力されたテキスト情報からなるコメントを一文ずつに分割し、
前記分割された一文ずつの文章を解析し、句単位に分離し、
前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、
複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する
ステップを含む情報処理方法。
<10> 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
してコンピュータを機能させるプログラム。
11 情報処理装置, 31 文分割部, 32 言語解析部, 33 抽出分類部, 34 オントロジ化部, 35 可視化画像生成部, 36 専門用語集, 37 辞書生成部, 38 オントロジ辞書
Claims (10)
- 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
を含む情報処理装置。 - 前記辞書は、専門用語集より抽出された単語が、概念により階層化されて配置されることで生成される
請求項1に記載の情報処理装置。 - 前記辞書は、オントロジ辞書である
請求項1に記載の情報処理装置。 - 前記解析部は、前記分割された一文ずつの文章を形態素解析、構文解析、および意味解析し、解析結果に応じて句単位に分離すると共に、前記文章のそれぞれにおけるモダリティを解析し、その結果をモダリティ情報として付加する
請求項1に記載の情報処理装置。 - 前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果を可視化画像として生成する
請求項1に記載の情報処理装置。 - 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果を可視化画像として生成する
請求項1に記載の情報処理装置。 - 前記可視化画像生成部は、前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報のうちのポジティブ、およびネガティブの割合を示す統計処理結果を可視化画像として生成する
請求項6に記載の情報処理装置。 - ユーザの操作を受け付けて操作内容に応じた操作信号を発生する操作部をさらに含み、
前記可視化画像生成部は、前記階層毎に、前記階層に属する単語毎のトピックとして分類された文章の数の総数に対する割合を示す統計処理結果、および前記単語毎にトピックとして分類された文章の数の総数に対する、前記モダリティ情報毎の割合を示す統計処理結果のうち、前記操作部が操作されることにより選択された、少なくともそのいずれかを可視化画像として生成する
請求項1に記載の情報処理装置。 - 入力されたテキスト情報からなるコメントを一文ずつに分割し、
前記分割された一文ずつの文章を解析し、句単位に分離し、
前記文章のそれぞれについて、解析結果である句単位に対応する単語を、概念により階層化した構造で単語が配置された辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化し、
複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する
ステップを含む情報処理方法。 - 入力されたテキスト情報からなるコメントを一文ずつに分割する文分割部と、
前記分割された一文ずつの文章を解析し、句単位に分離する解析部と、
概念により階層化した構造で単語が配置された辞書を記憶する辞書記憶部と、
前記文章のそれぞれについて、前記解析部による解析結果である句単位に対応する単語を、前記辞書内において検索し、検索結果となる単語を前記文章のトピックとし、前記トピックとなる前記単語が属する前記辞書における前記階層を、前記文章の属する階層として分類することで、前記文章を概念により階層化する分類部と、
前記分類部により複数の文章が概念により階層化された情報を統計処理して可視化画像を生成する可視画像生成部と
してコンピュータを機能させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015104709A JP2016218853A (ja) | 2015-05-22 | 2015-05-22 | 情報処理装置、および情報処理方法、並びにプログラム |
PCT/JP2016/063634 WO2016190063A1 (ja) | 2015-05-22 | 2016-05-06 | 情報処理装置、および情報処理方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015104709A JP2016218853A (ja) | 2015-05-22 | 2015-05-22 | 情報処理装置、および情報処理方法、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016218853A true JP2016218853A (ja) | 2016-12-22 |
Family
ID=57393132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015104709A Pending JP2016218853A (ja) | 2015-05-22 | 2015-05-22 | 情報処理装置、および情報処理方法、並びにプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2016218853A (ja) |
WO (1) | WO2016190063A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019101149A (ja) * | 2017-11-30 | 2019-06-24 | 学校法人酪農学園 | 設問自動生成プログラム及び設問自動生成装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5656542B2 (ja) * | 2010-10-06 | 2015-01-21 | 株式会社クリップス | 口コミ情報管理システム及び口コミ情報管理プログラム |
JP5717549B2 (ja) * | 2011-06-10 | 2015-05-13 | 株式会社野村総合研究所 | 感性分析システム及びプログラム |
-
2015
- 2015-05-22 JP JP2015104709A patent/JP2016218853A/ja active Pending
-
2016
- 2016-05-06 WO PCT/JP2016/063634 patent/WO2016190063A1/ja active Application Filing
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019101149A (ja) * | 2017-11-30 | 2019-06-24 | 学校法人酪農学園 | 設問自動生成プログラム及び設問自動生成装置 |
JP7082333B2 (ja) | 2017-11-30 | 2022-06-08 | 学校法人酪農学園 | 設問自動生成プログラム及び設問自動生成装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2016190063A1 (ja) | 2016-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Egger et al. | A topic modeling comparison between lda, nmf, top2vec, and bertopic to demystify twitter posts | |
CN110543574B (zh) | 一种知识图谱的构建方法、装置、设备及介质 | |
Rathan et al. | Consumer insight mining: aspect based Twitter opinion mining of mobile phone reviews | |
CN107491531B (zh) | 基于集成学习框架的中文网络评论情感分类方法 | |
Hai et al. | Analyzing sentiments in one go: A supervised joint topic modeling approach | |
CN105637507B (zh) | 文本跨度的智能选择 | |
US9208144B1 (en) | Crowd-sourced automated vocabulary learning system | |
JP6655788B2 (ja) | 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム | |
US11210328B2 (en) | Apparatus and method for learning narrative of document, and apparatus and method for generating narrative of document | |
Miura et al. | TeamX: A sentiment analyzer with enhanced lexicon mapping and weighting scheme for unbalanced data | |
Shirsat et al. | Document level sentiment analysis from news articles | |
Zaroor et al. | JRC: a job post and resume classification system for online recruitment | |
Syed | Applying sentiment and emotion analysis on brand tweets for digital marketing | |
WO2007066607A1 (ja) | 情報処理装置および方法、並びにプログラム | |
Badaro et al. | A light lexicon-based mobile application for sentiment mining of arabic tweets | |
Priya | Emoji based sentiment analysis using KNN | |
Khan et al. | Sentiview: A visual sentiment analysis framework | |
CN113901263B (zh) | 一种视频素材的标签生成方法及装置 | |
CN113923475B (zh) | 一种视频合成方法及视频合成器 | |
US10650195B2 (en) | Translated-clause generating method, translated-clause generating apparatus, and recording medium | |
CN113886568A (zh) | 一种文本摘要的生成方法及装置 | |
WO2016190063A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
Soni et al. | Comparative analysis of rotten tomatoes movie reviews using sentiment analysis | |
KR20220142705A (ko) | 초고속 분석 인공지능을 이용한 실시간 댓글 판단 방법 | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム |