JP2012256282A - Sensitivity analysis system and program - Google Patents
Sensitivity analysis system and program Download PDFInfo
- Publication number
- JP2012256282A JP2012256282A JP2011130042A JP2011130042A JP2012256282A JP 2012256282 A JP2012256282 A JP 2012256282A JP 2011130042 A JP2011130042 A JP 2011130042A JP 2011130042 A JP2011130042 A JP 2011130042A JP 2012256282 A JP2012256282 A JP 2012256282A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- expression
- negative
- tag
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010206 sensitivity analysis Methods 0.000 title claims description 12
- 238000011156 evaluation Methods 0.000 claims abstract description 171
- 230000014509 gene expression Effects 0.000 claims abstract description 154
- 238000004458 analytical method Methods 0.000 claims abstract description 139
- 238000003860 storage Methods 0.000 claims abstract description 72
- 230000035945 sensitivity Effects 0.000 claims description 37
- 230000015556 catabolic process Effects 0.000 claims description 13
- 239000002245 particle Substances 0.000 claims description 10
- 238000000605 extraction Methods 0.000 abstract description 18
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000008451 emotion Effects 0.000 abstract 4
- 238000000034 method Methods 0.000 description 38
- 238000012731 temporal analysis Methods 0.000 description 32
- 238000000700 time series analysis Methods 0.000 description 32
- 230000008859 change Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 17
- 238000010411 cooking Methods 0.000 description 11
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 6
- 230000002996 emotional effect Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 235000013361 beverage Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 230000004308 accommodation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 206010000087 Abdominal pain upper Diseases 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 241001655798 Taku Species 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000029777 axis specification Effects 0.000 description 1
- 235000021167 banquet Nutrition 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
この発明は感性分析システム及びプログラムに係り、特に、電子掲示板上の記事データやアンケート記事データなどの電子化された文書データから、特定の商品やサービスに関するエンドユーザの主観的な評価や意見を自動的に収集する技術に関する。 The present invention relates to a sensitivity analysis system and program, and in particular, automatically evaluates end users' subjective evaluations and opinions regarding specific products and services from electronic document data such as article data and questionnaire article data on an electronic bulletin board. Related to collective technology.
具体的な商品やサービス(以下「商品等」)に対するエンドユーザの主観的な評価(感想)は、現行商品等の改良や次世代商品等の開発にとって極めて重要な指針となるため、各企業はエンドユーザから集めたアンケート結果を様々な観点から分析し、あるいはネット上の電子掲示板にアクセスし、自社商品等に対する評価をチェックすることを行っている。 Each company's subjective evaluation (impressions) on specific products and services (hereinafter “products, etc.”) is an extremely important guideline for improving current products and developing next-generation products. The results of questionnaires collected from end users are analyzed from various viewpoints, or an electronic bulletin board on the Internet is accessed to check the evaluation of their products.
また、このような人手による分析作業の効率化を図るため、電子化された文章(アンケート情報)をコンピュータを用いて自動解析することにより、特定の商品等に対するエンドユーザの評価を抽出する技術が既に提案されている。
例えば、特許文献1にあっては、所定の対象に対する情動表現を含む文章に対して形態素処理や構文解析処理を施した後、多数の情動表現が登録されたアフェクトターム辞書を参照して、当該文章から情動表現を抽出すると共に、各情動表現の属性(ネガ/ポジ等)を集計し、その結果を外部に出力する技術が開示されている。
この結果、「口紅」という評価対象に関し、色つや、におい、付け心地、パッケージといった複数の評価軸毎に、否定的評価と肯定的評価の分布状況を提示することが可能となる。
For example, in
As a result, regarding the evaluation target “lipstick”, it is possible to present the distribution of negative evaluations and positive evaluations for each of a plurality of evaluation axes such as color, odor, comfort, and package.
このように、従来の分析技術を用いることにより、評価対象である商品等に対するエンドユーザの好き嫌いや良し悪しといった、二者択一的な評価を自動集計することが実現できる。
しかしながら、分析担当者にとってエンドユーザの生の声に触れることは避けて通れず、最終的には膨大な量の文書に当たらざるを得ないのが実情であるが、各エンドユーザがフリーワードで気ままに記述した文書にアトランダムに目を通していくことは極めて非効率的であり、文書閲覧プログラムの検索機能を駆使するにしても、多くの労力を要していた。
As described above, by using the conventional analysis technique, it is possible to automatically aggregate alternative evaluations such as end user's likes and dislikes and good or bad for the products to be evaluated.
However, it is unavoidable for analysts to touch the live voices of end users, and in the end it is inevitably necessary to deal with a huge amount of documents. It is extremely inefficient to look at a document written at will at random, and even if the search function of the document browsing program is fully used, much labor is required.
この発明は、従来のこのような問題を解決するために案出されたものであり、各エンドユーザが記述した膨大な量の文書を、分析担当者が見やすいように分類・整理して提示することを可能とする技術の実現を目的としている。 The present invention has been devised to solve such a conventional problem, and presents an enormous amount of documents described by each end user, classified and arranged so that an analyst can easily see them. The purpose is to realize technology that makes this possible.
上記の目的を達成するため、請求項1に記載した感性分析システムは、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段と、文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段と、各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段と、否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段と、各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段と、各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段と、各文中の主格を構成するための助詞を探索し、当該助詞が付属している自立語を主題と認定する主題認定手段と、発言者の発言意図を表す意図表現と、その意図の類型との組合せを格納しておく意図表現記憶手段と、上記ネガ判定タグが付与された文について「不満」を意味する意図類型タグを関連付けると共に、上記ポジ判定タグが付与された文について「好評」を意味する意図類型タグを関連付け、さらに、各文に含まれる形態素または形態素の組合せからなる表現が、上記意図表現辞書記憶手段に格納された意図表現に該当するか否かを判定し、該当する場合には当該表現に対して対応の類型を示す意図類型タグを関連付ける手段と、複数種類の評価軸を示す文字列と、各評価軸に包含される類似表現との対応関係を格納しておく評価軸類似表現記憶手段と、各文に認定された主題が、上記評価軸類似表現記憶手段に格納された類似表現に該当するか否かを判定し、該当する場合には文に対して対応の評価軸を関連付ける手段と、各文を、共通の評価軸、意図類型及び感性用語を備えた類似文の集合である類似文グループ毎に分類すると共に、各類似文グループ中で文字数が最も少ない類似文を代表意見と認定する手段と、複数の代表意見が列記された代表意見リストを生成する手段と、この代表意見リストを出力する手段とを備えたことを特徴としている。
上記「属性」としては、例えば「+」や「−」の極性が該当するが、「肯定」や「否定」、あるいは「P」や「N」等であってもよい(以下同様)。
上記「『不満』を意味する意図類型タグ」としては、「不満」の他にネガティブな意味を有する「残念」、「否定的」、「文句」などが該当する。
上記「『好評』を意味する意図類型タグ」としては、「好評」の他にポジティブな意味を有する「満足」、「肯定的」、「讃辞」などが該当する。
上記「出力」とは、ディスプレイに表示すること以外に、プリンタを介してプリントアウトすること、所定形式のファイルを生成して記憶手段に格納すること、画面(htmlファイル等)を生成してクライアント端末に送信することを含む概念である。
In order to achieve the above object, a sensitivity analysis system according to claim 1 stores a combination of a sensitivity term representing an affirmative / negative value judgment for an object and an attribute indicating whether it is affirmative / negative. Sensitivity dictionary storage means, morpheme processing is performed on a document file, a plurality of text sentences included in the document file are decomposed into morpheme units, and morphemes or combinations of morphemes included in each sentence It is determined whether or not the expression corresponds to the sensitivity term stored in the sensitivity dictionary storage means, and if so, indicates either the positive or negative attribute combined with the expression Consists of means for associating attribute tags, negative expression storage means for storing negative expressions used in constructing negative sentences, and morphemes or combinations of morphemes included in each sentence Determining whether or not the current expression corresponds to the negative expression stored in the negative expression storage means, and, if applicable, means for associating a negative expression tag indicating that the expression is a negative expression with each expression; Based on the combination pattern of the type of attribute tag associated with the sentence and the presence or absence of a negative expression tag, it is determined whether the sentence is a negative evaluation sentence or a positive evaluation sentence. At the same time, a means for assigning a positive determination tag to a positive evaluation sentence and a particle for constructing the main case in each sentence are searched, and the subject recognition that recognizes the independent word attached to the particle as the subject. Meaning storage means for storing a combination of a means, an intention expression expressing the intention of the speaker, and a type of the intention, and an intention type meaning “dissatisfaction” with respect to the sentence with the negative determination tag When you associate tags The sentence with the positive determination tag is associated with an intention type tag that means “popular”, and an expression composed of a morpheme or a combination of morphemes included in each sentence is stored in the intention expression dictionary storage unit. Means for associating an intention type tag indicating a corresponding type with the expression, a character string indicating a plurality of types of evaluation axes, and each evaluation axis. The evaluation axis similar expression storage means for storing the correspondence relationship with the similar expressions included in the text, and whether the subject recognized in each sentence corresponds to the similar expression stored in the evaluation axis similar expression storage means Means for associating a corresponding evaluation axis with a sentence if applicable, and for each sentence group that is a set of similar sentences with a common evaluation axis, intention type, and sensitivity term As well as A means for recognizing a similar sentence having the smallest number of characters in each similar sentence group as a representative opinion, a means for generating a representative opinion list in which a plurality of representative opinions are listed, and a means for outputting the representative opinion list It is characterized by that.
As the “attribute”, for example, the polarity of “+” or “−” is applicable, but “positive” or “negative”, “P”, “N”, or the like may be used (the same applies hereinafter).
The “intention type tag meaning“ dissatisfied ”” includes “disappointment”, “negative”, “complaint”, etc. having negative meanings in addition to “dissatisfied”.
The “intention type tag meaning“ favored ”” corresponds to “satisfied”, “positive”, “affirmation”, etc. having a positive meaning in addition to “popular”.
In addition to displaying on the display, the above "output" means printing out through a printer, generating a file in a predetermined format and storing it in a storage means, generating a screen (such as an html file), and a client It is a concept including transmitting to a terminal.
請求項2に記載した感性分析システムは、請求項1に記載のシステムであって、さらに、上記代表意見リスト中の各代表意見には、それぞれの類似文グループに含まれる類似文の件数が付記されていることを特徴としている。
The sensibility analysis system according to
請求項3に記載した感性分析システムは、請求項1または2に記載のシステムであって、さらに、上記代表意見リスト中の一の代表意見が選択された場合に、対応の類似文グループに属する個々の類似文を列記した内訳リストを生成する手段と、この内訳リストを出力する手段とを備えたことを特徴としている。
The sensitivity analysis system according to
請求項4に記載した感性分析システムは、請求項3に記載のシステムであって、さらに、上記内訳リスト中の一の類似文が選択された場合に、当該類似文を含む文書の全文を出力する手段を備えたことを特徴としている。
The sensibility analysis system according to
請求項5に記載した感性分析プログラムは、コンピュータを、事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段、文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段、各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段、否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段、各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段、各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段、各文中の主格を構成するための助詞を探索し、当該助詞が付属している自立語を主題と認定する主題認定手段、発言者の発言意図を表す意図表現と、その意図の類型との組合せを格納しておく意図表現記憶手段、上記ネガ判定タグが付与された文について「不満」を意味する意図類型タグを関連付けると共に、上記ポジ判定タグが付与された文について「好評」を意味する意図類型タグを関連付け、さらに、各文に含まれる形態素または形態素の組合せからなる表現が、上記意図表現辞書記憶手段に格納された意図表現に該当するか否かを判定し、該当する場合には当該表現に対して対応の類型を示す意図類型タグを関連付ける手段、複数種類の評価軸を示す文字列と、各評価軸に包含される類似表現との対応関係を格納しておく評価軸類似表現記憶手段、各文に認定された主題が、上記評価軸類似表現記憶手段に格納された類似表現に該当するか否かを判定し、該当する場合には文に対して対応の評価軸を関連付ける手段、各文を、共通の評価軸、意図類型及び感性用語を備えた類似文の集合である類似文グループ毎に分類すると共に、各類似文グループ中で文字数が最も少ない類似文を代表意見と認定する手段、複数の代表意見が列記された代表意見リストを生成する手段、この代表意見リストを出力する手段として機能させることを特徴としている。 The sensitivity analysis program according to claim 5 stores a combination of a sensitivity term representing an affirmative / negative value judgment for an object and an attribute indicating whether the computer is positive / negative. Means for performing morpheme processing on a document file and decomposing a plurality of text sentences included in the document file into morpheme units; an expression comprising a morpheme or a combination of morphemes included in each sentence is the Kansei dictionary Means for associating attribute tags indicating any one of the above-mentioned positive / negative attributes combined with the expression, whether or not it corresponds to a sensitivity term stored in the storage means; Negative expression storage means for storing negative expressions used when composing sentences, expressions composed of morphemes or combinations of morphemes included in each sentence are A means for determining whether or not the negative expression stored in the current storage means corresponds, and in that case, a means for associating a negative expression tag indicating that the expression is a negative expression with the expression, an attribute associated with each sentence Based on the combination pattern of tag type and presence / absence of negative expression tag, it is determined whether the sentence is a negative evaluation sentence or a positive evaluation sentence. Means to attach positive judgment tags to sentences, search for particles that constitute the main character in each sentence, and subject recognition means that recognizes independent words attached with the particles as the subject; An intention expression storage means for storing a combination of an intention expression indicating the type of the intention and a type of the intention, an intention type tag that means “dissatisfied” is associated with the sentence with the negative determination tag, and the positive determination tag But Whether an intention type tag that means “popular” is associated with a given sentence, and further, an expression composed of a morpheme or a combination of morphemes included in each sentence corresponds to an intention expression stored in the intention expression dictionary storage unit. Means for associating an intention type tag indicating a corresponding type with the expression, if applicable, a character string indicating a plurality of types of evaluation axes, and a similar expression included in each evaluation axis Evaluation axis similar expression storage means for storing the correspondence relationship, whether the subject recognized in each sentence corresponds to the similar expression stored in the evaluation axis similar expression storage means, and if so, Is a means of associating a corresponding evaluation axis with a sentence, and each sentence is classified into a similar sentence group that is a set of similar sentences having a common evaluation axis, intention type, and sensitivity term, and in each similar sentence group The number of characters It is characterized by functioning as means for recognizing few similar sentences as representative opinions, means for generating a representative opinion list in which a plurality of representative opinions are listed, and means for outputting the representative opinion list.
この発明に係る感性分析システム及び感性分析プログラムにあっては、多数の分析対象文書から相互に似通った内容の文を類似文グループとして抽出すると共に、各類似文グループから最も文字数の少ない類似文を代表意見として選別し、代表意見リストとして外部に出力することができる。
このため分析担当者は、コンパクトにまとめられた代表意見リストを眺めることにより、分析対象文書の内容を概括することが可能となり、内容チェックの効率化を実現できる。
この代表意見は、機械によって合成された文ではなく、エンドユーザが実際に記述した文そのものであるため、分析担当者はエンドユーザの生の声に触れることができ、行間に潜む微妙なニュアンスを汲み取ることも可能となる。
In the sensibility analysis system and the sensibility analysis program according to the present invention, sentences having similar contents are extracted as a similar sentence group from a large number of analysis target documents, and a similar sentence having the smallest number of characters is extracted from each similar sentence group. A representative opinion can be selected and output as a representative opinion list to the outside.
For this reason, the person in charge of analysis can summarize the contents of the analysis target document by looking at the representative opinion list compiled in a compact manner, and the efficiency of the contents check can be realized.
This representative opinion is not a sentence synthesized by the machine, but a sentence actually written by the end user, so the analyst can touch the live voice of the end user and subtle nuances hidden between the lines. It can also be drawn.
図1は、この発明に係る感性分析システム10の全体構成を示すブロック図であり、文書登録部11と、文書記憶部12と、文書解析部13と、ネガ/ポジ判定部14と、感性辞書記憶部15と、否定表現記憶部16と、主題認定部17と、意図抽出部18と、意図表現記憶部19と、分析結果記憶部20と、分析結果評価部21と、評価軸類似表現記憶部22と、時系列解析部23と、考察ルール記憶部24と、画面生成部25とを備えている。
FIG. 1 is a block diagram showing the overall configuration of a
上記の文書登録部11、文書解析部13、ネガ/ポジ判定部14、主題認定部17、意図抽出部18、分析結果評価部21、時系列解析部23及び画面生成部25は、サーバコンピュータのCPUが、OS及びアプリケーションプログラムに従って必要な処理を実行することによって実現される。
また、上記の文書記憶部12、感性辞書記憶部15、否定表現記憶部16、意図表現記憶部19、分析結果記憶部20、評価軸類似表現記憶部22及び考察ルール記憶部24は、サーバコンピュータの外部記憶装置内に設けられている。
The
In addition, the
この感性分析システム10は、Webサーバ26とネットワーク接続されており、Webサーバ26はインターネット27を介して複数のクライアント端末28と接続される。
各クライアント端末28は、OS及びWebブラウザを搭載したPC等よりなる。
This
Each
つぎに、この感性分析システム10の利用方法について説明する。
まずユーザは、クライアント端末28からWebサーバ26にアクセスし、ID及びパスワードを入力してログインした後、サービスメニューから「感性分析サービス」を選択する。
この結果、Webサーバ26からクライアント端末28に対して分析条件指定画面が送信される。
Next, a method of using the
First, the user accesses the
As a result, an analysis condition designation screen is transmitted from the
図2は、この分析条件指定画面40の一例を示すものであり、分析対象ファイル指定欄41と、評価軸指定欄42とを備えている。
FIG. 2 shows an example of the analysis
まず、分析対象ファイル指定欄41は、ユーザ側で事前に準備した文書ファイルを指定する欄である。すなわち、ユーザが参照ボタン43をクリックすると、クライアント端末28のドライブ構造を示すファイル選択ウィンドウがWebブラウザ上に表示される。これに対しユーザは、特定のドライブ名やその配下のフォルダ名をクリックして展開させ、特定の文書ファイルを指定する。
図においては、「03〜11 アンケート結果.csv」という文書ファイルが指定されている。
First, the analysis target
In the figure, a document file “03-11 questionnaire result.csv” is designated.
この文書ファイルには、ユーザである「ABC観光ホテル」の顧客から集めた電子化済みの文書が、複数件格納されている。
各文書は、個々の顧客が記述したアンケートの回答文書に相当し、それぞれ複数の文が含まれている。また各文書には、回答日時や更新日時等の時間情報と、回答者の属性情報(性別、年代、職業、都道府県、郵便番号等)が付加されている。
In this document file, a plurality of digitized documents collected from customers of the user “ABC Tourist Hotel” are stored.
Each document corresponds to a questionnaire response document described by an individual customer, and each document includes a plurality of sentences. In addition, each document is added with time information such as reply date and time, update date and time, and attribute information of the respondent (gender, age, occupation, prefecture, postal code, etc.).
評価軸指定欄42は、分析対象ファイルに含まれた各文に対する分析項目を指定する欄であり、ユーザの属する業界毎に設定された標準の評価軸が、複数列挙されている。
図においては、ユーザIDに関連付けられた業種コードが「ホテル・旅館業界」であるため、「価格」、「料理」、「部屋」、「風呂」、「立地」、「宴会」、「設備」等が表示されている。
これに対しユーザは、不要な評価軸のチェックボックスに入れられたチェックを外すことにより、当該評価軸を分析項目から除外することができる。
The evaluation
In the figure, since the industry code associated with the user ID is “Hotel / Ryokan industry”, “Price”, “Cooking”, “Room”, “Bath”, “Location”, “Banquet”, “Equipment” Etc. are displayed.
On the other hand, the user can exclude the evaluation axis from the analysis items by unchecking the check box of the unnecessary evaluation axis.
以上の設定を完了したユーザが、分析開始ボタン44をクリックすると、クライアント端末28からWebサーバ26に対して、感性分析リクエストが送信される。
この際、ユーザが指定した文書ファイルのデータと、ユーザが設定した評価軸の識別コードが、Webサーバ26に送信される。
これを受けたWebサーバ26は、クライアント端末28からアップロードされた文書ファイルや評価軸の識別コード、当該ユーザの業種コード等のデータを感性分析システム10に送信し、分析を依頼する。
When the user who has completed the above settings clicks the
At this time, the document file data designated by the user and the evaluation axis identification code set by the user are transmitted to the
Receiving this, the
以下、図3のフローチャートに従い、この感性分析システム10における処理手順を説明する。
まず、感性分析システム10の文書登録部11は、Webサーバ26から送信された文書ファイルを、文書記憶部12に格納する(S10)。この文書ファイルには、ユーザが設定した評価軸の識別コード及びユーザの業種コードが関連付けられている。
Hereinafter, the processing procedure in the
First, the
つぎに、文書解析部13が文書記憶部12に格納された文書ファイルを取り出し、当該文書ファイル中の各文書について文書識別コードを付与すると同時に、各文書に含まれる各文について文識別コードを付与する(S11)。
Next, the
つぎに文書解析部13は、文書ファイル中の各文について、形態素解析処理を施す(S12)。
ここで「形態素解析」とは、自然言語で記述された文を、意味を有する最小の言語単位である形態素に分解し、それぞれの品詞を特定する処理をいう。この形態素解析処理は公知技術であり、例えば以下のようなフリーソフトを形態素解析エンジンとして用いることができる。
■MeCab(http://mecab.sourceforge.net/)
■ChaSen(http://chasen.naist.jp/hiki/ChaSen/)
Next, the
Here, “morpheme analysis” refers to a process of decomposing a sentence written in a natural language into morphemes, which are the smallest meaningful language units, and specifying each part of speech. This morpheme analysis process is a known technique. For example, the following free software can be used as the morpheme analysis engine.
■ MeCab (http://mecab.sourceforge.net/)
■ ChaSen (http://chasen.naist.jp/hiki/ChaSen/)
つぎに文書解析部13は、形態素に分解された各文について、構文解析処理を施す(S14)。
ここで「構文解析」とは、各文に含まれる文節間の係り受け構造を特定する処理をいう。この構文解析自体も公知技術であり、例えば以下のようなフリーソフトを構文解析エンジンとして用いることができる。
■KNP(http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html)
■CaboCha(http://chasen.org/~taku/software/cabocha/)
Next, the
Here, “syntactic analysis” refers to a process of specifying a dependency structure between clauses included in each sentence. This syntax analysis itself is also a known technique. For example, the following free software can be used as the syntax analysis engine.
■ KNP (http://nlp.kuee.kyoto-u.ac.jp/nl-resource/knp.html)
■ CaboCha (http://chasen.org/~taku/software/cabocha/)
文書解析部13による処理が完了すると、ネガ/ポジ判定部14によるネガ/ポジ判定処理が実行される(S16)。
以下、図4のフローチャートに従い、ネガ/ポジ判定処理の具体的な手順について説明する。
When the processing by the
Hereinafter, a specific procedure of the negative / positive determination process will be described with reference to the flowchart of FIG.
まずネガ/ポジ判定部14は、感性辞書記憶部15内に格納された各種感性辞書を参照し、各文を構成する形態素または形態素の組合せの中で、感性辞書に登録された感性用語に該当するものを探索する(S16-01)。
First, the negative /
感性辞書記憶部15には、図5に示すように、汎用辞書群50と、複数のドメイン別辞書群55が格納されている。また、汎用辞書群50には、単語辞書51、二項関係辞書52、慣用句辞書53、擬態語辞書54の各辞書が含まれている。さらに、各ドメイン別辞書群55には、単語辞書56、二項関係辞書57、擬態語辞書58の各辞書がそれぞれ含まれている。
As shown in FIG. 5, the sensitivity
図6は、汎用辞書群50に属する単語辞書51の登録データを例示するものであり、「感性用語」、「読みがな」及び「極性」のデータ項目を備えたレコードが多数格納されている。
ここで「感性用語」のデータ項目には、「おいしい」や「うまい」、「まずい」等、事物に対する肯定/否定(良し悪し)に関する人間の主観的な価値判断を表す名詞や形容詞等が格納されている。また、極性のデータ項目には、当該感性用語の意味内容が肯定的な場合には「+」の符号が、否定的な場合には「−」の符号が設定されている。
FIG. 6 exemplifies registered data of the
Here, the “Kansei term” data item stores nouns, adjectives, etc. that represent human subjective value judgments regarding positive / negative (good / bad) things such as “delicious”, “delicious”, “bad”, etc. Has been. Further, in the polarity data item, a sign “+” is set when the meaning content of the sensitivity term is positive, and a sign “−” is set when it is negative.
汎用辞書群50に属する二項関係辞書52にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
ここで「二項関係」とは、例えば「値段が高い」のように、二つの単語が助詞を介して組み合わされることにより、初めて一つの具体的な価値判断が生じる言葉を意味している。
すなわち、「高い」という形容詞は、一般的には肯定的な意味合いを観念させるものであるが、「値段が高い」や「危険性が高い」、「腐食性が高い」のように、主語によっては否定的な意味合いが生じる場合がある。あるいは逆に、「低い」という形容詞は、一般的には否定的な意味合いを観念させるものであるが、「危険性が低い」や「毒性が低い」、「違法性が低い」のように、主語によって肯定的な意味合いが生じる場合がある。
このため二項関係辞書52には、このように二つの単語の組合せによって具体的な価値判断を表すこととなる言葉について、「+」または「−」の極性が付与されている。
In the
Here, the “binary relationship” means a word that causes a specific value judgment for the first time when two words are combined through a particle, for example, “high price”.
In other words, the adjective “high” generally has a positive meaning, but it depends on the subject, such as “high price”, “high risk”, and “high corrosiveness”. May have negative implications. Or, conversely, the adjective “low” is generally conceived of a negative meaning, but like “low risk”, “low toxicity”, “low illegality” The subject may have positive implications.
For this reason, the
汎用辞書群50に属する慣用句辞書53にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
具体的には、「馬の耳に念仏(感性用語)/−(極性)」、「雨降って地固まる(感性用語)/+(極性)」、「片腹痛い(感性用語)/−(極性)」、「覆水盆に返らず(感性用語)/−(極性)」、「出藍の誉れ(感性用語)/+(極性)」のように、諺や格言のように価値判断を伴う慣用句が「感性用語」のデータ項目に充填されると共に、各慣用句の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
In the
Specifically, “Nenbutsu in the ears of the horse (sensitivity term) / − (polarity)”, “It rains and solidifies (sensitivity term) / + (polarity)”, “Hit stomachache (sensitivity term) / − (polarity) ”,“ Do not return to the basin (sensitivity term) / − (polarity) ”,“ Honor of the indigo (sensitivity term) / + (polarity) ”, and idioms with value judgments such as proverbs and maxims Is filled in the data item of “Kansei term”, and “+” is used when the meaning of each idiom is positive, and “−” is “polarity” when it is negative. The data items are filled.
汎用辞書群50に属する擬態語辞書54にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードが多数登録されている。
具体的には、「わくわく(感性用語)/+(極性)」、「ほっこり(感性用語)/+(極性)」、「ざわざわ(感性用語)/−(極性)」、「ぎとぎと(感性用語)/−(極性)」のように、価値判断を伴う擬態語が「感性用語」のデータ項目に充填されると共に、各擬態語の意味合いが肯定的なものである場合には「+」が、否定的なものである場合には「−」が「極性」のデータ項目に充填されている。
Although not shown in the
Specifically, "Waku Waku (Sensitive term) / + (Polarity)", "Hot (Sensitive term) / + (Polarity)", "Zawazawa (Sensitive term) /-(Polarity)", "Gitto (Sensitive term) Like “/-(polarity)”, a mimetic word with a value judgment is filled in the data item of “Kansei term”, and “+” is negative when the meaning of each mimetic word is positive. If it is a negative one, “-” is filled in the “polarity” data item.
各ドメイン別辞書群55に属する単語辞書56、二項関係辞書57、擬態語辞書58にも、図示は省略したが、「感性用語」、「読みがな」、「極性」のデータ項目を備えたレコードがそれぞれ多数登録されている。
ただし、各ドメイン別辞書群は、それぞれ特定のカテゴリ(業界、商品分野、サービス分野)毎に用意されており、当該カテゴリに特有の感性用語や極性が登録されている。
Although not shown, the
However, each domain dictionary group is prepared for each specific category (industry, product field, service field), and sensitivity terms and polarities specific to the category are registered.
そして、特定の形態素または形態素の組合せにマッチする感性用語が感性辞書中に存在していた場合、ネガ/ポジ判定部14はその感性用語の極性を表すタグ(<+>または<−>)を当該表現に付与する(S16-02)。
When a sensitivity term matching a specific morpheme or combination of morphemes exists in the sensitivity dictionary, the negative /
この際、例えば文中に「値段が少し高い」という表現があり、二項関係辞書52中に「値段が高い(感性用語)/−(極性)」の登録例が存在した場合に、ネガ/ポジ判定部14は構文解析の処理結果を参照することにより、「値段が少し高い」に対して<−>のタグを付与することができる。
すなわち、文書解析部13による構文解析処理により、当該文中の「値段が」の文節が「高い」の文節に係ることを示す解析データが生成されているため、ネガ/ポジ判定部14はこの解析データに基づき、二項関係辞書52中の「値段が高い」の極性を「値段が少し高い」の表現に適用可能となる。
In this case, for example, if there is an expression “price is a little high” in the sentence, and there is a registered example of “high price (sensitivity term) / − (polarity)” in the binary
That is, since the analysis data indicating that the “price” clause in the sentence relates to the “high” clause is generated by the parsing process by the
つぎにネガ/ポジ判定部14は、否定表現記憶部16を参照し、各文を構成する形態素または形態素の組合せ中で、否定表現記憶部16に登録された否定表現パターンに合致する表現を探索する(S16-03)。
Next, the negative /
否定表現記憶部16には、図示は省略したが、否定文を作る際に用いられる多数の否定表現パターンが格納されている。例えば、「思えません」、「思えない」、「いえません」、「いえない」、「いえぬ」、「ありません」、「ない」、「感じません」、「感じない」、「考えません」、「考えない」等が該当する。
そして、否定表現記憶部16中に文中の形態素または形態素の組合せにマッチする否定表現パターンが登録されていた場合、ネガ/ポジ判定部14はその表現(形態素または形態素の組合せ)に対して否定表現タグ(<否定>)を付与する(S16-04)。
Although not shown in the figure, the negative
If a negative expression pattern that matches the morpheme or combination of morphemes in the sentence is registered in the negative
つぎにネガ/ポジ判定部14は、各文に付与された極性タグと否定表現タグとの組合せに独自の文法ルールを適用することにより、文全体が否定的か肯定的かの判定を行う(S16-05)。
そして、「否定的」との判定結果が出た場合、ネガ/ポジ判定部14は当該否定評価文に「<N>(Negative)」のネガ判定タグを付与し、「肯定的」との判定結果が出た場合には、当該肯定評価文に「<P>(Positive)」のポジ判定タグを付与する(S16-06)。
Next, the negative /
When a negative determination result is obtained, the negative /
例えば、図7(a)に示すように、「料理は、おいしいと思いました。」という文の場合、「おいしい」の形態素に<+>の極性タグが付与されており、<否定>タグは付与されていないため、ネガ/ポジ判定部14は文全体を「肯定的」と認定し、<P>のポジ判定タグを関連付ける。
For example, as shown in FIG. 7A, in the case of the sentence “I thought the dish was delicious,” the <+> polarity tag was attached to the “delicious” morpheme, and the <deny> tag Is not assigned, the negative /
これに対し、図7(b)に示すように、「料理は、おいしいとは思いませんでした。」という文の場合、「おいしい」の形態素に<+>の極性タグが付与されているが、それよりも後方に位置する「思いません」の部分に<否定>タグが付与されているため、ネガ/ポジ判定部14は文全体を「否定的」と認定し、<N>のネガ判定タグを関連付ける。
On the other hand, as shown in FIG. 7B, in the case of the sentence “I didn't think the dish was delicious,” the “+” polarity tag was attached to the “delicious” morpheme. Since the <No> tag is attached to the “I don't think” part that is located behind it, the negative /
また、図7(c)に示すように、「料理は、まずかったです。」という文の場合、「まずかっ」の形態素に<−>の極性が付与されており、<否定>タグは付与されていないため、ネガ/ポジ判定部14は文全体を「否定的」と認定し、<N>のネガ判定タグを関連付ける。
In addition, as shown in FIG. 7 (c), in the case of the sentence “Cooking was bad”, the <-> polarity is assigned to the “morphic” morpheme, and the <negative> tag is assigned. Therefore, the negative /
これに対し、図7(d)に示すように、「料理は、まずくはありませんでした。」という文の場合、「まずく」の形態素に<−>の極性が付与されているが、それよりも後方に位置する「ありません」の部分に<否定>タグが付与されているため、ネガ/ポジ判定部14は文全体を「肯定的」と認定し、<P>のポジ判定タグを関連付ける。
On the other hand, as shown in FIG. 7 (d), in the case of the sentence “Cooking was not bad”, the <-> polarity was given to the “poor” morpheme. Since the <Negated> tag is assigned to the “no” part located at the rear, the negative / positive determining
ネガ/ポジ判定部14によるネガ/ポジ判定処理が完了すると、主題認定部17による主題認定処理が実行される(図3のS18)。
ここで「主題認定処理」とは、ネガ/ポジの評価対象を特定する処理を意味する。
When the negative / positive determination processing by the negative /
Here, the “subject recognition process” means a process for specifying a negative / positive evaluation target.
この主題を特定するため主題認定部17は、まず文中における格要素「〜は」、「〜が」、「〜も」を探索し、これらの助詞が付属している自立語(主格)を主題と認定し、その旨を示す<主題>のタグを付与する。図7で示した各例文の場合、「料理」が主題に該当する。
In order to identify this subject, the
文によっては、主格が省略されている場合がある。例えば、図8に示すように、「(1) 部屋が蒸し暑くて寝苦しかった。」の文に続く「(2) しかもかび臭かった。」では、主格が省略されている。このような場合、主題認定部17は前の文の主題である「部屋」を後の文に継承させ、(2)の文の主題として「部屋」を認定する。
In some sentences, the main character may be omitted. For example, as shown in FIG. 8, the main character is omitted in “(2) It was musty” following the sentence “(1) The room was too hot and hard to sleep”. In such a case, the
この主題の継承は、連続する文の間に限定されるものではなく、主格の存在しない文が続いた場合には、次々と継承される。
図8においては、「(3) 静かなのがせめてもの救いだった。」の文にも、(1)の文の「部屋」が主格として継承されている。そして、新たな主格である「料理は」を有する(4)の文が登場した時点で、「部屋」の主題としての継承が停止されている。
Inheritance of this subject is not limited between successive sentences, but is inherited one after another when sentences without a main character continue.
In FIG. 8, the “room” in the sentence (1) is inherited as the main character in the sentence “(3) It was a salvation at least for quiet.” Then, when the sentence (4) having a new main character “Cooking” appears, the inheritance as the theme of “room” is stopped.
当該文中に主格が存在せず、かつ、継承すべき主格を備えた先行文が存在しない場合、主題認定部17は当該文中に連体修飾語が含まれているか否かを探索し、連体修飾語を発見した場合にはその修飾先の形態素を主題と認定する。
例えば、「いい香り。」という文の場合、主格が省略されているが、「香り」という名詞(体言)を修飾している連体修飾語「いい(<+>)」が存在しているため、主題認定部17は「香り」を当該文の主題と認定する。
If there is no main character in the sentence and there is no preceding sentence with a main character that should be inherited, the
For example, in the case of the sentence “good scent.”, The main character is omitted, but there is a combined modifier “good (<+>)” that modifies the noun (body name) “scent”. The
主題認定部17による主題認定処理が完了すると、意図抽出部18による意図抽出処理が実行される(図3のS20)。
ここで「意図」とは、個別の主題に対する発言者(文執筆者)の「良い/悪い」という二元論的な価値判断の他に、当該価値判断の背後に潜む発言目的や思惑、あるいは良し悪しの価値判断から離れた発言者の読み手に対する主張やメッセージなどを含む概念であり、「好評」、「不満」、「意向」、「要望」、「質問」、「予想外」、「興味有り」、「興味無し」等に類型化できる。
When the subject certification process by the
Here, “intent” refers to the dualistic value judgment of “good / bad” by a speaker (writer) on an individual subject, as well as the purpose or speculation behind the value judgment, or the good or bad This is a concept that includes an assertion or message to the reader of a speaker who is far from the judgment of the value of, and is "popular", "dissatisfied", "intention", "request", "question", "unexpected", "interesting" , “No interest”, etc.
まず意図抽出部18は、<P>のポジ判定タグが付与された文に対して<好評>の意図類型タグを付与すると共に、<N>のネガ判定タグが付与された文に対して<不満>の意図類型タグを付与する。
First, the
つぎに、意図抽出部18は意図表現記憶部19を参照して、各文中の表現(形態素または形態素の組合せ)とのマッチングを実行し、<好評>及び<不満>以外の意図類型を抽出する。
すなわち、図9に示すように、意図表現記憶部19に格納された各レコードは、「意図表現」と「意図類型」のデータ項目を備えている。そこで意図抽出部18は、この意図表現にマッチする表現を各文中において探索し、該当する表現を発見した場合には、対応する意図類型のタグを当該表現に関連付ける。
Next, the
That is, as shown in FIG. 9, each record stored in the intention
例えば、図10(a)に示すように、「夕食が粗末なので、もう少し品数を増やして下さい。」という文が与えられた場合、意図抽出部18は「下さい」の文字列が意図表現記憶部19に存在することを探知した後、「下さい」の意図類型である「要望」に対応した<要望>の意図類型タグを当該表現に関連付ける。
因みに、この文については文全体が「否定的」であることを示す<N>のネガ判定タグが付与されているため、<不満>の意図類型タグが重複的に付与されている。
For example, as shown in FIG. 10 (a), when the sentence “Since dinner is poor, please increase the number of items a little more.” Is given, the
Incidentally, since the negative determination tag of <N> indicating that the whole sentence is “negative” is assigned to this sentence, the <unsatisfied> intention type tag is redundantly assigned.
また、図10(b)に示すように、「値段が良心的なのには驚きました。」という文が与えられた場合、意図抽出部18は「驚き」の文字列が意図表現記憶部19に存在することを探知した後、「驚き」に対応した<予想外>の意図類型タグを当該表現に付与する。
この文については、文全体が「肯定的」であることを示す<P>のポジ判定タグが付与されているため、<好評>の意図類型タグも付与されている。
Also, as shown in FIG. 10B, when a sentence “I was surprised that the price is conscientious” is given, the
For this sentence, the <P> positive determination tag indicating that the entire sentence is “positive” is assigned, and therefore, the <popular> intention type tag is also assigned.
また、図10(c)に示すように、「アクセスが悪いので今度は車にしたい。」という文が与えられた場合、意図抽出部18は「したい」の文字列が意図表現記憶部19に存在することを探知した後、「したい」に対応した<意向>の意図類型タグを当該文に付与する。
この文については、文全体が「否定的」であることを示す<N>のネガ判定タグが付与されているため、<不満>の意図類型タグも付与されている。。
Further, as shown in FIG. 10 (c), when the sentence “I want to drive this time because the access is bad” is given, the
For this sentence, since the negative determination tag of <N> indicating that the whole sentence is “negative” is assigned, the intention type tag of <dissatisfaction> is also assigned. .
さらに、図10(d)に示すように、「当方の頼み方がいけなかったのでしょうか?」という文が与えられた場合、意図抽出部18は「でしょうか」の文字列が意図表現記憶部19に存在することを探知した後、「でしょうか」に対応した<質問>の意図類型タグを当該文に付与する。
この文の場合、ネガ/ポジの判定結果を示すタグが付与されていないため、<好評>や<不満>の意図類型タグは付与されていない。
Furthermore, as shown in FIG. 10 (d), when a sentence “Is it possible to ask us?” Is given, the
In the case of this sentence, the tag indicating the negative / positive determination result is not attached, and thus the intention type tag of <favorable> or <not satisfied> is not attached.
分析対象ファイルに含まれる全ての文について意図抽出処理が完了すると、意図抽出部18は、これまでの分析結果を分析結果記憶部20に格納する(図3のS22)。
ここで「分析結果」とは、各文に対して主題タグや極性タグ、否定表現タグ、ネガ/ポジ判定タグ、意図類型タグを付与した分析結果データが該当する。
When the intention extraction process is completed for all sentences included in the analysis target file, the
Here, “analysis result” corresponds to analysis result data in which a subject tag, a polarity tag, a negative expression tag, a negative / positive determination tag, and an intention type tag are assigned to each sentence.
つぎに、分析結果評価部21及び画面生成部25によって、分析結果画面が生成される(図3のS24)。
この分析結果画面は、Webサーバ26を経由してクライアント端末28に送信される(図3のS26)。
Next, the analysis
This analysis result screen is transmitted to the
図11は、クライアント端末28のWebブラウザ上に表示された分析結果画面60の一例を示すものであり、メイン領域にはネガ/ポジ分析結果を示すネガ/ポジ分布グラフ61が表示されている。
また、サイドバーには、意図抽出結果の件数がツリー状に表示された意図分類チャート62が設けられている。
FIG. 11 shows an example of the
Further, the sidebar is provided with an
まず、ネガ/ポジ分布グラフ61には、総合、価格、料理、部屋、風呂、立地の評価軸毎に、ポジ、ネガ、中立のパーセンテージが帯グラフによって示されている。
このグラフ61を参照することにより、例えば、「価格」についてはポジ判定の付いた文書の割合がネガ判定の文書の割合よりも多いことから、顧客は価格について概ね満足していることが読み取れる。
これに対し、「部屋」についてはネガ判定の付いた文書の割合が圧倒的に多くなっているため、多くの顧客の不興を買っていることが理解できる。
また、各評価軸の合計値から導かれた「総合」については、ポジとネガの比率が拮抗しているため、全体としては「可もなく不可もなし」という結果を認識することができる。
First, in the negative /
By referring to this
On the other hand, regarding the “room”, since the proportion of documents with negative judgments is overwhelmingly large, it can be understood that many customers are buying a bad experience.
In addition, with respect to “total” derived from the total value of each evaluation axis, the ratio of positive and negative is antagonizing, so the overall result can be recognized as “no good or bad”.
ネガ/ポジ分析結果の見せ方は上記の帯グラフに限定されるものではなく、レーダーチャートや円グラフによってネガ/ポジの割合や数を表示することもできる。 The way of showing the negative / positive analysis result is not limited to the above-mentioned band graph, and the negative / positive ratio and number can also be displayed by a radar chart or a pie chart.
意図分類チャート62においては、価格、料理、部屋、風呂、立地の評価軸毎に、該当文の延べ件数が括弧内に表示されている。例えば、「価格」に関しては318件の文が、「料理」に関しては170件の文が関連付けられている。
In the
ここでユーザが各評価軸をクリックすると、好評、不満、意向、要望、質問、予想外、興味有り、興味無し、不明の意図類型がそれぞれ展開する。
また、各意図類型には該当の意図類型タグが付与された文の延べ数が括弧内に表示されている。例えば、「価格」配下の「好評」に関しては74件の文が存在しており、同「不満」に関しては121件の文が存在していることが示されている。
「不明」とは、該当の評価軸に係るものではあるが、何れの意図類型タグをも付与されていない文の数を示している。
When the user clicks each evaluation axis, popular intentions, dissatisfactions, intentions, requests, questions, unexpected, interested, not interested, and unknown intention types are developed.
In addition, the total number of sentences with the corresponding intention type tag is displayed in parentheses for each intention type. For example, it is shown that there are 74 sentences for “popular” under “price” and 121 sentences for “dissatisfied”.
“Unknown” indicates the number of sentences that are related to the relevant evaluation axis but are not assigned any intention type tag.
ここでユーザが何れかの意図類型をクリックすると、当該意図類型に含まれる代表意見が複数列挙された代表意見リストが展開する。
例えば、ユーザが評価軸「価格」配下の意図類型「好評」をクリックすると、図12に示すように、サイドバー中に「料金の安さが魅力。(17)」、「料金が手ごろだし。(12)」、「安いわりには良し。(15)」等の代表意見を列記した代表意見リスト63が展開表示される。
各代表意見の末尾に付記された括弧付きの数字は、当該代表意見及びその類似文の合計数を示している。
Here, when the user clicks on any intention type, a representative opinion list in which a plurality of representative opinions included in the intention type are listed is developed.
For example, when the user clicks an intention type “popular” under the evaluation axis “price”, as shown in FIG. 12, “low price is attractive. (17)”, “price is reasonable” in the sidebar. The
The numbers in parentheses attached to the end of each representative opinion indicate the total number of the representative opinions and similar sentences.
これに対しユーザが何れかの代表意見をマウスポインタで選択すると、メイン領域に当該代表意見及びその類似文から構成される類似文グループの内訳リスト64が表示される。
この内訳リスト64は、文書番号及び類似文の表示項目を備えており、類似文の表示項目には、各文書の中で代表意見と同一または近似した文が表示されている。この結果ユーザは、個々の類似文の具体的な表現を確認することが可能となる。
On the other hand, when the user selects any representative opinion with the mouse pointer, a
The
ユーザが任意の類似文の「選択」ボタン65をクリックすると、図示は省略したが、ディスプレイ上に別ウィンドウが起動して、当該代表意見または他の類似文を含む文書の全体が表示される。
表示された文書中の各文には、各種情報(極性タグ、否定表現タグ、ネガ/ポジ判定タグ、主題タグ、評価軸、意図類型タグ、属性情報、時間情報等)が付与されている。
When the user clicks the “select”
Various information (polarity tag, negative expression tag, negative / positive determination tag, theme tag, evaluation axis, intention type tag, attribute information, time information, etc.) is given to each sentence in the displayed document.
上記のように、このシステム10においては、まず代表意見リスト63が画面中に表示された後、その中の一の代表意見に係る内訳リスト64が表示され、最後に内訳リスト64中の一の類似文に係る文書全体が表示されというように、分析対象データの内容が段階的に表示される仕組みを備えているため、分析担当者は要チェックの文を容易に探知することができ、作業効率を飛躍的に向上させることができる。
As described above, in this
つぎに、図13のフローチャートに従い、この分析結果画面60の生成に係る処理手順を説明する。
まず、分析結果評価部21は、当該文書ファイルに関連付けられた評価軸である「価格」、「料理」、「部屋」、「風呂」、「立地」を取得する(S24-01)。
つぎに分析結果評価部21は、評価軸類似表現記憶部22に格納された業界毎の評価軸類似表現辞書を参照し、各評価軸の類似表現(展開語)を特定する(S24-02)。
Next, a processing procedure related to generation of the
First, the analysis
Next, the analysis
図14は、評価軸類似表現記憶部22に格納されたホテル・旅館業界用の評価軸類似表現辞書の具体例を示している。
例えば、「価格」の評価軸については、「価格」の他に、「料金」、「値段」、「宿泊料」、「宿代」等の類義語や関連語が類似表現として格納されている。これらの類似表現は、一般的な類義語辞書等を参照し、また個々の業界の特性を考慮しつつ、ユーザの属する業界毎に編纂されたものである。
このため、「価格」の評価軸について、「価格」や「料金」、「値段」といった一般的な呼び名の他に、「宿泊料」、「宿代」のようにホテル・旅館業界に特有の呼び名が列記されている。
また、飲食業界に属するユーザに対してサービスを提供する場合には、「宿泊料」や「宿代」の代わりに「飲食代」や「飲み代」等の類似表現が列記された、飲食業界用の評価軸類似表現辞書が適用されることとなる。
FIG. 14 shows a specific example of an evaluation axis similar expression dictionary for the hotel / ryokan industry stored in the evaluation axis similar
For example, for the evaluation axis of “price”, synonyms and related words such as “fee”, “price”, “accommodation fee”, “accommodation fee”, and the like are stored as similar expressions in addition to “price”. These similar expressions are compiled for each industry to which the user belongs while referring to a general synonym dictionary or the like and considering the characteristics of each industry.
For this reason, on the evaluation axis of “price”, in addition to general names such as “price”, “price”, and “price”, “hotel charges” and “price” are unique to the hotel and ryokan industry. Names are listed.
In addition, when providing services to users belonging to the food and beverage industry, similar expressions such as “food and beverage charges” and “beverage charges” are listed instead of “hotel charges” and “hotel charges”. The evaluation axis similarity expression dictionary is applied.
つぎに分析結果評価部21は、文書ファイルに含まれる各文の「主題」として認定された文字列と、上記の類似表現とをマッチングさせ、該当する文に対応の評価軸を関連付ける(S24-03)。
例えば、図10(a)の「夕食が粗末なので、もう少し品数を増やして下さい。」という文の場合、主題である「夕食」の文字列が評価軸「料理」の類似表現として登録されているため、分析結果評価部21は「料理」の評価軸識別コードを当該文に関連付ける。
Next, the analysis
For example, in the case of the sentence “Dinner is poor, please increase the number of items a little more” in FIG. 10 (a), the character string “dinner” which is the subject is registered as a similar expression of the evaluation axis “dish”. Therefore, the analysis
また、図10(b)の「値段が良心的なのには驚きました。」という文の場合、主題である「値段」の文字列が評価軸「価格」の類似表現として登録されているため、分析結果評価部21は「価格」の評価軸識別コードを当該文に関連付ける。
Also, in the case of the sentence “I was surprised that the price is conscientious” in FIG. 10 (b), since the character string of “the price” that is the subject is registered as a similar expression of the evaluation axis “price”, The analysis
また、図10(c)の「アクセスが悪いので今度は車にしたい。」という文の場合、主題である「アクセス」の文字列が評価軸「立地」の類似表現として登録されているため、分析結果評価部21は「立地」の評価軸識別コードを当該文に関連付ける。
Also, in the case of the sentence “Access is bad and I want to drive this time” in FIG. 10 (c), since the character string “access” that is the subject is registered as a similar expression of the evaluation axis “location”, The analysis
これに対し、図10(d)の「当方の頼み方がいけなかったのでしょうか?」という文の場合、主題である「頼み方」の文字列は何れの評価軸でも類似表現として登録されていないため、分析結果評価部21は「不明」の評価軸識別コードを関連付ける。
On the other hand, in the case of the sentence “Wouldn't it be my request?” In Fig. 10 (d), the character string “How to request” that is the subject is registered as a similar expression on any evaluation axis. Therefore, the analysis
つぎに分析結果評価部21は、ユーザが選択した評価軸の識別コードが付与された文を文書ファイルから抽出した後、各文に設定されたネガ/ポジ判定タグ<P>及び<N>の数を評価軸毎に集計する(S24-04)。
Next, the analysis
例えば、「価格」の評価軸識別コードが付与された文が全部で80個あり、その中で<P>のタグが付された文が45個、<N>のタグが付された文が30個、<P>及び<N>の何れも付与されていない文が5個あった場合、分析結果評価部21は以下の集計結果を生成する。
[評価軸:価格]
<P>(ポジ):45個
<N>(ネガ):30個
(中立):5個
For example, there are a total of 80 sentences with “price” evaluation axis identification codes, of which 45 are tagged with the <P> tag, and those with the <N> tag. When there are five sentences to which none of <P> and <N> is assigned, the analysis
[Evaluation axis: Price]
<P> (Positive): 45 <N> (Negative): 30
(Neutral): 5
また、「料理」の識別コードが付与された文が全部で60個あり、その中で<P>のタグが付された文が18個、<N>のタグが付された文が25個、<P>及び<N>の何れも付与されていない文が17個あった場合、分析結果評価部21は以下の集計結果を生成する。
[評価軸:料理]
<P>(ポジ):18個
<N>(ネガ):25個
(中立):17個
In addition, there are 60 sentences with “Cooking” identification code in total, 18 of which are tagged with <P> and 25 of which are tagged with <N>. When there are 17 sentences to which neither <P> nor <N> is assigned, the analysis
[Evaluation axis: Cooking]
<P> (Positive): 18 <N> (Negative): 25
(Neutral): 17
つぎに分析結果評価部21は、上記の集計結果を反映させた帯グラフ(ネガ・ポジ分布グラフ61)を生成する(S24-05)。
この際、分析結果評価部21は、各評価軸のポジ数を合計した「総合ポジ数」を算出すると共に、各評価軸のネガ数を合計した「総合ネガ数」、各評価軸の中立数を合計した「総合中立数」を算出し、それぞれの割合を帯グラフの「総合」に反映させる。
Next, the analysis
At this time, the analysis
つぎに分析結果評価部21は、各文に付与された評価軸及び意図類型毎に文の数を集計し、意図分類チャート76を生成する(S24-06)。
Next, the analysis
つぎに分析結果評価部21は、「評価軸×意図類型」単位で文書ファイルから代表意見を抽出する(S24-07)。
このために分析結果評価部21は、まず同じ評価軸及び意図類型を有する文の集合の中から、同一の感性表現を備えた文同士を、類似文グループとして抽出する。
Next, the analysis
For this purpose, the analysis
例えば図15(a)に示すように、評価軸「価格」及び意図類型「不満」を共通にする(1)〜(6)の文が与えられた場合、分析結果評価部21は図15(b)に示すように、感性表現「高い」を共通にする(1)(2)(5)の3件の文を共通の類似文グループとして取り出す。
つぎに分析結果評価部21は、図15(c)に示すように、評価軸、意図類型、感性表現を共通にする(1)(2)(5)の類似文グループ中で、最も文字数の少ない(2)の文「明らかに価格が高すぎる。」を代表意見と認定する。
つぎに分析結果評価部21は、当該類似文グループに属する類似文の合計数である「3」を、当該代表意見の件数として関連付ける。
For example, as shown in FIG. 15 (a), when the sentences (1) to (6) that share the evaluation axis “price” and the intention type “dissatisfaction” are given, the analysis
Next, as shown in FIG. 15 (c), the analysis
Next, the analysis
図示は省略したが、同様の手順に従い、分析結果評価部21は感性表現「ぼったくり」を共通にする(3)及び(6)の文を類似文グループを構成するものとして取り出した後、より文字数の少ない(3)の文「ぼったくりとしか思えません。」を代表意見と認定する。
Although illustration is omitted, following the same procedure, the analysis
画面生成部25は、分析結果評価部21から渡されたネガ・ポジ分布グラフ及び意図分類チャートを所定のテンプレートに充填することにより、分析結果画面60を生成する(S24-08)。
この分析結果画面60は、上記の通りWebサーバ26を介してクライアント端末28に送信される。
The
The
また、Webサーバ26経由でクライアント端末28から特定の評価軸に係る特定の意図類型の選択情報が送信された場合、画面生成部25は分析結果評価部21から渡された代表意見及びその件数(代表意見が属する類似グループ中の類似文数)が列記された画面を生成し、Webサーバ26経由でクライアント端末28に送信する。
この結果、図12に示したように、クライアント端末28のWebブラウザ上には、サイドバーに特定の評価軸及び意図類型に係る代表意見リスト63が配置された画面60が表示される。
In addition, when selection information of a specific intention type related to a specific evaluation axis is transmitted from the
As a result, as shown in FIG. 12, on the web browser of the
さらに、Webサーバ26経由でクライアント端末28から特定の代表意見の選択情報が送信された場合、画面生成部25は分析結果評価部21から渡された対応の類似文グループに属する全類似文(代表意見+他の類似文)の具体的な内容が列記された画面を生成し、Webサーバ26経由でクライアント端末28に送信する。
この結果、図12に示したように、クライアント端末28のWebブラウザ上には、メイン領域に代表意見を含む類似文グループの内訳リスト64が配置された画面60が表示される。
Furthermore, when selection information of a specific representative opinion is transmitted from the
As a result, as shown in FIG. 12, a
ユーザが画面60中の「時系列解析結果」ボタン66をクリックすると、分析結果評価部21及び時系列解析部23による時系列解析処理が実行されると共に、その解析結果を反映させた画面が画面生成部25によって生成され、Webサーバ26経由でクライアント端末28に送信される。
When the user clicks the “time series analysis result”
図16は、この時系列解析結果画面70を示すものであり、画面のメイン領域には、縦軸に件数が設定されると共に、横軸に時間が設定された時系列変化グラフ71が表示されている。
また、時系列変化グラフ71中の変化点Pについては、「ネガティブな意見が非常に多く、意見の53%を占めており要注意です。不満意見として『料理の味が落ちた。』が多く出現しています。」という内容の考察文72が付記されている。「変化点」の意義については、後述する。
FIG. 16 shows the time series
As for the change point P in the time
以下、図17のフローチャートに従い、この時系列解析に係る処理手順を説明する。
まず、Webサーバ26経由でクライアント端末28から時系列解析のリクエストを受信した分析結果評価部21は(S30)、分析結果データに含まれる各文書の時間情報(回答日時等)に基づいて日毎の文書件数を集計し(S32)、この時系列情報に基づいて時系列変化グラフを生成する(S34)。
つぎに分析結果評価部21は、この日毎の件数情報(時系列情報)を時系列解析部23に渡し、変化点の検出を依頼する。
Hereinafter, a processing procedure related to the time series analysis will be described with reference to the flowchart of FIG.
First, the analysis
Next, the analysis
これを受けた時系列解析部23は、所定の時系列解析モデル(アルゴリズム)に上記の時系列情報を投入することにより、変化点を特定する(S36)。
ここで「変化点」とは、複数のランダムな時系列データの集合において、データの基本的な性質が変化した時点を意味し、データの特性に応じて最適な解析モデルが複数用意されている。図18において、主な時系列解析モデルの特徴を示す。
時系列解析部23は、デフォルトでは「ARIMAモデル」を適用することによって変化点を特定し、分析結果評価部21に返す。
Receiving this, the time
Here, the “change point” means the point in time when the basic properties of the data change in a set of multiple random time-series data, and multiple optimal analysis models are prepared according to the characteristics of the data. . FIG. 18 shows the characteristics of the main time series analysis model.
The time
これに対し分析結果評価部21は、この変化点に対応した考察文を生成し、上記の通り時系列変化グラフ中に付記する(S38)。この考察文の生成方法については、後に詳述する。
On the other hand, the analysis
画面生成部25は、分析結果評価部21から渡された時系列変化グラフに基づいて時系列解析結果画面70を生成する(S40)。
The
上記の通り、デフォルトでは「全分析結果データ」に対して、「ARIMAモデル」に基づいた時系列解析が実行されるが、ユーザは解析対象期間や評価軸×意図類型を限定し、あるいは異なる時系列解析モデルの適用を求めることもできる。 As described above, by default, time series analysis based on the “ARIMA model” is performed on “all analysis result data”, but the user limits the analysis target period, evaluation axis x intention type, or at different times. Application of a series analysis model can also be obtained.
具体的には、サイドバーに用意された期間指定欄73において始期及び周期を選択することで、ユーザは解析対象期間を絞り込む。
またユーザは、対象データ指定欄74において必要な「評価軸×意図類型」のチェックボックスにチェックを入れることにより、対象文の意図類型を絞り込む。例えば、「総合」配下の「不満」にチェックを入れると、全評価軸に係る<不満>のタグが付与された文が時系列解析対象として指定されたことになる。これに対し、「価格」配下の「不満」にチェックを入れると、「価格」の評価軸に係る<不満>のタグが付与された文のみが時系列解析対象として指定されたことになる。
さらにユーザは、解析モデル指定欄75において任意の解析モデルを指定することで、適用すべき解析モデルの変更を求めることができる。
Specifically, the user narrows down the analysis target period by selecting a start period and a period in the
Further, the user narrows down the intention type of the target sentence by checking a check box of “evaluation axis × intention type” necessary in the target
Furthermore, the user can obtain a change of the analysis model to be applied by designating an arbitrary analysis model in the analysis
サイドバーにおける設定を完了したユーザが「再表示」ボタン76をクリックすると、クライアント端末28からWebサーバ26に指定条件データが送信される。
Webサーバ26経由でこの指定条件データを受け取った分析結果評価部21は、指定された条件に合致する分析結果データに基づいて時系列変化グラフを作成すると共に、同データに基づく変化点の特定を時系列解析部23に依頼する。
これを受けた時系列解析部23は、指定された時系列解析モデルに時系列データを投入して新たな変化点を特定し、分析結果評価部21に返す。
分析結果評価部21は、この変化点に係る考察文を生成する。
画面生成部25は、分析結果評価部21から渡された時系列変化グラフ及び考察文に基づいて時系列解析結果画面を生成する。
この時系列解析結果画面は、Webサーバ26経由でクライアント端末28に送信される。
以上の結果、クライアント端末28のWebブラウザ上には、新たな時系列解析結果画面70が表示される(図示省略)。
When the user who has completed the setting in the sidebar clicks the “redisplay”
Upon receiving this specified condition data via the
Receiving this, the time
The analysis
The
This time series analysis result screen is transmitted to the
As a result, a new time series
ユーザが画面70中の「自動考察結果」ボタン77をクリックすると、分析結果評価部21による考察文生成処理が実行されると共に、その考察文を記述した画面が画面生成部25によって生成され、Webサーバ26経由でクライアント端末28に送信される。
When the user clicks the “automatic consideration result”
図19は、この自動考察結果画面80を示すものであり、「総合的な考察」、「回答者の属性別考察(1)」、「回答者の属性別考察(2)」、「価格に関する考察」、「料理に関する考察」、「部屋に関する考察」、「風呂に関する考察」等の考察文表示欄81が設けられており、各考察文表示欄81には分析対象文書における記述内容の傾向を、簡潔な言葉で表現した考察文(コメント)が記述されている。
FIG. 19 shows the automatic
例えば、「総合的な考察」として「全般的にポジティブな意見が多く、意見の38%を占めています。好評意見として『料金が安い』という意見が多くなっています。」が表示されており、これを参照することによってユーザは、文書ファイル全体の傾向を大まかに把握することが可能となる。 For example, “Comprehensive consideration” is displayed as “Generally, there are many positive opinions, accounting for 38% of the opinions. As a popular opinion, there are many opinions that“ the price is cheap ”.” By referring to this, the user can roughly grasp the tendency of the entire document file.
また「回答者の属性別考察(1)」として、「属性『30代男性』では、ポジティブな意見が非常に多く、意見の62%を占めており、要注目です。好評意見として『アクセスが良い』が多く出現しています。」が表示されており、これを参照することによってユーザは、文書を記述した回答者の属性に特有の評価傾向を把握することが可能となる。 Also, as “Consideration by respondent attribute (1),” “Attribute '30's male” has a lot of positive opinions, accounting for 62% of the opinions. "Good" appears a lot "is displayed, and by referring to this, the user can grasp the evaluation tendency peculiar to the attribute of the respondent describing the document.
また「価格に関する考察」として、「価格に関しては、ポジティブな意見が多く、意見の42%を占めています。好評意見として『料金が安い』という意見が多くなっています。」が表示されており、これを参照することによってユーザは、「評価軸:価格」に関する評価傾向を大まかに認識することが可能となる。 Also, “Price consideration” is displayed as “There are many positive opinions regarding the price, accounting for 42% of the opinion. As a popular opinion, there are many opinions that“ the price is cheap ””. By referring to this, the user can roughly recognize the evaluation tendency related to “evaluation axis: price”.
以下において、「価格」に関する考察文の生成に係る処理手順を説明する。
まず分析結果評価部21は、「価格」の評価軸が関連付けられた文の件数と、当該件数中における「不満」、「好評」、「要望」、「予想外」、「質問」、「意向」の意図類型毎の件数を、考察ルール記憶部24に格納された考察ルールに当てはめることにより、考察文を生成する。
Hereinafter, a processing procedure related to generation of a consideration sentence related to “price” will be described.
First, the analysis
図20は、考察ルールの一例を示しており、各ルールは「優先度」、「考察名」、「適用条件」、「テンプレート」のデータ項目を備えている。
これに対し分析結果評価部21は、図21に示すように、優先度の高い順に適用条件と分析対象データとの合致/不合致を調べ、合致した時点で当該考察ルール(好評)に係るテンプレート中の比率挿入欄に具体的な数値(ポジティブの占めるパーセンテージ)を挿入すると共に、意見挿入欄に最多代表意見を挿入し、さらに価格の評価軸に係る枕詞である「価格に関しては、」を文頭に挿入することにより、考察文を完成させる。
FIG. 20 shows an example of the consideration rule, and each rule includes data items of “priority”, “consideration name”, “application condition”, and “template”.
On the other hand, as shown in FIG. 21, the analysis
上記「ポジティブの占めるパーセンテージ」とは、「価格」の評価軸が設定された文の集合の中で、<好評>の意図類型タグが付与された文の百分率を意味している。
また、上記「最多代表意見」とは、評価軸として「価格」が付与されると共に、<好評>の意図類型タグが付与された代表意見の中で、関係する類似文の件数が最も多いものを意味している。
これに対し、適用される考察ルールが仮に「予想外」であった場合、「価格」の評価軸が設定され、かつ<予想外>の意図類型タグが付与された代表意見の中で、関係する類似文の件数が最も多いものが、上記の「最多代表意見」として選定される。
The above-mentioned “percentage occupied by positives” means the percentage of sentences with the <popular> intent type tag in the sentence set in which the evaluation axis of “price” is set.
The above “most representative opinion” has “price” as the evaluation axis and has the highest number of related similar sentences among the representative opinions with the <popular> intention type tag. Means.
On the other hand, if the consideration rule to be applied is “unexpected”, the evaluation axis of “price” is set, and in the representative opinion with the <unexpected> intention type tag, The sentence with the largest number of similar sentences is selected as the above “most representative opinion”.
他の評価軸に関する考察文を生成する場合も、分析結果評価部21は上記と同様の手順を踏襲することで、当該評価軸固有の考察文を完成させる。
Even in the case of generating a consideration sentence relating to another evaluation axis, the analysis
総合的な考察文を生成する場合も、分析結果評価部21は基本的には上記と同様の手順を踏む。
すなわち、価格〜立地の評価軸に係る全ての文の件数と、その中に含まれる「不満」、「好評」、「要望」、「予想外」、「質問」、「意向」の意図類型毎の合計件数を考察ルールに当てはめて、「好評」の考察ルールに係るテンプレートを特定した後、<好評>の意図類型タグが設定された文が占める具体的な数値を比率挿入欄に挿入すると共に、全評価軸を通じて最も頻度の高い<好評>の意図類型タグが設定された代表意見を意見挿入欄に挿入し、「全般的に」の枕詞を文頭に挿入することにより、考察文を完成させる。
Even when generating a comprehensive consideration sentence, the analysis
In other words, the number of all sentences related to the evaluation axis of price to location and the intention types of “dissatisfied”, “popular”, “request”, “unexpected”, “question”, and “intention” included in it. After applying the total number of cases to the consideration rule and identifying the template related to the “favorite” consideration rule, insert a specific numerical value occupied by the sentence with the <intentional> intention type tag into the ratio insertion field. , The representative opinion with the most popular <popular> intention type tag set through all evaluation axes is inserted into the opinion insertion field, and the general statement is inserted at the beginning of the sentence to complete the consideration sentence. .
つぎに、回答者の属性別の考察文生成処理について説明する。
まず分析結果評価部21は、全分析対象文を各文書に関連付けられた「年代×性別」の属性グループ単位で分類し、それぞれの文集合の件数を集計する。
つぎに分析結果評価部21は、図22に示すように、「年代×性別」単位で考察ルールの適用条件を各文集合に適用して、判定結果(true/false)を導き出す。
そして、一の属性グループの文集合にのみに該当する考察ルールのテンプレートが、考察文の雛形として抽出され、必要な数値や文言の挿入を経て考察文が完成される。
Next, discussion text generation processing for each attribute of the respondent will be described.
First, the analysis
Next, as shown in FIG. 22, the analysis
Then, a consideration rule template corresponding to only the sentence set of one attribute group is extracted as a template of the consideration sentence, and the consideration sentence is completed through insertion of necessary numerical values and words.
例えば、考察名「かなり好評」についてみると、「30代男性」の属性グループのみが「判定結果=true」となっているため、対応のテンプレートである「ポジティブな意見が非常に多く、意見の[比率]%を占めており要注目です。好評意見として「[意見]」が多く出現しています。」が取り出される。
つぎに、「30代男性」の属性グループに係る文集合の中で、<好評>の意図類型タグが付与された文の比率が算出され、比率挿入欄に挿入される。
また、上記文集合の中から<好評>の意図類型タグが付与された最多代表意見が抽出され、意見挿入欄に挿入される。
最後に、文頭に「属性『30代男性では、』」が挿入されることにより、考察文が完成される。
For example, in the case of the consideration name “very popular”, only the attribute group of “male in their 30s” has “judgment result = true”, so the corresponding template is “very positive opinion, [Ratio]%, and it is worth paying attention. Is extracted.
Next, the ratio of sentences to which the intention type tag of <popular> is given in the sentence set related to the attribute group of “male in their 30s” is calculated and inserted into the ratio insertion column.
In addition, the most representative opinion with the <popular> intention type tag is extracted from the sentence set and inserted into the opinion insertion column.
Finally, the consideration sentence is completed by inserting “attribute“ in the 30's male ”” at the beginning of the sentence.
また、考察名「質問」についてみると、「30代女性」の属性グループのみが「判定結果=true」となっているため、対応のテンプレートである「『[意見]』という質問が数多く出現しています。」が取り出される。
つぎに、「30代女性」の属性グループに係る文集合の中から<質問>の意図類型タグが付与された最多代表意見が抽出され、意見挿入欄に挿入される。
最後に、文頭に「属性『30代女性では、』」が挿入されることにより、考察文が完成される。
In addition, as for the consideration name “question”, only the attribute group of “female 30s” has “judgment result = true”, so a lot of questions “[Opinion]”, which is the corresponding template, appear. Is taken out.
Next, the most representative opinion with the <question> intent type tag is extracted from the sentence set related to the attribute group of “30's female” and inserted into the opinion insertion column.
Finally, the consideration sentence is completed by inserting “attribute“ in 30's female ”” at the beginning of the sentence.
これに対し考察名「要望」の場合には、「20代男性」のみならず「40代女性」の属性グループについても「判定結果=true」となっているため、対応のテンプレートに基づいて属性別考察文が生成されることはない。 On the other hand, in the case of the consideration name “request”, since “judgment result = true” is obtained for the attribute group of “male in the 20s” as well as “male in the 40s”, the attribute is based on the corresponding template. Another consideration sentence is not generated.
図22においては、図示の便宜上、20代女性〜40代男性の属性グループのみが示されているが、実際には全ての属性グループについて上記の判定処理が実行され、一の属性グループについてのみ合致する考察ルールのテンプレートに基づいて考察文が生成される。 In FIG. 22, only the attribute group of women in their 20s to 40s is shown for convenience of illustration, but in reality, the above determination processing is executed for all attribute groups, and only one attribute group is matched. A consideration sentence is generated based on the template of the consideration rule.
上記のように、一の属性グループについてのみ合致する考察ルールのテンプレートに基づいて考察文が生成されるため、ユーザは各属性グループに特有な評価傾向を的確に認識することが可能となる。
ただし、複数の属性グループにマッチする場合であっても、それぞれの属性グループについて考察文を生成するように、条件を緩和してこのシステム10を運用することも当然に可能である。
As described above, since the consideration sentence is generated based on the consideration rule template that matches only one attribute group, the user can accurately recognize the evaluation tendency unique to each attribute group.
However, even when a plurality of attribute groups are matched, it is naturally possible to operate the
上記においては、「年代×性別」の属性グループ毎に考察文を生成する例を説明したが、他の属性(例えば回答者の職業、居住地域等)単位で考察文を生成することもできる。 In the above description, an example in which a consideration sentence is generated for each attribute group of “age × gender” has been described. However, a consideration sentence can be generated in units of other attributes (for example, the occupation of the respondent, the residential area, etc.).
つぎに、図16に示した時系列解析に際して表示される考察文72の生成方法について説明する。
まず分析結果評価部21は、図23(a)に示すように、時系列変化グラフ71中の変化点Pを中心にした所定期間(例えば1週間)を、着目期間と認定する。
つぎに分析結果評価部21は、着目期間内の分析対象文について考察ルールを適用する。
同時に分析結果評価部21は、着目期間をも含めた全期間内の分析対象文について考察ルールを適用する。
そして、着目期間のみに該当する考察ルールのテンプレートに基づいて、考察文を生成する。
Next, a method for generating the
First, as shown in FIG. 23A, the analysis
Next, the analysis
At the same time, the analysis
Then, a consideration sentence is generated based on a consideration rule template corresponding only to the period of interest.
例えば図23(b)に示すように、考察名「かなり不満」の考察ルールについてみると、着目期間のみが「true」で全期間は「false」であるため、「ネガティブな意見が非常に多く、意見の[比率]%を占めており要注意です。不満意見として『[意見]』が多く出現しています。」のテンプレートが引用され、[比率]及び[意見]に具体的な数値や文字列(最多代表意見)が挿入されることによって、考察文が完成される。 For example, as shown in FIG. 23 (b), regarding the consideration rule of the consideration name “substantially dissatisfied”, only the period of interest is “true” and the whole period is “false”. , Which accounts for [ratio]% of opinions, and the template of “[opinion]” appears frequently as a dissatisfied opinion. A consideration sentence is completed by inserting a character string (most representative opinion).
このように、全期間内の分析対象文に基づく判定結果と着目期間内の分析対象文に基づく判定結果とを比較し、後者のみに適合する考察ルールのテンプレートに基づいて考察文を生成することにより、着目期間に特有の考察文を導くことが可能となる。
このためユーザは、変化点付近においける特異な評価傾向を容易に認識することができる。
In this way, the determination result based on the analysis target sentence within the entire period is compared with the determination result based on the analysis target sentence within the target period, and the consideration sentence is generated based on the template of the consideration rule that only suits the latter. This makes it possible to derive a consideration sentence peculiar to the period of interest.
Therefore, the user can easily recognize the unique evaluation tendency in the vicinity of the change point.
なお、考察名「不満」に関しても、着目期間のみが「true」で全期間は「false」という判定結果が示されているが、優先度が劣るためこの考察ルールに係るテンプレートが適用されることはない。 In addition, regarding the consideration name “dissatisfied”, only the period of interest is “true” and the determination result is “false” for all periods. However, because the priority is inferior, the template related to this consideration rule is applied. There is no.
ユーザは、時系列解析結果画面70または自動考察結果画面80の「分析結果」ボタン85をクリックすることにより、分析結果画面60に戻ることができる。
The user can return to the
上記においては、この発明に係る感性分析システム10を、Webブラウザを搭載したクライアント端末28に各種画面(HTMLファイル)がWebサーバ26経由で送信されるWebシステムとして具体化した例を説明したが、このシステム10を実現するためのコンピュータプログラムをPC等のコンピュータにセットアップした、所謂スタンドアロン型のシステムとして具体化することも当然に可能である。
In the above, the
10 感性分析システム
11 文書登録部
12 文書記憶部
13 文書解析部
14 ネガ/ポジ判定部
15 感性辞書記憶部
16 否定表現記憶部
17 主題認定部
18 意図抽出部
19 意図表現記憶部
20 分析結果記憶部
21 分析結果評価部
22 評価軸類似表現記憶部
23 時系列解析部
24 考察ルール記憶部
25 画面生成部
26 Webサーバ
27 インターネット
28 クライアント端末
40 分析条件指定画面
41 分析対象ファイル指定欄
42 評価軸指定欄
43 参照ボタン
44 分析開始ボタン
50 汎用辞書群
51 単語辞書
52 二項関係辞書
53 慣用句辞書
54 擬態語辞書
55 ドメイン別辞書群
56 単語辞書
57 二項関係辞書
58 擬態語辞書
60 分析結果画面
61 ネガ・ポジ分布グラフ
62 意図分類チャート
63 代表意見リスト
64 代表意見の内訳リスト
65 「選択」ボタン
66 「時系列解析結果」ボタン
70 時系列解析結果画面
71 時系列変化グラフ
72 考察文
73 期間指定欄
74 対象データ指定欄
75 解析モデル指定欄
76 「再表示」ボタン
77 「自動考察結果」ボタン
80 自動考察結果画面
81 考察文表示欄
85 「分析結果」ボタン
10 Kansei analysis system
11 Document Registration Department
12 Document storage
13 Document Analysis Department
14 Negative / Positive judgment part
15 Sensitivity dictionary storage
16 Negative expression storage
17 Subject Certification Department
18 Intention extraction unit
19 Intention expression storage
20 Analysis result storage
21 Analysis result evaluation department
22 Evaluation axis similarity expression storage
23 Time Series Analysis Department
24 Consideration rule memory
25 Screen generator
26 Web server
27 Internet
28 Client terminal
40 Analysis condition specification screen
41 Analysis target file specification column
42 Evaluation axis specification field
43 Browse button
44 Start analysis button
50 general dictionaries
51 word dictionary
52 Binary relational dictionary
53 Phrasebook Dictionary
54 Mimicry Dictionary
55 Domain-specific dictionaries
56 word dictionary
57 Binary relational dictionary
58 Mimicry Dictionary
60 Analysis result screen
61 Negative / Positive Distribution Graph
62 Intention classification chart
63 Representative Opinion List
64 Breakdown list of representative opinions
65 Select button
66 Time Series Analysis Results button
70 Time Series Analysis Result Screen
71 Time series change graph
72 Thoughts
73 Period designation field
74 Target data specification column
75 Analysis model specification field
76 Refresh button
77 “Automatic Result” button
80 Automatic consideration result screen
81 Discussion text display column
85 “Result” button
Claims (5)
文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段と、
否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段と、
各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段と、
各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段と、
各文中の主格を構成するための助詞を探索し、当該助詞が付属している自立語を主題と認定する主題認定手段と、
発言者の発言意図を表す意図表現と、その意図の類型との組合せを格納しておく意図表現記憶手段と、
上記ネガ判定タグが付与された文について「不満」を意味する意図類型タグを関連付けると共に、上記ポジ判定タグが付与された文について「好評」を意味する意図類型タグを関連付け、さらに、各文に含まれる形態素または形態素の組合せからなる表現が、上記意図表現辞書記憶手段に格納された意図表現に該当するか否かを判定し、該当する場合には当該表現に対して対応の類型を示す意図類型タグを関連付ける手段と、
複数種類の評価軸を示す文字列と、各評価軸に包含される類似表現との対応関係を格納しておく評価軸類似表現記憶手段と、
各文に認定された主題が、上記評価軸類似表現記憶手段に格納された類似表現に該当するか否かを判定し、該当する場合には文に対して対応の評価軸を関連付ける手段と、
各文を、共通の評価軸、意図類型及び感性用語を備えた類似文の集合である類似文グループ毎に分類すると共に、各類似文グループ中で文字数が最も少ない類似文を代表意見と認定する手段と、
複数の代表意見が列記された代表意見リストを生成する手段と、
この代表意見リストを出力する手段と、
を備えたことを特徴とする感性分析システム。 A sensitivity dictionary storage means for storing a combination of a sensitivity term representing an affirmative / negative value judgment for an object and an attribute indicating whether it is affirmative / negative;
A morpheme analyzing unit that performs morpheme processing on a document file and decomposes a plurality of text sentences included in the document file into morpheme units;
It is determined whether or not an expression composed of a morpheme or a combination of morphemes included in each sentence corresponds to a sensitivity term stored in the sensitivity dictionary storage unit, and if applicable, is combined with the expression. Means for associating an attribute tag indicating any of the positive / negative attributes;
Negative expression storage means for storing negative expressions used when constructing negative sentences;
It is determined whether or not an expression composed of a morpheme or a combination of morphemes included in each sentence corresponds to a negative expression stored in the negative expression storage means, and if so, is a negative expression for the expression. Means for associating a negative expression tag indicating
Based on the combination pattern of the attribute tag type associated with each sentence and the presence / absence of a negative expression tag, it is determined whether the sentence is a negative evaluation sentence or a positive evaluation sentence, and for negative evaluation sentences, a negative determination tag And a means for adding a positive determination tag to a positive evaluation sentence,
Searching for a particle for constructing the main character in each sentence, and subject recognition means that recognizes an independent word attached to the particle as a subject;
An intention expression storage means for storing a combination of an intention expression representing a speaker's intention and a type of the intention;
The sentence with the negative determination tag is associated with an intention type tag that means “dissatisfied”, and the sentence with the positive determination tag is associated with an intention type tag that means “popular”. It is determined whether or not an expression composed of a morpheme or a combination of morphemes corresponds to an intention expression stored in the intention expression dictionary storage means, and if so, an intention indicating a corresponding type for the expression Means for associating a type tag;
An evaluation axis similar expression storage means for storing a correspondence relationship between a character string indicating a plurality of types of evaluation axes and a similar expression included in each evaluation axis;
A means for determining whether the subject recognized in each sentence corresponds to the similar expression stored in the evaluation axis similar expression storage means, and, if applicable, associating a corresponding evaluation axis with the sentence;
Each sentence is classified into a similar sentence group that is a set of similar sentences with a common evaluation axis, intention type, and sentiment terms, and the similar sentence with the smallest number of characters in each similar sentence group is recognized as a representative opinion. Means,
Means for generating a representative opinion list in which a plurality of representative opinions are listed;
Means for outputting this representative opinion list;
Kansei analysis system characterized by having.
この内訳リストを出力する手段とを備えたことを特徴とする請求項1または2に記載の感性分析システム。 Means for generating a breakdown list listing individual similar sentences belonging to a corresponding similar sentence group when one representative opinion in the representative opinion list is selected;
The sensibility analysis system according to claim 1 or 2, further comprising means for outputting the breakdown list.
事物に対する肯定/否定の価値判断を表す感性用語と、肯定/否定の何れであるかを示す属性との組合せを格納しておく感性辞書記憶手段、
文書ファイルに対して形態素処理を施し、当該文書ファイルに含まれる複数のテキスト文を形態素単位に分解する形態素解析手段、
各文に含まれる形態素または形態素の組合せからなる表現が、上記感性辞書記憶手段に格納された感性用語に該当するか否かを判定し、該当する場合には当該表現に対して組み合わされている上記肯定/否定の何れかの属性を示す属性タグを関連付ける手段、
否定文を構成する際に用いられる否定表現を格納しておく否定表現記憶手段、
各文に含まれる形態素または形態素の組合せからなる表現が、上記否定表現記憶手段に格納された否定表現に該当するか否かを判定し、該当する場合には当該表現に対して否定表現であることを示す否定表現タグを関連付ける手段、
各文に関連付けられた属性タグの種類と、否定表現タグの有無との組合せパターンに基づいて、当該文が否定評価文か肯定評価文かを判定し、否定評価文に対してはネガ判定タグを付与すると共に、肯定評価文に対してはポジ判定タグを付与する手段、
各文中の主格を構成するための助詞を探索し、当該助詞が付属している自立語を主題と認定する主題認定手段、
発言者の発言意図を表す意図表現と、その意図の類型との組合せを格納しておく意図表現記憶手段、
上記ネガ判定タグが付与された文について「不満」を意味する意図類型タグを関連付けると共に、上記ポジ判定タグが付与された文について「好評」を意味する意図類型タグを関連付け、さらに、各文に含まれる形態素または形態素の組合せからなる表現が、上記意図表現辞書記憶手段に格納された意図表現に該当するか否かを判定し、該当する場合には当該表現に対して対応の類型を示す意図類型タグを関連付ける手段、
複数種類の評価軸を示す文字列と、各評価軸に包含される類似表現との対応関係を格納しておく評価軸類似表現記憶手段、
各文に認定された主題が、上記評価軸類似表現記憶手段に格納された類似表現に該当するか否かを判定し、該当する場合には文に対して対応の評価軸を関連付ける手段、
各文を、共通の評価軸、意図類型及び感性用語を備えた類似文の集合である類似文グループ毎に分類すると共に、各類似文グループ中で文字数が最も少ない類似文を代表意見と認定する手段、
複数の代表意見が列記された代表意見リストを生成する手段、
この代表意見リストを出力する手段、
として機能させることを特徴とする感性分析プログラム Computer
A sensitivity dictionary storage means for storing a combination of a sensitivity term representing an affirmative / negative value judgment for an object and an attribute indicating whether it is positive / negative;
Morpheme analysis means for performing morpheme processing on a document file and decomposing a plurality of text sentences included in the document file into morpheme units;
It is determined whether or not an expression composed of a morpheme or a combination of morphemes included in each sentence corresponds to a sensitivity term stored in the sensitivity dictionary storage unit, and if applicable, is combined with the expression. Means for associating an attribute tag indicating any of the positive / negative attributes;
Negative expression storage means for storing negative expressions used when constructing negative sentences,
It is determined whether or not an expression composed of a morpheme or a combination of morphemes included in each sentence corresponds to a negative expression stored in the negative expression storage means, and if so, is a negative expression for the expression. Means for associating a negative expression tag indicating
Based on the combination pattern of the attribute tag type associated with each sentence and the presence / absence of a negative expression tag, it is determined whether the sentence is a negative evaluation sentence or a positive evaluation sentence, and for negative evaluation sentences, a negative determination tag And a means for adding a positive determination tag to a positive evaluation sentence,
Search for a particle for composing the main character in each sentence, and determine the subject recognition means to recognize the independent word attached with the particle as the subject,
An intention expression storage means for storing a combination of an intention expression representing a speaker's intention and a type of the intention;
The sentence with the negative determination tag is associated with an intention type tag that means “dissatisfied”, and the sentence with the positive determination tag is associated with an intention type tag that means “favored”. It is determined whether or not an expression composed of a morpheme or a combination of morphemes corresponds to an intention expression stored in the intention expression dictionary storage means, and if so, an intention indicating a corresponding type for the expression Means for associating type tags,
Evaluation axis similar expression storage means for storing a correspondence relationship between a character string indicating a plurality of types of evaluation axes and a similar expression included in each evaluation axis;
Means for determining whether the subject recognized in each sentence corresponds to the similar expression stored in the evaluation axis similar expression storage means, and in this case, associating a corresponding evaluation axis with the sentence;
Each sentence is classified into a similar sentence group that is a set of similar sentences with a common evaluation axis, intention type, and sentiment terms, and the similar sentence with the smallest number of characters in each similar sentence group is recognized as a representative opinion. means,
Means for generating a representative opinion list in which a plurality of representative opinions are listed;
A means for outputting this representative opinion list,
Kansei analysis program characterized by functioning as
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011130042A JP4796664B1 (en) | 2011-06-10 | 2011-06-10 | Kansei analysis system and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011130042A JP4796664B1 (en) | 2011-06-10 | 2011-06-10 | Kansei analysis system and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4796664B1 JP4796664B1 (en) | 2011-10-19 |
JP2012256282A true JP2012256282A (en) | 2012-12-27 |
Family
ID=44946782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011130042A Active JP4796664B1 (en) | 2011-06-10 | 2011-06-10 | Kansei analysis system and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4796664B1 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101448228B1 (en) | 2013-02-12 | 2014-10-10 | 이주양 | Apparatus and Method for social data analysis |
JP2014206917A (en) * | 2013-04-15 | 2014-10-30 | 日本電信電話株式会社 | Evaluation expression extraction device, method, and program |
US9292313B2 (en) | 2012-10-10 | 2016-03-22 | International Business Machines Corporation | Detection of component operating state by computer |
JP2016177477A (en) * | 2015-03-19 | 2016-10-06 | ヤフー株式会社 | Information provision device, information provision method, and information provision program |
KR20200127557A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | A program recording midium for an automatic sentiment information labeling method to news articles for providing sentiment information |
KR20200127555A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | A program for an automatic sentiment information labeling to news articles for providing sentiment information |
KR20200127553A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | An automatic sentiment information labeling method to news articles for providing sentiment information |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417269B2 (en) * | 2017-03-13 | 2019-09-17 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for verbatim-text mining |
US20220229984A1 (en) * | 2021-01-15 | 2022-07-21 | Recruit Co., Ltd., | Systems and methods for semi-supervised extraction of text classification information |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3408528B1 (en) * | 2001-11-20 | 2003-05-19 | 株式会社ジャストシステム | Device, method and program for processing information |
JP2004157931A (en) * | 2002-11-08 | 2004-06-03 | Ntt Advanced Technology Corp | Intention sentence type classification extraction system |
-
2011
- 2011-06-10 JP JP2011130042A patent/JP4796664B1/en active Active
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9292313B2 (en) | 2012-10-10 | 2016-03-22 | International Business Machines Corporation | Detection of component operating state by computer |
KR101448228B1 (en) | 2013-02-12 | 2014-10-10 | 이주양 | Apparatus and Method for social data analysis |
JP2014206917A (en) * | 2013-04-15 | 2014-10-30 | 日本電信電話株式会社 | Evaluation expression extraction device, method, and program |
JP2016177477A (en) * | 2015-03-19 | 2016-10-06 | ヤフー株式会社 | Information provision device, information provision method, and information provision program |
KR20200127557A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | A program recording midium for an automatic sentiment information labeling method to news articles for providing sentiment information |
KR20200127555A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | A program for an automatic sentiment information labeling to news articles for providing sentiment information |
KR20200127553A (en) * | 2019-05-03 | 2020-11-11 | 주식회사 자이냅스 | An automatic sentiment information labeling method to news articles for providing sentiment information |
KR102361597B1 (en) | 2019-05-03 | 2022-02-11 | 주식회사 자이냅스 | A program recording medium on which a program for labeling sentiment information in news articles using big data is recoded |
KR102361596B1 (en) | 2019-05-03 | 2022-02-11 | 주식회사 자이냅스 | A method for labeling sentiment information in news articles using big data |
KR102382681B1 (en) | 2019-05-03 | 2022-04-06 | 주식회사 자이냅스 | A program for labeling sentiment information in news articles using big data |
Also Published As
Publication number | Publication date |
---|---|
JP4796664B1 (en) | 2011-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4796664B1 (en) | Kansei analysis system and program | |
Wijeratne et al. | Emojinet: An open service and api for emoji sense discovery | |
US10839155B2 (en) | Text analysis of morphemes by syntax dependency relationship with determination rules | |
JP2012003572A (en) | Sensitivity analysis system and program | |
US20190012376A1 (en) | Preference visualization system and censorship system | |
JP5599073B2 (en) | Kansei analysis system and program | |
JP5717549B2 (en) | Kansei analysis system and program | |
Zhong et al. | Fast detection of deceptive reviews by combining the time series and machine learning | |
JP6409071B2 (en) | Sentence sorting method and calculator | |
JP5438603B2 (en) | Kansei dictionary editing support system and program | |
JP2004280180A (en) | System for extracting keyword for advertisement, commercial copy delivery system, program for extracting keyword for advertisement, and commercial copy delivery program | |
Shi et al. | EOSentiMiner: an opinion-aware system based on emotion ontology for sentiment analysis of Chinese online reviews | |
JP2012003573A (en) | Sensitivity analyzing system and program | |
JP5703629B2 (en) | Synonym dictionary generation device, data analysis device, data detection device, synonym dictionary generation method, and synonym dictionary generation program | |
TW202349325A (en) | A system of semantic analysis-based trademark class recommendation and the method thereof | |
Im et al. | Confirmatory aspect-level opinion mining processes for tourism and hospitality research: a proposal of DiSSBUS | |
Agarwal et al. | Detecting Fake Reviews using Machine learning techniques: a survey | |
Sariki et al. | A book recommendation system based on named entities | |
Wang et al. | CA-CD: context-aware clickbait detection using new Chinese clickbait dataset with transfer learning method | |
CN114255067A (en) | Data pricing method and device, electronic equipment and storage medium | |
Himdi | Classification of Arabic real and fake news based on Arabic textual analysis | |
Kaili et al. | Improving the Representation Choices of Privacy Policies for End-Users | |
Lee | Use-centric mining of customer reviews | |
Albanese et al. | T-REX: A domain-independent system for automated cultural information extraction | |
Zarifi et al. | Gender identification of short text author using conceptual vectorization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110729 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4796664 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140805 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |