JP4423004B2 - テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム - Google Patents
テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム Download PDFInfo
- Publication number
- JP4423004B2 JP4423004B2 JP2003345961A JP2003345961A JP4423004B2 JP 4423004 B2 JP4423004 B2 JP 4423004B2 JP 2003345961 A JP2003345961 A JP 2003345961A JP 2003345961 A JP2003345961 A JP 2003345961A JP 4423004 B2 JP4423004 B2 JP 4423004B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- word
- document
- text
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 35
- 238000005065 mining Methods 0.000 title claims description 25
- 239000013598 vector Substances 0.000 claims description 52
- 238000000605 extraction Methods 0.000 claims description 44
- 238000011156 evaluation Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 238000009795 derivation Methods 0.000 claims description 7
- 238000007493 shaping process Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims 2
- 230000004048 modification Effects 0.000 claims 2
- 239000012491 analyte Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 26
- 230000014509 gene expression Effects 0.000 description 17
- 238000012795 verification Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 210000001015 abdomen Anatomy 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
登録手段、テキスト解析手段、属性データベース、概念辞書作成手段、概念辞書、照合パタン記憶手段、情報抽出手段、抽出情報索引記憶手段、文書索引記憶手段、分析手段を備え、
登録手段は、分析対象文書を読み込み、
テキスト解析手段は、登録手段により、読み込まれた分析対象文書のテキストを解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出し、
属性データベースは、アンケート文書に付与された年齢や性別などの顧客情報や、故障事例文書に付与された機種名や故障派生日時などの分析処理内容により分析対象文書が絞り込み可能な項目からなる属性情報が格納され、
概念辞書作成手段は、テキスト解析手段により分割された単語の共起頻度から特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成し、
概念辞書は、概念辞書作成手段により作成された概念辞書データを格納し、
上記登録手段はさらに、テキスト解析手段により分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し
文書索引記憶手段は、登録手段が生成した文書ベクトルが格納され、
照合パタン記憶手段は、予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶され、
情報抽出手段は、分析対象文書をテキスト解析手段で解析した結果の単語が照合パタン記憶手段に記憶された照合パタンにある場合は、その単語と分析種別と分析種別に対する評価値を抽出し、
抽出情報索引記憶手段は、情報抽出手段が抽出した単語と分析種別と分析種別に対する評価値と該当文書の文書idが格納され、
分析手段は、
分析作業者が分析条件を入力する分析条件入力手段と、
分析条件入力手段により入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計手段と、
頻度集計手段で取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算手段と、
関連度計算手段で得られた情報を、グラフまたは表の形式に整形し出力する出力手段を有するものである。
登録手段により分析対象文書を読み込む登録ステップと、
登録ステップにより、読み込まれた分析対象文書のテキストをテキスト解析手段で解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出するテキスト解析ステップと、
テキスト解析ステップにより分割された単語の共起頻度から概念辞書作成手段で特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成して、概念辞書に格納する概念辞書作成ステップと、
文書ベクトル生成手段でテキスト解析ステップにより分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し文書索引に格納する文書ベクトル生成ステップと、
予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶された照合パタンを用いて分析対象文書をテキスト解析ステップで解析した結果の単語が照合パタンにある場合、その単語と分析種別と分析種別に対する評価値を情報抽出手段で抽出し、これらを該当文書の文書idとともに抽出情報索引記憶手段に格納する情報抽出ステップと、
アンケート文書における顧客情報や、故障事例文書における機種名や故障派生日時の分析対象文書に付与された属性情報が格納された属性データベースと文書索引記憶手段に記憶された文書ベクトルに加え情報抽出ステップの抽出情報を参照して分析手段により分析結果を得る分析ステップを備え、
分析ステップは、分析作業者により分析条件入力手段を用いて入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計ステップと、
頻度集計ステップで取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算ステップと、
関連度計算ステップで得られた情報を、グラフまたは表の形式に整形し出力する出力ステップを有するものである。
登録手段により分析対象文書を読み込む登録ステップと、
登録ステップにより、読み込まれた分析対象文書のテキストをテキスト解析手段で解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出するテキスト解析ステップと、
テキスト解析ステップにより分割された単語の共起頻度から概念辞書作成手段で特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成して、概念辞書に格納する概念辞書作成ステップと、
文書ベクトル生成手段でテキスト解析ステップにより分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し文書索引に格納する文書ベクトル生成ステップと、
予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶された照合パタンを用いて分析対象文書をテキスト解析ステップで解析した結果の単語が照合パタンにある場合、その単語と分析種別と分析種別に対する評価値を情報抽出手段で抽出し、これらを該当文書の文書idとともに抽出情報索引記憶手段に格納する情報抽出ステップと、
アンケート文書における顧客情報や、故障事例文書における機種名や故障派生日時の分析対象文書に付与された属性情報が格納された属性データベースと文書索引記憶手段に記憶された文書ベクトルに加え情報抽出ステップの抽出情報を参照して分析手段により分析結果を得る分析ステップを備え、
分析ステップは、分析作業者により分析条件入力手段を用いて入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計ステップと、
頻度集計ステップで取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算ステップと、
関連度計算ステップで得られた情報を、グラフまたは表の形式に整形し出力する出力ステップの各ステップをコンピュータに実行させるものである。
また多数の類似表現をカバーすることができ、分析作業に際して同義語辞書構築の手間を削減することが出来るという利点がある。
図1に本発明によるテキストマイニング装置の実施の形態1における構成図を示す。テキスト解析手段101は、文書121に含まれるテキストを解析し、単語に分割して単語間の関係を抽出する。概念辞書作成手段102は、テキスト解析手段101が分割した単語の出現傾向から各単語の概念ベクトルを計算して概念辞書103に格納する。登録手段104は、概念辞書103に登録された概念ベクトルをもとに文書121に含まれるテキストをベクトル情報に変換して文書索引105に登録する。情報抽出手段106は、事前に定義された照合パタン107を参照して、テキスト解析手段101がテキスト解析した結果から分析に必要な情報を抽出して、登録手段104を介して抽出情報索引108に登録する。属性データベース109は、アンケート分析においては性別や年齢などの顧客情報を格納し、また、故障事例分析においては機種名や故障派生日時などの属性情報を格納する。分析手段110は、ユーザの入力した分析入力122を読み込んで、概念辞書103、文書索引105、抽出情報索引108、および、属性データベース109を参照して分析入力122に対応する分析支援のための分析情報123を出力する。
まずステップS201の概念辞書作成処理について説明する。ステップS201においては、まず登録手段104により文書121を読み込み、文書121に含まれるテキストをテキスト解析手段101により単語に分割する。ついで、登録手段104は概念辞書作成手段102を呼び出してテキスト解析手段101により分割した単語の出現傾向(同時に出現する(共起する)単語の頻度)から特異値分解という代数的演算により各単語の概念ベクトルを計算して図3に示すような概念辞書データを作成し、概念辞書103に格納する。
概念ベクトルの計算には、たとえば文献5(「単語の連想関係に基づく情報検索システムInfoMAP、高山他、情報学基礎53-1、1999-3」)に開示された方法を用いる。
また、単語を分割し、単語間の係り受け関係を抽出する方法については多数の公知文献があるので、説明を省略する。
なお、上記では文書索引情報として文書ベクトルの例を述べたが、文書索引情報としては概念辞書103を用いずに、文書中に出現した単語と、その文書とを対応づける対照表であってもよい。
図14は、分析手段110の詳細構成図である。分析条件入力手段1401は、分析作業者が分析入力122の条件を対話的に入力するためのGUI(Graphical User Interface)である。頻度集計手段1402は、分析条件入力手段1401で入力された分析条件に合致する文書や単語の頻度を、概念辞書103、文書索引105、抽出情報索引108、および、属性データベース109を参照して取得する。関連度計算手段1403は、概念辞書103、文書索引105、抽出情報索引108、および、属性データベース109を参照して、分析条件入力手段1401で入力された分析条件の指定により分類された文書集合から合成される概念ベクトルと、分析条件入力手段1401で入力された分析条件で指定されたテキストなどの概念ベクトルとの類似性を計算する。出力手段1404は、上記で得られた頻度および関連度を、分析作業者が傾向を把握しやすい形で整形して、表ないしはグラフの形式で分析情報123を出力する。
102:概念辞書作成手段、
103:概念辞書、
104:登録手段、
105:文書索引、
106:情報抽出手段、
107:照合パタン、
108:抽出情報索引、
109:属性データベース、
110:分析手段、
121:文書、
122:分析入力、
123:分析情報、
501:文節内パタン照合手段、
502:文内パタン照合手段、
503:係り受けパタン照合手段、
1401:分析条件入力手段、
1402:頻度集計手段、
1403:関連度計算手段、
1404:出力手段。
Claims (6)
- 登録手段、テキスト解析手段、属性データベース、概念辞書作成手段、概念辞書、照合パタン記憶手段、情報抽出手段、抽出情報索引記憶手段、文書索引記憶手段、分析手段を備え、
登録手段は、分析対象文書を読み込み、
テキスト解析手段は、登録手段により、読み込まれた分析対象文書のテキストを解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出し、
属性データベースは、アンケート文書に付与された年齢や性別などの顧客情報や、故障事例文書に付与された機種名や故障派生日時などの分析処理内容により分析対象文書が絞り込み可能な項目からなる属性情報が格納され、
概念辞書作成手段は、テキスト解析手段により分割された単語の共起頻度から特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成し、
概念辞書は、概念辞書作成手段により作成された概念辞書データを格納し、
上記登録手段はさらに、テキスト解析手段により分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し
文書索引記憶手段は、登録手段が生成した文書ベクトルが格納され、
照合パタン記憶手段は、予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶され、
情報抽出手段は、分析対象文書をテキスト解析手段で解析した結果の単語が照合パタン記憶手段に記憶された照合パタンにある場合は、その単語と分析種別と分析種別に対する評価値を抽出し、
抽出情報索引記憶手段は、情報抽出手段が抽出した単語と分析種別と分析種別に対する評価値と該当文書の文書idが格納され、
分析手段は、
分析作業者が分析条件を入力する分析条件入力手段と、
分析条件入力手段により入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計手段と、
頻度集計手段で取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算手段と、
関連度計算手段で得られた情報を、グラフまたは表の形式に整形し出力する出力手段を有することを特徴とするテキストマイニング装置。 - 上記照合パタン記憶手段に記憶される予め作成された照合パタンは、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値と、検索対象範囲が文節内であることを有する文節内照合パタンであり、
上記情報抽出手段が、照合パタン記憶手段に記憶された文節内照合パタンを用い、テキスト解析手段によるテキスト解析結果の文節内の単語を用いて分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を抽出する文節内パタン照合手段を有することを特徴とする請求項1記載のテキストマイニング装置。 - 上記照合パタン記憶手段に記憶される予め作成された照合パタンは、分析条件である分析種別と、その分析種別に関連する複数の単語と、その複数の単語による分析種別に対する評価値と、検索対象範囲が文内であることを有する文内照合パタンであり、
上記情報抽出手段が、照合パタン記憶手段に記憶された文内照合パタンを用い、テキスト解析手段によるテキスト解析結果の文内の単語を用いて分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を抽出する文内パタン照合手段を有することを特徴とする請求項1または請求項2記載のテキストマイニング装置。 - 上記照合パタン記憶手段に記憶される予め作成された照合パタンは、分析条件である分析種別と、その分析種別に関連する複数の単語と、その複数の単語間の係り受け関係と、複数の単語間の係り受け関係による分析種別に対する評価値と、検索対象範囲が文内であることを有する係り受け照合パタンであり、
上記情報抽出手段が、照合パタン記憶手段に記憶された係り受け照合パタンを用い、テキスト解析手段によるテキスト解析結果の文内の単語を用いて分析条件である分析種別と、その分析種別に関連する単語間の係り受け関係と、その単語間の係り受け関係による分析種別に対する評価値を抽出する係り受けパタン照合手段を有することを特徴とする請求項1乃至請求項3の何れか1項に記載のテキストマイニング装置。 - 登録手段により分析対象文書を読み込む登録ステップと、
登録ステップにより、読み込まれた分析対象文書のテキストをテキスト解析手段で解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出するテキスト解析ステップと、
テキスト解析ステップにより分割された単語の共起頻度から概念辞書作成手段で特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成して、概念辞書に格納する概念辞書作成ステップと、
文書ベクトル生成手段でテキスト解析ステップにより分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し文書索引に格納する文書ベクトル生成ステップと、
予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶された照合パタンを用いて分析対象文書をテキスト解析ステップで解析した結果の単語が照合パタンにある場合、その単語と分析種別と分析種別に対する評価値を情報抽出手段で抽出し、これらを該当文書の文書idとともに抽出情報索引記憶手段に格納する情報抽出ステップと、
アンケート文書における顧客情報や、故障事例文書における機種名や故障派生日時の分析対象文書に付与された属性情報が格納された属性データベースと文書索引記憶手段に記憶された文書ベクトルに加え情報抽出ステップの抽出情報を参照して分析手段により分析結果を得る分析ステップを備え、
分析ステップは、分析作業者により分析条件入力手段を用いて入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計ステップと、
頻度集計ステップで取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算ステップと、
関連度計算ステップで得られた情報を、グラフまたは表の形式に整形し出力する出力ステップを有することを特徴とするテキストマイニング方法。 - 登録手段により分析対象文書を読み込む登録ステップと、
登録ステップにより、読み込まれた分析対象文書のテキストをテキスト解析手段で解析して、単語に分割し、単語の共起頻度と単語間の係り受け関係を抽出するテキスト解析ステップと、
テキスト解析ステップにより分割された単語の共起頻度から概念辞書作成手段で特異値分解により各単語の概念ベクトルを計算して概念辞書データを作成して、概念辞書に格納する概念辞書作成ステップと、
文書ベクトル生成手段でテキスト解析ステップにより分割された各単語に対応する概念ベクトルを概念辞書から読み出し、これらの概念ベクトルを文章毎に合成して文書索引情報の1つである文書ベクトルを生成し文書索引に格納する文書ベクトル生成ステップと、
予め作成され、分析条件である分析種別と、その分析種別に関連する単語と、その単語の分析種別に対する評価値を有する照合パタンが記憶された照合パタンを用いて分析対象文書をテキスト解析ステップで解析した結果の単語が照合パタンにある場合、その単語と分析種別と分析種別に対する評価値を情報抽出手段で抽出し、これらを該当文書の文書idとともに抽出情報索引記憶手段に格納する情報抽出ステップと、
アンケート文書における顧客情報や、故障事例文書における機種名や故障派生日時の分析対象文書に付与された属性情報が格納された属性データベースと文書索引記憶手段に記憶された文書ベクトルに加え情報抽出ステップの抽出情報を参照して分析手段により分析結果を得る分析ステップを備え、
分析ステップは、分析作業者により分析条件入力手段を用いて入力された分析条件に合致する単語と、その単語と共起しやすい単語を属性データベースと概念辞書を参照して、文書索引記憶手段から取得する頻度集計ステップと、
頻度集計ステップで取得した分析条件に合致する単語と、その単語と共起しやすい単語について抽出情報索引記憶手段から各単語の評価値を抽出し、合計する関連度計算ステップと、
関連度計算ステップで得られた情報を、グラフまたは表の形式に整形し出力する出力ステップの各ステップをコンピュータに実行させることを特徴とするテキストマイニングプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003345961A JP4423004B2 (ja) | 2003-10-03 | 2003-10-03 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003345961A JP4423004B2 (ja) | 2003-10-03 | 2003-10-03 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005115468A JP2005115468A (ja) | 2005-04-28 |
JP4423004B2 true JP4423004B2 (ja) | 2010-03-03 |
Family
ID=34539075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003345961A Expired - Fee Related JP4423004B2 (ja) | 2003-10-03 | 2003-10-03 | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4423004B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7450464B2 (ja) | 2020-06-16 | 2024-03-15 | 株式会社クラレ | 水銀吸着材及びその製造方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4870448B2 (ja) | 2006-02-23 | 2012-02-08 | 株式会社日立製作所 | 情報処理装置、顧客ニーズ分析方法、およびプログラム |
JP5028823B2 (ja) * | 2006-02-27 | 2012-09-19 | 沖電気工業株式会社 | 同義語対抽出装置及び同義語対抽出方法 |
JP4744404B2 (ja) * | 2006-09-13 | 2011-08-10 | C2cube株式会社 | 評価出力装置、評価出力方法、およびプログラム |
JP4956298B2 (ja) * | 2007-06-29 | 2012-06-20 | 株式会社東芝 | 辞書構築支援装置 |
JP5471673B2 (ja) * | 2010-03-23 | 2014-04-16 | 大日本印刷株式会社 | 文書分類装置、プログラムおよび記憶媒体 |
JP5872183B2 (ja) * | 2011-04-08 | 2016-03-01 | 株式会社ユニバーサルエンターテインメント | 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法 |
WO2013121810A1 (ja) | 2012-02-16 | 2013-08-22 | インターナショナル・ビジネス・マシーンズ・コーポレーション | テキストの文書を解析する装置、プログラムおよび方法 |
US9996527B1 (en) * | 2017-03-30 | 2018-06-12 | International Business Machines Corporation | Supporting interactive text mining process with natural language and dialog |
JP7092998B2 (ja) * | 2018-04-26 | 2022-06-29 | 富士通株式会社 | 分析プログラム及び分析方法 |
-
2003
- 2003-10-03 JP JP2003345961A patent/JP4423004B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7450464B2 (ja) | 2020-06-16 | 2024-03-15 | 株式会社クラレ | 水銀吸着材及びその製造方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005115468A (ja) | 2005-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A sentence compression based framework to query-focused multi-document summarization | |
US10282468B2 (en) | Document-based requirement identification and extraction | |
US8548805B2 (en) | System and method of semi-supervised learning for spoken language understanding using semantic role labeling | |
US9792279B2 (en) | Methods and systems for analyzing communication situation based on emotion information | |
Tsur et al. | ICWSM—a great catchy name: Semi-supervised recognition of sarcastic sentences in online product reviews | |
US20060217962A1 (en) | Information processing device, information processing method, program, and recording medium | |
Griol et al. | Combining speech-based and linguistic classifiers to recognize emotion in user spoken utterances | |
JP4904496B2 (ja) | 文書類似性導出装置及びそれを用いた回答支援システム | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
Smith et al. | Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations | |
JP4423004B2 (ja) | テキストマイニング装置、テキストマイニング方法およびテキストマイニングプログラム | |
US20140214428A1 (en) | Voice input and output database search method and device | |
Massung et al. | Structural parse tree features for text representation | |
Massung et al. | Non-native text analysis: A survey | |
JP2004157931A (ja) | 意図文型種別抽出方式 | |
JP2020119087A (ja) | 文書審査支援方法、文書審査支援装置及びコンピュータプログラム | |
JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
Demilie et al. | Automated all in one misspelling detection and correction system for Ethiopian languages | |
Nugraha et al. | Chatbot-Based Movie Recommender System Using POS Tagging | |
JP3575242B2 (ja) | キーワード抽出装置 | |
JP2008204133A (ja) | 回答検索装置及びコンピュータプログラム | |
CN109165277B (zh) | 一种作文的输出方法及学习设备 | |
JP2006119697A (ja) | 質問応答システム、質疑応答方法および質疑応答プログラム | |
Porntrakoon et al. | Text summarization for Thai food reviews using simplified sentiment analysis | |
JP5187187B2 (ja) | 体験情報検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |