JP2011186762A - 文書評価付与方法、プログラム及び装置 - Google Patents
文書評価付与方法、プログラム及び装置 Download PDFInfo
- Publication number
- JP2011186762A JP2011186762A JP2010051087A JP2010051087A JP2011186762A JP 2011186762 A JP2011186762 A JP 2011186762A JP 2010051087 A JP2010051087 A JP 2010051087A JP 2010051087 A JP2010051087 A JP 2010051087A JP 2011186762 A JP2011186762 A JP 2011186762A
- Authority
- JP
- Japan
- Prior art keywords
- word
- occurrence
- evaluation
- statistical information
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims description 38
- 230000000877 morphologic effect Effects 0.000 claims abstract description 12
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- 235000019441 ethanol Nutrition 0.000 description 7
- 238000001914 filtration Methods 0.000 description 5
- 238000005352 clarification Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】本発明の文章評価付与装置は、訓練例データベース1、正例のデータベース2、負例のデータベース3、解析する対象となる文章4、形態素解析を行う形態素解析部5、共起統計情報を解析し共起統計情報データベースを作成する部分6、共起統計情報データベース7、文脈によって評価が異なるグレーワードのリストであるグレーワードリスト8、NG単語のリストであるブラックワードリスト9、評価計算演算式格納部10、評価付与部11、解析する対象となる文章に付与された評価12から構成されている。
【選択図】図1
Description
102 正例のデータベース
103 負例のデータベース
104 解析する対象となる文章
105 形態素解析を行う形態素解析部
106 共起統計情報を解析し共起統計情報データベースを作成する部分
107 共起統計情報データベース
108 文脈によって評価が異なるグレーワードのリストであるグレーワードリスト
109 NG単語のリストであるブラックワードリスト
110 評価を計算する演算式を格納する部分
111 評価を付与する部分
112 解析する対象となる文章に付与された評価
201 解析する対象となる文章の入力
202 形態素解析
203 ブラックワードを含んでいるか否かの評価
204 グレーワードを含んでいるか否かの評価
301 解析する対象となる文章
302 2単語間の共起統計情報データベース
303 グレーワード
304 共起語
305 正例の中に「胸」と「明かす」が共起した数としての正例カウント
306 負例の中に「胸」と「明かす」が共起した数としての負例カウント
307 正例カウントと負例カウントから「胸」と「明かす」が正例にある確率
308 HRの計算例
309 HRの値から判定した例
401 解析する対象となる文章
402 3単語間の共起統計情報データベース
403 グレーワード
404 1つ目の共起語
405 2つ目の共起語
406 正例の中に「胸」と「明かす」「彼」が共起した数としての正例カウント
407 負例の中に「胸」と「明かす」「彼」が共起した数としての負例カウント
408 正例カウントと負例カウントから「胸」「明かす」及び「彼」が同時に正例に存在する確率
409 HRの計算例
410 HRの値から判定した例
501 正例の一例
502 501の正例から生成された共起統計情報データベースの例
601 正例の一例
602 601の正例から距離2で生成された共起統計情報データベースの例
701 解析する対象となる文章の入力
702 形態素解析
703 ブラックワードを含んでいるか否かの評価
704 グレーワードを含んでいるか否かの評価
Claims (7)
- 訓練例として正例と負例を集めた訓練例データベースと、最低の評価と判断されるNGワードを持つブラックワードリスト保持部と、文脈によって評価が異なるグレーワードを持つグレーワードリスト保持部と、グレーワードと正例の中のそれぞれの単語との共起の統計情報、および、それぞれのグレーワードと負例の中のそれぞれの単語との共起の統計情報を保持する共起統計情報データベースと、文章を形態素解析処理する形態素解析処理部と、形態素解析処理により得られた単語に共起統計情報データベースに基づいて、演算式格納部にある演算式によって評価を計算し付与する評価付与部と、を有する文書評価付与方法、プログラム及び装置。
- 請求項1の文書評価付与方法、プログラム及び装置であって、共起統計情報データにおける統計情報が、グレーワード1単語と正例の中のそれぞれの1単語の、2単語間の共起統計情報、および、グレーワード1単語と負例の中のそれぞれの1単語の、2単語間の共起情報に基づいている共起統計情報データベースを有する文書評価付与方法、プログラム及び装置。
- 請求項1の文書評価付与方法、プログラム及び装置であって、共起統計情報データにおける統計情報が、グレーワード1単語と正例の中のいくつかの単語との、多単語間の共起統計情報、および、グレーワード1単語と負例の中のいくつかの単語との、多単語間の共起情報に基づいている共起統計情報データベースを有する文書評価付与方法、プログラム及び装置。
- 請求項2の文書評価付与方法、プログラム及び装置であって、共起統計情報データにおける統計情報が、グレーワード1単語と正例の中のある一定の距離内の1単語の、2単語間の共起統計情報、および、グレーワード1単語と負例の中のある一定の距離内の1単語の、2単語間の共起情報に基づいている共起統計情報データベースを有する文書評価付与方法、プログラム及び装置。
- 請求項3の文書評価付与方法、プログラム及び装置であって、共起統計情報データにおける統計情報が、グレーワード1単語と正例の中のある一定の距離内のいくつかの単語との、多単語間の共起統計情報、および、グレーワード1単語と負例の中のある一定の距離内のいくつかの単語との、多単語間の共起情報に基づいている共起統計情報データベースを有する文書評価付与方法、プログラム及び装置。
- 請求項1の文書評価付与方法、プログラム及び装置であって、ユーザが文章を入力する文章入力部と、入力された文章に評価を付与し表示する評価表示部と、文章が良いか悪いかを判定する閾値表示部と、管理者が文書に対して操作を行う管理部をさらに有する文書評価付与方法、プログラム及び装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051087A JP5581743B2 (ja) | 2010-03-08 | 2010-03-08 | 文書評価付与方法、プログラム及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051087A JP5581743B2 (ja) | 2010-03-08 | 2010-03-08 | 文書評価付与方法、プログラム及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011186762A true JP2011186762A (ja) | 2011-09-22 |
JP5581743B2 JP5581743B2 (ja) | 2014-09-03 |
Family
ID=44792951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010051087A Expired - Fee Related JP5581743B2 (ja) | 2010-03-08 | 2010-03-08 | 文書評価付与方法、プログラム及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5581743B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013084180A (ja) * | 2011-10-12 | 2013-05-09 | Nomura Research Institute Ltd | 文書管理装置 |
WO2018116459A1 (ja) * | 2016-12-22 | 2018-06-28 | 日本電気株式会社 | 文章評価装置、文章評価方法および記録媒体 |
JP7273442B1 (ja) | 2022-10-07 | 2023-05-15 | Dcアーキテクト株式会社 | 情報処理システム、情報処理方法及びプログラム |
-
2010
- 2010-03-08 JP JP2010051087A patent/JP5581743B2/ja not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
CSNG200900269118; 米井由美 他2名: '学習によるXML文書のコンテンツベースフィルタリング' 電子情報通信学会 第18回データ工学ワークショップ論文集 , 20070601 * |
JPN6013060954; 米井由美 他2名: '学習によるXML文書のコンテンツベースフィルタリング' 電子情報通信学会 第18回データ工学ワークショップ論文集 , 20070601 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013084180A (ja) * | 2011-10-12 | 2013-05-09 | Nomura Research Institute Ltd | 文書管理装置 |
WO2018116459A1 (ja) * | 2016-12-22 | 2018-06-28 | 日本電気株式会社 | 文章評価装置、文章評価方法および記録媒体 |
JPWO2018116459A1 (ja) * | 2016-12-22 | 2019-10-24 | 日本電気株式会社 | 文章評価装置、文章評価方法および記録媒体 |
JP7273442B1 (ja) | 2022-10-07 | 2023-05-15 | Dcアーキテクト株式会社 | 情報処理システム、情報処理方法及びプログラム |
JP2024055308A (ja) * | 2022-10-07 | 2024-04-18 | Dcアーキテクト株式会社 | 情報処理システム、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5581743B2 (ja) | 2014-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Use of hangeul twitter to track and predict human influenza infection | |
Young et al. | Toward automating HIV identification: machine learning for rapid identification of HIV-related social media data | |
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
Aisopos et al. | Content vs. context for sentiment analysis: a comparative analysis over microblogs | |
Chen et al. | Tweeting under pressure: analyzing trending topics and evolving word choice on sina weibo | |
US20140040371A1 (en) | Systems and methods for identifying geographic locations of social media content collected over social networks | |
CN109145216A (zh) | 网络舆情监控方法、装置及存储介质 | |
US20130297694A1 (en) | Systems and methods for interactive presentation and analysis of social media content collection over social networks | |
US9286379B2 (en) | Document quality measurement | |
Yang et al. | User interest and social influence based emotion prediction for individuals | |
US9524526B2 (en) | Disambiguating authors in social media communications | |
CN103336766A (zh) | 短文本垃圾识别以及建模方法和装置 | |
US20130198240A1 (en) | Social Network Analysis | |
US20180032907A1 (en) | Detecting abusive language using character n-gram features | |
Pozzobon et al. | On the challenges of using black-box apis for toxicity evaluation in research | |
US10510014B2 (en) | Escalation-compatible processing flows for anti-abuse infrastructures | |
CN110413842B (zh) | 基于舆情态势感知的内容审核方法***电子设备及介质 | |
JP5581743B2 (ja) | 文書評価付与方法、プログラム及び装置 | |
CN114742071A (zh) | 基于图神经网络的汉越跨语言观点对象识别分析方法 | |
Ha et al. | Where conspiracy theories flourish: A study of YouTube comments and Bill Gates conspiracy theories | |
JP2007172173A (ja) | 情報提供方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP2019200784A (ja) | 分析方法、分析装置及び分析プログラム | |
US10530889B2 (en) | Identifying member profiles containing disallowed content in an online social network | |
CN111680505B (zh) | 一种Markdown特征感知的无监督关键词提取方法 | |
CN108763400B (zh) | 基于对象行为和主题偏好的对象划分方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131213 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20140130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140204 |
|
TRDD | Decision of grant or rejection written | ||
A072 | Dismissal of procedure [no reply to invitation to correct request for examination] |
Free format text: JAPANESE INTERMEDIATE CODE: A073 Effective date: 20140527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140610 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140630 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5581743 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |