CN101344890A - 一种基于观点检索的信息检索文档的评分方法 - Google Patents
一种基于观点检索的信息检索文档的评分方法 Download PDFInfo
- Publication number
- CN101344890A CN101344890A CNA2008101186680A CN200810118668A CN101344890A CN 101344890 A CN101344890 A CN 101344890A CN A2008101186680 A CNA2008101186680 A CN A2008101186680A CN 200810118668 A CN200810118668 A CN 200810118668A CN 101344890 A CN101344890 A CN 101344890A
- Authority
- CN
- China
- Prior art keywords
- document
- user
- speech
- query word
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000008451 emotion Effects 0.000 claims abstract description 49
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 235000010086 Setaria viridis var. viridis Nutrition 0.000 claims description 4
- 244000230342 green foxtail Species 0.000 claims 1
- 238000002203 pretreatment Methods 0.000 claims 1
- 238000012887 quadratic function Methods 0.000 abstract description 4
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000013077 scoring method Methods 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 244000304962 green bristle grass Species 0.000 description 3
- 238000007630 basic procedure Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- PXUQTDZNOHRWLI-OXUVVOBNSA-O malvidin 3-O-beta-D-glucoside Chemical compound COC1=C(O)C(OC)=CC(C=2C(=CC=3C(O)=CC(O)=CC=3[O+]=2)O[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)=C1 PXUQTDZNOHRWLI-OXUVVOBNSA-O 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
λ的取值 | 常用的线性加权方法的检索性能 | 本发明给出的评分方法的检索性能 | 本发明带来的性能提高 |
0.01 | 0.1969 | 0.2253 | 14.42% |
0.1 | 0.2041 | 0.2255 | 10.49% |
0.2 | 0.2071 | 0.2256 | 8.93% |
0.3 | 0.2081 | 0.2257 | 8.46% |
0.4 | 0.2087 | 0.2257 | 8.15% |
0.5 | 0.2067 | 0.2259 | 9.29% |
0.6 | 0.2038 | 0.2266 | 11.19% |
0.7 | 0.1993 | 0.2267 | 13.75% |
0.8 | 0.1938 | 0.2255 | 16.36% |
0.9 | 0.1866 | 0.2213 | 18.60% |
初始化中文情感词典列表SCN={};初始化英文情感词典列表SEN={};对知网(HowNet)中的每一个词:如果其属性(DEF)的值至少包括下列之一:“good|好”,“desire|良”,“beautiful|美”,“great|伟”那么:将该词的中文描述(W_C的值)加入中文情感词典列表SCN作为一条记录;将该词的英文描述(W_X的值)加入英文情感词典SEN作为一条记录;如果其属性(DEF)的值至少包括下列之一:“bad|坏”,“undesired|莠”,“fake|伪”那么:将该词的中文描述(W_C的值)加入中文情感词典列表SCN作为一条记录;将该词的英文描述(W_X的值)加入英文情感词典SEN作为一条记录;对英文情感词典SEN中的每一条记录:如果该记录由多个词组成那么:将该记录中的每个词也分别作为一条记录加入情感词典SEN;删去英文情感词典SEN中的重复记录。 |
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008101186680A CN100570611C (zh) | 2008-08-22 | 2008-08-22 | 一种基于观点检索的信息检索文档的评分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2008101186680A CN100570611C (zh) | 2008-08-22 | 2008-08-22 | 一种基于观点检索的信息检索文档的评分方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101344890A true CN101344890A (zh) | 2009-01-14 |
CN100570611C CN100570611C (zh) | 2009-12-16 |
Family
ID=40246893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2008101186680A Active CN100570611C (zh) | 2008-08-22 | 2008-08-22 | 一种基于观点检索的信息检索文档的评分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100570611C (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887414A (zh) * | 2009-02-04 | 2010-11-17 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN102567420A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102567421A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102637165A (zh) * | 2012-02-17 | 2012-08-15 | 清华大学 | 一种中文的观点、评价信息的属性-观点对抽取方法 |
CN102915322A (zh) * | 2011-07-11 | 2013-02-06 | 莱克西私人有限公司 | 情感数据生成的***和方法 |
CN102929962A (zh) * | 2012-10-11 | 2013-02-13 | 中国科学技术大学 | 一种搜索引擎的评测方法 |
CN103177054A (zh) * | 2011-09-16 | 2013-06-26 | 莱克西私人有限公司 | 用于使用最高级形容词来排序语义子密钥的***和方法 |
CN103646097A (zh) * | 2013-12-18 | 2014-03-19 | 北京理工大学 | 一种基于约束关系的意见目标和情感词联合聚类方法 |
CN104217026A (zh) * | 2014-09-28 | 2014-12-17 | 福州大学 | 一种基于图模型的中文微博客倾向性检索方法 |
CN104268230A (zh) * | 2014-09-28 | 2015-01-07 | 福州大学 | 一种基于异质图随机游走的中文微博客观点探测方法 |
CN104424278A (zh) * | 2013-08-29 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种获取热点资讯的方法及装置 |
CN104933022A (zh) * | 2014-03-20 | 2015-09-23 | 株式会社东芝 | 信息处理装置和信息处理方法 |
CN106156340A (zh) * | 2016-07-12 | 2016-11-23 | 浪潮(北京)电子信息产业有限公司 | 一种命名实体链接方法 |
CN106407730A (zh) * | 2016-11-30 | 2017-02-15 | 广州市万表科技股份有限公司 | 手表测评方法及装置 |
CN108038204A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 针对社交媒体的观点检索***及方法 |
US10311113B2 (en) | 2011-07-11 | 2019-06-04 | Lexxe Pty Ltd. | System and method of sentiment data use |
CN110209821A (zh) * | 2019-06-06 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 文本类别确定方法和装置 |
CN111488931A (zh) * | 2020-04-10 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 文章质量评估方法、文章推荐方法及其对应的装置 |
CN111612658A (zh) * | 2020-05-29 | 2020-09-01 | 北京华宇元典信息服务有限公司 | 法律数据检索的评价方法、评价装置和电子设备 |
CN113544689A (zh) * | 2019-02-11 | 2021-10-22 | 谷歌有限责任公司 | 为文档的来源观点生成并提供附加内容 |
-
2008
- 2008-08-22 CN CNB2008101186680A patent/CN100570611C/zh active Active
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101887414A (zh) * | 2009-02-04 | 2010-11-17 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN101887414B (zh) * | 2009-02-04 | 2014-07-16 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN102236650B (zh) * | 2010-04-20 | 2014-06-04 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN102567420B (zh) * | 2010-12-27 | 2014-03-12 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102567421B (zh) * | 2010-12-27 | 2014-04-02 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102567421A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102567420A (zh) * | 2010-12-27 | 2012-07-11 | 北大方正集团有限公司 | 文档检索方法和装置 |
CN102915322A (zh) * | 2011-07-11 | 2013-02-06 | 莱克西私人有限公司 | 情感数据生成的***和方法 |
US10311113B2 (en) | 2011-07-11 | 2019-06-04 | Lexxe Pty Ltd. | System and method of sentiment data use |
CN102915322B (zh) * | 2011-07-11 | 2017-01-18 | 莱克西私人有限公司 | 情感数据生成的***和方法 |
CN103177054A (zh) * | 2011-09-16 | 2013-06-26 | 莱克西私人有限公司 | 用于使用最高级形容词来排序语义子密钥的***和方法 |
CN102637165A (zh) * | 2012-02-17 | 2012-08-15 | 清华大学 | 一种中文的观点、评价信息的属性-观点对抽取方法 |
CN102637165B (zh) * | 2012-02-17 | 2014-08-20 | 清华大学 | 一种中文的观点、评价信息的属性-观点对抽取方法 |
CN102929962A (zh) * | 2012-10-11 | 2013-02-13 | 中国科学技术大学 | 一种搜索引擎的评测方法 |
CN102929962B (zh) * | 2012-10-11 | 2015-08-12 | 中国科学技术大学 | 一种搜索引擎的评测方法 |
CN104424278A (zh) * | 2013-08-29 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 一种获取热点资讯的方法及装置 |
CN103646097A (zh) * | 2013-12-18 | 2014-03-19 | 北京理工大学 | 一种基于约束关系的意见目标和情感词联合聚类方法 |
CN103646097B (zh) * | 2013-12-18 | 2016-09-07 | 北京理工大学 | 一种基于约束关系的意见目标和情感词联合聚类方法 |
CN104933022A (zh) * | 2014-03-20 | 2015-09-23 | 株式会社东芝 | 信息处理装置和信息处理方法 |
CN104933022B (zh) * | 2014-03-20 | 2018-11-13 | 株式会社东芝 | 信息处理装置和信息处理方法 |
CN104217026A (zh) * | 2014-09-28 | 2014-12-17 | 福州大学 | 一种基于图模型的中文微博客倾向性检索方法 |
CN104217026B (zh) * | 2014-09-28 | 2017-08-11 | 福州大学 | 一种基于图模型的中文微博客倾向性检索方法 |
CN104268230B (zh) * | 2014-09-28 | 2017-09-15 | 福州大学 | 一种基于异质图随机游走的中文微博客观点探测方法 |
CN104268230A (zh) * | 2014-09-28 | 2015-01-07 | 福州大学 | 一种基于异质图随机游走的中文微博客观点探测方法 |
CN106156340A (zh) * | 2016-07-12 | 2016-11-23 | 浪潮(北京)电子信息产业有限公司 | 一种命名实体链接方法 |
CN106407730A (zh) * | 2016-11-30 | 2017-02-15 | 广州市万表科技股份有限公司 | 手表测评方法及装置 |
CN108038204A (zh) * | 2017-12-15 | 2018-05-15 | 福州大学 | 针对社交媒体的观点检索***及方法 |
CN113544689A (zh) * | 2019-02-11 | 2021-10-22 | 谷歌有限责任公司 | 为文档的来源观点生成并提供附加内容 |
US12008323B2 (en) | 2019-02-11 | 2024-06-11 | Google Llc | Generating and provisioning of additional content for source perspective(s) of a document |
CN110209821A (zh) * | 2019-06-06 | 2019-09-06 | 北京奇艺世纪科技有限公司 | 文本类别确定方法和装置 |
CN111488931A (zh) * | 2020-04-10 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 文章质量评估方法、文章推荐方法及其对应的装置 |
CN111488931B (zh) * | 2020-04-10 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 文章质量评估方法、文章推荐方法及其对应的装置 |
CN111612658A (zh) * | 2020-05-29 | 2020-09-01 | 北京华宇元典信息服务有限公司 | 法律数据检索的评价方法、评价装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN100570611C (zh) | 2009-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100570611C (zh) | 一种基于观点检索的信息检索文档的评分方法 | |
US11036814B2 (en) | Search engine that applies feedback from users to improve search results | |
CN101501630B (zh) | 计算机化搜索结果列表的排序方法及其数据库搜索引擎 | |
TWI544351B (zh) | Extended query method and system | |
US9430568B2 (en) | Method and system for querying information | |
US8612435B2 (en) | Activity based users' interests modeling for determining content relevance | |
CN100465954C (zh) | 用于搜索术语建议的多种类型数据的加强群集 | |
JP4908214B2 (ja) | サーチクエリのリファインメントを提供するシステム及び方法。 | |
CN103678576B (zh) | 基于动态语义分析的全文检索*** | |
US20060155751A1 (en) | System and method for document analysis, processing and information extraction | |
CN104252456B (zh) | 一种权重估计方法、装置及*** | |
CN1818908A (zh) | 一种在搜索引擎中应用搜索者反馈信息的方法 | |
JP2009520264A5 (zh) | ||
CN102314443B (zh) | 搜索引擎的修正方法和*** | |
WO2009152441A1 (en) | Searching, sorting, and displaying data files by relevance | |
CN101206674A (zh) | 以商品为媒介的增强型相关搜索***及其方法 | |
US20100306214A1 (en) | Identifying modifiers in web queries over structured data | |
US20080288483A1 (en) | Efficient retrieval algorithm by query term discrimination | |
CN107193883B (zh) | 一种数据处理方法和*** | |
CN103123653A (zh) | 基于贝叶斯分类学习的搜索引擎检索排序方法 | |
US20100042610A1 (en) | Rank documents based on popularity of key metadata | |
CN110609950B (zh) | 一种舆情***搜索词推荐方法及*** | |
CN103186650B (zh) | 一种搜索方法和装置 | |
CN103324707A (zh) | 一种基于半监督聚类的查询扩展方法 | |
US20070192313A1 (en) | Data search method with statistical analysis performed on user provided ratings of the initial search results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20090626 Address after: Beijing 100084-82 mailbox code: 100084 Applicant after: Tsinghua University Co-applicant after: Sogo Science-Technology Development Co., Ltd., Beijing Address before: Beijing 100084-82 mailbox code: 100084 Applicant before: Tsinghua University |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhang Min Inventor after: Sun Maosong Inventor after: Ma Shaoping Inventor after: Hong Richang Inventor after: Ru Liyun Inventor after: Tong Zijian Inventor before: Zhang Min Inventor before: Ma Shaoping Inventor before: Ru Liyun Inventor before: Tong Zijian |
|
COR | Change of bibliographic data |