CN101887415A - 一种文本文档主题词义的自动提取方法 - Google Patents
一种文本文档主题词义的自动提取方法 Download PDFInfo
- Publication number
- CN101887415A CN101887415A CN 201010210106 CN201010210106A CN101887415A CN 101887415 A CN101887415 A CN 101887415A CN 201010210106 CN201010210106 CN 201010210106 CN 201010210106 A CN201010210106 A CN 201010210106A CN 101887415 A CN101887415 A CN 101887415A
- Authority
- CN
- China
- Prior art keywords
- text document
- key words
- word
- candidate key
- meaning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
主题词义提取算法 | Pr ecision | Recall | F-measure |
5个主题词义 | 0.595 | 0.612 | 0.603 |
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102101066A CN101887415B (zh) | 2010-06-24 | 2010-06-24 | 一种文本文档主题词义的自动提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102101066A CN101887415B (zh) | 2010-06-24 | 2010-06-24 | 一种文本文档主题词义的自动提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101887415A true CN101887415A (zh) | 2010-11-17 |
CN101887415B CN101887415B (zh) | 2012-05-23 |
Family
ID=43073341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102101066A Active CN101887415B (zh) | 2010-06-24 | 2010-06-24 | 一种文本文档主题词义的自动提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101887415B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455487A (zh) * | 2012-05-29 | 2013-12-18 | 腾讯科技(深圳)有限公司 | 一种搜索词的提取方法及装置 |
CN106484920A (zh) * | 2016-11-21 | 2017-03-08 | 北京恒华伟业科技股份有限公司 | 一种评审文档指标的抽取方法 |
CN107729480A (zh) * | 2017-10-16 | 2018-02-23 | 北京神州泰岳软件股份有限公司 | 一种限定区域的文本信息抽取方法及装置 |
CN108512873A (zh) * | 2017-02-27 | 2018-09-07 | 中国科学院沈阳自动化研究所 | 一种分布式自组织结构的分组语义消息过滤与路由方法 |
CN108920454A (zh) * | 2018-06-13 | 2018-11-30 | 北京信息科技大学 | 一种主题短语抽取方法 |
CN110020153A (zh) * | 2017-11-30 | 2019-07-16 | 北京搜狗科技发展有限公司 | 一种搜索方法及装置 |
CN110209941B (zh) * | 2019-06-03 | 2021-01-15 | 北京卡路里信息技术有限公司 | 维护推送内容池的方法、推送方法、装置、介质及服务器 |
CN112307251A (zh) * | 2019-06-24 | 2021-02-02 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联***和方法 |
-
2010
- 2010-06-24 CN CN2010102101066A patent/CN101887415B/zh active Active
Non-Patent Citations (2)
Title |
---|
《计算机工程与应用》 20050131 王萌等 基于概念向量空间模型的中文自动文摘*** 107-110 1-2 , 第1期 2 * |
《计算机科学》 20080630 方俊等 基于语义的关键词提取算法 148-151 1-2 第35卷, 第6期 2 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103455487A (zh) * | 2012-05-29 | 2013-12-18 | 腾讯科技(深圳)有限公司 | 一种搜索词的提取方法及装置 |
CN103455487B (zh) * | 2012-05-29 | 2018-07-06 | 腾讯科技(深圳)有限公司 | 一种搜索词的提取方法及装置 |
CN106484920A (zh) * | 2016-11-21 | 2017-03-08 | 北京恒华伟业科技股份有限公司 | 一种评审文档指标的抽取方法 |
CN108512873A (zh) * | 2017-02-27 | 2018-09-07 | 中国科学院沈阳自动化研究所 | 一种分布式自组织结构的分组语义消息过滤与路由方法 |
CN108512873B (zh) * | 2017-02-27 | 2020-02-04 | 中国科学院沈阳自动化研究所 | 一种分布式自组织结构的分组语义消息过滤与路由方法 |
CN107729480A (zh) * | 2017-10-16 | 2018-02-23 | 北京神州泰岳软件股份有限公司 | 一种限定区域的文本信息抽取方法及装置 |
CN107729480B (zh) * | 2017-10-16 | 2020-06-26 | 中科鼎富(北京)科技发展有限公司 | 一种限定区域的文本信息抽取方法及装置 |
CN110020153A (zh) * | 2017-11-30 | 2019-07-16 | 北京搜狗科技发展有限公司 | 一种搜索方法及装置 |
CN108920454A (zh) * | 2018-06-13 | 2018-11-30 | 北京信息科技大学 | 一种主题短语抽取方法 |
CN110209941B (zh) * | 2019-06-03 | 2021-01-15 | 北京卡路里信息技术有限公司 | 维护推送内容池的方法、推送方法、装置、介质及服务器 |
CN112307251A (zh) * | 2019-06-24 | 2021-02-02 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联***和方法 |
CN112307251B (zh) * | 2019-06-24 | 2021-08-20 | 上海松鼠课堂人工智能科技有限公司 | 英语词汇知识点图谱自适应识别关联***和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101887415B (zh) | 2012-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101887415B (zh) | 一种文本文档主题词义的自动提取方法 | |
Wen et al. | Emotion classification in microblog texts using class sequential rules | |
US9104710B2 (en) | Method for cross-domain feature correlation | |
Rousseau et al. | Main core retention on graph-of-words for single-document keyword extraction | |
CN101067808B (zh) | 文本关键词的提取方法 | |
CN102799647B (zh) | 网页去重方法和设备 | |
CN101944099B (zh) | 一种使用本体进行文本文档自动分类的方法 | |
Ni et al. | Short text clustering by finding core terms | |
CN106599054B (zh) | 一种题目分类及推送的方法及*** | |
CN103617157A (zh) | 基于语义的文本相似度计算方法 | |
Glenisson et al. | Combining full-text analysis and bibliometric indicators. A pilot study | |
CN102081601B (zh) | 一种领域词识别方法和装置 | |
CN103995876A (zh) | 一种基于卡方统计和smo算法的文本分类方法 | |
CN102760142A (zh) | 一种针对搜索请求抽取搜索结果主题标签的方法和装置 | |
CN103399901A (zh) | 一种关键词抽取方法 | |
CN101694670A (zh) | 一种基于公共子串的中文Web文档在线聚类方法 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN101833579B (zh) | 一种自动检测学术不端文献的方法及*** | |
CN106649308B (zh) | 一种分词词库更新方法及*** | |
CN107085568A (zh) | 一种文本相似度判别方法及装置 | |
CN103886072B (zh) | 煤矿搜索引擎中检索结果聚类*** | |
CN104778157A (zh) | 一种多文档摘要句的生成方法 | |
Benitez et al. | Semantic knowledge construction from annotated image collections | |
CN103136212A (zh) | 一种类别新词的挖掘方法及装置 | |
Teixeira et al. | Automatic extraction of document topics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C53 | Correction of patent for invention or patent application | ||
CB03 | Change of inventor or designer information |
Inventor after: Fang Jun Inventor after: Guo Lei Inventor after: Chang Weiwei Inventor after: Yang Ning Inventor before: Fang Jun Inventor before: Guo Lei Inventor before: Chang Weiwei |
|
COR | Change of bibliographic data |
Free format text: CORRECT: INVENTOR; FROM: FANG JUN GUO LEI CHANG WEIWEI TO: FANG JUN GUO LEI CHANG WEIWEI YANG NING |
|
ASS | Succession or assignment of patent right |
Owner name: NORTHWESTERN POLYTECHNICAL UNIVERSITY Effective date: 20140814 Owner name: COMTEC SOLAR (JIANGSU) CO., LTD. Free format text: FORMER OWNER: NORTHWESTERN POLYTECHNICAL UNIVERSITY Effective date: 20140814 |
|
C41 | Transfer of patent application or patent right or utility model | ||
COR | Change of bibliographic data |
Free format text: CORRECT: ADDRESS; FROM: 710072 XI AN, SHAANXI PROVINCE TO: 226600 NANTONG, JIANGSU PROVINCE |
|
TR01 | Transfer of patent right |
Effective date of registration: 20140814 Address after: 226600 the Yellow Sea Road, Haian Development Zone, Haian County, Nantong, Jiangsu Patentee after: Comtec Solar (Jiangsu) Co., Ltd. Patentee after: Northwestern Polytechnical University Address before: 710072 Xi'an friendship West Road, Shaanxi, No. 127 Patentee before: Northwestern Polytechnical University |