CN102411592A - 一种文本分类方法和装置 - Google Patents
一种文本分类方法和装置 Download PDFInfo
- Publication number
- CN102411592A CN102411592A CN2010102924612A CN201010292461A CN102411592A CN 102411592 A CN102411592 A CN 102411592A CN 2010102924612 A CN2010102924612 A CN 2010102924612A CN 201010292461 A CN201010292461 A CN 201010292461A CN 102411592 A CN102411592 A CN 102411592A
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- vocabulary group
- group
- word frequency
- classifying documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (10)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010292461 CN102411592B (zh) | 2010-09-21 | 2010-09-21 | 一种文本分类方法和装置 |
HK12106886.0A HK1166384A1 (en) | 2010-09-21 | 2012-07-12 | Method and apparatus for classifying text |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010292461 CN102411592B (zh) | 2010-09-21 | 2010-09-21 | 一种文本分类方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102411592A true CN102411592A (zh) | 2012-04-11 |
CN102411592B CN102411592B (zh) | 2013-08-07 |
Family
ID=45913667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010292461 Active CN102411592B (zh) | 2010-09-21 | 2010-09-21 | 一种文本分类方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102411592B (zh) |
HK (1) | HK1166384A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978354A (zh) * | 2014-04-10 | 2015-10-14 | 中电长城网际***应用有限公司 | 文本分类方法和装置 |
CN105095209A (zh) * | 2014-04-21 | 2015-11-25 | 北京金山网络科技有限公司 | 文档聚类方法及装置、网络设备 |
CN106156163A (zh) * | 2015-04-15 | 2016-11-23 | 株式会社日立制作所 | 文本分类方法以及装置 |
CN106997340A (zh) * | 2016-01-25 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 词库的生成以及利用词库的文档分类方法及装置 |
CN107992501A (zh) * | 2016-10-27 | 2018-05-04 | 腾讯科技(深圳)有限公司 | 社交网络信息识别方法、处理方法及装置 |
CN111177379A (zh) * | 2019-12-20 | 2020-05-19 | 深圳市优必选科技股份有限公司 | 低精度问题的归类方法、智能终端及计算机可读存储介质 |
CN113032562A (zh) * | 2021-03-18 | 2021-06-25 | 中国人民解放***箭军工程大学 | 一种多次迭代对折词汇层级分类方法及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1719436A (zh) * | 2004-07-09 | 2006-01-11 | 中国科学院自动化研究所 | 一种新的面向文本分类的特征向量权重的方法及装置 |
CN101059805A (zh) * | 2007-03-29 | 2007-10-24 | 复旦大学 | 基于网络流和分层知识库的动态文本聚类方法 |
-
2010
- 2010-09-21 CN CN 201010292461 patent/CN102411592B/zh active Active
-
2012
- 2012-07-12 HK HK12106886.0A patent/HK1166384A1/xx unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1719436A (zh) * | 2004-07-09 | 2006-01-11 | 中国科学院自动化研究所 | 一种新的面向文本分类的特征向量权重的方法及装置 |
CN101059805A (zh) * | 2007-03-29 | 2007-10-24 | 复旦大学 | 基于网络流和分层知识库的动态文本聚类方法 |
Non-Patent Citations (3)
Title |
---|
伍建军,康耀红: "《基于改进的互信息特征选择的文本分类》", 《计算机应用》 * |
姜远; 周志华;: "《基于词频分类器集成的文本分类方法》", 《计算机研究与发展》 * |
张鹏飞; 李赟; 刘建毅; 钟义信;: "《基于相对词频的文本特征抽取方法》", 《计算机应用研究》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978354A (zh) * | 2014-04-10 | 2015-10-14 | 中电长城网际***应用有限公司 | 文本分类方法和装置 |
CN105095209A (zh) * | 2014-04-21 | 2015-11-25 | 北京金山网络科技有限公司 | 文档聚类方法及装置、网络设备 |
CN106156163A (zh) * | 2015-04-15 | 2016-11-23 | 株式会社日立制作所 | 文本分类方法以及装置 |
CN106156163B (zh) * | 2015-04-15 | 2021-06-22 | 株式会社日立制作所 | 文本分类方法以及装置 |
CN106997340A (zh) * | 2016-01-25 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 词库的生成以及利用词库的文档分类方法及装置 |
CN106997340B (zh) * | 2016-01-25 | 2020-07-31 | 阿里巴巴集团控股有限公司 | 词库的生成以及利用词库的文档分类方法及装置 |
CN107992501A (zh) * | 2016-10-27 | 2018-05-04 | 腾讯科技(深圳)有限公司 | 社交网络信息识别方法、处理方法及装置 |
CN111177379A (zh) * | 2019-12-20 | 2020-05-19 | 深圳市优必选科技股份有限公司 | 低精度问题的归类方法、智能终端及计算机可读存储介质 |
CN111177379B (zh) * | 2019-12-20 | 2023-05-23 | 深圳市优必选科技股份有限公司 | 低精度问题的归类方法、智能终端及计算机可读存储介质 |
CN113032562A (zh) * | 2021-03-18 | 2021-06-25 | 中国人民解放***箭军工程大学 | 一种多次迭代对折词汇层级分类方法及*** |
CN113032562B (zh) * | 2021-03-18 | 2024-02-02 | 中国人民解放***箭军工程大学 | 一种多次迭代对折词汇层级分类方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN102411592B (zh) | 2013-08-07 |
HK1166384A1 (en) | 2012-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Guo et al. | Augmenting data with mixup for sentence classification: An empirical study | |
CN100583101C (zh) | 基于领域知识的文本分类特征选择及权重计算方法 | |
CN102411592B (zh) | 一种文本分类方法和装置 | |
CN110442722B (zh) | 分类模型训练的方法及装置、数据分类的方法及装置 | |
CN110287328B (zh) | 一种文本分类方法、装置、设备及计算机可读存储介质 | |
WO2017097231A1 (zh) | 话题处理方法及装置 | |
CN107844559A (zh) | 一种文件分类方法、装置及电子设备 | |
CN104361037B (zh) | 微博分类方法及装置 | |
CN108874921A (zh) | 提取文本特征词的方法、装置、终端设备及存储介质 | |
CN105975491A (zh) | 企业新闻分析方法及*** | |
CN107729520B (zh) | 文件分类方法、装置、计算机设备及计算机可读介质 | |
CN103886077B (zh) | 短文本的聚类方法和*** | |
CN110442842A (zh) | 合同内容的提取方法及装置、计算机设备、存储介质 | |
CN109241392A (zh) | 目标词的识别方法、装置、***及存储介质 | |
CN104462229A (zh) | 一种事件分类方法及装置 | |
CN105045913A (zh) | 基于WordNet以及潜在语义分析的文本分类方法 | |
CN111639185B (zh) | 关系信息抽取方法、装置、电子设备和可读存储介质 | |
CN103577587A (zh) | 一种新闻主题分类方法 | |
CN103246686A (zh) | 文本分类方法和装置及文本分类的特征处理方法和装置 | |
CN103268346A (zh) | 半监督分类方法及*** | |
Roy et al. | Region selection in handwritten character recognition using artificial bee colony optimization | |
CN108153726A (zh) | 文本处理方法和装置 | |
CN101673305A (zh) | 行业分类方法、装置和服务器 | |
CN102034117B (zh) | 一种图像分类方法和装置 | |
Knight et al. | Hypergen-a distributed genetic algorithm on a hypercube |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1166384 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1166384 Country of ref document: HK |
|
TR01 | Transfer of patent right |
Effective date of registration: 20211118 Address after: Room 554, floor 5, building 3, No. 969, Wenyi West Road, Wuchang Street, Yuhang District, Hangzhou City, Zhejiang Province Patentee after: TAOBAO (CHINA) SOFTWARE CO.,LTD. Address before: Box four, 847, capital building, Grand Cayman Island capital, Cayman Islands, UK Patentee before: ALIBABA GROUP HOLDING Ltd. |
|
TR01 | Transfer of patent right |