CN114207605A - 一种文本分类方法、装置、电子设备及存储介质 - Google Patents
一种文本分类方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114207605A CN114207605A CN201980099197.XA CN201980099197A CN114207605A CN 114207605 A CN114207605 A CN 114207605A CN 201980099197 A CN201980099197 A CN 201980099197A CN 114207605 A CN114207605 A CN 114207605A
- Authority
- CN
- China
- Prior art keywords
- semantic
- text
- network
- classification
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims abstract description 81
- 238000013145 classification model Methods 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims description 179
- 238000013527 convolutional neural network Methods 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 41
- 238000011176 pooling Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013526 transfer learning Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种文本分类方法、装置、电子设备及存储介质,该方法包括获取待分类文本;根据预先训练的文本分类模型的语义表征网络,将待分类文本转换为语义矩阵;在文本分类模型的语义分类网络的卷积层对语义矩阵进行卷积运算,得到多种尺寸的语义特征;根据多种尺寸的语义特征,在分类层确定待分类文本的文本类别。
Description
PCT国内申请,说明书已公开。
Claims (20)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/114871 WO2021081945A1 (zh) | 2019-10-31 | 2019-10-31 | 一种文本分类方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114207605A true CN114207605A (zh) | 2022-03-18 |
Family
ID=75715730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980099197.XA Pending CN114207605A (zh) | 2019-10-31 | 2019-10-31 | 一种文本分类方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114207605A (zh) |
WO (1) | WO2021081945A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113434699B (zh) * | 2021-06-30 | 2023-07-18 | 平安科技(深圳)有限公司 | 用于文本匹配的bert模型的预训练方法、计算机装置和存储介质 |
CN113505304B (zh) * | 2021-09-10 | 2021-12-17 | 明品云(北京)数据科技有限公司 | 一种目标对象推荐方法及*** |
CN113836302A (zh) * | 2021-09-26 | 2021-12-24 | 平安科技(深圳)有限公司 | 文本分类方法、文本分类装置及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
US20190065817A1 (en) * | 2017-08-29 | 2019-02-28 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for detection and classification of cells using convolutional neural networks |
CN109508377A (zh) * | 2018-11-26 | 2019-03-22 | 南京云思创智信息科技有限公司 | 基于融合模型的文本特征提取方法、装置、聊天机器人和存储介质 |
CN109710770A (zh) * | 2019-01-31 | 2019-05-03 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种基于迁移学习的文本分类方法及装置 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
CN109918497A (zh) * | 2018-12-21 | 2019-06-21 | 厦门市美亚柏科信息股份有限公司 | 一种基于改进textCNN模型的文本分类方法、装置及存储介质 |
CN109951846A (zh) * | 2019-03-25 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 无线网络识别方法、装置、存储介质及计算机设备 |
CN110059191A (zh) * | 2019-05-07 | 2019-07-26 | 山东师范大学 | 一种文本情感分类方法及装置 |
CN110083700A (zh) * | 2019-03-19 | 2019-08-02 | 北京中兴通网络科技股份有限公司 | 一种基于卷积神经网络的企业舆情情感分类方法及*** |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170308790A1 (en) * | 2016-04-21 | 2017-10-26 | International Business Machines Corporation | Text classification by ranking with convolutional neural networks |
CN110147452B (zh) * | 2019-05-17 | 2022-03-01 | 北京理工大学 | 一种基于层级bert神经网络的粗粒度情感分析方法 |
CN110334210A (zh) * | 2019-05-30 | 2019-10-15 | 哈尔滨理工大学 | 一种基于bert与lstm、cnn融合的中文情感分析方法 |
CN110309511B (zh) * | 2019-07-04 | 2022-12-09 | 哈尔滨工业大学 | 基于共享表示的多任务语言分析***及方法 |
-
2019
- 2019-10-31 CN CN201980099197.XA patent/CN114207605A/zh active Pending
- 2019-10-31 WO PCT/CN2019/114871 patent/WO2021081945A1/zh active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
US20190065817A1 (en) * | 2017-08-29 | 2019-02-28 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for detection and classification of cells using convolutional neural networks |
CN109508377A (zh) * | 2018-11-26 | 2019-03-22 | 南京云思创智信息科技有限公司 | 基于融合模型的文本特征提取方法、装置、聊天机器人和存储介质 |
CN109918497A (zh) * | 2018-12-21 | 2019-06-21 | 厦门市美亚柏科信息股份有限公司 | 一种基于改进textCNN模型的文本分类方法、装置及存储介质 |
CN109840279A (zh) * | 2019-01-10 | 2019-06-04 | 山东亿云信息技术有限公司 | 基于卷积循环神经网络的文本分类方法 |
CN109710770A (zh) * | 2019-01-31 | 2019-05-03 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种基于迁移学习的文本分类方法及装置 |
CN110083700A (zh) * | 2019-03-19 | 2019-08-02 | 北京中兴通网络科技股份有限公司 | 一种基于卷积神经网络的企业舆情情感分类方法及*** |
CN109951846A (zh) * | 2019-03-25 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 无线网络识别方法、装置、存储介质及计算机设备 |
CN110059191A (zh) * | 2019-05-07 | 2019-07-26 | 山东师范大学 | 一种文本情感分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021081945A1 (zh) | 2021-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111164601B (zh) | 情感识别方法、智能装置和计算机可读存储介质 | |
WO2020238293A1 (zh) | 图像分类方法、神经网络的训练方法及装置 | |
WO2021169723A1 (zh) | 图像识别方法、装置、电子设备及存储介质 | |
US20210326377A1 (en) | Multi-stage image querying | |
JP6741357B2 (ja) | マルチ関連ラベルを生成する方法及びシステム | |
WO2021022521A1 (zh) | 数据处理的方法、训练神经网络模型的方法及设备 | |
CN109241880B (zh) | 图像处理方法、图像处理装置、计算机可读存储介质 | |
CN111209970B (zh) | 视频分类方法、装置、存储介质及服务器 | |
CN111133453B (zh) | 人工神经网络 | |
CN114207605A (zh) | 一种文本分类方法、装置、电子设备及存储介质 | |
EP3620982B1 (en) | Sample processing method and device | |
CN113836992B (zh) | 识别标签的方法、训练标签识别模型的方法、装置及设备 | |
CN110929805A (zh) | 神经网络的训练方法、目标检测方法及设备、电路和介质 | |
JP2022532432A (ja) | データ圧縮方法およびコンピューティングデバイス | |
CN113326930A (zh) | 数据处理方法、神经网络的训练方法及相关装置、设备 | |
CN111860046B (zh) | 一种改进MobileNet模型的人脸表情识别方法 | |
CN111428645A (zh) | 人体关键点的检测方法、装置、电子设备及存储介质 | |
CN107330387B (zh) | 基于图像数据的行人检测方法 | |
CN110717401A (zh) | 年龄估计方法及装置、设备、存储介质 | |
WO2021253941A1 (zh) | 神经网络模型训练、图像分类、文本翻译方法及装置、设备 | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN112418327A (zh) | 图像分类模型的训练方法、装置、电子设备以及存储介质 | |
WO2023016087A1 (zh) | 图像聚类方法、装置、计算机设备及存储介质 | |
US20190348062A1 (en) | System and method for encoding data using time shift in an audio/image recognition integrated circuit solution | |
US20200043477A1 (en) | Sensor-Processing Systems Including Neuromorphic Processing Modules and Methods Thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |