CN111324742A - 一种数字人文知识图谱的构建方法 - Google Patents
一种数字人文知识图谱的构建方法 Download PDFInfo
- Publication number
- CN111324742A CN111324742A CN202010084140.7A CN202010084140A CN111324742A CN 111324742 A CN111324742 A CN 111324742A CN 202010084140 A CN202010084140 A CN 202010084140A CN 111324742 A CN111324742 A CN 111324742A
- Authority
- CN
- China
- Prior art keywords
- entity
- corpus
- model
- attribute
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title description 4
- 238000000605 extraction Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000002372 labelling Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 7
- 239000000463 material Substances 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010084140.7A CN111324742B (zh) | 2020-02-10 | 2020-02-10 | 一种数字人文知识图谱的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010084140.7A CN111324742B (zh) | 2020-02-10 | 2020-02-10 | 一种数字人文知识图谱的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111324742A true CN111324742A (zh) | 2020-06-23 |
CN111324742B CN111324742B (zh) | 2024-01-23 |
Family
ID=71172665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010084140.7A Active CN111324742B (zh) | 2020-02-10 | 2020-02-10 | 一种数字人文知识图谱的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111324742B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881294A (zh) * | 2020-07-30 | 2020-11-03 | 本识科技(深圳)有限公司 | 一种语料标注***、方法及存储介质 |
CN112100401A (zh) * | 2020-09-14 | 2020-12-18 | 北京大学 | 面向科技服务的知识图谱构建方法、装置、设备及存储介质 |
CN112148886A (zh) * | 2020-09-04 | 2020-12-29 | 上海晏鼠计算机技术股份有限公司 | 一种内容知识图谱的构建方法及*** |
CN112364166A (zh) * | 2020-11-02 | 2021-02-12 | 北京中科凡语科技有限公司 | 关系抽取模型的建立方法以及关系抽取方法 |
CN112989811A (zh) * | 2021-03-01 | 2021-06-18 | 哈尔滨工业大学 | 一种基于BiLSTM-CRF的历史典籍阅读辅助***及其控制方法 |
CN113190541A (zh) * | 2021-05-12 | 2021-07-30 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于数字人文的实体识别方法 |
CN113239196A (zh) * | 2021-05-12 | 2021-08-10 | 同方知网数字出版技术股份有限公司 | 一种基于数字人文的实体分类模型训练与预测方法 |
CN113377916A (zh) * | 2021-06-22 | 2021-09-10 | 哈尔滨工业大学 | 一种面向法律文本的多关系中主要关系的抽取方法 |
CN113987145A (zh) * | 2021-10-22 | 2022-01-28 | 智联(无锡)信息技术有限公司 | 一种精准推理用户属性实体的方法、***、设备和存储介质 |
CN118093881A (zh) * | 2024-04-17 | 2024-05-28 | 成都数之联科技股份有限公司 | 一种基于知识图谱的审计对象画像建模方法和*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN108875051A (zh) * | 2018-06-28 | 2018-11-23 | 中译语通科技股份有限公司 | 面向海量非结构化文本的知识图谱自动构建方法及*** |
CN109190113A (zh) * | 2018-08-10 | 2019-01-11 | 北京科技大学 | 一种中医理论典籍的知识图谱构建方法 |
GB201904167D0 (en) * | 2019-03-26 | 2019-05-08 | Benevolentai Tech Limited | Name entity recognition with deep learning |
CN109829159A (zh) * | 2019-01-29 | 2019-05-31 | 南京师范大学 | 一种古汉语文本的一体化自动词法分析方法及*** |
CN110032648A (zh) * | 2019-03-19 | 2019-07-19 | 微医云(杭州)控股有限公司 | 一种基于医学领域实体的病历结构化解析方法 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110413798A (zh) * | 2019-07-24 | 2019-11-05 | 厦门快商通科技股份有限公司 | 一种医疗美容知识图谱自动构建方法、***及存储介质 |
CN110598203A (zh) * | 2019-07-19 | 2019-12-20 | 中国人民解放军国防科技大学 | 一种结合词典的军事想定文书实体信息抽取方法及装置 |
-
2020
- 2020-02-10 CN CN202010084140.7A patent/CN111324742B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN108875051A (zh) * | 2018-06-28 | 2018-11-23 | 中译语通科技股份有限公司 | 面向海量非结构化文本的知识图谱自动构建方法及*** |
CN109190113A (zh) * | 2018-08-10 | 2019-01-11 | 北京科技大学 | 一种中医理论典籍的知识图谱构建方法 |
CN109829159A (zh) * | 2019-01-29 | 2019-05-31 | 南京师范大学 | 一种古汉语文本的一体化自动词法分析方法及*** |
CN110032648A (zh) * | 2019-03-19 | 2019-07-19 | 微医云(杭州)控股有限公司 | 一种基于医学领域实体的病历结构化解析方法 |
GB201904167D0 (en) * | 2019-03-26 | 2019-05-08 | Benevolentai Tech Limited | Name entity recognition with deep learning |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN110598203A (zh) * | 2019-07-19 | 2019-12-20 | 中国人民解放军国防科技大学 | 一种结合词典的军事想定文书实体信息抽取方法及装置 |
CN110413798A (zh) * | 2019-07-24 | 2019-11-05 | 厦门快商通科技股份有限公司 | 一种医疗美容知识图谱自动构建方法、***及存储介质 |
Non-Patent Citations (1)
Title |
---|
袁凯琦: ""医学知识图谱构建技术与研究进展"", vol. 35, no. 35, pages 1 - 8 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111881294B (zh) * | 2020-07-30 | 2023-10-24 | 本识科技(深圳)有限公司 | 一种语料标注***、方法及存储介质 |
CN111881294A (zh) * | 2020-07-30 | 2020-11-03 | 本识科技(深圳)有限公司 | 一种语料标注***、方法及存储介质 |
CN112148886A (zh) * | 2020-09-04 | 2020-12-29 | 上海晏鼠计算机技术股份有限公司 | 一种内容知识图谱的构建方法及*** |
CN112100401A (zh) * | 2020-09-14 | 2020-12-18 | 北京大学 | 面向科技服务的知识图谱构建方法、装置、设备及存储介质 |
CN112100401B (zh) * | 2020-09-14 | 2024-05-07 | 北京大学 | 面向科技服务的知识图谱构建方法、装置、设备及存储介质 |
CN112364166A (zh) * | 2020-11-02 | 2021-02-12 | 北京中科凡语科技有限公司 | 关系抽取模型的建立方法以及关系抽取方法 |
CN112989811A (zh) * | 2021-03-01 | 2021-06-18 | 哈尔滨工业大学 | 一种基于BiLSTM-CRF的历史典籍阅读辅助***及其控制方法 |
CN113239196A (zh) * | 2021-05-12 | 2021-08-10 | 同方知网数字出版技术股份有限公司 | 一种基于数字人文的实体分类模型训练与预测方法 |
CN113190541A (zh) * | 2021-05-12 | 2021-07-30 | 《中国学术期刊(光盘版)》电子杂志社有限公司 | 一种基于数字人文的实体识别方法 |
CN113239196B (zh) * | 2021-05-12 | 2024-07-09 | 同方知网数字出版技术股份有限公司 | 一种基于数字人文的实体分类模型训练与预测方法 |
CN113377916A (zh) * | 2021-06-22 | 2021-09-10 | 哈尔滨工业大学 | 一种面向法律文本的多关系中主要关系的抽取方法 |
CN113987145A (zh) * | 2021-10-22 | 2022-01-28 | 智联(无锡)信息技术有限公司 | 一种精准推理用户属性实体的方法、***、设备和存储介质 |
CN118093881A (zh) * | 2024-04-17 | 2024-05-28 | 成都数之联科技股份有限公司 | 一种基于知识图谱的审计对象画像建模方法和*** |
CN118093881B (zh) * | 2024-04-17 | 2024-07-02 | 成都数之联科技股份有限公司 | 一种基于知识图谱的审计对象画像建模方法和*** |
Also Published As
Publication number | Publication date |
---|---|
CN111324742B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111324742B (zh) | 一种数字人文知识图谱的构建方法 | |
CN110019839B (zh) | 基于神经网络和远程监督的医学知识图谱构建方法和*** | |
CN109857990B (zh) | 一种基于文档结构与深度学习的金融类公告信息抽取方法 | |
CN111723215B (zh) | 基于文本挖掘的生物技术信息知识图谱构建装置与方法 | |
CN109829159B (zh) | 一种古汉语文本的一体化自动词法分析方法及*** | |
CN107463607B (zh) | 结合词向量和自举学习的领域实体上下位关系获取与组织方法 | |
CN112732934B (zh) | 电网设备分词词典和故障案例库构建方法 | |
CN109753660B (zh) | 一种基于lstm的中标网页命名实体抽取方法 | |
CN111209412A (zh) | 一种循环更新迭代的期刊文献知识图谱构建方法 | |
CN111209401A (zh) | 网络舆情文本信息情感极性分类处理***及方法 | |
CN107622050A (zh) | 基于Bi‑LSTM和CRF的文本序列标注***及方法 | |
CN111310470B (zh) | 一种融合字词特征的中文命名实体识别方法 | |
CN111061882A (zh) | 一种知识图谱构建方法 | |
CN111897917B (zh) | 基于多模态自然语言特征的轨道交通行业术语提取方法 | |
CN115080694A (zh) | 一种基于知识图谱的电力行业信息分析方法及设备 | |
CN107247739A (zh) | 一种基于因子图的金融公报文本知识提取方法 | |
CN111858933A (zh) | 基于字符的层次化文本情感分析方法及*** | |
CN113312922A (zh) | 一种改进的篇章级三元组信息抽取方法 | |
CN111178080A (zh) | 一种基于结构化信息的命名实体识别方法及*** | |
CN113392183A (zh) | 一种儿童范畴图谱知识的表征与计算方法 | |
CN108763487B (zh) | 一种基于Mean Shift的融合词性和句子信息的词表示方法 | |
CN115934936A (zh) | 一种基于自然语言处理的智能交通文本分析方法 | |
CN115952794A (zh) | 融合双语敏感词典和异构图的汉泰跨语言敏感信息识别方法 | |
CN113095087B (zh) | 一种基于图卷积神经网络的中文词义消歧方法 | |
Seresangtakul et al. | Thai-Isarn dialect parallel corpus construction for machine translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230808 Address after: Rooms B201, B202, B203, B205, B206, B207, B208, B209, B210, 2nd Floor, Building B-2, Zhongguancun Dongsheng Science and Technology Park, No. 66 Xixiaokou Road, Haidian District, Beijing, 100084 (Dongsheng District) Applicant after: TONGFANG KNOWLEDGE NETWORK DIGITAL PUBLISHING TECHNOLOGY CO.,LTD. Address before: 100084 Beijing city Haidian District Tsinghua University Tsinghua Yuan 36 zone B1410, Huaye building 1412, room 1414 Applicant before: TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co.,Ltd. Applicant before: TONGFANG KNOWLEDGE NETWORK DIGITAL PUBLISHING TECHNOLOGY CO.,LTD. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |