CN110825930A - 基于人工智能自动识别社区问答论坛中的正确回答的方法 - Google Patents

基于人工智能自动识别社区问答论坛中的正确回答的方法 Download PDF

Info

Publication number
CN110825930A
CN110825930A CN201911058818.8A CN201911058818A CN110825930A CN 110825930 A CN110825930 A CN 110825930A CN 201911058818 A CN201911058818 A CN 201911058818A CN 110825930 A CN110825930 A CN 110825930A
Authority
CN
China
Prior art keywords
answer
question
answers
similarity
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911058818.8A
Other languages
English (en)
Inventor
孙海峰
王晶
戚琦
王敬宇
郭令奇
马兵
杜纯宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201911058818.8A priority Critical patent/CN110825930A/zh
Publication of CN110825930A publication Critical patent/CN110825930A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

基于人工智能自动识别社区问答论坛中的正确回答的方法,包括下列操作步骤:(1)数据集建立的过程;(2)使用深度学习的方法抽取文本对的信息特征;(3)使用规则提取提问和回答的其他特征,将这些特征与步骤(2)中得到的特征拼接成特征向量,特征向量的格式为[BERT预测概率,当前回答和优秀回答的相似度,回答和提问的相似度,天数差];(4)训练机器学习分类模型并预测新帖。本发明的方法能够快速、准确的判断出一个帖子下可能为正确答案的回答,省时省力。

Description

基于人工智能自动识别社区问答论坛中的正确回答的方法
技术领域
本发明涉及基于人工智能自动识别社区问答论坛中的正确回答的方法,属于自然语言处理技术领域,特别是属于基于人工智能的自然语言处理的论坛问答技术领域。
背景技术
随着众多社区论坛的出现,与之相关的任务在最近变得越来越重要。随着这些论坛每天涌入很多新问题,与这些新问题相关的留言大部分有一定的错误,对他人造成了一定的误导作用。这些错误的留言如果用人工鉴别的话,不光需要某些领域比较权威的专家,还费时费力。因此,如何快速有效的判别新问题下的答案是否对解决该问题有帮助,是解决论坛为解决问题不断增多的有效途径。
人工智能技术和自然语言处理技术在近几年获得很大的发展,如何利用人工智能技术和自然语言处理技术来实现对回答的好坏进行甄别成了亟需解决的一个技术难题。
发明内容
有鉴于此,本发明的目的是发明一种基于人工智能自动识别社区问答论坛中的正确回答的方法,实现对问答贴中的回答进行辨别,选择出优秀的答案留给他人参考。
为了达到上述目的,本发明提出了基于人工智能自动识别社区问答论坛中的正确回答的方法,所述方法包括下列操作步骤:
(1)数据集建立的过程,具体内容是:先用爬虫软件爬取大量的问答贴内容;在爬取后,将所述问答贴内容以提问和单个回答组成的文本对的形式进行数据存储;然后对前述存储的数据进行数据清洗,再进行人工标注,建立数据集;
(2)使用深度学习的方法抽取文本对的信息特征,具体内容是:将步骤(1)中获得的数据集作为训练集训练深度学习模型,然后用所述的深度学习模型提取文本对的语气,关键词,语法结构等特征;
(3)使用规则提取提问和回答的其他特征,具体内容是:计算提问与回答发布的天数差、利用TF-IDF计算单个回答与当前提问的相似程度、利用TF-IDF计算单个回答与当前提问的其他回答的相似程度等特征,将这些特征与步骤(2)中得到的特征拼接成特征向量;
(4)训练机器学习分类模型并预测新帖,具体内容是:将步骤(3)获得的特征向量对机器学习分类模型进行训练;训练完成后对新帖进行预测,先用爬虫爬取新帖的全部内容并存储,之后按照步骤(2)和步骤(3)抽取特征组成向量再用所述的机器学习分类模型进行预测,选取概率最高的前n个回答,n为自然数,n不大于回答的总个数。
所述步骤(1)的具体内容包括如下操作步骤:
(11)使用爬虫爬取网站的信息,将帖子提问,回答,提问用户,回答用户,发帖时间等信息存储,也可以从其他类似数据集中获得数据,一并进行整理;
(12)遍历并用“NULL”填充为空的属性,统一文本的最大长度,清洗干扰数据;
(13)将上一步骤中获得的数据以问题和单个回答以文本对的形式存储,进行人工标注。
所述步骤(2)的具体内容包括如下操作步骤:
(21)使用BERT模型并根据步骤(1)中得到的数据进行微调训练;BERT模型将输入的文本内容进行字节编码、片段编码和位置编码;在微调训练结束后,将微调后的模型存储。
(22)将步骤(21)中得到的三个编码层的向量相加后进行分类,获得单个提问和单个回答的分类结果,所述分类结果中含有BERT模型学习到文本中的语气,关键词等文本特征。
所述步骤(3)的具体内容包括如下操作步骤:
(31)在所述数据集中读取当前提问和其回答的时间,计算天数差,即天数差=提问的时间-回答提问的时间,使用TF-IDF词频-逆文件频率算法来计算单个回答和提问的相似度;
(32)根据步骤(2)中所得到对所有回答的分类结果,计算每个回答与它当前提问的概率最高的回答之间的相似度,具体方法是使用TF-IDF词频-逆文件频率算法来计算所述相似度,所述概率最高的回答即优秀回答;
(33)将前述获得的天数差特征、相似度特征和步骤(2)中获得的特征值拼接成特征向量,所述特征向量的格式为[BERT预测概率,当前回答和优秀回答的相似度,回答和提问的相似度,天数差]。
所述步骤(4)的具体内容包括如下操作步骤:
(41)选取SVM模型作为机器学习分类模型,根据步骤(3)获得的特征向量对所述机器学习分类模型进行训练;
(42)获得目标帖的相关信息,包括但不限于提问内容、回答内容、发帖时间,按照步骤(1)的存储格式,将提问和单个回答以文本对的形式存储;
(43)根据上一步骤获得的文本数据,使用在步骤(2)中微调好的BERT模型对所述目标贴进行预测,再按照步骤(3)的方法计算天数差、相似度等特征之后组合成特征向量,特征向量格式与步骤(3)中组成的特征向量格式相同,特征向量的个数与回答个数相等;
(44)使用步骤(41)中训练好的机器学习分类模型对所述特征向量进行预测,输出前n个概率最高的回答供用户参考,n为自然数,n不大于回答的总个数。
本发明的有益效果在于:本发明的方法不仅局限于发帖和回帖的文本信息,更考虑了文本以外的信息,如用户名,发帖与回帖的时间差,与其他回答的相似程度等,以多维度的特征去训练模型,使模型的准确率更高。本发明的方法能够快速、准确的判断出一个帖子下可能为正确答案的回答,省时省力,也减少了错误答案对他人的误导。
附图说明
图1是本发明提出的基于人工智能自动识别社区问答论坛中的正确回答的方法的流程图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
参见图1,介绍本发明提出的基于人工智能自动识别社区问答论坛中的正确回答的方法,所述方法包括下列操作步骤:
(1)数据集建立的过程,具体内容是:先用爬虫软件爬取大量的问答贴内容;在爬取后,将所述问答贴内容以提问和单个回答组成的文本对的形式进行数据存储,文本对的数据存储格式参见表1;也可以通过其他的数据集获得数据;然后对前述存储的数据进行数据清洗,再进行人工标注,建立数据集;
表1
问题 回答
签证的有效期是几个月 3个月
签证的有效期是几个月 在3个月内允许多次入出境。
签证的有效期是几个月 大概两个月吧,也可能三个月
(2)使用深度学习的方法抽取文本对的信息特征,具体内容是:将步骤(1)中获得的数据集作为训练集训练深度学习模型,然后用所述的深度学习模型提取文本对的语气,关键词,语法结构等特征;
(3)使用规则提取提问和回答的其他特征,具体内容是:计算提问与回答发布的天数差、利用TF-IDF计算单个回答与当前提问的相似程度、利用TF-IDF计算单个回答与当前提问的其他回答的相似程度等特征,将这些特征与步骤(2)中得到的特征拼接成特征向量;
(4)训练机器学习分类模型并预测新帖,具体内容是:将步骤(3)获得的特征向量对机器学习分类模型进行训练;训练完成后对新帖进行预测,先用爬虫爬取新帖的全部内容并存储,之后按照步骤(2)和步骤(3)抽取特征组成向量再用所述的机器学习分类模型进行预测,选取概率最高的前n个回答,n为自然数,n不大于回答的总个数。
所述步骤(1)的具体内容包括如下操作步骤:
(11)使用爬虫爬取网站的信息,将帖子提问,回答,提问用户,回答用户,发帖时间等信息存储,也可以从其他类似数据集中获得数据,如:一些主要内容为论坛求助帖的数据集,比如Semeval2019的Task8的数据集中获得数据,一并进行整理;
(12)遍历并用“NULL”填充为空的属性,统一文本的最大长度,利用规则清洗干扰数据;例如讨论帖,公告帖等无关帖子内容,所述规则主要是查找帖子中是否含有“节日快乐”、“水贴”、“讨论”等关键词;
表2
Figure BDA0002257306330000041
(13)将上一步骤中获得的数据以问题和单个回答以文本对的形式存储,进行人工标注,人工标注的方法遵循以下公式:
Figure BDA0002257306330000042
在上述公式中,a代表了文本对的标签,如果回答是正确的,则文本对会被标为“1”,如果回答是错误的,文本对会被标为“0”,如果回答是个问句,则文本对被标为“2”。
参见表1,数据以问题和单个回答的文本对的形式存储在文件里以便读取。参见表2所示的数据举例,表2中每一行代表了单个的文本对,第一列是问题,第二列是对该问题的回答。对于一个帖子,可能有零个、一个或多个正确的回答。在该例中,第一个回答和第二个回答是正确的,第三个回答是错误的。
所述步骤(2)的具体内容包括如下操作步骤:
(21)使用BERT模型并根据步骤(1)中得到的数据进行微调训练;BERT模型将输入的文本内容进行字节编码、片段编码和位置编码;在微调训练结束后,将微调后的模型存储。BERT模型全称为Bidirectional Encoder Representation from Transformers,详细情况参见论文Jacob Devlin,Ming-Wei Chang,Kenton Lee,andKristinaToutanova.2018.Bert:Pre-training of deep bidirectional transformersfor language understanding.arXiv preprint arXiv:1810.04805;
(22)将步骤(21)中得到的三个编码层的向量相加后进行分类,获得单个提问和单个回答的分类结果,所述分类结果中含有BERT模型学习到文本中的语气,关键词等文本特征。
所述步骤(3)的具体内容包括如下操作步骤:
(31)在所述数据集中读取当前提问和其回答的时间,计算天数差,即天数差=提问的时间-回答提问的时间,使用TF-IDF词频-逆文件频率算法来计算单个回答和提问的相似度;
(32)根据步骤(2)中所得到对所有回答的分类结果,计算每个回答与它当前提问的概率最高的回答之间的相似度,具体方法是使用TF-IDF词频-逆文件频率算法来计算所述相似度,所述概率最高的回答即优秀回答;
(33)将前述获得的天数差特征、相似度特征和步骤(2)中获得的特征值拼接成特征向量,所述特征向量的格式为[BERT预测概率,当前回答和优秀回答的相似度,回答和提问的相似度,天数差]。
所述步骤(4)的具体内容包括如下操作步骤:
(41)选取SVM模型作为机器学习分类模型,根据步骤(3)获得的特征向量对所述机器学习分类模型进行训练;
(42)获得目标帖的相关信息,包括但不限于提问内容、回答内容、发帖时间,按照步骤(1)的存储格式,将提问和单个回答以文本对的形式存储;
(43)根据上一步骤获得的文本数据,使用在步骤(2)中微调好的BERT模型对所述目标贴进行预测,再按照步骤(3)的方法计算天数差、相似度等特征之后组合成特征向量,特征向量格式与步骤(3)中组成的特征向量格式相同,特征向量的个数与回答个数相等;
(44)使用步骤(41)中训练好的机器学习分类模型对所述特征向量进行预测,输出前n个概率最高的回答供用户参考,n为自然数,n不大于回答的总个数。
发明人对本发明方法进行了大量的实验,实验结果证明本发明的方法是可行有效的。

Claims (5)

1.基于人工智能自动识别社区问答论坛中的正确回答的方法,其特征在于:所述方法包括下列操作步骤:
(1)数据集建立的过程,具体内容是:先用爬虫软件爬取大量的问答贴内容;在爬取后,将所述问答贴内容以提问和单个回答组成的文本对的形式进行数据存储;然后对前述存储的数据进行数据清洗,再进行人工标注,建立数据集;
(2)使用深度学习的方法抽取文本对的信息特征,具体内容是:将步骤(1)中获得的数据集作为训练集训练深度学习模型,然后用所述的深度学习模型提取文本对的语气,关键词,语法结构等特征;
(3)使用规则提取提问和回答的其他特征,具体内容是:计算提问与回答发布的天数差、利用TF-IDF计算单个回答与当前提问的相似程度、利用TF-IDF计算单个回答与当前提问的其他回答的相似程度等特征,将这些特征与步骤(2)中得到的特征拼接成特征向量;
(4)训练机器学习分类模型并预测新帖,具体内容是:将步骤(3)获得的特征向量对机器学习分类模型进行训练;训练完成后对新帖进行预测,先用爬虫爬取新帖的全部内容并存储,之后按照步骤(2)和步骤(3)抽取特征组成向量再用所述的机器学习分类模型进行预测,选取概率最高的前n个回答,n为自然数,n不大于回答的总个数。
2.根据权利要求1所述的基于人工智能自动识别社区问答论坛中的正确回答的方法,其特征在于:所述步骤(1)的具体内容包括如下操作步骤:
(11)使用爬虫爬取网站的信息,将帖子提问,回答,提问用户,回答用户,发帖时间等信息存储,也可以从其他类似数据集中获得数据,一并进行整理;
(12)遍历并用“NULL”填充为空的属性,统一文本的最大长度,清洗干扰数据;
(13)将上一步骤中获得的数据以问题和单个回答以文本对的形式存储,进行人工标注。
3.根据权利要求1所述的基于人工智能自动识别社区问答论坛中的正确回答的方法,其特征在于:所述步骤(2)的具体内容包括如下操作步骤:
(21)使用BERT模型并根据步骤(1)中得到的数据进行微调训练;BERT模型将输入的文本内容进行字节编码、片段编码和位置编码;在微调训练结束后,将微调后的模型存储;
(22)将步骤(21)中得到的三个编码层的向量相加后进行分类,获得单个提问和单个回答的分类结果,所述分类结果中含有BERT模型学习到文本中的语气,关键词等文本特征。
4.根据权利要求1所述的基于人工智能自动识别社区问答论坛中的正确回答的方法,其特征在于:所述步骤(3)的具体内容包括如下操作步骤:
(31)在所述数据集中读取当前提问和其回答的时间,计算天数差,即天数差=提问的时间-回答提问的时间,使用TF-IDF词频-逆文件频率算法来计算单个回答和提问的相似度;
(32)根据步骤(2)中所得到对所有回答的分类结果,计算每个回答与它当前提问的概率最高的回答之间的相似度,具体方法是使用TF-IDF词频-逆文件频率算法来计算所述相似度,所述概率最高的回答即优秀回答;
(33)将前述获得的天数差特征、相似度特征和步骤(2)中获得的特征值拼接成特征向量,所述特征向量的格式为[BERT预测概率,当前回答和优秀回答的相似度,回答和提问的相似度,天数差]。
5.根据权利要求1所述的基于人工智能自动识别社区问答论坛中的正确回答的方法,其特征在于:所述步骤(4)的具体内容包括如下操作步骤:
(41)选取SVM模型作为机器学习分类模型,根据步骤(3)获得的特征向量对所述机器学习分类模型进行训练;
(42)获得目标帖的相关信息,包括但不限于提问内容、回答内容、发帖时间,按照步骤(1)的存储格式,将提问和单个回答以文本对的形式存储;
(43)根据上一步骤获得的文本数据,使用在步骤(2)中微调好的BERT模型对所述目标贴进行预测,再按照步骤(3)的方法计算天数差、相似度等特征之后组合成特征向量,特征向量格式与步骤(3)中组成的特征向量格式相同,特征向量的个数与回答个数相等;
(44)使用步骤(41)中训练好的机器学习分类模型对所述特征向量进行预测,输出前n个概率最高的回答供用户参考,n为自然数,n不大于回答的总个数。
CN201911058818.8A 2019-11-01 2019-11-01 基于人工智能自动识别社区问答论坛中的正确回答的方法 Pending CN110825930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911058818.8A CN110825930A (zh) 2019-11-01 2019-11-01 基于人工智能自动识别社区问答论坛中的正确回答的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911058818.8A CN110825930A (zh) 2019-11-01 2019-11-01 基于人工智能自动识别社区问答论坛中的正确回答的方法

Publications (1)

Publication Number Publication Date
CN110825930A true CN110825930A (zh) 2020-02-21

Family

ID=69551882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911058818.8A Pending CN110825930A (zh) 2019-11-01 2019-11-01 基于人工智能自动识别社区问答论坛中的正确回答的方法

Country Status (1)

Country Link
CN (1) CN110825930A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159414A (zh) * 2020-04-02 2020-05-15 成都数联铭品科技有限公司 文本分类方法及***、电子设备、计算机可读存储介质
CN113609851A (zh) * 2021-07-09 2021-11-05 浙江连信科技有限公司 心理学上想法认知偏差的识别方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191686A1 (en) * 2009-01-23 2010-07-29 Microsoft Corporation Answer Ranking In Community Question-Answering Sites
CN109271505A (zh) * 2018-11-12 2019-01-25 深圳智能思创科技有限公司 一种基于问题答案对的问答***实现方法
CN109472305A (zh) * 2018-10-31 2019-03-15 国信优易数据有限公司 答案质量确定模型训练方法、答案质量确定方法及装置
CN109558477A (zh) * 2018-10-23 2019-04-02 深圳先进技术研究院 一种基于多任务学习的社区问答***、方法及电子设备
CN109871439A (zh) * 2019-02-18 2019-06-11 华南理工大学 一种基于深度学习的问答社区问题路由方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100191686A1 (en) * 2009-01-23 2010-07-29 Microsoft Corporation Answer Ranking In Community Question-Answering Sites
CN109558477A (zh) * 2018-10-23 2019-04-02 深圳先进技术研究院 一种基于多任务学习的社区问答***、方法及电子设备
CN109472305A (zh) * 2018-10-31 2019-03-15 国信优易数据有限公司 答案质量确定模型训练方法、答案质量确定方法及装置
CN109271505A (zh) * 2018-11-12 2019-01-25 深圳智能思创科技有限公司 一种基于问题答案对的问答***实现方法
CN109871439A (zh) * 2019-02-18 2019-06-11 华南理工大学 一种基于深度学习的问答社区问题路由方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JACOB DEVLIN 等: "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding", 《HTTPS://ARXIV.ORG/ABS/1810.04805》 *
LICHUN YANG 等: "Analyzing and Predicting Not-Answered Questions in Community-based Question Answering Services", 《TWENTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
车车轮轮滚滚滚: "《如何拼接不同维度的特征并传入SVM训练?》", 《HTTPS://BBS.CSDN.NET/TOPICS/392506779》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159414A (zh) * 2020-04-02 2020-05-15 成都数联铭品科技有限公司 文本分类方法及***、电子设备、计算机可读存储介质
CN113609851A (zh) * 2021-07-09 2021-11-05 浙江连信科技有限公司 心理学上想法认知偏差的识别方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN102262634B (zh) 一种自动问答方法及***
CN110795543A (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN111581376B (zh) 一种知识图谱自动构建***及方法
CN111368042A (zh) 智能问答方法、装置、计算机设备及计算机存储介质
CN104156433B (zh) 一种基于语义映射空间构建的图像检索方法
CN105095187A (zh) 一种搜索意图识别方法及装置
CN112395410B (zh) 一种基于实体抽取的产业舆情推荐方法、装置及电子设备
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN112818093A (zh) 基于语义匹配的证据文档检索方法、***及存储介质
CN104881428B (zh) 一种信息图网页的信息图提取、检索方法和装置
CN111552773A (zh) 一种阅读理解任务中是否类问题关键句寻找方法及***
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN115761753A (zh) 一种融合知识图谱的检索式知识前缀引导视觉问答方法
CN112966117A (zh) 实体链接方法
CN110825930A (zh) 基于人工智能自动识别社区问答论坛中的正确回答的方法
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN117668180A (zh) 文档问答方法、文档问答设备以及可读存储介质
CN114722086A (zh) 一种搜索重排模型的确定方法及装置
CN114048308A (zh) 一种类案检索报告生成的方法及装置
CN111259223B (zh) 基于情感分析模型的新闻推荐和文本分类方法
CN110969005A (zh) 一种确定实体语料之间的相似性的方法及装置
CN114842982B (zh) 一种面向医疗信息***的知识表达方法、装置及***
CN114416914B (zh) 一种基于图片问答的处理方法
CN116089578A (zh) 智能问答数据自动标注方法、***及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200221