CN107729468A - 基于深度学习的答案抽取方法及*** - Google Patents
基于深度学习的答案抽取方法及*** Download PDFInfo
- Publication number
- CN107729468A CN107729468A CN201710948835.3A CN201710948835A CN107729468A CN 107729468 A CN107729468 A CN 107729468A CN 201710948835 A CN201710948835 A CN 201710948835A CN 107729468 A CN107729468 A CN 107729468A
- Authority
- CN
- China
- Prior art keywords
- answer
- word
- question
- knowledge fragment
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于深度学习的答案抽取方法及***,其中,方法的实现包括:根据待回答问题中的关键词搜集与待回答问题的答案相关的知识碎片;基于待回答问题的类型,对知识碎片进行词性标注分析,将包含符合待回答问题的类型的知识碎片作为候选答案;利用已训练的word2vec模型,计算关键词与候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;将目标候选答案中的词语反代入到待回答问题中得到若干个目标语句,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。通过本发明能够找到相似度较高的多个词语的答案,从而提高了***的精确度。
Description
技术领域
本发明属于人工智能与深度学习技术领域,更具体地,涉及一种基于深度学习的答案抽取方法及***。
背景技术
问答机器人是指以自然语言理解技术为核心,使得计算机能够理解用户提出的问题,实现人与计算机之间的有效沟通,并且提供强大的搜索能力,准确回答用户的问题。其中,目前在计算机客服***中普遍采用的智能问答***就是一种自动问答***,它是一种通过自然语言技术,能够理解用户的问题,并且提供准确答案的人工智能***。然而目前的智能问答***。
现有问答***大多都是先以句子为单位进行分词及标注词性。利用问句类型表得到预期答案类型,利用句型分析得到答案的可能形式。最后将片段中不含预期答案类型的句子排除得到答案候选集。这类方法存在的问题是抽取方法只能识别特定词语的答案而不能识别相似词语的答案,从而导致识别准确性较低。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于深度学习的答案抽取方法及***,由此解决现有答案抽取方法中存在的只能识别特定词语的答案而不能识别相似词语的答案,而导致的识别准确性较低的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于深度学习的答案抽取方法,包括:
根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
优选地,所述方法还包括:
根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断所述知识碎片的分数是否高于分数阈值,若高于所述分数阈值,则将所述知识碎片作为候选答案,并执行所述利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
若所述知识碎片的分数不高于所述分数阈值,则执行所述基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案。
优选地,所述方法还包括:
采用结巴分词,将训练语料进行分词;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
按照本发明的另一方面,提供了一种基于深度学习的答案抽取***,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
优选地,所述***还包括:
评分模块,用于根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断模块,用于判断所述知识碎片的分数是否高于分数阈值;
判断执行模块,用于在所述知识碎片的分数高于所述分数阈值时,将所述知识碎片作为候选答案,并执行所述相似度计算模块的操作;在所述知识碎片的分数不高于所述分数阈值时,则执行所述词性分析模块的操作。
优选地,所述***还包括:
训练模块,用于采用结巴分词,将训练语料进行分词;将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)通过利用问题中的关键词从本地文本库或互联网上获取支撑问题的证据碎片,该方法极大地扩充了问题证据的广泛性,从而能有效地找到相关问题对应的答案;
(2)为评价不同证据碎片对问题的支撑程度,通过计算问题中的关键词在标题和碎片中的词频建立了一套证据评分机制,通过词性分析和依存句法分析,筛选出证据中包含问题类型的句子,该方法通过一种评分机制及对词性的分析,有效地提高了针对问题分类所采取的证据筛选和过滤的功能;
(3)利用深度学习技术,基于语料库,训练一种word2vec模型,计算问题中关键词与候选中词语的相似度,找到与问题中关键词相似的词语并排序,该方法通过采用深度学习的技术,通过神经网络模型,计算问题关键词与候选答案中词语的相似性,筛选出与问题关键词相似度较高的词语,从而提高了答案的获取效率。
附图说明
图1是本发明实施例公开的一种基于深度学习的答案抽取方法的流程示意图;
图2是本发明实施例公开的另一种基于深度学习的答案抽取方法的流程示意图;
图3是本发明实施例公开的一种基于深度学习的word2vec模型训练流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明针对用户提出的问题,在经过对问题的分类和关键词提取之后,利用关键词从文本库或基于网络搜索涉及问题的答案的碎片。利用知识抽取技术,根据给定本体从无语义标注的信息中识别并抽取与本体匹配的事实知识。利用深度学习技术,基于语料库,训练一种word2vec词向量模型,计算问题中关键词与从知识碎片中抽取到的关键词之间的相似度,从而找到与问题中关键词相似的词,再讲筛选得到的词代入问题中,并对句子进行句法分析,从而找到最符合问题的答案。
如图1所示是本发明实施例公开的一种基于深度学习的答案抽取方法的流程示意图;在图1所示的方法中,包括以下步骤:
S1:根据待回答问题中的关键词搜集与待回答问题的答案相关的知识碎片;
其中,根据问题中的关键词,可以基于solr搜索服务器,从本地文本库寻找支撑问题的证据。若本地数据库存储有该问题的证据,则直接返回支撑问题的证据。否则,需要利用搜索引擎从互联网上抓取与该问题相关的片段,并抽取出其中的正文作为该问题的支撑证据。
S2:基于待回答问题的类型,对知识碎片进行词性标注分析,将包含符合待回答问题的类型的知识碎片作为候选答案;
其中,如图2所示,在步骤S2之前,所述方法还包括:
根据关键词的重要程度对知识碎片进行打分,其中,关键词的重要程度越高,则知识碎片的分数越高,且关键词位于知识碎片所属标题中的重要程度高于位于知识碎片中的重要程度。
例如,若出现在标题中,则分数加2,若出现在证据碎片中,则分数加1,得到各个知识碎片的评分。
判断知识碎片的分数是否高于分数阈值,若高于分数阈值,则将知识碎片作为候选答案,并执行步骤S3;
若知识碎片的分数不高于分数阈值,则执行步骤S2。
S3:利用已训练的word2vec模型,计算关键词与候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
其中,对模型的训练包括:
采用结巴分词,将训练语料进行分词,可以空格或tab隔开;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
例如,在训练时输入命令为:
./word2vec-train corpus.txt-output vectors.bin-cbow 0-size 200-window5-negative 0-hs 1-sample 1e-3-threads 12-binary 1
上述命令表示的含义为:输入文件是corpus.txt,输出文件是vectors.bin,不使用cbow模型,默认为Skip-Gram模型。每个单词的向量维度是200,训练的窗口大小为5就是考虑一个词前五个和后五个词语(实际代码中还有一个随机选窗口的过程,窗口大小<=5)。不使用NEG方法,使用HS方法。-sampe指的是采样的阈值,如果一个词语在训练样本中出现的频率越大,那么就越会被采样。-binary为1指的是结果二进制存储,为0是普通存储(普通存储的时候是可以打开看到词语和对应的向量的)。
训练好模型之后,得到vectors.bin这个模型文件。vectors.bin这个文件就是文档中词语和其对应的向量,这个向量的维度即是训练时设置的参数大小。利用训练得到的模型,计算与问题关键词相似的词语。
如图3所示,将词w(t)所在的上下文中的词w(t-2),w(t-1),w(t+1),w(t+2)作为输入,而词w(t)本身作为输出,即达到通过一个上下文,能猜出这个词和它的意思的目的。通过在一个大的语料库训练,得到一个从输入层到隐含层的权重模型。第t个词的上下文词是w(t-2),w(t-1),w(t+1),w(t+2),那么w(t-2),w(t-1),w(t+1),w(t+2)作为输入,它们所在的词汇表中的位置的值置为1。然后,输出是t,把它所在的词汇表中的位置的值置为1。训练完成后,就得到了每个词到隐含层的每个维度的权重,就是每个词的词向量。
S4:将目标候选答案中的词语反代入到待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
通过步骤S4可以跨越句子表层句法结构的束缚,直接获取深层的语义信息,通过判断语义信息,对答案进行排序,得分最高的即为最准确答案。
在本发明的另一个方面,提供了一种基于深度学习的答案抽取***,其特征在于,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于深度学习的答案抽取方法,其特征在于,包括:
根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断所述知识碎片的分数是否高于分数阈值,若高于所述分数阈值,则将所述知识碎片作为候选答案,并执行所述利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
若所述知识碎片的分数不高于所述分数阈值,则执行所述基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
采用结巴分词,将训练语料进行分词;
将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
4.一种基于深度学习的答案抽取***,其特征在于,包括:
搜集模块,用于根据待回答问题中的关键词搜集与所述待回答问题的答案相关的知识碎片;
词性分析模块,用于基于所述待回答问题的类型,对所述知识碎片进行词性标注分析,将包含符合所述待回答问题的类型的知识碎片作为候选答案;
相似度计算模块,用于利用已训练的word2vec模型,计算所述关键词与所述候选答案中的知识碎片所包含的词语的相似度,找出满足相似度要求的词语作为目标候选答案;
目标答案确定模块,用于将所述目标候选答案中的词语反代入到所述待回答问题中得到若干个目标语句,对各目标语句进行语义依存分析,并通过判断各目标语句的语义信息,对各目标语句进行排序,将得分最高的目标语句作为目标答案。
5.根据权利要求4所述的***,其特征在于,所述***还包括:
评分模块,用于根据所述关键词的重要程度对所述知识碎片进行打分,其中,所述关键词的重要程度越高,则所述知识碎片的分数越高,且所述关键词位于所述知识碎片所属标题中的重要程度高于位于所述知识碎片中的重要程度;
判断模块,用于判断所述知识碎片的分数是否高于分数阈值;
判断执行模块,用于在所述知识碎片的分数高于所述分数阈值时,将所述知识碎片作为候选答案,并执行所述相似度计算模块的操作;在所述知识碎片的分数不高于所述分数阈值时,则执行所述词性分析模块的操作。
6.根据权利要求4或5所述的***,其特征在于,所述***还包括:
训练模块,用于采用结巴分词,将训练语料进行分词;将分好词的训练语料进行训练得到word2vec模型,其中,输入为由所有分词组成的输入文件,输出为词向量,每个单词的向量维度是M,训练的窗口大小为N,采样阈值为L。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710948835.3A CN107729468B (zh) | 2017-10-12 | 2017-10-12 | 基于深度学习的答案抽取方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710948835.3A CN107729468B (zh) | 2017-10-12 | 2017-10-12 | 基于深度学习的答案抽取方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107729468A true CN107729468A (zh) | 2018-02-23 |
CN107729468B CN107729468B (zh) | 2019-12-17 |
Family
ID=61211032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710948835.3A Expired - Fee Related CN107729468B (zh) | 2017-10-12 | 2017-10-12 | 基于深度学习的答案抽取方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107729468B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681564A (zh) * | 2018-04-28 | 2018-10-19 | 北京京东尚科信息技术有限公司 | 关键词和答案的确定方法、装置和计算机可读存储介质 |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
CN108804529A (zh) * | 2018-05-02 | 2018-11-13 | 深圳智能思创科技有限公司 | 一种基于Web的问答***实现方法 |
CN108932289A (zh) * | 2018-05-23 | 2018-12-04 | 北京华建蓝海科技有限责任公司 | 一种基于信息抽取和深度学习的问题回答处理方法及*** |
CN109062977A (zh) * | 2018-06-29 | 2018-12-21 | 厦门快商通信息技术有限公司 | 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和*** |
CN109492221A (zh) * | 2018-10-31 | 2019-03-19 | 广东小天才科技有限公司 | 一种基于语义分析的信息回复方法及可穿戴设备 |
CN109918560A (zh) * | 2019-01-09 | 2019-06-21 | 平安科技(深圳)有限公司 | 一种基于搜索引擎的问答方法和装置 |
CN110209782A (zh) * | 2018-09-25 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 问答模型及应答语句的生成方法、装置、介质和电子设备 |
CN111309878A (zh) * | 2020-01-19 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 检索式问答方法、模型训练方法、服务器及存储介质 |
CN111680135A (zh) * | 2020-04-20 | 2020-09-18 | 重庆兆光科技股份有限公司 | 一种基于隐式知识的阅读理解方法 |
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、***、设备及存储介质 |
CN113076466A (zh) * | 2021-02-26 | 2021-07-06 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113742469A (zh) * | 2021-09-03 | 2021-12-03 | 科讯嘉联信息技术有限公司 | 基于Pipeline处理和ES储存问答***构建方法 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
CN116886656A (zh) * | 2023-09-06 | 2023-10-13 | 北京小糖科技有限责任公司 | 面向聊天室的舞蹈知识推送方法及其装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160232441A1 (en) * | 2015-02-05 | 2016-08-11 | International Business Machines Corporation | Scoring type coercion for question answering |
CN106503123A (zh) * | 2016-10-20 | 2017-03-15 | 宁波江东大金佰汇信息技术有限公司 | 一种基于计算机云数据的深度学习智能应答*** |
CN106649786A (zh) * | 2016-12-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的答案检索方法及装置 |
CN106844741A (zh) * | 2017-02-13 | 2017-06-13 | 哈尔滨工业大学 | 一种面向特定领域的问题解答方法 |
-
2017
- 2017-10-12 CN CN201710948835.3A patent/CN107729468B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160232441A1 (en) * | 2015-02-05 | 2016-08-11 | International Business Machines Corporation | Scoring type coercion for question answering |
CN106503123A (zh) * | 2016-10-20 | 2017-03-15 | 宁波江东大金佰汇信息技术有限公司 | 一种基于计算机云数据的深度学习智能应答*** |
CN106649786A (zh) * | 2016-12-28 | 2017-05-10 | 北京百度网讯科技有限公司 | 基于深度问答的答案检索方法及装置 |
CN106844741A (zh) * | 2017-02-13 | 2017-06-13 | 哈尔滨工业大学 | 一种面向特定领域的问题解答方法 |
Non-Patent Citations (3)
Title |
---|
曹莉丽等: "融合词向量的多特征问句相似度计算方法研究", 《现代计算机(专业版)》 * |
王丽月等: "面向游戏客服场景的自动问答***研究与实现", 《计算机工程与应用》 * |
范桥青等: "面向健康问答社区的语义检索技术研究与分析", 《电子技术与软件工程》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108681564A (zh) * | 2018-04-28 | 2018-10-19 | 北京京东尚科信息技术有限公司 | 关键词和答案的确定方法、装置和计算机可读存储介质 |
CN108681564B (zh) * | 2018-04-28 | 2021-06-29 | 北京京东尚科信息技术有限公司 | 关键词和答案的确定方法、装置和计算机可读存储介质 |
CN108804529A (zh) * | 2018-05-02 | 2018-11-13 | 深圳智能思创科技有限公司 | 一种基于Web的问答***实现方法 |
CN108717441A (zh) * | 2018-05-16 | 2018-10-30 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
CN108717441B (zh) * | 2018-05-16 | 2023-01-17 | 腾讯科技(深圳)有限公司 | 问题模板所对应的谓词的确定方法及装置 |
CN108932289A (zh) * | 2018-05-23 | 2018-12-04 | 北京华建蓝海科技有限责任公司 | 一种基于信息抽取和深度学习的问题回答处理方法及*** |
CN108932289B (zh) * | 2018-05-23 | 2021-10-15 | 北京华健蓝海医疗科技有限责任公司 | 一种基于信息抽取和深度学习的问题回答处理方法及*** |
CN109062977A (zh) * | 2018-06-29 | 2018-12-21 | 厦门快商通信息技术有限公司 | 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和*** |
CN110209782A (zh) * | 2018-09-25 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 问答模型及应答语句的生成方法、装置、介质和电子设备 |
CN109492221A (zh) * | 2018-10-31 | 2019-03-19 | 广东小天才科技有限公司 | 一种基于语义分析的信息回复方法及可穿戴设备 |
CN109918560A (zh) * | 2019-01-09 | 2019-06-21 | 平安科技(深圳)有限公司 | 一种基于搜索引擎的问答方法和装置 |
CN109918560B (zh) * | 2019-01-09 | 2024-03-12 | 平安科技(深圳)有限公司 | 一种基于搜索引擎的问答方法和装置 |
CN111309878B (zh) * | 2020-01-19 | 2023-08-22 | 支付宝(杭州)信息技术有限公司 | 检索式问答方法、模型训练方法、服务器及存储介质 |
CN111309878A (zh) * | 2020-01-19 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 检索式问答方法、模型训练方法、服务器及存储介质 |
CN111680135B (zh) * | 2020-04-20 | 2023-08-25 | 重庆兆光科技股份有限公司 | 一种基于隐式知识的阅读理解方法 |
CN111680135A (zh) * | 2020-04-20 | 2020-09-18 | 重庆兆光科技股份有限公司 | 一种基于隐式知识的阅读理解方法 |
CN112749266B (zh) * | 2021-01-19 | 2023-03-21 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、***、设备及存储介质 |
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、***、设备及存储介质 |
CN113076466A (zh) * | 2021-02-26 | 2021-07-06 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113076466B (zh) * | 2021-02-26 | 2024-05-24 | 广东电网有限责任公司广州供电局 | 一种最佳答案和兴趣感知推荐方法 |
CN113742469A (zh) * | 2021-09-03 | 2021-12-03 | 科讯嘉联信息技术有限公司 | 基于Pipeline处理和ES储存问答***构建方法 |
CN116739003A (zh) * | 2023-06-01 | 2023-09-12 | 中国南方电网有限责任公司 | 电网管理智能问答实现方法、装置、电子设备及存储介质 |
CN116886656A (zh) * | 2023-09-06 | 2023-10-13 | 北京小糖科技有限责任公司 | 面向聊天室的舞蹈知识推送方法及其装置 |
CN116886656B (zh) * | 2023-09-06 | 2023-12-08 | 北京小糖科技有限责任公司 | 面向聊天室的舞蹈知识推送方法及其装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107729468B (zh) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729468A (zh) | 基于深度学习的答案抽取方法及*** | |
CN110765257B (zh) | 一种知识图谱驱动型的法律智能咨询*** | |
CN109189942B (zh) | 一种专利数据知识图谱的构建方法及装置 | |
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN106897559B (zh) | 一种面向多数据源的症状体征类实体识别方法及装置 | |
CN108664599B (zh) | 智能问答方法、装置、智能问答服务器及存储介质 | |
CN109388743B (zh) | 语言模型的确定方法和装置 | |
CN108681574A (zh) | 一种基于文本摘要的非事实类问答答案选择方法及*** | |
CN111783518A (zh) | 训练样本生成方法、装置、电子设备及可读存储介质 | |
CN103970733B (zh) | 一种基于图结构的中文新词识别方法 | |
CN104636465A (zh) | 网页摘要生成方法、展示方法及相应装置 | |
CN112559684A (zh) | 一种关键词提取及信息检索方法 | |
CN107679110A (zh) | 结合文本分类与图片属性提取完善知识图谱的方法及装置 | |
CN111967267B (zh) | 一种基于XLNet的新闻文本地域提取的方法及*** | |
CN112069312B (zh) | 一种基于实体识别的文本分类方法及电子装置 | |
CN113590810B (zh) | 摘要生成模型训练方法、摘要生成方法、装置及电子设备 | |
CN107943514A (zh) | 一种软件文档中核心代码元素的挖掘方法及*** | |
CN112256845A (zh) | 意图识别方法、装置、电子设备和计算机可读存储介质 | |
CN103886020A (zh) | 一种房地产信息快速搜索方法 | |
CN113282754A (zh) | 针对新闻事件的舆情检测方法、装置、设备和存储介质 | |
CN115713072A (zh) | 一种基于提示学习和上下文感知的关系类别推断***及方法 | |
Menezes et al. | Building a massive corpus for named entity recognition using free open data sources | |
CN110162651A (zh) | 基于语义内容摘要的新闻内容图文不符鉴别***及鉴别方法 | |
CN113486174A (zh) | 模型训练、阅读理解方法、装置、电子设备及存储介质 | |
CN107291685B (zh) | 语义识别方法和语义识别*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191217 Termination date: 20201012 |