CN110263051A - 用于问答***的问答对更新方法、装置、设备及存储介质 - Google Patents

用于问答***的问答对更新方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110263051A
CN110263051A CN201910501631.4A CN201910501631A CN110263051A CN 110263051 A CN110263051 A CN 110263051A CN 201910501631 A CN201910501631 A CN 201910501631A CN 110263051 A CN110263051 A CN 110263051A
Authority
CN
China
Prior art keywords
answer
target
question
corrigendum
answering system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910501631.4A
Other languages
English (en)
Inventor
岳聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen China Investment Co Ltd
Mobvoi Innovation Technology Co Ltd
Original Assignee
Chumen Wenwen Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chumen Wenwen Information Technology Co Ltd filed Critical Chumen Wenwen Information Technology Co Ltd
Priority to CN201910501631.4A priority Critical patent/CN110263051A/zh
Publication of CN110263051A publication Critical patent/CN110263051A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种用于问答***的问答对更新方法,包括:获得目标问题的更正后的目标答案;将目标问题和更正后的目标答案写入可编辑数据库,建立目标问题和更正后的目标答案的索引;以及基于索引,可编辑数据库向问答***提供目标问题的更正后的目标答案。本公开还提供了一种用于问答***的问答对更新装置、电子设备及可读存储介质。

Description

用于问答***的问答对更新方法、装置、设备及存储介质
技术领域
本公开涉及一种用于问答***的问答对更新方法、更新装置、电子 设备及可读存储介质。
背景技术
问答***(question answer system,简称QA),是用来回答用户输入或 提出的各种各样的问题。比如用户提问“中国的国土面积是多少”,QA系 统回答“960万平方公里”;用户提问“中国有多少人口”,QA***回答“13 亿”。
问答对(question answer pair or key value pair,简称KV对),是指已经 存储好的问题和答案对。比如:中国的国土面积是多少---960万平方公里, 中国有多少人口---13亿,这就是两个KV对。
现有技术中,问答***中回答出来的答案,有很大一部分是通过检 索问答对来得到的。当用户输入的query和存储的K之间的语义相似度 大于一个设定的阈值时,就把K对应的V当做该query的答案,返回给 用户。
现有的检索和KV更新方案中,新建索引需要至少10分钟的时间, 且每次手动***KV后需要再次手工点击更新url才能使线上生效。不能 保证线上实时热更新。
当对问答***的实时纠错能力要求高的时候,比如在特定的产品线, 如儿童问答、客服等,期望对于一个用户问的问题,如果回答错了,问 答***能立刻补充上正确的答案。这样其他的用户就能够得到满意的回 答。所以需要一个问答对实时更新的机制。
发明内容
为了解决上述技术问题中的至少一个,本公开提供了一种用于问答 ***的问答对更新方法、更新装置、电子设备及可读存储介质。
根据本公开的一个方面,一种用于问答***的问答对更新方法, 包括:获得目标问题的更正后的目标答案;将目标问题和更正后的目 标答案写入可编辑数据库,建立目标问题和更正后的目标答案的索引; 以及基于索引,可编辑数据库向问答***提供目标问题的更正后的目 标答案。
根据本公开的至少一个实施方式,可编辑数据库至少包括第一子 数据库和第二子数据库;目标问题和更正后的目标答案被实时地写入 到第一子数据库;对于目标问题,第一子数据库和第二子数据库采用 不同的匹配策略。
根据本公开的至少一个实施方式,目标问题和更正后的目标答案 被非实时地写入到第二子数据库。
根据本公开的至少一个实施方式,可编辑数据库至少包括第一子 数据库、第二子数据库和第三子数据库;目标问题和更正后的目标答 案被实时地写入到第一子数据库和第二子数据库;对于目标问题,第 一子数据库、第二子数据库和第三子数据库采用的匹配策略均不相同。
根据本公开的至少一个实施方式,目标问题和更正后的目标答案 被非实时地写入到第三子数据库。
根据本公开的至少一个实施方式,在获得目标问题的更正后的目 标答案之前,还包括:发现目标问题的错误的目标答案。
根据本公开的至少一个实施方式,发现目标问题的错误的目标答 案,包括:基于目标问题和目标答案之间的语义相似度来判断目标答 案是否为错误的目标答案。
根据本公开的至少一个实施方式,当问答***重启时,问答*** 从可编辑数据库和问答***自身的问答对数据库读取问答对。
根据本公开的至少一个实施方式,获得目标问题的更正后的目标 答案,包括:基于语义相似度对目标问题的目标答案进行更正。
根据本公开的另一方面,一种用于问答***的问答对更新装置, 其特征在于,包括:获取装置,获取装置用于获得目标问题的更正后 的目标答案;处理装置,处理装置将目标问题和更正后的目标答案写 入可编辑数据库,建立目标问题和更正后的目标答案的索引;以及, 可编辑数据库,可编辑数据库基于索引向问答***提供目标问题的更 正后的目标答案。
根据本公开的又一方面,一种电子设备,包括:存储器,存储器 存储计算机执行指令;以及处理器,处理器执行存储器存储的计算机 执行指令,使得处理器执行上述的方法。
根据本公开的再一方面,一种可读存储介质,可读存储介质中存 储有计算机执行指令,计算机执行指令被处理器执行时用于实现上述 的方法。
附图说明
附图示出了本公开的示例性实施方式,并与其说明一起用于解释本 公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且 附图包括在本说明书中并构成本说明书的一部分。
图1是根据本公开一个实施方式的用于问答***的问答对更新方法 的示意性流程图。
图2是根据本公开又一个实施方式的用于问答***的问答对更新方 法的示意性流程图。
图3是根据本公开又一个实施方式的用于问答***的问答对更新方 法的示意性流程图。
图4是根据本公开又一个实施方式的用于问答***的问答对更新方 法的示意性流程图。
图5是根据本公开一个实施方式的用于问答***的问答对更新装置 的示意性框图。
图6是根据本公开又一个实施方式的用于问答***的问答对更新装 置的示意性框图。
图7是根据本公开又一个实施方式的用于问答***的问答对更新装 置的示意性框图。
图8是根据本公开又一个实施方式的用于问答***的问答对更新装 置的示意性框图。
图9是根据本公开一个实施方式的电子设备的示意性视图。
具体实施方式
下面结合附图和实施方式对本公开作进一步的详细说明。可以理解 的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开 的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公 开相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方 式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明 本公开。
图1是本公开一个实施方式的用于问答***的问答对更新方法, 包括:S11、获得目标问题的更正后的目标答案;S12、将目标问题和 更正后的目标答案写入可编辑数据库,建立目标问题和更正后的目标 答案的索引;以及S13、基于索引,可编辑数据库向问答***提供目 标问题的更正后的目标答案。
例如用户使用问答***提出一个问题“中国的国土面积是多少”, 问答***给出的目标答案是“13亿”,则对于本实施方式的问答对更 新方法,需要获得目标问题的更正后的目标答案即“960万平方公里”。 将目标问题“中国的国土面积是多少”和更正后的目标答案“960万平 方公里”写入可编辑数据库,建立“中国的国土面积是多少”和“960 万平方公里”的索引,当其他用户再次使用问题***提出“中国的国 土面积是多少”这一目标问题时,可编辑数据库向问答***提供更正 后的目标答案即“960万平方公里”,也即问答***从可编辑数据库读 取更正后的目标答案。其中,可编辑数据库优选mySQL数据库。优 选地,目标问题和目标答案的索引具有全局唯一性。优选地,获得目 标问题的更正后的目标答案,可以通过获取经过人员编辑的目标答案 来实现,也可以通过向经过机器学习算法训练的语义相似度模型获取 正确的目标答案来实现。
现有技术中的语义相似度模型一般通过计算词语之间的距离,再 转换为相似度。而语义之间的距离,例如可以通过大量的语料库进行 统计,这种方法主要将上下文信息的概率分布作为词汇语义相似度的 参照依据,其利用大规模语料库,将词语的上下文信息作为语义相似 度计算的参照依据。基于统计的定量分析方法能够对词汇间的语义相 似性进行比较精确和有效的度量,当然本领域技术人员还可以通过本 体或分类关系计算词语语义距离,这些均属于现有技术,不再赘述。
问答***(Question Answering System,QA)是信息检索***的一种 高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的 问题。问答***以自然语言理解技术为核心,使得计算机能够理解用 户的谈话内容,实现人与计算机之间的有效交流沟通。例如在计算机 客服***中普遍采用的聊天机器人***就是一种问答***,它是一种通过自然语言技术,能够自动与用户对话的人工智能***。现有技术 中已经发展出多种类型的问答***,在此不再赘述。本实施方式对问 答对更新方法应用的问答***不做特别限定。
mySQL是一种关系型数据库管理***,关系数据库将数据保存在 不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速 度并提高了灵活性。本公开并不对可编辑数据库的类型做特别限定, 本领域技术人员在本公开的启示下,可以选用其他类型的可编辑数据 库。
图2是本公开一个实施方式的用于问答***的问答对更新方法, 包括:S21、发现目标问题的错误的目标答案;S22、获得目标问题的 更正后的目标答案;S23、将目标问题和更正后的目标答案写入可编辑 数据库,建立目标问题和更正后的目标答案的索引;以及S24、基于 索引,可编辑数据库向问答***提供目标问题的更正后的目标答案。
发现目标问题的错误的目标答案,本实施方式中优选地,基于目 标问题和目标答案之间的语义相似度来判断目标答案是否为错误的目 标答案。优选地,采用经过机器学习算法训练的语义相似度模型来判 断目标答案是否为错误的目标答案。机器学习算法是可以从数据中学 习并从中改进的算法,无需人工干预。学习任务可能包括将输入映射 到输出,在未标记的数据中学习隐藏的结构,或者“基于实例的学习”, 其中通过将新实例与来自存储在存储器中的训练数据的实例进行比较 来为新实例生成类标签。
机器学习算法主要分为三大类:监督学习算法、无监督学习算法 和强化学习算法。其中,监督学习算法使用标记的训练数据来学习从 输入变量(X)到输出变量(Y)的映射函数,典型的监督学习算法例 如线性回归算法、Logistic回归算法、CART算法、朴素贝叶斯算法等; 无监督学习算法只有输入变量(X),但没有相应的输出变量,它使用 无标签的训练数据来模拟数据的基本结构,典型的无监督学习算法例 如Apriori算法、K-means算法、PCA算法等;强化学习算法按照给定 条件,可分为基于模式的强化学习算法和无模式强化学习算法,以及 主动强化学习算法和被动强化学习算法。
本实施方式中对使用的机器学习算法类型并不做特别限定,只要 本领域技术人员能够将其用来训练语义相似度模型,使得语义相似度 模型能够判断目标答案是否为错误的目标答案即可。
图3是本公开一个实施方式的用于问答***的问答对更新方法, 包括:S31、获得目标问题的更正后的目标答案;S32、将目标问题和 更正后的目标答案实时写入可编辑数据库的第一子数据库,建立目标 问题和更正后的目标答案的索引;以及S33、基于索引,可编辑数据 库向问答***提供目标问题的更正后的目标答案。
其中,可编辑数据库包括第一子数据库和第二子数据库;目标问 题和更正后的目标答案被实时地写入到第一子数据库;对于目标问题, 第一子数据库和第二子数据库采用不同的匹配策略。目标问题和更正 后的目标答案被非实时地写入到第二子数据库。本实施方式中,优选 地,可编辑数据库实时向问答***提供目标问题的更正后的目标答案。 例如,mySQL数据库配置有完全匹配库和模糊匹配库,本领域技术人 员应当理解,对于目标问题,完全匹配库和模糊匹配库采用的匹配策 略不同。本实施方式中,完全匹配只做精确匹配,即目标问题与完全 匹配库中存储的问题有一个字不一样也不能匹配上,但相应的,完全 匹配库在增加新的问答对(即KV对)时的速度特别快,一般1ms以 内就能新增KV对完毕。一般地,完全匹配库可以匹配到大约20%的 目标问题。模糊匹配虽然能匹配大约80%的目标问题,但是模糊匹配 库新增KV对的速度要慢于完全匹配库。
图4是本公开一个实施方式的用于问答***的问答对更新方法, 包括:S41、获得目标问题的更正后的目标答案;S42、将目标问题和 更正后的目标答案实时写入可编辑数据库的第一子数据库和第二子数 据库,建立目标问题和更正后的目标答案的索引;以及S43、基于索 引,可编辑数据库向问答***提供目标问题的更正后的目标答案。
其中,可编辑数据库包括第一子数据库、第二子数据库和第三子 数据库;目标问题和更正后的目标答案被实时地写入到第一子数据库 和第二子数据库;对于目标问题,第一子数据库、第二子数据库和第 三子数据库采用不同的匹配策略。目标问题和更正后的目标答案被非 实时地写入到第三子数据库。本实施方式中,优选地,可编辑数据库 实时向问答***提供目标问题的更正后的目标答案。例如,mySQL数 据库配置有完全匹配库、简单模糊匹配库和复杂模糊匹配库,本领域 技术人员应当理解,对于目标问题,完全匹配库、简单模糊匹配库、 复杂模糊匹配库采用的匹配策略不同。本实施方式中,完全匹配只做 精确匹配,即目标问题与完全匹配库中存储的问题有一个字不一样也 不能匹配上,与前面一个实施方式的匹配策略相同,不再赘述。
对于简单模糊匹配库,新增KV对时,需计算目标问题的计算机 表示,如目标问题的拼音,在匹配时计算目标问题的拼音和已经存储 的问题的拼音的编辑距离;再例如,新增KV对时,计算目标问题的 embedding向量,在匹配时,计算目标问题的embedding和已经存储 的问题的embedding的余弦距离等。一般地,简单模糊匹配库新增KV 对可以在500ms以内完成,并可以匹配到大约80%的目标问题。
对于复杂模糊匹配库,新增KV对时,需要进行例如建立倒排索 引等需要全局KV数据库计算的操作,往往需要10分钟左右。复杂模 糊匹配库可以匹配到大约80%的目标问题。
其中,全局KV数据库包括上述可编辑数据库和问答***自身的 问答对数据库。当问答***重启时,问答***从可编辑数据库和问答 ***自身的问答对数据库读取问答对。
根据本公开的另一方面,本公开还提供了一种用于问答***的问 答对更新装置,图5示出了本公开一个实施方式的用于问答***的问 答对更新装置100,问答对更新装置100包括:获取装置101,获取装 置101用于获得目标问题的更正后的目标答案;处理装置102,处理 装置102将目标问题和更正后的目标答案写入可编辑数据库103,建 立目标问题和更正后的目标答案的索引;以及可编辑数据库103,可 编辑数据库103基于索引向问答***提供目标问题的更正后的目标答 案。
优选地,获得目标问题的更正后的目标答案,获取装置101可以 通过获取经过人员编辑的目标答案来实现,获取装置101也可以通过 向经过机器学习算法训练的语义相似度模型获取正确的目标答案来实 现。
对于本实施方式中的获取装置101和处理装置102可以同时被包 括在问答***中;也可以是获取装置101和处理装置102中的一个被 包括在问答***中;还可以是获取装置101和处理装置102均不被包 括在问答***中,但是获取装置101和处理装置102能够与问答*** 通信连接。作为优选地实施方式,可编辑数据库103不被包括在问答 ***中,问答***能够从可编辑数据库103中读取数据。
图6示出了本公开一个实施方式的用于问答***的问答对更新装 置200,问答对更新装置200包括:判断装置204,判断装置204用于 发现目标问题的错误的目标答案;获取装置201,获取装置201用于 获得目标问题的更正后的目标答案;处理装置202,处理装置202将 目标问题和更正后的目标答案写入可编辑数据库203,建立目标问题 和更正后的目标答案的索引;以及可编辑数据库203,可编辑数据库 203基于索引向问答***提供目标问题的更正后的目标答案。优选地, 判断装置204基于目标问题和目标答案之间的语义相似度来判断目标 答案是否为错误的目标答案。判断装置204例如采用经过机器学习算 法训练的语义相似度模型来判断目标答案是否为错误的目标答案。
优选地,获得目标问题的更正后的目标答案,获取装置201可以 通过获取经过人员编辑的目标答案来实现,获取装置201也可以通过 向经过机器学习算法训练的语义相似度模型获取正确的目标答案来实 现。
对于本实施方式中的判断装置204、获取装置201和处理装置202 可以同时被包括在问答***中;也可以是判断装置204、获取装置201 和处理装置202中的一个或两个被包括在问答***中;还可以是判断 装置204、获取装置201和处理装置202均不被包括在问答***中, 但是判断装置204、获取装置201和处理装置202能够与问答***通 信连接。作为优选地实施方式,可编辑数据库203不被包括在问答系 统中,问答***能够从可编辑数据库203中读取数据。
图7示出了本公开一个实施方式的用于问答***的问答对更新装 置300,问答对更新装置300包括:获取装置301,获取装置301用于 获得目标问题的更正后的目标答案;处理装置302,处理装置302将 目标问题和更正后的目标答案写入可编辑数据库303,建立目标问题 和更正后的目标答案的索引;以及可编辑数据库303,可编辑数据库 303基于索引向问答***提供目标问题的更正后的目标答案。
其中,可编辑数据库303包括第一子数据库3031和第二子数据库 3032;目标问题和更正后的目标答案被实时地写入到第一子数据库 3031;对于目标问题,第一子数据库3031和第二子数据库3032采用 不同的匹配策略。目标问题和更正后的目标答案被非实时地写入到第 二子数据库3032。本实施方式中,优选地,可编辑数据库303实时向 问答***提供目标问题的更正后的目标答案。例如,mySQL数据库配 置有完全匹配库(第一子数据库3031的示例)和模糊匹配库(第二子 数据库3032的示例),本领域技术人员应当理解,对于目标问题,完 全匹配库和模糊匹配库采用的匹配策略不同。本实施方式中,完全匹 配只做精确匹配,即目标问题与完全匹配库中存储的问题有一个字不 一样也不能匹配上,但相应的,完全匹配库在增加新的问答对(即KV 对)时的速度特别快,一般1ms以内就能新增KV对完毕。一般地, 完全匹配库可以匹配到大约20%的目标问题。模糊匹配虽然能匹配大 约80%的目标问题,但是模糊匹配库新增KV对的速度要慢于完全匹 配库。
优选地,可编辑数据库303与问答***配置在不同的服务器上, 相应的,可编辑数据库303与问答***自身的问答对数据库配置在不 同的服务器上,例如可编辑数据库303可以配置在云服务器上。
对于本实施方式中的获取装置301和处理装置302可以同时被包 括在问答***中;也可以是获取装置301和处理装置302中的一个被 包括在问答***中;还可以是获取装置301和处理装置302均不被包 括在问答***中,但是获取装置301和处理装置302能够与问答*** 通信连接。作为优选地实施方式,可编辑数据库303不被包括在问答 ***中,问答***能够从可编辑数据库303中读取数据。
图8示出了本公开一个实施方式的用于问答***的问答对更新装 置400,问答对更新装置400包括:获取装置401,获取装置401用于 获得目标问题的更正后的目标答案;处理装置402,处理装置402将 目标问题和更正后的目标答案写入可编辑数据库403,建立目标问题 和更正后的目标答案的索引;以及可编辑数据库403,可编辑数据库 403基于索引向问答***提供目标问题的更正后的目标答案。
其中,可编辑数据库403包括第一子数据库4031、第二子数据库 4032和第三子数据库4033;目标问题和更正后的目标答案被实时地写 入到第一子数据库4031和第二子数据库4032;对于目标问题,第一 子数据库4031、第二子数据库4032和第三子数据库4033采用不同的 匹配策略。目标问题和更正后的目标答案被非实时地写入到第三子数 据库4033。
本实施方式中,优选地,可编辑数据库403实时向问答***提供 目标问题的更正后的目标答案。例如,mySQL数据库配置有完全匹配 库(第一子数据库4031的示例)、简单模糊匹配库(第二子数据库4032 的示例)和复杂模糊匹配库(第三子数据库4033的示例),本领域技 术人员应当理解,对于目标问题,完全匹配库、简单模糊匹配库、复 杂模糊匹配库采用的匹配策略不同。本实施方式中,完全匹配只做精 确匹配,即目标问题与完全匹配库中存储的问题有一个字不一样也不 能匹配上,与前面一个实施方式的匹配策略相同,不再赘述。
对于简单模糊匹配库,新增KV对时,需计算目标问题的计算机 表示,如目标问题的拼音,在匹配时计算目标问题的拼音和已经存储 的问题的拼音的编辑距离;再例如,新增KV对时,计算目标问题的 embedding向量,在匹配时,计算目标问题的embedding和已经存储 的问题的embedding的余弦距离等。一般地,简单模糊匹配库新增KV 对可以在500ms以内完成,并可以匹配到大约80%的目标问题。
对于复杂模糊匹配库,新增KV对时,需要进行例如建立倒排索 引等需要全局KV数据库计算的操作,往往需要10分钟左右。复杂模 糊匹配库可以匹配到大约80%的目标问题。
其中,全局KV数据库包括上述可编辑数据库403和问答***自 身的问答对数据库。当问答***重启时,问答***从可编辑数据库403 和问答***自身的问答对数据库读取问答对。
对于本实施方式中的获取装置401和处理装置402可以同时被包 括在问答***中;也可以是获取装置401和处理装置402中的一个被 包括在问答***中;还可以是获取装置401和处理装置402均不被包 括在问答***中,但是获取装置401和处理装置402能够与问答*** 通信连接。作为优选地实施方式,可编辑数据库403不被包括在问答 ***中,问答***能够从可编辑数据库403中读取数据。
本公开还提供一种电子设备,如图9所示,该设备包括:通信接口 1000、存储器2000和处理器3000。通信接口1000用于与外界设备进行 通信,进行数据交互传输。存储器2000内存储有可在处理器3000上运 行的计算机程序。处理器3000执行所述计算机程序时实现上述实施方式 中方法。所述存储器2000和处理器3000的数量可以为一个或多个。
存储器2000可以包括高速RAM存储器,也可以还包括非易失性存 储器(non-volatile memory),例如至少一个磁盘存储器。
如果通信接口1000、存储器2000及处理器3000独立实现,则通信 接口1000、存储器2000及处理器3000可以通过总线相互连接并完成相 互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展 工业标准体系结构(EISA,Extended IndustryStandard Component)总线 等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示, 该图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口1000、存储器2000、及处理 器3000集成在一块芯片上,则通信接口1000、存储器2000、及处理器 3000可以通过内部接口完成相互间的通信。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解 为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执 行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围 包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及 的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开 的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的 各个方法和处理。例如,本公开中的方法实施方式可以被实现为软件程 序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中, 软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或 安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述 的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以 通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之 一。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体 实现在任何可读存储介质中,以供指令执行***、装置或设备(如基于计 算机的***、包括处理器的***或其他可以从指令执行***、装置或设 备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设 备而使用。
就本说明书而言,“可读存储介质”可以是任何可以包含、存储、通 信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执 行***、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷 尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携 式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可 擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式 只读存储器(CDROM)。另外,可读存储介质甚至可以是可在其上打印所 述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行 光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以 电子方式获得所述程序,然后将其存储在存储器中。
应当理解,本公开的各部分可以用硬件、软件或它们的组合来实现。 在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的 指令执行***执行的软件来实现。例如,如果用硬件来实现,和在另一 实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合 来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电 路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA), 现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施方式方法的全部 或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存 储于一种可读存储介质中,该程序在执行时,包括方法实施方式的步骤 之一或其组合。
此外,在本公开各个实施方式中的各功能单元可以集成在一个处理 模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元 集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可 以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块 的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读存 储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施方式/方式”、“一些实施方 式/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施 方式/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的 至少一个实施方式/方式或示例中。在本说明书中,对上述术语的示意性 表述不必须针对的是相同的实施方式/方式或示例。而且,描述的具体特 征、结构、材料或者特点可以在任一个或多个实施方式/方式或示例中以 合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可 以将本说明书中描述的不同实施方式/方式或示例以及不同实施方式/方 式或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗 示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第 一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请 的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明 确具体的限定。
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明 本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员 而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化 或变型仍处于本公开的范围内。

Claims (10)

1.一种用于问答***的问答对更新方法,其特征在于,包括:
获得目标问题的更正后的目标答案;
将所述目标问题和所述更正后的目标答案写入可编辑数据库,建立所述目标问题和所述更正后的目标答案的索引;以及
基于所述索引,所述可编辑数据库向所述问答***提供所述目标问题的所述更正后的目标答案。
2.根据权利要求1所述的问答对更新方法,其特征在于,所述可编辑数据库至少包括第一子数据库和第二子数据库;所述目标问题和所述更正后的目标答案被实时地写入到所述第一子数据库;对于目标问题,所述第一子数据库和第二子数据库采用不同的匹配策略。
3.根据权利要求2所述的问答对更新方法,其特征在于,所述目标问题和所述更正后的目标答案被非实时地写入到所述第二子数据库。
4.根据权利要求1至3中任一项所述的问答对更新方法,其特征在于,在获得目标问题的更正后的目标答案之前,还包括:发现所述目标问题的错误的目标答案。
5.根据权利要求4所述的问答对更新方法,其特征在于,发现所述目标问题的错误的目标答案,包括:基于所述目标问题和目标答案之间的语义相似度来判断所述目标答案是否为错误的目标答案。
6.根据权利要求1至3中任一项所述的问答对更新方法,其特征在于,当所述问答***重启时,所述问答***从所述可编辑数据库和问答***自身的问答对数据库读取问答对。
7.根据权利要求1至6中任一项所述的问答对更新方法,其特征在于,获得目标问题的更正后的目标答案,包括:基于语义相似度对所述目标问题的目标答案进行更正。
8.一种用于问答***的问答对更新装置,其特征在于,包括:
获取装置,所述获取装置用于获得目标问题的更正后的目标答案;
处理装置,所述处理装置将所述目标问题和所述更正后的目标答案写入可编辑数据库,建立所述目标问题和所述更正后的目标答案的索引;以及
可编辑数据库,所述可编辑数据库基于所述索引向所述问答***提供所述目标问题的所述更正后的目标答案。
9.一种电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;以及
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如权利要求1至7中任一项所述的方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的方法。
CN201910501631.4A 2019-06-11 2019-06-11 用于问答***的问答对更新方法、装置、设备及存储介质 Pending CN110263051A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910501631.4A CN110263051A (zh) 2019-06-11 2019-06-11 用于问答***的问答对更新方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910501631.4A CN110263051A (zh) 2019-06-11 2019-06-11 用于问答***的问答对更新方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110263051A true CN110263051A (zh) 2019-09-20

Family

ID=67917571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910501631.4A Pending CN110263051A (zh) 2019-06-11 2019-06-11 用于问答***的问答对更新方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110263051A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互***和方法
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答***实现方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN105912697A (zh) * 2016-04-25 2016-08-31 北京光年无限科技有限公司 一种对话***知识库的优化方法及装置
CN105917334A (zh) * 2014-01-14 2016-08-31 微软技术许可有限责任公司 搜索结果中的相干问题回答
US20170103069A1 (en) * 2015-10-13 2017-04-13 International Business Machines Corporation Supplementing candidate answers
CN106874441A (zh) * 2017-02-07 2017-06-20 腾讯科技(上海)有限公司 智能问答方法和装置
CN108108426A (zh) * 2017-12-15 2018-06-01 杭州网蛙科技有限公司 自然语言提问的理解方法、装置及电子设备
US10019434B1 (en) * 2012-06-01 2018-07-10 Google Llc Resolving pronoun ambiguity in voice queries
CN109145092A (zh) * 2017-06-15 2019-01-04 阿里巴巴集团控股有限公司 一种数据库更新、智能问答管理方法、装置及其设备
CN109815321A (zh) * 2018-12-26 2019-05-28 出门问问信息科技有限公司 问答方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互***和方法
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答***实现方法
US10019434B1 (en) * 2012-06-01 2018-07-10 Google Llc Resolving pronoun ambiguity in voice queries
CN105917334A (zh) * 2014-01-14 2016-08-31 微软技术许可有限责任公司 搜索结果中的相干问题回答
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
US20170103069A1 (en) * 2015-10-13 2017-04-13 International Business Machines Corporation Supplementing candidate answers
CN105912697A (zh) * 2016-04-25 2016-08-31 北京光年无限科技有限公司 一种对话***知识库的优化方法及装置
CN106874441A (zh) * 2017-02-07 2017-06-20 腾讯科技(上海)有限公司 智能问答方法和装置
CN109145092A (zh) * 2017-06-15 2019-01-04 阿里巴巴集团控股有限公司 一种数据库更新、智能问答管理方法、装置及其设备
CN108108426A (zh) * 2017-12-15 2018-06-01 杭州网蛙科技有限公司 自然语言提问的理解方法、装置及电子设备
CN109815321A (zh) * 2018-12-26 2019-05-28 出门问问信息科技有限公司 问答方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈阳: "互联网"人肉搜索"在公安工作中的创新运用", 《江苏警官学院学报》 *

Similar Documents

Publication Publication Date Title
US11816438B2 (en) Context saliency-based deictic parser for natural language processing
CN108446286B (zh) 一种自然语言问句答案的生成方法、装置及服务器
Stefik Introduction to knowledge systems
Patel et al. Systems, design, and entrepreneurial thinking: Comparative frameworks
Norton et al. Introductory concepts in information science
CN109919316A (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
JP2020071869A (ja) 動画基盤求人求職マッチングサーバーおよび方法
CN105989088A (zh) 数字化环境下的学习装置
Cowen et al. How to learn and teach economics with large language models, including GPT
CN113871020B (zh) 一种基于ai机器学习的急危重症诊后健康管理方法及***
CN109783624A (zh) 基于知识库的答案生成方法、装置和智能会话***
CN112015896B (zh) 基于人工智能的情感分类方法、以及装置
CN111339285B (zh) 基于bp神经网络的企业简历筛选方法和***
CN112507095A (zh) 基于弱监督学习的信息识别方法及相关设备
CN112685550A (zh) 智能问答方法、装置、服务器及计算机可读存储介质
CN112463986A (zh) 信息存储的方法及装置
CN111552796A (zh) 组卷方法、电子设备及计算机可读介质
CN117556802B (zh) 一种基于大语言模型的用户画像方法、装置、设备及介质
Pillai et al. Using historical methods to improve abduction and inference to the best explanation in strategy
Banasiewicz Organizational learning in the Age of Data
CN110263051A (zh) 用于问答***的问答对更新方法、装置、设备及存储介质
CN110222186A (zh) 叠字类问题处理方法、处理装置、设备及存储介质
Shedlock et al. Indigeneity and technology: Assigning Indigenous properties to the agent-based IT artefact ensemble
CN112102304A (zh) 图像处理方法、装置、计算机设备和计算机可读存储介质
US11501259B2 (en) Training an avatar to assist a user in career advancement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211118

Address after: 210034 floor 8, building D11, Hongfeng Science Park, Nanjing Economic and Technological Development Zone, Jiangsu Province

Applicant after: New Technology Co.,Ltd.

Applicant after: VOLKSWAGEN (CHINA) INVESTMENT Co.,Ltd.

Address before: 100094 1001, 10th floor, office building a, 19 Zhongguancun Street, Haidian District, Beijing

Applicant before: MOBVOI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190920

RJ01 Rejection of invention patent application after publication