CN110019719B

CN110019719B - 基于断言的问答

Info

Publication number: CN110019719B
Application number: CN201711354191.1A
Authority: CN
Inventors: 唐都钰; 段楠; 周明; 王文迪; 姜大昕; 刘树杰; 寿林钧; 公明
Original assignee: Microsoft Technology Licensing LLC
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2023-04-25
Anticipated expiration: 2037-12-15
Also published as: US20200356556A1; CN110019719A; US11327971B2; WO2019118257A1

Abstract

在本文所描述的主题的实施例中，提出了一种基于断言的问答方式。在获得问题以及相关文章之后，根据文章的内容来确定针对该问题的断言回答，其中断言回答具有预定结构并且表示完整的语义。然后，可以向用户输出针对该问题的断言回答。在根据本文所描述的主题的实施例中，使用问题和相关文章作为输入，并且输出半结构化的断言回答。根据本文所描述的主题的实施例的断言回答能够提供比传统的短回答更丰富的语义内容，并且提供比传统的长回答更简洁的表达，由此提升了用户体验同时保证了回答的准确性。

Description

基于断言的问答

背景技术

自动问答(QA)是指用户以自然语言的方式提出问题，计算设备或服务器根据对问题的分析，从各种资源中找出准确的回答。例如，自动问答***可以包括问题分析、信息检索以及回答抽取等过程。通常，自动问答***可以预先收集大量信息和数据，并且以问题-回答对的方式进行存储。当接收到用户提出的问题之后，可以查询问答对以获得针对该问题的回答。

目前，对于自动问答的主要研究集中在开放领域问答(Open-OA)，所谓开放领域问答，是指不限定问答的类型和回答的出处。通常，开放领域问答通过开放式信息抽取(Open-IE)来实现。开放式信息抽取是指不需要预先定义的词典，就可以根据关系短语和相关的上下文，从任意文本的任意句子中抽取具有预定结构的关系元组。由于可以预先定义待抽取的元组的结构，因而开放式信息抽取可以不需要任何训练数据。一般来说，单纯的开放式信息抽取不涉及问题，所以是问题未知的，而自动问答是基于问题的，因而是问题已知的。

发明内容

提供发明内容部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本文所描述的主题的关键特征或主要特征，也无意限制本文所描述的主题的范围。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：

图1示出了其中可以实施本文所描述的主题的一个或多个实施例的计算设备/服务器的框图；

图2示出了其中可以实施本文所描述的主题的用于基于断言的问答的方法的流程图；

图3A-3B示出了根据本文所描述的主题的实施例的用于基于断言的问答的图形用户界面(GUI)的示图；

图4示出了根据本文所描述的主题的实施例的用于构建并且使用断言回答语料库的框图；

图5示出了根据本文所描述的主题的实施例的断言回答语料库中的示例数据结构的示图；

图6示出了根据本文所描述的主题的实施例的用于生成断言回答的示意图；

图7示出了根据本文所描述的主题的实施例的用于抽取断言回答的方法的流程图；以及

图8示出了根据本文所描述的主题的实施例的所生成的断言回答与所抽取的断言回答的比较的示图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

传统的问答***提供的回答通常具有两种形式。第一种形式是长回答(例如一个段落或者几个句子)，其是通过信息检索而获得的较长相关内容。第二种形式是短回答(例如词语或短语)，其是通过问答***对于问答的理解而提供的较短相关内容。例如，对于某个特定问题“who killed JFK”，第一种形式的回答可以是“A ten-month investigationfrom November 1963to September 1964by the Warren Commission concluded thatKennedy was assassinated by Lee Harvey Oswald,acting alone,and that Jack Rubyalso acted alone when he killed Oswald before he could stand trial”，回答的篇幅较长，用户需要花费大量时间进行阅读；而第二种形式的回答可以是“Lee HarveyOswald”，回答的篇幅太短，只有一个人名，不能表达完整的语义。

由此可见，传统的问答***提供的回答要么太长要么太短，太长的回答给用户造成阅读负担(例如用户可能为此多花费好长时间)，而太短的回答会造成用户无法理解(例如用户可能没有理解回答的词语或短语所指代的含义)。因此，传统的问答***所提供的用户体验不够好。

为此，在本文所描述的主题的实施例中，提出了一种基于断言的问答方式。在获得问题以及相关文章之后，根据文章的内容来确定针对该问题的断言回答，其中断言回答具有预定结构并且表示完整的语义。仍然参考上文的示例问题“who killed JFK”，根据本文所描述的主题的实施例提供的回答可以是“Kennedy was assassinated by Lee HarveyOswald”，其具有完整的语义和简洁的表示，并且其可以通过这样的预定结构<Kennedy；wasassassinated；by Lee Harvey Oswald>被表示。因此，根据本文所描述的主题的实施例的断言回答能够提供比传统的短回答更丰富的语义内容，并且提供比传统的长回答更简洁的表达，由此提升了用户体验同时保证了回答的准确性。换句话说，本文所描述的主题的实施例通过对文章内容的深度理解来提供完整且简洁的回答。

此外，根据本文所描述的主题的实施例，可以从搜索引擎获得问题和相关文章，因而根据本文所描述的主题的实施例可以与搜索引擎一起使用，或者也可以作为搜索引擎的一个附加功能。另外，可以使用分级解码器首先生成断言回答的结构(例如字段)，然后生成每个字段中的词语，从而提高回答的可读性。而且，也可以使用人工标注的断言回答语料库来训练回答模型，以便提高回答的准确性。由于根据本文所描述的主题的实施例的断言回答具有完整的语义和简洁的表示，因而其适合于支持语音控制的音频输出装置(例如智能音箱)的问答场景。

以下参考图1至图8来说明本公开的基本原理和若干示例实现方式。图1示出了其中可以实施本公开的一个或多个实施例的计算设备/服务器100的框图。应当理解，图1所示出的计算设备/服务器100仅仅是示例性的，而不应当构成对本文所描述的实施例的功能和范围的任何限制。

如图1所示，计算设备/服务器100是通用计算设备的形式。计算设备/服务器100的组件可以包括但不限于一个或多个处理器或处理单元110、存储器120、存储设备130、一个或多个通信单元140、一个或多个输入设备150以及一个或多个输出设备160。处理单元110可以是实际或虚拟处理器并且能够根据存储器120中存储的持续来执行各种处理。在多处理器***中，多个处理单元并行执行计算机可执行指令，以提高计算设备/服务器100的并行处理能力。

计算设备/服务器100通常包括多个计算机存储介质。这样的介质可以是计算设备/服务器100可访问的任何可以获得的介质，包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器120可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如，只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备130可以是可拆卸或不可拆卸的介质，并且可以包括机器可读介质，诸如闪存驱动、磁盘或者任何其他介质，其可以能够用于存储信息和/或数据(例如断言回答语料库135，其用于训练基于断言的问答模型或引擎)并且可以在计算设备/服务器100内被访问。

计算设备/服务器100可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图1中示出，可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中，每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器120可以包括基于断言的问答引擎125，其具有一个或多个程序模块集合，这些程序模块被配置为执行本文所描述的各种实施例的方法或功能。

通信单元140实现通过通信介质与其他计算设备进行通信。附加地，计算设备/服务器100的组件的功能可以以单个计算集群或多个计算机器来实现，这些计算机器能够通过通信连接进行通信。因此，计算设备/服务器100可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。

输入设备150可以是一个或多个输入设备，例如鼠标、键盘、追踪球等。输出设备160可以是一个或多个输出设备，例如显示器、扬声器、打印机等。计算设备/服务器100还可以根据需要通过通信单元140与一个或多个外部设备(未示出)进行通信，外部设备诸如存储设备、显示设备等，与一个或多个使得用户与计算设备/服务器100交互的设备进行通信，或者与使得计算设备/服务器100与一个或多个其他计算设备通信的任何设备(例如，网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。

如图1所示，计算设备/服务器100能够通过通信单元140接收包括问题和相关文章的输入180，并且使用问答引擎125对输入180进行处理，从而生成包括断言回答的输出190。例如，输入180可以包括问题“when will shanghai disney open”和文章“the Disneyempire’s latest outpost,Shanghai Disneyland,will open in late 2015,reportsthe associated press”，输出190可以包括断言回答“Shanghai Disneyland will openin late 2015”，其具有预定结构<Shanghai Disneyland；will open；in late 2015>，并且表示完整的语义，即上海迪斯尼将在2015年开放。

本领域技术人员应当理解，虽然图1中示出了通过通信单元140接收输入180，并且发送输出190，但是也可以直接通过输入设备150获得该输入180并且通过输出设备160直接提供该输出190。此外，计算设备/服务器100可以同时获得问题和相关文章，也可以从不同的来源分别获得问题与文章。以下参考图2-8详细描述了基于断言的问答引擎125如何基于问题和相关文章来输出断言回答的示例实施例。

图2示出了其中可以实施本文所描述的主题的用于基于断言的问答的方法的流程图。应当理解，方法200可以由参考图1所描述的计算设备/服务器100执行。

在202，获得问题(q)以及与问题相关联的文章(p)。可选地，可以从搜索引擎的查询获得问题，也即，用户输入到搜索引擎中的问题类的查询被作为问题，并且将搜索引擎中与该查询相关联的搜索结果(例如，最相关的搜索结果)或其一部分作为文章。备选地，也可以直接从用户接收问题，然后由问答引擎125(例如通过信息检索)查询与该问题最相关的文章。换句话说，问答引擎125可以从其他程序或模块(例如搜索引擎)获得与问题相关联的文章，也可以自身去执行检索以获取相关联的文章。

在本文所描述的主题的实施例中，“文章(passage)”是指具有有限长度的一段内容，其可以例如为句子的一部分、一个句子、几个句子、几个段落，几个网页，等等。本领域技术人员应当理解，本文所描述的文章不同于从大规模文档抽取出内容的知识库。

在204，基于文章的内容来确定针对问题的断言回答(ast)，其中断言回答具有预定结构并且表示完整的语义。例如问答引擎125根据输入的问题和相关文章，能够根据文章确定相应的断言回答。在本文所描述的主题的实施例中，针对指定的问题和指定的文章来生成断言回答，所生成的断言回答能够准确且简明地回答问题。换句话说，断言回答(ast)能够基于文章(p)的内容来回答问题(q)。

在本文所描述的主题的实施例中，“断言(assertion)”是指坚定地相信为真的陈述，而“断言回答”是指针对问题的确信回答，其可以具有半结构化的预定结构(即具有预定的几个字段)，并且能够简明地表示完整的语义(即不需要借助于其他词语或环境就能理解出完整的语义)。

在一些实施例中，断言回答的预定结构可以包括主语字段(sub)、谓语字段(pre)以及自变量字段(arg_i)。例如，在上文提到的示例断言回答<Shanghai Disneyland；willopen；in late 2015>中，“Shanghai Disneyland”表示主语，“will open”表示谓语，以及“in late 2015”表示自变量。应当理解，虽然本文描述了主语-谓语-自变量的示例预定结构，但是能够表示完整语义的其他预定结构也是可能的。

应当理解，基于文章的内容确定断言回答可以直接从文章中抽取相关联的句子作为断言回答，也可以基于文章内容生成断言回答。以下参考图6描述了生成断言回答的示例实施例，并且参考图7描述了抽取断言回答的示例实施例。

在206，输出所确定的断言回答。例如，问答引擎125可以使用可视或可听装置来输出断言回答。在一些实施例，可以使用支持语音控制的音频输出装置(例如“智能音箱”)来输出断言回答，从而使得智能音箱能够读出简洁且完整的断言回答。由于传统的智能音箱提供的太短的回答不能够传达足够的信息，而太长的回答需要很长时间才能读完，因此，与传统技术相比，根据本文所描述的主题的实施例能够有效提升用户体验。

因此，根据本文所描述的主题的方法200的实施例所输出的断言回答，能够提供比传统的短回答更丰富的语义内容，并且提供比传统的长回答更简洁的表达，由此提升了用户体验同时保证了回答的准确性。

图3A-3B示出了根据本文所描述的主题的实施例的用于基于断言的问答的图形用户界面(GUI)300和350的示图。如图3A所示，GUI 300是一个在线问答的页面，其包括可以输入问题的框310、提交问题按钮320、以及可以输出回答的框330等。还如图3A所示，在框310中已经输入了问题“when will shanghai disney open”。当用户点击提交问题按钮330之后，从图3A中的GUI 300跳转到图3B中的GUI 350。如图3B所示，在框330中输出根据本文所描述的主题的实施例的断言回答“Shanghai Disneyland will open in late 2015”，其具有预先定义的结构，并且具有完全且简洁的表达，因而能够高效地回答用户的问题。

在一些实施例中，可以构建语料库并且使用语料库来训练问答引擎125。图4示出了根据本文所描述的主题的实施例的用于构建并使用断言回答语料库的框图400。

在410，从搜索引擎获得查询，例如从搜索引擎的日志或在线输入中获取提问类的查询。在420，从搜索引擎获得文章，例如可以将与提问式查询最相关的搜索结果网页中的内容或内容的一部分作为文章。在获得查询和文章之后，即获得了问题-文章对，例如一个问题对应一段文章。

在430，使用信息抽取来抽取问题-文章对中的候选断言回答，断言回答描述文章的哪个部分可以回答问题，任何已知的或将来开发的开放式信息抽取方式可以应用于本文所描述的主体的实施例。在一个问题-文章对中，针对问题可能存在多个候选断言回答。

在440，对所抽取的候选断言回答进行处理，例如可以基于组合规则来调整断言回答以促进对断言回答的理解。接下来，在450，对于所抽取的候选断言回答，可以人工地对其进行标注。标注人员可以标注候选断言回答是否能够正确回答问题并且同时具有完整的语义，如果是，则标注为肯定断言回答，否则标注为否定断言回答。在对例如几万个问题-文章对中的几十万个断言回答进行标注之后，在460，生成断言回答语料库，其为基于网页搜索结果而生成的语料库，也被称为“WebAssertions”。

在470，可以利用断言回答语料库“WebAssertions”来训练回答引擎125中的断言回答模型。例如，可以分别地训练断言回答生成模型和抽取模型。然后，在480，使用经训练的断言回答生成模型或抽取模型来处理问答任务，从而提高断言回答的准确性。

图5示出了根据本文所描述的主题的实施例的断言回答语料库中的示例数据结构的示图。如图5所示，针对某个特定问题“when will shanghai disney open”及其相关文章“the Disney empire’s latest outpost,Shanghai Disneyland,will open in late2015,reports the associated press”，存在多个候选断言回答，例如第一候选断言回答“<the Disney empire's latest outpost；is；Shanghai Disneyland>”、第二候选断言回答“<the Disney empire's latest outpost；will open；in late 2015>”、第三候选断言回答“<the associated press；reports；the Disney empire's latest outpost willopen in late 2015>”、以及第四候选断言回答“<Shanghai Disneyland；will open；inlate 2015>”。通过人工标注，第四候选断言回答被人工判断为最适合的断言回答，因而在语料库中第四候选断言回答被标注为肯定标记(例如“1”)，而第一候选断言回答至第三候选断言回答被标注为否定标记(例如“0”)。

在一些实施例中，不同结构的断言回答可以被组合。例如，两种结构的断言＜A,is,B＞和＜A,pre,C＞可以被组合成新的断言＜B,pre,C＞，图5中的第四候选断言回答是第一候选断言回答和第二候选断言回答的组合。

图6示出了根据本文所描述的主题的实施例的用于生成断言回答的示意图。如图6所示，示出了使用序列至断言(Seq2Ast)的方式生成断言回答，序列至断言(Seq2Ast)基于序列至序列(Seq2Seq)学习，其包括编码器和解码器，其中编码器将序列作为输入并且将输入映射到隐向量列表，而解码器通过一次输出一个词的顺序方式生成另一序列。

如图6所示，通过对问题“when will shanghai disney open”和文章“the Disneyempire’s latest outpost,Shanghai Disneyland,will open in late 2015,reportsthe associated press”串接并且编码来生成问题和文章的量化表示h₁至h₂₆(例如向量)，其中问题和文章之间通过标记<EOQ>进行分隔，<EOQ>表编码为向量h₆。

接下来，可以使用元组级解码器对量化表示解码来首先生成断言回答中的多个字段，多个字段的向量分别为

并且使用词语级解码器对量化表示解码来其后生成每个字段中的一个或多个词语，例如主语字段中的词语的向量

谓语字段中的字段的向量

以及自变量字段中的词语的向量

在Seq2Ast的过程中，元组级解码器记住断言回答的结构，并且词语级解码器学习每个字段中的依赖关系。如图6所示，每个字段的最后一个词语被示出为特殊标记，例如主语字段中的</SUBJ>、谓语字段中的</PRED>、以及自变量字段中的</ARG>，这些标记在生成最终断言回答时可以被省略。

在一些实施例中，可以使用基于循环神经网络(RNN)的门控循环单元(GRU)作为元组级解码器来输出断言回答中的每个字段的表示，还可以使用另一基于RNN的GRU作为词语级解码器来生成每个字段中的词语。例如，如图6所示，元组级解码器可以根据式(1)计算第k个字段的向量

词语级解码器可以根据式(2)计算第k个字段第j个词语的向量

其中

表示第k个字段的向量，

表示第k-1个字段的向量，并且

表示词语级解码器中第k-1个字段中的最后一个词语的向量。

其中

表示第k个字段中第j个词语的向量，

表示第k个字段中第j-1个词语的向量，

表示第k个字段的向量，以及y_k，j-1表示第k个字段中第j-1个词语序列。

换句话说，根据本文所描述的主题的实施例，可以基于多个字段中的特定字段的量化表示和特定字段中的末尾词语的量化表示，确定特定字段的下一字段的量化表示。可以基于特定字段中的特定词语的量化表示和特定字段的量化表示，确定特定字段中特定词语的下一词语的量化表示。因此，根据本文所描述的主题的实施例的断言回答生成方法能够生成准确的且合适的回答，并且断言回答可以包括在文章中不存在的词语。

图7示出了根据本文所描述的主题的实施例的用于抽取断言回答的方法的流程图700。应当理解，方法700可以由参考图1所描述的计算设备/服务器100执行，并且可以为以上参考图2所描述的动作204的子动作。

在702，从文章的内容抽取候选断言回答集合。如以上所讨论的，可以对从搜索引擎获得的问题-文章对进行信息抽取而获得候选断言回答集合。在704，确定问题与候选断言回答集合中的候选断言回答之间的相关度。例如，可以使用以下各项中的一项或多项来确定问题与候选断言回答集合中的候选断言回答之间的语义相关度：词级别匹配、短语级别匹配、以及句子级别匹配。

在词语级匹配中，可以基于问题与候选断言回答之间的相同词语数目，确定词语级匹配特征F_WM，其中相同词语数目越多，说明问题与候选断言回答在词语级上越匹配。此外，还可以基于词语到词语的转换，确定词语级转换特征F_W2W，其用于处理相同含义的不同词语表达。

在短语级匹配中，可以基于短语到短语的转换，来确定短语级匹配特征F_PP和F_P2P，这二者使用不同的中英文对或问答对被构建，以便用于处理相同含义的不同短语表达。

在句子级匹配中，可以使用基于CNN的特征f_CNN来计算问题与候选断言回答之间的句子级匹配程度，例如，可以通过式(3)计算特征f_CNN：

f_CNN(que，ast)＝cosine(cdssm₁(q)，cdssm₂(ast)) (3)

其中f_CNN(que,ast)表示问题与候选断言回答之间的基于CNN的特征，cdssm₁(q)和cdssm₂(ast)表示分别通过两个CNN得到的问题向量和候选断言回答向量。

此外，还可以使用基于RNN的特征f_RNN来计算问题与候选断言回答之间的句子级匹配程度。可以使用两个DNN来将问题和候选断言回答分别映射到固定长度的向量，并且可以使用相同的双向GRU来得到两个方向上的问题向量和候选断言回答向量。

可以使用具有随机下降的问答对来训练f_CNN和f_RNN的模型参数。例如，可以通过式(4)计算针对每个训练示例的成对的边界排名损失：

其中f⁺(q，ast)和f^-(q，ast)是针对相关和不相关对的模型得分，m是指边界。

在706，基于相关度从候选断言回答集合选择断言回答，例如，可以选择最高排名的候选断言回答作为正式的断言回答。在一些实施例中，可以构建决策树森林，并且输出决策树结果的线性组合，决策树中的每个分支指示应用到单个特征的阈值，并且每个叶节点是真实值。针对N颗数，例如可以通过式(5)计算问题-断言回答对的相关得分：

其中w_i是与第i颗回归树相关联的权重，tr_i(·)是通过评估具有特征[f₁(q,ast),…,f_K(q,ast)]的第i颗树而获得的叶节点的值，而w_i的值和tr_i(·)中的参数在训练期间利用梯度下降被学习。

图8示出了根据本文所描述的主题的实施例的所生成的断言回答与所抽取的断言回答的比较的示图。如图8所示，针对问题“how much can your bladder hold”和相关文章“A healthy adult bladder can hold up to 16 ounces(2cups)of urine comfortably,according to the national institutes of health.How frequently it fillsdepends on how much excess water your body is trying to get rid of”，根据本文所描述的主题的实施例的生成方法所生成的结果示例为“a healthy adult bladder canhold up to 16 ounces”，而根据本文所描述的主题的实施例的抽取方法所抽取的结果示例为“<a healthy adult bladder can hold up to 16 ounces,2 cups of urine>”。由此可见，无论是断言回答生成方法，还是断言回答抽取方法，都能提供具有固定结构和完整语义的简明回答。

继续参考图8，断言回答生成方法能够生成断言回答的结构、每个字段的流畅表达、以及一定程度上完整的语义。此外，在图8的示例中，断言回答生成方法的结果比断言回答抽取方法的结果更加的简洁。

本文中所描述的方法和功能可以至少部分地由一个或多个硬件逻辑组件来执行。例如但不限于，可以使用的硬件逻辑组件的示意性类型包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑器件(CPLD)等。

用于实施本文所描述的主题的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开内容的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本文所描述的主题的范围的限制。在单独的实现的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

以下列出了本公开的一些示例实现方式。

在一个方面，提供了一种计算机实现的方法。该方法包括：获得问题以及与问题相关联的文章；基于文章的内容来确定针对问题的断言回答，断言回答具有预定结构并且表示完整的语义；以及输出所确定的断言回答。

在一些实施例中，其中预定结构包括主语字段、谓语字段以及自变量字段，并且其中获得问题以及与问题相关联的文章包括：从搜索引擎的查询获得问题；以及基于搜索引擎中与查询相关联的搜索结果来获得文章。

在一些实施例中，其中基于文章的内容来确定针对问题的断言回答包括：基于文章的内容，生成具有预定结构的断言回答。

在一些实施例中，其中生成具有预定结构的断言回答包括：通过对问题和文章编码来生成问题和文章的量化表示；通过对量化表示解码来生成断言回答中的多个字段；以及通过对量化表示解码来生成多个字段中的多个词语。

在一些实施例中，其中生成断言回答中的多个字段包括：基于多个字段中的特定字段的量化表示和特定字段中的末尾词语的量化表示，确定特定字段的下一字段的量化表示；并且其中生成多个字段中的多个词语包括：基于特定字段中的特定词语的量化表示和特定字段的量化表示，确定特定字段中特定词语的下一词语的量化表示。

在一些实施例中，其中基于文章的内容来确定针对问题的断言回答包括：从文章的内容抽取具有预定结构的断言回答。

在一些实施例中，其中抽取断言回答包括：从文章的内容抽取候选断言回答集合；使用以下各项中的至少一项来确定问题与候选断言回答集合中的候选断言回答之间的相关度：词级别匹配、短语级别匹配、以及句子级别匹配；以及基于相关度从候选断言回答集合选择断言回答。

在一些实施例中，其中方法由基于断言的问答模型执行，基于断言的回答模型使用通过以下构建的语料库被训练：从搜索引擎获得问题-文章对，抽取候选断言回答，以及接收对候选断言回答的人工标注。

在一些实施例中，其中输出所确定的断言回答包括：使用支持语音控制的音频输出装置来输出断言回答。

在另一方面，提供了一种电子设备。该电子设备包括：处理单元；存储器，耦合至处理单元并且存储有指令，指令在由处理单元执行时执行以下动作：获得问题以及与问题相关联的文章；基于文章的内容来确定针对问题的断言回答，断言回答具有预定结构并且表示完整的语义；以及输出所确定的断言回答。

在一些实施例中，动作由在处理单元上运行的基于断言的问答模型执行，基于断言的回答模型使用通过以下构建的语料库被训练：从搜索引擎获得问题-文章对，抽取候选断言回答，以及接收对候选断言回答的人工标注。

在又一方面，提供了一种计算机程序产品。该计算机程序产品被存储在非瞬态计算机存储介质中并且包括机器可执行指令，机器可执行指令在设备中运行时使得设备执行动作：获得问题以及与问题相关联的文章；基于文章的内容来确定针对问题的断言回答，断言回答具有预定结构并且表示完整的语义；以及输出所确定的断言回答。

在一些实施例中，动作由在设备上运行的基于断言的问答模型执行，基于断言的回答模型使用通过以下构建的语料库被训练：从搜索引擎获得问题-文章对，抽取候选断言回答，以及接收对候选断言回答的人工标注。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本公开，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种计算机实现的方法，包括：

经由计算设备的输入设备，获得问题以及与所述问题相关联的文章；

基于所述文章的内容，通过以下来生成具有预定结构的断言回答：

通过对所述问题和所述文章编码来生成所述问题和所述文章的量化表示；

通过对所述量化表示解码来生成所述断言回答中的多个字段；以及

通过对所述量化表示解码来生成所述多个字段中的多个词语；

基于所述文章的所述内容来确定针对所述问题的所述断言回答，所述断言回答表示完整的语义；以及

输出所确定的所述断言回答。

2.根据权利要求1所述的方法，其中所述预定结构包括主语字段、谓语字段以及自变量字段，并且其中获得问题以及与所述问题相关联的文章包括：

从搜索引擎的查询获得所述问题；以及

基于所述搜索引擎中与所述查询相关联的搜索结果来获得所述文章。

3.根据权利要求1所述的方法，其中基于所述文章的内容来确定针对所述问题的断言回答包括：

基于所述文章的所述内容，生成具有所述预定结构的所述断言回答。

4.根据权利要求1所述的方法，

其中生成所述断言回答中的多个字段包括：

基于所述多个字段中的特定字段的量化表示和所述特定字段中的末尾词语的量化表示，确定所述特定字段的下一字段的量化表示；

并且其中生成所述多个字段中的多个词语包括：

基于所述特定字段中的特定词语的量化表示和所述特定字段的量化表示，确定所述特定字段中所述特定词语的下一词语的量化表示。

5.根据权利要求1所述的方法，其中基于所述文章的内容来确定针对所述问题的断言回答包括：

从所述文章的所述内容抽取具有所述预定结构的所述断言回答。

6.根据权利要求5所述的方法，其中抽取所述断言回答包括：

从所述文章的所述内容抽取候选断言回答集合；

使用以下各项中的至少一项来确定所述问题与所述候选断言回答集合中的候选断言回答之间的相关度：词级别匹配、短语级别匹配、以及句子级别匹配；以及

基于所述相关度从所述候选断言回答集合选择所述断言回答。

7.根据权利要求1所述的方法，其中所述方法由基于断言的问答模型执行，所述基于断言的回答模型使用通过以下构建的语料库被训练：从搜索引擎获得问题-文章对，抽取候选断言回答，以及接收对所述候选断言回答的人工标注。

8.根据权利要求1所述的方法，其中输出所确定的所述断言回答包括：

使用支持语音控制的音频输出装置来输出所述断言回答。

9.一种电子设备，包括：

处理单元；

存储器，耦合至所述处理单元并且存储有指令，所述指令在由所述处理单元执行时执行以下动作：

经由所述电子设备的输入设备，获得问题以及与所述问题相关联的文章；

输出所确定的所述断言回答。

10.根据权利要求9所述的电子设备，其中所述预定结构包括主语字段、谓语字段以及自变量字段，并且其中获得问题以及与所述问题相关联的文章包括：

从搜索引擎的查询获得所述问题；以及

11.根据权利要求9所述的电子设备，其中基于所述文章的内容来确定针对所述问题的断言回答包括：

12.根据权利要求9所述的电子设备，

其中生成所述断言回答中的多个字段包括：

并且其中生成所述多个字段中的多个词语包括：

13.根据权利要求9所述的电子设备，其中基于所述文章的内容来确定针对所述问题的断言回答包括：

14.根据权利要求13所述的电子设备，其中抽取所述断言回答包括：

从所述文章的所述内容抽取候选断言回答集合；

15.根据权利要求9所述的电子设备，其中所述动作由在所述处理单元上运行的基于断言的问答模型执行，所述基于断言的回答模型使用通过以下构建的语料库被训练：从搜索引擎获得问题-文章对，抽取候选断言回答，以及接收对所述候选断言回答的人工标注。

16.根据权利要求9所述的电子设备，其中输出所确定的所述断言回答包括：

使用支持语音控制的音频输出装置来输出所述断言回答。

17.一种非瞬态计算机存储介质，存储有计算机程序产品，所述计算机程序产品包括机器可执行指令，所述机器可执行指令在设备中运行时使得所述设备：

获得问题以及与所述问题相关联的文章；

输出所确定的所述断言回答。

18.根据权利要求17所述的非瞬态计算机存储介质，其中所述预定结构包括主语字段、谓语字段以及自变量字段，并且其中获得问题以及与所述问题相关联的文章包括：

从搜索引擎的查询获得所述问题；以及