CN105912697A - 一种对话***知识库的优化方法及装置 - Google Patents

一种对话***知识库的优化方法及装置 Download PDF

Info

Publication number
CN105912697A
CN105912697A CN201610262475.7A CN201610262475A CN105912697A CN 105912697 A CN105912697 A CN 105912697A CN 201610262475 A CN201610262475 A CN 201610262475A CN 105912697 A CN105912697 A CN 105912697A
Authority
CN
China
Prior art keywords
information
answer
answer information
question
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610262475.7A
Other languages
English (en)
Other versions
CN105912697B (zh
Inventor
孙永超
邱模武
包强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guangnian Wuxian Technology Co Ltd
Original Assignee
Beijing Guangnian Wuxian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guangnian Wuxian Technology Co Ltd filed Critical Beijing Guangnian Wuxian Technology Co Ltd
Priority to CN201610262475.7A priority Critical patent/CN105912697B/zh
Publication of CN105912697A publication Critical patent/CN105912697A/zh
Application granted granted Critical
Publication of CN105912697B publication Critical patent/CN105912697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种对话***知识库的优化方法及装置,该包括:目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将待分析问答信息作为目标问答信息;更新答案集合生成步骤,基于目标问答信息的问题信息获取对应的答案信息集合,分别计算答案信息集合中各个答案信息的相关度参数,并根据相关度参数生成针对目标问答信息中问题信息的更新答案集合。该方法能够实现对对话***数据库的主动更新,从而使得对话***能够输出更加符合用户使用习惯以及期望的答案,进而提高了对话***的用户体验以及用户粘度。

Description

一种对话***知识库的优化方法及装置
技术领域
本发明涉及人机交互技术领域,具体地说,涉及一种对话***知识库的优化方法及装置。
背景技术
对于传统的人机交互而言,人机交互主要是由用户通过鼠标、键盘以及触摸屏等装置来与计算机、手机等设备进行交互。而随着人机之间信息交互量正呈现***性的增长,传统的人机交互方式极大地影响了人机交互的效率以及效果。
人们所习惯的最自然、最便捷的交互方式是自然语言交互,因此通过对话***来实现高效地人机交互成为了越来越普遍的选择。然而,现有的对话***对于用户的一些询问问题无法给出令人满意的回答,这也就影响了整个对话***的用户体验,使得产品的用户粘性较差。
发明内容
为解决上述问题,本发明提供了一种对话***知识库的优化方法,包括:
目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
更新答案集合生成步骤,基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
根据本发明的一个实施例,在所述目标问答信息获取步骤中,判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
根据本发明的一个实施例,在所述更新答案集合生成步骤中,根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
根据本发明的一个实施例,在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。
根据本发明的一个实施例,在选取所述目标用户时,
获取对话***不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
或,获取对话***不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
本发明还提供了一种对话***知识库的优化装置,包括:
目标问答信息获取模块,其用于判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
更新答案集合生成模块,其用于基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
根据本发明的一个实施例,所述目标问答信息获取模块配置为判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
根据本发明的一个实施例,所述更新答案集合生成模块配置为根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
根据本发明的一个实施例,所述更新答案集合生成模块配置为在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。
根据本发明的一个实施例,所述更新答案集合生成模块配置为在选取所述目标用户时,
获取对话***不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
或,获取对话***不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
本发明所提供的对话***知识库优化方法通过对海量用户的用户请求日志进行分析,尽可能找到这些日志中不好的或不合理的问答信息,然后通过各种渠道主动地获取这类问答信息中的问题信息的答案信息,并对答案信息进行合法性的判断,最后将符合要求的答案信息***或更新到数据库中。通过对对话***数据库的更新,对话***能够输出更加符合用户使用习惯以及期望的答案,从而提高了对话***的用户体验以及用户粘度。
该方法实现了对话***知识库的自学习以及闭环反馈。其中,该方法可以使得对话***能够对知识库中不好的和不合理的问答信息自主地进行合理化改进,从而使得该***的质量能够有持续性的提升。同时,该方法还能够使得对话***实现自主学习,这样也就可以脱离必须依赖维护人员的手动学习方式。
该方法通过将目标问答信息中的问题信息重新推送给用户来获取用户针对该问题信息的答案,这样便实现了“用户-对话***-用户”的闭环反馈,因此对话***也就可以在受到外接干扰时保持自身的稳定性。正是基于这种闭环结构,对话***才能够持续的接收到来自用户感知层面的反馈,并根据用户的反馈来不断优化自身知识库从而调整自身的输出,以使得这种输出能够符合用户的期望。
此外,本发明所提供的对话***知识库优化方法还可以通过根据用户的属性来向特定的用户推送目标问答信息中的问题信息。由于这类用户的属性与向对话***输入目标问答信息中问题信息的用户的属性相同或类似,因此通过这类用户也就可以获得针对于目标问答信息中问题信息的更为准确或契合度更高的答案信息,而根据这类答案信息所确定出的上述问题信息的更新答案集合也将更为准确。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
图1是根据本发明一个实施例的对话***知识库优化方法的实现流程图;
图2是根据本发明另一个实施例的对话***知识库优化方法的实现流程图;
图3是根据本发明又一个实施例的对话***知识库优化方法的实现流程图;
图4是根据本发明一个实施例的对话***知识库优化装置的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
对于智能机器人中的对话***来说,从用户的角度来看,越好的用户体验,那么就意味着越高的用户粘性。目前,对于对话机器人来说,最为直观的体验是用户所询问的问题的答案是否满足了用户的期望。例如,当用户向对话机器人发起询问“总自己一个人”时,对于现有的对话机器人来说,其反馈的答案很可能是“我不知道你在说什么耶”。由此可以看出,现有的对话机器人无法很好地满足用户的日常交互需求。
对话机器人是利用对话***来实现机器人与用户之间的对话交互的,其中,对话***利用自身的知识库来根据用户输入的问题来确定出相应的答案。本发明正是利用上述特性,提供了一种新的对话***知识库的优化方法,以使得对话***能够利用优化后的知识库更加准确、合理地确定出用户所输入的问题的答案。该优化方法通过不间断地持续学习,以此不断地提升对话***知识库的质量。
需要指出的是,本发明所指的对话***知识库的质量的提升,既可以指知识库中问题信息所对应的答案信息的改善,也可以指知识库中问题信息及其答案信息的扩充。
为了更加清楚地阐述本发明所提供的对话***知识库优化方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对该方法作进一步地说明。
实施例一:
图1示出了本实施例所提供的对话***知识库的优化方法的实现流程图。
如图1所示,本实施例所提供的方法首先在步骤S101中获取待分析问答信息的测评参数。其中,该方法在步骤S101中所获取到的测评参数优选地为问答评价***对待分析问答信息的评分。对于问答信息中的问题信息而言,其答案信息的评分越高,也就说明用户对该答案信息的满意程度越高;反之,如果答案信息的评分越低,也就说明用户对该答案信息的满意程度越低,而这类答案信息也正是需要进行优化的信息。
因此,本实施例中,该方法在步骤S102中判断步骤S101中所获得的测评参数是否满足预设优化标准。如果测评参数满足预设优化标准,该方法则在步骤S103中将步骤S101中的待分析问答信息作为目标问答信息。其中,目标问答信息即为待优化的问答信息。
具体地,本实施例中,由于该方法在步骤S101中所获取的测评参数为问答评价***针对答案信息的评分,因此该方法在步骤S102中通过判断测评参数是否小于预设测评阈值来判断待分析问答信息是否为目标问答信息。
例如对于用户输入的问题信息“总自己一个人”来说,对话***所反馈的答案信息“我不知道你在说什么耶”显然无法令用户感到满意,因此其对应的评分也就必然会很低。如果该答案信息所对应的评分小于预设评分阈值的话,那么就表示需要对该答案信息进行优化,以使得用户在输入问题信息时对话***能够反馈令用户更为满意的答案。
如图1所示,当确定出目标问答信息后,该方法在步骤S104中基于目标问答信息的问题信息获取对应的回答信息集合。本实施例中,当确定出对话***数据库中的目标问答信息后,该方法会在特定的场景下把目标问答信息中的问题信息推送给对话***的用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
例如,该方法在步骤S103中所确定的目标问答信息包括:问题信息“总自己一个人”和答案信息“我不知道你在说什么耶”,在步骤S104中,该方法会将问题信息“总自己一个人”推送给对话***的用户(此处的用户可能为输入该问题信息的用户也可能为其他多个不同的用户)。针对所推送的问题信息,用户在对话过程中会将自己的答案反馈给对话***,这样该方法通过收集用户的反馈答案便可以得到目标问答信息中问题信息所对应的答案信息集合。
需要指出的是,在本发明的其他实施例中,该方法也可以通过其他合理方式来获取对应于目标问答信息中问题信息的答案信息集合,本发明不限于此。
当得到答案信息集合后,由于回答信息集合中所包含的答案信息多是由多个不同的用户所反馈的,因此其中既可能包含能够令用户较为满意的答案信息,也可能包含无法令用户满意的答案信息,这样也就需要对答案信息集合进行筛选,以确定能够作为目标问答信息中问题信息的备选答案的信息。
具体地,如图1所示,在得到答案信息集合后,该方法在步骤S105中分别计算答案信息集合中各个答案信息的相关度参数,并在步骤S106中根据相关度参数生成针对目标问答信息中问题信息的更新答案信息集合。
本实施例中,相关度参数用于表征答案信息与问题信息之间的联系程度,而判断问题信息与答案信息之间的联系一直是人工智能领域中一个重要的研究课题。为了使得对话***能够尽可能高效地工作,本实施例中该方法利用预先设定的规则来计算答案信息集合中各个答案信息的相关度参数。
具体地,本实施例中,该方法利用多个适用于相关度判断的规则来分别计算各个规则下问答信息的相关度,随后利用各个规则的权重对利用各个规则所计算得到的相关度进行加权,从而最终得到某一答案信息总体的相关度参数。
其中,该方法所利用的预设规则优选地包括中心词规则,该方法根据问答信息中答案信息与问题信息是否具有语义相同的中心词来确定答案信息的相关度参数。如果问题信息与答案信息中语义相同的中心词越多,那么答案信息与问题信息的相关度参数的取值也就越大;反之,如果问题信息与答案信息中语义相同的中心词越少,那么答案信息与问题信息的相关度参数的取值也就越小。
需要指出的是,在本发明的其他实施例中,该方法在计算答案信息的相关度参数时所使用的预测还可以包含其他合理规则,本发明不限于此。
本实施例中,当得到答案信息集合中各个答案信息的相关度参数后,该方法会按照相关度参数的取值大小对答案信息集合中的各个答案信息进行排序,并选取排序靠前的N(N的取值可以根据实际需要进行设定)个答案信息来作为更新答案集合,该更新答案集合即为目标问答信息中问题信息的备选答案,由此便实现对对话***知识库的优化。
需要指出的是,利用本方法对对话***知识库的更新周期可以根据实际需要进行设定(例如可以通过对每天收集到的问答信息进行集中处理从而实现每天对对话***知识库更新一次),本发明不限于此。同时,该方法在执行时,所获取的海量数据不仅包括用户数据,还包括问答评价***和用户评价***的数据。具体地,这些数据包括但不限于:用户的问题信息和对话***的答案信息、对话***答案信息的来源、用户的相关数据、答案信息的评分数据以及数据生成的时间等。
从上述描述可以看出,本实施例所提供的对话***知识库优化方法实现了对话***知识库的自学习以及闭环反馈。其中,该方法可以使得对话***能够对知识库中不好的和不合理的问答信息自主地进行合理化改进,从而使得该***的质量能够有持续性的提升。同时,该方法还能够使得对话***实现自主学习,这样也就可以脱离必须依赖维护人员的手动学习方式。
该方法通过将目标问答信息中的问题信息重新推送给用户来获取用户针对该问题信息的答案,这样便实现了“用户-对话***-用户”的闭环反馈,因此对话***也就可以在受到外接干扰时保持自身的稳定性。正是基于这种闭环结构,对话***才能够持续的接收到来自用户感知层面的反馈,并根据用户的反馈来不断优化自身知识库从而调整自身的输出,以使得这种输出能够符合用户的期望。
例如对于如上所述的目标问答信息中的问题信息“总自己一个人”,现有的对话***所反馈的答案信息是无法令用户感到满意的“我不知道你在说什么耶”。而利用本实施例所提供的方法对对话***知识库进行更新后,对话***则可以输出诸如“我一直陪在你身边呢”的答案信息,该答案信息显然更加符合用户期望。
实施例二:
图2示出了本实施例所提供的对话***知识库的优化方法的实现流程图。
如图2所示,本实施例所提供的方法首先在步骤S201中获取待分析问答信息的测评参数,并在步骤S202中判断测评参数是否符合预设优化标准,如果符合,则在步骤S203中将步骤S201中所获取的待分析问答信息作为目标问答信息,目标问答信息即为需要进行优化的问答信息。
需要指出的是,本实施例中,步骤S201至步骤S203的实现原理以及实现过程与实施例一中步骤S101至步骤S103的实现原理以及实现过程相同,故在此不再赘述。
现有的对话***在进行问题推送时是不区分用户的,这就可能造成对话***会将问题信息推送给不适合的用户,这类用户所反馈的答案信息很可能会造成答案信息不可靠和不准确。
例如,当对话***向一男性用户推送了问题信息“X牌的化妆品怎么样”,男性用户通常无法准确提供该问题信息的答案,因此也就可能向对话***反馈诸如“我不知道”或“我用不上化妆品”的答案信息。
针对上述问题,本实施例所提供的方法优选地通过用户的用户属性来确定问题信息推送的目标用户,从而获取更为准确、可靠的答案信息。
本实施例中,当确定出对话***数据库中的目标问答信息后,该方法会把目标问答信息中的问题信息推送给对话***的特定用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
具体地,如图2所示,当确定出目标问答信息后,该方法在步骤S204中获取对话***中不同用户的属性,并在步骤S205中判断步骤S204中所获取到的用户属性是否符合预设问题推送要求。如果用户的用户属性符合预设问题推送要求,那么该方法则在步骤S206中将对应的用户确定为目标用户,并向目标用户推送目标问答信息中的问题信息。
本实施例中,用于确定用户是否为目标用户的用户属性优选地包括:用户身份信息、用户位置信息、用户年龄信息以及用户性别信息等。例如对于用户年龄信息来说,如果目标问答信息中问题信息所涉及的用户年龄与某用户的年龄处于同一年龄段,那么该用户的属性也就符合预设问题推送要求。
当然,在本发明的不同实施例中,该方法在步骤S205中进行判断时,既可以仅仅使用以上所列项中的某一项或某几项来进行目标用户的判别,也可以利用以上未列出的其他合理项或其他合理项与上述某一项或某几项的结合来进行目标用户的判别,本发明不限于此。
当向目标用户推送目标问答信息中的问题信息后,该方法在步骤S207中通过对话***获取目标用户针对问题信息所反馈的答案信息,从而得到答案信息集合。
在得到答案信息集合后,该方法在步骤S208中分别计算答案信息集合中各个答案信息的相关度参数,并在步骤S209中根据各个答案信息的相关度参数从答案信息结合中确定出更新答案集合。
需要指出的是,本实施例中,步骤S207至步骤S209的实现原理与实现过程与实施例一中步骤S104至步骤S106的实现原理以及实现过程类似,故在此不再赘述。
本实施例中,在对目标问答信息中的答案信息进行更新时,更新后的该问题信息的答案信息优选地将包含多个答案信息,这样用户与对话***进行交互时,对话***针对同一问题信息可以向用户反馈多个不同的答案信息,从而避免了用户在询问同一问题时对话***由于总是输出相同的答案而使得用户感到厌倦,这进一步提高了对话***的用户体验和用户粘度。
从上述描述可以看出,本实施例所提供的对话***知识库优化方法在实施例一所提供的方法的基础上,通过根据用户的属性来向特定的用户推送目标问答信息中的问题信息。由于这类用户的属性与向对话***输入目标问答信息中问题信息的用户的属性相同或类似,因此通过这类用户也就可以获得针对于目标问答信息中问题信息的更为准确或契合度更高的答案信息,而根据这类答案信息所确定出的上述问题信息的更新答案集合也将更为准确。
需要指出的是,在本发明的其他实施例中,该方法还可以根据其他合理的参数(例如交互场景和/或交互话题)来从对话***的多个用户中选取目标用户,本发明不限于此。例如在本发明的一个实施例中,对话***知识库的优化方法的执行步骤S301至S309与实施例二中的步骤S201至步骤S209大致相同,不同的是,在该实施例中,该方法在步骤S304中所获取的为对话***的不同用户当前的交互话题,并在步骤S305中是利用交互话题来选取目标用户的。
在具体应用过程中,如果某一用户与对化***之间的交互话题是“足球”,而目标问答信息中问题信息是针对“AlphaGo”的,那么此时将问题信息推送给该用户显然是十分突兀的,在这种情况下,将无法保证该用户针对所推送的问题信息所反馈的答案信息的可靠性。因此这种问题信息的推送策略会使得被推送的用户感觉到交互过程受到干扰,从而降低对话***的用户体验。
而本实施例所提供的方法正是通过交互话题来从对话***的大量用户中选取目标用户,当用户的当前交互话题与目标问答信息中问题信息所涉及的话题相关时,此时将问题信息推送给该用户不仅不会使用户感到突兀,还能够让用户感觉对话***是有“思想”的。在这种情况下,用户针对问题信息所反馈的答案信息显然质量更高,其更能够准确地发映出用户对该问题信息真实回答。
需要指出的是,在本发明的其他实施例中,该对话***知识库的优化方法可以将多个不同的参量(例如用户的属性、交互话题和交互场景)相结合来更加精确的选取目标用户,本发明同样不限于此。
同时,还需要指出的是,在上述描述中,在获取待分析问答信息的测评参数前,还可以对获取到的待分析问答信息进行过滤,以此确定问答信息的合法性。
本发明还提供了一种对话***知识库的优化装置,图4示出了本实施例中该装置的结构示意图。
如图4所示,本实施例所提供的对话***知识库优化装置优选地包括:目标问答信息获取模块401和更新答案集合生成模块402。其中,目标问答信息获取模块401用户判断待分析问答信息的测评参数是否符合预设优化标准。如果符合,目标问答信息获取模块401则将该问答信息作为目标问答信息,其中目标问答信息即为待优化的问答信息。
本实施例中,目标问答信息获取模块401所获取到的测评参数优选地为问答评价***对待分析问答信息的评分。对于问答信息中的问题信息而言,其答案信息的评分越高,也就说明用户对该答案信息的满意程度越高;反之,如果答案信息的评分越低,也就说明用户对该答案信息的满意程度越低,而这类答案信息也正是需要进行优化的信息。
目标问答信息获取模块401如果判断出待分析问答信息的测评参数的取值小于预设测评阈值,那么目标问答信息获取模块401将判定测评参数符合预设优化标准,因此目标问答信息获取模块401也将判定该待分析问答信息为目标问答信息。
当确定出目标问答信息后,目标问答信息获取模块401会将目标问答信息传输给更新答案集合生成模块402,以由更新答案集合生成模块402根据目标问答信息生成用于更新目标问答信息中问题信息所对应答案的更新答案集合。
具体地,本实施例中,更新答案集合生成模块402会在特定的场景下把目标问答信息中的问题信息推送给对话***的用户,并记录用户对该问题信息的反馈,从而得到问题信息所对应的回答信息集合。
更新答案集合生成模块402优选地通过用户的用户属性来确定问题信息推送的目标用户,从而获取更为准确、可靠的答案信息。因此,本实施例中,更新答案集合生成模块402在进行问题推送前,会获取对话***中不同用户的属性,并判断所获取到的用户属性是否符合预设问题推送要求。如果用户的用户属性符合预设问题推送要求,那么更新答案集合生成模块402则将对应的用户确定为目标用户,并向目标用户推送目标问答信息中的问题信息。
本实施例中,用于确定用户是否为目标用户的用户属性优选地包括:用户身份信息、用户位置信息、用户年龄信息以及用户性别信息等。当然,在本发明的不同实施例中,更新答案集合生成模块402在对目标用户进行选取时,既可以仅仅使用以上所列项中的某一项或某几项来进行目标用户的判别,也可以利用以上未列出的其他合理项或其他合理项与上述某一项或某几项的结合来进行目标用户的判别,本发明不限于此。
需要指出的是,在本发明的其他实施例中,更新答案集合生成模块402还可以根据其他合理的参数(例如交互场景和/或交互话题)来从对话***的多个用户中选取目标用户,本发明不限于此。
例如在本发明的一个实施例中,更新答案集合生成模块402所获取的用于选取目标用户的参数为对话***的不同用户当前的交互话题。本实施例所提供的方法正是通过交互话题来从对话***的大量用户中选取目标用户,当用户的当前交互话题与目标问答信息中问题信息所涉及的话题相关时,此时将问题信息推送给该用户不仅不会使用户感到突兀,还能够让用户感觉对话***是有“思想”的。在这种情况下,用户针对问题信息所反馈的答案信息显然质量更高,其更能够准确地发映出用户对该问题信息真实回答。
需要指出的是,在本发明的其他实施例中,该对话***知识库的优化方法可以将多个不同的参量(例如用户的属性、交互话题和交互场景)相结合来更加精确的选取目标用户,本发明同样不限于此。
同时,还需要指出的是,在上述描述中,在获取待分析问答信息的测评参数前,还可以对获取到的待分析问答信息进行过滤,以此确定问答信息的合法性。
当得到答案信息集合后,由于回答信息集合中所包含的答案信息多是由多个不同的用户所反馈的,因此其中既可能包含能够令用户较为满意的答案信息,也可能包含无法令用户满意的答案信息,这样也就需要对答案信息集合进行筛选,以确定能够作为目标问答信息中问题信息的备选答案的信息。
因此,在得到答案信息集合后,更新答案集合生成模块402分别计算回答信息集合中各个答案信息的相关度参数,并根据相关度参数生成针对目标问答信息中问题信息的更新答案信息集合。
需要指出的是,本实施例中,更新答案集合生成模块402计算各个答案信息的相关度参数的原理与上述对话***知识库的优化方法中所阐述的原理相同,故在此不再赘述。
应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构、处理步骤或材料,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。

Claims (10)

1.一种对话***知识库的优化方法,其特征在于,包括:
目标问答信息获取步骤,判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
更新答案集合生成步骤,基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
2.如权利要求1所述的方法,其特征在于,在所述目标问答信息获取步骤中,判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
3.如权利要求1或2所述的方法,其特征在于,在所述更新答案集合生成步骤中,根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
4.如权利要求1或2所述的方法,其特征在于,在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。
5.如权利要求4所述的方法,其特征在于,在选取所述目标用户时,
获取对话***不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
或,获取对话***不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
6.一种对话***知识库的优化装置,其特征在于,包括:
目标问答信息获取模块,其用于判断待分析问答信息的测评参数是否符合优化标准,如符合,则将所述待分析问答信息作为目标问答信息;
更新答案集合生成模块,其用于基于所述目标问答信息的问题信息获取对应的答案信息集合,分别计算所述答案信息集合中各个答案信息的相关度参数,并根据所述相关度参数生成针对所述目标问答信息中问题信息的更新答案集合。
7.如权利要求6所述的装置,其特征在于,所述目标问答信息获取模块配置为判断所述待分析问答信息的测评参数是否小于预设测评阈值,如果小于,则将所述待分析问答信息作为目标问答信息。
8.如权利要求6或7所述的装置,其特征在于,所述更新答案集合生成模块配置为根据问答信息中问题信息与答案信息是否具有语义相同的中心词来确定答案信息的相关度参数,其中,语义相同的中心词的数量越多,答案信息与问题信息的相关度参数越大。
9.如权利要求6或7所述的装置,其特征在于,所述更新答案集合生成模块配置为在获取所述答案信息集合时,按照预设规则选取目标用户,并向所述目标用户推送所述目标问答信息中的问题信息,获取所述目标用户针对所述问题信息所反馈的答案信息,从而得到所述问答信息集合。
10.如权利要求9所述的装置,其特征在于,所述更新答案集合生成模块配置为在选取所述目标用户时,
获取对话***不同用户的用户属性,判断用户属性是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户,其中,所述用户属性包括以下所列项中的任一项或几项:
用户身份信息、用户位置信息、用户年龄信息、用户性别信息;
或,获取对话***不同用户的交互场景和/或交互话题,判断所述交互场景和/或交互话题是否符合预设问题推送要求,如果符合,则将对应的用户确定为所述目标用户。
CN201610262475.7A 2016-04-25 2016-04-25 一种对话***知识库的优化方法及装置 Active CN105912697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610262475.7A CN105912697B (zh) 2016-04-25 2016-04-25 一种对话***知识库的优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610262475.7A CN105912697B (zh) 2016-04-25 2016-04-25 一种对话***知识库的优化方法及装置

Publications (2)

Publication Number Publication Date
CN105912697A true CN105912697A (zh) 2016-08-31
CN105912697B CN105912697B (zh) 2019-08-27

Family

ID=56751992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610262475.7A Active CN105912697B (zh) 2016-04-25 2016-04-25 一种对话***知识库的优化方法及装置

Country Status (1)

Country Link
CN (1) CN105912697B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446141A (zh) * 2016-09-21 2017-02-22 北京光年无限科技有限公司 面向智能机器人***的交互数据处理方法及机器人***
CN106682137A (zh) * 2016-12-19 2017-05-17 武汉市灯塔互动文化传播有限公司 一种智能股票投顾问答交互方法与***
CN106781790A (zh) * 2016-12-10 2017-05-31 杭州博世数据网络有限公司 一种带有自纠正功能的在线学习***
CN107729510A (zh) * 2017-10-23 2018-02-23 深圳市前海众兴电子商务有限公司 信息交互方法、信息交互终端及存储介质
CN109460459A (zh) * 2018-10-31 2019-03-12 神思电子技术股份有限公司 一种基于日志学习的对话***自动优化方法
CN109657038A (zh) * 2018-10-10 2019-04-19 阿里巴巴集团控股有限公司 一种问答对数据的挖掘方法、装置及电子设备
CN110046235A (zh) * 2019-03-18 2019-07-23 阿里巴巴集团控股有限公司 一种知识库评估方法、装置及设备
CN110263051A (zh) * 2019-06-11 2019-09-20 出门问问信息科技有限公司 用于问答***的问答对更新方法、装置、设备及存储介质
CN110674276A (zh) * 2019-09-23 2020-01-10 深圳前海微众银行股份有限公司 机器人自学习方法、机器人终端、装置及可读存储介质
CN111382239A (zh) * 2018-12-27 2020-07-07 上海智臻智能网络科技股份有限公司 一种交互流程的优化方法及其装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及***
CN103365899A (zh) * 2012-04-01 2013-10-23 腾讯科技(深圳)有限公司 一种问答社区中的问题推荐方法及***
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答***及方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
US20160092523A1 (en) * 2014-09-30 2016-03-31 International Business Machines Corporation Information handling system and computer program product for dynamcally assigning question priority based on question extraction and domain dictionary
CN105512228A (zh) * 2015-11-30 2016-04-20 北京光年无限科技有限公司 一种基于智能机器人的双向问答数据处理方法和***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及***
CN103365899A (zh) * 2012-04-01 2013-10-23 腾讯科技(深圳)有限公司 一种问答社区中的问题推荐方法及***
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答***及方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答***
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答***
US20160092523A1 (en) * 2014-09-30 2016-03-31 International Business Machines Corporation Information handling system and computer program product for dynamcally assigning question priority based on question extraction and domain dictionary
CN105512228A (zh) * 2015-11-30 2016-04-20 北京光年无限科技有限公司 一种基于智能机器人的双向问答数据处理方法和***

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446141B (zh) * 2016-09-21 2020-05-19 北京光年无限科技有限公司 面向智能机器人***的交互数据处理方法及机器人***
CN106446141A (zh) * 2016-09-21 2017-02-22 北京光年无限科技有限公司 面向智能机器人***的交互数据处理方法及机器人***
CN106781790A (zh) * 2016-12-10 2017-05-31 杭州博世数据网络有限公司 一种带有自纠正功能的在线学习***
CN106682137A (zh) * 2016-12-19 2017-05-17 武汉市灯塔互动文化传播有限公司 一种智能股票投顾问答交互方法与***
CN107729510A (zh) * 2017-10-23 2018-02-23 深圳市前海众兴电子商务有限公司 信息交互方法、信息交互终端及存储介质
CN107729510B (zh) * 2017-10-23 2021-07-06 深圳市前海众兴科研有限公司 信息交互方法、信息交互终端及存储介质
CN109657038A (zh) * 2018-10-10 2019-04-19 阿里巴巴集团控股有限公司 一种问答对数据的挖掘方法、装置及电子设备
CN109460459A (zh) * 2018-10-31 2019-03-12 神思电子技术股份有限公司 一种基于日志学习的对话***自动优化方法
CN111382239A (zh) * 2018-12-27 2020-07-07 上海智臻智能网络科技股份有限公司 一种交互流程的优化方法及其装置
CN111382239B (zh) * 2018-12-27 2023-06-23 上海智臻智能网络科技股份有限公司 一种交互流程的优化方法及其装置
CN110046235A (zh) * 2019-03-18 2019-07-23 阿里巴巴集团控股有限公司 一种知识库评估方法、装置及设备
CN110263051A (zh) * 2019-06-11 2019-09-20 出门问问信息科技有限公司 用于问答***的问答对更新方法、装置、设备及存储介质
CN110674276A (zh) * 2019-09-23 2020-01-10 深圳前海微众银行股份有限公司 机器人自学习方法、机器人终端、装置及可读存储介质

Also Published As

Publication number Publication date
CN105912697B (zh) 2019-08-27

Similar Documents

Publication Publication Date Title
CN105912697A (zh) 一种对话***知识库的优化方法及装置
CN106791235B (zh) 一种选择服务座席的方法、装置及***
CN103916306B (zh) 实现即时通信的方法和装置
CN105472413B (zh) 电视频道排序方法、***及服务器
CN110473123A (zh) 一种多元智能教育方法及***
CN104007805A (zh) 实现移动终端节电的方法及装置及移动终端
CN104732450A (zh) 一种基于规则引擎的供电质量评价***
CN106407405A (zh) 一种基于婚恋匹配度搜索的社交***
CN113420058B (zh) 一种基于结合用户历史行为的对话式学术会议推荐方法
CN111581516A (zh) 投资产品的推荐方法及相关装置
Li et al. On integrating multiple type preferences into competitive analyses of customer requirements in product planning
CN106934067A (zh) 信息处理方法及电子设备
CN107976919A (zh) 一种智能机器人控制方法、***及电子设备
CN102880725B (zh) 一种基于按需服务组织的推荐方法
JP2022003586A (ja) 支援システム
CN106503189A (zh) 基于人工智能的搜索***优化方法和装置
CN113163063B (zh) 智能外呼***及方法
CN104657477A (zh) 社交推荐方法和装置
Huang et al. Applied to mobile multimedia intelligent speech system interactive topic guiding model
CN106874451A (zh) 一种自动建立个人专属语料库的方法
CN109857829A (zh) 一种地理信息数据融合***
CN110046204A (zh) 考虑关联性与优先关系的区间犹豫模糊图决策方法的构建
Biswas et al. A fuzzy goal programming method for solving chance constrained programming with fuzzy parameters
CN107193829B (zh) 应用程序推荐方法和装置
CN116961139A (zh) 一种电力***的调度方法、调度装置和电子装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant