CN113111155B - 信息展示方法、装置、设备及存储介质 - Google Patents

信息展示方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113111155B
CN113111155B CN202010027304.2A CN202010027304A CN113111155B CN 113111155 B CN113111155 B CN 113111155B CN 202010027304 A CN202010027304 A CN 202010027304A CN 113111155 B CN113111155 B CN 113111155B
Authority
CN
China
Prior art keywords
corpus
information
query information
user
corpora
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010027304.2A
Other languages
English (en)
Other versions
CN113111155A (zh
Inventor
俞林峰
刘钰帆
陈伟嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010027304.2A priority Critical patent/CN113111155B/zh
Publication of CN113111155A publication Critical patent/CN113111155A/zh
Application granted granted Critical
Publication of CN113111155B publication Critical patent/CN113111155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种信息展示方法、装置、设备及存储介质,其中,该方法可以包括:首先,接收用户输入的问询信息;接着,根据问询信息的关键词,确定与问询信息具有相似语义的第一语料;然后,展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。用以解决相关技术中,知识库的生成效率过低,以及语料内容具有局限性的问题。

Description

信息展示方法、装置、设备及存储介质
技术领域
本发明是涉及信息处理技术领域,尤其涉及一种信息展示方法、装置、设备及存储介质。
背景技术
随着移动互联网技术和电子设备的不断发展,智能机器人在服务领域的应用越来越广泛。其中,用于解答用户问题的智能机器人可以利用知识库中的数据最大限度匹配到用户的问询信息,以便反馈给用户想要的答案。
由于对于同一语义的描述,每个用户可能都会有所差别,所以,就需要在知识库中构建大量的语料,来保障智能机器人能够识别到每个问询信息。目前,知识库中的语料主要依靠工作人员根据业务经验编写。但是,这种依赖工作人员的业务经验进行手工输入语料的方式,导致知识库的生成效率过低,以及语料内容具有局限性。
发明内容
本发明一个或多个实施例描述了一种信息展示方法、装置、设备及存储介质,用以解决相关技术中,知识库的生成效率过低,以及语料内容具有局限性的问题。
为了解决上述技术问题,本发明是这样实现的:
根据第一方面,提供了一种信息展示方法,该方法可以包括:
接收用户输入的问询信息;
根据问询信息的关键词,确定与问询信息具有相似语义的第一语料;
展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。
根据第二方面,提供了一种信息辅助处理方法,该方法可以包括:
为用户提供信息交互界面;
基于输入知识信息的关键词,向用户提供与知识信息关系关联的至少一个关联知识;
基于用于在交互界面,对至少一个关联知识的确认操作,将确认的关联知识添加到知识库中。
根据第三方面,提供了一种信息展示装置,该装置可以包括:
接收模块,用于接收用户输入的问询信息;
处理模块,用于根据问询信息的关键词,确定与问询信息具有相似语义的第一语料;
展示模块,用于展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。
根据第四方面,提供了一种信息辅助处理装置,该装置可以包括:
显示模块,用于为用户提供信息交互界面;
处理模块,用于基于输入知识信息的关键词,向用户提供与知识信息关系关联的至少一个关联知识;
添加模块,用于基于用于在交互界面,对至少一个关联知识的确认操作,将确认的关联知识添加到知识库中。
根据第五方面,提供了一种计算设备,设备包括至少一个处理器和存储器,存储器用于存储有计算机程序指令,处理器用于执行存储器的程序,以控制计算设备实现如第一方面所示的信息展示方法,或者,实现如第二方面所示的信息辅助处理方法。
根据第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,若计算机程序在计算机中执行,则令计算机执行如第一方面所示的信息展示方法,或者,实现如第二方面所示的信息辅助处理方法。
本发明实施例的方案中,根据用户输入的正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,以使用户将多个语料添加到语料知识库中,如此,工作人员可以基于第一语料和问询信息的相似性,根据业务需要选择性的将第一语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题,以反馈给用户想要的答案。这样,可以解决目前知识库中的语料主要依靠工作人员根据业务经验编写,导致的知识库的生成效率过低,以及语料内容具有局限性,在一些场景下,基于手工输入的语料无法准确识别问询信息的问题。
附图说明
从下面结合附图对本发明的具体实施方式的描述中可以更好地理解本发明其中,相同或相似的附图标记表示相同或相似的特征。
图1示出根据一个实施例的信息展示方法的架构示意图;
图2示出根据一个实施例的一种信息展示方法的流程图;
图3示出根据一个实施例的一种信息展示的界面示意图;
图4所示出根据一个实施例的一种信息处理方法的流程图;
图5示出根据一个实施例的一种信息辅助处理方法的流程图;
图6示出根据一个实施例的信息展示装置的结构框图;
图7示出根据一个实施例的信息辅助处理装置的结构框图;
图8示出根据一个实施例的计算设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种测量的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前,用于解答用户问题的智能机器人可以利用知识库中的数据最大限度匹配到用户的问询信息,以便反馈给用户想要的答案。由于对于同一语义的描述,每个用户可能都会有所差别,所以,就需要在知识库中构建大量的语料,来保障智能机器人能够识别到每个问询信息。
其中,知识库中的语料主要依靠工作人员根据业务经验编写。但是,这种依赖工作人员的业务经验进行手工输入语料的方式,导致知识库的生成效率过低,以及语料内容具有局限性。
为了解决上述技术问题,本发明实施例提供了一种信息展示方法装置、设备及存储介质,具体如下所示。
首先,对本发明实施例提供的一种信息展示架构进行说明。
如图1所示,在计算设备接收到用户(例如:普通的客户或者工作人员)输入的问询信息(例如:A功能怎么用)时,计算设备根据该问询信息中的关键词(例如:“A功能”和“用”),确定与问询信息具有相似语义的第一语料(例如:怎么用A功能、在##应用中A功能怎么用、A功能在##应用中的用法等);接着,通过计算设备将包括上述第一语料的信息(例如:请在如下选项中,选择与问询信息相关的信息,即(1)怎么用A功能(2)在##应用中A功能怎么用(3)A功能在##应用中的用法)向工作人员展示。
这样,工作人员可以根据展示的第一语料和问询信息的相似性,根据业务需要选择性的将第一语料(例如:仅选择“怎么用A功能”和“在##应用中A功能怎么用”)添加到语料知识库中,以保障在用户提出问题(例如:A功能)时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题(例如:您想问的是“怎么用A功能”和“在##应用中A功能怎么用”),以在接收用户选择其中一个问题(例如:“在##应用中A功能怎么用”)时,反馈给用户想要的答案。
由此,在根据用户输入的海量正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,以便于用户在多个语料中选取所需语料添加到语料知识库中,如此,工作人员可以基于第一语料和问询信息的相似性,根据业务需要选择性的将第一语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题,以反馈给用户想要的答案。
另外,对于工作人员(例如:智能训练师)的应用场景来说,上述方法可以为智能训练师提供知识训练工具。即可以通过多个客户输入的知识信息(如某某问题)确定与该问题具有相关问法的至少一个关联知识,且在面向智能训练师的交互界面上显示,根据智能训练师对至少一个关联知识的确认操作,将确认的关联知识添加到知识库中。由此,可以解决目前知识库中的语料(即关联知识)主要依靠工作人员根据业务经验编写,导致的知识库的生成效率过低,以及语料内容具有局限性,在一些场景下,基于手工输入的语料无法准确识别问询信息的问题。
该方法一方面可以为工作人员提供多种语料选项,减少工作人员的工作;另一方面,还可以基于海量问询信息的逻辑,针对同一语义的描述,生成不用的描述方式,以保障智能机器人能够识别到每个问询信息。
需要提示的是,本发明实施例提供的方法,除了上述涉及的计算设备可以自动生成并展示与问询信息具有相似语义的多个语料,还可以提供辅助标注,即可以根据用户输入的海量正常问询信息,向工作人员提示可以增加什么类别的语料或者增加哪些语料。例如,在问询信息为“A功能怎么用”时,生成的与问询信息具有相似语义的多个语料可以为“可以添加在平台1中A功能怎么用的语料”、“可以添加在A功能在平台B有什么功能的语料”等。
这里,本发明实施例中的问询信息和与问询信息具有相似语义的多个语料都是以文本的形式进行举例说明,当然,在获取的问询信息是以图像的形式存在时,与问询信息具有相似语义的多个语料可以是文本的形式也可以是图像的形式,还可以是图像加文本的形式向工作人员进行提示。例如:在问询信息为图像的形式时,与问询信息具有相似语义的多个语料可以是在该图像上进行标注文本,并以标注后的图像和以文本的形式的辅助标注向工作人员进行提示。此外,在问询信息和/或与问询信息具有相似语义的多个语料还可以是音视频的形式时,本发明实施例中的方法同样适用。
其次,基于上述架构,本发明实施例结合图2和图3对本发明实施例提供的信息展示方法作出进一步说明。
图2示出根据一个实施例的一种信息展示方法的流程图。
如图2所示,该方法可以包括步骤210至步骤230:
首先,步骤210,接收用户输入的问询信息;其次,步骤220,根据问询信息的关键词,确定与问询信息具有相似语义的第一语料;然后,步骤230,展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。
下面分别对上述步骤进行详细说明:
首先,涉及步骤220,本发明实施例提供了三种可能的方式,这里,可以利用三种可能方式中的至少一种确定第一语料,具体方式如下所示:
方式一:根据问询信息的关键词通过粗排处理和/或精排处理,从历史语料知识库中确定第一语料。
举例说明,在问询信息的关键词数量较多时,在计算相关性或者权重等数据时,计算量过大,由此,可以对这些关键词进行两轮的排序,即第一轮通常为粗排处理,可以通过简单的规则将海量数据中的一小部分取出来,参与第二轮的精排处理,精排处理的排序规则较多,筛选出的数据更为精确。由此,将根据关键词信息,先通过粗排处理将历史语料知识库中的一小部分与关键词信息相关的数据取出来,参与第二轮的精排处理,以确定第一语料。
方式二:抽取问询信息的至少一个结构文本,至少一个结构文本中包括关键词;
根据特征词对关键词进行替换,得到第一语料;其中,特征词为关键词的近义词。
举例说明,在问询信息为“A功能在##应用中的用法”时,抽取“A功能在##应用中的用法”的结构文本,即主语“A功能”、谓语动词“用”和宾语“##应用”,其中,关键词可以为“A功能”、谓语动词“用”和宾语“##应用”中的至少一种。这是,可以根据特征词“B功能”替换“A功能”;或者,特征词“用”替换为“使用”、“运用”、“启用”、“引用”等;或者,特征词“##应用”替换为“@@应用”和/或“%%应用”。
这样,可以基于问询信息,确定语义相同,表达形式不同的多个问法。
方式三:根据句法分析的结构树对问询信息进行结构改写,得到至少一个关键词;
根据关键词的同义词对关键词进行替换,得到第一语料。
举例说明,在问询信息为“A功能在##应用中的用法”时,可以得到“A功能”、“用”和“##应用”关键词。这样,可以将整个问询信息进行改写,即“##应用中A功能的用法”。然后,在一些场景中,可以对“##应用中A功能的用法”中的关键词进行同义词替换,即“##应用中A功能怎么用”、“##应用中A功能如何启用”等。
需要提示的是,在一些场景中,为了保证第一语料符合法律规范,本发明实施例中,在步骤220之前,还可以对问询信息进行检测,识别该问询信息中是否包括违法或者敏感信息,具体的实现方式如下所示:
在检测到问询信息包括敏感词的情况下,通过内容安全监测对敏感词进行过滤。这样,可以减少在第一语料中出现敏感信息的可能性。
然后,步骤230,展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。
举例说明,如图3所示,在问询信息为“A功能在##应用中的用法”时,向工作人员展示的第一语料的信息可以包括:请在如下选项中,选择与问询信息相关的信息,即(1)##应用中A功能的用法、(2)##应用中A功能怎么用、(3)##应用中A功能如何启用等。
另外,在一种可能的实施例中,在步骤230之后,该方法还可以包括:
接收用户在多个第一语句中选取至少一个标准语句的预设输入;响应于预设输入,将用户选择的标准语句添加到语料知识库中。以便工作人员可以基于第一语料和问询信息的相似性,根据业务需要选择性的将第一语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题,以反馈给用户想要的答案。这样,根据用户输入的正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,也减少了工作人员的工作量。
此外,在一些场景下,由于可能会出现多个第一语料中,出现至少两个语料相同的可能,由此,需要对相同的语料进行去重处理,具体实现方式如下所示:
在第一语料为多个第一语料时,对第一语料进行去重处理,得到第二语料;
将第二语料输入到语言模型中,得到第二语料的评分数据。
这样,基于此,该步骤230具体可以包括:按照第二语料的评分数据展示包括第二语料的信息。进一步地,在第二语料为多个第二语料时,分别获取多个第二语料中每个第二语料的评分数据;按照评分数据从高到低的顺序展示包括多个第二语料的信息。
基于此,结合上述工作人员对语料进行选择的过程,在可能之后,还可以包括:接收用户在多个第二语料中选取至少一个标准语句的第一输入;响应于第一输入,将标准语句添加到语料知识库。
需要提示的是,虽然本发明实施例中涉及的是展示生成的第一语料,并由工作人员选择之后,添加到语料知识库中。但是,在一些场景中,本发明实施例中还可以无需用户选择,计算设备根据与第一语料相关联的业务类型,直接将生成的第一语料(或者第二语料)添加到与业务类型对应的语料知识库中(或者,将业务类型和第一语料的关联关系添加到语料知识库中)。
综上,本发明实施例提供的方法,可以根据用户输入的正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,以将多个语料添加到语料知识库中。如此,可以基于第一语料和问询信息的相似性,根据业务需要选择性的将第一语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题,以反馈给用户想要的答案。
由于,本发明实施例中涉及到的信息展示方法,涉及了根据用户输入,如何生成第一语料并为工作人员展示,以及工作人员如何根据这些生成的第一语料建立知识语料库。基于此,本发明实施例以两个阶段为例,对本发明实施例提供的信息展示方法进行进一步说明。
图4所示出根据一个实施例的一种信息处理方法的流程图。
如图4所示,该方法可以包括步骤410至步骤490,具体如下所示:
步骤410,接收用户输入的问询信息。
例如,问询信息为“A功能怎么用”。
步骤420根据问询信息的关键词,确定与问询信息具有相似语义的第一语料。
这里,问询信息的关键词可以为“A功能”和“用”。这样,可以通过本发明实施例中的三种模型(例如:检索模型、生成模型和末班模型)确定与问询信息具有相似语义的第一语料,具体实现方式如下:
首先,将关键词输入到检索模型中,以在历史语料数据库中提取与关键词相关的第一数据。接着,抽取问询信息的至少一个文本结构,其中,至少一个文本结构包括上述涉及到的“A功能”和“用”,通过特征词对其“A功能”和“用”进行替换,即将“A功能”替换为“B功能”和/或“C功能”,以及将“用”替换为“怎么使用”、“运用”、“怎么启用”和“引用”。然后,基于替换后的特征词和关键词通过模板模型,对问询信息的结构进行改写,以得到第一语料,其中,第一语料可以包括下述中的至少一种:“怎么运用A功能”、“怎么使用A功能”、“如何启用A功能”、“怎么引用A功能”、“A功能怎么运用”、“A功能怎么使用”、“A功能如何启用”、“A功能怎么引用”。
步骤430,检测问询信息中是否包括敏感词。
步骤440,在问询信息包括敏感词的情况下,通过内容安全监测对敏感词进行过滤。
这里,主要为了过滤一些非法词汇以及敏感信息,以保证第一语料的合法程度。
另外,在问询信息未包括敏感词的情况下,执行步骤450.
步骤450,对过滤后的第一语料进行去重处理,得到第二语料。
在第一语料为多个第一语料,且多个第一语料中包括多个相似的语料时,可以进行去重处理,以保证高效的为工作人员显示语料。
步骤460,将第二语料输入到语言模型中,得到第二语料的评分数据。
步骤470,按照评分数据从高到低的顺序向用户展示包括多个第二语料的信息。
这里,用户可以指代维护语料指示库的工作人员。由此,根据用户输入的正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,在减少人工主观因素干扰的同时,也减少了工作人员的工作量。
步骤480;接收用户在多个第二语料中选取至少一个标准语句的第一输入。
这里,工作人员可以基于第二语料和问询信息的相似性,根据业务需要选择性的将第二语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第二语料最大限度的识别到用户的问题,以反馈给用户想要的答案。
步骤490,响应于第一输入,将标准语句添加到语料知识库。
另外,上述涉及到对于工作人员(例如:智能训练师)的应用场景时,本发明实施例还提供了一种信息辅助处理方法。
如图5所示,该信息辅助处理方法具体可以包括:
步骤510,为用户提供信息交互界面。
需要提示的是,该实施例中的用户均可以指代工作人员即智能训练师。计算设备可以为智能训练师提供信息交互界面。
步骤520,基于输入知识信息的关键词,向用户提供与知识信息关系关联的至少一个关联知识。
其中,在一种可能的实施例中,在该步骤之前,还可以包括确定知识信息。进一步地,在本发明实施例中,确定知识信息的方式可以包括如下方式:
方式一:由工作人员手动确认,即根据对语料库中历史知识信息的确认操作,将确认的历史知识信息确定为知识信息。
方式二:有计算设备自动确认,即根据输入的初始信息,在语料库中筛选与初始信息相关联的相似知识信息;将相似知识信息确定为知识信息。
基于此,该步骤520具体可以包括基于输入知识信息的关键词,确定与知识信息具有相似问法的至少一个关联知识;向用户提供至少一个关联知识。
步骤530,基于用于在交互界面,对至少一个关联知识的确认操作,将确认的关联知识添加到知识库中。
其中,在交互界面中,显示至少一个关联知识;接收用户对至少一个关联知识中目标关联知识的确认操作;响应于确认操作,将目标关联知识添加到知识库中。
由此,可以解决目前知识库中的语料(即关联知识)主要依靠工作人员根据业务经验编写,导致的知识库的生成效率过低,以及语料内容具有局限性,在一些场景下,基于手工输入的语料无法准确识别问询信息的问题。
基于上述信息展示的方法和信息辅助处理方法,本发明实施例分别提供了一种信息展示装置以及一种信息辅助处理装置。
首先,图6示出根据一个实施例的信息展示装置的结构框图。
如图6所示,该信息展示装置600具体可以包括:
接收模块601,用于接收用户输入的问询信息;
处理模块602,用于根据问询信息的关键词,确定与问询信息具有相似语义的第一语料;
展示模块603,用于展示包括第一语料的信息,以使用户将第一语料添加到语料知识库中。
在本发明实施例中,可以通过下述3种方式中的至少一种方式,确定第一语料。
由此,在一种可能的实施例中,处理模块602具体可以用于,根据问询信息的关键词通过粗排处理和/或精排处理,从历史语料知识库中确定第一语料。
在另一种可能的实施例中,处理模块602具体可以用于,抽取问询信息的至少一个结构文本,至少一个结构文本中包括关键词;
根据特征词对关键词进行替换,得到第一语料;其中,特征词为关键词的近义词。
在又一种可能的实施例中,处理模块602具体可以用于,根据句法分析的结构树对问询信息进行结构改写,得到至少一个关键词;
根据关键词的同义词对关键词进行替换,得到第一语料。
另外,为了避免上述涉及的第一语料中出现敏感词或者非法词汇的可能性,本发明实施例中的信息展示装置600还可以过滤模块604,用于在检测到问询信息包括敏感词的情况下,通过内容安全监测对敏感词进行过滤。
再者,在第一语料为多个第一语料、且多个第一语料中出现重复的语料时,为了高效的显示语料的信息,本发明实施例中的信息展示装置600还可以去重模块606,用于在第一语料为多个第一语料时,对第一语料进行去重处理,得到第二语料;将第二语料输入到语言模型中,得到第二语料的评分数据。
基于此,本发明实施例中的展示模块603具体可以用于,按照第二语料的评分数据展示包括第二语料的信息。进一步地,展示模块603具体可以用于,在第二语料为多个第二语料时,分别获取多个第二语料中每个第二语料的评分数据;按照评分数据从高到低的顺序展示包括多个第二语料的信息。
这里,基于确定第二语料的可能性,本发明实施例中的接收模块还可以用于,接收用户在多个第二语料中选取至少一个标准语句的第一输入。基于此,本发明实施例中的处理模块602还可以用于,响应于第一输入,将标准语句添加到语料知识库。
另外,图7示出根据一个实施例的信息辅助处理装置的结构框图。
如图7所示,该信息辅助处理装置700具体可以包括:
显示模块701,用于为用户提供信息交互界面;
处理模块702,用于基于输入知识信息的关键词,向用户提供与知识信息关系关联的至少一个关联知识;
添加模块703,用于基于用于在交互界面,对至少一个关联知识的确认操作,将确认的关联知识添加到知识库中。
其中,在一种可能的实施例中,处理模块702还可以用于,确定知识信息。进一步地,根据用户对语料库中历史知识信息的确认操作,将确认的历史知识信息确定为知识信息;或者,根据输入的初始信息,在语料库中筛选与初始信息相关联的相似知识信息;将相似知识信息确定为知识信息。
本发明实施例的处理模块702具体可以用于,基于输入知识信息的关键词,确定与知识信息具有相似问法的至少一个关联知识;向用户提供至少一个关联知识。
本发明实施例的添加模块703,具体可以用于,在交互界面中,显示至少一个关联知识;接收用户对至少一个关联知识中目标关联知识的确认操作;响应于确认操作,将目标关联知识添加到知识库中。
由此,本发明实施例的方案中,根据用户输入的正常问询信息的逻辑,自动生成并展示与问询信息具有相似语义的多个语料,以使用户将多个语料添加到语料知识库中,如此,工作人员可以基于第一语料和问询信息的相似性,根据业务需要选择性的将第一语料添加到语料知识库中,以保障在用户提出问题时,智能机器人能够利用语料知识库中的第一语料最大限度的识别到用户的问题,以反馈给用户想要的答案。这样,可以解决目前知识库中的语料主要依靠工作人员根据业务经验编写,导致的知识库的生成效率过低,以及语料内容具有局限性,在一些场景下,基于手工输入的语料无法准确识别问询信息的问题。
图8示出根据一个实施例的计算设备的结构示意图。
如图8所示,能够实现根据本发明实施例信息展示方法、信息辅助处理方法、信息展示装置以及信息辅助处理装置的计算设备的示例性硬件架构的结构图。
该设备可以包括处理器801以及存储有计算机程序指令的存储器802。
具体地,上述处理器801可以包括中央处理器(CPU),或者特定集成电路(application specific integrated circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器802可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器802可包括硬盘驱动器(hard disk drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器802可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器802可在综合网关设备的内部或外部。在特定实施例中,存储器802是非易失性固态存储器。在特定实施例中,存储器802包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存,或者两个或及其以上这些的组合。
处理器801通过读取并执行存储器802中存储的计算机程序指令,以实现上述实施例中的任意一种方法。
收发器803,主要用于实现本发明实施例中各装置或者与其他设备中的通信。
在一个示例中,该设备还可包括总线804。其中,如图8所示,处理器801、存储器802和收发器803通过总线804连接并完成相互间的通信。
总线804包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、***控件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线803可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本发明实施例还提供了与上述信息展示方法对应的计算机可读存储介质。
在一种可能的实施例中,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行本发明实施例信息展示方法和信息辅助处理方法的步骤。
需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的***、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域的技术人员可以清楚地了解到,本发明的方法过程并不限于所描述和示出的具体步骤,任何熟悉本技术领域的技术人员在领会本发明的精神后,在本发明揭露的技术范围内作出各种改变、修改和添加,或者等效替换以及改变步骤之间的顺序,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种信息展示方法,包括:
接收用户输入的问询信息;
根据所述问询信息的关键词,确定与所述问询信息具有相似语义的第一语料;其中,所述根据所述问询信息的关键词,确定与所述问询信息具有相似语义的第一语料,包括:根据句法分析的结构树对所述问询信息进行结构改写,得到至少一个关键词;根据所述关键词的同义词对所述关键词进行替换,得到所述第一语料;
在所述第一语料为多个第一语料时,对所述第一语料进行去重处理,得到第二语料;将所述第二语料输入到语言模型中,得到所述第二语料的评分数据;
展示包括所述第一语料的信息,以使用户将所述第一语料添加到语料知识库中;其中,所述展示包括所述第一语料的信息,包括:按照所述第二语料的评分数据展示包括所述第二语料的信息。
2.根据权利要求1所述的方法,其中,在根据所述问询信息的关键词,确定与所述问询信息具有相似语义的第一语料的步骤之前,所述方法还包括:
在检测到所述问询信息包括敏感词的情况下,通过内容安全监测对所述敏感词进行过滤。
3.根据权利要求1所述的方法,其中,所述按照所述第二语料的评分数据展示包括所述第二语料的信息,包括:
在所述第二语料为多个第二语料时,分别获取所述多个第二语料中每个第二语料的评分数据;
按照所述评分数据从高到低的顺序展示包括所述多个第二语料的信息。
4.根据权利要求3所述的方法,其中,所述方法还包括:
接收用户在多个第二语料中选取至少一个标准语句的第一输入;
响应于所述第一输入,将所述标准语句添加到所述语料知识库。
5.一种信息展示装置,包括:
接收模块,用于接收用户输入的问询信息;
处理模块,用于根据所述问询信息的关键词,确定与所述问询信息具有相似语义的第一语料;其中,所述处理模块具体用于根据句法分析的结构树对所述问询信息进行结构改写,得到至少一个关键词;根据所述关键词的同义词对所述关键词进行替换,得到所述第一语料;以及,在所述第一语料为多个第一语料时,对所述第一语料进行去重处理,得到第二语料;将所述第二语料输入到语言模型中,得到所述第二语料的评分数据;
展示模块,用于展示包括所述第一语料的信息,以使用户将所述第一语料添加到语料知识库中;其中,所述展示模块具体用于,按照所述第二语料的评分数据展示包括所述第二语料的信息。
6.一种计算设备,其中,所述设备包括至少一个处理器和存储器,所述存储器用于存储有计算机程序指令,所述处理器用于执行所述存储器的所述程序,以控制所述设备实现如权利要求1-4中的任意一种信息展示方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其中,若所述计算机程序在计算机中执行,则令计算机执行如权利要求1-4中的任意一种信息展示方法。
CN202010027304.2A 2020-01-10 2020-01-10 信息展示方法、装置、设备及存储介质 Active CN113111155B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010027304.2A CN113111155B (zh) 2020-01-10 2020-01-10 信息展示方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010027304.2A CN113111155B (zh) 2020-01-10 2020-01-10 信息展示方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113111155A CN113111155A (zh) 2021-07-13
CN113111155B true CN113111155B (zh) 2024-04-19

Family

ID=76708814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010027304.2A Active CN113111155B (zh) 2020-01-10 2020-01-10 信息展示方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113111155B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678418A (zh) * 2012-09-25 2014-03-26 富士通株式会社 信息处理方法和信息处理设备
CN106294358A (zh) * 2015-05-14 2017-01-04 北京大学 一种信息的检索方法及***
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
CN108509617A (zh) * 2018-04-04 2018-09-07 上海智臻智能网络科技股份有限公司 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端
CN109196496A (zh) * 2016-05-31 2019-01-11 微软技术许可有限责任公司 未知词预测器和内容整合的翻译器
CN109739964A (zh) * 2018-12-27 2019-05-10 北京拓尔思信息技术股份有限公司 知识数据提供方法、装置、电子设备和存储介质
CN109800879A (zh) * 2018-12-21 2019-05-24 科大讯飞股份有限公司 知识库构建方法和装置
CN110162611A (zh) * 2019-04-23 2019-08-23 苏宁易购集团股份有限公司 一种智能客服应答方法及***
CN110209804A (zh) * 2018-04-20 2019-09-06 腾讯科技(深圳)有限公司 目标语料的确定方法和装置、存储介质及电子装置
CN110297880A (zh) * 2019-05-21 2019-10-01 深圳壹账通智能科技有限公司 语料产品的推荐方法、装置、设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678418A (zh) * 2012-09-25 2014-03-26 富士通株式会社 信息处理方法和信息处理设备
CN106294358A (zh) * 2015-05-14 2017-01-04 北京大学 一种信息的检索方法及***
CN109196496A (zh) * 2016-05-31 2019-01-11 微软技术许可有限责任公司 未知词预测器和内容整合的翻译器
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107993724A (zh) * 2017-11-09 2018-05-04 易保互联医疗信息科技(北京)有限公司 一种医学智能问答数据处理的方法及装置
CN108509617A (zh) * 2018-04-04 2018-09-07 上海智臻智能网络科技股份有限公司 知识库构建、基于知识库的智能问答方法及装置、存储介质、终端
CN110209804A (zh) * 2018-04-20 2019-09-06 腾讯科技(深圳)有限公司 目标语料的确定方法和装置、存储介质及电子装置
CN109800879A (zh) * 2018-12-21 2019-05-24 科大讯飞股份有限公司 知识库构建方法和装置
CN109739964A (zh) * 2018-12-27 2019-05-10 北京拓尔思信息技术股份有限公司 知识数据提供方法、装置、电子设备和存储介质
CN110162611A (zh) * 2019-04-23 2019-08-23 苏宁易购集团股份有限公司 一种智能客服应答方法及***
CN110297880A (zh) * 2019-05-21 2019-10-01 深圳壹账通智能科技有限公司 语料产品的推荐方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于低维语义向量模型的语义相似度度量;蔡圆媛;卢苇;;中国科学技术大学学报;20160915(09);全文 *

Also Published As

Publication number Publication date
CN113111155A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN107247707B (zh) 基于补全策略的企业关联关系信息提取方法和装置
CN109359175B (zh) 电子装置、诉讼数据处理的方法及存储介质
US9514417B2 (en) Cloud-based plagiarism detection system performing predicting based on classified feature vectors
CN112631997B (zh) 数据处理方法、装置、终端及存储介质
CN111310440B (zh) 文本的纠错方法、装置和***
US9898464B2 (en) Information extraction supporting apparatus and method
CN109684627A (zh) 一种文本分类方法及装置
CN107102993B (zh) 一种用户诉求分析方法和装置
EP3690676A1 (en) Method, apparatus, computer device and storage medium for verifying community question answer data
US20120150825A1 (en) Cleansing a Database System to Improve Data Quality
CN110032734B (zh) 近义词扩展及生成对抗网络模型训练方法和装置
CN110597978A (zh) 物品摘要生成方法、***、电子设备及可读存储介质
CN111506595B (zh) 一种数据查询方法、***及相关设备
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN111444718A (zh) 一种保险产品需求文档处理方法、装置及电子设备
CN105378706A (zh) 实体提取反馈
CN113158695A (zh) 一种面向多语言混合文本的语义审核方法与***
CN114048129A (zh) 软件功能变更的自动化测试方法、装置、设备及***
CN111210321B (zh) 一种基于合同管理的风险预警方法及***
CN113111155B (zh) 信息展示方法、装置、设备及存储介质
US20220092453A1 (en) Systems and methods for analysis explainability
CN114840668A (zh) 网络文本审核方法、电子设备及存储介质
CN113378561A (zh) 词语预测模板生成方法及装置
CN113919352A (zh) 数据库敏感数据识别方法及装置
CN111782601A (zh) 电子文件的处理方法、装置、电子设备及机器可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant