CN114610845A - 基于多***的智能问答方法、装置和设备 - Google Patents

基于多***的智能问答方法、装置和设备 Download PDF

Info

Publication number
CN114610845A
CN114610845A CN202210201842.8A CN202210201842A CN114610845A CN 114610845 A CN114610845 A CN 114610845A CN 202210201842 A CN202210201842 A CN 202210201842A CN 114610845 A CN114610845 A CN 114610845A
Authority
CN
China
Prior art keywords
question
information
determining
answer
question information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210201842.8A
Other languages
English (en)
Other versions
CN114610845B (zh
Inventor
冯欣伟
田孟
李斐斐
时鸿剑
姜文斌
***
郭辰阳
王煜
孙雨
陈帅宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210201842.8A priority Critical patent/CN114610845B/zh
Publication of CN114610845A publication Critical patent/CN114610845A/zh
Priority to US17/820,285 priority patent/US20220391426A1/en
Priority to KR1020220103564A priority patent/KR20220123187A/ko
Priority to JP2022131721A priority patent/JP2022166260A/ja
Application granted granted Critical
Publication of CN114610845B publication Critical patent/CN114610845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Alarm Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开提供了一种基于多***的智能问答方法、装置和设备,涉及人工智能领域,尤其涉及知识图谱领域。具体实现方案为:响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别;确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***;在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。

Description

基于多***的智能问答方法、装置和设备
技术领域
本公开涉及人工智能中的知识图谱,尤其涉及一种基于多***的智能问答方法、装置和设备。
背景技术
随着智能技术和自然语言技术的发展,可以为用户提供智能问答。用户提供语音问题或文本问题,然后智能***为用户提供答案。
现有技术中,可以采用常见问题解答(frequently-asked questions,简称FAQ)***处理用户输入的问题信息,然后为用户输出答案。
但是上述方式中,在FAQ***中预先架构了问题、以及与问题对应的答案;然后通过直接搜索与问题对应的答案的方式,去确定出答案,若FAQ***中没有预先构建答案,则无法查询出与用户输入的问题信息对应的答案,无法满足广泛的答案需求。
发明内容
本公开提供了一种基于多***的智能问答方法、装置和设备。
根据本公开的第一方面,提供了一种基于多***的智能问答方法,包括:
响应于用户的问答指令,其中,所述问答指令用于指示问题信息,确定所述问题信息的问题类别;
确定与所述问题类别对应的查询引擎,并根据所述查询引擎调用与所述查询引擎对应的多个问题分析***;
在依据问题分析***的***优先级,依次采用所述多个问题分析***对所述问题信息进行处理的过程中,若依据当前问题分析***确定出与所述问题信息对应的答案信息,则向用户反馈所述答案信息。
根据本公开的第二方面,提供了一种基于多***的智能问答装置,包括:
第一确定单元,用于响应于用户的问答指令,其中,所述问答指令用于指示问题信息,确定所述问题信息的问题类别;
调用单元,用于确定与所述问题类别对应的查询引擎,并根据所述查询引擎调用与所述查询引擎对应的多个问题分析***;
第二确定单元,用于在依据问题分析***的***优先级,依次采用所述多个问题分析***对所述问题信息进行处理的过程中,若依据当前问题分析***确定出与所述问题信息对应的答案信息,则向用户反馈所述答案信息。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本公开的技术解决了当前FAQ***无法满足用户广泛的答案需求的问题。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第一实施例的示意图;
图3是根据本公开第二实施例的示意图;
图4是根据本公开第三实施例的示意图;
图5是根据本公开第四实施例的示意图;
图6是根据本公开第五实施例的示意图;
图7是根据本公开第六实施例的示意图;
图8是根据本公开第七实施例的示意图;
图9是根据本公开第八实施例的示意图;
图10是根据本公开第九实施例的示意图;
图11是用来实现本公开实施例的基于多***的智能问答的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开提供一种基于多***的智能问答方法、装置和设备,应用于人工智能领域中的知识图谱领域,以达到解决当前FAQ***无法满足用户广泛的答案需求的问题。
在本公开中,图1是根据本公开第一实施例的示意图,其中,包括了多个问题分析***,在决策应用层101中获取到用户的问答指令后,在决策应用层101对该用户的问答指令进行分类,确定好该用户的问答指令所指示的问题信息,根据该问题信息确定最终的问题类别,其中,问题类别是在查询引擎层102,在查询引擎层102确定好问题类别后,在核心服务层103确定问题分析***的类别,问题分析***从基础数据层104中的多种数据库中获取数据信息,其中,基础数据层104中的数据类型包括知识图谱、SQL/表格、规则库、文档库、FAQ库以及专名词库。
图2是根据本公开第一实施例的示意图,本公开提供了一种基于多***的智能问答方法,包括:
S201、响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
在一个示例中,用户的问答指令是指用户在企业文档中发送的查询指令消息,其中,查询指令消息可以是文字形式的,也可以是语音形式的。进一步地,企业文档可以包括图片、目录、标题、表格和公式等内容,企业文档中所包含内容的篇幅较大,所包含的内容的种类也比较多。因此,需要根据用户的问答指令分析出问答指令指示的问题信息的问题类别,根据问题类别再在企业文档中查询用户的问答指令。其中,问题类别用于区分用户的问答指令的类型。这样设置的好处是能够根据不同的问题类别,对该问题类别所需的数据进行查询,提高查询效率。
S202、确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
在一个示例中,查询引擎是指依据预设的算法为用户提供全面的信息服务,其中,预设的算法包括网络爬虫算法、检索排序算法、网页处理算法、大数据处理算法和自然语言处理算法。本实施例中,不同的查询引擎所确定的问题分析***中的内容是不同的,例如,查询引擎可以包括数字类引擎、短文本类引擎、长文本类引擎、泛需求类引擎和判断类引擎。这样设置的好处是不同的引擎所采用的算法是不同的,进而提高查询效率。
S203、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
本实施例中,在获取到问题分析***的***优先级的顺序后,若当前的问题分析***的优先级是第一优先级,则按照当前的问题分析***对问题信息进行处理,并根据当前的问题分析***获取与该问题信息对应的答案信息,并将答案信息反馈至用户,若第一优先级的问题分析***所获取的答案信息为空,则通过第二优先级的问题分析***对问题信息进行处理,并根据第二优先级的问题分析***获取与该问题信息对应的答案信息,并将答案信息反馈至用户,若第二优先级的问题分析***所获取的答案信息也为空,则通过第三优先级的问题分析***对问题信息进行处理,直至获取到答案信息。进一步地,不同的问题分析***在对同一个问题信息进行处理的过程中,所确定的答案信息是不同的,优先级高的问题分析***所确定的答案信息比优先级低的问题分析***所确定的答案信息准确。
本公开提供一种基于多***的智能问答方法,通过响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别,确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***,在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。采用本技术方案,能够解决当前FAQ***无法满足用户广泛的答案需求的问题。
图3是根据本公开第二实施例的示意图,本公开提供了一种基于多***的智能问答方法,包括:
S301、响应于用户的问答指令,其中,问答指令用于指示问题信息,提取问题信息的关键信息,其中,关键信息包括实体词语和/或语气词语。
在一个示例中,问题信息包括多个关键信息,其中,不同的关键信息所代表的含义不同,进一步地,关键信息包括实体词语和语气词语;还可以是关键信息包括实体词语或语气词语,其中,实体词语可以是地名、人名或者属性,语气词语可以是吗、的或者和等连接词语。
本实施例中,通过提取问题信息中的关键信息,能够分析出问题信息所代表的语义内容,例如,问题信息可以是A的身高是多少?则该问题信息中的关键信息为实体词语“A”,语气词语“的”,实体词语“身高”,语气词语“是”和语气词语“多少”。
S302、根据预设的关键信息与问题类别之间的对应关系,确定问题信息的问题类别;其中,问题类别为以下的一种:数字类别、短文本类别、长文本类别、泛需求类别、判断类别。
在一个示例中,预设的关键信息与问题类别之间存在对应关系,例如,预设的关键信息可以是“多少”对应问题类别中的数字类别;预设的关键信息还可以是“是否”对应问题类别中的判断类别等。在获取到关键信息后,根据预设的关键信息与问题类别的对应关系,确定该问题信息所属的问题类别。
S303、根据预设的问题类别与查询引擎的映射关系,确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
在一个示例中,预设的问题类别与查询引擎之间存在映射关系,不同的问题类别所使用的查询引擎不同,由于不同的查询引擎所使用的算法不同,因此,确定的查询引擎不同后,调用问题分析***所使用的算法是不同的,且调用的问题分析***分析的数据的种类也是不同的。但是,不同的查询引擎所调用的问题分析***的优先级是相同的。
进一步地,其中,多个问题分析***,包括:知识图谱***、推理问答***、文档问答***、常见问题解答FAQ问答***。
其中,知识图谱***用于指示问题信息中的实体对应的答案信息。
推理问答***用于指示与问题信息对应的推理模板,其中,推理模板用于确定答案信息;推理模板中包括具有次序关系的多个填充点,填充点具有词语特性。
文档问答***用于指示与问题信息对应的段落,其中,段落用于确定答案信息。
FAQ问答***用于指示与问题信息相关的其他问题,其他问题和问题信息用于确定答案信息。
本实施例中,知识图谱***是显示知识发展进程与结构关系的一系列各种不同的图形所组成的***,能够用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱***可以从知识图谱的知识库,输入问题信息,通过对问题信息进行语义理解和解析,自动从知识图谱库中查询、计算、推理找到答案。
推理问答***是借助一定推理规则进行查询计算得到答案的***,其中,推理规则可以是简单的答案计算逻辑。
文档问答***是指面向文档知识库的问答***,核心技术是机器阅读理解,其中,机器阅读理解是指让机器阅读文本,然后回答和阅读内容相关的问题,并使计算机具备从文本数据中获取知识并回答问题的能力。
常见问题解答(frequently-asked questions,简称FAQ)FAQ问答***通过预先提供一些可能的常见问答对,并将上述常见问答对进行公开。这样设置的好处是将多个问题分析***结合进行使用,能够很好地利用每一个问题分析***的优点。
进一步地,其中,***优先级为预设的;或者,***优先级为用户所确认的;或者,***优先级表征了问题分析***所包含的数据的数据量。
本实施例中,***优先级可以是预设的,例如,***优先级从高到低可以为常见问题解答FAQ问答***、知识图谱***、推理问答***和文档问答***。还可以是用户确认的***优先级,此时所设定的***优先级可以根据用户偏好设置,例如,用户需要知识图谱***的优先级高于文档问答***,则优先设置知识图谱***的优先级次序。这样设置的好处是可以适应多种使用场景,进而使得推荐的答案信息的准确度比较高。
进一步地,***优先级还可以是问题分析***所包含的数据的数据量的多少,数据量多的问题分析***的优先级高,数据少的问题分析***的优先级低。例如,若文档问答***中的数据的数据量大于FAQ问答***中的数据的数据量,则将文档问答***的***优先级设置为优先级高于FAQ问答***的***优先级。
S304、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
示例性地,本步骤可以参见步骤S203,在此不再赘述。
本公开提供一种基于多***的智能问答方法,通过响应于用户的问答指令,其中,问答指令用于指示问题信息,提取问题信息的关键信息,其中,关键信息包括实体词语和/或语气词语,根据预设的关键信息与问题类别之间的对应关系,确定问题信息的问题类别;根据预设的问题类别与查询引擎的映射关系,确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***,在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。采用本技术方案,能够提升答案信息的整体召回率,并解决了问题信息语义和泛化的问题。
图4是根据本公开第三实施例的示意图,本公开提供了一种基于多***的智能问答方法,是在上述实施例的基础上,根据当前问题分析***的不同,确定出与问题信息对应的答案信息,该方法包括:
S401、响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
示例性地,本步骤可以参见步骤S201,在此不再赘述。
S402、确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
示例性地,本步骤可以参见步骤S202,在此不再赘述。
S403、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若当前问题分析***为文档问答***,则依据当前问题分析***确定出与问题信息对应的答案信息。
在一个示例中,若当前问题分析***为文档问答***,则依据当前问题分析***确定出与问题信息对应的答案信息,包括:
根据文档问答***中的第一数据库,对问题信息进行相似性匹配,得到与问题信息对应的最优段落;其中,第一数据库中包括多个文档,文档具有多个段落。
根据第一通过知识集成的增强表示ERNIE模型,对最优段落进行字数精简处理,得到与问题信息对应的答案信息。
本实施例中,第一数据库包括文档库和专名词库。在确定当前问题分析***为文档问答***后,则在第一数据库中确定问题信息的相似内容,具体的,可以是通过对问题信息进行相似性匹配,将相似性最高的段落确定为对应的最优段落。例如,第一数据库中包括不同的文档类型,可以是新闻类的文档内容、问答搜索类的文档内容和文献资料类的文档内容。通过在新闻类的文档内容、问答搜索类的文档内容和文献资料类的文档内容中对问题信息进行相似性匹配,确定相似性高的文档中的最优段落,并将最优段落通过ERNIE(通过知识集成的增强表示,enhanced representation through knowledge integration)模型,对最优段落进行无意义词汇的删除,例如,将最优段落中的“是、吗、的”进行删除,进而得到比较精简的答案信息。
进一步地,ERNIE模型可以通过预设的问题信息以及该问题信息所对应的精简的答案信息进行训练,进而使得将问题信息输入至ERNIE模型后,通过ERNIE模型可以精简最优段落的字数。这样设置的好处是在文档问答***中加入ERNIE模型,可以使得最后的答案信息的准确度比较高。
在一个示例中,其中,根据文档问答***中的第一数据库,对问题信息进行相似性匹配,得到与问题信息对应的最优段落,包括:
根据文档问答***中的第一数据库,对问题信息进行相似性匹配,得到与问题信息相似的多个候选段落;并获取问题信息对应的核心要素信息;
对核心要素信息和候选段落进行相似度计算,确定相似度最高的候选段落,为与问题信息对应的最优段落。
本实施例中,其中,核心要素信息包括以下的一种或多种:用户位置信息、用户属性信息、用户所采用的终端设备的信息。这样设置的好处是可以通过增加核心要素信息的内容,提高候选段落相似度的准确性。
在一个示例中,在第一数据库中确定与问题信息相似的多个候选段落,在确定多个候选段落后,获取问题信息中的核心要素信息,其中,核心要素信息可以是用户位置信息、用户属性信息和用户所采用的终端设备的信息。其中,用户属性信息可以是用户的姓名、用户的身高、用户的年龄和用户的偏好等可以描述用户自身特征的信息。
本实施例中,通过将核心要素信息与多个候选段落进行相似度计算,确定出相似度最高的候选段落,并将相似度最高的候选段落作为最优段落。这样设置的好处是通过核心要素信息和多个候选段落,能够快速地确定出与问题信息对应的最优段落,这样可以提高最优段落的准确度。
S404、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若当前问题分析***为FAQ问答***,则依据当前问题分析***确定出与问题信息对应的答案信息。
在一个示例中,若当前问题分析***为FAQ问答***,则依据当前问题分析***确定出与问题信息对应的答案信息,包括:
根据FAQ问答***中的第二数据库,对问题信息进行相似性匹配,得到与问题信息相似的多个问题文本;其中,第二数据库中包括多个问题文本。
根据问题信息、以及与问题信息相似的多个问题文本,确定与问题信息对应的答案信息。
在一个示例中,第二数据库包括FAQ库和专名词库,在第二数据库中确定与问题信息相似的多个问题文本,再根据问题信息和多个问题文本共同确定与问题信息对应的答案信息。例如,问题信息为“A的年纪是多少?”,则可以在第二数据库中对该问题信息进行相似性匹配,可以得到的多个问题文本为“A的出生年月是多少?”“A今年是多少岁?”,再根据得到的问题信息和多个问题文本共同确定对应的答案信息。这样设置的好处是可以提高问题信息的泛化能力,进而使得反馈的答案信息更为准确。
在一个示例中,其中,根据问题信息、以及与问题信息相似的多个问题文本,确定与问题信息对应的答案信息,包括:
确定问题信息、以及与问题信息相似的多个问题文本,为问题集合中的候选问题;其中,候选问题具有特征信息。
将问题集合中的候选问题的特征信息,输入至预设神经网络模型中,得到最优的候选问题。
根据预设的候选问题与答案信息之间的对应关系,确定与最优的候选问题对应的答案信息,为与问题信息对应的答案信息。
本实施例中,将问题信息以及多个问题文本确定为问题集合中的候选问题,其中,候选问题具备同一个特征信息,例如,候选问题中包括的问题有:“A的年纪是多少?”、“A的出生年月是多少?”和“A今年是多少岁?”上述候选问题中的特征信息为年纪,则将获取到的年纪这个特征信息输入至神经网络模型中,确定出最优的候选问题,并根据最优的候选问题与答案信息之间的对应关系,确定出答案信息,并将该答案信息作为该问题信息对应的答案信息。例如,最优候选问题为“A今年是多少岁?”,则得到的答案信息为27,则将27作为问题信息“A的年纪是多少?”的答案信息。这样设置的好处是确定出最优候选问题后,直接将最优候选问题对应的答案信息作为最后的答案信息,可以节省确定答案信息的时间。
在一个示例中,第二数据库中的多个问题文本的生成过程如下:
获取原始文档,对原始文档进行切分处理,得到多个短文本;根据第二ERNIE模型对短文本进行遮挡处理,生成第二数据库中的问题文本;
或者,获取原始文档,并确定原始文档中的标题;确定标题,为第二数据库中的问题文本。
或者,获取原始文档,并对原始文档进行内容结构分析处理,得到具有提问特性的短片段;将短片段和短片段在原始文档中的原始段落,输入至预设模型中,得到第二数据库中的问题文本;其中,短片段为所得到的问题文本对应的答案信息。
本实施例中,原始文档可以是以各种形式存在的文档数据,获取原始文档后,对原始文档进行切分处理,可以是按照语义关系对原始文档进行切分,例如,可以将原始文档中表达同一个语义的文档进行切分,进而得到多个短文本,并根据第二ERNIE模型对短文本中的部分词语进行遮挡处理,进而得到多个问题文本。其中,所采用的技术有:段落识别技术、答案段落识别技术、问答段落匹配技术以及噪声降噪技术。
本实施例中,获取原始文档后,提取原始文档的标题或者子标题,将标题或者子标题修改为问题的形式或者将标题进行拼接后作为问题文本。
本实施例中,获取原始文档后,对原始文档中的文字内容进行分析,具体的,可以是内容结构分析处理,将原始文档中的连接词进行提取,得到具有提问特性的短片段后,将短片段和短片段所在原始段落输入至神经网络模型中,确定出第二数据库中的问题文本。这样设置的好处是尽可能多地提供第二数据库中的问题文本,以供后续的问题信息的查询。
S405、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若当前问题分析***为知识图谱***,则依据当前问题分析***确定出与问题信息对应的答案信息。
在一个示例中,若当前问题分析***为知识图谱***,则依据当前问题分析***确定出与问题信息对应的答案信息,包括:
提取问题信息中的实体。
根据知识图谱***中预设知识图谱以及第三ERNIE模型,对问题信息中的实体进行识别,得到与问题信息对应的答案信息;其中,预设知识图谱中包括多个实体,预设知识图谱中的实体之间具有连接关系,第三ERNIE模型用于处理问题信息中的实体。
在一个示例中,提取问题信息中的实体后,通过知识图谱***中预设知识图谱以及第三ERNIE模型,在预设知识图谱中确定实体后,并确定与实体相关的答案信息,进一步地,实体的识别是通过第三ERNIE模型实现的。这样设置的好处是通过使用ERNIE模型,提高知识图谱***确定实体的准确率。
在一个示例中,其中,根据知识图谱***中预设知识图谱以及第三ERNIE模型,对问题信息中的实体进行识别,得到与问题信息对应的答案信息,包括:
根据第三ERNIE模型对问题信息中的实体进行遮蔽处理,得到多个相关实体。
将问题信息中的实体、以及所得到的相关实体,输入至预设知识图谱中,得到多个初始答案。
根据第三ERNIE模型对多个初始答案进行打分处理,得到问题信息对应的答案信息。
本实施例中,将问题信息中所识别出的实体进行遮蔽处理后,确定出与该实体相关的多个相关实体后,将问题信息中的实体和相关实体输入至预设知识图谱中,确定出多个初始答案,然后再通过第三ERNIE模型对多个初始答案进行打分处理,得到与问题信息对应的答案信息。这样设置的好处是能够提高确定的答案信息的准确率。
在一个示例中,若当前问题分析***为知识图谱***,则依据当前问题分析***确定出与问题信息对应的答案信息,包括:
提取问题信息中的关键词,其中,关键词具有词语特性。
根据知识图谱***中的预设的规则模板库、以及问题信息中的关键词的词语特性,对问题信息进行匹配处理,确定与问题信息对应的规则模板。其中,规则模板库中包括多个规则模板,规则模板中包括不具有次序关系的多个槽位,槽位表征词语特性,规则模板中的各槽位的词语特性不同。
根据与问题信息对应的规则模板,对问题信息进行答案匹配,得到与问题信息对应的答案信息。
本实施例中,提取问题信息中的关键词,其中,问题信息中的每一个词语均为关键词,只是关键词所属的词语特性是不同的,其中,词语特性包括实体、属性、疑问词、停用词、联接词和跳转词。本实施例中的槽位就是放置关键词的一个位置,不同的槽位放置的关键词不同。
本实施例中,根据预设的规则模板库中,确定问题信息中关键词所包含的词语特性,并在确定好问题信息对应的规则模板中,将问题信息进行答案匹配。
本实施例中,规则模板库中包括实体、属性和疑问词一种规则,还包括属性、疑问词和联接词一种规则,以及实体、跳转词和属性一种规则。例如,问题信息中所包含的词语特性为实体、属性和疑问词,则将该问题信息对应规则模板库中的第一种规则,并通过第一种规则确定该问题信息对应的答案信息。这样设置的好处是能够预先提供规则模板,快速定位问题信息。
在一个示例中,规则模板具有预设的细规则库,其中,细规则库中包括规则模板对应的多个细规则表,细规则表中包括具有次序关系的多个槽位;细规则表中的各槽位的词语特性不同,或者,细规则表中的部分槽位的词语特性相同。
根据知识图谱***中的预设的规则模板库、以及问题信息中的关键词的词语特性,对问题信息进行匹配处理,确定与问题信息对应的规则模板,包括:
根据细规则库的预设的细规则库、问题信息中的不同的词语特性的关键词的数量、以及问题信息中的不同的词语特性的关键词的连接关系,对问题信息进行匹配处理,确定与问题信息对应的细规则表。
将问题信息中的关键词,填充至与问题信息对应的细规则表中,得到问题描述信息;并根据预设的问题描述信息和答案信息之间的对应关系,确定与所得到的问题描述信息对应的答案信息,为与问题信息对应的答案信息。
本实施例中,规则模板中包括多个细规则库,每一个规则模板中的多个槽位的词语特性是相同的,但是每一个规则模板中的细规则表中的多个槽位是具备次序关系的,例如,规则模板的第一种规则为实体、属性和疑问词,则细规则库中包括的细规则可以为实体、属性和疑问词这一种规则,还可以包括实体、属性、实体和疑问词这一种规则,以及还可以包括实体、疑问词和属性这一种规则。
本实施例中,确定问题信息中的不同词语特性的关键词的数量、以及问题信息中不同的词语特性中的关键词的连接关系后,对该问题信息进行匹配处理,确定与问题信息对应的细规则表,例如,此时确定的细规则表为实体、属性和疑问词,则将问题信息中的关键词进行填充,利用细规则表中的问题信息确定对应的答案信息。例如,问题信息为“A的年纪是多少?”其中,“A”为实体、“的”为联接词、“年纪”为属性、“是”为联接词和“多少”为疑问词,则可以在规则模板库中确定实体、联接词、属性和疑问词的规则模板,在这个规则模板中确定两个联接词、一个实体词、一个属性、一个疑问词的细规则表,得到问题描述信息;进而根据预设的问题描述信息和答案信息之间的对应关系,确定与所得到的问题描述信息对应的答案信息,该答案信息为与问题信息对应的答案信息。这样设置的好处是能够提升答案信息的整体召回率。
S406、在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若当前问题分析***为推理问答***,则依据当前问题分析***确定出与问题信息对应的答案信息。
在一个示例中,若当前问题分析***为推理问答***,则依据当前问题分析***确定出与问题信息对应的答案信息,包括:
提取问题信息的关键词,其中,关键词具有词语特性。
根据推理问答***中的预设的推理规则模板库、问题信息中的关键词的词语特性、以及问题信息中的关键词之间的次序关系,对问题信息进行匹配处理,确定与问题信息对应的推理模板;其中,推理规则模板库中包括多个推理模板,推理模板中包括具有次序关系的多个填充点,填充点具有词语特性。
获取问题信息对应的核心要素信息,并根据问题信息对应的核心要素信息、以及与问题信息对应的推理模板,确定与问题信息对应的答案信息。
本实施例中,推理模板中多个填充点是具备次序的,在填充点的词语特性相同的情况下,如果填充点的词语特性次序不同的情况下,所表示的推理模板是不同的,通过确定问题信息对应的核心要素信息、以及问题信息对应的推理模板共同确定与问题信息对应的答案信息。这样设置的好处是能够满足用户广泛的问答需求。
在一个示例中,根据问题信息对应的核心要素信息、以及与问题信息对应的推理模板,确定与问题信息对应的答案信息,包括:
根据预设的神经网络模型对与问题信息对应的各推理模板进行识别,确定出最优推理模板。
根据问题信息对应的核心要素信息以及最优推理模板,确定与问题信息对应的答案信息。
本实施例中,将多个推理模板输入至预设的神经网络模型中,通过预设的神经网络模型确定出最优推理模板后,再获取问题信息对应的核心要素信息,结合两者共同确定与问题信息对应的答案信息。这样设置的好处是提高了答案信息的鲁棒性。
在一个示例中,根据问题信息对应的核心要素信息以及最优推理模板,确定与问题信息对应的答案信息,包括:
确定核心要素信息的词语特性,并得到核心要素信息的词语特性对应的填充点。
将核心要素信息的词语特性对应的填充点,加入到最优推理模板中,得到最终的推理模板。
将问题信息的关键词和问题信息对应的核心要素信息,填充到最终的推理模板的各填充点中,得到推理语句。
根据预设推理语句与答案信息之间的对应关系,确定与所得到的推理语句对应的答案信息,为与问题信息对应的答案信息。
本实施例中,将获取到的核心要素信息的词语特性填充至填充点中,并将该核心要素信息加入到最优推理模板中,例如,核心要素信息可以是地理位置信息,则将地理位置信息填充至实体的填充点中,并根据实体的填充点共同确定最终的推理模板。在获取到问题信息中的关键词后,将关键词也填充至填充点,并根据最终的推理模板得到推理语句。
在得到推理语句后,根据预设推理语句与答案信息之间的关系,确定最终的答案信息。这样设置的好处是通过推理语句能够确定出准确的答案信息,提高答案信息确定的效率。
S407、向用户反馈答案信息。
本公开提供一种基于多***的智能问答方法,根据当前问题分析***的不同,确定出与问题信息对应的答案信息,当前问题分析***包括多个,这些***可以任意组合,进而确定出与问题信息对应的答案信息。采用本技术方案,能够在大量的专业性的企业文档里快速找到答案信息。
图5是根据本公开第四实施例的示意图,本公开提供了一种基于多***的智能问答装置500,包括:
第一确定单元501,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元502,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元503,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图6是根据本公开第五实施例的示意图,本公开提供了一种基于多***的智能问答装置600,包括:
第一确定单元601,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元602,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元603,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
在一个示例中,其中,多个问题分析***,包括:知识图谱***、推理问答***、文档问答***、常见问题解答FAQ问答***。
其中,知识图谱***用于指示问题信息中的实体对应的答案信息。
推理问答***用于指示与问题信息对应的推理模板,其中,推理模板用于确定答案信息;推理模板中包括具有次序关系的多个填充点,填充点具有词语特性。
文档问答***用于指示与问题信息对应的段落,其中,段落用于确定答案信息。
FAQ问答***用于指示与问题信息相关的其他问题,其他问题和问题信息用于确定答案信息。
在一个示例中,其中,***优先级为预设的;或者,***优先级为用户所确认的;或者,***优先级表征了问题分析***所包含的数据的数据量。
在一个示例中,其中,第一确定单元601,包括:
提取模块6011,用于提取问题信息的关键信息,其中,关键信息包括实体词语和/或语气词语。
确定模块6012,用于根据预设的关键信息与问题类别之间的对应关系,确定问题信息的问题类别。
在一个示例中,其中,调用单元602,包括:
确定模块6021,用于根据预设的问题类别与查询引擎的映射关系,确定与问题类别对应的查询引擎。
其中,问题类别为以下的一种:数字类别、短文本类别、长文本类别、泛需求类别、判断类别。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图7是根据本公开第六实施例的示意图,本公开提供了一种基于多***的智能问答装置700,包括:
第一确定单元701,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元702,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元703,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
在一个示例中,其中,若当前问题分析***为文档问答***,第二确定单元703,包括:
匹配模块7031,用于根据文档问答***中的第一数据库,对问题信息进行相似性匹配,得到与问题信息对应的最优段落;其中,第一数据库中包括多个文档,文档具有多个段落。
处理模块7032,用于根据第一通过知识集成的增强表示ERNIE模型,对最优段落进行字数精简处理,得到与问题信息对应的答案信息。
在一个示例中,其中,匹配模块7031,包括:
第一确定子模块70311,用于根据文档问答***中的第一数据库,对问题信息进行相似性匹配,得到与问题信息相似的多个候选段落;并获取问题信息对应的核心要素信息。
第二确定子模块70312,用于对核心要素信息和候选段落进行相似度计算,确定相似度最高的候选段落,为与问题信息对应的最优段落。
在一个示例中,其中,核心要素信息包括以下的一种或多种:用户位置信息、用户属性信息、用户所采用的终端设备的信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图8是根据本公开第七实施例的示意图,本公开提供了一种基于多***的智能问答装置800,包括:
第一确定单元801,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元802,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元803,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
在一个示例中,其中,若当前问题分析***为FAQ问答***,第二确定单元803,包括:
匹配模块8031,用于根据FAQ问答***中的第二数据库,对问题信息进行相似性匹配,得到与问题信息相似的多个问题文本;其中,第二数据库中包括多个问题文本。
第一确定模块8032,用于根据问题信息、以及与问题信息相似的多个问题文本,确定与问题信息对应的答案信息。
在一个示例中,其中,第一确定模块8032,包括:
第一确定子模块80321,用于确定问题信息、以及与问题信息相似的多个问题文本,为问题集合中的候选问题;其中,候选问题具有特征信息;
第二确定子模块80322,用于将问题集合中的候选问题的特征信息,输入至预设神经网络模型中,得到最优的候选问题。
第三确定子模块80323,用于根据预设的候选问题与答案信息之间的对应关系,确定与最优的候选问题对应的答案信息,为与问题信息对应的答案信息。
在一个示例中,还包括:
第一生成单元804,用于获取原始文档,对原始文档进行切分处理,得到多个短文本;根据第二ERNIE模型对短文本进行遮挡处理,生成第二数据库中的问题文本。
或者,第二生成单元805,用于获取原始文档,并确定原始文档中的标题;确定标题,为第二数据库中的问题文本。
或者,第三生成单元806,用于获取原始文档,并对原始文档进行内容结构分析处理,得到具有提问特性的短片段;将短片段和短片段在原始文档中的原始段落,输入至预设模型中,得到第二数据库中的问题文本。其中,短片段为所得到的问题文本对应的答案信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图9是根据本公开第八实施例的示意图,本公开提供了一种基于多***的智能问答装置900,包括:
第一确定单元901,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元902,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元903,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
在一个示例中,其中,若当前问题分析***为知识图谱***,第二确定单元903,包括:
第一提取模块9031,用于提取问题信息中的实体。
识别模块9032,用于根据知识图谱***中预设知识图谱以及第三ERNIE模型,对问题信息中的实体进行识别,得到与问题信息对应的答案信息;其中,预设知识图谱中包括多个实体,预设知识图谱中的实体之间具有连接关系,第三ERNIE模型用于处理问题信息中的实体。
在一个示例中,其中,识别模块9032,包括:
第一处理子模块90321,用于根据第三ERNIE模型对问题信息中的实体进行遮蔽处理,得到多个相关实体。
输入子模块90322,用于将问题信息中的实体、以及所得到的相关实体,输入至预设知识图谱中,得到多个初始答案。
第二处理子模块90323,用于根据第三ERNIE模型对多个初始答案进行打分处理,得到问题信息对应的答案信息。
在一个示例中,若当前问题分析***为知识图谱***,第二确定单元903,包括:
第二提取模块9033,用于提取问题信息中的关键词,其中,关键词具有词语特性。
处理模块9034,用于根据知识图谱***中的预设的规则模板库、以及问题信息中的关键词的词语特性,对问题信息进行匹配处理,确定与问题信息对应的规则模板;其中,规则模板库中包括多个规则模板,规则模板中包括不具有次序关系的多个槽位,槽位表征词语特性,规则模板中的各槽位的词语特性不同。
匹配模块9035,用于根据与问题信息对应的规则模板,对问题信息进行答案匹配,得到与问题信息对应的答案信息。
在一个示例中,其中,规则模板具有预设的细规则库,其中,细规则库中包括规则模板对应的多个细规则表,细规则表中包括具有次序关系的多个槽位;细规则表中的各槽位的词语特性不同,或者,细规则表中的部分槽位的词语特性相同。
处理模块9034,包括:
第一确定子模块90341,用于根据细规则库的预设的细规则库、问题信息中的不同的词语特性的关键词的数量、以及问题信息中的不同的词语特性的关键词的连接关系,对问题信息进行匹配处理,确定与问题信息对应的细规则表。
第二确定子模块90342,用于将问题信息中的关键词,填充至与问题信息对应的细规则表中,得到问题描述信息;并根据预设的问题描述信息和答案信息之间的对应关系,确定与所得到的问题描述信息对应的答案信息,为与问题信息对应的答案信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图10是根据本公开第九实施例的示意图,本公开提供了一种基于多***的智能问答装置1000,包括:
第一确定单元1001,用于响应于用户的问答指令,其中,问答指令用于指示问题信息,确定问题信息的问题类别。
调用单元1002,用于确定与问题类别对应的查询引擎,并根据查询引擎调用与查询引擎对应的多个问题分析***。
第二确定单元1003,用于在依据问题分析***的***优先级,依次采用多个问题分析***对问题信息进行处理的过程中,若依据当前问题分析***确定出与问题信息对应的答案信息,则向用户反馈答案信息。
在一个示例中,其中,若当前问题分析***为推理问答***,第二确定单元1003,包括:
提取模块10031,用于提取问题信息的关键词,其中,关键词具有词语特性。
处理模块10032,用于根据推理问答***中的预设的推理规则模板库、问题信息中的关键词的词语特性、以及问题信息中的关键词之间的次序关系,对问题信息进行匹配处理,确定与问题信息对应的推理模板;其中,推理规则模板库中包括多个推理模板,推理模板中包括具有次序关系的多个填充点,填充点具有词语特性。
确定模块10033,用于获取问题信息对应的核心要素信息,并根据问题信息对应的核心要素信息、以及与问题信息对应的推理模板,确定与问题信息对应的答案信息。
在一个示例中,其中,确定模块10033,包括:
第一确定子模块100331,用于根据预设的神经网络模型对与问题信息对应的各推理模板进行识别,确定出最优推理模板。
第二确定子模块100332,用于根据问题信息对应的核心要素信息以及最优推理模板,确定与问题信息对应的答案信息。
在一个示例中,其中,第二确定子模块100332,包括:
确定核心要素信息的词语特性,并得到核心要素信息的词语特性对应的填充点。
将核心要素信息的词语特性对应的填充点,加入到最优推理模板中,得到最终的推理模板。
将问题信息的关键词和问题信息对应的核心要素信息,填充到最终的推理模板的各填充点中,得到推理语句。
根据预设推理语句与答案信息之间的对应关系,确定与所得到的推理语句对应的答案信息,为与问题信息对应的答案信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如基于多***的智能问答方法。例如,在一些实施例中,基于多***的智能问答方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的基于多***的智能问答方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行基于多***的智能问答方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (39)

1.一种基于多***的智能问答方法,包括:
响应于用户的问答指令,其中,所述问答指令用于指示问题信息,确定所述问题信息的问题类别;
确定与所述问题类别对应的查询引擎,并根据所述查询引擎调用与所述查询引擎对应的多个问题分析***;
在依据问题分析***的***优先级,依次采用所述多个问题分析***对所述问题信息进行处理的过程中,若依据当前问题分析***确定出与所述问题信息对应的答案信息,则向用户反馈所述答案信息。
2.根据权利要求1所述的方法,其中,所述多个问题分析***,包括:知识图谱***、推理问答***、文档问答***、常见问题解答FAQ问答***;
其中,所述知识图谱***用于指示问题信息中的实体对应的答案信息;
所述推理问答***用于指示与问题信息对应的推理模板,其中,所述推理模板用于确定答案信息;所述推理模板中包括具有次序关系的多个填充点,所述填充点具有词语特性;
所述文档问答***用于指示与所述问题信息对应的段落,其中,所述段落用于确定答案信息;
所述FAQ问答***用于指示与所述问题信息相关的其他问题,所述其他问题和所述问题信息用于确定答案信息。
3.根据权利要求2所述的方法,其中,若所述当前问题分析***为文档问答***,则依据当前问题分析***确定出与所述问题信息对应的答案信息,包括:
根据所述文档问答***中的第一数据库,对所述问题信息进行相似性匹配,得到与所述问题信息对应的最优段落;其中,所述第一数据库中包括多个文档,所述文档具有多个段落;
根据第一通过知识集成的增强表示ERNIE模型,对所述最优段落进行字数精简处理,得到与所述问题信息对应的答案信息。
4.根据权利要求3所述的方法,其中,根据所述文档问答***中的第一数据库,对所述问题信息进行相似性匹配,得到与所述问题信息对应的最优段落,包括:
根据所述文档问答***中的第一数据库,对所述问题信息进行相似性匹配,得到与所述问题信息相似的多个候选段落;并获取所述问题信息对应的核心要素信息;
对所述核心要素信息和所述候选段落进行相似度计算,确定相似度最高的候选段落,为与所述问题信息对应的最优段落。
5.根据权利要求4所述的方法,其中,所述核心要素信息包括以下的一种或多种:用户位置信息、用户属性信息、用户所采用的终端设备的信息。
6.根据权利要求2所述的方法,其中,若所述当前问题分析***为FAQ问答***,则依据当前问题分析***确定出与所述问题信息对应的答案信息,包括:
根据所述FAQ问答***中的第二数据库,对所述问题信息进行相似性匹配,得到与所述问题信息相似的多个问题文本;其中,所述第二数据库中包括多个问题文本;
根据所述问题信息、以及与所述问题信息相似的多个问题文本,确定与所述问题信息对应的答案信息。
7.根据权利要求6所述的方法,其中,根据所述问题信息、以及与所述问题信息相似的多个问题文本,确定与所述问题信息对应的答案信息,包括:
确定所述问题信息、以及与所述问题信息相似的多个问题文本,为问题集合中的候选问题;其中,所述候选问题具有特征信息;
将问题集合中的候选问题的特征信息,输入至预设神经网络模型中,得到最优的候选问题;
根据预设的候选问题与答案信息之间的对应关系,确定与所述最优的候选问题对应的答案信息,为与所述问题信息对应的答案信息。
8.根据权利要求6或7所述的方法,还包括:
获取原始文档,对所述原始文档进行切分处理,得到多个短文本;根据第二ERNIE模型对所述短文本进行遮挡处理,生成所述第二数据库中的问题文本;
或者,获取原始文档,并确定所述原始文档中的标题;确定所述标题,为所述第二数据库中的问题文本;
或者,获取原始文档,并对所述原始文档进行内容结构分析处理,得到具有提问特性的短片段;将所述短片段和所述短片段在所述原始文档中的原始段落,输入至预设模型中,得到所述第二数据库中的问题文本;其中,所述短片段为所得到的问题文本对应的答案信息。
9.根据权利要求2所述的方法,其中,若所述当前问题分析***为知识图谱***,则依据当前问题分析***确定出与所述问题信息对应的答案信息,包括:
提取所述问题信息中的实体;
根据所述知识图谱***中预设知识图谱以及第三ERNIE模型,对所述问题信息中的实体进行识别,得到与所述问题信息对应的答案信息;其中,所述预设知识图谱中包括多个实体,所述预设知识图谱中的实体之间具有连接关系,所述第三ERNIE模型用于处理所述问题信息中的实体。
10.根据权利要求9所述的方法,其中,根据所述知识图谱***中预设知识图谱以及第三ERNIE模型,对所述问题信息中的实体进行识别,得到与所述问题信息对应的答案信息,包括:
根据所述第三ERNIE模型对所述问题信息中的实体进行遮蔽处理,得到多个相关实体;
将所述问题信息中的实体、以及所得到的相关实体,输入至所述预设知识图谱中,得到多个初始答案;
根据所述第三ERNIE模型对所述多个初始答案进行打分处理,得到所述问题信息对应的答案信息。
11.根据权利要求2所述的方法,其中,若所述当前问题分析***为知识图谱***,则依据当前问题分析***确定出与所述问题信息对应的答案信息,包括:
提取所述问题信息中的关键词,其中,所述关键词具有词语特性;
根据所述知识图谱***中的预设的规则模板库、以及所述问题信息中的关键词的词语特性,对所述问题信息进行匹配处理,确定与所述问题信息对应的规则模板;其中,所述规则模板库中包括多个规则模板,所述规则模板中包括不具有次序关系的多个槽位,所述槽位表征词语特性,所述规则模板中的各槽位的词语特性不同;
根据与所述问题信息对应的规则模板,对所述问题信息进行答案匹配,得到与所述问题信息对应的答案信息。
12.根据权利要求11所述的方法,其中,所述规则模板具有预设的细规则库,其中,所述细规则库中包括所述规则模板对应的多个细规则表,所述细规则表中包括具有次序关系的多个槽位;所述细规则表中的各槽位的词语特性不同,或者,所述细规则表中的部分槽位的词语特性相同;
根据所述知识图谱***中的预设的规则模板库、以及所述问题信息中的关键词的词语特性,对所述问题信息进行匹配处理,确定与所述问题信息对应的规则模板,包括:
根据所述细规则库的所述预设的细规则库、所述问题信息中的不同的词语特性的关键词的数量、以及所述问题信息中的不同的词语特性的关键词的连接关系,对所述问题信息进行匹配处理,确定与所述问题信息对应的细规则表;
将所述问题信息中的关键词,填充至与所述问题信息对应的细规则表中,得到问题描述信息;并根据预设的问题描述信息和答案信息之间的对应关系,确定与所得到的问题描述信息对应的答案信息,为与所述问题信息对应的答案信息。
13.根据权利要求2所述的方法,其中,若所述当前问题分析***为推理问答***,则依据当前问题分析***确定出与所述问题信息对应的答案信息,包括:
提取所述问题信息的关键词,其中,所述关键词具有词语特性;
根据所述推理问答***中的预设的推理规则模板库、所述问题信息中的关键词的词语特性、以及所述问题信息中的关键词之间的次序关系,对所述问题信息进行匹配处理,确定与所述问题信息对应的推理模板;其中,所述推理规则模板库中包括多个推理模板,所述推理模板中包括具有次序关系的多个填充点,所述填充点具有词语特性;
获取所述问题信息对应的核心要素信息,并根据所述问题信息对应的核心要素信息、以及与所述问题信息对应的推理模板,确定与所述问题信息对应的答案信息。
14.根据权利要求13所述的方法,其中,根据所述问题信息对应的核心要素信息、以及与所述问题信息对应的推理模板,确定与所述问题信息对应的答案信息,包括:
根据预设的神经网络模型对与所述问题信息对应的各推理模板进行识别,确定出最优推理模板;
根据问题信息对应的核心要素信息以及所述最优推理模板,确定与所述问题信息对应的答案信息。
15.根据权利要求14述的方法,其中,根据问题信息对应的核心要素信息以及所述最优推理模板,确定与所述问题信息对应的答案信息,包括:
确定所述核心要素信息的词语特性,并得到所述核心要素信息的词语特性对应的填充点;
将所述核心要素信息的词语特性对应的填充点,加入到所述最优推理模板中,得到最终的推理模板;
将所述问题信息的关键词和所述问题信息对应的核心要素信息,填充到所述最终的推理模板的各填充点中,得到推理语句;
根据预设推理语句与答案信息之间的对应关系,确定与所得到的推理语句对应的答案信息,为与所述问题信息对应的答案信息。
16.根据权利要求1-15任一项所述的方法,其中,所述***优先级为预设的;或者,所述***优先级为用户所确认的;或者,所述***优先级表征了问题分析***所包含的数据的数据量。
17.根据权利要求1-16任一项所述的方法,其中,确定所述问题信息的问题类别,包括:
提取所述问题信息的关键信息,其中,所述关键信息包括实体词语和/或语气词语;
根据预设的关键信息与问题类别之间的对应关系,确定所述问题信息的问题类别。
18.根据权利要求1-17任一项所述的方法,其中,确定与所述问题类别对应的查询引擎,包括:
根据预设的问题类别与查询引擎的映射关系,确定与所述问题类别对应的查询引擎;
其中,所述问题类别为以下的一种:数字类别、短文本类别、长文本类别、泛需求类别、判断类别。
19.一种基于多***的智能问答装置,包括:
第一确定单元,用于响应于用户的问答指令,其中,所述问答指令用于指示问题信息,确定所述问题信息的问题类别;
调用单元,用于确定与所述问题类别对应的查询引擎,并根据所述查询引擎调用与所述查询引擎对应的多个问题分析***;
第二确定单元,用于在依据问题分析***的***优先级,依次采用所述多个问题分析***对所述问题信息进行处理的过程中,若依据当前问题分析***确定出与所述问题信息对应的答案信息,则向用户反馈所述答案信息。
20.根据权利要求19所述的装置,其中,所述多个问题分析***,包括:知识图谱***、推理问答***、文档问答***、常见问题解答FAQ问答***;
其中,所述知识图谱***用于指示问题信息中的实体对应的答案信息;
所述推理问答***用于指示与问题信息对应的推理模板,其中,所述推理模板用于确定答案信息;所述推理模板中包括具有次序关系的多个填充点,所述填充点具有词语特性;
所述文档问答***用于指示与所述问题信息对应的段落,其中,所述段落用于确定答案信息;
所述FAQ问答***用于指示与所述问题信息相关的其他问题,所述其他问题和所述问题信息用于确定答案信息。
21.根据权利要求20所述的装置,其中,若所述当前问题分析***为文档问答***,所述第二确定单元,包括:
匹配模块,用于根据所述文档问答***中的第一数据库,对所述问题信息进行相似性匹配,得到与所述问题信息对应的最优段落;其中,所述第一数据库中包括多个文档,所述文档具有多个段落;
处理模块,用于根据第一通过知识集成的增强表示ERNIE模型,对所述最优段落进行字数精简处理,得到与所述问题信息对应的答案信息。
22.根据权利要求21所述的装置,其中,所述匹配模块,包括:
第一确定子模块,用于根据所述文档问答***中的第一数据库,对所述问题信息进行相似性匹配,得到与所述问题信息相似的多个候选段落;并获取所述问题信息对应的核心要素信息;
第二确定子模块,用于对所述核心要素信息和所述候选段落进行相似度计算,确定相似度最高的候选段落,为与所述问题信息对应的最优段落。
23.根据权利要求22所述的装置,其中,所述核心要素信息包括以下的一种或多种:用户位置信息、用户属性信息、用户所采用的终端设备的信息。
24.根据权利要求20所述的装置,其中,若所述当前问题分析***为FAQ问答***,所述第二确定单元,包括:
匹配模块,用于根据所述FAQ问答***中的第二数据库,对所述问题信息进行相似性匹配,得到与所述问题信息相似的多个问题文本;其中,所述第二数据库中包括多个问题文本;
第一确定模块,用于根据所述问题信息、以及与所述问题信息相似的多个问题文本,确定与所述问题信息对应的答案信息。
25.根据权利要求24所述的装置,其中,所述第一确定模块,包括:
第一确定子模块,用于确定所述问题信息、以及与所述问题信息相似的多个问题文本,为问题集合中的候选问题;其中,所述候选问题具有特征信息;
第二确定子模块,用于将问题集合中的候选问题的特征信息,输入至预设神经网络模型中,得到最优的候选问题;
第三确定子模块,用于根据预设的候选问题与答案信息之间的对应关系,确定与所述最优的候选问题对应的答案信息,为与所述问题信息对应的答案信息。
26.根据权利要求24或25所述的装置,还包括:
第一生成单元,用于获取原始文档,对所述原始文档进行切分处理,得到多个短文本;根据第二ERNIE模型对所述短文本进行遮挡处理,生成所述第二数据库中的问题文本;
或者,第二生成单元,用于获取原始文档,并确定所述原始文档中的标题;确定所述标题,为所述第二数据库中的问题文本;
或者,第三生成单元,用于获取原始文档,并对所述原始文档进行内容结构分析处理,得到具有提问特性的短片段;将所述短片段和所述短片段在所述原始文档中的原始段落,输入至预设模型中,得到所述第二数据库中的问题文本;其中,所述短片段为所得到的问题文本对应的答案信息。
27.根据权利要求20所述的装置,其中,若所述当前问题分析***为知识图谱***,所述第二确定单元,包括:
第一提取模块,用于提取所述问题信息中的实体;
识别模块,用于根据所述知识图谱***中预设知识图谱以及第三ERNIE模型,对所述问题信息中的实体进行识别,得到与所述问题信息对应的答案信息;其中,所述预设知识图谱中包括多个实体,所述预设知识图谱中的实体之间具有连接关系,所述第三ERNIE模型用于处理所述问题信息中的实体。
28.根据权利要求27所述的装置,其中,所述识别模块,包括:
第一处理子模块,用于根据所述第三ERNIE模型对所述问题信息中的实体进行遮蔽处理,得到多个相关实体;
输入子模块,用于将所述问题信息中的实体、以及所得到的相关实体,输入至所述预设知识图谱中,得到多个初始答案;
第二处理子模块,用于根据所述第三ERNIE模型对所述多个初始答案进行打分处理,得到所述问题信息对应的答案信息。
29.根据权利要求20所述的装置,其中,若所述当前问题分析***为知识图谱***,所述第二确定单元,包括:
第二提取模块,用于提取所述问题信息中的关键词,其中,所述关键词具有词语特性;
处理模块,用于根据所述知识图谱***中的预设的规则模板库、以及所述问题信息中的关键词的词语特性,对所述问题信息进行匹配处理,确定与所述问题信息对应的规则模板;其中,所述规则模板库中包括多个规则模板,所述规则模板中包括不具有次序关系的多个槽位,所述槽位表征词语特性,所述规则模板中的各槽位的词语特性不同;
匹配模块,用于根据与所述问题信息对应的规则模板,对所述问题信息进行答案匹配,得到与所述问题信息对应的答案信息。
30.根据权利要求29所述的装置,其中,所述规则模板具有预设的细规则库,其中,所述细规则库中包括所述规则模板对应的多个细规则表,所述细规则表中包括具有次序关系的多个槽位;所述细规则表中的各槽位的词语特性不同,或者,所述细规则表中的部分槽位的词语特性相同;
所述处理模块,包括:
第一确定子模块,用于根据所述细规则库的所述预设的细规则库、所述问题信息中的不同的词语特性的关键词的数量、以及所述问题信息中的不同的词语特性的关键词的连接关系,对所述问题信息进行匹配处理,确定与所述问题信息对应的细规则表;
第二确定子模块,用于将所述问题信息中的关键词,填充至与所述问题信息对应的细规则表中,得到问题描述信息;并根据预设的问题描述信息和答案信息之间的对应关系,确定与所得到的问题描述信息对应的答案信息,为与所述问题信息对应的答案信息。
31.根据权利要求20所述的装置,其中,若所述当前问题分析***为推理问答***,所述第二确定单元,包括:
提取模块,用于提取所述问题信息的关键词,其中,所述关键词具有词语特性;
处理模块,用于根据所述推理问答***中的预设的推理规则模板库、所述问题信息中的关键词的词语特性、以及所述问题信息中的关键词之间的次序关系,对所述问题信息进行匹配处理,确定与所述问题信息对应的推理模板;其中,所述推理规则模板库中包括多个推理模板,所述推理模板中包括具有次序关系的多个填充点,所述填充点具有词语特性;
确定模块,用于获取所述问题信息对应的核心要素信息,并根据所述问题信息对应的核心要素信息、以及与所述问题信息对应的推理模板,确定与所述问题信息对应的答案信息。
32.根据权利要求31所述的装置,其中,所述确定模块,包括:
第一确定子模块,用于根据预设的神经网络模型对与所述问题信息对应的各推理模板进行识别,确定出最优推理模板;
第二确定子模块,用于根据问题信息对应的核心要素信息以及所述最优推理模板,确定与所述问题信息对应的答案信息。
33.根据权利要求32述的装置,其中,所述第二确定子模块,包括:
确定所述核心要素信息的词语特性,并得到所述核心要素信息的词语特性对应的填充点;
将所述核心要素信息的词语特性对应的填充点,加入到所述最优推理模板中,得到最终的推理模板;
将所述问题信息的关键词和所述问题信息对应的核心要素信息,填充到所述最终的推理模板的各填充点中,得到推理语句;
根据预设推理语句与答案信息之间的对应关系,确定与所得到的推理语句对应的答案信息,为与所述问题信息对应的答案信息。
34.根据权利要求19-33任一项所述的装置,其中,所述***优先级为预设的;或者,所述***优先级为用户所确认的;或者,所述***优先级表征了问题分析***所包含的数据的数据量。
35.根据权利要求19-34任一项所述的装置,其中,所述第一确定单元,包括:
提取模块,用于提取所述问题信息的关键信息,其中,所述关键信息包括实体词语和/或语气词语;
确定模块,用于根据预设的关键信息与问题类别之间的对应关系,确定所述问题信息的问题类别。
36.根据权利要求19-35任一项所述的装置,其中,所述调用单元,包括:
确定模块,用于根据预设的问题类别与查询引擎的映射关系,确定与所述问题类别对应的查询引擎;
其中,所述问题类别为以下的一种:数字类别、短文本类别、长文本类别、泛需求类别、判断类别。
37.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-18中任一项所述的方法。
38.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-18中任一项所述的方法。
39.一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-18中任一项所述方法的步骤。
CN202210201842.8A 2022-03-02 2022-03-02 基于多***的智能问答方法、装置和设备 Active CN114610845B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202210201842.8A CN114610845B (zh) 2022-03-02 2022-03-02 基于多***的智能问答方法、装置和设备
US17/820,285 US20220391426A1 (en) 2022-03-02 2022-08-17 Multi-system-based intelligent question answering method and apparatus, and device
KR1020220103564A KR20220123187A (ko) 2022-03-02 2022-08-18 다중 시스템 기반 지능형 질의 응답 방법, 장치와 기기
JP2022131721A JP2022166260A (ja) 2022-03-02 2022-08-22 マルチシステムに基づくインテリジェントな質問応答方法、装置及び機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210201842.8A CN114610845B (zh) 2022-03-02 2022-03-02 基于多***的智能问答方法、装置和设备

Publications (2)

Publication Number Publication Date
CN114610845A true CN114610845A (zh) 2022-06-10
CN114610845B CN114610845B (zh) 2024-05-14

Family

ID=81861617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210201842.8A Active CN114610845B (zh) 2022-03-02 2022-03-02 基于多***的智能问答方法、装置和设备

Country Status (4)

Country Link
US (1) US20220391426A1 (zh)
JP (1) JP2022166260A (zh)
KR (1) KR20220123187A (zh)
CN (1) CN114610845B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257610B (zh) * 2023-01-11 2023-12-08 长河信息股份有限公司 基于行业知识图谱的智能问答方法、装置、设备及介质
CN116628167B (zh) * 2023-06-08 2024-04-05 四维创智(北京)科技发展有限公司 一种响应确定方法、装置、电子设备及存储介质
CN117194730B (zh) * 2023-11-06 2024-02-20 北京枫清科技有限公司 一种意图识别和问答方法、装置、电子设备及存储介质
CN117436531A (zh) * 2023-12-21 2024-01-23 安徽大学 基于水稻病虫害知识图谱的问答***及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832342A (zh) * 2017-10-13 2018-03-23 北京康夫子科技有限公司 机器人聊天方法及***
CN108153915A (zh) * 2018-01-29 2018-06-12 赵宇航 一种基于互联网的教育信息快速获取方法
CN109033277A (zh) * 2018-07-10 2018-12-18 广州极天信息技术股份有限公司 基于机器学习的类脑***、方法、设备及存储介质
JP2019012439A (ja) * 2017-06-30 2019-01-24 ヤフー株式会社 生成装置、生成方法及び生成プログラム
CN112784590A (zh) * 2021-02-01 2021-05-11 北京金山数字娱乐科技有限公司 文本处理方法及装置
CN112860865A (zh) * 2021-02-10 2021-05-28 达而观信息科技(上海)有限公司 一种智能问答的实现方法、装置、设备及存储介质
US20210201174A1 (en) * 2019-12-30 2021-07-01 International Business Machines Corporation Generating question templates in a knowledge-graph based question and answer system
CN113127617A (zh) * 2021-04-09 2021-07-16 厦门渊亭信息科技有限公司 通用领域知识图谱的知识问答方法、终端设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019012439A (ja) * 2017-06-30 2019-01-24 ヤフー株式会社 生成装置、生成方法及び生成プログラム
CN107832342A (zh) * 2017-10-13 2018-03-23 北京康夫子科技有限公司 机器人聊天方法及***
CN108153915A (zh) * 2018-01-29 2018-06-12 赵宇航 一种基于互联网的教育信息快速获取方法
CN109033277A (zh) * 2018-07-10 2018-12-18 广州极天信息技术股份有限公司 基于机器学习的类脑***、方法、设备及存储介质
US20210201174A1 (en) * 2019-12-30 2021-07-01 International Business Machines Corporation Generating question templates in a knowledge-graph based question and answer system
CN112784590A (zh) * 2021-02-01 2021-05-11 北京金山数字娱乐科技有限公司 文本处理方法及装置
CN112860865A (zh) * 2021-02-10 2021-05-28 达而观信息科技(上海)有限公司 一种智能问答的实现方法、装置、设备及存储介质
CN113127617A (zh) * 2021-04-09 2021-07-16 厦门渊亭信息科技有限公司 通用领域知识图谱的知识问答方法、终端设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MING GAO ET AL.: "Research on Industry Question Answering System Based on Near Neighbor Vector Search", JOURNAL OF PHYSICS: CONFERENCE SERIES, 31 December 2021 (2021-12-31), pages 1 - 8 *
岳世峰;林政;王伟平;孟丹;: "智能回复***研究综述", 信息安全学报, no. 01, 15 January 2020 (2020-01-15), pages 24 - 38 *

Also Published As

Publication number Publication date
US20220391426A1 (en) 2022-12-08
KR20220123187A (ko) 2022-09-06
CN114610845B (zh) 2024-05-14
JP2022166260A (ja) 2022-11-01

Similar Documents

Publication Publication Date Title
EP4141733A1 (en) Model training method and apparatus, electronic device, and storage medium
CN114610845B (zh) 基于多***的智能问答方法、装置和设备
US11521603B2 (en) Automatically generating conference minutes
JP7042693B2 (ja) 対話型業務支援システム
US20220254507A1 (en) Knowledge graph-based question answering method, computer device, and medium
CN110162768B (zh) 实体关系的获取方法、装置、计算机可读介质及电子设备
CN116501960B (zh) 内容检索方法、装置、设备及介质
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
EP4141697A1 (en) Method and apparatus of processing triple data, method and apparatus of training triple data processing model, device, and medium
CN114595686A (zh) 知识抽取方法、知识抽取模型的训练方法及装置
US11423219B2 (en) Generation and population of new application document utilizing historical application documents
CN117171296A (zh) 信息获取方法、装置和电子设备
CN117112595A (zh) 一种信息查询方法、装置、电子设备及存储介质
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
CN115510247A (zh) 一种电碳政策知识图谱构建方法、装置、设备及存储介质
CN114625889A (zh) 一种语义消歧方法、装置、电子设备及存储介质
CN114443802A (zh) 一种接口文档处理方法、装置、电子设备和存储介质
CN112148751B (zh) 用于查询数据的方法和装置
CN112905752A (zh) 一种智能交互方法、装置、设备以及存储介质
CN111368036A (zh) 用于搜索信息的方法和装置
CN113971216B (zh) 数据处理方法、装置、电子设备和存储器
EP4187431A1 (en) Address identification method and apparatus, electronic device, and storage medium
CN114154072A (zh) 检索方法、装置、电子设备以及存储介质
CN117851542A (zh) 信息查询方法、装置、设备、存储介质及程序产品
CN117851575A (zh) 一种大语言模型问答优化方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant