CN107273350A - 一种实现智能问答的信息处理方法及其装置 - Google Patents

一种实现智能问答的信息处理方法及其装置 Download PDF

Info

Publication number
CN107273350A
CN107273350A CN201710344592.2A CN201710344592A CN107273350A CN 107273350 A CN107273350 A CN 107273350A CN 201710344592 A CN201710344592 A CN 201710344592A CN 107273350 A CN107273350 A CN 107273350A
Authority
CN
China
Prior art keywords
question sentence
sentence
question
mrow
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710344592.2A
Other languages
English (en)
Inventor
张峰
谢俊武
吴海波
刘奕湘
刘丽萍
陈碧莹
曹威
林泽曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Jiangmen Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN201710344592.2A priority Critical patent/CN107273350A/zh
Publication of CN107273350A publication Critical patent/CN107273350A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及人机交互技术领域,公开了一种实现智能问答的信息处理方法及其装置。本发明所提供的信息处理方法,其核心思路是先对问题文本信息进行分句处理,获取用户问句,然后基于问句相似度在QA问答库中找到与用户问句最相似的标准问句及对应的答复信息,由此相比较于现有基于关键词检索的问答方法,无需要求用户具有关键词分解的能力,全程自动化,大幅度提升用户体验,并提高搜索效果、反馈答案的针对性和有效性。同时通过句模分析、词法分析和词义扩展等自然语言理解技术的融合,以及进行多维度相似性的综合计算,可极大地提高最终问句相似度在汉语自动问答过程中的准确性,使汉语系的智能问答***成为可能。

Description

一种实现智能问答的信息处理方法及其装置
技术领域
本发明涉及人机交互技术领域,具体地,涉及一种实现智能问答的信息处理方法及其装置。
背景技术
人机交互是一门研究***与用户之间交互关系的科学,其中的***可以是各种各样的机器,也可以是计算机化的***或软件。例如,通过人机交互可以实现诸如智能客户***、语音控制***等各种人工智能***。智能问答***是人机交互的一种典型应用:当用户提出问题后,由智能问答***给出该问题的答案,由此需在***中配置一套QA问答库,并在该QA问答库中存储有大量的标准问题和对应的答案。
目前,国内外很多研究机构都对智能问答***展开了深入的研究,并在教育、政府、医院和银行等领域得到了广泛的应用。但是大多数的智能问答***仍然存在一些不容忽视的弊端:(1)采用关键词检索,搜索效果不理想且要求用户具有关键词分解的能力;(2)反馈答案的针对性和有效性较差。
发明内容
针对前述现有大多数智能问答***仍然存在的一些弊端问题,本发明提供了一种新的实现智能问答的信息处理方法及其装置。
本发明采用的技术方案,一方面提供了一种实现智能问答的信息处理方法,包括步骤如下:S101.接收问题文本信息;S102.对所述问题文本信息进行分句处理,获取用户问句;S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息;S105.反馈所述答复信息。
优化的,在计算所述用户问句与在QA问答库中各项标准问句的问句相似度的步骤中,包括步骤如下:S201.分别对所述用户问句和所述标准问句进行分词预处理,获取对应的关键词集;S202.根据所述用户问句和所述标准问句的关键词集,计算所述用户问句与所述标准问句的问句相似度。
进一步优化的,在所述步骤S201中,包括步骤如下:S301.将问句与在句模库中的各项句模进行模式匹配,将匹配率最高的句模作为与所述问句对应的最匹配句模,所述问句为用户问句或标准问句;S302.根据所述最匹配句模去掉所述问句中的疑问词和问句特征词,实现对所述问句的切分,得到语句片断;S303.对所述语句片断进行分词处理,然后去除分词结果中的所有辅助词,得到核心语义词;S304.将所有的核心语义词作为关键词加载到所述问句的关键词集中。
详细优化的,在所述步骤S304之后,还包括如下步骤:S305.根据所述核心语义词收集对应的同义词,然后将所有的同义词也作为关键词加载到所述问句的关键词集中。
详细优化的,在所述步骤S304之后,还包括如下步骤:S306.读取与所述最匹配句模对应的特定辅助词表,然后将在所述特定辅助词表中的所有特定辅助词也作为关键词加载到所述问句的关键词集中。
详细优化的,在对所述语句片断进行分词处理的步骤中,包括步骤如下:
S401.分别应用正向最大匹配算法和逆向最大匹配算法对所述语句片断进行分词处理,若两种分词处理的分词结果一致,则将任意一种分词结果作为最终的分词结果,否则比较两种分词结果的切分出现概率,将切分出现概率最高的分词结果作为最终的分词结果。
进一步详细优化的,按照如下公式计算分词结果的切分出现概率q:
q=q(W1)·q(W2)·q(W3)·····q(Wn)
式中,W1,W2,W3,…Wn为所述分词结果中的各个词,n为所述分词结果中的词数,q(W)为词W的词频。
进一步优化的,在所述步骤S202中,包括步骤如下:
S501.按照如下公式分别计算用户问句QU与标准问句QA的词形相似度WordSim(QU,QA)、句长相似度LenSim(QU,QA)、词序相似度OrderSim(QU,QA)和距离相似度DisSim(QU,QA):
式中,Len(QU)为在用户问句QU的关键词集中关键词个数,Len(QA)为在标准问句QA的关键词集中关键词个数,SameWc(QU,QA)为在用户问句QU和标准问句QA的关键词集中相同关键词的个数,OnceWs(QU,QA)表示在用户问句QU和标准问句QA中都出现且只出现一次的关键词的集合,|OnceWs(QU,QA)|为在OnceWs(QU,QA)集合中关键词的个数,Pfirst(QU,QA)表示OnceWs(QU,QA)集合中的关键词在用户问句QU中的位置序号构成的向量,Psecond(QU,QA)表示Pfirst(QU,QA)中的分量按对应关键词在标准问句QA中的次序排序生成的向量,RevOrd(QU,QA)为在Psecond(QU,QA)中各相邻分量的逆序数,Dis(QU,QA)为应用标准语句QA中的关键词集将用户问句QU变成标准问句QA所需的最小编辑操作次数,k为利用领域内的相似问句进行训练得到的且在距离相似度DisSim(QU,QA)为0.5时的词语距离值,Max()为取最大值函数,Abs()为取绝对值函数;
S502.按照如下公式计算用户问句QU与标准问句QA的问句相似度Sim(QU,QA):
Sim(QU,QA)=α1·WordSim(QU,QA)+α2·LenSim(QU,QA)+α3·OrderSim(QU,QA)
4·DisSim(QU,QA)
式中,α1为词形相似度WordSim(QU,QA)的权重系数,α2为句长相似度LenSim(QU,QA)的权重系数,α3为词序相似度OrderSim(QU,QA)的权重系数,α4为距离相似度DisSim(QU,QA)的权重系数,所有的权重系数满足:α1234=1。
本发明采用的技术方案,另一方面提供了一种实现前述的实现智能问答的信息处理方法的装置,包括收发单元、问句获取单元、问句相似度对比单元、答案获取单元和QA问答库;所述收发单元通信连接所述问句获取单元,用于接收问题文本信息和反馈答复信息;所述问句获取单元通信连接所述问句相似度对比单元,用于对所述问题文本信息进行分句处理,获取用户问句;所述问句相似度对比单元分别通信连接所述答案获取单元和所述QA问答库,用于分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;所述答案获取单元分别通信连接所述QA问答库和所述收发单元,用于从所述QA问答库中读取与所述最相似标准问句对应的答复信息;所述QA问答库用于存储各项标准问句和对应的答复信息。
综上,采用本发明所提供的一种实现智能问答的信息处理方法及其装置,具有如下有益效果:(1)本发明所提供的信息处理方法,其核心思路是先对问题文本信息进行分句处理,获取用户问句,然后基于问句相似度在QA问答库中找到与用户问句最相似的标准问句及对应的答复信息,由此相比较于现有基于关键词检索的问答方法,无需要求用户具有关键词分解的能力,全程自动化,大幅度提升用户体验,并提高搜索效果、反馈答案的针对性和有效性;(2)在问句相似度的计算过程中,实现了句模分析、词法分析和词义扩展等自然语言理解技术的融合,并通过进行多维度相似性的综合计算,极大地提高了最终问句相似度在汉语自动问答过程中的准确性,从而可解决因中文固有的复杂性特点而难以实现汉语智能问答的问题,使汉语系的智能问答***成为可能;(3)本发明提供的实现智能问答的信息处理方法及其装置,可拓展适用于诸如教育领域、行政领域和供电服务领域等行业领域中,便于实际推广和应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的实现智能问答的信息处理方法流程示意图。
图2是本发明提供的实现智能问答的信息处理方法的装置结构示意图。
具体实施方式
以下将参照附图,通过实施例方式详细地描述本发明提供的实现智能问答的信息处理方法及其装置。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B三种情况,本文中术语“/和”是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A,单独存在A和B两种情况,另外,本文中字符“/”,一般表示前后关联对象是一种“或”关系。
实施例一
图1示出了本发明提供的实现智能问答的信息处理方法流程示意图。本实施例提供的所述实现智能问答的信息处理方法,包括步骤如下。
S101.接收问题文本信息。
在所述步骤S101中,所述问题文本信息可以但不限于为由用户在诸如微信等聊天平台向智能问答***发送的短消息,其包含有具体的文字内容。
S102.对所述问题文本信息进行分句处理,获取用户问句。
在所述步骤S102中,所述进行分句处理的方法,可以但不限于基于逗号、分号或句号等标点符号将所述问题文本信息中的具体文字内容分解为多个单独的子句,所述子句无论是否具有提问意思,都视作用户问句。
S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句。
在所述步骤S103中,所述QA问答库是指预存储有大量标准问句及与标准问句对应的答复信息的数据库,其中,所述答复信息可以但不限于为语音信息、文本信息或图片信息等。在计算所述用户问句与在QA问答库中各项标准问句的问句相似度的步骤中,可以但不限于包括步骤如下:S201.分别对所述用户问句和所述标准问句进行分词预处理,获取对应的关键词集;S202.根据所述用户问句和所述标准问句的关键词集,计算所述用户问句与所述标准问句的问句相似度。
在所述步骤S201中,对所述标准问句进行分词预处理的时间节点优选在该标准问句录入所述QA问答库时,并将获取的对应关键词集预存储在该QA问答库中。在所述步骤S201中,可以但不限于包括步骤如下:S301.将问句与在句模库中的各项句模进行模式匹配,将匹配率最高的句模作为与所述问句对应的最匹配句模,所述问句为用户问句或标准问句;S302.根据所述最匹配句模去掉所述问句中的疑问词和问句特征词,实现对所述问句的切分,得到语句片断;S303.对所述语句片断进行分词处理,然后去除分词结果中的所有辅助词,得到核心语义词;S304.将所有的核心语义词作为关键词加载到所述问句的关键词集中。
在所述步骤S301中,所述句模库是指预存储有各种句模(即问句模型)的数据库,其中,所述句模为模型化的、具有一定规律的提问句型,其可以但不限于采用巴科斯范式(BackusNormalForm)来定义句模的文法,然后以如下表1所示的句模数据结构存储在句模库中。例如,对于问句“小明什么时候上大学?”,可以定义其文法为<询问时间语义块>::=(<事件>)<提问时间特征词>(<事件>)<提问时间特征词>::=何时|什么时候|哪天|几月几日|。
表1 句模数据结构
对问句与句模进行模式匹配的思路是:首先根据提问特征词,使用正则表达式对句模库中的句模进行匹配,然后根据匹配结果确定该问句属于何种句模。由此可实现句模分析的融合,帮助问答***理解用户的提问意图,以便后续进行有针对性地答复,同时通过句模分析,可以去掉句子中的提问特征词(如“什么”“哪里”等),将大大减小下一阶段词法分析中出现歧义的概率。
在所述步骤S302中,所述语句片断为一个或多个词的连续组合,可根据最匹配句模的定义,舍弃问句中的提问特征词,实现句子的进一步切开,得到多个语句片断。例如对于问句:“工作人员什么时候来安装电表”,可先根据句模的定义进行匹配,根据“什么时候”关键词分析出问题属于“提问时间”句模,然后将问题句中“什么时候”关键词舍弃掉,把句子切分开,如此得到语句片断:“工作人员”和“来安装电表”。
在所述步骤S303中,所述核心语义项代表了用户所提问题的实质,具有主题突出和概念明确的特点,因此有必要将其作为关键词加载到所述问句的关键词集中。由于句模分析后得到的语句片断是切分后得到的结果,所以它的灵活性和多样性比真实的自然语言文本要差一些,这样分词时出现歧义的情况较少,可以避免出现理解差异。作为优化的,为了在分词时最大限度地避免出现歧义情况,在对所述语句片断进行分词处理的步骤中,可以但不限于包括步骤如下:S401.分别应用正向最大匹配算法和逆向最大匹配算法对所述语句片断进行分词处理,若两种分词处理的分词结果一致,则将任意一种分词结果作为最终的分词结果,否则比较两种分词结果的切分出现概率,将切分出现概率最高的分词结果作为最终的分词结果。
在所述步骤S401中,所述正向最大匹配算法和所述逆向最大匹配算法分别为现有的传统机械式分词算法,例如在对语句片断“研究生物科学的学生”进行分词处理时,采用正向最大匹配算法进行分词的结果为:“研究生/物/科学/的/学生”,而采用逆向最大匹配算法进行分词的结果却为:“研究/生物/科学/的/学生”,此时即认为分词出现歧义情况。具体的,按照如下公式计算分词结果的切分出现概率q:
q=q(W1)·q(W2)·q(W3)·····q(Wn)
式中,W1,W2,W3,…Wn为所述分词结果中的各个词,n为所述分词结果中的词数,q(W)为词W的词频。
由于计算机或程序并不能真正理解各个关键词的含义,因此还需要对问句的关键词集进行同义和概念扩展。即在所述步骤S304之后,还包括如下步骤:S305.根据所述核心语义词收集对应的同义词,然后将所有的同义词也作为关键词加载到所述问句的关键词集中。和/或在所述步骤S304之后,还包括如下步骤:S306.读取与所述最匹配句模对应的特定辅助词表,然后将在所述特定辅助词表中的所有特定辅助词也作为关键词加载到所述问句的关键词集中。对于所述步骤S305,可以但不限于从同义词典和概念库中找出与核心语义项对应的各种同义词,例如对于问句“我国有多少辆自行车”,其中的核心语义项“自行车”可以扩展为“自行车”/“bicycle”/“脚踏车”/“单车”等。对于所述步骤S306,所述特定辅助词表为预先存储在句模库中的数据,对于不同的句模,对应有不同的特定辅助词,例如对于门句“中国科技大学在哪里?”,可以扩展为“中国科技大学”+“位于”/“地处”等。
在所述步骤S202中,为了从多个维度来综合计算门句相似度,可以但不限于包括步骤如下。
S501.按照如下公式分别计算用户问句QU与标准问句QA的词形相似度WordSim(QU,QA)、句长相似度LenSim(QU,QA)、词序相似度OrderSim(QU,QA)和距离相似度DisSim(QU,QA):
式中,Len(QU)为在用户问句QU的关键词集中关键词个数,Len(QA)为在标准问句QA的关键词集中关键词个数,SameWc(QU,QA)为在用户问句QU和标准问句QA的关键词集中相同关键词的个数,OnceWs(QU,QA)表示在用户问句QU和标准问句QA中都出现且只出现一次的关键词的集合,|OnceWs(QU,QA)|为在OnceWs(QU,QA)集合中关键词的个数,Pfirst(QU,QA)表示OnceWs(QU,QA)集合中的关键词在用户问句QU中的位置序号构成的向量,Psecond(QU,QA)表示Pfirst(QU,QA)中的分量按对应关键词在标准问句QA中的次序排序生成的向量,RevOrd(QU,QA)为在Psecond(QU,QA)中各相邻分量的逆序数,Dis(QU,QA)为应用标准语句QA中的关键词集将用户问句QU变成标准问句QA所需的最小编辑操作次数,k为利用领域内的相似问句进行训练得到的且在距离相似度DisSim(QU,QA)为0.5时的词语距离值,Max()为取最大值函数,Abs()为取绝对值函数。
S502.按照如下公式计算用户问句QU与标准问句QA的问句相似度Sim(QU,QA):
Sim(QU,QA)=α1·WordSim(QU,QA)+α2·LenSim(QU,QA)+α3·OrderSim(QU,QA)
4·DisSim(QU,QA)
式中,α1为词形相似度WordSim(QU,QA)的权重系数,α2为句长相似度LenSim(QU,QA)的权重系数,α3为词序相似度OrderSim(QU,QA)的权重系数,α4为距离相似度DisSim(QU,QA)的权重系数,所有的权重系数满足:α1234=1。
在所述步骤S502中,各项权重系数可以根据应用领域的具体情况调节,例如在供电服务领域,可以设定权重系数α1介于0.3~0.4之间,设定权重系数α2介于0.15~0.35之间,设定权重系数α3介于0.1~0.3之间,设定权重系数α4介于0.05~0.1之间。由此在计算问句相似度的过程中,可以通过针对词形、句长、次序和距离四个维度进行相似性评估,并得到最终的、具有综合性的问句相似度,保证问句相似度的准确性。
S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息。
S105.反馈所述答复信息。
综上,本实施例所提供的实现智能问答的信息处理方法,具有如下技术效果:(1)本发明所提供的信息处理方法,其核心思路是先对问题文本信息进行分句处理,获取用户问句,然后基于问句相似度在QA问答库中找到与用户问句最相似的标准问句及对应的答复信息,由此相比较于现有基于关键词检索的问答方法,无需要求用户具有关键词分解的能力,全程自动化,大幅度提升用户体验,并提高搜索效果、反馈答案的针对性和有效性;(2)在问句相似度的计算过程中,实现了句模分析、词法分析和词义扩展等自然语言理解技术的融合,并通过进行多维度相似性的综合计算,极大地提高了最终问句相似度在汉语自动问答过程中的准确性,从而可解决因中文固有的复杂性特点而难以实现汉语智能问答的问题,使汉语系的智能问答***成为可能;(3)本发明提供的实现智能问答的信息处理方法及其装置,可拓展适用于诸如教育领域、行政领域和供电服务领域等行业领域中,便于实际推广和应用。
实施例二
图2示出了本发明提供的实现智能问答的信息处理方法的装置结构示意图。本实施例提供的所述装置为实现实施例一所述的实现智能问答的信息处理方法的装置,包括收发单元、问句获取单元、问句相似度对比单元、答案获取单元和QA问答库;所述收发单元通信连接所述问句获取单元,用于接收问题文本信息和反馈答复信息;所述问句获取单元通信连接所述问句相似度对比单元,用于对所述问题文本信息进行分句处理,获取用户问句;所述问句相似度对比单元分别通信连接所述答案获取单元和所述QA问答库,用于分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;所述答案获取单元分别通信连接所述QA问答库和所述收发单元,用于从所述QA问答库中读取与所述最相似标准问句对应的答复信息;所述QA问答库用于存储各项标准问句和对应的答复信息。
本实施例提供的所述装置的工作方式和技术效果,可以基于实施例一中所描述的内容得到,于此不再赘述。
如上所述,可较好地实现本发明。对于本领域的技术人员而言,根据本发明的教导,设计出不同形式的实现智能问答的信息处理方法及其装置并不需要创造性的劳动。在不脱离本发明的原理和精神的情况下对这些实施例进行变化、修改、替换、整合和变型仍落入本发明的保护范围内。

Claims (9)

1.一种实现智能问答的信息处理方法,其特征在于,包括步骤如下:
S101.接收问题文本信息;
S102.对所述问题文本信息进行分句处理,获取用户问句;
S103.分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;
S104.从所述QA问答库中读取与所述最相似标准问句对应的答复信息;
S105.反馈所述答复信息。
2.如权利要求1所述的一种实现智能问答的信息处理方法,其特征在于,在计算所述用户问句与在QA问答库中各项标准问句的问句相似度的步骤中,包括步骤如下:
S201.分别对所述用户问句和所述标准问句进行分词预处理,获取对应的关键词集;
S202.根据所述用户问句和所述标准问句的关键词集,计算所述用户问句与所述标准问句的问句相似度。
3.如权利要求2所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S201中,包括步骤如下:
S301.将问句与在句模库中的各项句模进行模式匹配,将匹配率最高的句模作为与所述问句对应的最匹配句模,所述问句为用户问句或标准问句;
S302.根据所述最匹配句模去掉所述问句中的疑问词和问句特征词,实现对所述问句的切分,得到语句片断;
S303.对所述语句片断进行分词处理,然后去除分词结果中的所有辅助词,得到核心语义词;
S304.将所有的核心语义词作为关键词加载到所述问句的关键词集中。
4.如权利要求3所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S304之后,还包括如下步骤:
S305.根据所述核心语义词收集对应的同义词,然后将所有的同义词也作为关键词加载到所述问句的关键词集中。
5.如权利要求4所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S304之后,还包括如下步骤:
S306.读取与所述最匹配句模对应的特定辅助词表,然后将在所述特定辅助词表中的所有特定辅助词也作为关键词加载到所述问句的关键词集中。
6.如权利要求3所述的一种实现智能问答的信息处理方法,其特征在于,在对所述语句片断进行分词处理的步骤中,包括步骤如下:
S401.分别应用正向最大匹配算法和逆向最大匹配算法对所述语句片断进行分词处理,若两种分词处理的分词结果一致,则将任意一种分词结果作为最终的分词结果,否则比较两种分词结果的切分出现概率,将切分出现概率最高的分词结果作为最终的分词结果。
7.如权利要求6所述的一种实现智能问答的信息处理方法,其特征在于,按照如下公式计算分词结果的切分出现概率q:
q=q(W1)·q(W2)·q(W3)·…·q(Wn)
式中,W1,W2,W3,…Wn为所述分词结果中的各个词,n为所述分词结果中的词数,q(W)为词W的词频。
8.如权利要求2所述的一种实现智能问答的信息处理方法,其特征在于,在所述步骤S202中,包括步骤如下:
S501.按照如下公式分别计算用户问句QU与标准问句QA的词形相似度WordSim(QU,QA)、句长相似度LenSim(QU,QA)、词序相似度OrderSim(QU,QA)和距离相似度DisSim(QU,QA):
<mrow> <mi>W</mi> <mi>o</mi> <mi>r</mi> <mi>d</mi> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>,</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>S</mi> <mi>a</mi> <mi>m</mi> <mi>e</mi> <mi>W</mi> <mi>c</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>,</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>M</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>)</mo> <mo>,</mo> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mo>(</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
<mrow> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>,</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <mi>A</mi> <mi>b</mi> <mi>s</mi> <mrow> <mo>(</mo> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>)</mo> <mo>-</mo> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mo>(</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>L</mi> <mi>e</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
<mrow> <mi>D</mi> <mi>i</mi> <mi>s</mi> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>,</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mi>k</mi> <mrow> <mo>(</mo> <mi>D</mi> <mi>i</mi> <mi>s</mi> <mo>(</mo> <mrow> <msub> <mi>Q</mi> <mi>U</mi> </msub> <mo>,</mo> <msub> <mi>Q</mi> <mi>A</mi> </msub> </mrow> <mo>)</mo> <mo>+</mo> <mi>k</mi> <mo>)</mo> </mrow> </mfrac> </mrow>
式中,Len(QU)为在用户问句QU的关键词集中关键词个数,Len(QA)为在标准问句QA的关键词集中关键词个数,SameWc(QU,QA)为在用户问句QU和标准问句QA的关键词集中相同关键词的个数,OnceWs(QU,QA)表示在用户问句QU和标准问句QA中都出现且只出现一次的关键词的集合,|OnceWs(QU,QA)|为在OnceWs(QU,QA)集合中关键词的个数,Pfirst(QU,QA)表示OnceWs(QU,QA)集合中的关键词在用户问句QU中的位置序号构成的向量,Psecond(QU,QA)表示Pfirst(QU,QA)中的分量按对应关键词在标准问句QA中的次序排序生成的向量,RevOrd(QU,QA)为在Psecond(QU,QA)中各相邻分量的逆序数,Dis(QU,QA)为应用标准语句QA中的关键词集将用户问句QU变成标准问句QA所需的最小编辑操作次数,k为利用领域内的相似问句进行训练得到的且在距离相似度DisSim(QU,QA)为0.5时的词语距离值,Max()为取最大值函数,Abs()为取绝对值函数;
S502.按照如下公式计算用户问句QU与标准问句QA的问句相似度Sim(QU,QA):
Sim(QU,QA)=α1·WordSim(QU,QA)+α2·LenSim(QU,QA)+α3·OrderSim(QU,QA)+α4·DisSim(QU,QA)
式中,α1为词形相似度WordSim(QU,QA)的权重系数,α2为句长相似度LenSim(QU,QA)的权重系数,α3为词序相似度OrderSim(QU,QA)的权重系数,α4为距离相似度DisSim(QU,QA)的权重系数,所有的权重系数满足:α1234=1。
9.一种实现如权利要求1~8任意一项所述的实现智能问答的信息处理方法的装置,其特征在于,包括收发单元、问句获取单元、问句相似度对比单元、答案获取单元和QA问答库;
所述收发单元通信连接所述问句获取单元,用于接收问题文本信息和反馈答复信息;
所述问句获取单元通信连接所述问句相似度对比单元,用于对所述问题文本信息进行分句处理,获取用户问句;
所述问句相似度对比单元分别通信连接所述答案获取单元和所述QA问答库,用于分别计算所述用户问句与在QA问答库中各项标准问句的问句相似度,然后将问句相似度最高的标准问句作为与所述用户问句对应的最相似标准问句;
所述答案获取单元分别通信连接所述QA问答库和所述收发单元,用于从所述QA问答库中读取与所述最相似标准问句对应的答复信息;
所述QA问答库用于存储各项标准问句和对应的答复信息。
CN201710344592.2A 2017-05-16 2017-05-16 一种实现智能问答的信息处理方法及其装置 Pending CN107273350A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710344592.2A CN107273350A (zh) 2017-05-16 2017-05-16 一种实现智能问答的信息处理方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710344592.2A CN107273350A (zh) 2017-05-16 2017-05-16 一种实现智能问答的信息处理方法及其装置

Publications (1)

Publication Number Publication Date
CN107273350A true CN107273350A (zh) 2017-10-20

Family

ID=60064437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710344592.2A Pending CN107273350A (zh) 2017-05-16 2017-05-16 一种实现智能问答的信息处理方法及其装置

Country Status (1)

Country Link
CN (1) CN107273350A (zh)

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729510A (zh) * 2017-10-23 2018-02-23 深圳市前海众兴电子商务有限公司 信息交互方法、信息交互终端及存储介质
CN107886876A (zh) * 2017-12-08 2018-04-06 江苏飞视文化发展有限公司 一种景区移动式环保广告车的服务方法
CN107918678A (zh) * 2017-12-28 2018-04-17 北京洪泰同创信息技术有限公司 问答信息处理方法、问答信息处理***及服务器
CN108153876A (zh) * 2017-12-26 2018-06-12 爱因互动科技发展(北京)有限公司 智能问答方法及***
CN108197151A (zh) * 2017-12-06 2018-06-22 阿里巴巴集团控股有限公司 文法库的更新方法及装置
CN108345672A (zh) * 2018-02-09 2018-07-31 平安科技(深圳)有限公司 智能应答方法、电子装置及存储介质
CN108449479A (zh) * 2018-04-28 2018-08-24 山东亚华电子股份有限公司 一种基于语音识别的医疗无线通信方法及***
CN108536874A (zh) * 2018-05-29 2018-09-14 赵洪矫 一种用于拓展客户流量的方法及平台
CN108628825A (zh) * 2018-04-10 2018-10-09 平安科技(深圳)有限公司 文本信息相似度匹配方法、装置、计算机设备及存储介质
CN108683821A (zh) * 2018-04-28 2018-10-19 山东亚华电子股份有限公司 一种移动终端与医护分机的通信方法及***
CN108682454A (zh) * 2018-04-28 2018-10-19 山东亚华电子股份有限公司 一种基于移动终端的语音医嘱管理***及方法
CN108735289A (zh) * 2018-04-28 2018-11-02 山东亚华电子股份有限公司 一种基于用户登录的医疗管理方法及***
CN108763356A (zh) * 2018-05-16 2018-11-06 深圳市三宝创新智能有限公司 一种基于相似句搜索的智能机器人闲聊***及方法
CN108846031A (zh) * 2018-05-28 2018-11-20 同方知网数字出版技术股份有限公司 一种面向电力行业的项目相似性对比方法
CN108920488A (zh) * 2018-05-14 2018-11-30 平安科技(深圳)有限公司 多***相结合的自然语言处理方法及装置
CN109033162A (zh) * 2018-06-19 2018-12-18 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109062977A (zh) * 2018-06-29 2018-12-21 厦门快商通信息技术有限公司 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和***
CN109189906A (zh) * 2018-08-17 2019-01-11 国家电网有限公司客户服务中心 智能客服对连贯语境下多问句完整语义的识别方法
CN109190099A (zh) * 2018-08-23 2019-01-11 上海互教教育科技有限公司 句模提取方法及装置
CN109241269A (zh) * 2018-07-27 2019-01-18 深圳追科技有限公司 任务型机器人词槽填充方法
CN109344234A (zh) * 2018-09-06 2019-02-15 和美(深圳)信息技术股份有限公司 机器阅读理解方法、装置、计算机设备和存储介质
CN109657232A (zh) * 2018-11-16 2019-04-19 北京九狐时代智能科技有限公司 一种意图识别方法
CN109829046A (zh) * 2019-01-18 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能坐席***及方法
CN110059155A (zh) * 2018-12-18 2019-07-26 阿里巴巴集团控股有限公司 文本相似度的计算、智能客服***的实现方法和装置
CN110162615A (zh) * 2019-05-29 2019-08-23 北京市律典通科技有限公司 一种智能问答方法、装置、电子设备和存储介质
CN110188180A (zh) * 2019-05-31 2019-08-30 三角兽(北京)科技有限公司 相似问题的确定方法、装置、电子设备及可读存储介质
CN110489527A (zh) * 2019-08-13 2019-11-22 南京邮电大学 基于语音交互的银行业务智能咨询以及办理方法和***
CN110502625A (zh) * 2019-08-27 2019-11-26 北京百度网讯科技有限公司 医疗问题解答方法、装置、设备及计算机可读存储介质
CN110674261A (zh) * 2019-10-14 2020-01-10 出门问问信息科技有限公司 一种信息处理方法、装置以及计算机可读存储介质
CN110674275A (zh) * 2019-09-23 2020-01-10 青岛聚好联科技有限公司 一种知识问答的方法及装置
WO2020010834A1 (zh) * 2018-07-13 2020-01-16 众安信息技术服务有限公司 一种faq问答库泛化方法、装置及设备
CN110851579A (zh) * 2019-11-06 2020-02-28 杨鑫蛟 用户意图识别方法、***、移动终端及存储介质
WO2020057439A1 (zh) * 2018-09-21 2020-03-26 华为技术有限公司 答案确定方法及***
CN111125334A (zh) * 2019-12-20 2020-05-08 神思电子技术股份有限公司 一种基于预训练的搜索问答***
CN111177349A (zh) * 2019-12-20 2020-05-19 厦门快商通科技股份有限公司 问答匹配方法、装置、设备及存储介质
WO2020119346A1 (zh) * 2018-12-12 2020-06-18 深圳前海达闼云端智能科技有限公司 自然语义理解的方法、装置、计算设备
CN112435512A (zh) * 2020-11-12 2021-03-02 郑州大学 一种轨道交通运输仿真培训的语音行为考核评价方法
CN112966087A (zh) * 2021-03-15 2021-06-15 中国美术学院 一种灵感素材的智能问答***及方法
CN113868413A (zh) * 2021-12-03 2021-12-31 北京大学 法律咨询报告生成方法及装置
CN115795016A (zh) * 2022-12-30 2023-03-14 联通智网科技股份有限公司 问题匹配方法、***、电子设备及存储介质
US11704497B2 (en) 2020-09-09 2023-07-18 International Business Machines Corporation Generating and using a sentence model for answer generation
CN116662374A (zh) * 2023-07-31 2023-08-29 天津市扬天环保科技有限公司 基于相关性分析的信息技术咨询服务***
CN116932911A (zh) * 2023-07-24 2023-10-24 山东翰林科技有限公司 一种基于ChatGPT的电力知识问答助手构建方法
CN117114475A (zh) * 2023-08-21 2023-11-24 广州红海云计算股份有限公司 基于多维度人才评估策略的综合能力测评***
CN117520522A (zh) * 2023-12-29 2024-02-06 华云天下(南京)科技有限公司 一种基于rpa和ai结合的智能对话方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286161A (zh) * 2008-05-28 2008-10-15 华中科技大学 一种基于概念的智能中文问答***
US20080263169A1 (en) * 2003-04-22 2008-10-23 Cooper Technologies Company Systems and methods for messaging to multiple gateways
CN105678383A (zh) * 2016-01-04 2016-06-15 北京飞舜信息技术有限公司 基于本体模型的移动知识服务***
CN106257441A (zh) * 2016-06-30 2016-12-28 电子科技大学 一种基于词频的skip语言模型的训练方法
CN106649868A (zh) * 2016-12-30 2017-05-10 首都师范大学 问答匹配方法及装置
CN106776532A (zh) * 2015-11-25 2017-05-31 ***通信集团公司 一种知识问答方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080263169A1 (en) * 2003-04-22 2008-10-23 Cooper Technologies Company Systems and methods for messaging to multiple gateways
CN101286161A (zh) * 2008-05-28 2008-10-15 华中科技大学 一种基于概念的智能中文问答***
CN106776532A (zh) * 2015-11-25 2017-05-31 ***通信集团公司 一种知识问答方法及装置
CN105678383A (zh) * 2016-01-04 2016-06-15 北京飞舜信息技术有限公司 基于本体模型的移动知识服务***
CN106257441A (zh) * 2016-06-30 2016-12-28 电子科技大学 一种基于词频的skip语言模型的训练方法
CN106649868A (zh) * 2016-12-30 2017-05-10 首都师范大学 问答匹配方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董自涛 等: ""智能问答***中问句相似度计算方法"", 《武汉理工大学学报 信息与管理工程版》 *

Cited By (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729510A (zh) * 2017-10-23 2018-02-23 深圳市前海众兴电子商务有限公司 信息交互方法、信息交互终端及存储介质
CN108197151B (zh) * 2017-12-06 2021-08-03 创新先进技术有限公司 文法库的更新方法及装置
CN108197151A (zh) * 2017-12-06 2018-06-22 阿里巴巴集团控股有限公司 文法库的更新方法及装置
CN107886876A (zh) * 2017-12-08 2018-04-06 江苏飞视文化发展有限公司 一种景区移动式环保广告车的服务方法
CN108153876A (zh) * 2017-12-26 2018-06-12 爱因互动科技发展(北京)有限公司 智能问答方法及***
CN107918678A (zh) * 2017-12-28 2018-04-17 北京洪泰同创信息技术有限公司 问答信息处理方法、问答信息处理***及服务器
CN108345672A (zh) * 2018-02-09 2018-07-31 平安科技(深圳)有限公司 智能应答方法、电子装置及存储介质
WO2019153607A1 (zh) * 2018-02-09 2019-08-15 平安科技(深圳)有限公司 智能应答方法、电子装置及存储介质
CN108628825A (zh) * 2018-04-10 2018-10-09 平安科技(深圳)有限公司 文本信息相似度匹配方法、装置、计算机设备及存储介质
CN108449479A (zh) * 2018-04-28 2018-08-24 山东亚华电子股份有限公司 一种基于语音识别的医疗无线通信方法及***
CN108735289A (zh) * 2018-04-28 2018-11-02 山东亚华电子股份有限公司 一种基于用户登录的医疗管理方法及***
CN108682454A (zh) * 2018-04-28 2018-10-19 山东亚华电子股份有限公司 一种基于移动终端的语音医嘱管理***及方法
CN108683821A (zh) * 2018-04-28 2018-10-19 山东亚华电子股份有限公司 一种移动终端与医护分机的通信方法及***
CN108683821B (zh) * 2018-04-28 2020-11-10 山东亚华电子股份有限公司 一种移动终端与医护分机的通信方法及***
CN108920488B (zh) * 2018-05-14 2021-09-28 平安科技(深圳)有限公司 多***相结合的自然语言处理方法及装置
CN108920488A (zh) * 2018-05-14 2018-11-30 平安科技(深圳)有限公司 多***相结合的自然语言处理方法及装置
CN108763356A (zh) * 2018-05-16 2018-11-06 深圳市三宝创新智能有限公司 一种基于相似句搜索的智能机器人闲聊***及方法
CN108846031A (zh) * 2018-05-28 2018-11-20 同方知网数字出版技术股份有限公司 一种面向电力行业的项目相似性对比方法
CN108846031B (zh) * 2018-05-28 2022-05-13 同方知网数字出版技术股份有限公司 一种面向电力行业的项目相似性对比方法
CN108536874A (zh) * 2018-05-29 2018-09-14 赵洪矫 一种用于拓展客户流量的方法及平台
CN109033162A (zh) * 2018-06-19 2018-12-18 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109062977A (zh) * 2018-06-29 2018-12-21 厦门快商通信息技术有限公司 一种基于语义相似度的自动问答文本匹配方法、自动问答方法和***
WO2020010834A1 (zh) * 2018-07-13 2020-01-16 众安信息技术服务有限公司 一种faq问答库泛化方法、装置及设备
CN109241269A (zh) * 2018-07-27 2019-01-18 深圳追科技有限公司 任务型机器人词槽填充方法
CN109189906A (zh) * 2018-08-17 2019-01-11 国家电网有限公司客户服务中心 智能客服对连贯语境下多问句完整语义的识别方法
CN109190099A (zh) * 2018-08-23 2019-01-11 上海互教教育科技有限公司 句模提取方法及装置
CN109190099B (zh) * 2018-08-23 2022-12-13 上海互教教育科技有限公司 句模提取方法及装置
CN109344234A (zh) * 2018-09-06 2019-02-15 和美(深圳)信息技术股份有限公司 机器阅读理解方法、装置、计算机设备和存储介质
WO2020057439A1 (zh) * 2018-09-21 2020-03-26 华为技术有限公司 答案确定方法及***
CN109657232A (zh) * 2018-11-16 2019-04-19 北京九狐时代智能科技有限公司 一种意图识别方法
WO2020119346A1 (zh) * 2018-12-12 2020-06-18 深圳前海达闼云端智能科技有限公司 自然语义理解的方法、装置、计算设备
CN110059155A (zh) * 2018-12-18 2019-07-26 阿里巴巴集团控股有限公司 文本相似度的计算、智能客服***的实现方法和装置
CN109829046A (zh) * 2019-01-18 2019-05-31 青牛智胜(深圳)科技有限公司 一种智能坐席***及方法
CN110162615A (zh) * 2019-05-29 2019-08-23 北京市律典通科技有限公司 一种智能问答方法、装置、电子设备和存储介质
CN110162615B (zh) * 2019-05-29 2021-08-24 北京市律典通科技有限公司 一种智能问答方法、装置、电子设备和存储介质
CN110188180A (zh) * 2019-05-31 2019-08-30 三角兽(北京)科技有限公司 相似问题的确定方法、装置、电子设备及可读存储介质
CN110188180B (zh) * 2019-05-31 2021-06-01 腾讯科技(深圳)有限公司 相似问题的确定方法、装置、电子设备及可读存储介质
CN110489527A (zh) * 2019-08-13 2019-11-22 南京邮电大学 基于语音交互的银行业务智能咨询以及办理方法和***
CN110502625A (zh) * 2019-08-27 2019-11-26 北京百度网讯科技有限公司 医疗问题解答方法、装置、设备及计算机可读存储介质
CN110674275A (zh) * 2019-09-23 2020-01-10 青岛聚好联科技有限公司 一种知识问答的方法及装置
CN110674261A (zh) * 2019-10-14 2020-01-10 出门问问信息科技有限公司 一种信息处理方法、装置以及计算机可读存储介质
CN110851579A (zh) * 2019-11-06 2020-02-28 杨鑫蛟 用户意图识别方法、***、移动终端及存储介质
CN110851579B (zh) * 2019-11-06 2023-03-10 杨鑫蛟 用户意图识别方法、***、移动终端及存储介质
CN111125334A (zh) * 2019-12-20 2020-05-08 神思电子技术股份有限公司 一种基于预训练的搜索问答***
CN111125334B (zh) * 2019-12-20 2023-09-12 神思电子技术股份有限公司 一种基于预训练的搜索问答***
CN111177349B (zh) * 2019-12-20 2022-05-17 厦门快商通科技股份有限公司 问答匹配方法、装置、设备及存储介质
CN111177349A (zh) * 2019-12-20 2020-05-19 厦门快商通科技股份有限公司 问答匹配方法、装置、设备及存储介质
US11704497B2 (en) 2020-09-09 2023-07-18 International Business Machines Corporation Generating and using a sentence model for answer generation
CN112435512B (zh) * 2020-11-12 2023-01-24 郑州大学 一种轨道交通运输仿真培训的语音行为考核评价方法
CN112435512A (zh) * 2020-11-12 2021-03-02 郑州大学 一种轨道交通运输仿真培训的语音行为考核评价方法
CN112966087A (zh) * 2021-03-15 2021-06-15 中国美术学院 一种灵感素材的智能问答***及方法
CN112966087B (zh) * 2021-03-15 2023-10-13 中国美术学院 一种灵感素材的智能问答***及方法
CN113868413A (zh) * 2021-12-03 2021-12-31 北京大学 法律咨询报告生成方法及装置
CN115795016A (zh) * 2022-12-30 2023-03-14 联通智网科技股份有限公司 问题匹配方法、***、电子设备及存储介质
CN115795016B (zh) * 2022-12-30 2024-03-22 联通智网科技股份有限公司 问题匹配方法、***、电子设备及存储介质
CN116932911A (zh) * 2023-07-24 2023-10-24 山东翰林科技有限公司 一种基于ChatGPT的电力知识问答助手构建方法
CN116932911B (zh) * 2023-07-24 2023-12-15 山东翰林科技有限公司 一种基于ChatGPT的电力知识问答助手构建方法
CN116662374A (zh) * 2023-07-31 2023-08-29 天津市扬天环保科技有限公司 基于相关性分析的信息技术咨询服务***
CN116662374B (zh) * 2023-07-31 2023-10-20 天津市扬天环保科技有限公司 基于相关性分析的信息技术咨询服务***
CN117114475A (zh) * 2023-08-21 2023-11-24 广州红海云计算股份有限公司 基于多维度人才评估策略的综合能力测评***
CN117520522A (zh) * 2023-12-29 2024-02-06 华云天下(南京)科技有限公司 一种基于rpa和ai结合的智能对话方法、装置及电子设备
CN117520522B (zh) * 2023-12-29 2024-03-22 华云天下(南京)科技有限公司 一种基于rpa和ai结合的智能对话方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107273350A (zh) 一种实现智能问答的信息处理方法及其装置
CN107315766A (zh) 一种集合智能与人工问答的语音问答方法及其装置
CN110674639B (zh) 一种基于预训练模型的自然语言理解方法
Chieu et al. A maximum entropy approach to information extraction from semi-structured and free text
CN111325029B (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN108874878A (zh) 一种知识图谱的构建***及方法
CN109241538A (zh) 基于关键词和动词依存的中文实体关系抽取方法
Fahad et al. Inflectional review of deep learning on natural language processing
CN106844346A (zh) 基于深度学习模型Word2Vec的短文本语义相似性判别方法和***
CN105608218A (zh) 智能问答知识库的建立方法、建立装置及建立***
CN109388700A (zh) 一种意图识别方法及***
CN105589844A (zh) 一种用于多轮问答***中缺失语义补充的方法
CN108717410B (zh) 命名实体识别方法及***
CN106610951A (zh) 改进的基于语义分析的文本相似度求解算法
CN111475655B (zh) 一种基于配电网知识图谱的电力调度文本实体链接方法
CN108710611A (zh) 一种基于词网络和词向量的短文本主题模型生成方法
CN101599071A (zh) 对话文本主题的自动提取方法
CN110362678A (zh) 一种自动提取中文文本关键词的方法与装置
CN110765759A (zh) 意图识别方法及装置
CN108733647B (zh) 一种基于高斯分布的词向量生成方法
CN108763212A (zh) 一种地址信息提取方法及装置
CN112948543A (zh) 基于加权TextRank的多语言多文档摘要抽取方法
JP2019153093A (ja) フレーズ生成関係性推定モデル学習装置、フレーズ生成装置、方法、及びプログラム
CN111914555B (zh) 基于Transformer结构的自动化关系抽取***
CN109783819B (zh) 一种正则表达式的生成方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171020

RJ01 Rejection of invention patent application after publication