CN113220881B - 基于深度学习的教育问答实现方法、装置及服务器 - Google Patents

基于深度学习的教育问答实现方法、装置及服务器 Download PDF

Info

Publication number
CN113220881B
CN113220881B CN202110511234.2A CN202110511234A CN113220881B CN 113220881 B CN113220881 B CN 113220881B CN 202110511234 A CN202110511234 A CN 202110511234A CN 113220881 B CN113220881 B CN 113220881B
Authority
CN
China
Prior art keywords
column
condition
question
model
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110511234.2A
Other languages
English (en)
Other versions
CN113220881A (zh
Inventor
孟伟东
杨凡
陈志杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yancheng Kindergarten Teachers College
Original Assignee
Yancheng Kindergarten Teachers College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yancheng Kindergarten Teachers College filed Critical Yancheng Kindergarten Teachers College
Publication of CN113220881A publication Critical patent/CN113220881A/zh
Application granted granted Critical
Publication of CN113220881B publication Critical patent/CN113220881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于深度学习的教育问答实现方法、装置及服务器,包括:获取待处理问题语句;将语句分别输入至预先建立的分类模型、查询模型和条件模型中,输出表格标识;输出至少一个关联列以及对关联列的聚合处理方式;输出至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;根据表格标识、关联列、对关联列的聚合处理方式、条件列、条件列的处理方式以及不同条件列的函数关系生成查询语句;根据查询语句从表格标识对应的表格中获取与查询语句对应的解答信息,将解答信息作为待处理问题语句的答案。本说明书实施例可以灵活应对问题答案需要查询单表还是多表的情况,拓宽应用范围,省略了数据转换的过程,节省人力和时间成本。

Description

基于深度学习的教育问答实现方法、装置及服务器
技术领域
本发明涉及人工智能领域,特别涉及一种基于深度学习的教育问答实现方法、装置及服务器。
背景技术
近年来,随着人工智能技术研究和进步,人工智能技术在多个领域得到广泛应用,其中,人工智能在在线教育行业的问答实现领域的应用,是各大互联网平台提供数据搜索等服务的基础保障。
现有技术中,目前的在线教育问答的实现基本上是以构建问答对数据集来针对问题进行解答或者将原始数据转换为知识图谱,然后针对图谱来进行问答。上述方法都需要将原始数据转换为其他类型的数据集,才能进行下一步的问答。上述现有的方法需要对原始数据进行处理得到特定的问答对数据集或知识图谱,由于对原始数据的处理量较大,并且处理后的问答对数据集或知识图谱并不够全面,导致所构建的文本特征无法准确反映文本信息的语义,从而对后续的匹配造成负向影响,导致匹配准确率低,并且,在新增问题时仍需要重新构建问答对数据集或知识图谱,造成服务器中数据冗余的问题。因此,需要提供更可靠或更有效的方案。
另外,现有的一些问答服务器,通常用固定架进行固定,并且通过多个分层板,使多个服务器依次放置在固定架上,这种多个服务器设置在同一个固定架上,十分影响服务器的散热,尤其是在一些特殊狭小的空间内,散热效率差,从而影响了整体的散热效率。
发明内容
本申请提供了一种基于深度学习的教育问答实现方法、装置及电子设备,可以有效避免个别与文本语义无关或有误导的分词对文本整体的偏差影响,省略将原始数据转化成其他类型数据集的过程,大大提高了问答的准确率,降低服务器数据冗余。
一方面,本发明提供一种问答实现方法,包括:
获取待处理问题语句;
将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识;
将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应;
将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;
根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句;
根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案。
进一步地、所述将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识,包括:
提取所述待处理问题语句中的至少一个关键词;
将全部所述关键词输入至预先建立的分类模型中,根据全部所述关键词输出与所述待处理问题语句关联的至少一个表格标识。
进一步地、所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,之前还包括:
判断所述关联列或所述条件列是否为空值;
若所述关联列或所述条件列为空值,则将所述待处理问题语句和对应的表格标识存储至转换错误日志中;
间隔预设时间将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述查询模型的输入,将对应表格中的至少一个关联列以及对关联列的聚合处理方式作为所述查询模型的输出,调整所述查询模型的参数,直至所述查询模型的收敛;
将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述条件模型的输入,将所述表格标识对应的表格中与所述待处理问题语句对应的多个条件列、各个条件列的处理方式以及不同条件列的函数关系作为所述条件模型的输出,调整所述条件模型的参数,直至所述条件模型的收敛。
进一步地、所述根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案,包括:
根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息;
判断所述解答信息是否为空值;
若所述解答信息为空值,则将预设回复信息作为解答信息,将所述解答信息作为所述待处理问题语句的答案;
将所述待处理问题语句存储至待确认日志中。
进一步地、所述将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系,之后包括:
根据所述条件列获取对应的属性值;
相应的,所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,包括:
根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列对应的属性值、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句。
进一步地、所述根据所述条件列获取对应的属性值,包括:
判断所述条件列的文字类型;
当所述条件列的文字类型为文本时,将所述条件列中的各个文本与各个所述关键词进行相似度计算;
将相似度最高的文本作为所述条件列的属性值。
进一步地、还包括:
当所述条件列的文字类型为数字时,将所述条件列的列名与各个所述关键词进行相似度计算;
将相似度最高的列名下的相近数值作为所述条件列的属性值。
另一方面,本发明提供一种问答实现装置,包括:
问题语句获取模块,被配置为执行获取待处理问题语句;
表格标识输出模块,被配置为执行将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识;
关联列输出模块,被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应;
条件列输出模块,被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;
查询语句生成模块,被配置为执行根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句;
解答模块,被配置为执行根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案。
再一方面,本发明提供一种问答实现设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由所述处理器加载并执行以实现如上述所述的问答实现方法。
再一方面,本发明提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由处理器加载并执行以实现如上述所述的问答实现方法。
本申请还提供一种问答实现服务器,所述问答实现服务器包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由所述处理器加载并执行以实现如上任一项实施方式所述的问答实现方法。
再一方面,所述问答实现服务器包括固定架和服务器主体,所述固定架之间设有多个固定连接的分层板,所述服务器主体设置在分层板上,所述固定架上设有用于所述服务器主体冷却降温的冷却机构,所述冷却机构包括:
散热管,设置在服务器主体的上方,用于服务器主体的吸热;
散热槽,设置在分层板内,且散热槽内设有用于降温的冷区液;
其中,上下相邻的所述散热槽之间设有相连通的连通管,所述固定架一侧设有冷却箱,所述冷却箱上设有用于输送冷区液的出料管,所述出料管与最底部的散热槽之间连通,位于最上端的所述散热槽一侧设有回流管,所述回流管与冷却箱连通。
优选的,所述固定架一侧设有散热风机,所述散热风机输出端设有排气管,且散热风机进气端设有进气管,位于散热管一侧的所述固定架内设有用于散热管连通的导流管,所述进气管底部与导流管连通。
优选的,所述散热管底部设有均匀分布的散热孔。
优选的,所述冷却箱内设有冷却泵,所述冷却泵输出端与出料管连通。
进一步的,位于回流管底部的所述冷却箱内设有剖面呈L形且用于分流的分流板,所述冷却泵设于分流板底部。
优选的,所述散热槽与连通管之间形成S形分布。
有益效果:
本说明书实施例提供的问答语句实现方法,通过将待处理语句输入至预先建立的分别模型中得到对应的表格标识,通过将待处理语句和表格标识输入至预先建立的查询模型中得到对应的关联列和对关联列的聚合处理方式,通过将待处理语句和表格标识输入至预先建立的条件模型中得到条件列、各个条件列的处理方式以及不同条件列的函数关系,再根据表格标识、关联列、对关联列的聚合处理方式、条件列、条件列的处理方式以及不同条件列的函数关系生成对应的查询语句,根据查询语句从队形的表格中获取对应的解答信息,并将解答信息作为待处理语句的答案,本说明书实施例可以灵活应对问题答案需要查询单表还是多表的情况,拓宽应用范围,省略了数据转换的过程,节省人力和时间成本。
另外,利用散热管,能够将服务器主体在工作时产生的热量,通过散热管及时的吸收排出,防止热气排放不及时,热气积累,影响提高整体的温度;这种设计能提高外部散热效率,通过降低服务器主体在工作时的环境的温度,从而保证服务器主体的工作效率;
散热槽的设计,将原有的分层板内部设置散热槽,并且在散热槽内设置冷却液,利用水冷的形式,通过接触散热,能够有效的将服务器主体在工作时,产生的热量,通过热传导的形式,进行及时的散热;
两种散热形式的结合,能够有效的提高整体的散热效率,能够将热量及时的排出,并且降温。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本说明书实施例提供的一种问答实现***的应用示意图;
图2为本发明实施例提供的一种问答实现方法的流程示意图;
图3为本发明实施例提供的又一种问答实现方法的流程示意图;
图4为本发明实施例提供的再一种问答实现方法的流程示意图;
图5为本发明实施例提供的一种问答实现装置的结构示意图;
图6为本发明实施例提供的一种问答实现设备的结构示意图;
图7为本说明书实施例提供的主视结构示意图;
图8为图7的散热管与散热风机连接结构示意图;
图9为图7的散热槽与冷却箱连接结构示意图;
图10为图7的冷却箱内部结构示意图。
其中,:1、固定架;11、分层板;2、散热管;21、散热孔;22、进气管;23、散热风机;24、排气管;25、导流管;3、冷却箱;31、冷却泵;32、出料管;33、回流管;34、连通管;35、散热槽;36、分流板;4、服务器主体;10、客户端;20、服务器;11、问题语句获取模块;12、表格标识输出模块;13、关联列输出模块;14、条件列输出模块;15、查询语句生成模块;16、解答模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
近年来,随着人工智能技术研究和进步,人工智能技术在多个领域得到广泛应用,本申请实施例提供的方案涉及人工智能的机器学习/深度学习等技术,具体通过如下实施例进行说明:
请参阅图1,图1为本说明书实施例提供的一种基于深度学习的教育问答实现***的应用示意图,该问答实现***可以包括客户端10和服务器20,客户端中安装有应用程序,应用程序可以与服务器进行数据交互,以用于实现本申请的多租户场景下的应用程序更新方法。如图1所示,客户端可以用于提供面向应用用户的下载或更新处理。客户端提供面向应用用户的下载或更新的方式可以包括但不限于应用程序方式或网页方式等。
本申请实施例中,该问答实现***中的服务器可以包括独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。在一个示例中,服务器为分布式***时,该分布式***可以为区块链***。
本申请实施例中,所述客户端可以包括智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、智能可穿戴设备等类型的实体设备。本申请实施例中客户端上运行的操作***可以包括但不限于安卓***、IOS***、linux、windows等。
本说明书实施例中,上述客户端10以及服务器20可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
此外,需要说明的是,在实际应用中,分类模型、查询模型和条件模型的训练处理也可以在客户端10中实现,本说明书实施例中,优选的,在服务器20中实现分类模型、查询模型和条件模型的训练处理,以便减轻客户端10的数据处理压力,改善面向用户的客户端的设备性能。
在一个具体的实施例中,服务器20为分布式***时,该分布式***可以为区块链***,分布式***为区块链***时,可以由多个节点(接入网络中的任意形式的计算设备,如服务器、用户终端)形成,节点之间形成组成的点对点(P2P,Peer To Peer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式***中,任何机器如服务器、客户端都可以加入而成为节点,节点包括硬件层、中间层、操作***层和应用层。具体的,区块链***中各节点的功能,涉及的功能可以包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链***中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
需要说明的是,以下图中示出的是一种可能的步骤顺序,实际上并不限定必须严格按照此顺序。有些步骤可以在互不依赖的情况下并行执行。
以下先介绍本申请一种问答实现方法,如图2所示,图2为本发明实施例提供的一种问答实现方法的流程示意图,本说明书实施例提供了一种问答实现方法,该方法可以在服务器或客户端中执行,图2中10可以表示上述实施例中的客户端,20可以表示上述实施例中的服务器,所述方法可以包括:
S202、获取待处理问题语句。
在具体的实施过程中,待处理问题语句可以是基于用户输入的问题语句,该问句中包含用户想要询问的内容。如:“我想知道甲老师的授课时间”。
S204、将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识。
在具体的实施过程中,分类模型可以是预先建立的,且存储有关于问题语句与至少一个表格标识的对应关系,其中,表格标识是用于区别不同表格,不同表格可以具备部分相同的内容。分类模型可以使用BERT算法训练。
在上述实施例基础上,本说明书一个实施例中,图3为本发明实施例提供的又一种问答实现方法的流程示意图,如图3所示,所述将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识,包括:
S302、提取所述待处理问题语句中的至少一个关键词;
S304、将全部所述关键词输入至预先建立的分类模型中,根据全部所述关键词输出与所述待处理问题语句关联的至少一个表格标识。
在具体的实施过程中,分类模型可以对输入的待处理问题语句进行关键词提取,关键词可以用于在分类模型中获取对应的表格标识,全部关键词可以表征待处理问题语句的全部内容。
在实际应用中,由于在线教育数据以表格形式存储在数据库中,而且会存储为多张表格。在询问老师业务信息的场景中,如果问题问的是询问不同老师的授课时间,需要针对不同老师的属性表进行查询。但是有些问题可能只是针对单个特定老师提问,因此针对问题我们首先需要判断问题是询问多张表还是一张表,以此为依据构建训练集。问题提问日志可以包括历史用户提出的问题语句,根据问题提问日志,建立对应的场景数据集。场景数据集与与对应问题语句对应的表格标识,表格标识对应的表格中包含问题语句的答案,如数据集中text为授课时间提问,label为表格标识(对应单表)或场景名称(对应查询多表)。如text=“在某时段的授课的所有老师”,对应label=“老师”;如text=“周日XX老师授课吗”,对应label=“table_XX”(xx老师属性表对应的表格id)。同时对每个场景建立各个场景表格的对应关系,将查询某场景多表时需要的表格标识加入该场景表格中。
可以理解的是,不同表格标识对应的表格可以是按照老师姓名、教学科目、教学日期等划分的表格。如问题语句为“周日XX老师授课吗”时,分类模型可以直接确定出XX老师对应的表格标识。
分类模型具体的训练方式可以如下所述,以问题提问日志中的各个问题语句作为分类模型的输入,以问题语句的答案对应的表格标识作为分类模型的输出,预先构建问题语句与其答案对应的表格标识,将构建问题语句与其答案对应的表格标识作为训练文本对。问题语句可以通过预设机器学习模型(分类模型)的输入层输入,然后,特征提取层将问题语句进行关键词提取得到分词信息,将问题语句和分词信息分别量化为文本特征向量和词向量。在一个具体的实施例中,特征提取层可以包括一个用于生成词向量和文本特征向量的模型,例如LTD-BERT模型(一种压缩版的bert模型,这里用来产生词向量和文本特征向量),也包括一个生成词向量的模型和一个生成文本特征向量的模型;具体的,生成词向量的模型可以包括但不限于词袋模型、One-Hot(独热编码)等词向量模型。具体的,生成文本特征向量的模型可以包括但不限于PV-DM(Distributed Memory Model of ParagraphVectors,句向量的分布记忆模型)、PV-DBOW(Distributed Bag of Words version ofParagraph Vector,句向量的分布词袋)等句向量模型。
本说明书实施例中,在信息交互层对问题语句对中两个问题语句的分词信息中分词的词向量进行信息交互处理,得到每一分词的权重具体可以包括,针对训练文本对中一个训练文本信息的分词信息中某一分词的权重,可以将该分词的词向量分别与另一训练文本信息的分词信息中每一分词的词向量相乘,将相乘的结果相加,作为该分词的权重。具体的,这里该分词的词向量与另一训练文本信息的分词信息中每一分词的词向量相乘的结果,可以反映该分词与另一训练文本信息的分词信息中每一分词的相似程度,将该分词与另一训练文本信息的分词信息中每一分词的相似程度相加,就可以得到表征分词在另一训练文本信息中重要程度的权重。具体的,分词的权重越高,该分词在另一训练文本信息中的重要程度越高。
S206、将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应。
在具体的实施过程中,查询模型中预先建立有待处理问题语句和所述表格标识与所述待处理问题语句关联的表格标识对应的表格中的至少一个关联列以及对关联列的聚合处理方式。
如:针对单表查询情况下建立查询数据集,每行数据为{“query”:问句;“table_id”:查询表id;“select”:[该问句查询了当前表的哪些列,查询列对应值为1,其他为0];“agg”:[该问句对查询列的聚合操作,0对应无操作,1对应count,2对应sum,3对应avg,4对应min,5对应max];“group_by”:[问句对表中哪列进行分组,分组列对应值为1,其他为0]}。
示例地、假设老师属性表格标识为111,该表的列名有Id(姓名id),班级(Class),老师姓名(Name),课程类型(Type),授课时间(WorkTime);问题语句为“我想知道韩梅梅老师的授课时间”,则对应的数据行为{“query”:“我想知道韩梅梅老师的授课时间”;“table_id”:“111”;“select”:[0,0,0,0,1];“agg”:[0,0,0,0,0];“group_by”:[0,0,0,0,0]}。将query和表的列名连接做tokenization,之后进行BERT ENCODING并训练出查询模型。预测时输入用户问题语句和步骤S204中得到的表格标识(如果查询多表,输入多次),查询模型可以通过对应的全连接层实现softmax归一化后,输出select、agg、group_by的最终值。其中,select表征与问题语句对应的关联列,agg和group_by对应问题语句对关联列的聚合处理方式。
S208、将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系。
在具体的实施过程中,条件模型可以预先构建条件数据集,其中每一行的数据为{“query”:问题语句;“table_id”:查询表格标识;“header”:[表格标识中哪些列作为问题语句对应的条件列,条件列对应值为1,其他为0];“operation”:[条件中对列的操作是什么,0对应无操作,1对应等于,2对应大于,3对应小于,4对应like,5对应大于等于,6对应小于等于];“connection”:[这几个列对应条件之间的链接关系,0对应无关系,1对应or,2对应and]}。步骤S206中举例的问句对应的条件数据行为{“query”:“韩梅梅老师的英文授课时间”;“table_id”:“111”;“header”:[0,1,1,1,0];“operation”:[0,1,1,1,0];“connection”:[0,2,2,2,0]}。将query和表格标识对应的表的列名连接做关联,之后可以使用BERTENCODING算法训练条件模型。在实际使用时输入用户问题语句和步骤S206中得到的表格标识(对应多个表格标识时,可以输入多次),查询模型分别通过对应的全连接层实现softmax归一化后,输出header、operation、connection的最终值。Header对应的最终值表征为问题语句对应的条件列,operation的最终值表征各个条件列的处理方式,connection的最终值表征不同条件列的函数关系。
S210、根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句。
在具体的实施过程中,查询语句可以是结构化查询语言(Structured QueryLanguage,SQL)、Hibernate查询语言(Hibernate Query Language,HQL)等,上面的例子形成sql可以表示为select WorkTime Remark from Branch where Name=’韩梅梅’and课程类型=’英文’。如果查询多个表格,则将生成多个查询语句。
结构化查询语言是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库***。
结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库***,可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。
HQL是Hibernate Query Language(Hibernate查询语言)的缩写,提供更加丰富灵活、更为强大的查询能力;HQL更接近SQL语句查询语法。
Hibernate查询语言(HQL)是一种面向对象的查询语言,类似于SQL,但不是去对表和列进行操作,而是面向对象和它们的属性。HQL查询被Hibernate翻译为传统的SQL查询从而对数据库进行操作。
S212、根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案。
在具体的实施过程中,服务器可以根据查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案。其中,待处理问题语句的答案可以通过页面展示的方式呈现给对应的用户。
本说明书实施例提供的问答语句实现方法,通过将待处理语句输入至预先建立的分别模型中得到对应的表格标识,通过将待处理语句和表格标识输入至预先建立的查询模型中得到对应的关联列和对关联列的聚合处理方式,通过将待处理语句和表格标识输入至预先建立的条件模型中得到条件列、各个条件列的处理方式以及不同条件列的函数关系,再根据表格标识、关联列、对关联列的聚合处理方式、条件列、条件列的处理方式以及不同条件列的函数关系生成对应的查询语句,根据查询语句从队形的表格中获取对应的解答信息,并将解答信息作为待处理语句的答案,本说明书实施例可以灵活应对问题答案需要查询单表还是多表的情况,拓宽***应用范围,省略了数据转换的过程,节省人力和时间成本。
在上述实施例基础上,本说明书一个实施例中,图4为本发明实施例提供的再一种问答实现方法的流程示意图,如图4所示,所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,之前还包括:
S402、判断所述关联列或所述条件列是否为空值;
S404、若所述关联列或所述条件列为空值,则将所述待处理问题语句和对应的表格标识存储至转换错误日志中;
S406、间隔预设时间将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述查询模型的输入,将对应表格中的至少一个关联列以及对关联列的聚合处理方式作为所述查询模型的输出,调整所述查询模型的参数,直至所述查询模型的收敛;
S408、将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述条件模型的输入,将所述表格标识对应的表格中与所述待处理问题语句对应的多个条件列、各个条件列的处理方式以及不同条件列的函数关系作为所述条件模型的输出,调整所述条件模型的参数,直至所述条件模型的收敛。
在具体的实施过程中,空值表示值未知。空值不同于空白或零值,没有两个相等的空值。比较两个空值或将空值与任何其他值相比均返回未知,这是因为每个空值均为未知。可以理解的是,本说明书实施例中的空值为对应的表格列中数据未知、不适用或将在以后添加数据。
示例地、如果步骤S204中结果为表格标识,且步骤S206和S208输出的select或header为空,证明待处理问题语句转换错误,将该问题语句存储在转换错误日志中,间隔预设时间根据将转换错误日志中的问题语句重新转换后加入查询模型、条件模型中进行模型训练。可以理解的是,转换错误日志存储在服务器的某个节点中。
本说明书实施例在对待处理问题语句进行处理过程中,如果出现空值时,可以将该问题语句存储在转换错误日志中,并间隔预设时间后对转换错误日志中的全部问题语句进行模型训练,提高模型的适用性和准确性。
在上述实施例基础上,本说明书一个实施例中,所述根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案,包括:
根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息;
判断所述解答信息是否为空值;
若所述解答信息为空值,则将预设回复信息作为解答信息,将所述解答信息作为所述待处理问题语句的答案;
将所述待处理问题语句存储至待确认日志中。
在具体的实施过程中,预设回复信息在本说明书实施例中不做具体限定,可以根据实际需要进行设置,如“很抱歉,没有查到相关结果”。
示例地、当判断出解答信息为空值时,可以将“很抱歉,没有查到相关结果”作为解答信息,并将该待处理问题语句存储至待确认日志中,后续确认是本来无结果还是***造成的错误,并进行优化。
在上述实施例基础上,本说明书一个实施例中,所述将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系,之后包括:
根据所述条件列获取对应的属性值;
在一些可能的实施例中,所述根据所述条件列获取对应的属性值,包括:
判断所述条件列的文字类型;
当所述条件列的文字类型为文本时,将所述条件列中的各个文本与各个所述关键词进行相似度计算;
将相似度最高的文本作为所述条件列的属性值。
在具体的实施过程中,文字类型可以包括文本或数字。条件列的内容可以与待处理问题语句的关键词相对应。
在上述实施例基础上,本说明书一个实施例中,还包括:
当所述条件列的文字类型为数字时,将所述条件列的列名与各个所述关键词进行相似度计算;
将相似度最高的列名下的相近数值作为所述条件列的属性值。
相应的,所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,包括:
根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列对应的属性值、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句。
示例地、对步骤S208中输出的header进行处理,其中header为条件列。如果header中列为文本,则将header对应列中的文本和问题语句使用TF-IDF或基于word2vec进行相似度计算,输出相似度最高的内容作为属性值,比如上面的问题语句为“韩梅梅老师的英文授课时间”,对应的三个属性值为韩梅梅,英文,授课时间,可以理解的是,问题语句对应的表格中记载有韩梅梅,英文,授课时间的内容。如果header对应条件列为数值,将关键词与条件列的列名进行相似度计算,提取最相似词下列的数值作为该条件列属性值。
本说明书实施例中将通过条件模型进一步匹配待处理问题语句中的关键词与对应表格中条件列的属性值的相似度,并利用相似度最高的属性值生成查询语句,使得查询语句与待处理问题语句更加匹配,进一步提高问答实现方法的准确性。
另一方面,本说明书实施例提供一种问答实现装置,图5为本发明实施例提供的一种问答实现装置的结构示意图,如图5所示,包括:
问题语句获取模块11,被配置为执行获取待处理问题语句;
表格标识输出模块12,被配置为执行将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识;
关联列输出模块13被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应;
条件列输出模块14被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;
查询语句生成模块15,被配置为执行根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句;
解答模块16,被配置为执行根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案。
在上述实施例基础上,本说明书一个实施例中,所述表格标识输出模块,包括:
关键词提取单元,被配置为执行提取所述待处理问题语句中的至少一个关键词;
表格标识输出单元,被配置为执行将全部所述关键词输入至预先建立的分类模型中,根据全部所述关键词输出与所述待处理问题语句关联的至少一个表格标识。
在上述实施例基础上,本说明书一个实施例中,还包括:
判断模块,被配置为判断判断所述关联列或所述条件列是否为空值;
存储模块若所述关联列或所述条件列为空值,则将所述待处理问题语句和对应的表格标识存储至转换错误日志中;
查询模型训练模块,被配置为执行间隔预设时间将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述查询模型的输入,将对应表格中的至少一个关联列以及对关联列的聚合处理方式作为所述查询模型的输出,调整所述查询模型的参数,直至所述查询模型的收敛;
条件模型训练模块,被配置为执行将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述条件模型的输入,将所述表格标识对应的表格中与所述待处理问题语句对应的多个条件列、各个条件列的处理方式以及不同条件列的函数关系作为所述条件模型的输出,调整所述条件模型的参数,直至所述条件模型的收敛。
在上述实施例基础上,本说明书一个实施例中,所述解答模块,包括:
解答信息获取单元,被配置为执行根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息;
判断单元,被配置为执行判断所述解答信息是否为空值;
解答信息替换单元,被配置为执行若所述解答信息为空值,则将预设回复信息作为解答信息,将所述解答信息作为所述待处理问题语句的答案;
存储单元,被配置为执行将所述待处理问题语句存储至待确认日志中。
又一方面,本说明书实施例提供一种诸如问答实现服务器的问答实现设备,图6为本发明实施例提供的一种问答实现服务器的结构示意图,如图6所示,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由所述处理器加载并执行以实现如上述所述的问答实现方法。
另一方面,本说明书实施例一种计算机可读存储介质,所述存储介质中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由处理器加载并执行以实现如上述所述的问答实现方法。
由于问答实现装置、计算机可读存储介质及问答实现设备与问答实现方法的技术效果相同,在此不在赘述。
请参阅图7-图10,本申请一个实施例中还提供一种可长时间稳定运行的问答服务器,该问答服务器可以应用于上述问答实现服务器的冷却降温,以实现长时间可靠稳定运行。具体的,该问答实现服务器包括固定架1和服务器主体4,所述固定架1之间设有多个固定连接的分层板11,所述服务器主体4设置在分层板11上,所述固定架1上设有用于服务器冷却降温的冷却机构,所述冷却机构包括散热管2和散热槽35,所述散热管2设置在服务器主体4的上方,用于服务器主体4的吸热;散热槽35,设置在分层板11内,且散热槽35内设有用于降温的冷区液。
其中,上下相邻的所述散热槽35之间设有相连通的连通管34,所述固定架1一侧设有冷却箱3,所述冷却箱3上设有用于输送冷区液的出料管32,所述出料管32与最底部的散热槽35之间连通,位于最上端的所述散热槽35一侧设有回流管33,所述回流管33与冷却箱3连通。
在本实施例中,所述固定架1一侧设有散热风机23,所述散热风机23输出端设有排气管24,且散热风机23进气端设有进气管22,位于散热管2一侧的所述固定架1内设有用于散热管2连通的导流管25,所述进气管22底部与导流管25连通。
在本实施例中,所述散热管2底部设有均匀分布的散热孔21。通过散热孔21的设计,能够实现多点吸附热量,散热更加的均匀。
在本实施例中,所述冷却箱3内设有冷却泵31,所述冷却泵31输出端与出料管32连通。所述散热槽35与连通管34之间形成S形分布。
请参阅图10,位于回流管33底部的所述冷却箱3内设有剖面呈L形且用于分流的分流板36,所述冷却泵31设于分流板36底部。在本实施例中的问答实现服务器通过分流板36的设计,能够有效的提高冷却后的冷却液在冷却箱3内的停留时间,从而有效的提高了冷却液在冷却箱3内的散热效率,保证冷却液在使用时,能够达到冷却的温度。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。本发明实施例所提供测试方法,其实现原理及产生的技术效果和前述***实施例相同,为简要描述,方法实施例部分未提及之处,可参考前述***实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的***和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以上述权利要求的保护范围为准。

Claims (8)

1.一种基于深度学习的教育问答实现方法,其特征在于,包括:
获取待处理问题语句;
将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识;所述分类模型存储有关于问题语句与至少一个表格标识的对应关系;
将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应;
将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;
根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句;
根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案;
所述将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识,包括:
提取所述待处理问题语句中的至少一个关键词;
将全部所述关键词输入至预先建立的分类模型中,根据全部所述关键词输出与所述待处理问题语句关联的至少一个表格标识;
所述分类模型的训练方式包括:以问题提问日志中的各个问题语句作为分类模型的输入,以问题语句的答案对应的表格标识作为分类模型的输出,预先构建问题语句与其答案对应的表格标识,将构建问题语句与其答案对应的表格标识作为训练文本对;
所述问题语句通过预设机器学习模型的输入层输入,然后,特征提取层将问题语句进行关键词提取得到分词信息,将问题语句和分词信息分别量化为文本特征向量和词向量;所述特征提取层包括一个用于生成词向量和文本特征向量的模型,或者所述特征提取层包括一个生成词向量的模型和一个生成文本特征向量的模型;
在信息交互层对问题语句对中两个问题语句的分词信息中分词的词向量进行信息交互处理,得到每一分词的权重,包括:针对训练文本对中一个训练文本信息的分词信息中某一分词的权重,将该分词的词向量分别与另一训练文本信息的分词信息中每一分词的词向量相乘,将相乘的结果相加,作为该分词的权重;分词的权重越高,该分词在另一训练文本信息中的重要程度越高;
所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,之前还包括:
判断所述关联列或所述条件列是否为空值;
若所述关联列或所述条件列为空值,则将所述待处理问题语句和对应的表格标识存储至转换错误日志中;
间隔预设时间将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述查询模型的输入,将对应表格中的至少一个关联列以及对关联列的聚合处理方式作为所述查询模型的输出,调整所述查询模型的参数,直至所述查询模型的收敛;
将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述条件模型的输入,将所述表格标识对应的表格中与所述待处理问题语句对应的多个条件列、各个条件列的处理方式以及不同条件列的函数关系作为所述条件模型的输出,调整所述条件模型的参数,直至所述条件模型的收敛。
2.根据权利要求1所述的问答实现方法,其特征在于,所述根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案,包括:
根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息;
判断所述解答信息是否为空值;
若所述解答信息为空值,则将预设回复信息作为解答信息,将所述解答信息作为所述待处理问题语句的答案;
将所述待处理问题语句存储至待确认日志中。
3.根据权利要求1所述的问答实现方法,其特征在于,所述将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系,之后包括:
根据所述条件列获取对应的属性值;
相应的,所述根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句,包括:
根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列对应的属性值、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句。
4.根据权利要求3所述的问答实现方法,其特征在于,所述根据所述条件列获取对应的属性值,包括:
判断所述条件列的文字类型;
当所述条件列的文字类型为文本时,将所述条件列中的各个文本与各个所述关键词进行相似度计算;
将相似度最高的文本作为所述条件列的属性值。
5.根据权利要求4所述的问答实现方法,其特征在于,还包括:
当所述条件列的文字类型为数字时,将所述条件列的列名与各个所述关键词进行相似度计算;
将相似度最高的列名下的相近数值作为所述条件列的属性值。
6.一种问答实现装置,其特征在于,包括:
问题语句获取模块,被配置为执行获取待处理问题语句;
表格标识输出模块,被配置为执行将所述待处理问题语句输入至预先建立的分类模型中,输出与所述待处理问题语句关联的至少一个表格标识;所述分类模型存储有关于问题语句与至少一个表格标识的对应关系;
关联列输出模块,被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的查询模型中,输出所述表格标识对应的表格中至少一个关联列以及对关联列的聚合处理方式,所述关联列以及对关联列的聚合处理方式与所述待处理问题语句对应;
条件列输出模块,被配置为执行将所述待处理问题语句和所述表格标识输入至预先建立的条件模型中,输出与所述表格标识对应的表格中与所述待处理问题语句对应的至少一个条件列、各个条件列的处理方式以及不同条件列的函数关系;
查询语句生成模块,被配置为执行根据所述表格标识、所述关联列、所述对关联列的聚合处理方式、所述条件列、所述条件列的处理方式以及不同所述条件列的函数关系生成对应的查询语句;
解答模块,被配置为执行根据所述查询语句从所述表格标识对应的表格中获取与所述查询语句对应的解答信息,将所述解答信息作为所述待处理问题语句的答案;
判断模块,被配置为判断所述关联列或所述条件列是否为空值;
存储模块,若所述关联列或所述条件列为空值,则将所述待处理问题语句和对应的表格标识存储至转换错误日志中;
查询模型训练模块,被配置为执行间隔预设时间将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述查询模型的输入,将对应表格中的至少一个关联列以及对关联列的聚合处理方式作为所述查询模型的输出,调整所述查询模型的参数,直至所述查询模型的收敛;
条件模型训练模块,被配置为执行将所述转换错误日志中的各个待处理问题语句和对应的表格标识作为所述条件模型的输入,将所述表格标识对应的表格中与所述待处理问题语句对应的多个条件列、各个条件列的处理方式以及不同条件列的函数关系作为所述条件模型的输出,调整所述条件模型的参数,直至所述条件模型的收敛;
所述表格标识输出模块包括:
关键词提取单元,被配置为执行提取所述待处理问题语句中的至少一个关键词;
表格标识输出单元,被配置为执行将全部所述关键词输入至预先建立的分类模型中,根据全部所述关键词输出与所述待处理问题语句关联的至少一个表格标识;
所述分类模型的训练方式包括:以问题提问日志中的各个问题语句作为分类模型的输入,以问题语句的答案对应的表格标识作为分类模型的输出,预先构建问题语句与其答案对应的表格标识,将构建问题语句与其答案对应的表格标识作为训练文本对;
所述问题语句通过预设机器学习模型的输入层输入,然后,特征提取层将问题语句进行关键词提取得到分词信息,将问题语句和分词信息分别量化为文本特征向量和词向量;所述特征提取层包括一个用于生成词向量和文本特征向量的模型,或者所述特征提取层包括一个生成词向量的模型和一个生成文本特征向量的模型;
在信息交互层对问题语句对中两个问题语句的分词信息中分词的词向量进行信息交互处理,得到每一分词的权重,包括:针对训练文本对中一个训练文本信息的分词信息中某一分词的权重,将该分词的词向量分别与另一训练文本信息的分词信息中每一分词的词向量相乘,将相乘的结果相加,作为该分词的权重;分词的权重越高,该分词在另一训练文本信息中的重要程度越高。
7.一种问答实现服务器,其特征在于,所述问答实现服务器包括处理器和存储器,所述存储器中存储有至少一条指令或者至少一段程序,所述至少一条指令或者至少一段程序由所述处理器加载并执行以实现如权利要求1-5任一项所述的问答实现方法。
8.如权利要求7所述的问答实现服务器,其特征在于,所述问答实现服务器包括固定架和服务器主体,所述固定架之间设有多个固定连接的分层板,所述服务器主体设置在分层板上,所述固定架上设有用于所述服务器主体冷却降温的冷却机构,所述冷却机构包括:
散热管,设置在服务器主体的上方,用于服务器主体的吸热;
散热槽,设置在分层板内,且散热槽内设有用于降温的冷区液;
其中,上下相邻的所述散热槽之间设有相连通的连通管,所述固定架一侧设有冷却箱,所述冷却箱上设有用于输送冷区液的出料管,所述出料管与最底部的散热槽之间连通,位于最上端的所述散热槽一侧设有回流管,所述回流管与冷却箱连通。
CN202110511234.2A 2021-02-24 2021-05-11 基于深度学习的教育问答实现方法、装置及服务器 Active CN113220881B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110208393 2021-02-24
CN2021102083935 2021-02-24

Publications (2)

Publication Number Publication Date
CN113220881A CN113220881A (zh) 2021-08-06
CN113220881B true CN113220881B (zh) 2024-02-06

Family

ID=77094688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110511234.2A Active CN113220881B (zh) 2021-02-24 2021-05-11 基于深度学习的教育问答实现方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN113220881B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114490969B (zh) * 2021-12-29 2023-03-07 北京百度网讯科技有限公司 基于表格的问答方法、装置以及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206728493U (zh) * 2017-05-18 2017-12-08 李东杰 一种计算机机房服务器机柜冷却装置
CN110945495A (zh) * 2017-05-18 2020-03-31 易享信息技术有限公司 基于神经网络的自然语言查询到数据库查询的转换
CN110941708A (zh) * 2019-11-04 2020-03-31 智器云南京信息科技有限公司 智能问答库建立方法、智能问答方法及装置、计算机设备
CN111414380A (zh) * 2020-03-20 2020-07-14 华泰证券股份有限公司 一种中文数据库sql语句生成方法、设备及存储介质
CN111625554A (zh) * 2020-07-30 2020-09-04 武大吉奥信息技术有限公司 一种基于深度学习语义理解的数据查询方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206728493U (zh) * 2017-05-18 2017-12-08 李东杰 一种计算机机房服务器机柜冷却装置
CN110945495A (zh) * 2017-05-18 2020-03-31 易享信息技术有限公司 基于神经网络的自然语言查询到数据库查询的转换
CN110941708A (zh) * 2019-11-04 2020-03-31 智器云南京信息科技有限公司 智能问答库建立方法、智能问答方法及装置、计算机设备
CN111414380A (zh) * 2020-03-20 2020-07-14 华泰证券股份有限公司 一种中文数据库sql语句生成方法、设备及存储介质
CN111625554A (zh) * 2020-07-30 2020-09-04 武大吉奥信息技术有限公司 一种基于深度学习语义理解的数据查询方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
text-to-SQL generation for question answering on electronic medical records;ping wang et al.;arXiv;全文 *
一种基于BERT的中文NL2SQL模型;张琰;信息科技;全文 *
一种基于深度学习的中文自然语言查询生成SQL语句技术研究;曹金超;信息科技辑;全文 *

Also Published As

Publication number Publication date
CN113220881A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
Gan et al. Towards robustness of text-to-SQL models against synonym substitution
US11681702B2 (en) Conversion of model views into relational models
US9552547B2 (en) Normalizing electronic communications using a neural-network normalizer and a neural-network flagger
Lee et al. Scalable and efficient web services composition based on a relational database
US20210018332A1 (en) Poi name matching method, apparatus, device and storage medium
US9298671B2 (en) Learning rewrite rules for search database systems using query logs
US10666731B2 (en) IRC-infoid data standardization for use in a plurality of mobile applications
Gu et al. Chronos: An elastic parallel framework for stream benchmark generation and simulation
Xu et al. Provenance Analysis for Missing Answers and Integrity Repairs.
CN111291170A (zh) 一种基于智能客服的会话推荐方法及相关装置
CN113887941B (zh) 业务流程生成方法、装置、电子设备及介质
CN108536728A (zh) 一种数据查询方法和装置
CN113220881B (zh) 基于深度学习的教育问答实现方法、装置及服务器
CN110851584A (zh) 一种法律条文精准推荐***和方法
CN113761220A (zh) 信息获取方法、装置、设备及存储介质
US11688393B2 (en) Machine learning to propose actions in response to natural language questions
Grolinger et al. Collaborative knowledge as a service applied to the disaster management domain
Lin et al. An agent-based approach to reconciling data heterogeneity in cyber-physical systems
Potter et al. Querying distributed RDF graphs: the effects of partitioning
CN113342944A (zh) 一种语料泛化方法、装置、设备及存储介质
CN117033348A (zh) Sql转换方法、装置、计算机设备和存储介质
CN111507108A (zh) 别名生成方法、装置、电子设备及计算机可读存储介质
CN109656952A (zh) 查询处理方法、装置及电子设备
Zeng Application of conditional random field model based on machine learning in online and offline integrated educational resource recommendation
CN114385827A (zh) 面向会议知识图谱的检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant