CN109977200A - 基于sql自动生成技术的语音查询助手 - Google Patents

基于sql自动生成技术的语音查询助手 Download PDF

Info

Publication number
CN109977200A
CN109977200A CN201910073074.0A CN201910073074A CN109977200A CN 109977200 A CN109977200 A CN 109977200A CN 201910073074 A CN201910073074 A CN 201910073074A CN 109977200 A CN109977200 A CN 109977200A
Authority
CN
China
Prior art keywords
module
sql
auto
entity key
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910073074.0A
Other languages
English (en)
Inventor
石正柏
封吉宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Coast Mdt Infotech Ltd
Original Assignee
Shanghai Coast Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Coast Mdt Infotech Ltd filed Critical Shanghai Coast Mdt Infotech Ltd
Priority to CN201910073074.0A priority Critical patent/CN109977200A/zh
Publication of CN109977200A publication Critical patent/CN109977200A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于SQL自动生成技术的语音查询助手,包括自动语音识别模块、实体关键词提取模块、SQL自动生成模块和答案生成模块四部分;本发明提供的基于SQL自动生成技术的语音查询助手,摒弃了传统方法中需要维护知识库的缺点,创造性的引入知识图谱技术。将问题查找匹配与知识谱图技术结合起来,图谱中只需要存储关系型数据库中所用到的表明与字段名就可以实现答案的动态自动生成,相比于传统方法中需要事先准备与维护问题与答案对的技术,提高了***的扩展性、降低了***的维护成本。

Description

基于SQL自动生成技术的语音查询助手
技术领域
本发明涉及产品软件和应用软件技术领域,尤其涉及一种基于SQL自动生成技术的语音查询助手。
背景技术
语音查询助手一般是将用户的查询语音通过ASR(自动语音识别)模块转换为文本,然后再通过NLU(自然语言理解)模块对文本进行解析理解匹配,在知识库中查找检索出与用户文本最相似的问题,最后可以对问题所对应的答案以不同的展现形式返还给用户,如文本或语音等;
现有技术在NLU(自然语言理解)模块对用户问题进行理解匹配的过程中需要维护一个庞大的知识库,用户所问的问题必须事先已存在知识库中,这种查询匹配的模式并不能够根据用户的查询意图实时生成答案,扩展性差,维护成本高。
发明内容
本发明为解决上述技术问题而采用的技术方案是提供一种基于SQL自动生成技术的语音查询助手,其中,具体技术方案是:
包括自动语音识别模块、实体关键词提取模块、SQL自动生成模块和答案生成模块四部分。
上述的基于SQL自动生成技术的语音查询助手,其中:
自动语音识别模块:该模块将用户查询的问题从语音格式自动转换为文本字符格式,转换后的文本格式数据作为数据源会继续加载到后续模块进行进一步处理;
实体关键词提取模块:该模块利用Bi-Lstm+Crf技术对自动语音识别模块转换后的文本数据进行实体关键词提取;
SQL自动生成模块:对实体关键词提取模块提取出的实体关键词进行组合查询,自动生成用于在关系型数据库中查询的Sql语句;
答案生成模块:通过知识图谱生成sql查询语句后在关系型数据库中执行相应的sql语句,将执行的结果作为最终答案返回给用户。
上述的基于SQL自动生成技术的语音查询助手,其中:
SQL自动生成模块,知识图谱通过Neo4j图数据库进行构建,图谱中共包含意图表和实体关键词两类实体,图谱中的关系有两种,意图表与意图表之间的关联关系,关系属性为关联字段名称;实体关键词与意图表之间的关系,表示实体关键词是此意图表中的一个字段。
本发明相对于现有技术具有如下有益效果:本发明在一般语音查询助手的基础上,摒弃了传统方法中需要维护知识库的缺点,创造性的引入知识图谱技术。将问题查找匹配与知识谱图技术结合起来,图谱中只需要存储关系型数据库中所用到的表明与字段名就可以实现答案的动态自动生成,相比于传统方法中需要事先准备与维护问题与答案对的技术,提高了***的扩展性、降低了***的维护成本。
附图说明
图1为基于知识图谱的语音查询助手的示意图。
图2为图数据库中知识图谱的构建模式示意图。
具体实施方式
基于知识图谱的语音查询助手主要包括自动语音识别模块、实体关键词提取模块、SQL自动生成模块和答案生成模块四部分,如图1所示。
自动语音识别模块:该模块可以将用户查询的问题从语音格式自动转换为文本字符格式。转换后的文本格式数据作为数据源会继续加载到后续模块进行进一步处理。
实体关键词提取模块:该模块利用Bi-Lstm+Crf技术对自动语音识别模块转换后的文本数据进行实体关键词提取。例如用户的问题为“张三的投资金额是多少?”,从此问题中提取出的实体关键词为姓名和金额。
SQL自动生成模块:此模块为本发明的核心模块,对实体关键词提取模块提取出的实体关键词进行组合查询,自动生成可以用于在关系型数据库中查询的Sql语句。知识图谱通过Neo4j图数据库进行构建。图谱中共包含意图表和实体关键词两类实体。图谱中的关系有两种,意图表与意图表之间的关联关系,关系属性为关联字段名称;实体关键词与意图表之间的关系,表示实体关键词是此意图表中的一个字段。例如用户的问题为“张三的投资金额是多少?”,问题中的实体关键词为姓名和金额,通过cypher语句可以从图中查询中生成sql语句所需的表明与字段名,并自动生成查询sql。
答案生成模块:通过知识图谱生成sql查询语句后可在关系型数据库中执行相应的sql语句,将执行的结果作为最终答案返回给用户。
现以用户的问题为“张三的投资金额是多少?”为例,展示整个***的运行流程。首先通过自动语音识别模块将用户问题语音转换为文本格式数据,然后通过实体关键字提取模块得到问题中出现的实体姓名和金额。假如图数据库中知识图谱的构建模式如图2所示,通过cypher查询语句可得到生成sql所需要的表名与字段名,然后可自动生成查询问题的sql语句。最后在答案生成模块中通过执行已经自动生成好的sql语句,获取问题答案,返回给用户。
Cypher语句如下:
MATCH(n:Field)-[:BELONGS_TO]->(m:Table)
WHERE n.name=’姓名’or n.name=’金额’
RETURN m.name
Sql语句如下:
SELECT t2.金额FROM用户表t1LEFT JOIN金额表t2
WHERE t1.userid=t2.userid AND t1.姓名=‘张三’
本发明的主要创新点在知识图谱查询模块,将关系型数据库中生成答案所需要的表名与字段名作为实体存储在图数据库中,通过cypher语句自动生成查询答案所需要的sql语句。与传统的基于知识库的查询方式相比大大降低了***的维护成本。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。

Claims (3)

1.一种基于SQL自动生成技术的语音查询助手,其特征在于:包括自动语音识别模块、实体关键词提取模块、SQL自动生成模块和答案生成模块四部分。
2.如权利要求1所述的基于SQL自动生成技术的语音查询助手,其特征在于:
自动语音识别模块:该模块将用户查询的问题从语音格式自动转换为文本字符格式,转换后的文本格式数据作为数据源会继续加载到后续模块进行进一步处理;
实体关键词提取模块:该模块利用Bi-Lstm+Crf技术对自动语音识别模块转换后的文本数据进行实体关键词提取;
SQL自动生成模块:对实体关键词提取模块提取出的实体关键词进行组合查询,自动生成用于在关系型数据库中查询的Sql语句;
答案生成模块:通过知识图谱生成sql查询语句后在关系型数据库中执行相应的sql语句,将执行的结果作为最终答案返回给用户。
3.如权利要求2所述的基于SQL自动生成技术的语音查询助手,其特征在于:
SQL自动生成模块,知识图谱通过Neo4j图数据库进行构建,图谱中共包含意图表和实体关键词两类实体,图谱中的关系有两种,意图表与意图表之间的关联关系,关系属性为关联字段名称;实体关键词与意图表之间的关系,表示实体关键词是此意图表中的一个字段。
CN201910073074.0A 2019-01-25 2019-01-25 基于sql自动生成技术的语音查询助手 Pending CN109977200A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910073074.0A CN109977200A (zh) 2019-01-25 2019-01-25 基于sql自动生成技术的语音查询助手

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910073074.0A CN109977200A (zh) 2019-01-25 2019-01-25 基于sql自动生成技术的语音查询助手

Publications (1)

Publication Number Publication Date
CN109977200A true CN109977200A (zh) 2019-07-05

Family

ID=67076702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910073074.0A Pending CN109977200A (zh) 2019-01-25 2019-01-25 基于sql自动生成技术的语音查询助手

Country Status (1)

Country Link
CN (1) CN109977200A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639153A (zh) * 2020-04-24 2020-09-08 平安国际智慧城市科技股份有限公司 基于法律知识图谱的查询方法、装置、电子设备及介质
CN113345430A (zh) * 2021-06-25 2021-09-03 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN115206320A (zh) * 2022-07-15 2022-10-18 湖南创星科技股份有限公司 基于语音识别的图数据库操作方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480183A (zh) * 2017-07-06 2017-12-15 广州索答信息科技有限公司 一种厨房领域知识图谱查询方法、装置和存储介质
CN108763556A (zh) * 2018-06-01 2018-11-06 北京奇虎科技有限公司 基于需求词的用户挖掘方法及装置
US20180349377A1 (en) * 2017-06-03 2018-12-06 Apple Inc. Converting natural language input to structured queries

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180349377A1 (en) * 2017-06-03 2018-12-06 Apple Inc. Converting natural language input to structured queries
CN107480183A (zh) * 2017-07-06 2017-12-15 广州索答信息科技有限公司 一种厨房领域知识图谱查询方法、装置和存储介质
CN108763556A (zh) * 2018-06-01 2018-11-06 北京奇虎科技有限公司 基于需求词的用户挖掘方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639153A (zh) * 2020-04-24 2020-09-08 平安国际智慧城市科技股份有限公司 基于法律知识图谱的查询方法、装置、电子设备及介质
CN111639153B (zh) * 2020-04-24 2024-07-02 平安国际智慧城市科技股份有限公司 基于法律知识图谱的查询方法、装置、电子设备及介质
CN113345430A (zh) * 2021-06-25 2021-09-03 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN113345430B (zh) * 2021-06-25 2024-05-10 上海适享文化传播有限公司 基于语音固定条件下多字段的查询方法
CN115206320A (zh) * 2022-07-15 2022-10-18 湖南创星科技股份有限公司 基于语音识别的图数据库操作方法及***

Similar Documents

Publication Publication Date Title
CN103761318B (zh) 一种关系型异构数据库数据同步的方法及***
CN111597308A (zh) 一种基于知识图谱的语音问答***及其应用方法
US11301502B1 (en) Parsing natural language queries without retraining
CN109977200A (zh) 基于sql自动生成技术的语音查询助手
KR20160077190A (ko) 자연 표현 처리 방법, 처리 및 응답 방법, 디바이스 및 시스템
WO2002049253A2 (en) Method and interface for intelligent user-machine interaction
CN109241080B (zh) 一种fql查询语言的构建使用方法及其***
WO1990007159A1 (en) Machine translation system
MX2023003764A (es) Método y servidor para sesión inteligente basados en recuperación de datos de tablas.
WO2001071542B1 (en) System and method for the transformation and canonicalization of semantically structured data
CN107491556A (zh) 时空全要素语义查询服务***及其方法
CN101937431A (zh) 情感语音翻译装置及处理方法
US8229746B2 (en) Enhanced accuracy for speech recognition grammars
JP2013190985A (ja) 知識応答システム、方法およびコンピュータプログラム
CN105893389A (zh) 一种语音信息搜索方法、装置及服务器
CN110909126A (zh) 一种信息查询方法及装置
KR20230079729A (ko) 자연어 질의의 sql 변환 방법 및 장치
CN110532358A (zh) 一种面向知识库问答的模板自动生成方法
CN114185931A (zh) 一种基于神经网络模型的中文语言处理方法及装置
CN117743526A (zh) 一种基于大语言模型和自然语言处理的表格问答方法
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
CN104199811B (zh) 短句解析模型建立方法及***
CN112183110A (zh) 一种基于数据中心的人工智能数据应用***及应用方法
CN115080603B (zh) 一种数据库查询语言转换方法、装置、设备及存储介质
CN114238595A (zh) 一种基于知识图谱的冶金知识问答方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705

RJ01 Rejection of invention patent application after publication