CN104281609A - 语音输入指令匹配规则的配置方法及装置 - Google Patents

语音输入指令匹配规则的配置方法及装置 Download PDF

Info

Publication number
CN104281609A
CN104281609A CN201310284410.9A CN201310284410A CN104281609A CN 104281609 A CN104281609 A CN 104281609A CN 201310284410 A CN201310284410 A CN 201310284410A CN 104281609 A CN104281609 A CN 104281609A
Authority
CN
China
Prior art keywords
word
words
identification
speech
mapping relations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310284410.9A
Other languages
English (en)
Other versions
CN104281609B (zh
Inventor
褚攀
徐浩
王飞
韩贵平
廖玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310284410.9A priority Critical patent/CN104281609B/zh
Priority to PCT/CN2014/081763 priority patent/WO2015003596A1/en
Publication of CN104281609A publication Critical patent/CN104281609A/zh
Priority to US14/798,557 priority patent/US9672813B2/en
Application granted granted Critical
Publication of CN104281609B publication Critical patent/CN104281609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/48Message addressing, e.g. address format or anonymous messages, aliases

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种语音输入指令匹配规则的配置方法及装置,涉及信息技术领域,可以提高语音输入指令匹配规则的配置效率。所述方法包括:首先建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中,然后为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令,最后将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。

Description

语音输入指令匹配规则的配置方法及装置
技术领域
本发明涉及信息技术领域,特别涉及一种语音输入指令匹配规则的配置方法及装置。
背景技术
随着终端设备的不断发展,终端设备可以支持的人机交互的方式也越来越多,其中,语音输入的方式为人机交互方式中的一种。终端设备可以通过用户输入的语音信息识别用户意图,目前终端设备通常采用语音输入指令匹配的方法,来匹配用户输入的语音信息对应的语音输入指令,从而执行与该语音输入指令对应的操作。
目前终端设备在配置语音输入指令匹配规则时,终端设备会建立每一种语音输入指令与对应的表达语句之间的映射关系,由于每一种语音输入指令会对应多种语句表达方式,因此采用现有语音输入指令匹配规则的配置方式,会使得终端设备针对每一种语音输入指令,都需要与该指令对应的多种表达方式的语句分别建立映射关系,从而造成现有语音输入指令匹配规则的配置效率较低。
发明内容
本发明实施例提供一种语音输入指令匹配规则的配置方法及装置,可以提高语音输入指令匹配规则的配置效率。
本发明实施例采用的技术方案为:
一种语音输入指令匹配规则的配置方法,包括:
建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中;
为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令;
将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
一种语音输入指令匹配规则的配置装置,包括:
建立单元,用于建立预置词语库中的各个词语与对应的标识词语之间的映射关系;
保存单元,用于将所述建立单元建立的所述映射关系保存在第一映射关系表中;
配置单元,用于为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令;
保存单元,还用于将所述配置单元配置的所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
本发明实施例提供的语音输入指令匹配规则的配置方法及装置,首先建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中,然后为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令,最后将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。与现有终端设备在配置语音输入指令匹配规则时,终端设备会建立每一种语音输入指令与对应的表达语句之间的映射关系相比,本发明实施例通过建立每一种语音输入指令与标识词语或者由标识词语组成的各个语句之间的映射关系,可以避免语义相近的多个语句与对应的同一种语音输入指令重复建立多次映射关系,从而可以提高语音输入指令匹配规则的配置效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种语音输入指令匹配规则的配置方法流程图;
图2为本发明实施例提供的另一种语音输入指令匹配规则的配置方法流程图;
图3为本发明实施例提供的一种语音输入指令匹配规则的配置装置结构示意图;
图4为本发明实施例提供的另一种语音输入指令匹配规则的配置装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
本发明实施例提供一种语音输入指令匹配规则的配置方法,如图1所示,所述方法包括:
101、建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中。
其中,所述预置词语库中的词语具体可以为用户进行语音信息输入时所使用的词语。对于本发明实施例,可以按照词语的词义为预置词语库中的各个词语预先配置分别对应的标识词语,其中,各个词语与对应的标识词语之间的词义相似度满足预设条件。预设条件具体可以为各个词语与对应的标识词语均含有相同词义或者各个词语与对应的标识词语之间的词义相近,本发明实施例不做限定。例如,可以预先配置词义中存在查询含义的词语对应的标识词语为查询,例如将搜索、查找等包含查询含义的词语对应的标识词语预先配置为查询,然后分别建立查找和搜索与查询之间的映射关系,此时,若用户输入的语音信息中包含查找、搜索、查询等词语,终端设备都会将其识别为查询。
102、为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令。
其中,语音输入指令为终端设备可以实现的功能对应的触发指令,语音输入指令具体可以为查询天气、查询联系人等功能触发指令,本发明实施例不做限定。
对于本发明实施例,可以为某一个标识词语配置对应的语音输入指令,也可以为由多个标识词语组成的不同语句配置对应的语音输入指令,本发明实施例不做限定。例如,某一个标识词语为查询,则可以根据用户的实际需求配置标识词语查询对应的语音输入指令为查询天气、查询电视节目等指令。再例如,存在四个标识词语分别为查询、天气、联系人、电视节目,则由上述标识词语可以组成的语句为查询天气、查询联系人、查询电视节目,此时,为各个不同语句分别配置的语音输入指令为查询天气指令、查询联系人指令、查询电视节目指令。
103、将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
对于本发明实施例,预置词语库中的各个词语与对应的标识词语之间的映射关系,以及标识词语和/或各个语句与对应的语音输入指令之间的映射关系可以保存在同一个映射关系表中,也可以保存在不同映射关系表中,即第二映射关系表与第一映射关系表可以为同一个映射关系表,也可以为不同的两个映射关系表,本发明实施例不做限定。
本发明实施例提供的语音输入指令匹配规则的配置方法及装置,首先建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中,然后为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令,最后将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。与现有终端设备在配置语音输入指令匹配规则时,终端设备会建立每一种语音输入指令与对应的表达语句之间的映射关系相比,本发明实施例通过建立每一种语音输入指令与标识词语或者由标识词语组成的各个语句之间的映射关系,可以避免语义相近的多个语句与对应的同一种语音输入指令重复建立多次映射关系,从而可以提高语音输入指令匹配规则的配置效率。
本发明实施例提供的另一种语音输入指令匹配规则的配置方法,如图2所示,所述方法包括:
201、根据词义将预置词语库中的词语进行分组,并且为每一个词语组分别配置一个标识词语。
其中,所述每一个词语组中的各个词语与所在词语组的标识词语之间的词义相似度满足预设条件。所述预置词语库中的词语具体可以为用户进行语音信息输入时所使用的词语。例如,可以将词义中存在天气情况含义的词语组的标识词语配置为天气情况,然后从预置词语库中获取包含天气情况含义的词语,具体可以为天气条件、天气状况、天气预报等包含天气情况含义的词语,此时存在天气情况含义的词语组中包含的词语为天气条件、天气情况、天气状况、天气预报。
可选地,步骤201之前还可以包括:根据词性将所述预置词语库中的词语进行分组。
其中,每一个词语组中各个词语的词性相同。具体可以按照动词、名词、形容词等词性划分方式将所有词语分为多个小组。例如,将天气、联系人、乐曲等名词划分到名词词语组,将查找、计算、删除、终止等动词划分到动词词语组,本发明实施例不做限定。可以看出,通过预先将全部词语按照词性划分为不同词语组,终端设备在对按照词性划分后的多个词语组中的各个词语,进一步按照词义进行词语组划分时,与直接对全部词语按照词义进行词语组划分相比,减少了不同词语之间的词义相似度比对次数,进一步提高了语音输入指令匹配规则的配置效率。
此时步骤201具体可以为根据所述每一个词语组中各个词语的词义,将所述每一个词语组划分为多个词语子小组,并且为每一个词语子小组分别配置一个标识词语,所述每一个词语子小组中的各个词语与所在词语子小组的标识词语之间的词义相似度满足预设条件。
202、建立每一个词语组中的各个词语与所在词语组的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中。
例如,如果某一个词语组中包含的词语为终止、中断、停止,并且预先配置该词语组的标识词语为中断,则分别建立终止、停止与中断之间的映射关系,此时,若用户输入的语音信息中包含终止、停止、中断等词语,终端设备都会将其识别为中断。
203a、为各个标识词语分别配置对应的语音输入指令,并且将各个标识词与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
例如,某一个小组的标识词语为查询,则可以根据用户的实际需求配置标识词语查询对应的语音输入指令为查询天气、查询电视节目、查询联系人等指令。
203b、将至少两个所述标识词语进行组合,生成分别符合不同语音输入指令语句规则的各个语句。
其中,步骤203b为与步骤203a并列的步骤。例如,目前各个小组的标识词语分别为查询、终止、计算、天气、联系人、电视节目,则将上述至少两个所述标识词语进行组合可以组成的语句为查询天气、查询联系人、查询电视节目、终止天气、计算联系人等,其中,查询天气、查询联系人、查询电视节目这三个语句符合语音输入指令规则,因此生成的符合输入指令语句规则的语句为查询天气、查询联系人、查询电视节目。
步骤203b之后还包括204b、为分别符合不同语音输入指令语句规则的所述各个语句,分别配置对应的语音输入指令,并且将所述各个语句与对应的语音输入指令之间的映射关系保存在第二映射关系表中。
其中,语音输入指令为终端设备可以实现的功能对应的触发指令,语音输入指令具体可以为查询联系人、查找音乐等功能指令,本发明实施例不做限定。
对于本发明实施例,预置词语库中的各个词语与对应的标识词语之间的映射关系,以及标识词语和/或各个语句与对应的语音输入指令之间的映射关系可以保存在同一个映射关系表中,也可以保存在不同映射关系表中,即第二映射关系表与第一映射关系表可以为同一个映射关系表,也可以为不同的两个映射关系表,本发明实施例不做限定。
进一步地,终端设备实时监测是否存在新增词语,当检测到存在未与标识词语建立映射关系的新增词语,获取所述新增词语对应的标识词语,然后建立所述新增词语与对应的所述标识词语之间的映射关系,并且将所述映射关系保存在所述第一映射关系表中。其中,具体可以根据词义获取新增词语对应的标识词语,本发明实施例不做限定。通过本发明实施例提供的配置方法,只需要建立新增词语与对应的标识词语之间的一次映射关系即可,而通过现有配置方法,首先需要获取包含该新增词语的所有符合语音输入指令语句规则的各个语句,然后分别建立各个语句与对应的语音输入指令之间的映射关系,从而完成新增词语的添加,可以看出,本发明实施例提供的语音输入指令匹配规则的配置方法与现有配置方法相比,提高了语音输入指令匹配规则的配置效率。
对于本发明实施例提供的语音输入指令匹配规则的配置方法的实现场景,具体可以为:预置词语库中保存的词语包括查询、查找、搜索、天气情况、天气预报、电视节目,终端设备按照词义将所有词语分为三个词语组,并配置每个词语组的标识词语分别为查询、天气预报、电视节目,终端设备判断查找、搜索与查询词义相近,天气情况与天气预报词义相近、因此分别建立查找、搜索与查询之间的映射关系,并且建立天气情况与天气预报之间的映射关系,然后根据每个词语组的标识词语,生成的分别符合不同语音输入指令语句规则的语句为查询天气预报和查询电视节目,此时将语句查询天气预报对应的语音输入指令,配置为触发终端设备执行查询天气操作的指令,将语句查询电视节目对应的语音输入指令,配置为触发终端设备执行查询电视节目操作的指令,并且将语句查询天气预报和查询电视节目分别与对应的语音输入指令之间的映射关系保存在映射关系表中,其中,不同语音输入指令可以用不同符号进行标识以进行区分,本发明实施例不做限定。
可以看出,本发明实施例提供的语音输入指令匹配规则配置方法,与通过现有匹配规则配置方法进行配置时,需要分别建立语句查询天气预报、查询天气情况、查找天气预报、查找天气情况、搜索天气预报、搜索天气情况与触发终端设备执行查询天气操作的指令之间的映射关系,并且分别建立语句查询电视节目、查找电视节目、搜索电视节目与触发终端设备执行查询电视节目的指令之间的映射关系相比,提升了语音输入指令匹配规则的配置效率。
进一步地,通过本发明实施例配置的语音输入指令匹配规则实现用户输入的语音信息的匹配过程包括:接收用户输入的语音信息,然后根据所述第一映射关系表,获取所述语音信息中各个词语分别对应的标识词语,再将所述各个词语分别对应的标识词语组成语句,最后从所述第二映射关系表中获取所述语句对应的语音输入指令,并且执行与所述语音输入指令对应的操作。其中,在将所述各个词语分别对应的标识词语组成语句时,可以根据各个词语在语音信息中的排列顺序组成语句,本发明实施例不做限定。
具体地,例如,用户输入的语音信息为查找天气情况,首先终端设备获取该语音信息中的词语为查找和天气情况,然后从语音输入指令匹配规则中获取到查找和天气状况分别对应的标识词语为查询和天气预报,此时终端设备根据语音信息中词语的顺序排列标识词语组成的语句为查询天气预报,最后获取到查询天气预报对应的语音输入指令为触发终端设备执行查询天气操作的指令,此时终端设备按照该指令执行查询天气的操作。可替换地,也可以不按照语音信息中词语的顺序排列标识词语组成语句,此时由标识词语组成的语句为天气预报查询,然后获取到天气预报查询对应的语音输入指令为触发终端设备执行查询天气操作的指令,此时终端设备按照该指令执行查询天气的操作。
本发明实施例提供的另一种语音输入指令匹配规则的配置方法,首先建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中,然后为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令,最后将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。与现有终端设备在配置语音输入指令匹配规则时,终端设备会建立每一种语音输入指令与对应的表达语句之间的映射关系相比,本发明实施例通过建立每一种语音输入指令与标识词语或者由标识词语组成的各个语句之间的映射关系,可以避免语义相近的多个语句与对应的同一种语音输入指令重复建立多次映射关系,从而可以提高语音输入指令匹配规则的配置效率。
进一步地,作为图1所示方法的具体实现,本发明实施例提供一种语音输入指令匹配规则的配置装置,所述装置的实体可以为终端设备,例如手机、计算机、电脑本等,如图3所示,所述装置包括:建立单元31、保存单元32、配置单元33。
建立单元31,可以用于建立预置词语库中的各个词语与对应的标识词语之间的映射关系。
保存单元32,可以用于将所述建立单元31建立的所述映射关系保存在第一映射关系表中。
配置单元33,可以用于为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令。
保存单元32,还可以用于将所述配置单元33配置的所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
需要说明的是,本发明实施例提供的语音输入指令匹配规则的配置装置所涉及各功能单元的其他相应描述,可以参考图1中的对应描述,在此不再赘述。
再进一步地,作为图2所示方法的具体实现,本发明实施例提供一种语音输入指令匹配规则的配置装置,所述装置的实体可以为终端设备,例如手机、计算机、电脑本等,如图4所示,所述装置包括:建立单元41、保存单元42、配置单元43、分组单元44、生成单元45、接收单元46、获取单元47、组合单元48、执行单元49。
建立单元41,可以用于建立预置词语库中的各个词语与对应的标识词语之间的映射关系。
保存单元42,可以用于将所述建立单元41建立的所述映射关系保存在第一映射关系表中。
配置单元43,可以用于为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令。保存单元42,还可以用于将所述配置单元43配置的所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在所述第一映射关系表或者第二映射关系表中。
分组单元44,可以用于根据词义将预置词语库中的词语进行分组,并且为每一个词语组分别配置一个标识词语,所述每一个词语组中的各个词语与所在词语组的标识词语之间的词义相似度满足预设条件。
建立单元41,可以用于建立所述每一个词语组中的各个词语与所在词语组的标识词语之间的映射关系。
分组单元41,还可以用于根据词性将所述预置词语库中的词语进行分组,每一个词语组中各个词语的词性相同。
分组单元41,可以用于根据所述每一个词语组中各个词语的词义,将所述每一个词语组划分为多个词语子小组,并且为每一个词语子小组分别配置一个标识词语,所述每一个词语子小组中的各个词语与所在词语子小组的标识词语之间的词义相似度满足预设条件。
生成单元45,可以用于将至少两个所述标识词语进行组合,生成分别符合不同语音输入指令语句规则的各个语句。
配置单元43,还可以用于为所述生成单元45生成的分别符合不同语音输入指令语句规则的所述各个语句,分别配置对应的语音输入指令。
接收单元46,可以用于接收用户输入的语音信息。
获取单元47,可以用于根据所述第一映射关系表,获取所述接收单元46接收的所述语音信息中各个词语分别对应的标识词语。
组合单元48,可以用于将所述获取单元47获取的所述各个词语分别对应的标识词语组成语句。
执行单元49,可以用于从所述第二映射关系表中获取所述语句对应的语音输入指令,并且执行与所述语音输入指令对应的操作。
获取单元47,还可以用于若检测存在未与标识词语建立映射关系的新增词语,获取所述新增词语对应的标识词语。
建立单元41,还可以用于建立所述新增词语与对应的标识词语之间的映射关系。
保存单元43,还可以用于将所述建立单元42建立的所述映射关系保存在所述第一映射关系表中。
需要说明的是,本发明实施例提供的语音输入指令匹配规则的配置装置所涉及各功能单元的其他相应描述,可以参考图2中的对应描述,在此不再赘述。
本发明实施例提供的语音输入指令匹配规则的配置装置,首先建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中,然后为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令,最后将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。与现有终端设备在配置语音输入指令匹配规则时,终端设备会建立每一种语音输入指令与对应的表达语句之间的映射关系相比,本发明实施例通过建立每一种语音输入指令与标识词语或者由标识词语组成的各个语句之间的映射关系,可以避免语义相近的多个语句与对应的同一种语音输入指令重复建立多次映射关系,从而可以提高语音输入指令匹配规则的配置效率。
本发明实施例提供的语音输入指令匹配规则的配置装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的语音输入指令匹配规则的配置方法及装置可以适用于信息技术领域,但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种语音输入指令匹配规则的配置方法,其特征在于,包括:
建立预置词语库中的各个词语与对应的标识词语之间的映射关系,并且将所述映射关系保存在第一映射关系表中;
为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令;
将所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
2.根据权利要求1所述的语音输入指令匹配规则的配置方法,其特征在于,所述建立预置词语库中的各个词语与对应的标识词语之间的映射关系的步骤之前,还包括:
根据词义将预置词语库中的词语进行分组,并且为每一个词语组分别配置一个标识词语,所述每一个词语组中的各个词语与所在词语组的标识词语之间的词义相似度满足预设条件;
所述建立预置词语库中各个词语与对应的标识词语之间的映射关系的步骤包括:
建立所述每一个词语组中的各个词语与所在词语组的标识词语之间的映射关系。
3.根据权利要求2所述的语音输入指令匹配规则的配置方法,其特征在于,所述根据词义将预置词语库中的词语进行分组的步骤之前,还包括:
根据词性将所述预置词语库中的词语进行分组,每一个词语组中各个词语的词性相同;
所述根据词义将预置词语库中的词语进行分组,并且为每一个词语组分别配置一个标识词语的步骤包括:
根据所述每一个词语组中各个词语的词义,将所述每一个词语组划分为多个词语子小组,并且为每一个词语子小组分别配置一个标识词语,所述每一个词语子小组中的各个词语与所在词语子小组的标识词语之间的词义相似度满足预设条件。
4.根据权利要求1所述的语音输入指令匹配规则的配置方法,其特征在于,所述为由所述标识词语组成的各个语句分别配置对应的语音输入指令的步骤之前,还包括:
将至少两个所述标识词语进行组合,生成分别符合不同语音输入指令语句规则的各个语句;
所述为由所述标识词语组成的各个语句分别配置对应的语音输入指令的步骤包括:
为分别符合不同语音输入指令语句规则的所述各个语句,分别配置对应的语音输入指令。
5.根据权利要求4所述的语音输入指令匹配规则的配置方法,其特征在于,所述为所述分别符合不同语音输入指令语句规则的各个语句,分别配置对应的语音输入指令的步骤之后,还包括:
接收用户输入的语音信息;
根据所述第一映射关系表,获取所述语音信息中各个词语分别对应的标识词语;
将所述各个词语分别对应的标识词语组成语句;
从所述第二映射关系表中获取所述语句对应的语音输入指令,并且执行与所述语音输入指令对应的操作。
6.根据权利要求1-5任一项所述的语音输入指令匹配规则的配置方法,其特征在于,所述方法还包括:
若检测存在未与标识词语建立映射关系的新增词语,获取所述新增词语对应的标识词语;建立所述新增词语与对应的所述标识词语之间的映射关系,并且将所述映射关系保存在所述第一映射关系表中。
7.一种语音输入指令匹配规则的配置装置,其特征在于,包括:
建立单元,用于建立预置词语库中的各个词语与对应的标识词语之间的映射关系;
保存单元,用于将所述建立单元建立的所述映射关系保存在第一映射关系表中;
配置单元,用于为所述标识词语和/或由所述标识词语组成的各个语句分别配置对应的语音输入指令;
保存单元,还用于将所述配置单元配置的所述标识词语和/或所述各个语句与对应的语音输入指令之间的映射关系,保存在第二映射关系表中。
8.根据权利要求6所述的语音输入指令匹配规则的配置装置,其特征在于,所述装置还包括:
分组单元,用于根据词义将预置词语库中的词语进行分组,并且为每一个词语组分别配置一个标识词语,所述每一个词语组中的各个词语与所在词语组的标识词语之间的词义相似度满足预设条件;
所述建立单元,用于建立所述每一个词语组中的各个词语与所在词语组的标识词语之间的映射关系。
9.根据权利要求8所述的语音输入指令匹配规则的配置装置,其特征在于,
所述分组单元,还用于根据词性将所述预置词语库中的词语进行分组,每一个词语组中各个词语的词性相同;
所述分组单元,用于根据所述每一个词语组中各个词语的词义,将所述每一个词语组划分为多个词语子小组,并且为每一个词语子小组分别配置一个标识词语,所述每一个词语子小组中的各个词语与所在词语子小组的标识词语之间的词义相似度满足预设条件。
10.根据权利要求7所述的语音输入指令匹配规则的配置装置,其特征在于,所述装置还包括:
生成单元,用于将至少两个所述标识词语进行组合,生成分别符合不同语音输入指令语句规则的各个语句;
所述配置单元,还用于为所述生成单元生成的分别符合不同语音输入指令语句规则的所述各个语句,分别配置对应的语音输入指令。
11.根据权利要求10所述的语音输入指令匹配规则的配置装置,其特征在于,所述装置还包括:
接收单元,用于接收用户输入的语音信息;
获取单元,用于根据所述第一映射关系表,获取所述接收单元接收的所述语音信息中各个词语分别对应的标识词语;
组合单元,用于将所述获取单元获取的所述各个词语分别对应的标识词语组成语句;
执行单元,用于从所述第二映射关系表中获取所述语句对应的语音输入指令,并且执行与所述语音输入指令对应的操作。
12.根据权利要求7-11任一项所述的语音输入指令匹配规则的配置装置,其特征在于,
所述获取单元,还用于若检测存在未与标识词语建立映射关系的新增词语,获取所述新增词语对应的标识词语;
所述建立单元,还用于建立所述新增词语与对应的所述标识词语之间的映射关系;
所述保存单元,还用于将所述建立单元建立的所述映射关系保存在所述第一映射关系表中。
CN201310284410.9A 2013-07-08 2013-07-08 语音输入指令匹配规则的配置方法及装置 Active CN104281609B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310284410.9A CN104281609B (zh) 2013-07-08 2013-07-08 语音输入指令匹配规则的配置方法及装置
PCT/CN2014/081763 WO2015003596A1 (en) 2013-07-08 2014-07-07 Systems and methods for configuring matching rules related to voice input commands
US14/798,557 US9672813B2 (en) 2013-07-08 2015-07-14 Systems and methods for configuring matching rules related to voice input commands

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310284410.9A CN104281609B (zh) 2013-07-08 2013-07-08 语音输入指令匹配规则的配置方法及装置

Publications (2)

Publication Number Publication Date
CN104281609A true CN104281609A (zh) 2015-01-14
CN104281609B CN104281609B (zh) 2020-03-17

Family

ID=52256485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310284410.9A Active CN104281609B (zh) 2013-07-08 2013-07-08 语音输入指令匹配规则的配置方法及装置

Country Status (3)

Country Link
US (1) US9672813B2 (zh)
CN (1) CN104281609B (zh)
WO (1) WO2015003596A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825848A (zh) * 2015-01-08 2016-08-03 宇龙计算机通信科技(深圳)有限公司 一种语音识别方法、装置及终端
CN107678309A (zh) * 2017-09-01 2018-02-09 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10783883B2 (en) * 2016-11-03 2020-09-22 Google Llc Focus session at a voice interface device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010715A1 (en) * 2001-07-26 2002-01-24 Garry Chinn System and method for browsing using a limited display device
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天***及其实现方法
US20080104037A1 (en) * 2004-04-07 2008-05-01 Inquira, Inc. Automated scheme for identifying user intent in real-time
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法
CN103187051A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载互动装置
CN103187079A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载信息***

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3487250B2 (ja) * 2000-02-28 2004-01-13 日本電気株式会社 符号化音声信号形式変換装置
JP2005528052A (ja) * 2002-05-28 2005-09-15 ティーギュ,アラン,エイチ. アドレスパターンと自動管理に基づいたメッセージ処理、及びコンタクトエイリアスの制御
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
CN1267838C (zh) * 2002-12-31 2006-08-02 程松林 一种语音检索方法及采用该方法的音像信息检索***
US8229733B2 (en) * 2006-02-09 2012-07-24 John Harney Method and apparatus for linguistic independent parsing in a natural language systems
US9524355B2 (en) * 2007-01-22 2016-12-20 Mozy, Inc. Methods for delivering task-related digital content based on task-oriented user activity
US20090018830A1 (en) * 2007-07-11 2009-01-15 Vandinburg Gmbh Speech control of computing devices
CN101269638A (zh) * 2008-04-10 2008-09-24 清华大学 基于命令词表的汽车电器语音控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020010715A1 (en) * 2001-07-26 2002-01-24 Garry Chinn System and method for browsing using a limited display device
US20080104037A1 (en) * 2004-04-07 2008-05-01 Inquira, Inc. Automated scheme for identifying user intent in real-time
CN101075435A (zh) * 2007-04-19 2007-11-21 深圳先进技术研究院 一种智能聊天***及其实现方法
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法
CN103187051A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载互动装置
CN103187079A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载信息***
CN102629246A (zh) * 2012-02-10 2012-08-08 北京百纳信息技术有限公司 识别浏览器语音命令的服务器及浏览器语音命令识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105825848A (zh) * 2015-01-08 2016-08-03 宇龙计算机通信科技(深圳)有限公司 一种语音识别方法、装置及终端
CN107678309A (zh) * 2017-09-01 2018-02-09 科大讯飞股份有限公司 操控句式生成、应用操控方法及装置、存储介质

Also Published As

Publication number Publication date
US9672813B2 (en) 2017-06-06
WO2015003596A1 (en) 2015-01-15
CN104281609B (zh) 2020-03-17
US20150325234A1 (en) 2015-11-12

Similar Documents

Publication Publication Date Title
CN103077714B (zh) 信息的识别方法和装置
US10043520B2 (en) Multilevel speech recognition for candidate application group using first and second speech commands
CN103903611B (zh) 一种语音信息的识别方法和设备
CN105469789A (zh) 一种语音信息的处理方法及终端
CN110457449B (zh) 在线训练模型的方法、装置、设备及存储介质
US20130238332A1 (en) Automatic input signal recognition using location based language modeling
CN104238991A (zh) 语音输入匹配方法及装置
CN103853703A (zh) 一种信息处理方法及电子设备
CN105973257A (zh) 导航方法及装置
CN103218555A (zh) 应用程序登录方法及装置
CN103049571A (zh) 基于语音识别的索引菜单的方法、装置及其终端
CN104516950A (zh) 一种兴趣点的查询方法及装置
CN104469029A (zh) 通过语音进行查号的方法及装置
CN104516921A (zh) 自动回复方法及装置
CN104282301A (zh) 一种语音命令处理方法以及***
CN104965918B (zh) 一种基于查询关键词的搜索方法和装置
CN104199956A (zh) 一种erp数据语音搜索方法
CN104281609A (zh) 语音输入指令匹配规则的配置方法及装置
CN103019530A (zh) 基于手势识别的索引菜单的方法、装置及其终端
CN104199977A (zh) 一种基于数据库中数据创建信息搜索的方法
CN103024157B (zh) 一种基于语音寻找移动终端的方法及***
CN106251590A (zh) 一种寻找网络设备的方法及路由器
CN111144132A (zh) 一种语义识别方法及装置
CN103176800A (zh) 应用程序登录方法及装置
CN101882025A (zh) 手写输入方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant