CN104871241A - 语音识别设备 - Google Patents

语音识别设备 Download PDF

Info

Publication number
CN104871241A
CN104871241A CN201280077932.5A CN201280077932A CN104871241A CN 104871241 A CN104871241 A CN 104871241A CN 201280077932 A CN201280077932 A CN 201280077932A CN 104871241 A CN104871241 A CN 104871241A
Authority
CN
China
Prior art keywords
speech recognition
recognition apparatus
terminal
information
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280077932.5A
Other languages
English (en)
Inventor
吉田满次
臼井温
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
RayTron Inc
Original Assignee
RayTron Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by RayTron Inc filed Critical RayTron Inc
Publication of CN104871241A publication Critical patent/CN104871241A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种语音识别设备,其中,对应与可无线或有线连接可选设备的终端之间的连接状态的确立,实行语音识别处理的识别处理部能够进行动作。当语音输入时(S132),所述语音识别设备实行语音识别处理(S134)。进而,根据被存储于存储部的代码对应信息,将表示识别处理结果的单词或文字转换成可选设备特有的指示代码信息(S136)。向连接对象、也就是连接的终端发送通过转换处理部转换后的指示代码信息。

Description

语音识别设备
技术领域
本发明涉及一种与能够通过无线或有线连接可选设备的终端通信的语音识别设备。
背景技术
在现有技术中存在提高语音识别率的技术。
例如,日本特开2010-266488号公报(专利文献1)揭示一种使重叠了多种杂音的语音数据的特征值正常化并生成用于语音识别的语音识别模型参数。通过使重叠了多种杂音的语音数据的特征值正常化,从而多种杂音一般化,因此,即使在进行语音识别时混入了杂音,也能够维持较高的语音识别率。
另外,还存在通过终端以外的装置进行语音识别并根据该识别结果对终端进行操作的技术。
例如,日本特开2002-108603号公报(专利文献2)揭示了以下内容,即,操作遥控装置的输入模式功能键,在将个人电脑切换至语音输入模式后,在遥控装置中,从话筒输入的语音被转换成文字数据信号。另外,揭示了将文字数据信号与从键输入部输出的控制信号一起作为远程信号生成,通过红外线向个人电脑本体发送。
WO2009/122756号小册子(专利文献3)揭示了以下内容,即,在G遥控器(读取网格型点阵图形的遥控器)中,对被输入的语音进行识别处理,处理后的文字列(例如“电视电源打开”)被发送至支座或便携式电话。
日本特开2003-87359号公报(专利文献4)揭示了以下内容,即,能够向司机佩戴的头盔安装的蓝牙通信装置具有与便携式电话通信的功能,包括语音识别单元和控制单元,其中,所述语音识别单元对被输入话筒的语音进行语音识别,所述控制单元将识别的语音转换成控制信号。
现有技术文献
专利文献
专利文献1:日本特开2010-266488号公报
专利文献2:日本特开2002-108603号公报
专利文献3:WO2009/122756号小册子
专利文献4:日本特开2003-87359号公报
发明内容
发明要解决的技术问题
目前,存在希望能够将上述特开2010-266488号公报(专利文献1)所揭示的高精度的语音识别技术使用在各种种类的终端的操作等的需求。但是,想要向目前流通的智能电话等的终端追加语音识别功能,需要向终端的OS(Operation System)编入语音识别功能,因此,较为花费劳力和时间。另外,也存在已经装载有语音识别功能的终端,但该识别功能由于终端的种类或机型而各不相同,会产生无法确切地识别语音的情况。
这里,如上所述,还存在有通过终端以外的装置进行语音识别并根据该识别结果操作终端的技术。但是,这些技术由于向现有技术中的遥控器或头盔装载语音识别功能,因此,为了在这些装置中启动语音识别功能,需要通过用户作出特定的操作。
为了解决上述课题,本发明的目的在于提供一种能够不改动已经存在的终端地追加语音识别功能的语音识别设备。
另外,本发明的其他目的在于提供一种无需用户操作就能够使语音识别功能启动的语音识别设备。
解决技术问题的手段
本发明的语音识别设备与可通过无线或有线连接可选设备的终端通信,其包括输入语音的语音输入机构、实行被输入的语音的识别处理的识别处理机构。识别处理机构对应与终端的连接状态确立地动作。语音识别设备进一步包括:存储机构,预先存储代码对应信息,其中,代码对应信息联系多个单词或文字和与它们分别对应的可选设备特有的指示代码信息;转换处理机构,根据被存储机构存储的代码对应信息,将表示由识别处理机构得到的识别处理结果的单词或文字转换成指示代码;通信机构,将通过转换处理机构转换后的指示代码信息向作为连接对象连接的终端发送。
优选,可选设备包含指示输入装置,指示代码信息是从指示输入装置输出的代码编号。
优选,存储机构进一步预先存储包含设备本身的识别信息和种类信息的设备信息,种类信息是表示设备本身的种类是指示输入装置的信息。
优选,语音识别设备进一步包括辨别处理机构,辨别处理机构在从终端接收了询问可选设备是否存在的第一询问信号的情况下辨别发送第一询问信号的终端作为连接对象。当接收了第一询问信号时,辨别处理机构生成包含设备信息的第一应答信号,向发送第一询问信号的终端回复第一应答信号。
优选,通信机构实行与终端的无线通信,其中,终端通过辨别处理机构作为连接对象被辨别,语音识别设备进一步包括事先实行与终端之间的配对设定处理的设定处理机构。
优选,在能够接受可选设备的搜索的状态下,当设定处理机构接收了从终端发送的第二询问信号时,生成包含设备信息的第二应答信号,向发送第二询问信号的终端回复第二应答信号。
优选,语音识别设备进一步包括操作机构,操作机构包含多个键,由用户操作。设定处理机构接受操作机构的操作,通过通信机构向终端发送对应操作机构的操作的代码编号,作为配对的密码。
优选,设定处理机构接受向语音输入机构输入的语音输入,将代码编号作为配对的密码,通过通信机构向终端发送,其中,代码编号是由转换处理机构转换通过识别处理机构得到的语音的识别处理结果而成。
优选,通信机构与通过辨别处理机构判断为连接对象的终端进行有线通信。
发明效果
根据本发明,能够不改动现有的信息处理终端地向该终端添加语音识别功能。另外,由于能够对应与终端的连接状态的确立而启动语音识别功能,因此,无需通过用户的操作,能够通过语音进行终端的操作。
附图说明
图1是表示本发明的实施方式的语音识别***的结构例的图;
图2是表示本发明的实施方式的语音识别设备的硬件框图;
图3是表示本发明的实施方式的信息处理终端的硬件框图;
图4是表示本发明的实施方式的语音识别设备的功能结构的功能框图;
图5是表示本发明的实施方式的配对设置处理的流程图;
图6是表示本发明的实施方式的固定通信处理流程图;
图7是表示本发明的实施方式的在语音识别设备中实行的语音识别处理的流程图;
图8是表示本发明的实施方式的变形例的语音识别设备的硬件框图。
符号说明
1、语音识别***;
10、10A、语音识别设备;
11、21、CPU;
12、22、通信模块;
13、23、电源部;
14、语音输入部;
15、A/D转换部;
16、26、存储部;
17、27、操作部;
19、29、USB端子;
20、信息处理终端;
28、操作部;
102、设定处理部;
104、辨别处理部;
106、识别处理部;
108、转换处理部;
110、通信部;
161、模型参数;
162、代码对应平台。
具体实施方式
以下参照附图详细说明本发明的实施方式。另外,对图中相同或相当的部分赋予相同的符号并不作反复的说明。
<有关结构>
(***结构)
首先,说明本实施方式的包括语音识别设备的语音识别***的结构例。
图1是表示本发明的实施方式的语音识别***1的结构例的图。
参照图1,语音识别***1包括语音识别设备10以及作为可与语音识别设备10通信的终端的信息处理终端20。
信息处理终端20为,能够通过无线或有线来连接可选设备,例如包含笔记本电脑(Personal Computer)、智能电话和平板电脑等。上述可选设备可以是现有的周边设备,例如包含指示输入装置和通话装置(耳机)等,其中,所述指示输入装置接收用户发出的指示,所述通话装置可进行语音对话。指示输入装置包含键盘等文字输入设备以及鼠标等定点设备。
语音识别设备10是具有话筒141、能够通过语音来操作信息处理终端20的语音识别专用的模块。但是,在与信息处理终端20的通信中,语音识别设备10在上述现有的可选设备中作为指示输入装置而动作。因此,将在设备本身得到的语音识别结果转换成指示输入装置特有的指示代码信息并向信息处理终端20发送。在以下的说明中,语音识别设备10作为指示输入装置中的文字输入设备(以下称为“键盘”)而动作。
在本实施方式中,语音识别设备10和信息处理终端20可通过无线连接,两者通过Bluetooth(注册商标)规格进行双向通信。另外,通过Bluetooth规格的通信是一例,也可以通过其他规格进行无线通信。
(硬件结构)
接着,说明语音识别设备10和信息处理终端20各自的硬件结构例。
图2是表示本发明的实施方式的语音识别设备10的硬件框图。
参照图2,语音识别设备10包括实行各种演算处理的CPU(CentralProcessing Unit)11、实现与信息处理终端20的Bluetooth通信的通信模块12、包含充电池或干电池的电源部13、从话筒141输入语音的语音输入部14、将被输入的语音数据转换成数码数据的A/D(Analog to Digital)转换部15,存储程序和各种信息的非易失性的存储部16、由用户操作的操作部17。操作部17仅包含后述的配对设定处理时必要的按钮,其中,包含图1所示的连接按钮171。
图3是表示本发明的实施方式的信息处理终端20的硬件框图。
参照图3,信息处理终端20具有与一般的智能电话等相同的结构即可,例如,包括实行各种演算处理的CPU21、实现与各种可选设备之间的Bluetooth通信的通信模块22、电源部23、存储程序和各种信息的非易失性的存储部26、由用户操作的操作部27、显示各种信息的显示部28、承接周边设备的USB端子的USB端子29,其中所述周边设备包含可选设备。
(功能结构)
接着,说明本发明的实施方式的语音识别设备10的功能结构例。
图4是表示本发明的实施方式的语音识别设备10的功能结构的功能框图。
参照图4,语音识别设备10包含设定处理部102、辨别处理部104、识别处理部106、转换处理部108、以及通信部110作为其功能。
设定处理部102事先在与信息处理终端20之间实行配对设定处理。在本实施方式中,“配对设定处理”是指为了回避与他人的信息处理终端的意外连接,预先进行向成为对象的信息处理终端20登记语音识别设备10的处理。通过设定处理部102实行的配对设定处理被设定为对应Bluetooth规格的简档,所述Bluetooth规格的简档搭载于信息处理终端20的通信模块12。在本实施方式中,称在信息处理终端20进行了配对设定的可选设备为“可连接的可选设备”。
设定处理部102对应操作部17的连接按钮171的下压而动作。由此,语音识别设备10成为能够接受可选设备的搜索的状态。在该状态下,当从信息处理终端20接收了询问是否存在可选设备的询问信号时,生成包含设备信息的应答信号并进行回复。“设备信息”是指有关语音识别设备10的信息,包含设备本身的识别信息(以下称为“ID代码”)和种类信息。种类信息是表示设备本身的种类为“键盘”的信息。设备信息被预先存储于存储部16内。
在配对设定处理(配对设定模式)时以外的通信处理(以下称为“固定通信处理”)中,辨别处理部104对信息处理终端20实行作为连接对象的辨别的处理,其中,所述信息处理终端20发送询问是否存在可选设备的询问信号。与设定处理部102的处理相同地,当接收了该询问信号时,辨别处理部104生成包含设备信息的应答信号并回复。
通过辨别处理部104回复的应答信号,判断在信息处理终端20中是否为语音识别设备10能够连接的可选设备。如为语音识别设备10能够连接的可选设备,则例如向语音识别设备10发送许可连接的信号(以下称为“许可信号”)。在语音识别设备10中,在接收该许可信号这一时刻,确立与信息处理终端20的连接状态。
识别处理部106实行被输入语音输入部14的语音的识别处理。具体来说,根据在A/D转换部15被数码化的语音数据和例如基于HMM(HiddenMarkov Model)的模式参数161,实行语音的识别处理。模式参数161是用于语音识别的学习数据,是通过例如日本特开2010-266488号公报(专利文献1)揭示的学习方法制作的参数。另外,关于具体的语音识别处理将于后述。识别处理部106对应与信息处理终端20的连接状态的确定而成为可动作状态。也就是说,在本实施方式中,无需从用户接收向语音输入模式切换的切换指示等即可向语音识别模式转移。
根据代码对应平台162,转换处理部108将通过识别处理部106得到的表示识别处理结果的单词或文字转换成代码编号。代码编号是从通用的键盘输出的是指示代码信息。代码对应平台162是联系多个单词或文字和与它们分别对应的代码编号的代码对应信息的一例。另外,在本实施方式中,“文字”也包含数字和符号。
在通过设定处理部102和辨别处理部104进行处理时,通信部110进行上述询问信号的接收和应答信号的发送。另外,向作为连接对象的信息处理终端20发送由转换处理部108转换后的代码编号。在本实施方式中,通信部110通过通信模块12实现。
另外,如图4所示的各处理部102~108的功能可以通过CPU11实行被存储在存储部16中的软件来实现,上述各处理部102~108的功能中的至少一个也可以通过硬件实现。另外,模式参数161和代码对应平台162也可以例如被存储于存储部16。
<有关动作>
接着,说明本实施方式中的语音识别***1的动作。
(配对设定处理)
图5是表示本发明的实施方式中的配对设定处理的流程图。
参照图5,在信息处理终端20中,根据用户的指示设定Bluetooth有效(步骤S(以下简称为“S”)2)。由此,在信息处理终端20中,通过发送规定的询问信号,实行Bluetooth终端、也就是可选设备的搜索处理(S4)。
在语音识别设备10中,当CPU11检测到连接按钮171的按下时(S22),被存储在存储部16的配对设定程序被读取,转移至配对设定模式。由此,设定处理部102成为可以接受可选设备的搜索的状态(S24)。当语音识别设备10存在于信息处理终端20的近旁时,接收从信息处理终端20发出的询问信号(S26)。另外,在从转移至配对设定模式后的规定时间内未接收询问信号的情况下,结束该设定处理。
当在规定时间内接收了询问信号时,设定处理部102从存储部16读取设备本身的ID代码和种类信息作为设备信息(S28)。种类信息是表示如上所述的为键盘的信息。设定处理部102生成包含读取的设备信息的应答信号,向发送出询问信号的信息处理终端20发送(S30)。另外,“询问信号”也可包含为了识别信息处理终端20的识别信息。
当接收从语音识别设备10发送的应答信号时(S6),信息处理终端20向CPU21的内部存储器暂时存储被包含于应答信号的设备信息。通过设备信息,可选设备被辨别为键盘,在显示部28显示密码(Passkey)(S8)。对应信息处理终端20的安装,在这里显示的密码存在固定数字(例如“0000”)的情况,也存在随机数字的情况。
接着,语音识别设备10的设定处理部102接受用户实行的密码的输入(S32)。当作为配对设定专用的多个键、例如当包含数字键和回车键时,通过操作这些键能够向语音识别设备10的操作部17输入密码。当数字键和回车键***作时,对应该操作的代码编号作为被输入的密码被发送至信息处理终端20(S34)。在语音识别设备10中,也可在发送了密码的这一时刻结束配对设定模式。
当信息处理终端20接收密码时(S10),判断显示中的密码和接收的密码是否一致(S12)。在判断为一致的情况下(在S12为YES),配对成立,向存储部26存储暂时存储的设备信息、作为可连接的可选设备的信息(S14)。由此,语音识别设备10的ID代码和种类信息(键盘)相对应地被登记于存储部26。另外,当询问信号包含信息处理终端20的种类信号时,在语音识别设备10侧也可向存储部16预先登记信息处理终端20的种类信息,作为已完成配对设定的信息处理终端的信息。
另外,如上所述,作为配对设定专用的多个键,在操作部17包含有数字键和回车键的情况下,能够使无论在S8中的被显示于信息处理终端20的密码为任何数字都成立配对。但是,也可以不在操作部17设置这些专用的键,而是自动地发送预先设定的数字(例如“0000”)。在这种情况下,仅能够与S8中显示的密码固定于“0000”的终端和能够通过用户变更所显示的密码的终端之间进行配对设定。
或者,也可以接受有关作为密码显示的数字的语音输入,取代接受密码的输入的处理(S32)。在这种情况下,通过用户发声的数字和“回车”的语音被输入语音输入部14。被输入的语音通过识别处理106被实行识别处理以及通过转换处理部108被实行转换处理,表示被发声的数字和“回车”的代码编号被发送至信息处理终端20。由此,对任何信息处理终端20都能够不向操作部17设置专用键地进行配对设定。
(固定通信处理)
图6是表示本发明的实施方式的固定通信处理的流程图。在本实施方式中,举例说明根据搭载于智能电话Bluetooth规格的简档的处理。
参照图6,当信息处理终端20的电源打开(ON)时,实行Bluetooth终端、也就是可选设备的搜索处理(S102)。在搜索处理中,发送规定的询问信号。
语音识别设备10在上述配对设定模式以外的时间处于待机状态。也就是说,在电源打开并进行初期化处理后,语音识别设备10处于待机状态。当在待机状态下接收询问信号时(S122),图4所示的辨别处理部104从存储部16读取设备本身的ID代码和种类信息作为设备信息(S124)。种类信息是表示如上述的为键盘的信息。辨别处理部104生成包含读取的设备信息的应答信号,并向发送询问信号的信息处理终端20发送(S126)。另外,这里的“询问信号”也可包含为了识别信息处理终端20的识别信息。
当信息处理终端20接收从语音识别设备10发送的应答信号时(S104),通过种类信息辨别存在键盘作为可选设备(S106)。这里,判断被包含于种类信息的ID代码是否与登记在存储部26的ID代码一致(S108),其中,所述登记在存储部26的ID代码对应表示键盘的种类信息。也就是说,信息处理终端20中,判断发送应答信号的装置是否为可连接的可选设备。
在判断ID代码一致的情况下(在S108为YES),由于目前的通信对象是可连接的可选设备,因此,向语音识别设备10发送作为ID代码的判断结果的许可信号(S110)。由此,与语音识别设备10的连接状态被确立,动作模式被转移至键盘连接模式(S114)。键盘连接模式也可以是例如被连接直至信息处理终端20的电源关闭(OFF)。
另一方面,在判断ID代码不一致的情况下(在S108为NO),由于目前的通信对象不是可连接的可选设备,因此,向语音识别设备10发送作为ID代码的判断结果的例如不许可信号(S112)。当S112处理结束时,信息处理终端20的可选设备搜索处理结束。
语音识别设备10的通信部110在发送了上述应答信号后,接收ID代码判断结果、即许可信号或不许可信号(S127)。在接收了许可信号的情况下(在S128为YES),确定目前的通信对象作为连接对象。因此,与信息处理终端20的连接状态被确立,动作模式被转移至语音识别模式(S130)。由此,例如读取被存储于存储部16的语音识别程序,使识别处理部106成为可动作的状态。另一方面,在接收了不许可信号的情况下(在S128为NO),结束固定通信处理,CPU11返回询问信号(S122)的待机模式。
当语音识别设备10的动作模式成为语音识别模式时,识别处理部106接受语音输入(S132)。当语音被输入时(在S132为YES),例如通过上述日本特开2010-266488号公报(专利文献1)揭示的方法,实行语音识别处理(S134)。有关语音识别处理,在图7中例举子程序进行说明。
图7是表示本发明的实施方式的在语音识别设备10中实行的语音识别处理的流程图。
参照图7,识别处理部106首先算出被输入的语音信号的特征值(S202)。具体来说,剪切被输入的语音信号中包含人声的区间,将剪切出的区间的语音信号转换成MFCC(Mel-frequency cepstral coefficient)特征值。
接着,为了除去杂音的影响,实行特征值的正常化处理(S204)。具体来说,例如通过带通过滤器过滤特征值,并除以最大振幅值。识别处理部106根据该正常化后的特征量,根据模式参数161推定使用了HMM的似然(S206)。也就是说,求出各HMM生成正常化后的特征值的系列的似然。识别处理部106比较各HMM的似然值,并以似然最大的HMM作为识别结果(S208)。
再次参照图6,当语音识别处理结束,转换处理部108根据代码对应平台162、将通过识别处理部106得到的识别结果转换成代码编号(S136)。例如语音输入“Osaka”并被识别。在这种情况下,在该转换处理中,选择与向通用的键盘输入“Osaka”时相同的代码编号。转换后的代码编号通过通信部110被发送至信息处理终端20。
在信息处理终端20中,当接收了代码编号时(在S116为YES),CPU21实行与代码编号相对应的处理(S118)。S116和S118的处理例如可以持续直至信息处理终端20的电源关闭。
在转移至键盘连接模式后,例如在通讯录的应用软件被起动的情况下,通过对语音识别设备10语音输入住址或姓名,能够简单地的登记或变更通讯录。另外,对应被安装于信息处理终端20中的能够通过键盘进行指示的功能,能够进行各种操作。例如,向语音识别设备10输入“拍照”这一语音,由此,能够按下被搭载于信息处理终端20的照相机(未图示)的快门。
此外,语音识别设备10中的语音识别模式在电源关闭时被解除。另外,也可在按下连接按钮171时解除语音识别设备10中的语音识别模式。由此,即使在与信息处理终端20连接时,也能够开始与其他信息处理终端的配对设定处理。
根据上述说明,能够通过使用本实施方式的语音识别设备10、通过语音操作信息处理终端20,因此,无需另外向信息处理终端20组装语音识别功能(语音识别程序)。也就是说,根据本实施方式,能够完全不改动现有的信息处理终端20地向该终端添加语音识别功能。另外,即使在信息处理终端20搭载有语音识别功能的情况下,也能够向该终端添加高精度的语音识别功能。
另外,由于语音识别设备10是语音识别专用的模块,因此无需用户进行转换成语音识别模式的操作。由此,仅通过打开信息处理终端20侧的电源的操作,就能够开始通过语音对终端的操作。
另外,由于语音识别设备10是语音识别专用的模块,因此操作部17也可形成仅包含有配对设定时的连接按钮171的结构。因此,能够使语音识别设备10的框体小型化,便于携带。
进而,只要是例如可连接键盘的信息处理终端20,就能够不局限于终端的种类和型号连接语音识别设备10。由此,如Bluetooth规格的简档是通用的终端,能够使1台语音识别设备10作为向各种信息处理终端20的指示输入装置动作。
另外,在本实施方式中,说明了语音识别设备10作为键盘动作,但也可以作为可连接信息处理终端20的其他种类的可选设备动作。
另外,在本实施方式中,说明了与语音识别设备10通信的终端是信息处理终端20,但只要是可连接指示输入装置等可选设备的装置,也可以是家电产品或汽车导航***等。
另外,在本实施方式中,说明了语音识别设备10和信息处理终端20无线通信,但也可以通过有线连接。以下作为变形例,说明两者例如通过USB(Universal Serial Bus)通信的形态。
(变形例)
图8是表示本发明的实施方式的变形例的语音识别设备10A的硬件框图。在本变形例中,仅详细说明与上述实施方式不同的点。
参照图8,语音识别设备10A包括USB端子19,该USB端子19取代图2所示的通信模块12、与信息处理终端20的USB端子29(图3)连接。另外,在本变形例中,可以不包括如图2所示的电源部13和操作部17。
当语音识别设备10A与信息处理终端20有线连接时,不会与他人的信息处理终端20发生意外连接。因此,在本变形例中,不需要图4所示的功能结构中的设定处理部102的功能、以及图5所示的配对设定处理。图4所示的通信部110包含USB端子19。
另外,在图6所示的固定通信处理中,不需要在信息处理终端20中实行的有关ID代码辨别的S108~S112的处理。另外,也不需要通过语音识别设备10实行的作为接收许可信号的判断步骤的S128的处理。也就是说,在本变形例中,在语音识别设备10A向有线连接的信息处理终端20发送包含设备信息的应答信号这一时刻,其与信息处理终端20之间的连接状态被确立。另外,当信息处理终端20通过包含在接收了的应答信号中的设备信号、辨别连接有键盘时,其与语音识别设备10之间的连接状态被确立。
如上所述,在本变形例中,能够以比上述实施方式更单纯的结构构成语音识别设备10A。其结果,能够降低制造成本并使设备轻量化。
产业上的可利用性
本发明的语音识别设备能够不对现有的终端做出任何改动地添加语音识别功能,因此能够被有效地利用。

Claims (9)

1.一种语音识别设备,作为与可通过无线或有线连接可选设备的终端进行通信的语音识别设备,其包括:
语音输入机构,用于输入语音;
识别处理机构,用于执行被输入的语音的识别处理,
其中,所述识别处理机构根据与所述终端的连接状态被确立地情况进行动作,
所述语音识别设备还包括:
存储机构,预先存储代码对应信息,其中,所述代码对应信息联系多个单词或文字和与它们分别对应的所述可选设备特有的指示代码信息;
转换处理机构,基于由所述存储机构存储的所述代码对应信息,将表示由所述识别处理机构进行的识别处理结果的单词或文字转换成所述指示代码;
通信机构,将通过所述转换处理机构转换后的所述指示代码信息发送至作为被连接的所述终端的连接对象。
2.根据权利要求1所述的语音识别设备,其中,
所述可选设备包含指示输入装置,
所述指示代码信息是从所述指示输入装置输出的代码编号。
3.根据权利要求2所述的语音识别设备,其中,
所述存储机构还预先存储包含设备本身的识别信息和种类信息的设备信息,
所述种类信息是表示设备本身的种类是所述指示输入装置的信息。
4.根据权利要求3所述的语音识别设备,其中,
语音识别设备还包括辨别处理机构,
所述辨别处理机构为,当从所述终端接收了询问所述可选设备是否存在的第一询问信号的情况下、将发送所述第一询问信号的所述终端辨别为所述连接对象,
所述辨别处理机构为,当接收了所述第一询问信号时,生成包含所述设备信息的第一应答信号,并且向发送所述第一询问信号的所述终端回复所述第一应答信号。
5.根据权利要求4所述的语音识别设备,其中,
所述通信机构与通过所述辨别处理机构被辨别为所述连接对象的所述终端进行无线通信,
所述语音识别设备还包括事先执行与所述终端之间的配对设定处理的设定处理机构。
6.根据权利要求5所述的语音识别设备,其中,
所述设定处理机构为,在能够接受所述可选设备的搜索的状态下,当从所述终端接收第二询问信号时,生成包含所述设备信息的第二应答信号,并且向发送所述第二询问信号的所述终端回复所述第二应答信号。
7.根据权利要求6所述的语音识别设备,其中,
语音识别设备还包括操作机构,所述操作机构包含多个键,由用户操作,
所述设定处理机构为,接受所述操作机构的操作,将对应于所述操作机构的操作的所述代码编号作为配对的密码,通过所述通信机构发送至所述终端。
8.根据权利要求6所述的语音识别设备,其中,
所述设定处理机构为,接受向所述语音输入机构输入的语音输入,将所述代码编号作为配对的密码,通过所述通信机构向所述终端发送,
其中,所述代码编号是由所述转换处理机构转换通过所述识别处理机构得到的语音的识别处理结果而成。
9.根据权利要求4所述的语音识别设备,其中,
所述通信机构为,与通过所述辨别处理机构判断为所述连接对象的所述终端进行有线通信。
CN201280077932.5A 2012-12-28 2012-12-28 语音识别设备 Pending CN104871241A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/084150 WO2014103035A1 (ja) 2012-12-28 2012-12-28 音声認識デバイス

Publications (1)

Publication Number Publication Date
CN104871241A true CN104871241A (zh) 2015-08-26

Family

ID=51020185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280077932.5A Pending CN104871241A (zh) 2012-12-28 2012-12-28 语音识别设备

Country Status (3)

Country Link
JP (1) JP6059253B2 (zh)
CN (1) CN104871241A (zh)
WO (1) WO2014103035A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105916069A (zh) * 2016-04-19 2016-08-31 安徽理工大学 一种可将语音实时转换成文字的智能话筒
CN107071603A (zh) * 2017-06-30 2017-08-18 广州音书科技有限公司 一种用于实时语音识别的话筒及***

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019066702A (ja) 2017-10-02 2019-04-25 東芝映像ソリューション株式会社 対話型電子装置制御システム、対話型電子装置、対話型電子装置制御方法
JP2020065140A (ja) * 2018-10-16 2020-04-23 カシオ計算機株式会社 音声処理装置、方法、プログラム、携帯端末

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108603A (ja) * 2000-09-27 2002-04-12 Mitsumi Electric Co Ltd リモートコントローラ装置
JP2004104757A (ja) * 2002-07-16 2004-04-02 Advanced Media Inc 音声入力装置
CN1703923A (zh) * 2002-10-18 2005-11-30 中国科学院声学研究所 一种便携式数字移动通讯设备及其语音控制方法和***
CN201781565U (zh) * 2010-08-30 2011-03-30 康佳集团股份有限公司 一种遥控器、电视机及电视***
CN201846445U (zh) * 2010-11-10 2011-05-25 江苏惠通集团有限责任公司 基于rf4ce协议的多功能数字电视控制***
CN102111314A (zh) * 2010-12-30 2011-06-29 广州市聚晖电子科技有限公司 一种基于蓝牙传输的智能家居语音控制***及方法
CN102118186A (zh) * 2009-12-31 2011-07-06 鼎亿数码科技(上海)有限公司 蓝牙设备连接方法
CN102760433A (zh) * 2012-07-06 2012-10-31 广东美的制冷设备有限公司 联网家电用声控遥控器及其控制方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3286339B2 (ja) * 1992-03-25 2002-05-27 株式会社リコー ウインドウ画面制御装置
JP2000236585A (ja) * 1999-02-15 2000-08-29 Nippon Telegr & Teleph Corp <Ntt> 機器制御方法及び装置並びに制御サーバ
JP2001268646A (ja) * 2000-03-22 2001-09-28 Animo:Kk 携帯無線通信機、ツール・サーバ、音声認証サーバ、及び無線通信システム
JP4728537B2 (ja) * 2001-09-14 2011-07-20 株式会社ホンダアクセス ブルートゥース通信システム
JP2005072764A (ja) * 2003-08-21 2005-03-17 Hitachi Ltd 機器制御システムとそのための装置及び機器制御方法
JP4691741B2 (ja) * 2008-04-04 2011-06-01 健治 吉田 携帯電話用クレードル、tv電話システム、カラオケシステム、カーナビゲーションシステム、および緊急情報通知システム
JP2009300537A (ja) * 2008-06-10 2009-12-24 Fujitsu Ten Ltd 音声作動システム、音声作動方法および車載装置
JP5351855B2 (ja) * 2010-08-10 2013-11-27 ヤフー株式会社 情報家電システム、情報取得方法及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108603A (ja) * 2000-09-27 2002-04-12 Mitsumi Electric Co Ltd リモートコントローラ装置
JP2004104757A (ja) * 2002-07-16 2004-04-02 Advanced Media Inc 音声入力装置
CN1703923A (zh) * 2002-10-18 2005-11-30 中国科学院声学研究所 一种便携式数字移动通讯设备及其语音控制方法和***
CN102118186A (zh) * 2009-12-31 2011-07-06 鼎亿数码科技(上海)有限公司 蓝牙设备连接方法
CN201781565U (zh) * 2010-08-30 2011-03-30 康佳集团股份有限公司 一种遥控器、电视机及电视***
CN201846445U (zh) * 2010-11-10 2011-05-25 江苏惠通集团有限责任公司 基于rf4ce协议的多功能数字电视控制***
CN102111314A (zh) * 2010-12-30 2011-06-29 广州市聚晖电子科技有限公司 一种基于蓝牙传输的智能家居语音控制***及方法
CN102760433A (zh) * 2012-07-06 2012-10-31 广东美的制冷设备有限公司 联网家电用声控遥控器及其控制方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105916069A (zh) * 2016-04-19 2016-08-31 安徽理工大学 一种可将语音实时转换成文字的智能话筒
CN107071603A (zh) * 2017-06-30 2017-08-18 广州音书科技有限公司 一种用于实时语音识别的话筒及***

Also Published As

Publication number Publication date
JP6059253B2 (ja) 2017-01-11
WO2014103035A1 (ja) 2014-07-03
JPWO2014103035A1 (ja) 2017-01-12

Similar Documents

Publication Publication Date Title
KR102490376B1 (ko) 전자 장치 및 전자 장치 간 음성으로 기능을 실행하는 방법
KR102624327B1 (ko) IoT 기기의 위치 추론 방법, 이를 지원하는 서버 및 전자 장치
EP3779969A1 (en) Electronic devices managing plurality of intelligent agents
US9635164B2 (en) Remote control for electronic device
EP3794809B1 (en) Electronic device for performing task including call in response to user utterance and operation method thereof
CN104871241A (zh) 语音识别设备
US20230032366A1 (en) Method and apparatus for wireless connection between electronic devices
JP2012039282A (ja) 電子機器、その情報表示プログラム及びその情報表示方法
CN110944056A (zh) 交互方法、移动终端及可读存储介质
KR102453161B1 (ko) 자동 응답 시스템으로 개인 정보를 전송하기 위한 장치 및 방법
CN107025389B (zh) 一种指纹录入的方法及终端
CN105391845A (zh) 一种移动智能终端的远程操作方法及装置
CN107358952A (zh) 来电呼入处理方法、装置、存储介质及终端
JP6422640B2 (ja) カラオケリモコンアプリケーションプログラム
KR102529790B1 (ko) 전자장치 및 그 제어방법
KR20220005702A (ko) 전자 장치 및 전자 장치의 인증 동작 수행 방법
KR100946666B1 (ko) 사용자기기의 키패드를 이용한 외부 입력 방법 및 장치
US20240007561A1 (en) Electronic device for performing communication with counterpart by using assistance module, and control method thereof
CN106874738B (zh) 一种触控操作的响应方法及移动终端
CN201000603Y (zh) 以计算机执行语音操控电器设备的装置
JP5886720B2 (ja) 無線通信端末、方法、およびプログラム
JP3141142U (ja) 多機能ブルートゥースインターネット電話装置
US20230129555A1 (en) Electronic device and operating method thereof
US20230362259A1 (en) Electronic device for controlling internet of things device and method of operating the same
US20230422009A1 (en) Electronic device and offline device registration method

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150826

WD01 Invention patent application deemed withdrawn after publication