CN104919278A - 语音识别装置及显示方法 - Google Patents

语音识别装置及显示方法 Download PDF

Info

Publication number
CN104919278A
CN104919278A CN201380070047.9A CN201380070047A CN104919278A CN 104919278 A CN104919278 A CN 104919278A CN 201380070047 A CN201380070047 A CN 201380070047A CN 104919278 A CN104919278 A CN 104919278A
Authority
CN
China
Prior art keywords
display
speech recognition
relative importance
importance value
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380070047.9A
Other languages
English (en)
Other versions
CN104919278B (zh
Inventor
大泽政信
古本友纪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of CN104919278A publication Critical patent/CN104919278A/zh
Application granted granted Critical
Publication of CN104919278B publication Critical patent/CN104919278B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/265Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network constructional aspects of navigation devices, e.g. housings, mountings, displays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0967Systems involving transmission of highway information, e.g. weather, speed limits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Navigation (AREA)

Abstract

根据本发明的语音识别装置,在始终对说出的语音进行识别的情况下,能根据识别结果相对于语音识别结果以外的显示信息的显示优先度,来调整语音识别结果的输出,因此不会因显示识别结果而妨碍用户获取对其而言较为重要的其他信息,因而提高了便利性。

Description

语音识别装置及显示方法
技术领域
本发明涉及对用户说出的语音进行识别并显示识别结果的语音识别装置、以及使该识别结果显示于显示装置的显示方法。
背景技术
作为语音识别方法,已知有对用户说出的语音进行识别并显示该识别结果的方法。
在例如专利文献1中记载了以下内容:在识别用户说出的语音并显示该识别结果的语音识别装置中,基于使用者可操作的设备的利用状况、使用者的生物体信息等来推定使用者的负荷量,在其负荷量较大时(即,使用者对显示单元的显示进行视觉识别的频率较低时),使得容易显示识别结果,在其负荷量较小时(即,使用者对显示单元的显示进行视觉识别的频率较高时),使得不易显示识别结果。
现有技术文献
专利文献
(专利文献1)
日本专利特开2008-14818号公报
发明内容
发明所要解决的技术问题
然而,在例如专利文献1所示的现有语音识别装置中,仅能基于使用者的负荷来调整识别结果的输出频率,因而存在以下问题:即,即使显示了对于使用者而言较为重要的地图信息,但仍会显示语音识别结果,因而会妨碍使用者获取重要信息。
本发明是为了解决上述问题而完成的,其目的在于提供一种能根据识别结果相对于语音识别结果以外的显示信息的显示优先度,来调整语音识别结果的输出的语音识别装置、以及将该识别结果显示于显示装置的显示方法。
用于解决技术问题的技术手段
为了达成上述目的,本发明的语音识别装置中,识别用户说出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的音频数据,基于规定的判定匹配度来输出识别结果;
显示部,该显示部显示所述语音识别部所输出的识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示部的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;以及
识别结果输出控制部,该识别结果输出控制部基于所述显示优先度计算部所计算出的显示优先度来确定所述规定的判定匹配度,并设定于所述语音识别部。
发明效果
基于本发明的语音识别装置,能根据识别结果相对于语音识别结果以外的显示信息的显示优先度,来调整语音识别结果的输出,因此不会因显示识别结果而妨碍用户获取对其而言较为重要的其他信息,因而提高了便利性。
附图说明
图1是表示使用实施方式1的语音识别装置的导航装置的一个示例的框图。
图2是表示实施方式1的语音处理部的结构的一个示例的框图。
图3是表示在显示部上显示有地图画面的状态下、在显示部内的左边部分的识别结果显示区域中显示了识别结果即操作按钮的画面例的图。
图4是表示地图画面、本车前进方向、及识别结果显示区域的关系的图。
图5是表示本车前进方向上的信息和识别结果的显示优先度调整量的对应的一个示例的表。
图6是表示在显示部中显示有地图画面的状态下、停车场等设施图标显示于识别结果显示区域中的画面例的图。
图7是表示设施图标的个数与显示优先度调整量的对应的表。
图8是表示每个道路类别的识别结果的显示优先度调整量的一个示例的表。
图9是表示每个地域类别的识别结果的显示优先度调整量的一个示例的表。
图10是表示每个地图显示比例尺的识别结果的显示优先度调整量的一个示例的表。
图11是表示在显示部中显示了地图画面的状态下、引导信息或警告信息显示于识别结果显示区域中的画面例的图。
图12是表示引导信息/警告信息与识别结果的显示优先度调整量相对应的一个示例的表。
图13是表示相对于识别结果的内容与所显示的显示画面的组合的、识别结果的显示优先度调整量的一个示例的表。
图14是表示识别结果的显示优先度与判定匹配度的关系的图。
图15是表示语音识别结果即操作按钮的显示处理的流程图。
图16是表示操作按钮显示后的处理的流程图。
图17是表示判定匹配度的设定的处理的流程图。
图18是表示在显示部上显示了地图画面的状态下、因本车的前进方法与显示于识别结果显示区域的识别结果即操作按钮之间的关系而引起的画面迁移例的图。
图19是表示实施方式2的语音处理部的结构的一个示例的框图。
图20是表示语音识别词典切换信息存储部中所存储的现有优先度、语音识别词典名、识别单词数相对应的一个示例的表。
图21是表示实施方式2的语音识别装置的处理的流程图。
图22是表示实施方式3的语音处理部的结构的一个示例的框图。
图23是表示识别结果的显示优先度与识别对象单词数的关系的图。
图24是表示识别单词候补存储部中所存储的识别对象候补的单词的读法与识别顺序相对应的一个示例的表。
图25是表示实施方式3的语音识别装置的处理的流程图。
图26是表示实施方式4的导航***的概要的图。
具体实施方式
下面,参照附图,对本发明的实施方式进行详细说明。
本发明是识别用户说出的语音的语音识别装置,在该语音识别装置起动的情况下始终对语音进行识别。在下面的实施方式中,以将本发明的语音识别装置适用于搭载在车辆等移动体的导航装置中的情况为例进行说明,但也可以适用于安装在车辆以外的其他移动体用的导航装置上,可以适用于导航***的伺服器。另外,也能适用于安装在智能手机、平板电脑、移动电话等携带信息终端等的导航***的应用等中。
实施方式1
图1是表示适用了本发明的实施方式1的语音识别装置的导航装置的一个示例的框图。该导航装置包括:控制部1、GPS接收机2、自主巡航传感器3、当前位置检测部4、交通信息收发部5、路径计算部6、指引引导部7、麦克风8、语言处理部9、语音合成部10、地图信息存储部11、地图信息获取部12、指示输入部13、显示控制部14、显示部15、语音控制部16、扬声器17。
控制装置1对整个导航装置的动作进行控制。
GPS接收机2用于适用于根据来自GPS卫星的电波来测定移动体的当前位置的卫星巡航***。
自主巡航传感器3适用根据方位传感器、行驶距离传感器等来检测移动体的当前位置、方位的自主巡航***。
当前位置检测部4接收GPS接收机2及自主巡航传感器3的信号,并用卫星巡航***和自主巡航***且基于后述的地图信息来进行匹配,以检测本车的当前位置和前进方向。此外,也可以仅采用任一方的巡航***。
交通信息收发部5接收由FM多路广播、无线电信标、光信标所提供的交通信息(以VICS(Vehicle Information&Communication System:车辆信息和通信***/注册商标)为代表)、DSRC(Dedicate Short RangeCommunication:特定短距离通信)所提供的堵塞信息等。另外,发送与本车相关的信息例如当前位置等探测信息。
路径计算部6基于用户通过后述的指示输入部13、语音操作而设定的地点,由当前位置检测部4检测出的位置信息,由后述的地图信息获取部12所获取的地图信息,来计算从当前位置到所设定的地点为止的最佳路径(以下成为“推荐路径”)。
指引引导部7基于地图信息获取部12所获取的地图信息,生成车辆沿着路径计算部6所计算出的路径进行移动时用于引导的指引引导图及指引引导消息。
麦克风8获取用户说出的语音(集声)。麦克风8例如是全方向性(或无方向性)的麦克风、将多个全方向性(或无方向性)的麦克风排列成阵列状以调整方向特性的阵列麦克风、仅在一个方向上具有方向性且无法调整方向特性的单一方向性麦克风等。
语言处理部9处理麦克风8所获取的语音,此处进行语音识别。详细情况将参照图2在后面进行描述。
语音合成部10基于所输入的字符或字符串来生成合成语音。对于语音合成,例如使用“古井贞熙「语音信息处理」第4章”所揭示的方法。
地图信息存储部11中存储有例如与道路相关的“道路信息”,与设施相关的“设施信息”(类别、名称、位置等)、“各种文字信息”(地名、设施名、交叉路口名、道路名等)、以及表示设施·道路编号等的“各种图标信息”、以及指引引导部中所使用的指引用信息(规定的主要场所的位置信息、该重要场所的绘图信息、以及语音引导信息等)数据。地图信息存储部可以是例如HDD(Hard Disk Drive:硬盘驱动)、使用半导体元件的SD卡等存储器、也可以是存在于网络上的通过通信网络获取道路数据等信息的结构(地图数据获取部)。
地图信息获取部12接收到地图信息获取指示、设施信息获取指示等时,检索地图信息存储部11来获取必要信息。
对于指示输入部13,由用户手动输入指示。该指示可以列举出利用设置于导航装置的硬件开关、后述的显示器上所设定并显示的触摸开关、或者对设置于方向盘等的遥控器或单独的遥控器的指示进行识别的识别装置等作出的指示等。
显示控制部14从地图信息获取部12、当前位置检测部4、交通信息收发部5、路径计算部6、指引引导部7、视频处理部9获取必要信息,在后述的显示部15中生成要描绘的信息,向显示部15输出指示以显示该信息。
显示部15是显示一体型触摸面板,例如由LCD(Liquid Crystal Display:液晶显示器)和接触式传感器构成,根据来自显示控制部14的指示来在画面上进行描绘。此外,触摸面板可以是使用感压方式、电磁感应方式、静电电容方式、或对上述方式进行组合的方式等中任意一种。另外,也可以使用有机EL显示器来代替LCD。
语音控制部16向扬声器17输出指示,以使其输出来自指引引导部7的指引用语音信息、语音合成部10所生成的合成语音。
扬声器17基于语音控制部16的指示来输出语音。
接着,对语音控制部9的详细情况进行说明。图2是表示实施方式1的语音处理部9的结构的一个示例的框图。如图2所示,语音处理部9包括语音获取部18、语音识别部19、语音识别词典20、显示优先度计算部21、识别结果输出控制部22。
语音获取部18获取由麦克风8获取的用户语音、即输入的音频,并利用PCM(Pulse Code Modulation:脉冲编码调制)进行A/D(Analog/Digital:模拟/数字)转换。
语音识别部19从经过语音获取部18进行了数字化后的音频信号中检测出符合用户所说内容的音频区间,提取出该音频区间的音频数据的特征量,基于该特征量利用语音识别词典20进行识别处理,从而输出具有规定判定匹配度以上(或大于规定判定匹配度)的匹配度的识别结果。作为识别处理,使用例如HMM(Hidden Markov Model:隐马尔可夫模型)法之类的一般方法即可。
然而,在搭载于车载导航***等的语音识别功能中,通常用户会对***明确表示(指示)发话的开始。因此,可以将指示语音识别开始的按钮(以下成为“语音识别开始指示部”)显示于触摸面板或设置于方向盘。于是,在语音识别开始指示部被用户按下之后,对所说出的语音进行识别。即,语音识别开始指示部输出语音识别开始信号,若语音识别部接收该信号,则在接收该信号后从由语音获取部获取的音频数据中检测出符合用户所说内容的音频区间,由此来进行上述识别处理。
然而,本实施方式1的语音识别部19即使没有上述那样的来自用户的语音识别开始指示,也始终对用户所说的内容进行识别。即,语音识别部19即使没有接收到语音识别开始信号,在组装有该语音识别装置的导航装置启动的情况下,也始终反复进行以下处理,即:从由语音获取部18所获取的音频数据中检测出符合用户所说内容的音频区间,提取出该音频区间的音频数据的特征量,并基于该特征量利用语音识别词典20来进行识别处理,从而输出语音识别结果。在下述的实施方式中也一样。
对于语音识别部19输出识别结果时所使用的规定的判定匹配度,预先设定为一定的初始值(例如500),之后设定为由后述的识别结果输出控制部22所确定的值。
显示控制部14对显示部15输出指示,以将语音识别部19的识别结果显示于识别结果显示区域24(参照图3),该识别结果显示区域24被预先设定为显示识别结果的区域。图3是表示在显示部15上显示了本车31和地图画面的状态下、在显示部15内的左边部分的识别结果显示区域24中显示了识别结果即操作按钮23的画面例的图。例如图3所示,识别结果显示区域24可以设定为显示部15内的左边部分,也可以如后述的图4(b)所示,设定为显示部15内的上半部分等预先以固定的方式设定的区域,用户可以任意地设定该区域。
另外,在本实施方式中,例如图3所示,将语音识别部19的识别结果作为操作按键23显示于显示部15的识别结果显示区域24。所显示的识别结果(操作按钮23)中分配有对应于其识别结果的功能,在根据来自指示输入部13的操作、语音操作来选择该操作按钮23的情况下,执行所分配的功能。
另一方面,在操作按钮23显示于识别结果显示区域24开始一定时间(例如5至10秒)内用户不进行选择该操作按钮23的操作的情况下,显示控制部14对显示部15输出指示以使其结束该识别结果显示(操作按钮23的显示)。其结果是,识别结果即操作按钮23的显示消失。
在以下说明中,语音识别部19识别用户说出的例如“加油站”、“便利店”这样的设施所属的种类名(以下称为“设施种类名”),基于识别结果输出控制部22所设定的判定匹配度来输出该识别结果。
显示控制部14输出指示以将上述输出的识别结果显示为例如图3所示的操作按钮23。操作按键23中分配有按照对应种类进行设施检索的功能,若用户选择该操作按钮23,则输出与该操作按钮23相对应的按照种类进行设施检索的指示信号,地图信息获取部12基于该信号从地图信息存储部11获取设施信息。
说明在语音识别部19中根据现有技术即关键词识别来识别设施种类名的内容。
可以使用如下方法:即、不利用关键词识别来识别设施种类名,而利用大词汇连续语音识别来进行所有识别,对识别结果进行形态分析,以提取出设施种类名的方法。
语音识别部19可以不识别设施种类名,而识别例如艺术家名、专辑名、歌曲标题名、用于操作车载导航***的命令等。另外,所显示的识别结果(操作按钮23)中所分配的功能例如是按照艺术家名、专辑名、歌曲标题名等检索歌曲的功能,也可以是对应于命令的功能。
显示优先度计算部21基于当前位置检测部4检索出的当前位置信息、交通信息收发部5所接收到的交通信息、路径计算部6所计算出的路径信息、指引引导部7所输出的引导信息、地图信息获取部12所获取的信息等,来判定是否符合后述的规定项目(1)至(8),基于各个判定结果来确定符合的所有项目的显示优先度的调整量,并计算识别结果显示区域24中的识别结果的显示优先度。
将显示优先度设为表示相对于语音识别结果以外的显示信息(例如地图信息等)要优先显示语音识别结果的程度。由于显示优先度越高则语音识别的判定匹配度越低,因而易于进行语音识别,其结果是语音识别结果的输出频率(显示频率)变高。由于显示优先度越低则语音识别的判定匹配度越高,因而不易进行语音识别,其结果是语音识别结果的输出频率(显示频率)变低。即,显示优先度与语音识别中所使用的判定匹配度之间具有负相关的关系。
接着,说明显示优先度计算部21所判定的项目及每个项目的显示优先度的调整量(调整值),并说明显示优先度的计算方法。
各个项目分类为以下(1)至(8)那样的大项目,显示优先度计算部21将(1)至(8)的至少一个以上的大项目作为判定对象。此外,作为判定对象的大项目,可以预先设定为一个以上的项目,也可以由用户通过设定画面来任意选择。
(1)“本车前进方向上识别结果显示区域24的有无”
图4是表示地图画面、本车前进方向、及识别结果显示区域24的关系的图。
显示部15上在利用北基准显示地图的情况下,前进方向意味着“实际前进的方位角”。例如在地图利用北基准,本车31向西方前进的情况下,显示为图4(a)。图4(a)中示出了识别结果显示区域24为显示部15内左侧部分的情况。
另外,在显示部15上以本车为基准显示地图的情况下,前进方向意味着“显示画面的上方”。在该情况下,例如显示为图4(b)。该图4(b)中示出了识别结果显示区域24为显示部15内上侧部分的情况。
在上述例子以外,例如图4(c)所示,在本车31右(或左)转后的方向上有识别结果显示区域24的情况下,将“右(或左)转后的实际方位角”或“右(或左)转后的显示画面上的朝向”作为前进方向。
接下来,对优先度计算部21的判定方法进行说明。
在以下说明中,说明了显示优先度计算部21中预先存储有识别结果显示区域24的显示部15中的位置及范围的相关信息,但是也可以存储于例如显示控制部14等其他构成要素并从中获取。
在地图按照北基准进行显示的情况下,例如显示优先度计算部21从当前位置检测部4获取本车的当前前进方向,判定其前进方向和识别结果显示区域24的位置是否一致。
在地图按照本车基准进行显示的情况下,例如显示优先度计算部21对识别结果显示区域24的位置是否在显示画面的上方进行判定。
此处,在本车的前进方向上有识别结果显示区域24的情况下,也可以再对该前进方向的道路上是否显示了交通信息进行判定。
例如图4(d)所示,判定为在前进方向的道路上有堵塞信息的显示32。交通信息可以是表示正在拥堵、正在施工、发生了事故等的交通信息,也可以是表示其他情况的交通信息。在该情况下,显示优先度计算部21从交通信息收发部5获取交通信息即可。
接下来,说明显示优先度的调整量。
图5是表示本车前进方向上的信息与识别结果的显示优先度调整量相对应的一个示例的表。
在该情况下,认为本车前进方向上的信息对于用户而言较为重要,设定了使显示优先度减少的调整量。在本车前进方向的道路上显示有交通信息的情况下,若还存在对于用户而言较为重要的信息,则设定了进一步减少显示优先度的调整量。
在该实施方式1中,将显示优先度的初始值设为50,显示优先度可以设为0到100中的值,但并不限于上述值。
另外,对于显示优先度的初始值、后述每个项目的显示优先度调整量,也可以根据如下情况来进行改变:即、考虑了显示优先度所能获得的范围、后述的多个其他大项目的基础上来计算显示优先度的情况等。
在该实施方式1中,在显示优先度的计算结果超过上限(下限)的情况下,将显示优先度设为100(0)。
以判定对象仅为该项目(1)的情况为例,使用具体数值来说明显示优先度的计算方法。
例如图4(d)所示,地图按照北基准进行显示,本车31的前进方向朝西,识别结果显示区域24设定在显示部15内的左侧,此时,由于识别结果显示区域24位于本车31的前进方向上,因而显示优先度计算部21参照图5的表将显示优先度的调整量设为-30。
在该图4(d)的情况下,还在本车31的前进方向上显示了堵塞信息,因此显示优先度计算部21还基于图5的表来将显示优先度的调整量确定为-10。
其结果是,显示优先度计算部21计算出显示优先度=初始值50+调整量(-30)+调整量(-10)=10。后文中将叙述与由此计算出的显示优先度相对应的判定匹配度的确定方法。
(2)“识别结果显示区域24中所显示的设施图标的有无及其个数”
图6是表示在显示部15中显示了地图画面的状态下、停车场等设施图标33显示于识别结果显示区域24中的画面例的图。
对于该项目(2),显示优先度计算部21判定停车场等设施图标33是否显示于识别结果显示区域24。此外,显示优先度计算部21也能不仅判定识别结果显示区域24中是否显示了设施图标33,还能判定该设施图标33的个数。
显示优先度计算部21例如获取显示控制部14所生成的地图信息,在识别结果显示区域24所对应的范围内判断是否有与设施图标33相关的信息、其个数。
在这种情况下,设施图标33所示的地点是用户顺路经过的可能性较高的重要地点,因而在该设施图标33位于识别结果显示区域24内的情况下,设定为减少语音识别结果的显示优先度的调整量。
例如在识别结果显示区域24内有设施图标33的情况下,将显示优先度的调整量设为-10,从而减少显示优先度。另外,如图7所示,也可以随着设施图标33的个数增加而进一步设定使显示优先度减少的调整量。
图7是表示设施图标33的个数与显示优先度调整量相对应的表。例如图6所示,在识别结果显示区域24内有3个设施图标33的情况下,通过参照图7来将个数所对应的显示优先度的调整量确定为-6。
即,如图6所示,在识别结果显示区域24内有3个设施图标33的情况下,对于该项目(2)的显示优先度的调整量,由于设施图标33位于识别结果显示区域24内,因而调整量为“-10”,由于有3个设施图标33,因而调整量为“-6”,从而总调整量为“-16”。
(3)“识别结果显示区域24中所显示的由用户所设定的地点的有无及其个数”
显示优先度计算部21例如获取显示控制部14所生成的地图信息,在识别结果显示区域24所对应的范围内判断是否有与用户所设定的目的地、经由地、登录地等相关的信息(以下称为“设定地点图标”)、其个数。
在该情况下,由于用户所设定的地点对于用户而言是较为重要的地点,因而在设定地点图标位于识别结果显示区域24内的情况下,设定使显示优先度减少的调整量。
例如,在设定地点图标位于识别结果显示区域24内的情况下,将显示优先度调整量设为-5,使显示优先度减少。另外,随着设定地点个数的增加,与上述(2)相同,也能设定进一步使显示优先度减少的调整量。
(4)“行驶中的道路类别”
显示优先度计算部21例如获取当前位置检测部4所检测出的本车位置信息,并使用该本车位置信息,获得本车正在行驶的道路的道路类别,并进行判定,该道路类别由地图信息获取部12从地图信息存储部11中获得。
此时,道路类别例如是“高速道路”、“一般道路”、“隧道”等。
图8是表示每个道路类别的识别结果的显示优先度调整量的一个示例的表。
在该情况下,在高速道路行驶中,停车区、服务区、出入口以外的周边信息对用户而言的重要度并不高,因而设定使识别结果的显示优先度增加的调整量。认为在行驶于一般道路的情况下,周边信息的重要度对于用户而言较高,因而设定使显示优先度减少的调整量。另外,在行驶于隧道内的情况下,不存在对于用户而言重要度较高的周边信息,因而设定使显示优先度增加的调整量。
(5)“行驶中的地域”
显示优先度计算部21例如获取当前位置检测部4所检测出的本车位置信息,并使用该本车位置信息,获得本车正在行驶的地域的地域类别,并进行判定,该地域类别由地图信息获取部12从地图信息存储部11中获得。
此时,地域类别例如是“市区”、“市外”、“山中”、“海上”等。
图9是表示每个地域类别的识别结果的显示优先度调整量的一个示例的表。
在该情况下,在行驶于市区时,由于显示于地图上的信息较多,因而设定使语音识别结果的显示优先度减少的调整量。在行驶于市外的情况下,设定使显示优先度减少的调整量,但是由于与市区相比地图上所显示的信息较少,因而设定与行驶于市区的情况相比显示优先度的减少量变小的调整量。在行驶于山中或海上(例如行驶于明石海峡大桥等)时,由于地图上所显示的信息较少,因而设定为使显示优先度增加的调整量。此外,在行驶于海岸线时识别结果显示区域24为海上的情况下,也可以设定使显示优先度增加的调整量。
(6)“地图的显示比例尺”
显示优先度计算部21例如从显示控制部14或存储有用户的各种设定的设定存储部(未图示)等获取当前的地图显示比例尺,并进行判定。
此时,作为显示比例尺,将相当于成为基准的比例尺的距离设定为“25m”、“50m”、“100m”…“500m”、“1km”“、3km”、“5km”等。
图10是表示每个地图显示比例尺的识别结果的显示优先度调整量的一个示例的表。
在该情况下,显示比例尺越小(地图越大)则所显示的地图信息的重要度越高,因而设定为随着显示比例尺的减小、语音识别结果的显示优先度也减小的调整量。
例如,将最大显示比例尺的显示优先度调整值设为“+10”,随着显示比例尺的减少而使显示优先度调整量减少。
(7)“在识别结果显示区域24上是否显示了引导信息/警告信息”
图11是表示在显示部15中显示了地图画面的状态下、引导信息34或警告信息35显示于识别结果显示区域中24的画面例的图。
显示优先度计算部21判定是否显示了图11(a)所示的交叉路口引导显示、图11(b)所示的DSRC所获取的对向车辆接近的警告显示、步行者接近的警告显示、灾害信息显示等引导信息或警告信息。
显示优先度计算部21例如获取显示控制部14所生成的地图信息,在识别结果显示区域24所对应的范围内判断是否输出了交叉路口显示、警告显示等引导信息或警告信息。
另外,在规定为引导信息/警告信息的显示位置与识别结果显示区域24为相同位置的情况下,显示优先度计算部21从当前位置检测部4获取当前位置,使用该位置信息通过地图信息获取部12来确认地图信息存储部11中该位置上是否有引导信息即可,对于警告信息,向交通信息收发部5进行是否有警告信息的确认即可。
图12是表示引导信息/警告信息与识别结果的显示优先度调整量相对应的一个示例的表。
由于认为引导信息/警告信息相比其他信息而言对于用户的重要度要高,因而设定相比属于其他大项目的项目而言显示优先度的减少量要大的优先度调整量。
(8)“识别结果的内容和显示画面的关联性”
此处说明例如艺术家名、专辑名、歌曲标题名等语音识别对象与歌曲相关联的词汇的情况。在该情况下,若对这些词汇进行语音识别,则作为识别结果显示艺术家名的操作按钮、专辑名的操作按钮、歌曲名的操作按钮等,若用户按下该按钮则重放歌曲。
此时,在显示于显示部15的显示画面为AV画面(乐曲的重放画面)的情况下,可认为用户处于倾听音乐的状态,即使作为语音识别结果显示与重放歌曲相关联的操作按钮,也不会产生妨碍,而是处于用户希望利用该操作按钮来重放歌曲的状态,因此设定使识别结果的显示优先度变高的优先度调整量。
另一方面,在显示于显示部15的显示画面是通常的地图画面的情况下,在用户希望查看与道路引导相关的地图信息的状态下、显示有与歌曲重放相关的操作按钮来作为语音识别结果,此时考虑到会成为驾驶的妨碍,因此设定使识别结果的显示优先度降低的优先度调整量。
图13是表示相对于识别结果的内容与所显示的显示画面的组合的、识别结果的显示优先度调整量的一个示例的表。
如上所述,根据语音识别结果的内容、和实际显示于显示部15的显示画面的关联性,若识别结果对于当时的用户而言是较为重要的信息,则提高显示优先度以易于显示识别结果,若在识别结果此时对于用户并不重要的状态下,则设定使显示优先度降低从而难以显示识别结果的优先度调整量。
如上所述,对于上述大项目(1)至(8),显示优先度计算部21对作为预先确定的判定对象的项目的每个项目确定显示优先度调整量,并计算显示优先度。
识别结果输出控制部22确定对应于显示优先度计算部21所计算出的显示优先度的判定匹配度,并对语音识别部19进行设定。
然后,语音识别部19在识别结果的匹配度为该设定的判定匹配度以上(或大于判定匹配度)的情况下,输出该识别结果。
此处,判定匹配度和显示优先度具有相反的相关关系。图14是表示识别结果的显示优先度与判定匹配度的关系的图。
例如将Y设为判定匹配度,将X设为显示优先度,则判定匹配度是使用与显示优先度成比例地减少的函数“Y=-aX+b”(a、b为正常数)来确定的。在图14(a)所示的例子中,基于式“Y=-4X+700”来确定判定匹配度。
此外,如图14(b)所示,也可以基于显示优先度来阶梯性地减少判定匹配度。
然后,基于图14所示的显示优先度与判定匹配度之间的关系,识别结果输出控制部22能确定与显示优先度计算部21所计算出的显示优先度相对应的判定匹配度,并将其设定到语音识别部19。
由此,在显示优先度为规定值以下(或小于规定值)的情况下,由于设定于语音识别部19的规定的判定匹配度成为较高的值,因而成为不输出识别结果的状态。
此外,识别结果输出控制部22也可以基于显示优先度计算部21所计算出的显示优先度,来停止或重新开始语音识别部19的识别处理(在以下实施方式中也一样)。即,可以在显示优先度为规定值以下(或小于规定值)的情况下,停止语音识别部19的识别处理,在显示优先度为大于规定值的值(或规定值以上)的情况下,重新开始语音识别部19的识别处理。
接着,使用图15至图17的流程图来说明实施方式1的导航装置的处理。
图15是表示语音识别结果即操作按钮23的显示处理的流程图。
首先,语音获取部18获取由麦克风8收集的用户语音、即输入的音频,并利用PCM进行A/D转换(步骤ST01)。
接着,语音识别部19从由语音获取部18获取并进行了数字化后的音频信号中检测出符合用户所说内容的音频区间,提取出该音频区间的音频数据的特征量,基于该特征量参照语音识别词典20进行识别处理(步骤ST02)。
然后,语音识别部19对识别结果的匹配度是否在规定的判定匹配度以上(或大于规定的判定匹配度)进行判定(步骤ST03)。识别结果的匹配度在规定的判定匹配度以上(或大于规定的判定匹配度)的情况下(步骤ST03为“是”的情况),输出该识别结果(步骤ST04)。
之后,显示控制部14对显示部15输出指示,以使得在识别结果显示区域24上显示与语音识别部19所输出的识别结果相对应的操作按钮23(步骤ST05),使显示部15显示操作按钮23(步骤ST06)。
另一方面,在识别结果的匹配度小于规定的匹配度(或规定的匹配度以下)的情况下(步骤ST03为“否”的情况),返回步骤ST01的处理。
图16是操作按钮23显示后的处理的流程图。
控制部判定是否选择了所显示的操作按钮23(步骤ST11)。然后,在选择了操作按钮23的情况下(步骤ST11为“是”的情况),输出用于执行分配给所选择的操作按钮23的功能的指令,进行用于执行该功能的处理(步骤ST12)。
另一方面,在未选择操作按钮23的情况下(步骤ST11为“否”的情况),对于所显示的各操作按钮23,判定从显示开始经过的时间是否超过了规定时间(步骤ST13)。此外,若显示各个操作按钮23,则测量从显示该操作按钮开始经过的时间。
然后,在该测量时间超过规定时间的情况下(步骤ST13中为“是”),对显示控制部14输出指示,从而结束该操作按钮23的显示(步骤ST14)。
另一方面,在未超过规定时间的情况下(步骤ST13中为“否”的情况),返回步骤ST11,进行是否选择了操作按钮23的判定处理。
图17是表示判定匹配度的设定的处理的流程图。
首先,对于预先确定的或用户选择的大项目(上述项目(1)至(8)中的一个以上),显示优先度计算部21获取用于判定显示优先度所必需的信息(步骤ST31),基于所获取的信息和预先规定的优先度调整量,来计算显示优先度(步骤ST32)。
若举出具体的例子进行说明,则在将大项目(1)确定为判定对象的情况下,在步骤ST31中用于判定显示优先度所必需的信息是指本车位置信息、本车前进方向、识别结果显示区域24的位置、地图信息、交通信息(包含堵塞信息、施工信息等),显示优先度计算部21获取上述信息(步骤ST31)。
然后,例如图5所示那样参照本车前进方向上的信息与识别结果的显示优先度调整量的对应表,来确定显示优先度的调整量。
此处,参照图18举出具体例来进行说明。图18是表示在显示部15上显示了地图画面的状态下、因本车的前进方法与显示于识别结果显示区域的识别结果即操作按钮之间的关系而引起的画面迁移例的图。此处也将显示优先度的初始值设为50来进行说明。
图18(a)是与图4(d)相同的图,例如图18(a)所示,地图按照北基准进行显示,本车31的前进方向朝西,识别结果显示区域24设定在显示部15内的左侧时,由于识别结果显示区域24位于本车31的前进方向上,因而显示优先度计算部21参照图5的表将显示优先度的调整量确定为-30。
在该图18(a)的情况下,还在本车31的前进方向上显示有堵塞信息,因此显示优先度计算部21还基于图5的表来将显示优先度的调整量确定为-10。
其结果是,显示优先度计算部21计算出显示优先度=初始值50+调整量(-30)+调整量(-10)=10(步骤ST32)。
接着,识别结果输出控制部22确定对应于显示优先度计算部21所计算出的显示优先度的判定匹配度(步骤ST33),并对语音识别部19进行设定(步骤ST34)。
具体而言,识别结果输出控制部22基于图14(a)所示的曲线的计算式即判定匹配度Y=-4X+700(X是显示优先度),来计算相对于步骤ST32中由显示优先度计算部21所计算出的显示优先度的判定匹配度(步骤ST33)。其结果是,与显示优先度=10相对应的判定匹配度计算为660,将该判定匹配度设定为语音识别部19的规定的判定匹配度(步骤ST34)。
具体说明以下例子:即,在该状态下,以用户说出例如“便利店”时为例,说明识别结果的显示。首先,语音获取部18获取该“便利店”的音频,并利用例如PCM进行A/D转换(图15的步骤ST01)。接着,语音识别部19对所获取的音频进行识别处理,从而语音识别出“便利店”这一单词(步骤ST02)。此时,设该语音识别的匹配度为520。
在该情况下,语音识别部19判定为识别结果的匹配度520小于规定的判定匹配度660(步骤ST03为“否”的情况),不输出识别结果而返回步骤ST01的处理。
其结果是,显示部15上不显示识别结果即操作按钮23,而仍然显示图18(a)所示的显示画面的状态。
之后,如图18(b)所示,本车穿过堵塞区域并改变前进方向,成为向北方行驶的状态。在该情况下,由于识别结果显示区域24不在本车31的前进方向上,因而参照图5所示的本车的前进方向上的信息与识别结果的显示优先度调整量之间的对应表,其结果是将显示优先度的调整量确定为0。
其结果是,显示优先度计算部21计算出显示优先度=初始值50+调整量(0)=50(步骤ST32)。
然后,识别结果输出控制部22基于图14(a)所示的曲线的计算式即判定匹配度Y=-4X+700(X是显示优先度)来计算判定匹配度(步骤ST33)。其结果是,与显示优先度=50相对应的判定匹配度计算为500,将该判定匹配度设定为语音识别部19的规定的判定匹配度(步骤ST34)。
在该状态下,与上述所示的例子相同,在用户说出例如“便利店”的情况下,语音获取部18获取该“便利店”的音频,并使用例如PCM进行A/D转换(图15的步骤ST01)。接着,语音识别部19对所获取的音频进行识别处理,从而语音识别出“便利店”这一单词(步骤ST02)。此时,也同样设该语音识别的匹配度为520。
在该情况下,语音识别部19判定为识别结果的匹配度520为规定的判定匹配度500以上(步骤ST03为“是”的情况),输出该识别结果(步骤ST04)。
然后,显示控制部14对显示部15输出指示,从而使得在识别结果显示区域24上显示与语音识别部19所输出的“便利店”的识别结果所对应的操作按钮23(步骤ST05)。
其结果是,如图18(c)所示,显示部15显示“便利店”这一语音识别结果即操作按钮23(步骤ST06)。
如上所述,在本实施方式1中,在识别结果显示区域24位于本车的前进方向上的情况下,在识别结果显示区域24中存在用户顺路经过的可能性较高的设施种类图标所示的地点、或用户所设定的地点的情况下,或者在识别结果显示区域24中显示了引导信息/警告信息的情况下,通过使语音识别部19中的判定匹配度增加,从而减少识别结果的输出频率,另一方面,在不属于上述情况时,使判定匹配度减少,从而获得识别结果的输出频率增加这一结果。由此,在对于用户而言较为重要的信息被识别结果所隐藏的情况下,通过抑制识别结果的显示,从而减少其对用户获取较为重要信息的阻碍,另一方面,在判断为未隐藏重要信息的情况下,使语音中所包含的用户需求作为识别结果而变得易于显示,从而能提高便利性。
另外,在前进方向上显示有堵塞信息的情况下,认为用户需要地图信息,并进一步使语音识别的判定匹配度增加,从而能减少识别结果的输出频率,因而能进一步提高便利性。
而且,根据本车行驶用的道路、地域、地图的显示比例尺,判定为用户需要较多的地图信息或存在较多对于用户而言较为重要的信息的情况下,抑制识别结果的显示,从而减少其对用户获取较为重要信息的阻碍,另一方面,在上述情况以外的情况下,使语音中所包含的用户需求作为识别结果而变得易于显示,从而能提高便利性。
另外,组合上述(1)至(8)这多个大项目来计算显示优先度,从而能根据各种状况灵活地调整识别结果的输出频率。
此外,在该实施方式1中,说明了将显示优先度设为表示相对于语音识别结果(操作按钮23)以外的显示信息(例如地图信息等)要优先显示语音识别结果(操作按钮23)的程度,但是也可以将显示优先度设为表示相对于语音识别结果(操作按钮23)要优先显示语音识别结果(操作按钮23)以外的信息的程度。
在该情况下,对于与显示优先度计算部21所判定的项目相对应的显示优先度的增减量,其与上述增减量相反,显示优先度与识别结果判定匹配度具有正相关的关系(在以下实施方式中也一样)。
此外,显示优先度的计算可以始终进行,也可以隔开规定的间隔进行。
实施方式2
图19是表示本发明的实施方式2的语音处理部9的结构的一个示例的框图。对于与实施方式1中说明的相同结构,标注同一标号并省略重复说明。在以下所示的实施方式2中,与实施方式1相比,其不同点在于,还具有语音识别词典切换信息存储部25,语音识别词典20由多个语音识别词典1至N构成。另外,不同点在于,识别结果输出控制部22并不对语音识别部19设定与显示优先度相对应的判定匹配度,而是确定与显示匹配度相对应的语音识别词典名,从而切换语音识别词典20。
语音识别词典切换信息存储部25中将显示优先度和语音识别词典名与显示优先度相对应地进行存储。图20(a)是表示语音识别词典切换信息存储部25中所存储的显示优先度和语音识别词典名相对应的一个示例的表。另外,图20(b)是表示语音识别词典名和收纳于该词典中的识别单词数相对应的一个示例的表。
例如图20(b)所示,显示优先度、与对应的语音识别词典名的语音识别词典中所收纳的识别单词数之间具有正相关的关系。在将显示优先度设为表示相对于操作按钮23要优先显示操作按钮23以外的信息的程度的情况下,显示优先度、与对应的语音识别词典名的语音识别词典中所收纳的识别单词数之间具有负相关的关系。
识别结果输出控制部22参照语音识别词典切换信息存储部25来确定对应于显示优先度计算部21所输出的显示优先度的语音识别词典名,将语音识别部19所参照的语音识别词典20切换成具有该语音识别词典名的语音识别词典20。例如在显示优先度为10时,切换到语音识别词典名“Adic”的语音识别词典20,在显示优先度为50时,切换到语音识别词典名“Cdic”的词典。
接着,利用图21所示的流程图,对实施方式2的语音识别装置的处理进行说明。
步骤ST41和步骤ST42与实施方式1的步骤ST31和步骤ST32相同,因而省略说明。
识别结果输出控制部22参照语音识别词典切换信息存储部25来确定对应于显示优先度计算部21所输出的显示优先度的语音识别词典名(步骤ST43),将语音识别部19所参照的语音识别词典20切换成具有该语音识别词典名的语音识别词典20(步骤ST44)。
如上所述,根据该实施方式2,通过切换成对应于显示优先度的识别单词数的语音识别词典,从而能调整识别结果的输出频率,因此与实施方式1相同,能提高用户的便利性。
实施方式3
图22是表示实施方式3的语音处理部9的结构的一个示例的框图。对于与实施方式1中说明的相同结构,标注同一标号并省略重复说明。以下所示的实施方式3中,与实施方式1相比,还包括识别对象单词数确定部26和识别单词候补存储部27。另外,不同点在于,识别结果输出控制部22并不对语音识别部19设定与显示优先度相对应的判定匹配度,而是基于与显示优先度相对应的识别对象单词数来动态地生成语音识别词典20。
识别对象单词数确定部26确定与显示优先度计算部21所输出的显示优先度相对应的识别对象单词数。此处,显示优先度和识别对象单词数具有正相关的关系。图23是表示识别结果的显示优先度与识别对象单词数的关系的图。
例如将Y设为识别对象单词数,将X设为显示优先度,使用与显示优先度成比例地增加的函数“Y=cX+d”(c、d为正常数)来确定识别对象单词数。在图23(a)所示的例子中,基于式“Y=0.2X+10”来确定识别对象单词数。”
此外,如图23(b)所示,也可以基于显示优先度来阶梯性地增加识别对象单词数。
在将显示优先度设为表示相对于操作按钮23而要优先显示操作按钮23以外的信息的程度的情况下,显示优先度、与对应的识别对象单词数之间具有负相关的关系。
识别单词候选存储部27中存储有识别对象候补的单词读法与识别顺序。
识别顺序表示被后述的识别结果输出控制部22选中的容易性,识别顺序越小则越容易被选中。图24是表示识别单词候补存储部27中所存储的识别对象候补的单词的读法与识别顺序相对应的一个示例的表。
此处仅对识别顺序越小则越容易被选中的情况进行说明,但也可以是识别顺序越小则越不易被选中,几乎不显示操作按钮23的情况。识别顺序可以固定,也可是不存储识别顺序。
也可以存储识别出每个单词的次数来代替识别顺序,该次数越多则越容易被选择,该次数越少则越不易被选择。
此外,在该情况下,只要具有识别次数设定部(未图示)即可,该识别次数设定部将语音识别部19输出的识别结果作为检索关键词,对识别单词候补存储部27进行检索,并增加相一致的单词所对应的识别次数。
识别结果输出控制部22从识别单词候补存储部27中按照识别顺序从小到大的顺序或按照识别次数从多到少的顺序,来依次获取识别对象单词数确定部26所确定的单词数的单词的读法。然后,使用所获得的单词的读法来动态地生成语音识别词典20。
在识别单词候补存储部27中未存储有识别顺序的情况下,也可以随机获取识别对象单词数确定部26所确定的单词数的单词读法。
接着,利用图25所示的流程图,对实施方式3的语音识别装置的处理进行说明。
步骤ST51和步骤ST52与实施方式1的步骤ST31和步骤ST32相同,因而省略说明。
识别对象单词数确定部26确定与显示优先度计算部21所输出的显示优先度相对应的识别对象单词数(步骤ST53)。然后,识别结果输出控制部22从识别单词候补存储部27中按照识别顺序从小到大的顺序,来依次获取识别对象单词数确定部26所确定的单词数的单词的读法(步骤ST54),使用所获取的单词读法来生成语音识别词典(步骤ST55)。
如上所述,根据该实施方式3,通过动态地生成对应于显示优先度的识别单词数的语音识别词典,从而能调整识别结果的输出频率,因此与实施方式1相同,能提高用户的便利性。
实施方式4
在上述实施方式1至3中,以将本发明的语音识别装置适用于安装在车辆等移动体上的导航装置中的情况为例进行了说明,但是所适用的并不限于车辆用导航装置,也可以是包含人、车辆、铁路、船舶或航空器等移动体用的导航装置,也可以适用于语音识别***的伺服器或导航***的伺服器。另外,也能适用于例如安装在智能手机、平板电脑、移动电话等携带信息终端等语音识别***的应用或导航***的应用等形式的***中。
图26是表示本发明实施方式4所涉及的导航***的概要的图。该导航***能具有以下各种形式:例如车载装置100协同智能电话等移动信息终端101及伺服器102中的至少一方来进行语音识别处理和导航处理,或由智能电话等移动信息终端101及伺服器102中的至少一方来进行语音识别处理和导航处理,并使车载装置100显示识别结果、地图信息等。以下说明该导航***的结构形态。
在实施方式1至3中,说明了图26所示的车载装置100具有本发明的语音识别装置的所有功能的情况,但是本实施方式4的导航***中说明了以下情况:即,伺服器102进行语音识别处理,将该识别结果显示于车载装置100,从而提供给用户;以及移动信息终端101协同伺服器102进行语音识别处理,并将该识别结果显示于车载装置100,从而提供给用户。
首先,说明伺服器102进行语音识别处理,并将该识别结果显示于车载装置100的情况,即,说明协同具有语音识别功能的伺服器102,车载装置100作为显示装置起作用的情况。
在该结构中,认为车载装置100与伺服器102进行直接通信或车载装置100经由移动信息终端101与伺服器102进行通信。伺服器102作为具有上述实施方式1至3中所说明的语音处理部9的语音识别装置起作用。另外,车载装置100作为至少具有用于将伺服器102的识别结果提供给用户的显示部15的显示装置起作用。
在该情况下,车载装置100仅具有基本的通信功能和显示功能,接收伺服器102的语音识别结果并提供给用户。
即,伺服器102是具有显示部15以外的部件的语音识别装置,该语音识别装置即伺服器102对用户说出的语音进行识别并将识别结果显示于显示装置即车载装置100。
根据以上的结构,也能获得与实施方式1至3相同的效果。
另外,说明移动信息终端101协同伺服器102进行语音识别处理,并由车载装置100将该识别结果提供给用户的情况。
在该结构中,考虑到车载装置100经由移动信息终端101与伺服器102进行通信的情况,移动信息终端101的应用协同伺服器102进行语音识别处理。车载装置100作为至少具有用于将移动信息终端101和伺服器102的识别结果提供给用户的显示部15的显示装置来起作用。
即使在该情况下,车载装置100仅具有基本的通信功能和显示功能,接收移动信息终端101协同伺服器102获得的语音识别结果并提供给用户。
即,利用移动信息终端101的应用将对用户说出的语音进行识别所得到的识别结果显示于显示装置即车载装置100。
根据以上的结构,也能获得与实施方式1至3相同的效果。
本申请发明在其发明的范围内可以将各实施方式自由组合,或者对各实施方式的任意构成要素进行变形,或者在各实施方式中省略任意构成要素。
产业上的应用
本发明的语音识别装置能够适用于搭载在车辆等移动体的导航装置,车载信息提供***的伺服器,安装在智能手机、平板电脑、移动电话等移动信息终端等上的导航***的应用等中。
标号说明
1  控制部
2  GPS接收机
3  自主巡航传感器
4  当前位置检测部
5  交通信息收发部
6  路径计算部
7  指引引导部
8  麦克风
9  语音处理部
10  语音合成部
11  地图信息存储部
12  地图信息获取部
13  指示输入部
14  显示控制部
15  显示部(显示器)
16  语音控制部
17  扬声器
18  语音获取部
19  语音识别部
20  语音识别辞典
21  显示优先度计算部
22  识别结果输出控制部
23  操作按钮(识别结果)
24  识别结果显示区域
25  语音识别词典切换信息存储部
26  识别对象单词数确定部
27  识别单词候补存储部
31  本车
32  堵塞信息的显示
33  设施图标
24  引导显示
35  警告显示
100  车载装置
101  携带信息终端
102  伺服器。

Claims (18)

1.一种语音识别装置,
识别用户说出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的语音数据,基于规定的判定匹配度来输出识别结果;
显示部,该显示部输出所述语音识别部所输出的识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示部的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;以及
识别结果输出控制部,该识别结果输出控制部确定与所述显示优先度计算部计算出的显示优先度所对应的判定匹配度,并对所述语音识别部设定该判定匹配度以作为所述规定的判定匹配度。
2.一种语音识别装置,
识别用户说出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照多个语音识别词典中的一个,来识别所述语音获取部所获取的语音数据,基于规定的判定匹配度来输出识别结果;
显示部,该显示部显示由所述语音识别部所输出的识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示部的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;
语音识别词典切换信息存储部,该语音识别词典切换信息存储部将所述显示优先度、和与其对应的语音识别词典的名称即语音识别词典名相对应地进行存储;以及
识别结果输出控制部,该识别结果输出控制部参照所述语音识别词典切换信息存储部,获取与所述显示优先度计算部所计算出的显示优先度相对应的所述语音识别词典名,从而将所述语音识别部所参照的语音识别词典切换成所获取的语音识别词典名的语音识别词典。
3.一种语音识别装置,
识别用户说出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的语音数据,基于规定的判定匹配度来输出识别结果;
显示部,该显示部输出所述语音识别部所输出的识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示部的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;
识别对象单词数确定部,该识别对象单词数确定部基于所述显示优先度计算部所计算出的显示优先度来确定所述语音识别部中成为识别对象的单词数;
识别单词候补存储部,该识别单词候补存储部存储所述语音识别部中成为识别对象的单词的读法;以及
识别结果输出控制部,该识别结果输出控制部从所述识别单词候补存储部中获取所述识别对象单词数确定部所确定的单数词的单词,并使用所获取的单词来生成所述语音识别词典。
4.如权利要求3所述的语音识别装置,其特征在于,
所述识别单词候补存储部与所述单词的读法相对应地存储识别顺序,
所述识别结果输出控制部基于所述识别顺序来从所述识别单词候补存储部中获取所述单词的读法。
5.如权利要求3所述的语音识别装置,其特征在于,
所述识别单词候补存储部与所述单词的读法相对应地存储识别次数,
还具有识别次数设定部,该识别次数设定部将所述语音识别部所输出的识别结果作为检索关键词来检索所述识别单词候补存储部,并增加与相一致的单词的读法所对应的识别次数,
所述识别结果输出控制部基于所述识别次数来从所述识别单词候补存储部中获取所述单词的读法。
6.如权利要求1所述的语音识别装置,其特征在于,
所述识别结果输出控制部基于所述显示优先度计算部所计算出的显示优先度来停止或重新开始所述语音识别部的识别处理。
7.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述显示部所显示的所述移动体的前进方向与所述识别结果显示区域的位置关系,来计算所述显示优先度。
8.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述识别结果显示区域中所述地图上的交通信息的显示状况来计算所述显示优先度。
9.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述识别结果显示区域中所述地图上的图标的显示状况来计算所述显示优先度。
10.如权利要求9所述的语音识别装置,其特征在于,
所述显示优先度计算部使所述识别结果显示区域中显示了所述图标的情况下的所述显示优先度低于未显示所述图标的情况下的所述显示优先度。
11.如权利要求9所述的语音识别装置,其特征在于,
所述显示优先度计算部计算所述显示优先度,从而使得所述识别结果显示区域上所显示的所述图标的个数与所述显示优先度具有负相关的关系。
12.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述移动体行驶中的道路类别来计算所述显示优先度。
13.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述移动体行驶中的地域类别来计算所述显示优先度。
14.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述显示部上所显示的地图的显示比例尺来计算所述显示优先度。
15.如权利要求1所述的语音识别装置,其特征在于,
所述语音识别装置适用于在所述显示部显示地图并进行移动体的道路引导的导航装置,
所述显示优先度计算部基于所述识别结果显示区域中所述地图上的引导/警告显示的显示状况来计算所述显示优先度。
16.如权利要求1所述的语音识别装置,其特征在于,
所述显示优先度计算基于所述识别结果显示区域所显示的识别结果的内容与所述显示部所显示的显示画面之间的关联性,来计算所述显示优先度。
17.一种语音识别装置,
识别用户说出的语音并将识别结果显示于显示装置,其特征在于,包括:
语音获取部,该语音获取部获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的语音数据,基于规定的判定匹配度来输出识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示装置的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;以及
识别结果输出控制部,该识别结果输出控制部确定与所述显示优先度计算部计算出的显示优先度相对应的判定匹配度,并对所述语音识别部设定该判定匹配度以作为所述规定的判定匹配度。
18.一种显示方法,
是语音识别装置识别用户说出的语音并将识别结果显示于显示装置的显示方法,其特征在于,包括:
语音获取部获取所述用户所说出的语音的步骤;
语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的语音数据,并基于规定的判定匹配度来输出识别结果的步骤;
显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示装置的规定的识别结果显示区域的步骤;
显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度的步骤;以及
识别结果输出控制部确定与所述显示优先度计算部计算出的显示优先度相对应的判定匹配度,并对所述语音识别部设定该判定匹配度以作为所述规定的判定匹配度的步骤。
CN201380070047.9A 2013-01-09 2013-01-09 语音识别装置及显示方法 Expired - Fee Related CN104919278B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/050203 WO2014109017A1 (ja) 2013-01-09 2013-01-09 音声認識装置および表示方法

Publications (2)

Publication Number Publication Date
CN104919278A true CN104919278A (zh) 2015-09-16
CN104919278B CN104919278B (zh) 2017-09-19

Family

ID=51166688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380070047.9A Expired - Fee Related CN104919278B (zh) 2013-01-09 2013-01-09 语音识别装置及显示方法

Country Status (5)

Country Link
US (1) US9639322B2 (zh)
JP (1) JP5921722B2 (zh)
CN (1) CN104919278B (zh)
DE (1) DE112013006384T5 (zh)
WO (1) WO2014109017A1 (zh)

Families Citing this family (134)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
CN113470640B (zh) 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
DE112013007103T5 (de) * 2013-05-21 2016-03-03 Mitsubishi Electric Corporation Spracherkennungssystem, Erkennungsergebnis-Anzeigevorrichtung und Anzeigeverfahren
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
WO2014200728A1 (en) 2013-06-09 2014-12-18 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10163435B2 (en) * 2013-09-11 2018-12-25 Denso Corporation Voice output control device, voice output control method, and recording medium
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10008204B2 (en) * 2014-06-30 2018-06-26 Clarion Co., Ltd. Information processing system, and vehicle-mounted device
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US11199962B2 (en) * 2015-04-27 2021-12-14 Shane Venis Freehand memo image authentication
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
JP6516585B2 (ja) * 2015-06-24 2019-05-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御装置、その方法及びプログラム
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
JP6608199B2 (ja) * 2015-07-07 2019-11-20 クラリオン株式会社 情報システムおよびコンテンツ開始方法
KR102505347B1 (ko) * 2015-07-16 2023-03-03 삼성전자주식회사 사용자 관심 음성 알림 장치 및 방법
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) * 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770411A1 (en) 2017-05-15 2018-12-20 Apple Inc. MULTI-MODAL INTERFACES
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
WO2019089108A1 (en) 2017-11-06 2019-05-09 Google Llc Methods and systems for attending to a presenting user
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
JP7334420B2 (ja) * 2019-02-21 2023-08-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
US11061958B2 (en) 2019-11-14 2021-07-13 Jetblue Airways Corporation Systems and method of generating custom messages based on rule-based database queries in a cloud platform
US20230169959A1 (en) * 2019-12-11 2023-06-01 Google Llc Processing concurrently received utterances from multiple users
KR20210133600A (ko) * 2020-04-29 2021-11-08 현대자동차주식회사 차량 음성 인식 방법 및 장치
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11183193B1 (en) 2020-05-11 2021-11-23 Apple Inc. Digital assistant hardware abstraction
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
US12027163B2 (en) * 2020-07-27 2024-07-02 Samsung Electronics Co., Ltd. Electronic device and operation method thereof
CN113436628A (zh) * 2021-08-27 2021-09-24 广州小鹏汽车科技有限公司 语音交互方法、装置、***、交通工具及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171305A (ja) * 2004-12-15 2006-06-29 Nissan Motor Co Ltd ナビゲーション装置およびナビゲーション装置における音声認識による情報の検索方法
CN1942875A (zh) * 2004-04-12 2007-04-04 松下电器产业株式会社 对话支援装置
US20070101290A1 (en) * 2005-10-31 2007-05-03 Denso Corporation Display apparatus
JP2007286358A (ja) * 2006-04-17 2007-11-01 Xanavi Informatics Corp ナビゲーション装置及びその住所入力方法
CN101410790A (zh) * 2006-03-24 2009-04-15 日本电气株式会社 文本显示设备、文本显示方法及程序
CN101460995A (zh) * 2006-02-07 2009-06-17 日本电气株式会社 监测设备、评估数据选择设备、代理评估设备、代理评估***以及程序
CN101616221A (zh) * 2008-06-25 2009-12-30 富士通株式会社 引导信息显示装置及引导信息显示方法
WO2010061751A1 (ja) * 2008-11-25 2010-06-03 旭化成株式会社 重み係数生成装置、音声認識装置、ナビゲーション装置、車両、重み係数生成方法、及び重み係数生成プログラム
US20100198093A1 (en) * 2009-02-03 2010-08-05 Denso Corporation Voice recognition apparatus, method for recognizing voice, and navigation apparatus having the same

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4816409B2 (ja) * 2006-01-10 2011-11-16 日産自動車株式会社 認識辞書システムおよびその更新方法
JP2007303878A (ja) 2006-05-09 2007-11-22 Denso Corp ナビゲーション装置
JP4736982B2 (ja) 2006-07-06 2011-07-27 株式会社デンソー 作動制御装置、プログラム
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
JP2008180786A (ja) 2007-01-23 2008-08-07 Sanyo Electric Co Ltd ナビゲーションシステムおよびナビゲーション装置
JP5012123B2 (ja) 2007-03-22 2012-08-29 株式会社Jvcケンウッド ナビゲーション装置、制御方法及びプログラム
JP2010205130A (ja) * 2009-03-05 2010-09-16 Denso Corp 制御装置
JP2011091617A (ja) * 2009-10-22 2011-05-06 Denso Corp 車両用データ通信装置
JP5340418B2 (ja) * 2009-12-24 2013-11-13 三菱電機株式会社 ナビゲーション装置
JP5496947B2 (ja) * 2011-05-27 2014-05-21 株式会社Nttドコモ 機能提示システム、端末装置及びプログラム
DE112011105833B4 (de) * 2011-11-10 2019-07-04 Mitsubishi Electric Corp. Navigationsvorrichtung, Navigationsverfahren und Navigationsprogramm
JP5845860B2 (ja) * 2011-12-01 2016-01-20 株式会社デンソー 地図表示操作装置
JP6094399B2 (ja) * 2013-06-24 2017-03-15 株式会社デンソー ヘッドアップディスプレイ、及びプログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1942875A (zh) * 2004-04-12 2007-04-04 松下电器产业株式会社 对话支援装置
JP2006171305A (ja) * 2004-12-15 2006-06-29 Nissan Motor Co Ltd ナビゲーション装置およびナビゲーション装置における音声認識による情報の検索方法
US20070101290A1 (en) * 2005-10-31 2007-05-03 Denso Corporation Display apparatus
CN101460995A (zh) * 2006-02-07 2009-06-17 日本电气株式会社 监测设备、评估数据选择设备、代理评估设备、代理评估***以及程序
CN101410790A (zh) * 2006-03-24 2009-04-15 日本电气株式会社 文本显示设备、文本显示方法及程序
JP2007286358A (ja) * 2006-04-17 2007-11-01 Xanavi Informatics Corp ナビゲーション装置及びその住所入力方法
CN101616221A (zh) * 2008-06-25 2009-12-30 富士通株式会社 引导信息显示装置及引导信息显示方法
WO2010061751A1 (ja) * 2008-11-25 2010-06-03 旭化成株式会社 重み係数生成装置、音声認識装置、ナビゲーション装置、車両、重み係数生成方法、及び重み係数生成プログラム
US20100198093A1 (en) * 2009-02-03 2010-08-05 Denso Corporation Voice recognition apparatus, method for recognizing voice, and navigation apparatus having the same

Also Published As

Publication number Publication date
US9639322B2 (en) 2017-05-02
JPWO2014109017A1 (ja) 2017-01-19
JP5921722B2 (ja) 2016-05-24
DE112013006384T5 (de) 2015-09-24
US20150331664A1 (en) 2015-11-19
CN104919278B (zh) 2017-09-19
WO2014109017A1 (ja) 2014-07-17

Similar Documents

Publication Publication Date Title
CN104919278A (zh) 语音识别装置及显示方法
CN105008859A (zh) 语音识别装置及显示方法
CN100529670C (zh) 用于模拟引导路径的导航器及其工作方法
US9562787B2 (en) Travel guidance device, travel guidance method, and computer program
WO2016159171A1 (ja) 自動運転支援システム、自動運転支援方法及びコンピュータプログラム
US20130282264A1 (en) Systems and methods for obtaining and using traffic flow information
US9644985B2 (en) Navigation device that evaluates points of interest based on user utterance
US9829336B2 (en) Server for navigation, navigation system, and navigation method
CN105246743A (zh) 语音识别装置、识别结果显示装置及显示方法
JP2002236029A (ja) 音声案内装置
CN101438133A (zh) 具适应性导航指令的导航装置
US20200294092A1 (en) System and method for providing content to a user based on a predicted route identified from audio or images
CN103528592A (zh) 一种导航方法、装置及设备
WO2017015882A1 (en) Navigation device and navigation method
CN101825472A (zh) 导航装置和导航方法
CN101033977B (zh) 导航仪的语音导航方法
WO2008001620A1 (fr) dispositif de navigation, procédé de navigation et programme informatique
JP5401777B2 (ja) 情報提供装置、情報提供方法、ならびに、プログラム
US7912636B2 (en) Apparatus and program for navigation
JPH01119898A (ja) 車載型ナビゲーション装置
JP3283359B2 (ja) 音声対話式ナビゲーション装置
JP4778831B2 (ja) 走行支援装置、走行支援方法、走行支援プログラムおよびコンピュータに読み取り可能な記録媒体
JP2020190467A (ja) 交通情報提供システム、交通情報提供装置及びコンピュータプログラム
JP2020159803A (ja) 情報提供システム、及び情報提供プログラム
JP2011027690A (ja) ナビゲーション装置

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170919

Termination date: 20220109