CN203340238U - 图像处理设备 - Google Patents

图像处理设备 Download PDF

Info

Publication number
CN203340238U
CN203340238U CN2013200297023U CN201320029702U CN203340238U CN 203340238 U CN203340238 U CN 203340238U CN 2013200297023 U CN2013200297023 U CN 2013200297023U CN 201320029702 U CN201320029702 U CN 201320029702U CN 203340238 U CN203340238 U CN 203340238U
Authority
CN
China
Prior art keywords
voice
server
voice command
speech
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2013200297023U
Other languages
English (en)
Inventor
李周瑛
朴相信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120115783A external-priority patent/KR20140039946A/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of CN203340238U publication Critical patent/CN203340238U/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

提供一种图像处理设备。所述图像处理设备包括:图像处理器,处理从外部传输的广播信号,以基于处理的广播信号显示图像;通信单元,与服务器连接以进行通信;语音输入单元,接收用户的言语;语音处理器,根据与语音输入单元接收的所述言语相应的语音命令处理预设的相应操作的执行;和控制器,如果所述言语通过语音输入单元被输入,则通过语音处理器和服务器之一处理与所述言语相应的语音命令,其中,如果语音命令包括与广播频道的呼号有关的关键词,则控制器控制语音处理器和服务器之一根据预定的选择条件选择与所述关键词相应的推荐呼号,并且根据所述语音命令针对推荐呼号的广播频道执行相应的操作。

Description

图像处理设备
技术领域
与示例性实施例相符的设备涉及一种处理诸如自外部提供的广播信号的图像信号以基于处理的图像信号显示图像的图像处理设备,更具体地讲,涉及一种用于识别用户的语音命令以执行与语音命令相应的功能或操作的图像处理设备。
背景技术
图像处理设备根据各种图像处理操作,处理自外部提供的图像信号/图像数据。图像处理设备可基于处理的图像信号在其显示面板上显示图像,或者可将处理的图像信号输出给具有面板的另一显示设备,以基于处理的图像信号显示图像。也就是说,只要图像处理设备可处理图像信号,它可以包括或者不包括面板来显示图像。可将前种情形实现为TV,而将后种情形实现为机顶盒。
图像处理设备持续地被添加功能,扩展其功能以符合技术的发展。在这种趋势下,提供各种配置和方法来按需将用户的命令输入到图像处理设备。例如,在传统的图像处理设备中,如果用户从遥控器按下键/按钮,则控制信号被发送给图像处理设备,以按照用户的需要执行操作。但是,近年来,图像处理设备检测用户的动作或言语,分析检测到的内容,并且执行相应的操作,也就是,图像处理设备通过反映用户的意图被控制。
实用新型内容
技术问题
一个或多个示例性实施例提供一种用于最小化用于识别用户的命令以及执行操作的电子装置。
技术方案
可通过提供一种图像处理设备来实现上述和/或其他方面,所述图像处理设备包括:图像处理器,被连接到控制器,处理从外部传输的广播信号,以基于处理的广播信号显示图像;通信单元,被连接到控制器,与服务器连接以进行通信;语音输入单元,被连接到控制器,接收用户的言语;语音处理器,被连接到控制器,根据与语音输入单元接收的所述言语相应的语音命令处理预设的相应操作的执行;和控制器,其分别与图像处理器、通信单元、语音输入单元、语音处理器连接,如果通过语音输入单元言语被输入,则控制器通过语音处理器和服务器之一处理与所述言语相应的语音命令,其特征在于,如果语音命令包括与广播频道的呼号有关的关键词,则控制器控制语音处理器和服务器之一根据预定的选择条件选择与所述关键词相应的推荐呼号,并且根据所述语音命令针对推荐呼号的广播频道执行相应的操作。
与关键词相应的至少一个候选呼号的数据库可被存储在图像处理设备中和服务器中,并且推荐呼号可根据所述选择条件从自数据库搜索到的多个候选呼号被选择。
所述选择条件可包括将候选呼号选择为推荐呼号,推荐呼号的选择频率可以是基于图像处理设备的使用历史信息,多个候选呼号当中预设的排名或更高排名。
所述选择条件可包括将候选呼号选择为推荐呼号,推荐呼号的选择频率可以是多个候选呼号当中,在与服务器通信的多个其他图像处理设备中预设的排名或更高排名。
所述推荐呼号可以是从多个候选呼号选择的一个或多个呼号,并且如果多个候选呼号被选择,则控制器可显示被提供以选择多个候选呼号之一的用户界面UI。
如果在UI被显示后的预设时间内,选择候选呼号之一的输入没有被执行,则控制器可根据预设的选择条件选择推荐呼号之一。
通信单元可与将言语转换为文本的语音命令的言语到文本STT服务器通信,并且在所述言语被输入给语音输入单元后,控制器可将所述言语的语音信号发送给STT服务器,并且从STT服务器接收与所述言语相应的语音命令。
如果语音命令是短句,则控制器可控制语音处理器处理所述语音命令,并且如果所述语音命令是交谈语句,则控制器可控制服务器处理所述语音命令。
所述的图像处理设备可还包括:显示单元,基于图像处理器处理的广播信号在其上显示图像。
技术效果
根据本发明的图像处理设备可对用户输入的语音执行识别和处理,并且根据识别出的命令执行相应的操作,并且根据识别的结果(如长语句),可通过外部的服务器执行语音命令的处理,从而最小化图像处理设备针对语音输入的命令的操作。
附图说明
通过参照附图对示例性实施例进行的以下描述,上述和/或其他方面将会变得明显并且更容易被理解,其中:
图1是根据第一实施例的显示设备的框图;
图2示出与关键词和候选呼号有关的数据库的结构的示例;
图3是示出图1中的显示设备和服务器的交互结构的框图;
图4示出图3中的显示设备和服务器之间的交互处理的示例;
图5和图6示出在图1中的显示设备中被提供以选择多个推荐呼号之一的用户界面(UI)图像的示例;
图7示出根据第二实施例的在显示设备和服务器之间的交互处理的示例;
图8是根据第三实施例的显示设备和服务器的交互结构的框图;
图9示出在图8的显示设备和服务器之间的交互处理;
图10是示出根据第四实施例的显示设备的语音处理器的信号传输结构的框图。
具体实施方式
以下,将参照附图详细地描述示例性实施例,从而具有本领域一般只是的人可容易地实现所述示例性实施例。可通过各种形式实施所述示例性实施例,而不限于在此阐述的示例性实施例。为了清楚起见,省略对公知部件的描述,并且贯穿全文,相同的标号表示相同的元件。
图1是根据第一实施例的图像处理设备100的框图。
以下实施例解释可自身显示图像的图像处理设备100,但是本实用新型的构思可应用于自身不显示图像,而是将图像信号/控制信号输出给另一显示设备的其他装置。因此,本实用新型的构思不限于以下实施例。当前实施例解释被实现为TV的图像处理设备100,图像处理设备100的实施例可不同。
如图1所示,根据当前实施例的图像处理设备100或显示设备100从图像供应源(未示出)接收图像信号。可通过显示设备100接收的图像信号不受限于类型或特性,例如,显示设备100可接收广播站的传输设备(未示出)传输的广播信号,对所述广播信号进行调谐,并且显示广播图像。
显示设备100包括用于从图像供应源(未示出)接收图像信号的图像接收器110、用于根据预设的图像处理操作处理图像接收器110接收的图像信号的图像处理器120、用于基于图像处理器120处理的图像信号在其上显示图像的显示单元130、用于与外部装置(如服务器10)通信的通信单元140、被用户操纵的用户输入单元150、从外部接收语音或声音的语音输入单元160、用于解释并处理输入到语音输入单元160的语音/声音的语音处理器170、用于存储数据/信息的存储单元180和用于控制显示设备100的总体操作的控制器190。图像接收器110、图像处理器120、显示单元130、通信单元140、用户输入单元150、语音输入单元160和语音处理器170分别被连接到控制器190。
图像接收器110以有线或无线的方式接收图像信号/图像数据,并且将所述图像信号/图像数据发送给图像处理器120。图像接收器110根据接收的图像信号的标准以及显示设备100的实施类型可不同。例如,图像接收器110可接收射频(RF)信号或根据标准(诸如,复合视频、分量视频、超级视频、SCART、高清晰多媒体接口(HDMI)、显示端口(DisplayPort)、统一视频接口(UDI)或无线HD标准)的图像信号。如果图像信号是广播信号,则图像接收器110包括用于对每个频道的广播进行调谐的调谐器。
图像处理器120根据各种图像处理操作处理图像接收器110接收的图像信号。图像处理器120将处理的图像信号输出给显示单元130,在显示单元130上显示基于处理的图像信号的图像。例如,如果广播信号在图像接收器10中被调谐为特定频道,则图像处理器120从与所述频道相应的广播信号提取图像、语音和附加数据,将所述图像信号调整为预设的分辨率,并且在显示单元130上显示图像。
图像处理器120的图像处理操作可包括,但不限于,与图像数据的图像格式相应的解码操作、用于将交织图像数据转换为渐进图像数据的解交织操作、用于将图像数据调整为预设的分辨率的缩放操作、用于提高图像品质的去噪操作、细节增强操作、帧刷新率转换等。
图像处理器120被实现为集成前述功能的片上***(SOC)或实现为图像处理板(未示出),其中,所述图像处理板通过将单独元件安装在印刷电路板(PCB)(未示出)上以执行前述图像处理操作来形成并且安装在显示设备100中。
显示单元130基于图像处理器120输出的图像信号在其上显示图像。显示单元130可被实现为包括,但不限于,液晶、等离子、发光二极管(LED)、有机发光二极管(OLED)、表面传导电子发射器、碳纳米管和纳米晶的各种显示面板。
显示单元130还可根据其实施类型包括附加元件。例如,作为LCD的显示单元130可包括LCD面板(未示出)、将光发射到LCD面板上的背光单元(未示出)以及用于驱动LCD面板的面板驱动基板(未示出)。
通信单元140发送和接收用于在显示设备100和服务器10之间交互通信的数据。通信单元140根据服务器10的通信协议,通过有线/无线广域网/局域网或本地连接与服务器10连接。
用户输入单元150通过用户的操纵和输入将预设的各种控制命令或信息发送给控制器190。用户输入单元150被实现为菜单键或安装在显示设备100的外部部件中的输入面板,或者被实现为与显示设备100分离/分开的遥控器。否则,可在显示单元130中集成地形成用户输入单元150。如果显示单元130是触摸屏,则用户可触摸显示在显示单元130上的输入菜单(未示出),以将预设的命令发送给控制器190。
语音输入单元160被实现为麦克风,并且检测从显示设备100的外部环境产生的各种声音。语音输入单元160检测到的声音包括用户的言语以及由用户以外的各种因素产生的其他声音。
在显示设备100执行的各种预设的处理中,语音处理器170处理输入到语音输入单元160的语音/声音。由语音处理器170处理的“语音”是指输入到语音输入单元160的语音。当图像处理器120处理的图像信号包括语音数据时,图像处理器120处理的其中的图像数据。
如果语音/声音被输入到语音输入单元160,则语音处理器170确定输入的语音/声音是用户的言语所致还是被其他因素产生。该确定可使用各种配置,并且不能够被指定,例如,所述确定包括确定输入的语音/声音落入与人的语音相应的波长/频段的方法,或者确定输入的语音/声音落入事先指定的用户语音资料的方法。
如果确定用户的言语已经被输入,则语音处理器170根据与所述言语相应的语音命令,执行预设的相应操作。语音命令是指用户说出的内容。稍后将详细地对此进行描述。
存储单元180在控制器190的控制下,在其中存储未限制的数据。存储单元180被实现为如闪存或硬盘驱动器的非易失性存储器。存储单元180被控制器190、图像处理器120或语音处理器170访问,并且在其中存储的数据可被控制器190、图像处理器120或语音处理器170读取/写入/修改/删除/更新。
在通过语音输入单元160接收到用户的言语后,控制器190控制语音处理器170处理输入的言语。当图像处理器120处理图像接收器110接收的图像信号以在显示单元130上显示广播图像时,如果通过语音输入单元160接收到用于命令改换频道的用户言语,则控制器190根据用户言语的内容改换频道。
与“改换频道”有关的语音命令可包括说出用户期望的广播频道的频道号或说出期望的广播频道的呼号。频道号和呼号是事先同意用于将一频道与其他频道区分开的表达。以正的数字(如6、7和11)表达频道号。
呼号是提供特定频道的提供商的ID,并且通常是广播所述频道的广播站的识别名。单个频道的呼号可以是多个,并且如果单个广播站提供多个频道,则各个频道具有不同的呼号以区分它们自己。
前种情形的示例如下:如果预定第一频道的呼号是“KBS”,则呼号“Korean Broadcasting System(韩国广播公司)”与“KBS”一样地称作第一频道。在一个地域中的预定第二频道的呼号是“MBC”,但是在另一地域中第二频道的呼号可能是“TNN”。也就是说,特定频道的呼号可能是多个,而不是单个。
后种情形的示例如下:具有呼号“KBS”的广播站可向预定的第三频道和第四频道提供广播信号。在这种情况下,第三频道的呼号是“KBS-1”,而第四频道的呼号是“KBS-2”,它们彼此不同。可将“KBS”认作广播站的代表呼号,并且“KBS-1”和“KBS-2”是“KBS”的从属呼号。也就是说,呼号“KBS”与第三频道和第四频道都有关。
因此,如果通过语音输入单元160输入的用户言语是语音命令“播放KBS”,则可能不清楚第三频道“KBS-1”和第四频道“KBS-2”中的哪个被指示。
根据本实施例,控制器190确定与用户的言语相应的语音命令是否包括与广播频道的呼号有关的关键词。
如果确定语音命令包括与呼号有关的关键词,则控制器190控制语音处理器170从包括多个呼号的数据库搜索与所述关键词相应的呼号。数据库被存储在存储单元180中,并且搜索到的呼号被称作候选呼号。如果搜索到与所述关键词相应的多个候选呼号,则控制器190根据预设的选择条件从多个候选呼号选择推荐呼号。
否则,控制器190可将关键词和语音命令发送给存储所述数据库的服务器10。然后,服务器10根据类似于前面解释的原则选择推荐呼号,根据语音命令分析相应的操作,并且根据选择和分析结果向显示设备100发送控制信号。
控制器190根据语音命令,针对选择的推荐呼号的广播信号执行相应的操作。
其后,将参照图2描述数据库200的结构以及从数据库200搜索候选呼号230的方法。
图2示出数据库200的示例。
如在图2中所示,控制器190确定从用户的言语改变为文本的语音命令“播放KBS”是否包括与呼号有关的关键词。如果存储单元180在其中存储映射关键词和呼号的关系数据库200,则控制器190可从数据库200搜索预定的关键词,并且确定所述关键词是否与呼号有关。
数据库200映射多个关键词220和多个呼号230,并且用于基于单个关键词220搜索至少一个候选呼号230。该附图从数据库200仅示出与两个代表呼号210“KBS”和“FTV”有关的项的关系。
代表呼号210用作关键词220和候选呼号230之间的链接。更具体地,如果预定的关键词220被输入,则主要从数据库200搜索关键词220是否与哪个代表呼号210有关。如果搜索到代表呼号210,则再搜索搜索到的代表呼号210的从属呼号230或相关的候选呼号230。
在关键词220的情况下,将包括与代表呼号210有关的同义词的各种术语分组/分类以用于代表呼号210。候选呼号230包括与代表呼号210有关的至少一个频道的呼号,并且将呼号分组/分类以用于代表呼号210。
例如,如果关键词“钓鱼频道”220被输入,则与“钓鱼频道”有关的代表呼号210是“FTV”,并且与代表呼号“FTV”有关的候选呼号230只有一个,即“FTV”。也就是说,根据从数据库200搜索的结果,与关键词“钓鱼频道”220相应的频道的呼号只有“FTV”。
如果关键词“KBS”20被输入,则与“KBS”有关的代表呼号210是“KBS”,并且与代表呼号“KBS”210有关的候选呼号230是四个候选,即“KBS-1”、“KBS-2”、“KBS-sports”和“KBS-movie”。
通过前述方法搜索数据库200,以获得与关键词220有关的至少一个候选呼号。前述方法仅是用于实施数据库200的示例,并且数据库200的实施方法可不同,并且不限于前述的示例。
图3是示出显示设备100和服务器20和30的交互结构的框图。
如在其中示出,显示设备100包括通信单元140、语音输入单元160、语音处理器170和控制器190。这些元件与图1中说明的元件相同。通信单元140与将用户的言语转换为语音命令的言语至文本(STT)服务器20连接,并且与交谈服务器30连接,所述交谈服务器30分析语音命令,以确定与语音命令相应的操作。
STT服务器20分析接收的语音信号的波形,并且从所述语音信号的内容产生文本。STT服务器20将显示设备100发送的用户言语的语音信号转换为语音命令。
交谈服务器30包括用于映射与语音命令相应的显示设备100的各种操作的数据库。交谈服务器30分析显示设备100发送的语音命令,并且根据分析的结果向显示设备100发送用于执行与语音命令相应的操作的控制信号。
如果用户的言语被输入到语音输入单元160,则控制器190将所述言语的语音信号发送给STT服务器20,并且从STT服务器20接收与所述言语相应的语音命令。
控制器190确定STT服务器20发送的语音命令是短句还是交谈语句。如果语音命令是短句,则控制器190控制语音处理器170处理所述语音命令。如果语音命令是交谈语句,则控制器190控制交谈服务器30处理所述语音命令。
这是因为交谈语句是自然语音,并且从如交谈语句的语音命令机械地提取期望的相应操作相对不容易。例如,如果用户的语音命令是短句“播放KBS”,则语音处理器170可立即使用呼号关键词“KBS”和操作关键词“播放”执行操作。
然而,如果语音命令是与前述短句实质上具有相同内容的交谈语句“将当前频道改换到韩国广播公司”,则需要提取与“韩国广播公司”相应的呼号关键词“KBS”的处理以及提取与“改换到”相应的操作关键词“播放”的处理。由于诸如***负载或数据库的信息量的各种因素,可能不容易通过语音处理器170对该交谈语句进行处理。
图4示出根据本实施例的在显示设备100和服务器20和30之间的交互处理的示例。
如其中所示,在接收到用户的言语的输入(600)后,显示设备100将所述言语的语音信号发送给STT服务器20(610)。
STT服务器20将所述语音信号转换为语音命令(620),并且将转换的语音命令发送给显示设备100(630)。
显示设备100分析STT服务器30发送的语音命令,并且从所述语音命令提取与呼号有关的关键词(640)。显示设备100确定所述语音命令是短句还是交谈语句。
如果确定所述语音命令是交谈语句,则显示设备100将所述语音命令和与呼号有关的关键词发送给交谈服务器30(650)。
交谈服务器30对显示设备100发送的语音命令和与呼号有关的关键词执行呼号分析(660)。呼号分析处理包括搜索相应于与呼号有关的关键词的候选呼号的处理、从搜索到的候选呼号选择推荐呼号的处理以及确定与文本中推荐呼号相应的显示设备100的操作的处理。稍后将对此进行更详细的描述。
如果完成了推荐呼号的选择和语音命令的相应操作的确定,则交谈服务器30根据该选择和确定结果将控制信号发送给显示设备100。显示设备100可根据控制信号对推荐呼号执行相应的操作。
例如,如果分析得到推荐呼号是“KBS-1”并且相应的操作是改换频道,则交谈服务器30将指示所述内容的控制信号发送给显示设备100,显示设备100将频道改换到“KBS-1”。
如果在操作640,确定语音命令是短句,则显示设备100针对接收的语音命令和与呼号有关的关键词执行呼号分析处理。根据与交谈服务器30执行的处理相同的原则执行该处理。
此后,将针对与呼号有关的关键词的呼号分析处理进行描述。
交谈服务器30搜索与有关呼号的关键词相应的候选呼号,并且确定搜索到的候选呼号是否是多个。
可通过与在图2中说明的方法相同的方法执行确定语音命令是否包括与呼号有关的关键词以及搜索与所述关键词相应的候选呼号。也就是说,交谈服务器30从数据库200(参照图2)搜索提取自语音命令的词,并且确定是否有任何匹配的词220,并且如果有匹配的词220,则交谈服务器30可获取代表呼号210(参照图2)的候选呼号230(参照图2)。
在从语音命令提取关键词的处理中,可执行语音命令的打字错误的校正或过滤。例如,如果有语音命令“播放Orean Broadcasting System”,则即使数据库中不包括词“Orean Broadcasting System”但是“Korean BroadcastingSystem”被确定为与词“Orean Broadcasting System”相似,数据库中的词“Korean Broadcasting System”也可被选择。确定词的相似性的方法可不同,并且不限制本实用新型的构思。
如果搜索到的候选呼号仅有一个,则交谈服务器30将所述候选呼号选择为推荐呼号。
如果搜索到的候选呼号是多个,则交谈服务器30根据预设的选择条件选择推荐呼号。
可预先设置用于从候选呼号选择推荐呼号的选择条件。例如,交谈服务器30可将选择频率是预设的排名或更高的多个呼号选择为推荐呼号,或者将选择频率最高的单个呼号选择为推荐呼号。
如果在候选呼号中有四个呼号“KBS-1”、“KBS-2”、“KBS-sports”和“KBS-movie”,则控制器190基于使用历史信息确定在预定的时间段内显示设备100中频道的选择频率。例如,如果选择频率按照“KBS-sports”、“KBS-movie”、“KBS-2”和“KBS-1”的次序为高,则控制器190可按照选择频率的次序选择多个呼号,或者选择单个呼号。
控制器190可显示用于用户选择多个候选呼号之一的用户界面(UI)。
图5和图6示出被提供以用于选择多个推荐呼号之一的UI 310和320的示例。
如图5中示出,控制器190基于使用历史信息,将从显示设备100最频繁地被选择的“KBS-sports”和“KBS-movie”选择为推荐呼号,并且提供UI 310以使用户从选择的推荐呼号选择期望的频道。用户可通过UI 310从“KBS-sports”和“KBS-movie”选择一个呼号和广播频道。
如图6中示出,控制器190可提供用于选择全部候选呼号“KBS-sports”、“KBS-movie”、“KBS-2”和“KBS-1”中的一个的UI 320。控制器190可在UI 320中显示搜索到的候选呼号的全部,但是可根据选择频率确定呼号的选择次序。例如,UI 320可按照最高选择频率的次序显示候选呼号。
如果当UI 310和UI 320被显示时,在预设的时间内用户没有执行选择,则控制器190可从候选呼号选择最频繁地被选择的排名最高的频道,如“KBS-sports”。
用于从候选呼号选择推荐呼号的选择条件可不同于前述的示例。服务器10(参照图1)被连接到显示设备100以外的各种其他显示设备。服务器10可与STT服务器20或交谈服务器30相同,也可以与STT服务器20或交谈服务器30不同。STT服务器20和交谈服务器30被描述为不同,但是它们可以被实现为相同的服务器。
其他显示设备将使用历史信息发送给服务器10。服务器10基于从其他显示设备收集的使用历史信息确定在候选呼号的“KBS-1”、“KBS-2”、“KBS-sports”和“KBS-movie”的选择频率。
控制器190将候选呼号“KBS-1”、“KBS-2”、“KBS-sports”和“KBS-movie”发送给服务器10,并且可请求服务器10从所述候选呼号选择推荐的候选。
服务器10基于来自其他显示设备的使用历史信息,在候选呼号中确定选择排名。如果选择排名按照“KBS-movie”、“KBS-2”、“KBS-sports”和“KBS-1”的次序被示出,并且显示设备100请求的推荐的候选的个数是一个,则服务器10将最频繁地被选择的“KBS-movie”确定为推荐的候选,并且将确定的候选通知显示设备100。控制器190可将与“KBS-movie”有关的信息显示为图像。
如果仅一个推荐呼号被选择,则控制器190可自动地显示推荐呼号的广播频道的图像。然而,与呼号相应的频道号可能依地域而不同。
因此,控制器190获得有关显示设备100所在地域的地域信息,并且确定与所述地域相应的呼号的频道号。确定显示设备100的地域的方法可不同,例如,提取包括在广播信号的头或元数据中的地域/国家ID、基于通信单元140的MAC地址由服务器10确定或者在显示设备100中由用户预先输入地域信息。
如上所述,如果与用户的言语相应的语音命令包括与呼号有关的关键词,则显示设备100选择与所述关键词相应的推荐呼号,并且根据语音命令针对选择的推荐呼号的广播频道执行相应的操作。
图7示出根据第二实施例的在显示设备100和服务器20和30之间的交互处理的示例。
如在此其中示出,在接收到用户言语的输入(700)后,显示设备100将所述言语的语音信号发送给STT服务器20(710)。
STT服务器20将接收的语音信号转换为语音命令(720)。操作700至720与图4中示出的相同。
STT服务器20将语音命令发送给交谈服务器30(730)。
交谈服务器30执行诸如搜索候选呼号以及选择推荐呼号的呼号分析处理(740)。详细描述可与前述实施例相似,并且将不重复提供所述详细描述。然而,与图4中的情形不同,通过由交谈服务器30从语音命令提取呼号词来执行根据本实施例的呼号分析处理。
交谈服务器30将推荐呼号和指示相应操作的控制信号发送给显示设备100,显示设备100根据控制信号操作(750)。
在前述实施例中,已描述了用于通过STT服务器20将输入到显示设备100的用户的言语转换为语音命令、通过显示设备100将短句处理为语音命令以及通过交谈服务器30将交谈语句处理为语音命令的配置。
然而,本实用新型的构思不限于前述实施例,并且用于将言语转换为语音命令的配置以及有关根据语音命令是短句/交谈语句处理语音命令的配置可不同于前述实施例。
图8是示出根据第三实施例的显示设备100a和服务器40的交互结构的框图。图9示出在图8中的显示设备100a和服务器40之间的交互处理的示例。
如图8中示出,显示设备100a包括通信单元140a、语音输入单元160a、语音处理器170a和控制器190a。
语音处理器170a包括STT转换器171a以及短句命令处理器172a,STT转换器171a将语音输入单元160a发送的言语转换为语音命令,如果语音命令是短句,则短句命令处理器172a处理所述语音命令。
如果用户的言语被输入,则语音输入单元160a将输入言语的语音信号发送给STT转换器171a。STT转换器171a分析语音输入单元160a发送的语音信号,并且将所述语音信号转换为包括语音的内容的语音命令。STT转换器171a将转换的语音命令发送给控制器190a。也就是,STT转换器171a执行第一实施例中STT服务器20的功能。
控制器190a确定语音命令是短句还是交谈语句。如果语音命令是短句,则控制器190a将语音命令发送给短句命令处理器172a。短句命令处理器172a根据控制器190a的控制分析语音命令,并且根据分析结果执行相应的操作。语音命令的分析和执行可使用前述实施例,并且将省略详细描述。
如果语音命令是交谈语句,则控制器190a通过通信单元140a将语音命令发送给交谈服务器40,而不是发送给短句命令处理器172a。交谈服务器40执行与根据第一实施例的交谈服务器30相同的功能。
显示设备100a执行与交谈服务器40发送的控制信号相应的操作。
如图9中示出,显示设备100a与交谈服务器40连接以进行通信。如果用户的言语被输入(810),则显示设备100a确定与所述言语相应的语音命令是短句还是交谈语句(820)。如果确定语音命令是交谈语句,则显示设备100a将所述语音命令发送给交谈服务器40(830)。
在从显示设备100a接收到语音命令(910)时,交谈服务器40从所述语音命令提取与呼号有关的关键词(920)。
否则,可由显示设备100a而不是交谈服务器40提取与呼号有关的关键词。在这种情况下,显示设备100a将与呼号有关的关键词连同语音命令发送给交谈服务器40。
交谈服务器40搜索相应于关键词的候选呼号(930)。如果多个候选呼号被搜索到,则交谈服务器40根据如前所述的选择条件从多个搜索到的候选呼号选择推荐呼号(940)。交谈服务器40分析语音命令,并且确定所述语音命令下相应的操作。
交谈服务器40将推荐呼号和指示相应操作的控制信号发送给显示设备100a(950)。
显示设备100a根据交谈服务器40发送的控制信号,针对推荐呼号的广播信号执行相应的操作(840)。
如果在操作820,确定语音命令是短句,则显示设备100a分析推荐呼号和相应的操作。
图10是示出根据第四实施例的显示设备100b的语音处理器171b的信号传输结构的框图。
如其中所示,语音处理器170b包括STT转换器171b、短句命令处理器172b以及交谈命令处理器173b。其中,STT转换器171b将语音输入单元160b发送的用户言语转换为语音命令;如果STT转换器171b转换的语音命令是短句,则短句命令处理器172b处理所述语音命令;如果语音命令是交谈语句/自然语音,则交谈命令处理器173b处理STT转换器171b转换的语音命令。语音处理器170b的结构不限于前述的示例,并且本示例简短地说明直接与本实施例有关的主题。
如果用户的言语被输入,则语音输入单元60b将输入言语的语音信号发送给STT转换器171b。STT转换器171b将语音输入单元160b发送的言语转换为包括所述语音的内容的语音命令。STT转换器171b将转换的语音命令发送给控制器190b。
控制器190b确定语音命令是短句还是交谈语句。可通过各种算法执行前述确定。
如果言语命令是短句,则控制器190b将语音命令发送给短句命令处理器172b。如果语音命令是交谈语句,则控制器190b将语音命令发送给交谈命令处理器173b。
短句命令处理器172b执行与图8中短句命令处理器172a实质相同的功能。交谈命令处理器173b执行根据前述实施例由交谈服务器30和40执行的功能。
也就是,与前述实施例不同,根据本实施例的显示设备100b可转换作为用户的言语的结果的语音命令,并且分析与语音命令相应的操作,而不是与外部服务器20至40交换数据/信号。
如果显示设备与执行呼号分析处理的另外的服务器(未示出)连接,则短句命令处理器172b或交谈命令处理器173b可将关键词和语音命令发送给所述服务器(未示出),所述服务器执行呼号分析处理。
也就是,在前述实施例中,交谈服务器30和40或语音处理器170、170a和170b执行呼号分析处理,但是可通过另外的服务器(未示出)另外执行呼号分析处理。
虽然已经示出和描述了一些示例性实施例,但是本领域的技术人员将理解,在不脱离本实用新型的原则和精神的前提下,可对这些实施例进行修改,本实用新型的范围由权利要求及其等同物限定。

Claims (9)

1.一种图像处理设备,其特征在于包括: 
图像处理器,被连接到控制器,处理从外部传输的广播信号,以基于处理的广播信号显示图像; 
通信单元,被连接到控制器,与服务器连接以进行通信; 
语音输入单元,被连接到控制器,接收用户的言语; 
语音处理器,被连接到控制器,根据与语音输入单元接收的所述言语相应的语音命令处理预设的相应操作的执行;和 
控制器,如果通过语音输入单元言语被输入,则控制器通过语音处理器和服务器之一处理与所述言语相应的语音命令,其中,如果语音命令包括与广播频道的呼号有关的关键词,则控制器控制语音处理器和服务器之一根据预定的选择条件选择与所述关键词相应的推荐呼号,并且根据所述语音命令针对推荐呼号的广播频道执行相应的操作。 
2.如权利要求1所述的图像处理设备,其特征在于,与关键词相应的至少一个候选呼号的数据库被存储在图像处理设备中和服务器中的至少一个,并且推荐呼号根据所述选择条件从自数据库搜索到的多个候选呼号被选择。 
3.如权利要求2所述的图像处理设备,其特征在于,所述选择条件包括将候选呼号选择为推荐呼号,推荐呼号的选择频率是基于图像处理设备的使用历史信息,多个候选呼号当中预设的排名或更高排名。 
4.如权利要求2所述的图像处理设备,其特征在于,所述选择条件包括将候选呼号选择为推荐呼号,推荐呼号的选择频率是多个候选呼号当中,在与服务器通信的多个其他图像处理设备中预设的排名或更高排名。 
5.如权利要求2所述的图像处理设备,其特征在于,所述推荐呼号是从多个候选呼号选择的一个或多个呼号,并且如果多个候选呼号被选择,则控制器显示被提供以选择多个候选呼号之一的用户界面UI。 
6.如权利要求5所述的图像处理设备,其特征在于,如果在UI被显示后的预设时间内,选择候选呼号之一的输入没有被执行,则控制器根据预设的选择条件选择推荐呼号之一。 
7.如权利要求1所述的图像处理设备,其特征在于,通信单元与将言语转换为文本的语音命令的言语到文本STT服务器通信,并且在所述言语被输 入给语音输入单元后,控制器将所述言语的语音信号发送给STT服务器,并且从STT服务器接收与所述言语相应的语音命令。 
8.如权利要求7所述的图像处理设备,其特征在于,如果语音命令是短句,则控制器控制语音处理器处理所述语音命令,并且如果所述语音命令是交谈语句,则控制器控制服务器处理所述语音命令。 
9.如权利要求1所述的图像处理设备,还包括:显示单元,基于图像处理器处理的广播信号在其上显示图像。 
CN2013200297023U 2012-09-28 2013-01-21 图像处理设备 Expired - Lifetime CN203340238U (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20120109454 2012-09-28
KR10-2012-0109454 2012-09-28
KR1020120115783A KR20140039946A (ko) 2012-09-28 2012-10-18 영상처리장치 및 그 제어방법, 영상처리 시스템
KR10-2012-0115783 2012-10-18

Publications (1)

Publication Number Publication Date
CN203340238U true CN203340238U (zh) 2013-12-11

Family

ID=47757308

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2013200297023U Expired - Lifetime CN203340238U (zh) 2012-09-28 2013-01-21 图像处理设备
CN201310042328.5A Expired - Fee Related CN103716704B (zh) 2012-09-28 2013-02-01 图像处理设备及其控制方法和图像处理***

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310042328.5A Expired - Fee Related CN103716704B (zh) 2012-09-28 2013-02-01 图像处理设备及其控制方法和图像处理***

Country Status (7)

Country Link
US (2) US9037471B2 (zh)
EP (2) EP3211810A1 (zh)
CN (2) CN203340238U (zh)
AU (1) AU2013200307B2 (zh)
DE (1) DE202013100036U1 (zh)
FR (1) FR2996399B3 (zh)
WO (1) WO2014051219A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105763929A (zh) * 2016-02-23 2016-07-13 广州酷狗计算机科技有限公司 音频切换方法及装置
CN106782561A (zh) * 2016-12-09 2017-05-31 深圳Tcl数字技术有限公司 语音识别方法和***

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
US20150066513A1 (en) * 2013-08-29 2015-03-05 Ciinow, Inc. Mechanism for performing speech-based commands in a system for remote content delivery
CN105842964A (zh) * 2015-01-14 2016-08-10 中强光电股份有限公司 投影***、投影装置及投影装置的操作方法
CN105847715A (zh) * 2016-01-20 2016-08-10 乐视致新电子科技(天津)有限公司 一种多媒体播放设备
US10044710B2 (en) 2016-02-22 2018-08-07 Bpip Limited Liability Company Device and method for validating a user using an intelligent voice print
US10448115B1 (en) * 2016-09-28 2019-10-15 Amazon Technologies, Inc. Speech recognition for localized content
US10424297B1 (en) * 2017-02-02 2019-09-24 Mitel Networks, Inc. Voice command processing for conferencing
JP6875905B2 (ja) * 2017-03-29 2021-05-26 株式会社日立情報通信エンジニアリング 通話制御システム及び通話制御方法
US10896050B2 (en) * 2017-10-03 2021-01-19 Google Llc Systems, methods, and apparatus that provide multi-functional links for interacting with an assistant agent
JP7447458B2 (ja) * 2019-12-13 2024-03-12 コニカミノルタ株式会社 制御装置、制御システム及び制御プログラム
CN116825129B (zh) * 2023-05-09 2024-02-09 广东保伦电子股份有限公司 一种音频流精确分发的方法、设备及介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09186943A (ja) 1996-01-08 1997-07-15 Canon Inc データ受信方法とその装置
JP3913884B2 (ja) 1998-02-24 2007-05-09 クラリオン株式会社 音声認識による選局装置及び方法並びに音声認識による選局用プログラムを記録した記録媒体
JP2000013708A (ja) 1998-06-26 2000-01-14 Hitachi Ltd 番組選択支援装置
US6757718B1 (en) * 1999-01-05 2004-06-29 Sri International Mobile navigation of network-based electronic information using spoken input
US6314398B1 (en) 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
JP4524898B2 (ja) 2000-10-06 2010-08-18 株式会社デンソー 放送受信装置の選局制御装置
JP2002162987A (ja) 2000-11-22 2002-06-07 Matsushita Electric Ind Co Ltd 音楽信号再生方法及び音楽信号再生装置
CA2836213A1 (en) * 2001-02-20 2002-08-29 3D Radio, Llc Multiple radio signal processing and storing method and apparatus
JP3523213B2 (ja) 2001-03-28 2004-04-26 株式会社ジャストシステム コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム
US6892193B2 (en) * 2001-05-10 2005-05-10 International Business Machines Corporation Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities
US6993535B2 (en) * 2001-06-18 2006-01-31 International Business Machines Corporation Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities
MY141150A (en) * 2001-11-02 2010-03-15 Panasonic Corp Channel selecting apparatus utilizing speech recognition, and controling method thereof
JP2005242183A (ja) 2004-02-27 2005-09-08 Toshiba Corp 音声認識装置、表示制御装置、レコーダ装置、表示方法およびプログラム
JP2005249829A (ja) * 2004-03-01 2005-09-15 Advanced Media Inc 音声認識を行うコンピュータネットワークシステム
JP2006033795A (ja) 2004-06-15 2006-02-02 Sanyo Electric Co Ltd リモートコントロールシステム、コントローラ、コンピュータにコントローラの機能を付与するプログラム、当該プログラムを格納した記憶媒体、およびサーバ。
JP2006227135A (ja) 2005-02-16 2006-08-31 Sharp Corp 遠隔操作装置、遠隔操作方法、及び遠隔操作プログラム
JP2007142840A (ja) * 2005-11-18 2007-06-07 Canon Inc 情報処理装置及び情報処理方法
JP2007178927A (ja) * 2005-12-28 2007-07-12 Canon Inc 情報検索装置および方法
US8223961B2 (en) 2006-12-14 2012-07-17 Motorola Mobility, Inc. Method and device for answering an incoming call
US8631440B2 (en) * 2007-04-30 2014-01-14 Google Inc. Program guide user interface
US8533761B1 (en) * 2007-04-30 2013-09-10 Google Inc. Aggregating media information
US8175885B2 (en) 2007-07-23 2012-05-08 Verizon Patent And Licensing Inc. Controlling a set-top box via remote speech recognition
JP5167946B2 (ja) 2008-05-21 2013-03-21 株式会社デンソー 音声操作認識装置
US11012732B2 (en) * 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
KR20120010818A (ko) 2010-07-27 2012-02-06 주식회사 파인디지털 정보 단말기 및 이를 위한 채널 전환 방법
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
JP5039214B2 (ja) 2011-02-17 2012-10-03 株式会社東芝 音声認識操作装置及び音声認識操作方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105763929A (zh) * 2016-02-23 2016-07-13 广州酷狗计算机科技有限公司 音频切换方法及装置
CN105763929B (zh) * 2016-02-23 2018-10-23 广州酷狗计算机科技有限公司 音频切换方法及装置
CN106782561A (zh) * 2016-12-09 2017-05-31 深圳Tcl数字技术有限公司 语音识别方法和***

Also Published As

Publication number Publication date
EP2713535A1 (en) 2014-04-02
AU2013200307A1 (en) 2014-04-17
US20140095175A1 (en) 2014-04-03
WO2014051219A1 (en) 2014-04-03
FR2996399A3 (fr) 2014-04-04
CN103716704A (zh) 2014-04-09
CN103716704B (zh) 2018-03-23
FR2996399B3 (fr) 2015-05-15
AU2013200307B2 (en) 2015-02-05
DE202013100036U1 (de) 2013-07-08
EP3211810A1 (en) 2017-08-30
US20140095159A1 (en) 2014-04-03
US9037471B2 (en) 2015-05-19
US8838456B2 (en) 2014-09-16

Similar Documents

Publication Publication Date Title
CN203340238U (zh) 图像处理设备
US11385861B2 (en) Smart controlling device and method of controlling therefor
CN203151689U (zh) 图像处理设备以及图像处理***
US20220321965A1 (en) Voice recognition system, voice recognition server and control method of display apparatus for providing voice recognition function based on usage status
CN110737840A (zh) 语音控制方法及显示设备
US20140373082A1 (en) Output system, control method of output system, control program, and recording medium
WO2014130899A1 (en) Method for combining voice signals to form a continuous conversation in performing a voice search
CN103916704A (zh) 对话型接口设备及其控制方法
CN104053032A (zh) 虚拟频道的管理方法和网络多媒体重现***
US11228797B2 (en) Electronic apparatus and method of controlling the same
US10911831B2 (en) Information processing apparatus, information processing method, program, and information processing system
KR102088443B1 (ko) 검색을 수행하는 디스플레이 장치 및 이의 제어 방법
CN110750719A (zh) 一种基于iptv的资讯精准推送***及方法
CN108899019A (zh) 显示设备及其控制方法
KR20190047960A (ko) 전자 장치 및 이의 제어 방법
CN104284231A (zh) 一种数字电视频道快速切换***及切换方法
RU2571520C2 (ru) Устройство обработки изображений и соответствующий способ управления и система обработки изображений
CN109564758A (zh) 电子设备及其语音识别方法
CN110786019B (zh) 服务器及其控制方法
EP3748982A1 (en) Electronic device and content recognition information acquisition therefor
KR102386298B1 (ko) 영상처리장치 및 그 제어방법
KR102204813B1 (ko) 검색을 수행하는 디스플레이 장치 및 이의 제어 방법
EP4294028A1 (en) Electronic device and electronic device control method
CN115237929A (zh) 显示设备、交互方法和存储介质
CN111782878A (zh) 服务器、显示设备及其视频搜索排序方法

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20131211