CN103077711A - 电子设备及其控制方法 - Google Patents

电子设备及其控制方法 Download PDF

Info

Publication number
CN103077711A
CN103077711A CN2012104149213A CN201210414921A CN103077711A CN 103077711 A CN103077711 A CN 103077711A CN 2012104149213 A CN2012104149213 A CN 2012104149213A CN 201210414921 A CN201210414921 A CN 201210414921A CN 103077711 A CN103077711 A CN 103077711A
Authority
CN
China
Prior art keywords
voice
text
electronic equipment
unit
receive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104149213A
Other languages
English (en)
Inventor
朴殷相
蔡周洛
金在还
刘昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103077711A publication Critical patent/CN103077711A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

提供一种电子设备和控制方法。该电子设备包括:语音接收器,其接收用户的语音;信号处理器,其对所接收的语音执行信号处理;通信器,其与第一外部设备通信;和控制器,其确定与所接收的用户的语音对应的文本,并且控制通信器向第一外部设备发送经信号处理的语音和所确定的文本。

Description

电子设备及其控制方法
技术领域
与示范实施例一致的装置和方法涉及一种具有通信能力的电子设备及其控制方法。
背景技术
随着便携式通信设备的最新进展,包括语音呼叫、文本呼叫和视频呼叫的各类通信能力已经普及。但是,虽然此类各式各样类型的通信能力在便携式通信设备中已显著地起作用,但是它们在诸如电视机(TV)等的家庭电子设备中尚未被显著地使用。
例如,如果用户希望发送文本或留下文本消息,则用户必须使用诸如键盘等的输入设备来输入该文本。这在提供适当的输入设备的环境中是可能的。然而,大多数家庭视频显示设备不具有适当的输入设备,或者,即使有的话,对于用户来说输入文本也是不方便的,这导致难以实现各种类型的通信能力。
发明内容
本公开的一方面提供一种电子设备及其控制方法,以允许更便利地使用各种类型的通信能力。
根据示范实施例的一方面,提供一种电子设备,包括:语音输入单元,其接收用户的语音;信号处理单元,其对所接收的语音执行信号处理;通信单元,其与第一外部设备通信;以及控制单元,其确定对应于所接收的语音的文本,并且控制所述通信单元向该第一外部设备发送经信号处理的语音和所确定的文本。
语音输入单元可以从提供电子设备的远程控制的远程控制器接收语音。
信号处理单元可以执行预处理以去除在所接收的语音中包括的噪声。
语音输入单元可以从第二外部设备接收语音。
电子设备可以还包括语音识别单元,其识别所接收的语音,并且控制单元可以使用语音识别单来元确定文本。
通信单元可以与外部服务器通信,以及控制单元可以向外部服务器发送所接收的语音,从外部服务器接收关于所发送的语音的信息,并且基于所接收的信息来确定文本。
电子设备可以还包括语音输出单元,其输出经处理的语音。
电子设备可以还包括显示单元,其显示文本。
控制单元可以在发送文本之前在显示单元上显示文本,并且根据指令校正该文本。
根据另一示范实施例的一方面,提供一种电子设备的控制方法,包括:接收用户的语音;对所接收的语音执行信号处理;确定对应于所接收的语音的文本;并且向第一外部设备发送经信号处理的语音和所确定的文本。
接收用户的语音可以包括从提供电子设备的远程控制的远程控制器接收语音。
执行信号处理可以包括执行预处理以去除在所接收的语音中包括的噪声。
接收用户的语音可以包括从第二外部设备接收语音。
确定文本可以包括:识别所接收的语音;以及基于识别的结果来确定文本。
确定文本可以包括:向外部服务器发送所接收的语音;从外部服务器接收关于所发送的语音的信息;并且基于所接收的信息来确定文本。
所述控制方法可以还包括通过语音输出单元输出经处理的语音。
所述控制方法可以还包括在显示单元上显示文本。
显示文本可以包括在发送文本之前在显示单元上显示文本,并且确定文本可以包括根据指令校正该文本。
附图说明
通过结合附图的以下示范实施例的描述,以上和/或其它方面将变得更明了和更容易理解,其中:
图1是示出对其应用根据示范实施例的电子设备的环境的图;
图2是示出图1所示的电子设备的配置的示例的框图;
图3是示出图1和图2所示的电子设备的控制方法的流程图;
图4是示出图3的方法中文本的验证和校正的操作的流程图;以及
图5示出图4的操作中显示候选文本的一个示例。
具体实施方式
下面,将参考附图详细描述示范实施例以便本领域的普通技术人员容易理解。
图1是示出对其应用根据示范实施例的电子设备的环境的图。图1所示的电子设备1可以是家庭视频显示设备,诸如电视机(TV)、音频-视频(AV)设备等。电子设备1向用户2和用户5提供各种通信能力。例如,电子设备1接收从用户2输入的语音,并输出相应的语音和文本。语音和文本可以在接收语音后立即输出或稍后输出。用户可直接地或通过诸如远程控制器3的***设备向电子设备1输入语音。替换地,用户可以通过分离的外部设备4输入语音,诸如移动电话机、智能电话机、语音记录器等。
电子设备1可以向同一用户2或不同用户5输出该语音和文本,或者可以向本地外部设备6或经由网络7向远程外部设备9发送语音和文本。外部设备4、6和9可以是相同类型或不同类型的设备。可以通过识别所接收的语音来获得随语音一起输出或发送的文本。电子设备1可以本地地执行语音识别,或者可以经由网络7请求远程外部服务器8的语音识别并且从远程外部服务器8接收语音识别的结果。在被输出之前,文本可以被验证,并在某些情况下,可以由用户2和5来校正。
因此,由于本示范实施例的电子设备1可以具有使用语音而非字符的通信能力,故不需要字符输入,从而提高了用户的便利性。此外,由于该示范实施例的电子设备1连同相应的文本一起传递语音,所以可以最大化通信或信息传递的效果。
图2是示出图1所示的电子设备1的配置的框图。如图2中所示,电子设备1可以包括语音输入单元11、信号处理单元12、通信单元14和控制单元15。
语音输入单元11从用户接收语音。语音输入单元11可以包括麦克风,以生成对应于所接收的用户的语音的语音信号。作为替代,语音输入单元11可包括远程控制器接收单元,用于从远程控制器3接收与用户的语音相对应的语音信号。在这种情况下,远程控制器3可以包括麦克风,以生成对应于所接收的用户的语音的语音信号。
信号处理单元12从语音输入单元11接收对应于用户的语音的语音信号,并执行语音处理,以使得能够输出所接收的语音信号。信号处理单元12可以进一步执行预处理,以去除在语音信号中包含的噪声。信号处理单元12可以在控制单元15的控制下选择性地执行预处理。例如,如果麦克风被合并在语音输入单元11中,则信号处理单元12可以执行预处理以提高语音信号的质量,该语音信号可能比在远程控制器3中合并的麦克风包括更多噪声。
信号处理单元12还可以执行图像处理,以使得能够显示输入图像信号。电子设备1可以进一步包括用于输入图像信号的信号输入单元(未示出)。输入到信号输入单元的图像信号可以是从广播站(未示出)广播和接收的、从诸如数字视频光盘(DVD)播放器等的本地图像显示设备(未示出)接收的、或从诸如移动终端的本地外部设备4接收的。电子设备1可以进一步包括显示单元13,用于基于由信号处理单元12处理的图像信号来显示图像。
通信单元14在与外部设备6及9之间的通信中向外部设备6及9发送语音和文本。通信单元14可以直接或经由网络连接到外部设备6。通信单元14和外部设备6及9之间的通信没有特别的限制,但可以包括有线和无线通信之一或两者。
控制单元15控制电子设备1的整体操作。当通过语音输入单元11接收用户的语音时,控制单元15确定对应于所接收的语音的文本,并且控制信号处理单元12和通信单元14,从而可以输出语音和文本。电子设备1还可以包括合并了扬声器以输出语音的语音输出单元18,并且控制单元15可以控制语音输出单元18来输出语音。在这种情况下,除了语音的输出外,控制单元15可以控制信号处理单元12以在显示单元13上显示与语音对应的文本。
控制单元15取决于功能的选择来确定语音和文本要被输出到的目标。用户可以选择功能,或控制信号可以选择功能。例如,如果选择了文本发送菜单,则控制单元15控制通信单元14向指定的外部设备6或9传递语音和文本。外部装置6或9可由用户使用选择屏幕来指定。作为另一例子,如果选择了备忘录菜单,则控制单元15存储所接收的语音并且控制语音输出单元18和显示单元13以输出所存储的语音和相应的文本。此功能可以当用户希望稍后确认备忘录时使用。电子设备1可以进一步包括存储单元16,其包括非易失性存储器以用于存储所接收的语音的数据。
电子设备1还包括输入单元17,用于接收指令。可以在电子设备1的主体中以操作面板的形式提供输入单元17以用于接收输入,或者输入单元17可以从远程控制器3接收远程控制器信号。电子设备1可以为显示单元13提供用户界面(UI),以允许用户选择菜单(或功能),并且可以从UI接收菜单选择。
尽管未示出,但是控制单元15可包括:非易失性存储器,其中存储用于使能上述控制操作的控制程序;易失性存储器,其中加载所存储的控制程序中的至少一些;和微处理器,用于执行加载的控制程序。
图3是示出根据图1和图2所示的电子设备1的示范实施例的控制方法的流程图。在操作S31中,电子设备1从用户接收语音。在操作S32中,电子设备1执行信号处理,从而所接收的用户的语音可以被输出。在操作S33中,电子设备1确定对应于所接收的用户的语音的文本。在操作S34中,电子设备1向外部设备6和9发送用户的语音和所确定的文本。或者,如上所述,电子设备1可以取决于功能的选择而直接输出用户的语音和所确定的文本。
在操作S33中,通过识别所接收的语音来确定文本。电子设备1可以包括语音识别模块(未示出),其可以在软件或硬件中实现,这被称为“语音识别引擎”,并且电子设备1可以使用语音识别模块来确定对应于所接收的语音的文本。作为替代,电子设备1可以使用提供有语音识别引擎的外部服务器8来确定与所接收的语音对应的文本。在这种情况下,电子设备1通过经由网络7向外部服务器8发送关于所接收的用户的语音的信息并从外部服务器8接收语音识别的结果来确定与所接收的语音对应的文本。
在确定与所接收的语音对应的文本中,电子设备1可以允许用户验证并在某些情况下校正文本。图4是示出根据示范实施例的文本的验证和校正的操作的流程图。在操作S41中,电子设备1对语音输入执行语音识别。在操作S42中,电子设备1基于语音识别的结果而显示候选文本。图5示出显示候选文本的一个示例。在图5中,参考数字51表示显示单元13的屏幕,而参考数字52表示UI,该UI包括基于识别所接收的语音的结果的文本。例如,UI 52示出了与用户的语音消息对应的文本,“明天10点见”。用户可以在观看UI 52中所示文本的同时检查是否正确识别了用户的语音。
在操作S43中,电子设备1确定是否需要校正候选文本。如果确定无需校正候选文本(在操作S43中的“否”),则该过程结束。另一方面,如果确定需要校正候选文本(在操作S43中的“是”),则电子设备1在操作S44中根据指令来校正候选文本。UI 52可以包括允许用于校正候选文本的条目。例如,UI 52可包括条目54和55,以允许候选文本逐字被高亮显示(见参考数字53),并允许在候选文本中选择要校正的一个字。用户可以使用在用户输入单元17或远程控制器3中提供的方向按钮在候选文本中选择要校正的字。也可以使用在用户输入单元17或远程控制器3中提供的字符键或通过再次输入语音来校正候选文本。
如果校正已完成或无需校正,则电子设备1确定经历了验证和校正过程的候选文本为要输出的文本。UI 52还可以包括条目56,以允许完成验证和选择的校正。
根据示范实施例,通过利用诸如电视机(TV)等的家用电子设备,能够更便利地使用各种通信能力。
如果没有在此定义,则术语“单元”是指诸如处理器或电路的硬件组件和/或由诸如处理器的硬件组件执行的软件组件。
尽管已经示出和描述了几个示范实施例,但是本领域的普通技术人员将理解:在不背离本发明的精神和原理的情况下,可以在这些示范实施例中进行各种改变。本发明的范围由所附权利要求及其等价物限定。

Claims (15)

1.一种电子设备,包括:
语音输入单元,其接收用户的语音;
信号处理单元,其对所接收的语音执行信号处理;
通信单元,其与第一外部设备通信;以及
控制单元,其确定与所接收的用户的语音对应的文本,并且控制所述通信单元向第一外部设备发送经信号处理的语音和所确定的文本。
2.根据权利要求1所述的电子设备,其中,语音输入单元从提供电子设备的远程控制的远程控制器接收语音。
3.根据权利要求2所述的电子设备,其中,信号处理单元对所接收的语音执行预处理,以去除在所接收的语音中包括的噪声。
4.根据权利要求1到3中的一个所述的电子设备,其中,语音输入单元从第二外部设备接收语音。
5.根据权利要求1所述的电子设备,还包括语音识别单元,其识别所接收的语音,
其中,控制单元使用语音识别单元来确定与所接收的语音对应的文本。
6.根据权利要求1所述的电子设备,其中,通信单元与外部服务器通信,以及
其中,控制单元向外部服务器发送所接收的语音,从外部服务器接收关于所发送的语音的信息,并且基于所接收的信息来确定文本。
7.根据权利要求1所述的电子设备,还包括语音输出单元,其输出经信号处理的语音。
8.根据权利要求1所述的电子设备,其中,控制单元在发送文本之前在显示单元上显示文本,并且根据指令校正该文本。
9.一种电子设备的控制方法,该控制方法包括:
接收用户的语音;
对所接收的语音执行信号处理;
确定与所接收的语音对应的文本;并且
向第一外部设备发送经信号处理的语音和所确定的文本。
10.根据权利要求9所述的控制方法,其中,接收用户的语音包括:从提供电子设备的远程控制的远程控制器接收语音。
11.根据权利要求10所述的控制方法,其中,执行信号处理包括:执行预处理以去除在所接收的语音中包括的噪声。
12.根据权利要求9到11中的一个所述的控制方法,其中,接收用户的语音包括:从第二外部设备接收语音。
13.根据权利要求9所述的控制方法,其中,确定文本包括:
识别所接收的语音;以及
基于识别的结果来确定文本。
14.根据权利要求9所述的控制方法,其中,确定文本包括:
向外部服务器发送所接收的语音;
从外部服务器接收关于所发送的语音的信息;以及
基于所接收的信息来确定文本。
15.根据权利要求9所述的控制方法,其中显示文本包括在发送文本之前在显示单元上显示文本,并且
其中确定文本包括根据指令校正该文本。
CN2012104149213A 2011-10-26 2012-10-26 电子设备及其控制方法 Pending CN103077711A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110109694A KR20130045471A (ko) 2011-10-26 2011-10-26 전자장치 및 그 제어방법
KR10-2011-0109694 2011-10-26

Publications (1)

Publication Number Publication Date
CN103077711A true CN103077711A (zh) 2013-05-01

Family

ID=47076080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104149213A Pending CN103077711A (zh) 2011-10-26 2012-10-26 电子设备及其控制方法

Country Status (4)

Country Link
US (1) US20130110508A1 (zh)
EP (1) EP2587479A1 (zh)
KR (1) KR20130045471A (zh)
CN (1) CN103077711A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023124829A1 (zh) * 2021-12-30 2023-07-06 华为技术有限公司 语音协同输入方法、电子设备及计算机可读存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9575720B2 (en) 2013-07-31 2017-02-21 Google Inc. Visual confirmation for a recognized voice-initiated action
CN103646587B (zh) * 2013-12-05 2017-02-22 北京京东方光电科技有限公司 一种智能眼镜及其控制方法
US9430186B2 (en) 2014-03-17 2016-08-30 Google Inc Visual indication of a recognized voice-initiated action
KR102642666B1 (ko) 2016-02-05 2024-03-05 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템
KR102471499B1 (ko) 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
US20180225086A1 (en) * 2017-02-06 2018-08-09 Adam Scott Hollander Audio Control of Voice-Activated Devices
US11544591B2 (en) 2018-08-21 2023-01-03 Google Llc Framework for a computing system that alters user behavior

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7047192B2 (en) * 2000-06-28 2006-05-16 Poirier Darrell A Simultaneous multi-user real-time speech recognition system
US7298930B1 (en) * 2002-11-29 2007-11-20 Ricoh Company, Ltd. Multimodal access of meeting recordings
US7542971B2 (en) * 2004-02-02 2009-06-02 Fuji Xerox Co., Ltd. Systems and methods for collaborative note-taking
US8589156B2 (en) * 2004-07-12 2013-11-19 Hewlett-Packard Development Company, L.P. Allocation of speech recognition tasks and combination of results thereof
US20080059177A1 (en) * 2006-05-19 2008-03-06 Jamey Poirier Enhancement of simultaneous multi-user real-time speech recognition system
US8538757B2 (en) * 2007-05-17 2013-09-17 Redstart Systems, Inc. System and method of a list commands utility for a speech recognition command system
KR101612788B1 (ko) * 2009-11-05 2016-04-18 엘지전자 주식회사 이동 단말기 및 그 제어 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023124829A1 (zh) * 2021-12-30 2023-07-06 华为技术有限公司 语音协同输入方法、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
KR20130045471A (ko) 2013-05-06
US20130110508A1 (en) 2013-05-02
EP2587479A1 (en) 2013-05-01

Similar Documents

Publication Publication Date Title
CN103077711A (zh) 电子设备及其控制方法
US9544633B2 (en) Display device and operating method thereof
US11016578B2 (en) Method, electronic device and system for remote text input
EP3160151B1 (en) Video display device and operation method therefor
US9219949B2 (en) Display apparatus, interactive server, and method for providing response information
US8645707B2 (en) Apparatus and method for unlocking a user equipment
US8539531B2 (en) Mobile terminal, method of participating in interactive service therein, internet protocol television terminal and communication system including the same
CN104270404A (zh) 一种基于终端标识的登录方法及装置
CN104703252A (zh) 终端设备接入无线网络的方法及装置
CN105407070A (zh) 登录授权方法及装置
CN109903758A (zh) 音频处理方法、装置及终端设备
CN105635460A (zh) 一种用于信息输出的控制方法、移动终端及穿戴式设备
CN105208089A (zh) 信息显示方法、装置及***
CN107819740B (zh) 终端设备的验证方法、终端设备、音箱、服务器及介质
EP2840796A1 (en) Datum displaying method applied to smart television
CN109564758B (zh) 电子设备及其语音识别方法
CN105657325A (zh) 一种视频通信的方法、装置和***
US20180182393A1 (en) Security enhanced speech recognition method and device
EP2922306A1 (en) Personalization service method and system linked to user terminal
WO2016205455A1 (en) System and method for setting time and date in a device without access to network time protocol
CN105744206A (zh) 一种视频通信的方法、装置和***
CN104992106A (zh) 信息获取方法及装置
US20180350359A1 (en) Methods, systems, and media for controlling a media content presentation device in response to a voice command
CN105072243A (zh) 来电提示方法和装置
CN103905546B (zh) 一种终端登录远程服务器的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130501