CN101473636A - 用于检索信息的方法和*** - Google Patents
用于检索信息的方法和*** Download PDFInfo
- Publication number
- CN101473636A CN101473636A CNA2006800550664A CN200680055066A CN101473636A CN 101473636 A CN101473636 A CN 101473636A CN A2006800550664 A CNA2006800550664 A CN A2006800550664A CN 200680055066 A CN200680055066 A CN 200680055066A CN 101473636 A CN101473636 A CN 101473636A
- Authority
- CN
- China
- Prior art keywords
- information
- speech recognition
- voice conversation
- keyword
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000004891 communication Methods 0.000 claims abstract description 106
- 230000005236 sound signal Effects 0.000 claims abstract description 53
- 230000000977 initiatory effect Effects 0.000 claims abstract description 16
- 238000013500 data storage Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 230000008676 import Effects 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 10
- 241001504011 Anemone nemorosa Species 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 241000208818 Helianthus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 241000442474 Pulsatilla vulgaris Species 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000010010 raising Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
- H04M1/656—Recording arrangements for recording a message from the calling party for recording conversations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72445—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting Internet browser applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
一种***和方法,用于在通信终端中在与远程通信终端进行话音会话期间接收信息。在第一和第二通信终端之间发起话音会话之后,将话音会话的音频信号传递到语音识别引擎以便从该话音会话中识别关键字。然后,所识别的关键字用于定位和检索与该关键字有关的信息,并且在第一和第二通信终端中的至少一个的显示器上呈现所检索的信息。
Description
技术领域
本发明涉及用于检索(retrieve)信息的方法和***,更特别地,涉及在两个通信终端之间进行的话音(voice)会话期间信息的检索。
背景技术
在过去的数十年间,蜂窝电话行业在全世界取得了巨大的发展。从最初的模拟***(例如由标准AMPS(高级移动电话***)和NMT(北欧移动电话)所定义的***),所述发展在近些年期间几乎全部着眼于用于蜂窝无线电网络***的数字解决方案的标准,例如D-AMPS(例如如EIA/TIA-IS-54-B和IS-136中所规定的)和GSM(全球移动通信***)。目前,蜂窝技术通过诸如WCDMA之类的通信***正在进入所谓的第三代(3G),其相对于上面提到的在先第二代数字***提供了若干优点。
远距离的两方或多方之间通信的传统方式是话音会话,其中语音(speech)信号借助于无线电信号或者电线约束(electricalwire-bound)信号来传送。通常,这种通信发生在中间通信网络(例如PSTN或蜂窝无线电网络)上。一种可替换的解决方案是直接在通信终端之间传输信号,例如在对讲机终端之间传输信号。如今,移动电话通信迅速地增加,并且已经是世界上许多地区中语音通信的主导方式。移动电话也日益变得复杂,移动电话技术中的许多进展都涉及功能特征,例如更好的显示器、更有效和持续时间更长的电池、嵌入式相机等等。增大的存储空间和计算能力连同包括大尺寸触摸敏感显示器在内的图形用户接口一起导致能够处理越来越多的信息的移动电话,结果使得可以称之为移动电话的装置和可以称之为袖珍计算机的装置之间的界限正在逐渐消失。然而,即使文本和图像消息传递已经有了巨大的增长,话音会话在远程通信中也将很可能一直具有重要的作用。另一方面,话音会话也有其缺点,许多用户发现仅仅语音通信作用是十分有限的。视频电话技术是一种可替换方案,但是该技术通常占用多得多的带宽并且要求具有相机。
发明内容
因此,本发明的总的目的是提供使用诸如电话之类的通信终端进行通信的***和方法,其中话音通信可以与其他特征相结合以便相对于传统话音通信提供更高的价值。
依照本发明的第一方面,这个目的是借助于用于在通信终端中接收信息的方法来实现的,所述方法包括步骤:
在第一通信终端和第二通信终端之间发起话音会话;
将该话音会话的音频信号传递给语音识别引擎以便从该话音会话识别关键字;
检索与所述关键字有关的信息;
在第一和第二通信终端中的至少一个中呈现所检索的信息。
在一个实施例中,通过通信网络进行所述话音会话。
在一个实施例中,语音识别引擎位于所述通信网络的网络服务器中。
在一个实施例中,从第一通信终端发送到第二通信终端的或者相反方向发送的音频信号被传递经过所述语音识别引擎。
在一个实施例中,所述方法包括步骤:
在第一和第二通信终端中的至少一个中输入同意信息的检索和/或呈现的命令,从而
控制所述话音会话的通信信号被引导经过包含语音识别引擎的网络服务器。
在一个实施例中,输入同意信息的检索和/或呈现的命令的步骤作为缺省设置是在发起话音会话之前执行的。
在一个实施例中,输入同意信息的呈现的命令的步骤是在发起话音会话的步骤期间执行的。
在一个实施例中,所述方法包括步骤:
在话音会话期间在第一和第二通信终端中的至少一个中输入发起音频信号到语音识别引擎的传递的命令。
在一个实施例中,所述方法包括步骤:
在话音会话期间在第一和第二通信终端中的至少一个中输入将该话音会话的音频信号记录在数据存储器中的命令;
输入终止音频信号的记录的命令;
将所记录的音频信号传递到语音识别引擎。
在一个实施例中,语音识别引擎位于第一和第二通信终端中的一个中。
在一个实施例中,数据存储器位于第一和第二通信终端中的一个中。
在一个实施例中,检索与所述关键字有关的信息的步骤包括步骤:
在信息搜索引擎中输入该关键字。
在一个实施例中,检索与所述关键字有关的信息的步骤包括步骤:
在因特网上搜索与输入的关键字有关的信息。
在一个实施例中,检索与所述关键字有关的信息的步骤包括步骤:
将该关键字与和存储在存储器中的广告信息有关的预定关键字进行匹配,以便检索与该识别的关键字有关的广告。
在一个实施例中,呈现所检索的信息的步骤在发起的话音会话期间执行。
在一个实施例中,呈现所检索的信息的步骤包含步骤:
在第一或第二通信终端中的至少一个的显示器上呈现图像。
在一个实施例中,呈现所检索的信息的步骤包含步骤:
在第一或第二通信终端中的至少一个的显示器上呈现到包含更多与所述关键字有关的数据的信息源的链接。
在一个实施例中,呈现所检索的信息的步骤包含步骤:
借助于第一或第二通信终端中的至少一个中的扬声器发出可听见消息的声音。
在一个实施例中,所述通信终端为移动电话,其通过无线电通信网络交换话音会话的音频信号。
依照本发明的第二方面,所述目的是借助于用于接收信息的***来实现的,该***包括:
第一通信终端和第二通信终端,其被配置成在话音会话中交换音频信号;
语音识别引擎,被连接来接收第一和第二通信终端之间进行的话音会话的音频信号并且识别该音频信号中的关键字;
信息检索单元,被配置成检索与识别的关键字有关的信息;
用户接口,被配置成在第一和第二通信终端中的至少一个中呈现所检索的信息。
在一个实施例中,所述***包括:
通信网络,用于在话音会话期间在第一和第二通信终端之间传送音频信号。
在一个实施例中,所述语音识别引擎位于所述通信网络的网络服务器中。
在一个实施例中,从第一通信终端发送到第二通信终端的或者相反方向发送的音频信号被传递经过所述语音识别引擎。
在一个实施例中,第一和第二通信终端中的至少一个包括:
用户接口,用于输入同意信息的检索和/或呈现的命令;
控制单元,被配置成响应于输入同意命令而控制所述话音会话的音频信号被引导经过包含所述语音识别引擎的网络服务器。
在一个实施例中,所述通信终端中的至少一个的用户接口包括:
呼叫发起功能,可以有选择性地被激活以便发起同意或不同意信息的检索和/或呈现的话音会话通信。
在一个实施例中,所述通信终端中的至少一个的用户接口包括:
语音识别发起功能,可以在话音会话期间有选择性地被激活以便发起音频信号到所述语音识别引擎的传递。
在一个实施例中,所述***包括:
数据存储器,以及
音频记录器,其中所述通信终端中的至少一个的用户接口可操作用于
输入第一命令以便有选择性地发起话音会话的音频信号在所述数据存储器中的记录;
输入第二命令以便有选择性地终止音频信号的记录,并且其中所述语音识别引擎连接到所述数据存储器以便执行对所记录的音频信号的语音识别。
在一个实施例中,所述语音识别引擎位于第一和第二通信终端中的一个中。
在一个实施例中,所述数据存储器位于第一和第二通信终端中的一个中。
在一个实施例中,所述信息检索单元包括信息搜索引擎。
在一个实施例中,所述信息检索单元可通信地连接到因特网以便检索与输入的关键字有关的信息。
在一个实施例中,所述信息检索单元被配置成将识别的关键字与和存储在存储器中的广告信息有关的预定关键字进行匹配,以便检索与该识别的关键字有关的广告。
在一个实施例中,所述用户接口包括用于呈现所检索的信息的显示器。
在一个实施例中,所述用户接口包括用于呈现所检索的信息的扬声器。
附图说明
根据以下参照附图对优选实施例的描述,本发明的特征和优点将变得更加清楚明白,其中:
图1示意性地示出了其中可以采用本发明的手持无线电通信终端;
图2示意性地示出了依照本发明一个实施例配置的、用于通过通信网络在第一终端和第二终端之间进行通信的***;
图3和图4示意性地示出了被配置成记录和存储要依照本发明处理的音频信号的终端的实施例的使用;以及
图5和图6示意性地示出了利用本发明一个实施例进行受赞助的呼叫(sponsored call)的终端的使用。
具体实施方式
本说明书涉及使用通信终端进行话音通信的领域。这样的通信终端可以包括DECT电话或者甚至传统的模拟电话,其可借助于电线电缆连接到PSTN壁装插座。另一种可替换方案是IP电话。这些通信终端也可以是无线电通信终端,例如可操作用于通过无线电基站或者甚至彼此直接进行通信的移动电话。为了清楚起见,本文描述的大多数实施例涉及移动无线电话技术方面的实施例,其为目前已知的本发明的最佳模式。此外,应当强调的是,措词“包括”或“包含”用于本说明书中以及所附权利要求书中以便表示包含的特征、元件或步骤时,绝不应当被解释成排除了未明确表述的其他特征、元件或步骤的存在。
现在将参照附图来描述优选的实施例。
图1示出了便携式通信终端10形式的电子设备,所述便携式通信终端10例如是移动电话,其可以用于本发明的实施例中。终端10包含包括外壳的支撑结构11以及可操作用于输入和输出目的的用户接口。该用户接口包括键区或键盘12以及显示器13。作为一种可替换的解决方案,显示器13可以是触摸敏感的,并且代替键区12或者除了键区12之外还用作输入接口。终端10还包括音频接口,该音频接口包括麦克风14和扬声器15,可用于依照已确立的技术与远距离的一方进行语音会话。此外,终端10一般包括无线电收发器电路、天线、电池以及包含用于无线电通信的相关软件和数据存储器的微处理器***,其全部由支撑结构11承载并且包含在外壳内。作为通信终端的所述电子设备的具体功能和设计本身对于本发明是不重要的,因而将不进行更详细的描述。
本发明涉及使用终端的话音会话的语音识别以及与该话音会话的识别关键字有关的信息的检索和呈现。下面将概述不同的实施例,其中在话音通信***的不同位置处执行本发明的不同任务。为了简单起见,即使不是图2中所有元件都需要包含在每个实施例中,图2中示出的同一附图也将用于描述所述不同实施例中包含的元件之间的功能关系。特定实施例的使用情况参照单独的附图来进一步加以描述。
图2示出了用于接收信息的***的示意性表示,所述***利用了语音识别。该***包括第一通信终端10和第二通信终端30,其被配置成在话音会话中交换音频信号。为此目的,两个终端都配备有参照图1所解释的音频接口。终端10和30不必相同,它们也不必是相同类型的通信终端。举例而言,终端10可以是蜂窝移动电话,而终端30为标准的PSTN电话。为了简单起见,将主要针对第一终端10来描述其功能细节和执行的处理步骤。
终端10和30可以借助于导线和中间电话网络、通过无线电和中间无线电通信网络或者在某些实施例中甚至彼此直接地进行互连。在图2示出的实施例中,两个终端10和30都是移动电话,其通过诸如WCDMA网络之类的无线电通信网络40进行通信。
所述***包括语音识别引擎,该语音识别引擎被连接来接收第一10和第二30通信终端之间进行的话音会话的音频信号。该语音识别引擎可以设置在终端10或30内部,或者设置在网络40中,这将针对不同的实施例来解释。此外,该语音识别引擎被配置成识别话音会话的音频信号中的一个或多个关键字。信息检索单元可通信地连接到该语音识别引擎,被配置成检索与识别的关键字有关的信息并且借助于第一10和第二30通信终端中的用户接口向这些通信终端中的至少一个的用户呈现所检索的信息。
所述语音识别引擎的特有特性在本文献中没有详细地展示出来,因为特定的技术选择对于本发明不是关键的。然而,应当指出的是,一种已知且可用的语音识别引擎或***包括两个主要部分:特征提取(或前端)级和模式匹配(或后端)级。所述前端有效地提取与识别语音信号有关的语音参数(一般称为特征),所述语音信号即代表语音的音频信号。所述后端接收这些特征并且执行实际的识别。特征提取前端的任务是以从实时语音信号中提取最重要的信息的方式将该语音信号转换成参数表示。所述后端一般基于隐式马尔科夫(Markov)模型(HMM),该统计模型以根据与不同语音状态相应的一组参数识别很可能的语词或音素的方式来适应语音。语音特征提供这些参数。可以分散所述语音识别操作,使得所述前端和后端彼此分离,例如,前端可以驻留在移动电话中,而后端可以位于别处并且连接到移动电话网络。自然,由前端提取的语音特征可以用于包括前端和后端二者的设备中。目的在于,所提取的特征矢量对于由背景噪声、用来捕获语音信号的非理想设备以及如果使用了分布式语音识别的话由通信信道引起的失真是健壮的(robust)。捕获的语音信号的语音识别一般以时域电语音信号的模数转换(如果不存在该语音信号的数字表示)、预强调(pre-emphasis)和分段(segmentation)开始。预强调强调其中语音信号的幅度通常更小的这样的频率上的幅度。分段将该信号分割成帧,每帧代表短的时间段,通常为20-30毫秒。这些帧或者在时间上重叠或者不重叠。语音特征通过使用这些帧来产生,通常为Me1频率倒谱系数(MFCC)的形式。MFCC在其中存在少量或者不存在背景噪声的情形中可以提供良好的语音识别精度,但是在仅存在中等水平的噪声水平时性能显著下降。存在若干提高采用MFCC方法的语音识别前端的噪声健壮性的技术。所谓的倒谱域参数归一化(CN)是用于此目的的一种技术。落入该类别的方法试图归一化所提取的特征,以便在整个输入话语上在倒谱域中实现某些希望的统计性质,例如零均值或者零均值和单位方差。WO94/22132中给出了一种用于语音识别的***和方法,其通过引用包含于此。
在第一实施例中,语音识别引擎18包含在第一终端10中。如前面段落中所隐含概括的,语音识别是一种计算机处理,语音识别引擎因而一般包括可在计算机***中执行的计算机程序代码,例如可通过移动电话的微处理器或者可在网络服务器中执行的计算机程序代码。图2的框18表示用于语音识别引擎的计算机程序对象,其在功能上连接到终端10的控制单元16,该控制单元16一般为具有关联的操作***和存储空间的微处理器。语音识别引擎18还可以连接到用于存储信息的关联数据存储器19,其将被加以概述。图2中还示意性地示出了终端10的用户接口,包括麦克风14、扬声器15、键区12和显示器13。此外,终端10包括收发器单元17,其在所示的这个实施例中为连接到天线20的无线电信号发射器和接收器。依照已确立的技术,终端10被配置成在网络40上通过天线20与网络40的基站41之间的无线电通信与远距离的一方30进行通信。该远距离的一方的终端30还可通信地连接到网络40的另一个基站42或者有可能连接到相同的基站。
在本发明的一个实施例中,在终端10的第一用户和终端30的第二用户之间发起话音会话。当进行该话音会话时,出现其中这些用户的一个或者两个对获得有关他们话题的更多信息感兴趣的情形。于是,终端10的用户可能优选地借助于键区12在终端10中输入开始将该话音会话的音频信号传递到语音识别引擎18的命令。也可以给出终止音频信号到语音识别引擎18的传递的第二命令,从而规定时间上受限的音频信号段要经受语音识别。通过这种方式,可以发出用于语音识别的选定数量的短语或关键字,以便引导语音识别引擎18正确地识别关键字,而不是对整个会话执行语音识别。在一个实施例中,在作出命令之后将音频信号实时传递到语音识别引擎18。在一个可替换实施例中,终端10包括音频记录器21,其由借助于键区12给出的命令进行控制以便发起和终止记录话音会话的音频信号和将记录的音频信号段保存在存储器19中。然后,语音识别引擎18对所记录的音频信号执行语音识别以便识别关键字。
接下来,将由语音识别引擎18识别的关键字传递到信息搜索引擎。在一个实施例中,终端10拥有构成控制单元16的软件的一部分的这种信息搜索引擎。该信息搜索引擎使用信号收发器17来连接到网络40,并且从那里优选地连接到因特网以便收集信息。可替换地,终端10可以具有到因特网的单独的通信链接,而不涉及通过其进行与远程终端30的通信的链接。例如,终端10可以通过WCDMA网络40与终端30进行通信,同时具有在另一频带上并且使用另一信号收发器的到因特网的WLAN连接,或者甚至具有到因特网的有线连接。所述信息搜索引擎执行信息搜索,并且检索与所述关键字有关的信息。
然后,将所检索的信息呈现给终端10或30或者两者的用户。在一个优选的实施例中,在显示器13上通过使用文本、符号、图片或视频以图形方式呈现所检索的信息。作为一种可替换的解决方案,所述信息可以借助于声音,例如通过使用终端10的15或者附加的免提扬声器来呈现。然后,可以通过合成话音来读该信息,或者可替换地,该信息可以作为音频信号通过所述信息搜索引擎来获得。
优选地,执行语音识别以便识别关键字、检索与这些关键字有关的信息以及在终端10和30中的一个或两个上呈现该信息的步骤是在进行所述话音会话的同时执行的。这意味着建立起给传统话音呼叫提供附加值的在线服务。
图3和图4示意性地示出了在终端10中使用依照本发明的实施例,所述终端10是在话音会话期间进行通信的两个或多个终端中的一个。当话音会话正在进行时,在显示器13上呈现软键标签131,其链接到键区12的相邻按键121。软键标签131显示可选择的命令“记录(REC)”,其表示按压按键121会发起对借助于麦克风14输入的或者借助于扬声器15输出的或者通过这两种方式得到的音频信号进行记录。优选地,一旦给出REC命令,则记录由麦克风14捕获的音频信号。在一个实施例中,记录持续预设的时间段(例如5秒),然后自动地终止。可替换地,记录一直继续,直到在终端10中输入了终止记录的第二命令。这可以按照不同的方式来解决。一种选择是使用双击过程,从而标签131在发起记录之后变为显示另一个命令。图4示出了这种实例,其中标签131在发起记录之后切换成显示“获取(GET)”。当第二次按压按键121时,记录终止,其中在语音识别过程之后优选地自动开始信息的检索。一种可替换的解决方案是,只要保持按下按键121,则继续记录,从而当松开按键121时终止记录。另一种可替换方案当然是按压另一按键以便终止记录。
在使用实时语音识别的实施例中,代之以向下按压按键121来发起。于是,标签131优选地具有另一种文本,例如“解释(INTERPRET)”或者只是“获取信息(GET INFO)”,因为激活按键121开始语音识别、关键字识别和信息检索过程。语音识别过程的终止可以按照与以上所述类似的方式来实现,即通过重新激活按键121或者通过释放按键121来实现。
在使用本发明的这个实施例的场景中,用户A使用终端10来发起到用户B的终端30的话音呼叫。用户A和B开始争论“anemonenemorosa”(遮荫银莲花)的别名是sunflower(向日葵)还是windflower(银莲花)。然后,用户A按压按键121并且说出“anemonenemorosa”,从而用户A的语音信号由麦克风14捕获,由音频记录器21记录并且存储在存储器19中。当用户A第一次按压按键121时,标签131变为“获取(GET)”,当说出上述语词之后再次按压按键121时,记录被终止,并且语音识别引擎18被激活来识别所记录的信号中的关键字。在当前情况下,输入语音信号为这样的关键字,一旦语音识别引擎18识别了这些关键字,它们就被发送到所述信息搜索引擎。然后,该搜索引擎一般将在因特网上找到植物信息站点,但是可替换地可在网络40中或者在终端10中的本地存储器中找到植物信息的位置,从中检索与输入关键字有关的信息。然后,至少在终端10上,优选地在显示器13上呈现所检索的信息。该信息可以作为明文或者利用关联的图片来呈现,或者仅仅呈现为到由所述信息搜索引擎发现的信息源的一个或多个链接,所述链接可以被激活以便定位另外的信息。在所概述的这个实例中,检索的信息可以包括到所述植物信息站点的链接,并且使用终端10激活该链接揭示“anemonenemorosa”的别名真的是windflower。通过这种方式,在使用终端10进行话音会话的同时获得了信息,而不必主动地使用任何其他用于检索信息的手段,例如书本或单独的计算机。
作为使用嵌入式语音识别引擎18的一种可替换方案,所记录的音频段可以经由信号收发器17发送到网络40的网络服务器43中容纳的语音识别引擎18。在这种情况下,网络服务器43的语音识别引擎中识别的关键字被往回发送到终端10,也可能发送到终端30,其中所述信息被呈现。该信息可以例如使用WAP来发送或者作为sms或mms消息来发送。这个实施例的另一种可替换方案是,也采用存储器来将记录的音频信号存储到网络40中。
利用本发明特征的本发明另一个实施例涉及用于提供受赞助的呼叫的方法。这个实施例利用语音识别引擎来识别终端10和30之间的话音会话中的关键字,并且将与这些关键字有关的广告信息提供给至少从其发起所述呼叫的终端。通过这种方式,所述呼叫的成本可以部分地或者全部由广告公司赞助。优选地,终端10的用户必须同意信息的检索和呈现,即用户必须同意接收广告信息。这种同意可以通过在终端10中输入命令来实现,或者在签名订购时就已经实现了,结果受赞助呼叫功能被设置为缺省值。然后,终端10像任何其他通信终端一样用于发起话音呼叫。也可以通过在终端10中输入命令在进行的通过终端10发起的呼叫期间选择利用所述受赞助呼叫特征。
在一个可替换的实施例中,终端10的用户在进行呼叫时必须总是选择应当发起受赞助的呼叫或者正常的未受赞助的呼叫。图5和图6中示出了这种实施例。在图5中,终端10的用户通过借助于键区12或者借助于从联系列表中取来电话号码来输入电话号码而发起呼叫。该电话号码呈现在显示器13上的框133中。与按键121有关的软键标签132显示命令“呼叫(CALL)”,并且当CALL命令通过按压按键121给出时,用户被询问是否发起受赞助的呼叫。图6中示出了这样做的一种方式。当已经给出CALL命令时,在框133中显示所述查询,或者可能除了所输入的电话号码之外还显示所述查询。在按键121之上出现“是(YES)”标签,在另一按键122之上出现“否(NO)”标签。按压“是(YES)”软键121发起受赞助的呼叫,而按压“否(NO)”软键122发起正常呼叫。
当作为缺省设置或者与刚刚发起的特定呼叫有关的选择而选择了受赞助的呼叫时,通过网络40建立起呼叫,结果进行的话音会话的通信信号被引导通过包含语音识别引擎的网络服务器43。在这个场景中,一般对数字音频信号执行语音识别,因而所述语音识别引擎不执行模数转换步骤。语音识别引擎可以被配置成分析所述话音通信中说出的每个语词,但是优选地仅被配置成识别一组有限的关键字。在一个实施例中,也可以向订户呈现这组关键字,并且订户例如一旦签名订购则同意它们,以便挑选出不希望类型的广告。然后,服务器43中的信息检索单元将由语音识别引擎确定的关键字与和存储在数据存储器44中的广告信息有关的关键字进行匹配。如果找到匹配,那么从存储器44中检索相应的广告并且将其发送到终端10,可能也发送到终端30,以便向用户呈现。
当提供终端10中使用的订购的运营商登记已经选择了受赞助的呼叫时,一般将向广告公司收取该呼叫的部分获全部成本,而不是由订户支付该呼叫的全部成本。可替换地,运营商支持(stand for)呼叫成本,并且依照发送到通信终端的广告数量向广告公司收费。此外,作为一种实际降低用户的呼叫成本的可替换方案,终端10的用户可以改为受益于针对个人的出价(personal offer),例如广告公司提供的产品或服务的折扣。
在使用本发明的这个实施例的场景中,用户A使用终端10来发起到用户B的终端30的话音呼叫。一旦输入终端30的电话号码并且依照图5和图6两次按压按键121,那么就发起受赞助的呼叫。在用户A和B之间进行的话音会话期间,语音识别引擎分析经过网络服务器43的音频信号。当该会话包括谈及索尼爱立信(Sony Ericsson)时,在所述语音识别引擎中将这识别为关键字,并且发现该关键字是多个与存储在存储器44中的广告信息有关的预定关键字之一。然后,从存储器44中或者通过到网络40中的另一节点的连接检索与该关键字有关的广告信息对象,并且将其发送到终端10。用户A将通过发现显示器13上突然弹出具有与匹配的关键字(在这种情况下为索尼爱立信)有关的广告的浏览器窗口而注意到这一点。所述广告也可以包括例如由终端10上的第二扬声器播放的声音。该广告本身不必由该公司提供,相反地,它例如可以是来自运营商的广告,特殊出价涉及有补贴的索尼爱立信移动电话。该出价本身可能是用户获得的唯一益处,可替换地,所述呼叫本身也可以被部分地或者完全折扣。此外,所述广告可以只发送到终端10,或者也发送到终端30。
上面已经详细地描述了本发明的优选实施例,但是应当理解的是,本领域技术人员可以做出各种改变。因此,本发明不应当被解释为限于本说明书和附图中所展示的实例。
Claims (34)
1.一种用于在通信终端中接收信息的方法,包括步骤:
在第一通信终端和第二通信终端之间发起话音会话;
将该话音会话的音频信号传递给语音识别引擎以便从该话音会话中识别关键字;
检索与所述关键字有关的信息;
在第一和第二通信终端中的至少一个中呈现所检索的信息。
2.权利要求1的方法,其中,通过通信网络进行所述话音会话。
3.权利要求2的方法,其中,所述语音识别引擎位于所述通信网络的网络服务器中。
4.权利要求3的方法,其中,从第一通信终端发送到第二通信终端的或者相反方向发送的音频信号被传递经过所述语音识别引擎。
5.权利要求1的方法,包括步骤:
在第一和第二通信终端中的至少一个中输入同意信息的检索和/或呈现的命令,从而
控制所述话音会话的通信信号被引导经过包含所述语音识别引擎的网络服务器。
6.权利要求5的方法,其中,输入同意信息的检索和/或呈现的命令的步骤作为缺省设置是在发起所述话音会话之前执行的。
7.权利要求5的方法,其中,输入同意信息的呈现的命令的步骤是在发起所述话音会话的步骤期间执行的。
8.权利要求1的方法,包括步骤:
在所述话音会话期间在第一和第二通信终端中的至少一个中输入发起所述音频信号到所述语音识别引擎的传递的命令。
9.权利要求1的方法,包括步骤:
在所述话音会话期间在第一和第二通信终端中的至少一个中输入将该话音会话的音频信号记录在数据存储器中的命令;
输入终止所述音频信号的记录的命令;
将所记录的音频信号传递到所述语音识别引擎。
10.权利要求1的方法,其中,所述语音识别引擎位于第一和第二通信终端中的一个中。
11.权利要求9的方法,其中,所述数据存储器位于第一和第二通信终端中的一个中。
12.权利要求1的方法,其中,检索与所述关键字有关的信息的步骤包括步骤:
在信息搜索引擎中输入该关键字。
13.权利要求1的方法,其中,检索与所述关键字有关的信息的步骤包括步骤:
在因特网上搜索与所述输入的关键字有关的信息。
14.权利要求1的方法,其中,检索与所述关键字有关的信息的步骤包括步骤:
将该关键字与和存储在存储器中的广告信息有关的预定关键字进行匹配,以便检索与该识别的关键字有关的广告。
15.权利要求1的方法,其中,呈现所检索的信息的步骤在发起的话音会话期间执行。
16.权利要求1的方法,其中,呈现所检索的信息的步骤包含步骤:
在第一或第二通信终端中的至少一个的显示器上呈现图像。
17.权利要求1的方法,其中,呈现所检索的信息的步骤包含步骤:
在第一或第二通信终端中的至少一个的显示器上呈现到包含更多与所述关键字有关的数据的信息源的链接。
18.权利要求1的方法,其中,呈现所检索的信息的步骤包含步骤:
借助于第一或第二通信终端中的至少一个中的扬声器发出可听见的消息的声音。
19.权利要求1的方法,其中,所述通信终端为移动电话,其通过无线电通信网络交换所述话音会话的音频信号。
20.用于接收信息的***,包括:
第一通信终端和第二通信终端,被配置成在话音会话中交换音频信号;
语音识别引擎,被连接来接收第一和第二通信终端之间进行的话音会话的音频信号并且识别该音频信号中的关键字;
信息检索单元,被配置成检索与识别的关键字有关的信息;
用户接口,被配置成在第一和第二通信终端中的至少一个中呈现所检索的信息。
21.权利要求20的***,包括:
通信网络,用于在话音会话期间在第一和第二通信终端之间传送音频信号。
22.权利要求21的***,其中,所述语音识别引擎位于所述通信网络的网络服务器中。
23.权利要求22的***,其中,从第一通信终端发送到第二通信终端的或者相反方向发送的音频信号被传递经过所述语音识别引擎。
24.权利要求20的***,其中,第一和第二通信终端中的至少一个包括:
用户接口,用于输入同意信息的检索和/或呈现的命令;
控制单元,被配置成响应于输入同意命令而控制所述话音会话的音频信号被引导经过包含所述语音识别引擎的网络服务器。
25.权利要求24的***,其中,所述通信终端中的至少一个的用户接口包括:
呼叫发起功能,可以有选择性地被激活以便发起同意或不同意信息的检索和/或呈现的话音会话通信。
26.权利要求20的***,其中,所述通信终端中的至少一个的用户接口包括:
语音识别发起功能,可以在话音会话期间有选择性地被激活以便发起音频信号到所述语音识别引擎的传递。
27.权利要求20的***,包括:
数据存储器,以及
音频记录器,其中,所述通信终端中的至少一个的用户接口可操作用于
输入第一命令以便有选择性地发起话音会话的音频信号在所述数据存储器中的记录;
输入第二命令以便有选择性地终止所述音频信号的记录,并且其中所述语音识别引擎连接到所述数据存储器以便执行对所记录的音频信号的语音识别。
28.权利要求20的***,其中,所述语音识别引擎位于第一和第二通信终端中的一个中。
29.权利要求27的***,其中,所述数据存储器位于第一和第二通信终端中的一个中。
30.权利要求20的***,其中,所述信息检索单元包括信息搜索引擎。
31.权利要求20的***,其中,所述信息检索单元可通信地连接到因特网以便检索与输入的关键字有关的信息。
32.权利要求20的***,其中,所述信息检索单元被配置成将识别的关键字与和存储在存储器中的广告信息有关的预定关键字进行匹配,以便检索与该识别的关键字有关的广告。
33.权利要求20的***,其中,所述用户接口包括用于呈现所检索的信息的显示器。
34.权利要求20的***,其中,所述用户接口包括用于呈现所检索的信息的扬声器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/379,385 US20070249406A1 (en) | 2006-04-20 | 2006-04-20 | Method and system for retrieving information |
US11/379,385 | 2006-04-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101473636A true CN101473636A (zh) | 2009-07-01 |
Family
ID=37546597
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800550664A Pending CN101473636A (zh) | 2006-04-20 | 2006-10-20 | 用于检索信息的方法和*** |
Country Status (4)
Country | Link |
---|---|
US (1) | US20070249406A1 (zh) |
EP (1) | EP2008438A1 (zh) |
CN (1) | CN101473636A (zh) |
WO (1) | WO2007121792A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102316227A (zh) * | 2010-07-06 | 2012-01-11 | 宏碁股份有限公司 | 语音通话过程中数据处理方法 |
CN102917144A (zh) * | 2011-09-16 | 2013-02-06 | 斯凯普公司 | 广告出资的电话呼叫 |
WO2014043880A1 (zh) * | 2012-09-20 | 2014-03-27 | 东莞宇龙通信科技有限公司 | 终端、服务器和信息推送方法 |
CN103916514A (zh) * | 2012-12-31 | 2014-07-09 | 联想(北京)有限公司 | 一种数据处理方法、装置及一种通信终端 |
CN104144108A (zh) * | 2013-09-30 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 一种消息响应方法、装置及*** |
WO2015165379A1 (zh) * | 2014-05-01 | 2015-11-05 | 刘莎 | 一种互联网信息通用人工呼叫服务方法 |
CN105157742A (zh) * | 2014-04-29 | 2015-12-16 | 杭州美盛红外光电技术有限公司 | 识别装置和识别方法 |
CN105407316A (zh) * | 2014-08-19 | 2016-03-16 | 北京奇虎科技有限公司 | 智能摄像***的实现方法、智能摄像***和网络摄像头 |
CN106601240A (zh) * | 2015-10-16 | 2017-04-26 | 三星电子株式会社 | 归一化声学模型的输入数据的设备和方法和语音识别设备 |
CN107690636A (zh) * | 2015-05-28 | 2018-02-13 | 三星电子株式会社 | 电子设备、信息提供***及其信息提供方法 |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US7516190B2 (en) | 2000-02-04 | 2009-04-07 | Parus Holdings, Inc. | Personal voice-based information retrieval system |
US7707039B2 (en) | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US8442331B2 (en) | 2004-02-15 | 2013-05-14 | Google Inc. | Capturing text from rendered documents using supplemental information |
US10635723B2 (en) | 2004-02-15 | 2020-04-28 | Google Llc | Search engines and systems with handheld document data capture devices |
US20060104515A1 (en) * | 2004-07-19 | 2006-05-18 | King Martin T | Automatic modification of WEB pages |
US7812860B2 (en) | 2004-04-01 | 2010-10-12 | Exbiblio B.V. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
US8146156B2 (en) | 2004-04-01 | 2012-03-27 | Google Inc. | Archive of text captures from rendered documents |
US20060098900A1 (en) | 2004-09-27 | 2006-05-11 | King Martin T | Secure data gathering from rendered documents |
US7990556B2 (en) | 2004-12-03 | 2011-08-02 | Google Inc. | Association of a portable scanner with input/output and storage devices |
US9116890B2 (en) | 2004-04-01 | 2015-08-25 | Google Inc. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US9008447B2 (en) | 2004-04-01 | 2015-04-14 | Google Inc. | Method and system for character recognition |
WO2008028674A2 (en) | 2006-09-08 | 2008-03-13 | Exbiblio B.V. | Optical scanners, such as hand-held optical scanners |
US7894670B2 (en) | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US9143638B2 (en) | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
US8081849B2 (en) | 2004-12-03 | 2011-12-20 | Google Inc. | Portable scanning and memory device |
US20060081714A1 (en) | 2004-08-23 | 2006-04-20 | King Martin T | Portable scanning device |
US8713418B2 (en) | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
US8620083B2 (en) | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US8489624B2 (en) | 2004-05-17 | 2013-07-16 | Google, Inc. | Processing techniques for text capture from a rendered document |
US8874504B2 (en) | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
US8346620B2 (en) | 2004-07-19 | 2013-01-01 | Google Inc. | Automatic modification of web pages |
US8972268B2 (en) * | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
US11222185B2 (en) | 2006-10-26 | 2022-01-11 | Meta Platforms, Inc. | Lexicon development via shared translation database |
US10664850B2 (en) * | 2006-12-29 | 2020-05-26 | Provenance Asset Group Llc | Providing advertising content to at least one communicating terminal |
US20090300657A1 (en) | 2008-05-27 | 2009-12-03 | Kumari Tripta | Intelligent menu in a communication device |
KR20100007625A (ko) * | 2008-07-14 | 2010-01-22 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 표시 방법 |
US20100057528A1 (en) * | 2008-08-30 | 2010-03-04 | Yan Pan | Methods for rendering advertisement messages by the use of a mobile communication device |
FR2935854B1 (fr) * | 2008-09-11 | 2011-02-18 | Alcatel Lucent | Procede et systeme de communication pour l'affichage d'un lien vers un service a partir d'une expression enoncee en cours de conversation. |
KR101528266B1 (ko) * | 2009-01-05 | 2015-06-11 | 삼성전자 주식회사 | 휴대 단말기 및 그의 응용프로그램 제공 방법 |
CN102369724B (zh) | 2009-02-18 | 2016-05-04 | 谷歌公司 | 自动捕获信息,例如使用文档感知设备捕获信息 |
US8934406B2 (en) * | 2009-02-27 | 2015-01-13 | Blackberry Limited | Mobile wireless communications device to receive advertising messages based upon keywords in voice communications and related methods |
EP2224684B1 (en) | 2009-02-27 | 2013-02-13 | Research In Motion Limited | Mobile wireless communications device to receive advertising messages based upon keywords in voice communications and related methods |
WO2010105245A2 (en) | 2009-03-12 | 2010-09-16 | Exbiblio B.V. | Automatically providing content associated with captured information, such as information captured in real-time |
US8447066B2 (en) | 2009-03-12 | 2013-05-21 | Google Inc. | Performing actions based on capturing information from rendered documents, such as documents under copyright |
CN101894108A (zh) * | 2009-05-19 | 2010-11-24 | 上海易狄欧电子科技有限公司 | 网上搜索书源的方法及其*** |
US20110014952A1 (en) * | 2009-07-15 | 2011-01-20 | Sony Ericsson Mobile Communications Ab | Audio recognition during voice sessions to provide enhanced user interface functionality |
US9081799B2 (en) | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
US9323784B2 (en) | 2009-12-09 | 2016-04-26 | Google Inc. | Image search using text-based elements within the contents of images |
US9224396B2 (en) * | 2010-06-02 | 2015-12-29 | Nokia Technologies Oy | Enhanced context awareness for speech recognition |
KR101759190B1 (ko) * | 2011-01-04 | 2017-07-19 | 삼성전자주식회사 | 휴대용 무선 단말기에서 통화 중 위급상황을 신고하기 위한 방법 및 장치 |
EP2675147B1 (en) | 2012-06-11 | 2022-03-23 | Samsung Electronics Co., Ltd. | Service providing system in a vehicle including display device and mobile device, and method for providing service using the same |
US10006769B2 (en) | 2012-06-11 | 2018-06-26 | Samsung Electronics Co., Ltd. | Terminal apparatus, method and system for setting up destination and providing information |
EP2701372A1 (en) * | 2012-08-20 | 2014-02-26 | BlackBerry Limited | Methods and devices for storing recognized phrases |
CN103024117A (zh) * | 2012-11-29 | 2013-04-03 | 广东欧珀移动通信有限公司 | 一种利用语音识别录入联系人的***、方法和移动终端 |
EP2753052B1 (en) * | 2013-01-02 | 2017-10-04 | Samsung Electronics Co., Ltd | Message transfer system including display device and mobile device and message transfer method thereof |
US10070283B2 (en) * | 2013-03-15 | 2018-09-04 | Eolas Technologies Inc. | Method and apparatus for automatically identifying and annotating auditory signals from one or more parties |
US9300718B2 (en) * | 2013-04-09 | 2016-03-29 | Avaya Inc. | System and method for keyword-based notification and delivery of content |
KR102092058B1 (ko) | 2013-07-01 | 2020-03-23 | 삼성전자 주식회사 | 인터페이스 제공 방법 및 장치 |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
TW201541328A (zh) * | 2014-04-30 | 2015-11-01 | Maetay Prec Co Ltd | 可根據所接收的語音切換使用者介面之手持式電子裝置及其使用者介面切換方法 |
US9990814B1 (en) | 2015-08-04 | 2018-06-05 | Wells Fargo Bank, N.A. | Automatic notification generation |
US10614108B2 (en) | 2015-11-10 | 2020-04-07 | International Business Machines Corporation | User interface for streaming spoken query |
EP3179472B1 (en) * | 2015-12-11 | 2020-03-18 | Sony Mobile Communications, Inc. | Method and device for recording and analyzing data from a microphone |
KR102389041B1 (ko) | 2017-08-11 | 2022-04-21 | 엘지전자 주식회사 | 이동단말기 및 머신 러닝을 이용한 이동 단말기의 제어방법 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU5803394A (en) * | 1992-12-17 | 1994-07-04 | Bell Atlantic Network Services, Inc. | Mechanized directory assistance |
US6460036B1 (en) * | 1994-11-29 | 2002-10-01 | Pinpoint Incorporated | System and method for providing customized electronic newspapers and target advertisements |
EP0847003A3 (en) * | 1996-12-03 | 2004-01-02 | Texas Instruments Inc. | An audio memo system and method of operation thereof |
US6282511B1 (en) * | 1996-12-04 | 2001-08-28 | At&T | Voiced interface with hyperlinked information |
JPH11252281A (ja) * | 1998-02-27 | 1999-09-17 | Matsushita Electric Ind Co Ltd | 電話端末装置 |
JP2002540477A (ja) * | 1999-03-26 | 2002-11-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | クライアント−サーバ音声認識 |
JP2001197223A (ja) * | 2000-01-06 | 2001-07-19 | Sony Corp | 通信システム、通信管理装置及び方法 |
US6720980B1 (en) * | 2000-03-01 | 2004-04-13 | Microsoft Corporation | Method and system for embedding voice notes |
US6773344B1 (en) * | 2000-03-16 | 2004-08-10 | Creator Ltd. | Methods and apparatus for integration of interactive toys with interactive television and cellular communication systems |
US20020049600A1 (en) * | 2000-05-12 | 2002-04-25 | Lernout & Hauspie Speech Products N.V. | Speech processor apparatus and system |
US20040137945A1 (en) * | 2000-07-31 | 2004-07-15 | Matsushita Electric Industrial Co., Ltd. | Data recording system for storing as data the contents of telephone calls made by internal telephones and by mobile telephones having memory card data storage function |
JP2003032388A (ja) * | 2001-07-12 | 2003-01-31 | Denso Corp | 通信端末装置及び処理システム |
US7146320B2 (en) * | 2002-05-29 | 2006-12-05 | Microsoft Corporation | Electronic mail replies with speech recognition |
WO2006043128A1 (en) * | 2004-10-22 | 2006-04-27 | Nokia Corporation | Recording data at a mobile telephone during a telephone call |
US7672931B2 (en) * | 2005-06-30 | 2010-03-02 | Microsoft Corporation | Searching for content using voice search queries |
US20070239724A1 (en) * | 2005-09-14 | 2007-10-11 | Jorey Ramer | Mobile search services related to direct identifiers |
US20070078708A1 (en) * | 2005-09-30 | 2007-04-05 | Hua Yu | Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements |
US20070116227A1 (en) * | 2005-10-11 | 2007-05-24 | Mikhael Vitenson | System and method for advertising to telephony end-users |
US7477909B2 (en) * | 2005-10-31 | 2009-01-13 | Nuance Communications, Inc. | System and method for conducting a search using a wireless mobile device |
US20080154870A1 (en) * | 2006-12-26 | 2008-06-26 | Voice Signal Technologies, Inc. | Collection and use of side information in voice-mediated mobile search |
-
2006
- 2006-04-20 US US11/379,385 patent/US20070249406A1/en not_active Abandoned
- 2006-10-20 WO PCT/EP2006/067625 patent/WO2007121792A1/en active Application Filing
- 2006-10-20 CN CNA2006800550664A patent/CN101473636A/zh active Pending
- 2006-10-20 EP EP06807439A patent/EP2008438A1/en not_active Withdrawn
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102316227A (zh) * | 2010-07-06 | 2012-01-11 | 宏碁股份有限公司 | 语音通话过程中数据处理方法 |
CN102917144A (zh) * | 2011-09-16 | 2013-02-06 | 斯凯普公司 | 广告出资的电话呼叫 |
US10498889B2 (en) | 2011-09-16 | 2019-12-03 | Skype | Advertisement funded telephone calls |
CN102917144B (zh) * | 2011-09-16 | 2017-06-13 | 斯凯普公司 | 广告出资的电话呼叫 |
US9607614B2 (en) | 2012-09-20 | 2017-03-28 | Yulong Computer Telecommunication Scientific (Shenzhen) Co., Ltd. | Terminal, server and information pushing method |
WO2014043880A1 (zh) * | 2012-09-20 | 2014-03-27 | 东莞宇龙通信科技有限公司 | 终端、服务器和信息推送方法 |
CN104322139A (zh) * | 2012-09-20 | 2015-01-28 | 东莞宇龙通信科技有限公司 | 终端、服务器和信息推送方法 |
CN103916514A (zh) * | 2012-12-31 | 2014-07-09 | 联想(北京)有限公司 | 一种数据处理方法、装置及一种通信终端 |
CN103916514B (zh) * | 2012-12-31 | 2019-04-26 | 联想(北京)有限公司 | 一种数据处理方法、装置及一种通信终端 |
CN104144108B (zh) * | 2013-09-30 | 2017-07-25 | 腾讯科技(深圳)有限公司 | 一种消息响应方法、装置及*** |
CN104144108A (zh) * | 2013-09-30 | 2014-11-12 | 腾讯科技(深圳)有限公司 | 一种消息响应方法、装置及*** |
CN105157742A (zh) * | 2014-04-29 | 2015-12-16 | 杭州美盛红外光电技术有限公司 | 识别装置和识别方法 |
WO2015165379A1 (zh) * | 2014-05-01 | 2015-11-05 | 刘莎 | 一种互联网信息通用人工呼叫服务方法 |
CN105407316A (zh) * | 2014-08-19 | 2016-03-16 | 北京奇虎科技有限公司 | 智能摄像***的实现方法、智能摄像***和网络摄像头 |
CN107690636A (zh) * | 2015-05-28 | 2018-02-13 | 三星电子株式会社 | 电子设备、信息提供***及其信息提供方法 |
CN106601240A (zh) * | 2015-10-16 | 2017-04-26 | 三星电子株式会社 | 归一化声学模型的输入数据的设备和方法和语音识别设备 |
CN106601240B (zh) * | 2015-10-16 | 2021-10-01 | 三星电子株式会社 | 归一化声学模型的输入数据的设备和方法和语音识别设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2007121792A1 (en) | 2007-11-01 |
EP2008438A1 (en) | 2008-12-31 |
US20070249406A1 (en) | 2007-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101473636A (zh) | 用于检索信息的方法和*** | |
CN101971250B (zh) | 具有活动语音识别的移动电子设备 | |
CN102117614B (zh) | 个性化文本语音合成和个性化语音特征提取 | |
JP4447045B2 (ja) | 文字メッセージの統合管理機能を提供する移動通信端末機及びその方法 | |
CN102938803A (zh) | 可扩展的语音命令 | |
JP2008544629A (ja) | 文字メッセージに含まれている電話番号にハイパーリンク機能を提供する移動通信端末機及びその方法 | |
CN103000175A (zh) | 一种语音识别的方法及移动终端 | |
RU2374780C2 (ru) | Обработка телефонных номеров в звуковых потоках | |
CN102833428A (zh) | 自动语音服务中显示菜单选项的方法及通信终端 | |
CN101087151A (zh) | 便携式装置的远程控制***和方法 | |
CN101826896A (zh) | 通信终端、发送方法和发送*** | |
CN104333641B (zh) | 通话方法及装置 | |
CN101784025A (zh) | 快捷键式语音信息发送方法及其移动电话 | |
CN1777209A (zh) | 通过语音报告来电或消息接收的设备和方法 | |
JP2007516655A (ja) | キャッシュ機能を有する分散音声認識システムおよび方法 | |
US7164934B2 (en) | Mobile telephone having voice recording, playback and automatic voice dial pad | |
US20130103403A1 (en) | Responding to a call to action contained in an audio signal | |
KR100380829B1 (ko) | 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체 | |
CN111274828B (zh) | 基于留言的语言翻译方法、***、计算机程序和手持终端 | |
KR100462042B1 (ko) | 이동 통신망을 이용한 메시지를 전송하는 방법 및 시스템 | |
KR100432938B1 (ko) | 개인별로 구분된 음성 사서함 배경 음악 구성 방법 및 장치 | |
JP4017315B2 (ja) | ボイスメールサービス方法及びボイスメールサービスシステム | |
CN101552961A (zh) | 基于短信息的流媒体定制***及其实现方法 | |
US20080317226A1 (en) | Handheld device for transmitting a visual format message | |
CN201430625Y (zh) | 快捷键式语音信息发送的移动电话 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090701 |