CN103443853A - 自动化谈话辅助 - Google Patents
自动化谈话辅助 Download PDFInfo
- Publication number
- CN103443853A CN103443853A CN2012800135436A CN201280013543A CN103443853A CN 103443853 A CN103443853 A CN 103443853A CN 2012800135436 A CN2012800135436 A CN 2012800135436A CN 201280013543 A CN201280013543 A CN 201280013543A CN 103443853 A CN103443853 A CN 103443853A
- Authority
- CN
- China
- Prior art keywords
- user
- words
- voice
- profile information
- subscriber profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 230000005055 memory storage Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 206010028916 Neologism Diseases 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000005433 ionosphere Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/433—Query formulation using audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4936—Speech interaction details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
- H04M3/4938—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals comprising a voice browser which renders and interprets, e.g. VoiceXML
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2207/00—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place
- H04M2207/40—Type of exchange or network, i.e. telephonic medium, in which the telephonic communication takes place terminals with audio html browser
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明呈现用于提供自动化谈话辅助的方法、设备、***和计算机可读媒体。根据一个或一个以上方面,一种计算装置可获得与所述计算装置的用户相关联的用户简档信息,所述用户简档信息包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表。随后,所述计算装置可基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中。接着,所述计算装置可基于所述所选择的一个或一个以上词语产生所述搜索查询。
Description
相关申请案的交叉参考
本专利申请案主张2011年3月16日申请且标题为“音频处理期间充当自动化信息助理的移动装置(Mobile Device Acting As Automated Information Assistant During AudioProcessing)”的第61/453,532号美国临时专利申请案,以及2011年12月9日申请且标题为“自动化谈话辅助(Automated Conversation Assistance)”的第61/569,068号美国临时专利申请案的权益,所述申请案出于所有目的,以全文引用的方式并入本文中。
技术领域
背景技术
本发明的方面涉及计算技术。明确地说,本发明的方面涉及移动计算装置技术,例如用于提供自动化谈话辅助的***、方法、设备和计算机可读媒体。
一些当前***可提供语音到文本功能性,]2/或可允许用户基于所捕获音频执行搜索(例如,因特网搜索)。然而,这些当前***通常是受限的,例如在用户可接受搜索词和短语的程度方面,以及用户可能需要手动选择]2/或编辑搜索词和短语和/或待搜索的其它信息的程度方面。本发明的方面通过结合智能内容搜索实施增强的语音到文本功能性以提供自动化谈话辅助来为计算装置(例如移动计算装置)的用户提供较多便利和功能性。
发明内容
本发明呈现用于提供自动化谈话辅助的***、方法、设备和计算机可读媒体。如上文所述,虽然一些当前***可提供语音到文本功能性和/或允许用户基于所捕获音频执行搜索(例如,因特网搜索),但这些当前技术是受限的,因为此些搜索限于所捕获的单一词语或短语。事实上,如果这些当前***中的一者捕获到与较长语音相关联的音频,那么用户可能必须手动指定将搜索哪些词语和/或短语。
然而,通过实施本发明的方面,装置不仅可捕获较长语音(例如,电话呼叫、现场演讲、面对面或私下讨论、无线电节目、电视节目的音频部分等),而且可智能地从语音选择待搜索的词语,以便向用户提供关于语音中所讨论的一个或一个以上主题的相关信息。有利的是,本文所描述的这些特征和/或其它特征可向移动装置和/或其它计算装置的用户提供增加的功能性和改进的便利性。另外或替代地,本文所描述的这些特征和/或其它特征可增加且/或以其它方式增强用户从所捕获语音中吸收的信息的量和/或质量。
根据本发明的一个或一个以上方面,一种计算装置可获得与所述计算装置的用户相关联的用户简档信息,且所述用户简档信息可包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表。随后,所述计算装置可基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中。接着,所述计算装置可基于所述所选择的一个或一个以上词语产生所述搜索查询。
在一个或一个以上布置中,在选择一个或一个以上词语之前,计算装置可接收对应于所捕获语音的音频数据,且所述音频数据可与电话呼叫、现场演讲、面对面讨论、无线电节目和电视节目中的一者相关联。在其它布置中,所述用户简档信息可进一步包含先前已由所述用户搜索的一个或一个以上词语的列表。
在至少一个布置中,计算装置可将来自所述所捕获语音的至少一个词语添加到先前已在一个或一个以上先前捕获语音中检测到的一个或一个以上词语的所述列表。以此方式,可例如在一段时间内建立先前所遇到、检测到和/或搜索的词语的数据库。有利的是,这可使计算装置能够更智能地选择待搜索的词语,使得先前所遇到、检测到和/或搜索(且例如用户可能因此熟悉)的信息不会被再次搜索,而新的且/或先前尚未遇到、检测到和/或搜索(且例如用户可因此不熟悉)的信息可被搜索和/或优先于其它信息(例如,通过比此其它信息更显著地显示)。
在一个或一个以上额外和/或替代布置中,用户简档信息可包含关于用户的职业、教育或兴趣的信息。在一些布置中,计算装置可进一步基于先前已由具有与所述用户简档信息类似的简档信息的一个或一个以上其它用户搜索的一个或一个以上词语来选择一个或一个以上词语。举例来说,关键词列表可界定具有类似简档信息的用户感兴趣的一个或一个以上词语,且关键词列表可用于产生和确定执行搜索查询,如下文所论述。另外或替代地,排除列表可界定某些用户(例如,具有类似简档信息的某些用户)不感兴趣的一个或一个以上词语,且排除列表可用于产生搜索查询和/或确定执行搜索查询,也如下文所论述。
在至少一个额外和/或替代布置中,响应于产生搜索查询,计算装置可执行搜索查询。随后,计算装置可致使搜索查询的结果向用户显示,且所述结果可包含关于包含于所捕获语音中的至少一个主题的信息。另外或替代地,可响应于检测到所捕获语音已结束而向用户显示结果。在其它布置中,可实时(例如,在捕获语音时)向用户显示结果。如下文所论述,例如所捕获的词语、短语、句子和/或段落的数目等因素可影响是否和/或如何显示实时结果。
附图说明
本发明的方面以实例的方式说明。在附图中,相同参考编号指示相似元件,且:
图1A说明实施本发明的一个或一个以上方面的实例***。
图1B说明实施本发明的一个或一个以上方面的另一实例***。
图2A说明根据本发明一个或一个以上说明性方面的提供自动化谈话辅助的实例方法。
图2B说明根据本发明一个或一个以上说明性方面的选择一个或一个以上词语以包含在搜索查询中的实例方法。
图3A、3B、3C和3D说明根据本发明一个或一个以上说明性方面的内容数据集合的实例。
图4说明根据本发明一个或一个以上说明性方面的用户简档的实例。
图5说明其中可实施本发明的一个或一个以上方面的实例计算***。
具体实施方式
现在将相对于形成本发明一部分的附图来描述若干说明性实施例。虽然下文描述其中可实施本发明的一个或一个以上方面的特定实施例,但在不脱离本发明的范围和所附权利要求书的精神的情况下,可使用其它实施例,且可进行各种修改。
图1A中说明实施本发明的各种方面的实例***。如图1A中所见,用户装置110(其可为移动计算装置)可与服务器100通信。服务器100可包含无线处理栈115,其可促进无线通信服务的提供(例如,通过服务器100提供给多个移动装置,包含用户装置110)。另外,服务器100可包含音频转换器120和语音到文本引擎125,其一起可操作以接收音频数据(例如,对应于用户装置所捕获的语音的音频数据),并将其转换为文本和/或字符数据。服务器100进一步可包含用户简档数据库130(例如,其中可存储与各种用户相关联的信息)和搜索接口135(例如,经由其可执行一个或一个以上因特网搜索查询,经由其可执行一个或一个以上数据库查询等)。
图1B中说明实施本发明的一个或一个以上方面的***的替代实例。如图1B中所见,在一个或一个以上额外和/或替代布置中,移动装置150可包含一个或一个以上组件和/或模块,其可单独或组合操作,使得移动装置150可处理并辨识语音,且产生并执行搜索查询(例如,如下文更详细地描述),而不是依靠服务器(例如,服务器100、服务器175等)来处理和辨识语音且/或产生并执行搜索查询。举例来说,移动装置150可包含音频转换器155和语音到文本引擎160,其可一起操作以接收音频数据(例如,对应于移动装置150所捕获的语音的音频数据),并将其转换为文本和/或字符数据。移动装置150进一步可包含用户简档信息模块165(例如,其中可存储关于移动装置150的一个或一个以上用户的信息)和搜索接口170(例如,经由其可执行一个或一个以上因特网搜索查询,经由其可执行一个或一个以上数据库查询等)。另外或替代地,在这些布置的一些布置中,服务器可包含服务器100中所包含的组件和/或模块中的任一者和/或全部(例如,以便为移动装置150中所包含的类似组件和/或模块提供冗余度),而在这些布置的其它布置中,服务器175可能仅包含无线处理栈180(例如,用以促进向多个装置提供无线通信服务)、用户简档信息数据库185(例如,其中可存储关于移动装置150和/或其它类似装置的一个或一个以上用户的信息),和/或搜索接口190(例如,其可执行且/或辅助一个或一个以上移动装置执行一个或一个以上因特网搜索查询、一个或一个以上数据库查询等)。如上文所述,在这些布置中,用户装置本身(例如移动装置150)可代替服务器175来辨识语音并产生搜索查询。
根据本发明的一个或一个以上方面,图1A和/或图1B的实例***的一个或一个以上元件可在提供自动化谈话辅助时执行图2A中所说明的实例方法的任一和/或所有步骤。举例来说,在步骤200中,用户装置110(例如移动装置,例如智能电话、平板计算机、个人数字助理等)可捕获语音(例如,通过经由麦克风记录表示语音的音频数据)。
随后,在步骤205中,用户装置110可发射且服务器100可接收对应于所捕获语音的音频数据。
虽然在以下步骤的若干步骤中,将图1A的服务器100描述为执行各种步骤,但在一个或一个以上额外和/或替代实施例(例如,其中移动装置150而不是服务器100处理并辨识语音且产生并执行搜索查询的实施例)中,相同和/或类似步骤可由图1B的移动装置150执行。
一旦服务器100接收到音频数据,服务器100便可在步骤210中加载用户简档信息(例如,与捕获到语音的用户装置110的用户相关联的用户简档信息)。在一个或一个以上布置中,用户简档信息可包含先前已搜索的词语列表(例如,在方法的先前反复期间,用户曾搜索的词语)。另外或替代地,用户简档信息可包含关于用户的职业、教育或兴趣的信息。
如上文所述,在步骤210中加载的用户简档信息可包含与用户相关联的信息(例如,关于用户装置110的用户的信息),其包含先前已在与用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表,例如先前已由用户遇到且/或由用户装置110(和/或服务器100在分析涉及所述用户的语音时)识别且/或以其它方式捕获的词语。举例来说,如果用户先前已听到(且用户装置110先前已捕获对应于其的音频)句子“这是高通公司的工程师”,那么短语中所包含的词语中的每一者和/或整个短语本身可存储在先前在所捕获语音中已检测到的词语列表中。随后,如果用户将要再次遇到此短语(使得装置将再次检测此短语),那么装置将能够基于与用户相关联的用户简档信息,确定用户先前已遇到所述短语和包含于其中的所有词语,且因此可能在形成后续搜索查询时不包含所述短语(或包含于所述短语中的词语中的任一者)。如下文所论述,还可考虑额外因素,例如所捕获词语中的任一者是否包含于与用户简档相关联的关键词列表和/或与用户简档相关联的排除列表中。
接下来,在步骤215中,服务器100可将音频数据(且具体地说,包含于音频数据中的语音)转换为文本和/或字符数据(例如一个或一个以上串)。随后,在步骤220中,服务器100可选择待包含于搜索查询中的一个或一个以上词语(例如,来自经转换音频数据)。明确地说,服务器100可基于用户简档信息选择词语,使得搜索查询适合例如特定用户的背景和知识。在一种布置中,例如,服务器100可基于与用户具有类似简档信息的其它用户(例如,具有与用户相同的职位、教育或兴趣的其它用户)已搜索的词语来选择用于包含在搜索查询中的词语。在一个或一个以上布置中,在步骤220中,服务器100可通过执行图2B中所说明的实例方法的一个或一个以上步骤来选择用于包含在搜索查询中的一个或一个以上词语,下文更详细地描述图2B。
再次参看图2A,在已选择了用于包含在搜索查询中的一个或一个以上词语后,服务器100接着在步骤225中可产生搜索查询(例如,通过使用一个或一个以上连词和/或其它搜索修饰语来将选定词语串在一起)。接下来,在步骤230中,服务器100可执行搜索查询(例如,通过将搜索查询传递到因特网搜索引擎、新闻和/或期刊搜索接口和/或类似物)。一旦服务器100接收到所执行搜索查询的结果,服务器100就可在步骤235中,将搜索结果发送到用户装置110,用户装置110又可在步骤240中向用户显示搜索结果。根据一个或一个以上方面,搜索结果可包含关于包含于所捕获语音中的至少一个主题的更详细信息,例如用户可能不熟悉的词语或短语的定义、解释语音中所出现的用户以前可能未遇到过的技术概念的期刊文章和/或类似物。
在一个或一个以上布置中,可实时(例如,在所捕获语音正发生和/或正由用户装置110捕获)执行搜索查询的产生和执行,且服务器100可同样地在此些搜索结果被接收到时将搜索结果递送到用户装置110。然而,在至少一个布置中,用户装置110可经配置以等待显示任何此类搜索结果,直到用户装置110检测到正捕获的语音已结束(例如,基于超过某一阈值的静默周期,和/或基于其它指示符,例如在面对面讨论或电话呼叫的情况下检测到告别词(如“再见”或“保重”),或在现场演讲的情况下检测到鼓掌)为止。
在其中实时(例如,通过服务器100或通过移动装置150)执行搜索查询的产生和执行的布置中,确定应何时(例如,在所捕获语音期间的特定点)产生和执行搜索查询可取决于所捕获语音的长度和/或性质。举例来说,在其中实时产生和执行搜索查询的一些布置中,服务器100或移动装置150可经配置以在已捕获到阈值数目个词语、短语、句子或段落之后自动产生和执行搜索查询(例如,使用一个或一个以上选定词语,如下文相对于图2B所论述)。举例来说,服务器100或移动装置150可经配置以每当已捕获到一个完整句子时、每当已捕获到两个完整句子时、每当已捕获到完整段落时等等,使用所捕获词语中的选定词语来自动产生和执行搜索查询。在其中实时产生和执行搜索查询的其它布置中,服务器100或移动装置150可经配置以每当所捕获语音中包含新概念(例如,新型技术)时,自动产生和执行搜索查询,因为此新概念可表示正捕获的谈话或语音中的移位,且因此可为用户可能想要检视搜索结果的点。
在其中实时产生和执行搜索查询的其它布置中,服务器100或移动装置150可经配置以依据与检测到的词语或短语相关联的用户定义和/或预定义优先等级来自动产生和执行搜索查询。举例来说,可将一些词语视为具有“高”优先级,使得如果检测到此些词语,那么立即产生和执行基于所述词语的搜索,而可将其它词语视为具有“正常”优先级,使得如果检测到此些词语,那么可在预定量的时间内(例如,在三十秒内、在一分钟内等)和/或在阈值数目个词语和/或短语之后(例如,在已捕获两个额外句子之后、在已捕获两个段落之后等)产生和执行基于所述词语的搜索。另外或替代地,可将不同词语视为对于不同类型的用户具有“高”优先级和“正常”优先级,如基于不同用户的不同用户简档信息。下面的表格中说明与不同类型的用户的不同词语相关联的不同类型的优先等级的实例:
表A
简档类型 | 实时搜索词 | 优先级 |
无线工程师 | LTE话音 | 高 |
无线工程师 | CDMA | 正常 |
公司金融 | 股票现价 | 高 |
公司金融 | 提出税务代码 | 正常 |
图2B说明根据本发明一个或一个以上说明性方面的选择一个或一个以上词语以包含在搜索查询中的实例方法。根据本发明的一个或一个以上方面,可通过计算装置和/或计算机***(例如,下文所述的计算机***500)来执行本文所述的方法和/或方法步骤中的任一者和/或全部。另外或替代地,可以计算机可读指令和/或计算机可执行指令(例如存储在设备的存储器中的计算机可读指令)来实施本文所述的方法和/或方法步骤的任一者和/或全部,所述设备可包含一个或一个以上处理器以执行此些指令,且/或作为存储在一个或一个以上计算机可读媒体上的计算机可读指令。
如上文所论述,图2B中所说明的实例方法的一个或一个以上步骤可由服务器100执行以选择用于包含在搜索查询中的一个或一个以上词语。因此,在一个或一个以上布置中,图2B中所说明的实例方法的步骤中的任一者和/或全部可在语音和/或音频数据已转换为文本和/或字符数据之后,且/或在已产生和/或执行搜索查询之前,由服务器100执行。在一个或一个以上额外和/或替代布置中,图2B中所说明的实例方法的一个或一个以上步骤可由移动装置150执行以选择用于包含在搜索查询中的一个或一个以上词语。因此,在这些布置中,图2B中所说明的实例方法的步骤中的任一者和/或全部可在语音和/或音频数据已转换为文本和/或字符数据之后,且/或在已产生和/或执行搜索查询之前,由移动装置150执行。
在步骤250中,可确定先前是否曾遇到特定词语或短语。举例来说,在步骤250中,服务器100可确定用户装置110的用户先前是否已遇到过包含于文本和/或字符数据(其可表示所捕获音频数据)中的特定词语或短语。在替代实例中,在步骤250中,移动装置150可确定移动装置150的用户先前是否已遇到过包含于文本和/或字符数据(例如表示所捕获音频数据)中的特定词语或短语。在一个或一个以上布置中,服务器100或移动装置150可基于特定词语或短语是否包含于由服务器100或移动装置150所维持且/或存储在服务器100或移动装置150上的内容数据集合中来作出此确定。在一个或一个以上布置中,此内容数据集合可包含(例如)用户先前遇到的词语和/或短语的列表以及额外信息,例如用户已遇到所述词语和/或短语中的每一者的次数、(如果存在的话)用户已搜索关于所述词语和/或短语中的每一者的更多信息的次数,和/或其它信息。另外或替代地,此内容数据集合可形成与用户装置110或移动装置150的特定用户相关联的用户简档信息的全部或一部分。此外,在一些布置中,多个内容数据集合可针对单个用户维持和/或以其它方式对应于单个用户。
在至少一个布置中,因为服务器100或移动装置150可在语音或谈话正发生时和/或正被用户装置110或移动装置150捕获时实时接收词语,因此服务器100或移动装置150在步骤250的确定中所使用的特定词语或短语可表示语音或谈话中最近捕获且/或转换的词语或短语。另外或替代地,服务器100或移动装置150可连续地执行图2B的方法(例如,在循环中),直到所捕获语音和/或谈话结束为止,和/或直到包含于所捕获语音和/或谈话中的所有词语和/或短语均已由服务器100或移动装置150处理为止。
如果在步骤250中(例如,由服务器100或移动装置150)确定服务器100或移动装置150正评估的词语和/或短语先前已遇到过,那么在步骤255中,服务器100或移动装置150可增加计数值,其可表示用户装置110或移动装置150的用户已遇到特定词语和/或短语的次数。在一个或一个以上布置中,例如,此计数值可存储在内容数据集合中。
另一方面,如果在步骤250中(例如由服务器100或移动装置150)确定服务器100或移动装置150正评估的词语和/或短语先前尚未遇到过,那么在步骤260中,服务器100或移动装置150可确定与用户相关联的用户简档信息(例如,由服务器100或移动装置150在步骤210中加载的用户简档信息)是否表明用户可能对被呈现关于所述词语和/或短语的更多信息感兴趣。在一个或一个以上布置中,服务器100或移动装置150可基于与所述用户具有类似用户简档信息的其它用户(例如,具有与所述用户类似的职位、教育或兴趣的用户)是否先前已遇到过所述词语和/或短语和/或先前已搜索了与所述词语和/或短语相关联的更多信息,来作出此确定。服务器100或移动装置150可通过存取其中可存储与其它用户相关联的用户简档信息和/或内容数据集合的数据库(例如,用户简档数据库130或用户简档数据库185)来使用此信息。
当遇到新词语时,所述新词语中的一些可(例如)被视为“重要的”(例如,被服务器100或移动装置150),且因此可被确定为用户感兴趣的词语(用于包含在搜索查询中),而其它词语可能不被视为“重要的”,且因此可能不被确定为用户感兴趣的词语。在至少一个布置中,词语“重要”与否可取决于所述词语是否包含在与用户的简档相关联的关键词列表中。此列表可为用户定义的(例如,用户可将词语添加到列表和/或将词语从列表去除),且/或可包含基于用户的职位、教育和/或兴趣(以及其它用户简档信息)的一个或一个以上预定义词语。另外或替代地,此列表可结合用户的简档存储和/或以其它方式与用户的简档相关联,使得当加载用户简档信息(例如,在如上文所述的步骤210中)时,可加载列表(例如,由服务器100或移动装置150)。下表中说明可与某些简档的用户相关联的关键词的实例:
表B
简档类型 | 关键词 |
无线工程师 | 信号传播 |
无线工程师 | 信息理论 |
无线工程师 | 计算机设计 |
公司金融 | 贴现现金流 |
公司金融 | 净现值 |
在一些布置中,如果词语大体上与同用户的简档相关联的关键词有关,那么可将所述词语视为“重要的”。举例来说,如果特定用户与“无线工程师”简档相关联,且其装置捕获到短语“肯乃利-赫韦塞层(Kennelly-Heaviside Layer)”,那么所述装置可确定此短语大体上与“信号传播”关键词有关,且因此可搜索且/或显示关于肯乃利-赫韦塞层的额外信息,肯乃利-赫韦塞层是影响无线电信号传播的地球电离圈的层。可使用类似于上文所说明的数据表的数据表来存储与所述关键词有关的词语。
在一个或一个以上额外和/或替代布置中,除存储与用户的简档相关联的关键词列表之外,还可存储与用户的简档相关联的排除词列表。此排除列表可例如定义用户不视为“重要”且没兴趣接收关于其的更多信息的一个或一个以上词语。正如关键词列表,排除列表可为用户定义的,且/或可包含基于用户的职位、教育和/或兴趣(以及其它用户简档信息)的一个或一个以上预定词语。另外或替代地,排除列表可结合用户的简档存储和/或以其它方式与用户的简档相关联,使得当加载用户简档信息(例如,在如上文所述的步骤210中)时,可加载列表(例如,由服务器100或移动装置150)。下表中说明可与某些简档的用户相关联的关键词的实例:
表C
简档类型 | 排除词 |
无线工程师 | TDMA |
无线工程师 | GPRS |
公司金融 | 资本结构 |
公司金融 | 股息 |
如果在步骤260中(例如,由服务器100或移动装置150)确定与用户相关联的用户简档信息不表明用户可能对被呈现关于词语和/或短语的更多信息感兴趣,那么在步骤265中,服务器100或移动装置150可将词语和/或短语添加到与所述用户相关联的现有内容数据集合。在一个或一个以上布置中,现有内容数据集合可包含且/或以其它方式表示用户先前已遇到和/或用户可能没兴趣搜索的词语和/或短语。另外或替代地,现有内容数据集合可为由服务器100或移动装置150相对于用户存储和/或以其它方式维持且包含在与用户相关联的用户简档信息中且/或形成与用户相关联的用户简档信息的内容数据集合中的一者或一者以上。有利的是,通过以此方式将词语和/或短语添加到现有内容数据集合,服务器100或移动装置150可以在将来不大可能(如果不是完全阻止)选择此些词语和/或短语来包含在搜索查询中,从而增加服务器100或移动装置150搜索的未来词语和/或短语是用户可能真心有兴趣知道关于其的更多信息的词语和/或短语的可能性。
另一方面,如果在步骤260中确定(例如,通过服务器100或移动装置150)与用户相关联的用户简档信息确实表明用户可能有兴趣被呈现关于所述词语和/或短语的更多信息,那么在步骤270中,服务器100或移动装置150可将所述词语和/或短语添加到搜索查询(和/或添加到待包含于将例如由服务器100或移动装置150在所捕获语音或谈话结束之后产生的搜索查询中的词语列表)。有利的是,通过将用户先前尚未遇到且用户可能感兴趣(例如,因为其它类似用户也已对所述词语和/或短语感兴趣)的词语和/或短语添加到搜索查询,那么服务器100或移动装置150将向用户提供相关和/或合意搜索结果的可能性可增加。
随后,在步骤275中,服务器100或移动装置150可将所述词语和/或短语添加到与用户相关联的现有内容数据集合。在一个或一个以上布置中,在将词语添加到搜索查询之后,将词语和/或短语添加到现有内容数据集合可为合意的,因为这可降低词语和/或短语在将来被冗余地搜索和/或以其它方式再次呈现给用户的可能性(如果不是完全阻止)。
此后,图2B的方法可结束。然而,如上文所论述,在一个或一个以上布置中,流程可返回到图2A的方法,且服务器100或移动装置150可继续基于使用图2B的方法选择的词语来产生和执行搜索查询(例如,分别在步骤225和步骤230中)。
图3A、3B、3C和3D说明根据本发明一个或一个以上说明性方面的内容数据集合的实例。如上文所述,内容数据集合可为用户的用户简档信息的一部分,且可用以跟踪用户先前已遇到和/或搜索的词语和/或短语。另外或替代地,可存在两种类型的内容数据集合:(1)现有内容数据集合,其中可存储用户先前已遇到和/或搜索的词语和/或短语;以及(2)新内容数据集合,其中可存储先前尚未遇到和/或搜索的所捕获词语和/或短语。在一个或一个以上布置中,存储在新内容数据集合中的词语和/或短语可临时保持在新内容数据集合中,使得一旦词语和/或短语已被搜索,那么特定词语和/或短语可从新内容数据集合移除,且代替地添加到现有内容数据集合。以此方式,在给定时间点,用户可具有与其用户简档信息相关联的新内容数据集合和现有内容数据集合两者。
举例来说,图3A和3B分别说明在第一时间点处的新内容数据集合300和现有内容数据集合310。在此第一时间点处,现有内容数据集合310为空,且新内容数据集合300已(例如)在短语“这是高通公司的工程师”已被用户装置110捕获且发射到服务器100之后(例如,由服务器100)创建。
在后来的第二时间点处,可将短语“这是高通公司的工程师”(以及组成所述短语的词)从新内容数据集合移除,且代替地放置在现有内容数据集合中,如图3C和3D中所说明。举例来说,在第二时间点,短语“这是高通公司的WiFi工程师”可由用户装置110捕获且发射到服务器100,且因此在图3C中看到的新内容数据集合320可能仅包含词语“WiFi”,而在图3D中看到的现有内容数据集合330可包含短语中的其它词。在此实例中,如果服务器随后确定执行所捕获词语和/或短语的搜索(例如,基于确定用户可能对搜索的结果感兴趣,如上文所述),那么服务器可能仅在搜索查询中包含词语“WiFi”,而不是在搜索查询中包含短语“这是高通公司的WiFi工程师”。
虽然以上实例论述两个内容数据集合(例如,新内容数据集合和现有内容数据集合),但在一些布置中,可使用单个数据集合(或其它数据库或数据表),且新词在最初捕获和辨识之后,可在预定量的时间中用数据集合内的“新”指示符标记。另外或替代地,此数据集合(和/或上文所述的新内容数据集合和现有内容数据集合)可包含时戳信息,其指示包含在数据集合中的每一词语被捕获的特定时间和/或日期。此数据集合可表示(例如)检测历史,且下表中说明此数据集合的实例:
表D
所捕获词语/短语 | 时戳 | 检测计数 | 新? |
单一无线电话音呼叫连续性 | 2012年2月2日,上午8:30PST | 1 | 是 |
毫微微小区 | 2012年2月1日,下午12:30PST[...] | 12 | 否 |
LTE高级 | 2012年2月1日,下午9:00PST[...] | 2 | 否 |
图4说明根据本发明一个或一个以上说明性方面的用户简档的实例。如图4中所见,用户简档400可包含除上文所述类型的用户简档信息之外的各种类型的用户简档信息。当确定是否执行搜索、选择用于包含在搜索查询中的词语和/或短语、执行搜索查询和/或向用户显示搜索结果时,可(例如,由服务器100)考虑此信息中的任一者和/或全部。在一个或一个以上布置中,用户简档400可包含(例如)描述特定用户的兴趣和/或以其它方式与特定用户的兴趣相关联的关键词,以及可由用户存储在其用户装置(例如,用户装置110)中的其它关键词。另外或替代地,用户简档400可包含关于用户和/或用户的装置(例如,用户装置110)的当前情形的信息,例如当前时间、用户和/或用户装置的当前位置、用户可能正参加的事件(例如,如基于用户的电子日历信息来确定),等等。
在一个或一个以上布置中,用户简档400进一步可包含过滤器配置信息,其可包括先前所使用的过滤器准则,例如用户在过滤和/或以其它方式分类过去的搜索结果时可能已使用的过滤器准则。另外或替代地,用户简档400可包含关于用户所感兴趣的特定主题和/或领域(例如,工程设计、艺术、金融等)的信息,和/或关于用户、用户装置(例如用户装置110)和/或用户所寻求信息的类型的上下文信息。通过考虑用户简档的这些不同因素,服务器100可向用户提供增强的功能性和便利性。
在已描述了自动化谈话辅助的多个方面后,现在将相对于图5描述其中可实施本发明的各种方面的计算***的实例。根据一个或一个以上方面,如图5中所说明的计算机***可并入为计算装置的一部分,其可实施、执行且/或实行本文所述的特征、方法和/或方法步骤中的任一者和/或全部。举例来说,计算机***500可表示手持式装置的组件中的一些。手持式装置可为具有输入感测单元(例如相机和/或显示单元)的任何计算装置。手持式装置的实例包含(但不限于)视频游戏控制台、平板、智能电话和移动装置。在一个实施例中,***500经配置以实施上文所述的服务器100和/或用户装置110。图5提供可执行由如本文所述的各种其它实施例提供的方法和/或可充当主机计算机***、远程一体机/终端、销售点装置、移动装置、机顶盒和/或计算机***的计算机***500的一个实施例的示意性说明。图5仅意在提供各种组件的一般化说明,可酌情利用所述组件中的任一者和/或全部。因此,图5广泛说明可如何以相对分开或相对较集中的方式实施个别***元件。
展示计算机***500包括可经由总线505电耦合(或可酌情以其它方式通信)的硬件元件。所述硬件元件可包含一个或一个以上处理器510,其包含(但不限于)一个或一个以上通用处理器和/或一个或一个以上专用处理器(例如数字信号处理芯片、图形加速处理器和/或类似物);一个或一个以上输入装置515,其可包含(但不限于)相机、鼠标、键盘和/或类似物;以及一个或一个以上输出装置520,其可包含(但不限于)显示单元、打印机和/或类似物。
计算机***500可进一步包含一个或一个以上非暂时性存储装置525(和/或与之通信),其可包括(但不限于)本地和/或网络可存取存储装置,且/或可包含(但不限于)磁盘驱动器、驱动器阵列、光学存储装置、固态存储装置,例如随机存取存储器(“RAM”)和/或只读存储器(“ROM”),其可为可编程的、快闪可更新的等等。此些存储装置可经配置以实施任何适当数据存储,包含(但不限于)各种文件***、数据库结构和/或类似物。
计算机***500还可包含通信子***530,其可包含(但不限于)调制解调器、网卡(无线或有线)、红外线通信装置、无线通信装置和/或芯片组(例如装置、802.11装置、WiFi装置、WiMax装置、蜂窝式通信设施等),和/或类似物。通信子***530可准许与网络(例如,下文所述的网络,举一个实例)、其它计算机***和/或本文所述的任何其它装置交换数据。在许多实施例中,计算机***500将进一步包括非暂时性工作存储器535,其可包含RAM或ROM装置,如上文所述。
计算机***500还可包括软件元件,展示为当前位于工作存储器535内,包含操作***540、装置驱动器、可执行库和/或其它代码,例如一个或一个以上应用程序545,其可包括由各种实施例提供的计算机程序,且/或可经设计以实施由其它实施例提供的方法且/或配置由其它实施例提供的***,如本文所述。仅作为实例,相对于上文所论述的方法而描述(例如如相对于图2A和/或图2B所描述)的一个或一个以上程序可实施为可由计算机(和/或计算机内的处理器)执行的代码和/或指令;在一方面中,那么所述代码和/或指令可用以配置且/或调适通用计算机(或其它装置)来根据所描述的方法执行一个或一个以上操作。
一组这些指令和/或代码可存储在计算机可读存储媒体(例如,上文所述的存储装置525)上。在一些情况下,存储媒体可并入在计算机***(例如计算机***500)内。在其它实施例中,存储媒体可与计算机***分离(例如,可装卸媒体,例如压缩光盘),且/或以安装封装的形式提供,使得存储媒体可用以用存储于其上的指令/代码来编程、配置和/或调适通用计算机。这些指令可采取可由计算机***500执行的可执行代码的形式,且/或可采取源代码和/或可安装代码的形式,其在编译和/或安装在计算机***500上(例如,使用多种通常可用的编译器、安装程序、压缩/解压缩实用程序等中的任一者)后即刻接着采取可执行代码的形式。
可根据特定要求来作出实质变化。举例来说,还可使用定制的硬件,且/或特定元件可以硬件、软件(包含便携式软件,例如小应用程序等)或两者的形式来实施。另外,可使用到例如网络输入/输出装置等其它计算装置的连接。
一些实施例可使用计算机***(例如计算机***500)来执行根据本发明的方法。举例来说,所描述的方法的程序中的一些或全部可由计算机***500响应于处理器510执行包含于工作存储器535中的一个或一个以上指令(其可并入到操作***540和/或例如应用程序545等其它代码中)的一个或一个以上序列而执行。可将此些指令从另一计算机可读媒体(例如存储装置525中的一者或一者以上)读取到工作存储器535中。仅作为实例,包含于工作存储器535中的指令序列的执行可致使处理器510执行本文所述的方法(例如相对于图2A和/或图2B所述的方法)的一个或一个以上程序。
如本文所述的术语“机器可读媒体”和“计算机可读媒体”指代参与提供致使机器以特定方式操作的数据的任何媒体。在使用计算机***500实施的实施例中,各种计算机可读媒体可在将指令/代码提供给处理器510以供执行中涉及,和/或可用以存储和/或运载此些指令/代码(例如,作为信号)。在许多实施方案中,计算机可读媒体为物理和/或有形存储媒体。此媒体可采取许多形式,包含(但不限于)非易失性媒体、易失性媒体和传输媒体。非易失性媒体包含(例如)光盘和/或磁盘,例如存储装置525。易失性媒体包含(但不限于)动态存储器,例如工作存储器535。传输媒体包含(但不限于)同轴缆线、铜线和光纤,包含构成总线505的线,以及通信子***530的各种组件(和/或通信子***530借助其来提供与其它装置的通信的媒体)。因此,传输媒体还可采取波的形式(包含但不限于无线电、声波和/或光波,例如在无线电波和红外线数据通信期间产生的波)。
常见形式的物理和/或有形计算机可读媒体包含(例如)软盘、柔性盘、硬盘、磁带或任何其它磁性媒体、CD-ROM、任何其它光学媒体、穿孔卡片、纸带、任何其它具有孔图案的物理媒体、RAM、PROM、EPROM、FLASH-EPROM、任何其它存储器芯片或卡盘、如下文描述的载波,或计算机可从中读取指令和/或代码的任何其它媒体。
将一个或一个以上指令的一个或一个以上序列运载到处理器510以供执行中可涉及各种形式的计算机可读媒体。仅作为实例,所述指令最初可在远程计算机的磁盘和/或光盘上运载。远程计算机可将指令加载到其动态存储器中,且经由传输媒体将所述指令作为信号发送,以由计算机***500接收且/或执行。根据本发明的各种实施例,这些信号(其可呈电磁信号、声信号、光学信号和/或类似信号的形式)是可在其上编码指令的载波的所有实例。
通信子***530(和/或其组件)通常将接收所述信号,且总线505接着可将所述信号(和/或由所述信号运载的数据、指令等)运载到工作存储器535,处理器510从工作存储器535检索并执行指令。由工作存储器535接收的指令可在由处理器510执行之前或之后任选地存储在非暂时性存储装置525上。
上文所论述的方法、***和装置为实例。各种实施例可酌情省略、替代或添加各种程序或组件。举例来说,在替代配置中,所描述的方法可以与所描述次序不同的次序执行,且/或可添加、省略和/或组合各个级。并且,相对于某些实施例而描述的特征可在各种其它实施例中组合。实施例的不同方面和元件可以类似方式组合。并且,技术演变,且因此元件中的许多元件是不将本发明的范围限于那些具体实例的实例。
描述中给出特定细节来提供对实施例的全面理解。然而,可在没有这些具体细节的情况下实践实施例。举例来说,已经在无不必要细节的情况下展示了众所周知的电路、过程、算法、结构和技术,以便避免模糊实施例。此描述仅提供实例实施例,且无意限制本发明的范围、适用性或配置。相反,实施例的先前描述将向所属领域的技术人员提供用于实施例本发明的实施例的促成描述。在不脱离本发明的精神和范围的情况下,可对元件的功能和布置作出各种改变。
并且,将一些实施例描述为描绘为流程图或框图的过程。尽管各自可将操作描述为顺序过程,但可并行或同时执行许多操作。另外,可重新布置操作的次序。过程可具有不包含于图中的额外步骤。此外,方法的实施例可由硬件、软件、固件、中间件、微码、硬件描述语言或其任何组合实施。当在软件、固件、中间件或微码中实施时,用以执行相关联任务的程序代码或代码段可存储在例如存储媒体的计算机可读媒体中。处理器可执行相关联任务。
在描述了若干实施例后,可在不脱离本发明的精神的情况下,使用各种修改、替代构造和均等物。举例来说,以上元件可仅为较大***的组件,其中其它规则可优先于或以其它方式修改本发明的应用。并且,考虑可在以上元件之前、期间或之后进行的若干步骤。因此,以上描述不限制本发明的范围。
Claims (34)
1.一种方法,其包括:
获得与用户相关联的用户简档信息,所述用户简档信息包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表;
基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中;以及
基于所述所选择的一个或一个以上词语产生所述搜索查询。
2.根据权利要求1所述的方法,其进一步包括:
在选择一个或一个以上词语之前,接收对应于所述所捕获语音的音频数据,
其中所述音频数据与电话呼叫、现场演讲、面对面讨论、无线电节目和电视节目中的一者相关联。
3.根据权利要求1所述的方法,其中所述用户简档信息进一步包含先前已由所述用户搜索的一个或一个以上词语的列表。
4.根据权利要求1所述的方法,其进一步包括:
将来自所述所捕获语音的至少一个词语添加到先前已在一个或一个以上先前捕获语音中检测到的一个或一个以上词语的所述列表。
5.根据权利要求1所述的方法,其中所述用户简档信息包含关于用户的职业、教育或兴趣的信息。
6.根据权利要求5所述的方法,其中选择一个或一个以上词语还基于先前已由具有与所述用户简档信息类似的简档信息的一个或一个以上其它用户搜索的一个或一个以上词语。
7.根据权利要求1所述的方法,其进一步包括:
响应于产生所述搜索查询,执行所述搜索查询;以及
致使所述搜索查询的结果向所述用户显示,
其中所述结果包含关于所述所捕获语音中所包含的至少一个主题的信息。
8.根据权利要求7所述的方法,其中响应于检测到所述所捕获语音已结束而向所述用户显示所述结果。
9.至少一种计算机可读媒体,其存储计算机可读指令,所述计算机可读指令在被执行时致使至少一个计算装置:
获得与用户相关联的用户简档信息,所述用户简档信息包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表;
基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中;以及
基于所述所选择的一个或一个以上词语产生所述搜索查询。
10.根据权利要求9所述的至少一种计算机可读媒体,其具有存储于其上的额外计算机可读指令,所述计算机可读指令在被执行时进一步致使所述至少一个计算装置:
在选择一个或一个以上词语之前,接收对应于所述所捕获语音的音频数据,
其中所述音频数据与电话呼叫、现场演讲、面对面讨论、无线电节目和电视节目中的一者相关联。
11.根据权利要求9所述的至少一种计算机可读媒体,其中所述用户简档信息进一步包含先前已由所述用户搜索的一个或一个以上词语的列表。
12.根据权利要求9所述的至少一种计算机可读媒体,其具有存储于其上的额外计算机可读指令,所述计算机可读指令在被执行时进一步致使所述至少一个计算装置:
将来自所述所捕获语音的至少一个词语添加到先前已在一个或一个以上先前捕获语音中检测到的一个或一个以上词语的所述列表。
13.根据权利要求9所述的至少一种计算机可读媒体,其中所述用户简档信息包含关于用户的职业、教育或兴趣的信息。
14.根据权利要求13所述的至少一种计算机可读媒体,其中选择一个或一个以上词语还基于至少部分地基于先前已由具有与所述用户简档信息类似的简档信息的一个或一个以上其它用户搜索的一个或一个以上词语而界定的关键词列表和排除列表。
15.根据权利要求9所述的至少一种计算机可读媒体,其具有存储于其上的额外计算机可读指令,所述计算机可读指令在被执行时进一步致使所述至少一个计算装置:
响应于产生所述搜索查询,执行所述搜索查询;以及
致使所述搜索查询的结果向所述用户显示,
其中所述结果包含关于所述所捕获语音中所包含的至少一个主题的信息。
16.根据权利要求15所述的至少一种计算机可读媒体,其中所述结果是响应于检测到所述所捕获语音已结束而向所述用户显示。
17.一种设备,其包括:
至少一个处理器;以及
存储器,其存储计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时致使所述设备:
获得与用户相关联的用户简档信息,所述用户简档信息包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表;
基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中;以及
基于所述所选择的一个或一个以上词语产生所述搜索查询。
18.根据权利要求17所述的设备,其中所述存储器存储额外的计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时进一步致使所述设备:
在选择一个或一个以上词语之前,接收对应于所述所捕获语音的音频数据,
其中所述音频数据与电话呼叫、现场演讲、面对面讨论、无线电节目和电视节目中的一者相关联。
19.根据权利要求17所述的设备,其中所述用户简档信息进一步包含先前已由所述用户搜索的一个或一个以上词语的列表。
20.根据权利要求17所述的设备,其中所述存储器存储额外的计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时进一步致使所述设备:
将来自所述所捕获语音的至少一个词语添加到先前已在一个或一个以上先前捕获语音中检测到的一个或一个以上词语的所述列表。
21.根据权利要求17所述的设备,其中所述用户简档信息包含关于用户的职业、教育或兴趣的信息。
22.根据权利要求21所述的设备,其中选择一个或一个以上词语还基于先前已由具有与所述用户简档信息类似的简档信息的一个或一个以上其它用户搜索的一个或一个以上词语。
23.根据权利要求17所述的设备,其中所述存储器存储额外的计算机可读指令,所述计算机可读指令在由所述至少一个处理器执行时进一步致使所述设备:
响应于产生所述搜索查询,执行所述搜索查询;以及
致使所述搜索查询的结果向所述用户显示,
其中所述结果包含关于所述所捕获语音中所包含的至少一个主题的信息。
24.根据权利要求23所述的设备,其中所述结果是响应于检测到所述所捕获语音已结束而向所述用户显示。
25.一种***,其包括:
用于获得与用户相关联的用户简档信息的装置,所述用户简档信息包含先前已在与所述用户相关联的一个或一个以上先前捕获语音中检测到的一个或一个以上词语的列表;
用于基于所述用户简档信息从所捕获语音选择一个或一个以上词语以包含在搜索查询中的装置;以及
用于基于所述所选择的一个或一个以上词语产生所述搜索查询的装置。
26.根据权利要求25所述的***,其进一步包括:
用于在选择一个或一个以上词语之前接收对应于所述所捕获语音的音频数据的装置,
其中所述音频数据与电话呼叫、现场演讲、面对面讨论、无线电节目和电视节目中的一者相关联。
27.根据权利要求25所述的***,其中所述用户简档信息进一步包含先前已由所述用户搜索的一个或一个以上词语的列表。
28.根据权利要求25所述的***,其进一步包括:
用于将来自所述所捕获语音的至少一个词语添加到先前已在一个或一个以上先前捕获语音中检测到的一个或一个以上词语的所述列表的装置。
29.根据权利要求25所述的***,其中所述用户简档信息包含关于用户的职业、教育或兴趣的信息。
30.根据权利要求29所述的***,其中选择一个或一个以上词语还基于至少部分地基于先前已由具有与所述用户简档信息类似的简档信息的一个或一个以上其它用户搜索的一个或一个以上词语而界定的关键词列表和排除列表。
31.根据权利要求25所述的***,其进一步包括:
用于响应于产生所述搜索查询执行所述搜索查询的装置;以及
用于致使所述搜索查询的结果向所述用户显示的装置,
其中所述结果包含关于所述所捕获语音中所包含的至少一个主题的信息。
32.根据权利要求31所述的***,其中所述结果是响应于检测到所述所捕获语音已结束而向所述用户显示。
33.一种方法,其包括:
接收对应于与用户相关联的所捕获语音的音频数据;
基于所述音频数据,确定所述所捕获语音包含先前在与所述用户相关联的一个或一个以上先前所捕获语音中尚未检测到的至少一个词语;以及
响应于确定所述所捕获语音包含所述至少一个词语,产生包含所述至少一个词语的搜索查询。
34.根据权利要求33所述的方法,其进一步包括:
致使所述搜索查询的结果向所述用户显示。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161453532P | 2011-03-16 | 2011-03-16 | |
US61/453,532 | 2011-03-16 | ||
US201161569068P | 2011-12-09 | 2011-12-09 | |
US61/569,068 | 2011-12-09 | ||
US13/419,056 US20130066634A1 (en) | 2011-03-16 | 2012-03-13 | Automated Conversation Assistance |
US13/419,056 | 2012-03-13 | ||
PCT/US2012/029114 WO2012125755A1 (en) | 2011-03-16 | 2012-03-14 | Automated conversation assistance |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103443853A true CN103443853A (zh) | 2013-12-11 |
Family
ID=45932502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012800135436A Pending CN103443853A (zh) | 2011-03-16 | 2012-03-14 | 自动化谈话辅助 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20130066634A1 (zh) |
EP (1) | EP2710587A1 (zh) |
JP (1) | JP2014513828A (zh) |
KR (1) | KR20130133872A (zh) |
CN (1) | CN103443853A (zh) |
WO (1) | WO2012125755A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107430626A (zh) * | 2015-05-27 | 2017-12-01 | 谷歌公司 | 提供建议的基于话音的动作查询 |
CN109196491A (zh) * | 2016-05-31 | 2019-01-11 | 微软技术许可有限责任公司 | 机器智能预测通信和控制*** |
CN110582765A (zh) * | 2017-05-03 | 2019-12-17 | 谷歌有限责任公司 | 未索求内容到人类与计算机对话中的前摄并入 |
US11887594B2 (en) | 2017-03-22 | 2024-01-30 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9607025B2 (en) | 2012-09-24 | 2017-03-28 | Andrew L. DiRienzo | Multi-component profiling systems and methods |
US20150161249A1 (en) * | 2013-12-05 | 2015-06-11 | Lenovo (Singapore) Ptd. Ltd. | Finding personal meaning in unstructured user data |
US9635167B2 (en) | 2015-09-29 | 2017-04-25 | Paypal, Inc. | Conversation assistance system |
US10531227B2 (en) | 2016-10-19 | 2020-01-07 | Google Llc | Time-delimited action suggestion system |
US10521723B2 (en) | 2016-12-14 | 2019-12-31 | Samsung Electronics Co., Ltd. | Electronic apparatus, method of providing guide and non-transitory computer readable recording medium |
JP7015711B2 (ja) * | 2018-03-08 | 2022-02-03 | パナソニック株式会社 | 装置、ロボット、方法、及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020095292A1 (en) * | 2001-01-18 | 2002-07-18 | Mittal Parul A. | Personalized system for providing improved understandability of received speech |
CN1461465A (zh) * | 2001-04-13 | 2003-12-10 | 皇家菲利浦电子有限公司 | 语音对话***中的说话人的验证 |
US20040044516A1 (en) * | 2002-06-03 | 2004-03-04 | Kennewick Robert A. | Systems and methods for responding to natural language speech utterance |
CN1881206A (zh) * | 2005-06-15 | 2006-12-20 | 富士通株式会社 | 对话*** |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3683504B2 (ja) * | 2001-02-14 | 2005-08-17 | 日本電信電話株式会社 | 音声利用型情報検索装置および音声利用型情報検索プログラムと該プログラムを記録した記録媒体 |
TWI276357B (en) * | 2002-09-17 | 2007-03-11 | Ginganet Corp | Image input apparatus for sign language talk, image input/output apparatus for sign language talk, and system for sign language translation |
US7672931B2 (en) * | 2005-06-30 | 2010-03-02 | Microsoft Corporation | Searching for content using voice search queries |
JP2007025925A (ja) * | 2005-07-14 | 2007-02-01 | Fuji Xerox Co Ltd | 関連記述提示システム |
US7949529B2 (en) * | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
EP2109097B1 (en) * | 2005-11-25 | 2014-03-19 | Swisscom AG | A method for personalization of a service |
US8090082B2 (en) * | 2006-01-23 | 2012-01-03 | Icall, Inc. | System, method and computer program product for extracting user profiles and habits based on speech recognition and calling history for telephone system advertising |
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
EP1914639A1 (en) * | 2006-10-16 | 2008-04-23 | Tietoenator Oyj | System and method allowing a user of a messaging client to interact with an information system |
US8078468B2 (en) * | 2007-05-21 | 2011-12-13 | Sony Ericsson Mobile Communications Ab | Speech recognition for identifying advertisements and/or web pages |
US9646025B2 (en) * | 2008-05-27 | 2017-05-09 | Qualcomm Incorporated | Method and apparatus for aggregating and presenting data associated with geographic locations |
US8340974B2 (en) * | 2008-12-30 | 2012-12-25 | Motorola Mobility Llc | Device, system and method for providing targeted advertisements and content based on user speech data |
JP2010277207A (ja) * | 2009-05-27 | 2010-12-09 | Nec Corp | 携帯端末、検索エンジンシステム及びそれらに用いる情報提供サービス方法 |
-
2012
- 2012-03-13 US US13/419,056 patent/US20130066634A1/en not_active Abandoned
- 2012-03-14 JP JP2013557947A patent/JP2014513828A/ja active Pending
- 2012-03-14 WO PCT/US2012/029114 patent/WO2012125755A1/en active Application Filing
- 2012-03-14 KR KR1020137027289A patent/KR20130133872A/ko not_active Application Discontinuation
- 2012-03-14 EP EP12712798.3A patent/EP2710587A1/en not_active Withdrawn
- 2012-03-14 CN CN2012800135436A patent/CN103443853A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020095292A1 (en) * | 2001-01-18 | 2002-07-18 | Mittal Parul A. | Personalized system for providing improved understandability of received speech |
CN1461465A (zh) * | 2001-04-13 | 2003-12-10 | 皇家菲利浦电子有限公司 | 语音对话***中的说话人的验证 |
US20040044516A1 (en) * | 2002-06-03 | 2004-03-04 | Kennewick Robert A. | Systems and methods for responding to natural language speech utterance |
CN1881206A (zh) * | 2005-06-15 | 2006-12-20 | 富士通株式会社 | 对话*** |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107430626A (zh) * | 2015-05-27 | 2017-12-01 | 谷歌公司 | 提供建议的基于话音的动作查询 |
CN107430626B (zh) * | 2015-05-27 | 2019-11-08 | 谷歌有限责任公司 | 提供建议的基于话音的动作查询 |
US10504509B2 (en) | 2015-05-27 | 2019-12-10 | Google Llc | Providing suggested voice-based action queries |
US11238851B2 (en) | 2015-05-27 | 2022-02-01 | Google Llc | Providing suggested voice-based action queries |
US11869489B2 (en) | 2015-05-27 | 2024-01-09 | Google Llc | Providing suggested voice-based action queries |
CN109196491A (zh) * | 2016-05-31 | 2019-01-11 | 微软技术许可有限责任公司 | 机器智能预测通信和控制*** |
CN109196491B (zh) * | 2016-05-31 | 2021-09-03 | 微软技术许可有限责任公司 | 机器智能预测通信和控制*** |
US11887594B2 (en) | 2017-03-22 | 2024-01-30 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
CN110582765A (zh) * | 2017-05-03 | 2019-12-17 | 谷歌有限责任公司 | 未索求内容到人类与计算机对话中的前摄并入 |
US11929069B2 (en) | 2017-05-03 | 2024-03-12 | Google Llc | Proactive incorporation of unsolicited content into human-to-computer dialogs |
Also Published As
Publication number | Publication date |
---|---|
KR20130133872A (ko) | 2013-12-09 |
EP2710587A1 (en) | 2014-03-26 |
WO2012125755A1 (en) | 2012-09-20 |
JP2014513828A (ja) | 2014-06-05 |
US20130066634A1 (en) | 2013-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103443853A (zh) | 自动化谈话辅助 | |
US11960526B2 (en) | Query response using media consumption history | |
US11314370B2 (en) | Method for extracting salient dialog usage from live data | |
CN106227815B (zh) | 一种多模态线索的个性化应用程序功能推荐方法及其*** | |
CN102982800A (zh) | 具有影音文件处理功能的电子装置及影音文件处理方法 | |
CN103186557A (zh) | 一种录音或者录像文件自动命名的方法和装置 | |
KR102144868B1 (ko) | 통화 기록 제공 장치 및 방법 | |
CN102630049A (zh) | 一种用于确定用户关于在播视频的兴趣度的方法和设备 | |
CN109582869B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
WO2020248378A1 (zh) | 业务查询方法、装置及存储介质、计算机设备 | |
CN110990598A (zh) | 资源检索方法、装置、电子设备及计算机可读存储介质 | |
CN104202458A (zh) | 一种自动保存联系人信息的方法和智能终端 | |
CN104199837A (zh) | 一种信息输出方法及电子设备 | |
CN103226601A (zh) | 一种图片搜索的方法和装置 | |
CN109344325B (zh) | 基于智能会议平板的信息的推荐方法和装置 | |
CN103020141A (zh) | 一种用于提供搜索结果的方法和设备 | |
CN105550308A (zh) | 一种信息处理方法,检索方法及电子设备 | |
CN101777067B (zh) | 一种用于移动通讯设备终端的网页内容识别管理*** | |
CN104240107A (zh) | 社群数据筛选***及其方法 | |
CN110555202A (zh) | 文摘播报的生成方法和设备 | |
CN106850923B (zh) | 联系人信息显示方法、***及其设备 | |
WO2016085585A1 (en) | Presenting information cards for events associated with entities | |
KR20160041146A (ko) | 컨텍스트 기반의 사용자 분석을 통해 광고를 제공하는 광고 제공 시스템 및 그 방법, 그리고 이에 적용되는 광고 수신 단말 및 서버 | |
CN111159535A (zh) | 资源获取方法及装置 | |
CN113593543B (zh) | 智能音箱语音服务***、方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C05 | Deemed withdrawal (patent law before 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131211 |