CN111433845B - 在会话的上下文中推荐内容的方法和*** - Google Patents
在会话的上下文中推荐内容的方法和*** Download PDFInfo
- Publication number
- CN111433845B CN111433845B CN201880076956.6A CN201880076956A CN111433845B CN 111433845 B CN111433845 B CN 111433845B CN 201880076956 A CN201880076956 A CN 201880076956A CN 111433845 B CN111433845 B CN 111433845B
- Authority
- CN
- China
- Prior art keywords
- media guidance
- guidance application
- content
- user
- session
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 230000008569 process Effects 0.000 claims abstract description 59
- 238000012545 processing Methods 0.000 claims description 44
- 230000004044 response Effects 0.000 claims description 14
- 230000001755 vocal effect Effects 0.000 claims description 12
- 230000003213 activating effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 53
- 238000003860 storage Methods 0.000 description 30
- 230000005236 sound signal Effects 0.000 description 20
- 230000009471 action Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 206010019133 Hangover Diseases 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 241000282320 Panthera leo Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 244000187656 Eucalyptus cornuta Species 0.000 description 1
- 229910021417 amorphous silicon Inorganic materials 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007177 brain activity Effects 0.000 description 1
- 239000002041 carbon nanotube Substances 0.000 description 1
- 229910021393 carbon nanotube Inorganic materials 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000002772 conduction electron Substances 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 229910021420 polycrystalline silicon Inorganic materials 0.000 description 1
- 229920005591 polysilicon Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/4223—Cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/482—End-user interface for program selection
- H04N21/4821—End-user interface for program selection using a grid, e.g. sorted out by channel and broadcast time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
- H04N21/8405—Generation or processing of descriptive data, e.g. content descriptors represented by keywords
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
媒体指南应用可以监听用户之间的会话,并且识别会话中的关键字,而不使用唤醒词。关键字被用来搜索与正在进行的会话相关的媒体内容。因此,媒体指南应用在会话期间向用户呈现相关内容,以更主动地吸引用户。会话监听窗口可用于呈现会话信息以及相关内容。收听模式可以用于管理媒体指南应用何时处理来自会话的语音。媒体指南应用可以访问用户简档获取关键字、选择内容类型、选择内容源并且确定媒体内容的相关性以在会话的上下文中提供内容。
Description
技术领域
语音激活的个人助手有时被用来找到定制内容并与用户联系的方式。用户可以向助手提供语音命令,并且助手作出响应。有时,一组用户可能正在讨论诸如电影或特别感兴趣的场景的媒体内容。典型的***要求用户之一提供查询或执行搜索以找到与会话相关的某物,这可能扰乱会话。这种交互是低效的,并且影响了用户对媒体消费的享受。
除了形成查询和解析搜索结果的努力之外,用户还可能不知道在哪里搜索与他们的会话相关的内容。试图弄清楚内容源、识别感兴趣的特定媒体资产、以及显示该资产可能是不期望的,尤其是在保持会话参与和动态方面。
发明内容
本公开描述了语音激活的个人助手,其可以是媒体指南应用的一方面,其收听会话并在会话中的适当***点处自动提供内容。例如,个人助手可以具有电视收听模式和常规模式。当处于电视收听模式时,用户可能正在与另一个用户就最近的足球比赛进行会话,***会自动识别用户正在讨论游戏的哪个方面,并自动查找并生成游戏剪辑。***在会话过程中显示剪辑,使剪辑成为会话的相关部分。在进一步的示例中,如果用户正在讨论媒体资产或系列中的特定场景,例如,《Game of Thrones》(GOT),则私人助手可以播放正在讨论的场景。***还可以根据会话选择要搜索的一个或多个源。例如,如果一组用户在谈论病毒内容,则***可仅搜索社交媒体源,但是如果他们在谈论体育赛事,则***可以首先搜索体育源,然后搜索次要源(例如社交媒体)以获取相关内容。
因此,提供了用于提供媒体指南应用的***和方法,该媒体指南应用通过监听(例如,利用用户装备)多个用户之间的会话来在会话的上下文中推荐内容。媒体指南应用自动检测会话中的关键字而不接收唤醒词,并搜索与关键字之一匹配的内容,以便在会话期间向用户呈现。在没有接收到唤醒词的情况下,媒体指南应用自动将内容呈现给用户。如本文中所使用的,唤醒词是媒体指南应用被配置为以预定动作响应的识别的命令词。
媒体指南应用通过监听(例如,利用用户装备)多个用户之间的会话来在会话的上下文中推荐内容。随着口头会话继续,媒体指南应用处理口头会话中的单词,以从口头会话中的单词中选择性地检索关键字。媒体指南应用在没有接收基于选择性检索的关键字的唤醒词的情况下,在口头会话中检测关键字。媒体指南应用通过将与多个剪辑中的每个剪辑相关联的元数据与检测到的关键字进行比较,并选择(例如,基于比较)多个剪辑中具有比与另一剪辑相关联的元数据匹配更多所述关键字的元数据的剪辑,来在多个剪辑中搜索与关键字之一匹配的剪辑。媒体指南应用在没有接收唤醒词的情况下,在口头会话期间会自动且将剪辑呈现给用户。在一些实施方式中,多个剪辑中的每个剪辑可以小于阈值持续时间。
在一些实施例中,媒体指南应用在两个或更多用户之间的会话中识别与检测到的关键字相关联的内容类型,并基于识别出的内容类型选择要搜索的内容源。例如,如果关键字包括单词“足球”,则媒体指南应用可以基于单词“足球”将内容类型识别为运动剪辑。因此,通过将内容类型识别为运动剪辑,媒体指南应用可以更有效地从例如运动主题的媒体源搜索和/或定位与运动有关的内容。
在一些实施例中,媒体指南应用生成口头会话处理窗口,并将单词暂时存储在在会话处理窗口内检测到的口头会话中,使得丢弃在窗口的开始时间之前检测到的单词。会话处理窗口是指会话发生并被处理以及相关内容的呈现的时间段。当检测到会话时,媒体指南应用可以启动会话处理窗口,并例如在会话仍在进行时维护该窗口。
在一些实施例中,媒体指南应用激活收听模式,其中在收听模式处于活动时执行监听,而在停用收听模式时不执行监听。因此,收听模式可以用于定义媒体指南应用何时“偷听”。例如,如果媒体指南应用可能仅在检测到某些音频输入时才开始处理语音的音频信号,以使媒体指南应用在不存在会话时不浪费处理资源。
在一些实施例中,关键字可以与媒体资产中的片段有关,并且多个搜索到的剪辑中的每一个都代表媒体资产的场景中的内容。例如,该片段可以是整个场景或其一部分。在另一个示例中,该片段可以是展现体育赛事中的比赛的媒体资产的一部分。
在一些实施例中,媒体指南应用通过改变当前在用户装备上呈现的内容以呈现剪辑而在口头会话期间自动向用户呈现内容。例如,用户可能最初是在用户设备上观看节目,然后在节目继续播放的同时开始交谈。媒体指南应用可以在会话的上下文中呈现相关剪辑,并停止呈现最初正在播放的节目。
在一些实施例中,媒体指南应用通过剪辑呈现一些检测到的关键字,所述剪辑具有响应于在会话中检测到关键字而选择剪辑的指示。例如,媒体指南应用可以与相关剪辑一起显示关键字文本,以便用户可以识别为什么播放剪辑。例如,如果一个或多个关键字不正确(例如,处理错误)并且剪辑不相关,这可能特别有用。显示关键字还可以充当用户反馈,帮助媒体指南应用与用户进行交互。例如,媒体指南应用可以显示关键字,这可以提示用户主动说出其他单词以细化或定制关键字搜索(例如,通过添加更多相关的关键字)。
在一些实施例中,媒体指南应用通过识别口头会话中与多个用户中的每个用户的用户简档匹配的单词来选择性地检索关键字。用户的简档可以包括诸如用户偏好(例如,喜欢的节目、喜欢的体裁、喜欢的女演员)、用户的观看历史、与用户的媒体消费相关联的通用关键字、个人信息、可能与会话相关的其他用户的姓名之类的信息,或与用户有关的其它信息。例如,媒体指南应用可以识别会话中的单词,例如“Jamie”和“Jon”,并访问用户的简档之一,以将Game of Thrones(GOT)标识为喜欢的节目。因此,媒体指南应用可以将“Jamie”和“Jon”识别为GOT中的角色,并且将“Game of Thrones”添加到关键字,或者在Game ofThrones剪辑中搜索关键字。
附图说明
在结合附图考虑以下详细描述时,本公开的上述和其他目的和优点将变得显而易见,其中,相同的附图标记始终指代相同的部分,并且其中:
图1示出了根据本公开的一些实施例的在会话的上下文中推荐内容的说明性实施例;
图2示出了根据本公开的一些实施例的在会话的上下文中推荐内容的说明性实施例;
图3示出了根据本公开的一些实施例的显示屏的说明性实施例,该显示屏可以用于提供媒体指南应用列表和其他媒体指南信息;
图4示出了根据本公开的一些实施例的可以用于提供媒体指南应用列表的显示屏的另一说明性实施例;
图5是根据本公开的一些实施例的说明性设备的框图;
图6是根据本公开的一些实施例的说明性媒体***的框图;
图7是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性过程的流程图;
图8是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性过程的流程图;
图9是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性过程的流程图;和
图10是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性过程的流程图。
具体实施方式
本公开描述了一种语音激活的个人助手,其可以是媒体指南应用的一个方面,该语音激活的个人助手收听会话并在会话中的适当***点处自动提供内容。例如,个人助手可以具有电视收听模式和常规模式。当处于电视收听模式并且用户可能正在与另一用户关于最近的足球比赛进行会话时,***自动识别用户正在讨论比赛的什么方面,并且自动找到和生成比赛的剪辑。***在会话期间呈现剪辑,使得剪辑成为会话的相关部分。在进一步的示例中,如果用户正在讨论媒体资产或系列(例如,Game of Thrones(GOT))中的特定场景,则个人助手可以播放正在讨论的场景。该***还可以基于会话来选择要搜索的一个或多个源。例如,如果一组用户正在谈论病毒内容,则***可仅搜索社交媒体源,但是如果他们正在谈论体育赛事,则***可以首先搜索体育源,然后搜索次要源(例如,社交媒体)以寻找相关内容。
图1示出了根据本公开的一些实施例的在会话100的上下文中推荐内容的说明性实施例。媒体指南应用可以利用耦合到显示设备110(例如,电视机)的用户设备102来监听用户130和用户140之间的会话100。用户设备102包括音频输入设备(即,集成在设备中以检测音频信号的麦克风)。虽然说明性地示出为耦合到显示设备110的单独设备,但是用户设备(例如,用户设备102)可以替代地或附加地包括移动电话、计算机、集成显示器和处理电路(例如,智能TV)或根据本公开的图5-6的描述的任何其他合适的设备。用户130和用户140可以参与关于给定媒体资产(例如,Game of Thrones(GOT))的会话,并且更具体地,参与关于在最近的剧集中Jon Snow(即,Game of Thrones中的人物)是否存活的会话。例如,下面示出了说明性会话100的示例。
说明性会话100的示例1。
用户130:“你看了最新的GOT剧集吗?”
用户140:“没有,发生了什么?我听说Jon Snow-”
用户130(打断):“什么!不要告诉我Jon Snow发生了什么!”
用户140:“我认为他是活着的。”
随着会话100开始(例如,用户设备102检测到来自会话100的音频信号),媒体应用可以开始处理语音。例如,媒体指南应用可以实例化口头会话处理窗口,并且开始在存储器中存储音频信号。此外,口头处理窗口可以持续整个会话100。说明性会话100包括两个用户(用户130和用户140),以及例如五秒的语音。在五秒的语音中,媒体指南应用可以识别一个或多个关键字。例如,媒体指南应用可以将“GOT”、“剧集”、“Jon”、“Snow”、“活着”、“发生”和“最新”标识为会话100的示例1中的单词。在一些实施例中,媒体指南应用可以识别可能在社交媒体上热门的关键字“Jon Snow活着”。因此,媒体指南应用可以例如在搜索相关内容时单独地将社交媒体视为内容源。例如,一些社交媒体服务可以呈现在其网络内热门的关键字或内容。例如,Facebook或Twitter可以呈现当前热门话题、内容、站点或信息。媒体指南应用可以访问社交媒体网络并且识别出什么是热门的(例如,基于关键字)。在进一步的示例中,媒体指南应用可以查询第三方服务以递送关于热门的识别、存储、组织、分类或以其他方式管理趋势的识别的信息。在进一步的示例中,媒体指南应用可以访问用户130和140的社交媒体账户(例如,他们是否已登录),以确定什么是热门的。
此外,说明性会话100可以在用户130和用户140已经在显示屏104上观看节目时发生。媒体指南应用可以管理显示屏104,以向用户130和140呈现相关内容,如图2所示。
图2示出了根据本公开的一些实施例的在会话100的上下文中推荐内容的说明性实施例。响应于检测到会话100,媒体指南应用可以生成会话处理显示220,其可以包括例如选项栏222、关键字显示224、内容列表226和视频区域228。媒体指南应用可以生成包括显示104的元素的显示204和会话处理显示220。选项栏222可以包括搜索选项(例如,以细化、限制或以其他方式影响搜索多个剪辑)、选择标准(例如,以应用偏好或以其他方式影响所选择的剪辑)、显示选项(例如,呈现会话处理显示220作为覆盖、全屏或分屏、暂停先前显示的节目、关闭会话处理显示220)、任何其他合适的选项或其任何组合。关键字显示224可包括从会话100标识的一个或多个所显示的关键字。关键字显示224可呈现所有标识的关键字、一些标识的关键字、所有在执行对内容的搜索中使用的关键字、一些在执行对内容的搜索中使用的关键字、任何其它合适的关键字组、或其任何组合。内容列表226可以包括一个或多个媒体资产列表(例如,显示有诸如列表中的索引、其他标识符或标题的指示符)。视频区域228可以包括可播放剪辑。任何合适的播放选项可被包括作为视频区域228的一部分,诸如播放、暂停、停止、倒带、快进、滚动或其它合适的选项。
如图2中说明性地示出的,会话100仍然在进行,因为相关剪辑被呈现在视频区域228中。媒体指南应用可以被配置为在会话100期间提供相关的剪辑以增强会话或不减弱会话。因此,当用户130和用户140关于GOT交谈时,他们不需要主动地关注媒体指南应用、发起搜索、解析搜索结果或者以其他方式使他们自己从会话100转移注意力。通过不需要唤醒词,媒体指南应用可以因此执行例如关键字检测、内容搜索、内容选择和内容呈现,而无需接收来自用户的命令输入。在一些情况下,媒体指南应用可以执行会话处理而可能直到呈现剪辑用户130和140才会注意到。因此,媒体指南应用可以向会话提供补充输入,并且可能刺激进一步的会话。在一些实施例中,媒体指南应用可以通过识别其间音频输入低于阈值(例如,音频信号能量低于阈值,音频信号幅度低于阈值)的时间段来检测会话中的间歇或中断。自然会话可以包括间歇(例如,更安静或更不频繁的说话)、中断(例如,不说话)、说话者之间的切换(例如,轮流讲话)、中断、以及多人同时说话。因此,媒体指南应用可以在检测到的说话中的间歇或中断期间呈现剪辑(例如,较少打扰)。在一些实施例中,媒体指南应用可以在活动会话期间(例如,不在间歇或中断期间)呈现剪辑。例如,在活动会话期间的剪辑的呈现可以更容易地和及时地与会话融合。
下面提供了使用会话100作为参考的另一示例(即,示例2)。
说明性会话100的示例2。
用户130:“哇,我喜欢,我喜欢Detroit Lions!”
用户140:“是的,昨晚那场比赛太棒了”
用户130:“什么!我完全错过了,谁赢了?”
用户140:“没事,不过最后有拦截!”
会话100的示例2包括媒体指南应用可以识别为与体育相关的关键字“DetroitLions”、“比赛”、“昨晚”和“拦截”。媒体指南应用可以将识别的单词与已知的单词进行比较以对关键字进行分类。例如,媒体指南应用可以搜索存储内容类型和内容源的数据库(例如,媒体指南数据源618)。通过在适当的搜索查询中提供关键字,媒体指南应用可以搜索数据库(例如,使用任何适当的搜索技术)以检索内容类型和内容源。因此,在这样的情况下,在一些实施例中,媒体指南应用可以优先选择提供、分类或存储体育集锦的内容源。此外,媒体指南应用可以将关键字“昨晚”识别为与时间和日期相关。例如,媒体指南应用可以考虑会话100的日期和时间,并且相应地搜索具有在当前日期前一天的相关联日期、具有在下午5点后的时间(例如,对应于“昨晚”)的剪辑。因此,用于搜索的关键字可以是,但不必是,与来自会话的所识别的单词逐字匹配。在一些实施例中,媒体指南应用可以使用语音处理将整个会话转换成单词,并且然后执行转换的会话的全文搜索以识别关键字。在一些实施例中,媒体指南应用可以将会话转换成会话内片段中的文本并且处理来自片段的单词,使得会话不需要结束以便开始处理。
媒体指南应用可以使用适合于会话100的口头会话处理窗口来执行这里公开的说明性步骤(例如,在图1-2和图7-10的上下文中)。因此,媒体指南应用可以识别语音、标识关键字、基于关键字搜索内容、选择内容、以及在规定的时间量内呈现内容。因此,媒体指南应用可以在会话(例如,会话100)的上下文中以任何合适的时间尺度执行本文公开的说明性步骤。口头会话处理窗口的时间尺度(例如,窗口的持续时间)可以是预定的,可以取决于会话本身(例如,会话有多长、会话的主题、会话中的参与者)、执行媒体指南应用的动作的装备(例如,可用的存储器和处理功率)、用户指定的时间尺度、预定时间尺度、相关内容的长度(例如,足球比赛(play)具有高达10秒的典型时间尺度,足球比赛(game)可以具有几小时的典型时间尺度)。
例如,参考图1-2,如果从检测会话100到呈现相关剪辑所经过的时间是几秒或甚至10秒,则会话100可能仍然在进行或是“新鲜的”。在一些情况下,如果经过的时间是一分钟(例如,从会话100的开始,或从会话100的结束),则会话100可能较少受益于剪辑,而在其他情况下,一分钟仍然落在会话100的持续时间内。如果经过的时间是一小时,则用户130或140中的一个或两个可能仍然不存在(例如,尽管可能仍然期望呈现或存储有用剪辑)。
交互式媒体指南应用可以基于它们提供指南的内容而采取各种形式。一种典型的媒体指南应用类型是交互式电视节目指南。交互式电视节目指南(有时被称为电子节目指南)是众所周知的指南应用,除其它之外,尤其允许用户在多种类型的内容或媒体资产中导航和定位。交互式媒体指南应用可以生成图形用户界面屏幕,这使用户能够在内容之间导航、定位和选择。如本文所提到的,术语“媒体资产”和“内容”应当被理解为意指电子可消费的用户资产,诸如电视节目,以及按次计费节目、点播节目(如在点播视频(VOD)***中)、互联网内容(例如,流传输内容、可下载内容、网络广播(Webcast)等等)、视频剪辑、音频、内容信息、图片、旋转图像、文档、播放列表、网站、文章、书籍、电子书籍、博客、聊天会话、社交媒体、应用、游戏和/或任何其它媒体或多媒体和/或其组合。指南应用还允许用户在内容之间进行导航和定位。如本文所提到的,术语“多媒体”应当被理解为意指利用上述至少两种不同内容形式(例如文本、音频、图像、视频或交互内容形式)的内容。内容可以被用户装备设备记录、播放、显示或访问,但也可以是实况表演的一部分。
在一些实施例中,媒体指南应用可以包括语音激活的电子助手(也称为“语音激活的个人助手”或“电子助手”)。电子助手可能能够进行语音识别,例如接收语音命令并识别口语单词和短语。电子助手可以被配置为识别语音、说话(例如,输出语音消息)、分析语音(例如,检测单词、检测短语、检测谁在讲话)、管理媒体内容、向用户呈现媒体内容、管理对用户的会话的响应、执行任何其他适当的操作以帮助管理内容、或其任何组合。例如,电子助手可以检测语音模式,并识别可以指示电子助手的期望动作的一个或多个唤醒词。说明性地,用户可以例如说“唤醒”,而电子助手可以开始语音识别。在一些实施例中,电子助手可以识别语音而无需说出唤醒词或其他期望命令的指示(例如,由用户)。
用于执行本文讨论的任何实施例的媒体指南应用和/或任何指令可以在计算机可读介质上被编码。计算机可读介质包括能够存储数据的任何介质。计算机可读介质可以是暂态的,包括但不限于传播的电信号或电磁信号,或者可以是非暂态的,包括但不限于易失性和非易失性计算机存储器或存储设备,诸如硬盘、软盘、USB驱动器、DVD、CD、介质卡、寄存器存储器、处理器高速缓存、随机存取存储器(“RAM”),等等。
随着互联网、移动计算和高速无线网络的出现,用户在他们传统上不使用的用户装备设备上访问媒体。如本文所提到的,短语“用户装备设备”、“用户装备”、“用户设备”、“电子设备”、“电子装备”、“媒体装备设备”或“媒体设备”应当被理解为意指用于访问上述内容的任何设备,诸如电视机、智能TV、机顶盒、用于处理***的集成接收器解码器(IRD)、数字存储设备、数字媒体接收器(DMR)、数字媒体适配器(DMA)、流传输媒体设备、DVD播放器、DVD记录器、连接的DVD、本地媒体服务器、BLU-RAY播放器、BLU-RAY记录器、个人计算机(PC)、膝上型计算机、平板计算机、WebTV盒、个人计算机电视(PC/TV)、PC媒体服务器、PC媒体中心、手持式计算机、固定电话、个人数字助手(PDA)、移动电话、便携式视频播放器、便携式音乐播放器、便携式游戏机、智能手机或任何其它电视装备、计算装备或无线设备,和/或其组合。在一些实施例中,用户装备设备可以具有面向前方的屏幕和面向后方的屏幕、多个前方屏幕或多个有角度的屏幕。在一些实施例中,用户装备设备可以具有面向前方的摄像头和/或面向后方的摄像头。在这些用户装备设备上,用户可以能够在通过电视机可用的相同内容中进行导航和定位。因此,媒体指南也可以在这些设备上可用。所提供的指南可以用于仅通过电视机可用的内容,用于仅通过一个或多个其它类型的用户装备设备可用的内容,或用于既通过电视机又通过一个或多个其它类型的用户装备设备可用的内容。媒体指南应用可以作为在线应用(即,在网站上提供)或作为用户装备设备上的独立应用或客户端来提供。下面将更详细地描述可以实现媒体指南应用的各种设备和平台。
媒体指南应用的功能之一是向用户提供媒体指南数据。如本文所提到的,短语“媒体指南数据”或“指南数据”应当被理解为意指与在操作指南应用中使用的内容或数据相关的任何数据。例如,指南数据可以包括节目信息、指南应用设置、用户偏好、用户简档信息、媒体列表、媒体相关信息(例如,广播时间、广播频道、标题、描述、评级信息(例如,父母控制评级、评论家的评级,等等)、体裁或类别信息、演员信息、用于广播公司或提供商的徽标的徽标数据,等等)、媒体格式(例如,标准清晰度、高清晰度、3D,等等)、点播信息、博客、网站以及有助于用户在期望的内容选择中进行导航和定位的任何其它类型的指南数据。
图3-4示出了可以用于提供媒体指南数据的说明性显示屏幕。图3-4中所示的显示屏幕可以在任何合适的用户装备设备或平台上实现。虽然图3-4的显示被示为全屏显示,但是它们也可以全部或部分地覆盖在正被显示的内容上。用户可以通过选择在显示屏幕中提供的可选择选项(例如,菜单选项、列表选项、图标、超链接等等)或者按下遥控器或其它用户输入界面或设备上的专用按钮(例如,GUIDE按钮)来指示期望访问内容信息。响应于用户的指示,媒体指南应用可以向显示屏幕提供以若干方式之一组织的媒体指南数据,诸如在网格中按时间和频道、按时间、按频道、按来源、按内容类型、按类别(例如,电影、体育、新闻、儿童或其它节目类别)或其它预定义的、用户定义的或其它组织标准。
图3示出了按照时间和频道布置的节目列表显示300的说明性网格,其也使得能够访问单个显示中的不同类型的内容。显示300可以包括网格302,其具有:(1)频道/内容类型标识符的列304,其中每个频道/内容类型标识符(其是列中的单元格)识别可用的不同频道或内容类型;和(2)时间标识符的行306,其中每个时间标识符(其是行中的单元格)识别节目的时间块。网格302还包括节目列表的单元格,诸如节目列表308,其中每个列表提供在列表的相关频道和时间上提供的节目的标题。利用用户输入设备,用户可以通过移动高亮区域310来选择节目列表。可以在节目信息区域312中提供与由高亮区域310选择的节目列表相关的信息。区域312可以包括例如节目标题、节目描述、节目被提供的时间(如果适用的话)、节目所在的频道(如果适用的话)、节目的评级以及其它期望的信息。
除了提供对线性节目的访问(例如,被调度在预定时间发送到多个用户装备设备并且根据时间表提供的内容),媒体指南应用还提供对非线性节目的访问(例如,在任何时间用户装备设备可访问和不按照时间表提供的内容)。非线性节目可以包括来自不同内容源的内容,包括点播内容(例如VOD)、互联网内容(例如,流传输媒体、可下载的媒体等等)、本地存储的内容(例如,存储在如上所述的任何用户装备设备或其它存储设备上的内容)或其它与时间无关的内容。点播内容可以包括电影或由特定内容提供商提供的任何其它内容(例如,HBO点播提供“The Sopranos”和“Curb Your Enthusiasm”)。HBO ON DEMAND是时代华纳(Time Warner)公司L.P.等人拥有的服务标志,并且THE SOPRANOS和CURB YOURENTHUSIASM是由Home Box Office公司拥有的商标。互联网内容可以包括web事件(诸如聊天会话或网络广播),或者可通过互联网网站或其它互联网访问(例如,FTP)作为流传输内容或可下载内容点播可用的内容。
网格302可以提供用于非线性节目的媒体指南数据,包括点播列表314、记录的内容列表316和互联网内容列表318。组合来自不同类型的内容源的内容的媒体指南数据的显示有时被称为“混合媒体”显示。可以被显示的、与显示300不同的媒体指南数据的类型的各种变换(permutations)可以基于用户选择或指南应用定义(例如,仅记录和广播的列表、仅点播和广播的列表等等的显示)。如图所示,列表314、316和318被示为跨越网格302中显示的整个时间块,以指示这些列表的选择可以分别提供对专用于点播列表、记录的列表或互联网列表的显示的访问。在一些实施例中,可以将用于这些内容类型的列表直接包括在网格302中。附加的媒体指南数据可以响应于用户选择导航图标320之一而被显示。(按下用户输入设备上的箭头键可以以与选择导航图标320类似的方式影响显示。)
显示300还可以包括视频区域322和选项区域324。视频区域322可以允许用户收看和/或预览用户当前可用、将可用或曾经可用的节目。视频区域322的内容可以与网格302中显示的列表之一对应或者独立于其。包括视频区域的网格显示有时被称为指南中画面(PIG)显示。在2003年5月13日授予Satterfield等人的美国专利No.6,564,378和2001年5月29日授予Yuen等人的美国专利No.6,239,794中更详细地描述了PIG显示及其功能,这两个专利的全部内容整体上通过引用并入本文。PIG显示可以包括在本文描述的实施例的其它媒体指南应用显示屏幕中。
选项区域324可以允许用户访问不同类型的内容、媒体指南应用显示和/或媒体指南应用特征。选项区域324可以是显示300(以及本文描述的其它显示屏幕)的部分,或者可以由用户通过选择屏幕上的选项或按下用户输入设备上的专用或可指派按钮来调用。选项区域324内的可选择选项可以涉及与网格302中的节目列表相关的特征,或者可以包括从主菜单显示中可用的选项。与节目列表相关的特征可以包括搜索其它的播出时间或者接收节目、记录节目、启用节目的系列记录、将节目和/或频道设置为喜爱、购买节目的方式,或其它特征。主菜单显示中可用的选项可以包括搜索选项、VOD选项、父母控制选项、互联网选项、基于云的选项、设备同步选项、第二屏幕设备选项、访问各种类型的媒体指南数据显示的选项、订阅高级服务的选项、编辑用户简档的选项、访问浏览叠层的选项或其它选项。
媒体指南应用可以基于用户偏好被个性化。个性化的媒体指南应用允许用户定制显示和特征,以创建与媒体指南应用的个性化“体验”。这种个性化体验可以通过允许用户输入这些定制和/或通过媒体指南应用监视用户活动以确定各种用户偏好来创建。用户可以通过登录或以其它方式向指南应用识别他们自己来访问其个性化指南应用。媒体指南应用的定制可以根据用户简档进行。定制可以包括不同的呈现方案(例如,显示器的颜色方案、文本的字体大小等等)、所显示的内容列表的各个方面(例如,仅HDTV或仅3D节目、基于最喜爱的频道选择的用户指定的广播频道、重新排序频道的显示、推荐的内容等等)、期望的记录特征(例如,针对特定用户的记录或系列记录、记录质量等等)、父母控制设置、互联网内容的定制呈现(例如,社交媒体内容、电子邮件、电子交付的文章等等的呈现)以及其它期望的定制。
媒体指南应用可以允许用户提供用户简档信息,或者可以自动编译用户简档信息。媒体指南应用可以例如监视用户访问的内容和/或用户可能与指南应用的其它交互。此外,媒体指南应用可以获得与特定用户相关的其它用户简档的全部或部分(例如,从互联网上用户访问的其它网站(诸如www.Tivo.com)、从用户访问的其它媒体指南应用、从用户访问的其它交互式应用、从用户的另一个用户装备设备等等),和/或从媒体指南应用可以访问的其它源获得关于用户的信息。因此,可以跨用户的不同用户装备设备为用户提供统一的指南应用体验。下面结合图6更详细地描述这种类型的用户体验。在Ellis等人于2005年7月11日提交的美国专利申请公开No.2005/0251827、于2007年1月16日授予Boyer等人的美国专利No.7,165,098以及Ellis等人于2002年2月21日提交的美国专利申请公开No.2002/0174430中更详细地描述了附加的个性化媒体指南应用特征,这些通过引用整体上并入本文。
用于提供媒体指南的另一种显示布置在图4中示出。视频马赛克显示400包括用于基于内容类型、体裁和/或其它组织标准组织的内容信息的可选择选项402。在显示400中,选择电视列表选项404,由此提供列表406、408、410和412作为广播节目列表。在显示400中,列表可以提供包括封面艺术的图形图像、来自内容的静止图像、视频剪辑预览、来自内容的实况视频或向用户指示内容由列表中的媒体指南数据描述的其它类型的内容。每个图形列表还可以附带有文本,以提供关于与列表相关联的内容的进一步信息。例如,列表408可以包括多于一个部分,包括媒体部分414和文本部分416。媒体部分414和/或文本部分416可以是可选择的,以全屏观看内容或者观看与媒体部分414中显示的内容相关的信息(例如,观看用于显示视频的频道的列表)。
显示400中的列表具有不同的尺寸(即,列表406大于列表408、410和412),但是如果期望的话,那么所有列表可以是相同的尺寸。列表可以具有不同的尺寸或以图形方式加强,以指示用户感兴趣的程度或者强调某些内容,如内容提供者所期望的或者基于用户偏好。在例如2009年11月12日提交的Yates的美国专利申请公开No.2010/0153885中讨论了用于以图形方式加强内容列表的各种***和方法,其通过引用整体上并入本文。
用户可以从其一个或多个用户装备设备访问内容和媒体指南应用(及其上面和下面描述的显示屏幕)。图5示出了说明性用户装备设备500的一般化实施例。下面结合图6讨论用户装备设备的更具体的实现。用户装备设备500可以经由输入/输出(以下称为“I/O”)路径502接收内容和数据。I/O路径502可以向控制电路***504提供内容(例如,广播节目、点播节目、互联网内容、局域网(LAN)或广域网(WAN)上可用的内容,和/或其它内容)和数据,控制电路***504包括处理电路***506和存储装置508。控制电路***504可以被用来使用I/O路径502发送和接收命令、请求和其它合适的数据。I/O路径502可以将控制电路***504(具体而言是处理电路***506)连接到一个或多个通信路径(下面描述)。I/O功能可以由这些通信路径中的一个或多个提供,但是在图5中被示为单个路径,以避免使图过于复杂。
控制电路***504可以基于任何合适的处理电路***,诸如处理电路***506。如本文所提到的,处理电路***应当被理解为意指基于一个或多个微处理器、微控制器、数字信号处理器、可编程逻辑设备、现场可编程门阵列(FPGA)、专用集成电路(ASIC)等等的电路***,并且可以包括多核处理器(例如,双核、四核、六核或任何合适数量的核)或超级计算机。在一些实施例中,处理电路***可以分布在多个单独的处理器或处理单元上,例如多个相同类型的处理单元(例如,两个Intel Core i7处理器)或多个不同的处理器(例如,IntelCore i5处理器和Intel Core i7处理器)。在一些实施例中,控制电路***504执行存储在存储器(即,存储装置508)中用于媒体指南应用的指令。具体而言,控制电路***504可以由媒体指南应用指示,以执行上面和下面讨论的功能。例如,媒体指南应用可以向控制电路***504提供指令,以生成媒体指南显示。在一些实现中,由控制电路***504执行的任何动作可以基于从媒体指南应用接收的指令。
在基于客户端-服务器的实施例中,控制电路***504可以包括适于与指南应用服务器或其它网络或服务器进行通信的通信电路***。用于执行上述功能的指令可以存储在指南应用服务器上。通信电路***可以包括用于与其它装备通信的电缆调制解调器、综合业务数字网络(ISDN)调制解调器、数字订户线路(DSL)调制解调器、电话调制解调器、以太网卡或无线调制解调器,或者任何其它合适的通信电路***。这种通信可以涉及互联网或任何其它合适的通信网络或路径(结合图6更详细地描述)。此外,通信电路***可以包括使得能够实现用户装备设备的对等通信或者在彼此远离的位置的用户装备设备的通信的电路***(下面更详细地描述)。
存储器可以是作为存储装置508提供的电子存储设备,存储装置508是控制电路***504的一部分。如本文所提到的,短语“电子存储设备”或“存储设备”应当被理解为意指用于存储电子数据、计算机软件或固件的任何设备,诸如随机存取存储器、只读存储器、硬盘驱动器、光盘驱动器、数字视频光盘(DVD)记录器、光盘(CD)记录器、BLU-RAY盘(BD)记录器、BLU-RAY 3D盘片记录器、数字视频记录器(DVR,有时称为个人录像机或PVR)、固态设备、量子存储设备、游戏控制台、游戏介质或任何其它合适的固定或可移除存储设备,和/或其任意组合。存储装置508可以被用来存储本文描述的各种类型的内容以及上述的媒体指南数据。非易失性存储器也可以被使用(例如,启动指南程序和其它指令)。关于图6描述的基于云的存储装置可以被用来补充存储装置508或代替存储装置508。
控制电路***504可以包括视频生成电路***和调谐电路***,诸如一个或多个模拟调谐器、一个或多个MPEG-2解码器或其它数字解码电路***、高清晰度调谐器或者任何其它合适的调谐或视频电路,或者这种电路的组合。还可以提供编码电路***(例如,用于将空中(over-the-air)、模拟或数字信号转换成MPEG信号以供存储)。控制电路***504还可以包括用于将内容上变频和下变频成用户装备500的优选输出格式的缩放器电路***。电路***504还可以包括用于在数字和模拟信号之间转换的数模转换器电路***和模数转换器电路***。调谐和编码电路***可以被用户装备设备用来接收和显示、播放或记录内容。调谐和编码电路***也可以被用来接收指南数据。本文描述的电路***,包括例如调谐、视频生成、编码、解码、加密、解密、缩放器和模拟/数字电路***,可以使用在一个或多个通用或专用处理器上运行的软件来实现。可以提供多个调谐器来处理同时调谐功能(例如,观看和记录功能、画中画(PIP)功能、多调谐器记录等等)。如果存储装置508被提供为与用户装备500分开的设备,那么调谐和编码电路***(包括多个调谐器)可以与存储装置508相关联。
用户可以使用用户输入界面510向控制电路***504发送指令。用户输入界面510可以是任何合适的用户界面,诸如遥控器、鼠标、轨迹球、小键盘、键盘、触摸屏、触摸板、触笔输入、游戏杆、语音识别界面或其它用户输入界面。显示器512可以被提供为独立的设备或与用户装备设备500的其它元件集成。例如,显示器512可以是触摸屏或触敏显示器。在这种情况下,用户输入界面510可以与显示器512集成或者与显示器512结合。显示器512可以是监视器、电视机、用于移动设备的液晶显示器(LCD)、非晶硅显示器、低温多晶硅显示器、电子墨水显示器、电泳显示器、有源矩阵显示器、电润湿显示器、电流体显示器、阴极射线管显示器、发光二极管显示器、电致发光显示器、等离子体显示器面板、高性能寻址显示器、薄膜晶体管显示器、有机发光二极管显示器、表面传导电子发射显示器(SED)、激光电视、碳纳米管、量子点显示器、干涉式调制器显示器或用于显示视觉图像的任何其它合适的设备。在一些实施例中,显示器512可以是具有HDTV能力的。在一些实施例中,显示器512可以是3D显示器,并且交互式媒体指南应用和任何合适的内容可以以3D显示。视频卡或图形卡可以将输出生成到显示器512。视频卡可以提供各种功能,诸如3D场景和2D图形的加速渲染、MPEG-2/MPEG-4解码、TV输出或连接多个显示器的能力。视频卡可以是以上关于控制电路***504描述的任何处理电路***。视频卡可以与控制电路***504集成。扬声器514可以被提供为与用户装备设备500的其它元件集成,或者可以是独立的单元。显示器512上显示的视频和其它内容的音频分量可以通过扬声器514播放。在一些实施例中,音频可以分发给接收器(未示出),其经由扬声器514处理和输出音频。
指南应用可以使用任何合适的体系架构来实现。例如,它可以是完全在用户装备设备500上实现的独立应用。在这种方案中,应用的指令被本地存储(例如,存储在存储装置508中),并且由应用使用的数据被定期下载(例如,从带外馈送、从互联网资源,或使用其它合适的方案)。控制电路***504可以从存储装置508检索应用的指令,并处理指令,以生成本文所讨论的任何显示。基于经处理的指令,控制电路***504可以确定在从输入界面510接收到输入时要执行什么动作。例如,当输入界面510指示向上/向下按钮被选择时,可以通过经处理的指令来指示显示器上光标的向上/向下的移动。
在一些实施例中,媒体指南应用是基于客户端-服务器的应用。通过向远离用户装备设备500的服务器发出请求,按需检索用于由在用户装备设备500上实现的胖或瘦客户端使用的数据。在基于客户端-服务器的指南应用的一个示例中,控制电路***504运行解释由远程服务器提供的网页的Web浏览器。例如,远程服务器可以将用于应用的指令存储在存储设备中。远程服务器可以使用电路***(例如,控制电路***504)来处理所存储的指令,并生成上面和下面讨论的显示。客户端设备可以接收由远程服务器生成的显示,并且可以在装备设备500上本地显示该显示的内容。以这种方式,由服务器远程地执行指令的处理,同时在装备设备500上本地提供结果显示。装备设备500可以经由输入界面510接收来自用户的输入,并且将那些输入发送到远程服务器进行处理并生成对应的显示。例如,装备设备500可以向远程服务器发送指示经由输入界面510选择了向上/向下按钮的通信。远程服务器可以根据那个输入来处理指令,并生成与该输入对应的应用的显示(例如,向上/向下移动光标的显示)。所生成的显示然后被发送到装备设备500以供呈现给用户。
在一些实施例中,媒体指南应用被下载并由(由控制电路***504运行的)解释器或虚拟机解释或以其它方式运行。在一些实施例中,指南应用可以以ETV二进制交换格式(EBIF)编码,由控制电路***504作为合适的馈送的部分接收,并由在控制电路***504上运行的用户代理解释。例如,指南应用可以是EBIF应用。在一些实施例中,可以由一系列基于JAVA的文件来定义指南应用,这些基于JAVA的文件由本地虚拟机或控制电路***504执行的其它合适的中间件接收并运行。在一些此类的实施例中(例如,采用MPEG-2或其它数字媒体编码方案的实施例),可以例如在具有节目的MPEG音频和视频分组的MPEG-2对象轮播中编码和发送指南应用。
音频输入设备520可以包括麦克风或其他合适的设备,该麦克风或其他合适的设备可以从环境(例如,附近的用户的会话)接收音频信号,并将音频信号转换为电子信号、光信号、可以被处理和传送的任何其他信号或其任何组合。音频输入设备520可包括线绕型麦克风、电容性麦克风、压电麦克风、前置放大器、信号放大器、信号调节器、滤波器、任何其他合适的组件或其任意组合。在一些实施例中,音频输入设备520可以包括处理电路以处理音频信号,并且将处理后的信号传送至控制电路506(例如,用于进一步处理)。在一些实施例中,音频输入设备520可以包括机制(例如,将声波转换成电信号或光信号),并且信号的大部分实质性处理是由控制电路506执行的。例如,音频输入设备520可以包括用于将相应的电信号传输到控制电路506的麦克风和放大器,并且控制电路506可以执行语音识别、声音识别或以其他方式处理口头会话。在一些实施例中,音频输入设备520可以被集成为用户设备(例如,内置麦克风)的一部分。例如,参考图1,用户设备102可以包括用于检测语音的集成麦克风。
图5的用户装备设备500可以在图6的***600中实现,作为用户电视装备602、用户计算机装备604、无线用户通信设备606或适于访问内容的任何其它类型的用户装备(诸如非便携式游戏机)。为了简单起见,这些设备在本文可以被统称为用户装备或用户装备设备,并且可以基本上类似于上述的用户装备设备。在其上可以实现媒体指南应用的用户装备设备可以用作独立设备或者可以是设备的网络的一部分。设备的各种网络配置可以被实现并且在下面被更详细地讨论。
利用上面结合图5描述的***特征中的至少一些的用户装备设备可能不仅仅被分类为用户电视装备602、用户计算机装备604或无线用户通信设备606。例如,用户电视装备602可以像一些用户计算机装备604一样启用互联网,以允许访问互联网内容,而用户计算机装备604可以像一些电视装备602一样包括调谐器,以允许访问电视节目。媒体指南应用可以在各种不同类型的用户装备上具有相同的布局,或者可以针对用户装备的显示能力而被定制。例如,在用户计算机装备604上,指南应用可以被提供为由web浏览器访问的网站。在另一个示例中,可以针对无线用户通信设备606缩小指南应用。
在***600中,通常每种类型的用户装备设备存在多于一个,但是在图6中仅示出了每种类型中的一个,以避免使图过于复杂。此外,每个用户可以利用多于一种类型的用户装备设备以及多于一个每种类型的用户装备设备。
在一些实施例中,用户装备设备(例如,用户电视装备602、用户计算机装备604、无线用户通信设备606)可以被称为“第二屏幕设备”。例如,第二屏幕设备可以补充在第一用户装备设备上呈现的内容。在第二屏幕设备上呈现的内容可以是补充在第一设备上呈现的内容的任何合适的内容。在一些实施例中,第二屏幕设备提供用于调整第一设备的设置和显示偏好的界面。在一些实施例中,第二屏幕设备被配置用于与其它第二屏幕设备交互或用于与社交网络交互。第二屏幕设备可以位于与第一设备相同的房间中、与第一设备不同的房间但在同一个房屋或建筑物中,或者与第一设备不同的建筑物中。
用户还可以设置各种设置,以在家用式设备和远程设备之间维持一致的媒体指南应用设置。设置包括本文描述的那些设置,以及频道和节目收藏,指南应用用来做出节目推荐、显示偏好的节目偏好,和其它期望的指南设置。例如,如果用户将例如网站www.Tivo.com上的频道设置为其办公室的的个人计算机上的收藏,那么相同的频道将在用户的家用式设备(例如,用户电视装备和用户计算机装备)以及用户的移动设备上出现为收藏。因此,在一个用户装备设备上进行的改变可以改变另一个用户装备设备上的指南体验,而不管它们是相同类型还是不同类型的用户装备设备。此外,所做的改变可以基于用户输入的设置以及由指南应用监视的用户活动。
用户装备设备可以耦合到通信网络614。即,用户电视装备602、用户计算机装备604和无线用户通信设备606分别经由通信路径608、610和612耦合到通信网络614。通信网络614可以是一个或多个网络,包括互联网、移动电话网络、移动语音或数据网络(例如,4G或LTE网络)、有线网络、公共交换电话网络或其它类型的通信网络,或者通信网络的组合。路径608、610和612可以单独地或一起包括一条或多条通信路径,诸如卫星路径、光纤路径、电缆路径、支持互联网通信(例如,IPTV)的路径、自由空间连接(例如,用于广播或其它无线信号)或任何其它合适的有线或无线通信路径或这种路径的组合。路径612用点线画出,以指示在图6所示的示例性实施例中它是无线路径,并且路径608和610被绘制为实线,以指示它们是有线路径(但是,如果期望,那么这些路径可以是无线路径)。与用户装备设备的通信可以由这些通信路径中的一个或多个提供,但是在图6中被示为单个路径,以避免使图过于复杂。
虽然在用户装备设备之间没有画出通信路径,但是这些设备可以经由通信路径(诸如上面结合路径608、610和612描述的那些)以及其它短距离点到点通信路径(诸如USB电缆、IEEE 1394电缆、无线路径(例如,蓝牙、红外线、IEEE 802-11x等))或者经由有线或无线路径的其它短距离通信彼此直接通信。蓝牙是Bluetooth SIG公司拥有的认证标志。用户装备设备也可以通过经由通信网络614的间接路径彼此直接通信。
***600包括分别经由通信路径620和622耦合到通信网络614的内容源616和媒体指南数据源618。路径620和622可以包括上面结合路径608、610和612描述的任何通信路径。与内容源616和媒体指南数据源618的通信可以经一条或多条通信路径交换,但是在图6中被示为单条路径,以避免使图过于复杂。此外,内容源616和媒体指南数据源618中的每一种可以有多于一个,但是在图6中每种仅示出一个,以避免使图过于复杂。(以下讨论这些源中的每一种的不同类型。)如果期望,那么内容源616和媒体指南数据源618可以被集成为一个源设备。虽然源616和618与用户装备设备602、604和606之间的通信被示为通过通信网络614,但是在一些实施例中,源616和618可以经由通信路径(未示出)(诸如上面结合路径608、610和612描述的那些)与用户装备设备602、604和606直接通信。
***600还可以包括经由通信路径626耦合到通信网络614的广告源624。路径626可以包括以上结合路径608、610和612所述的任何通信路径。广告源624可以包括用于确定哪些广告在什么情况下要传输给特定用户的广告逻辑。例如,电缆运营商可有权在特定频道的特定时隙内***广告。因此,广告源624可以在那些时隙期间将广告发送给用户。作为另一个示例,广告源可以基于已知要观看特定节目的用户(例如,观看实况节目的青少年)的人口统计来确定广告的目标。作为又一个示例,广告源可以根据观看媒体资产的用户装备的位置(例如,东海岸或西海岸)提供不同的广告。
在一些实施例中,广告源624可以被配置为维护包括与用户相关联的广告适用性得分的用户信息,以便提供目标广告。附加地或可替代地,与广告源624相关联的服务器可以被配置为存储原始信息,该原始信息可以用于导出广告适用性得分。在一些实施例中,广告源624可以将对原始信息的请求发送到另一设备,并计算广告适用性得分。广告源624可以更新特定用户(例如,用户的第一子集、第二子集或第三子集)的广告适用性得分,并且将目标产品的广告发送给适合的用户。
内容源616可以包括一种或多种类型的内容分发装备,包括电视分发设施、有线***头端、卫星分发设施、节目源(例如,电视广播公司,诸如NBC、ABC、HBO等)、中间分发设施和/或服务器、互联网提供商、点播媒体服务器及其它内容提供商。NBC是美国全国广播公司(National Broadcasting Company,Inc.)拥有的商标,ABC是***(AmericanBroadcasting Company,Inc.)拥有的商标,而HBO是Home Box Office,Inc.拥有的商标。内容源616可以是内容的发起者(例如,电视广播公司、网络广播提供商等),或者可以不是内容的发起者(例如,点播内容提供商,用于下载的广播节目的内容的互联网提供商等)。内容源616可以包括有线源(cable source)、卫星提供商、点播提供商、互联网提供商、越顶(over-the-top)内容提供商或其它内容提供者。内容源616还可以包括用来在远离任何用户装备设备的位置存储不同类型的内容(包括用户选择的视频内容)的远程媒体服务器。用于内容的远程存储以及向用户装备提供远程存储的内容的***和方法结合2010年7月20日授予Ellis等人的美国专利No.7,761,892更详细地讨论,该专利整体上通过引用并入本文。
媒体指南数据源618可以提供媒体指南数据,诸如上述的媒体指南数据。媒体指南数据可以使用任何合适的方案提供给用户装备设备。在一些实施例中,指南应用可以是经由数据馈送(例如,连续馈送或涓流(trickle)馈送)接收节目指南数据的独立交互式电视节目指南。可以使用带内数字信号、使用带外数字信号或通过任何其它合适的数据传输技术在电视频道边带上向用户装备提供节目调度数据和其它指南数据。可以在多个模拟或数字电视频道上向用户装备提供节目调度数据和其它媒体指南数据。
在一些实施例中,可以使用客户端-服务器方法将来自媒体指南数据源618的指南数据提供给用户的装备。例如,用户装备设备可以从服务器拉取媒体指南数据,或者服务器可以将媒体指南数据推送到用户装备设备。在一些实施例中,驻留在用户装备上的指南应用客户端可以发起与源618的会话,以在需要时获得指南数据,例如,当指南数据过时或者当用户装备设备从用户接收到接收数据的请求时。可以以任何适当的频率(例如,连续地、每天、用户指定的时间段、***指定的时间段、响应于来自用户装备的请求等)向用户装备提供媒体指南。媒体指南数据源618可以向用户装备设备602、604和606提供媒体指南应用本身或者针对媒体指南应用的软件更新。
在一些实施例中,媒体指南数据可以包括观看者数据。例如,观看者数据可以包括当前和/或历史用户活动信息(例如,用户通常观看什么内容、用户在什么时间观看内容,用户是否与社交网络交互、用户在什么时间与社交网络交互以发布信息、用户通常观看什么类型的内容(例如,付费电视或免费电视)、心情、大脑活动信息等)。媒体指南数据还可以包括订阅数据。例如,订阅数据可以识别给定用户订阅哪些源或服务和/或给定用户先前订阅但后来终止访问了哪些源或服务(例如,用户是否订阅了付费频道、用户是否增加了服务的付费等级、用户是否提高了互联网速度)。在一些实施例中,观看者数据和/或订阅数据可以识别给定用户对于超过一年的时间段的模式。媒体指南数据可以包括用于生成指示给定用户将终止访问服务/源的可能性的得分的模型(例如,幸存者模型)。例如,媒体指南应用可以使用该模型处理具有订阅数据的观看者数据,以生成指示给定用户是否将终止访问特定服务或源的可能性的值或得分。特别地,越高的得分可以指示用户将终止访问特定服务或源的越高的置信度。基于得分,媒体指南应用可以生成诱使用户保持通过得分被指示为用户可能终止对其访问的特定服务或源的促销。
媒体指南应用可以是例如在用户装备设备上实现的独立应用。例如,媒体指南应用可以被实现为可以存储在存储装置508中并由用户装备设备500的控制电路***504执行的软件或可执行指令集。在一些实施例中,媒体指南应用可以是客户端-服务器应用,其中仅客户端应用驻留在用户装备设备上,而服务器应用驻留于远程服务器上。例如,媒体指南应用可以部分地被实现为用户装备设备500的控制电路***504上的客户端应用,并且部分地在远程服务器上作为服务器应用(例如,媒体指南数据源618)在远程服务器的控制电路***上运行。当由远程服务器(诸如媒体指南数据源618)的控制电路***执行时,媒体指南应用可以指示控制电路***生成指南应用显示,并将生成的显示发送到用户装备设备。服务器应用可以指示媒体指南数据源618的控制电路***发送要存储在用户装备上的数据。客户端应用可以指示接收方用户装备的控制电路***生成指南应用显示。
交付到用户装备设备602、604和606的内容和/或媒体指南数据可以是越顶(OTT)内容。除了经有线或卫星连接接收的内容,OTT内容交付还允许启用互联网的用户设备(包括上述任何用户装备设备)接收经互联网传送的内容(包括上述任何内容)。OTT内容经由互联网服务提供商(ISP)提供的互联网连接交付,但第三方分发内容。ISP可以不负责观看能力、版权或内容的再分发,并且可以仅传送由OTT内容提供商提供的IP分组。OTT内容提供商的示例包括经由IP分组提供音频和视频的YOUTUBE、NETFLIX和HULU。Youtube是Google公司拥有的商标,Netflix是Netflix公司拥有的商标,Hulu是Hulu有限责任公司拥有的商标。OTT内容提供商可以附加地或可替代地提供上述媒体指南数据。除了内容和/或媒体指南数据,OTT内容的提供商可以分发媒体指南应用(例如,基于web的应用或基于云的应用),或者可以通过存储在用户装备设备上的媒体指南应用来显示内容。
媒体指南***600旨在示例多个方案或网络配置,用户装备设备和内容源和指南数据可以为了访问内容和提供媒体指南而通过其彼此通信。本文所述的实施例可以按照这些方法中的任何一个或子集应用,或者在采用其它方法交付内容并提供媒体指南的***中应用。以下四种方案提供了图6的一般化示例的具体说明。
在一种方案中,用户装备设备可以在家庭网络内彼此通信。用户装备设备可以经由上述短程点到点通信方案、经由通过在家庭网络上提供的集线器或其它类似设备的间接路径或者经由通信网络614直接彼此通信。单个家庭中的多个个人中的每一个可以操作在家庭网络上的不同用户装备设备。因此,可能期望在不同的用户装备设备之间传送各种媒体指南信息或设置。例如,如在2005年7月11日提交的Ellis等人的美国专利公开No.2005/0251827中更详细描述的,用户可能期望在家庭网络内的不同用户装备设备上维持一致的媒体指南应用设置。家庭网络中的不同类型的用户装备设备也可以彼此通信,以发送内容。例如,用户可以将内容从用户计算机装备发送到便携式视频播放器或便携式音乐播放器。
在第二种方案中,用户可以具有多种类型的用户装备,他们通过这些用户装备访问内容并获得媒体指南。例如,一些用户可以具有由家用式和移动设备访问的家庭网络。用户可以通过在远程设备上实现的媒体指南应用来控制家用式设备。例如,用户可以经由他们办公室的个人计算机或移动设备(诸如PDA或启用web的移动电话)访问网站上的在线媒体指南应用。用户可以在在线指南应用上设置各种设置(例如,记录、提醒或其它设置)来控制用户的家用式装备。在线指南可以直接控制用户的装备,或者通过与用户的家用式装备上的媒体指南应用通信来控制。例如,在2011年10月25日授予Ellis等人的美国专利No.8,046,801中讨论了用于用户装备设备通信的各种***和方法,其中用户装备设备处于彼此远离的位置,该专利整体上通过引用并入本文。
在第三种方案中,在家庭内部和外部的用户装备设备的用户可以使用他们的媒体指南应用来直接与内容源616通信,以访问内容。具体而言,在家里,用户电视装备602和用户计算机装备604的用户可以访问媒体指南应用,以在期望的内容之间导航并定位。用户还可以使用无线用户通信设备606在家外面访问媒体指南应用,以在期望的内容之间导航并定位。
在第四种方案中,用户装备设备可以在云计算环境中操作,以访问云服务。在云计算环境中,用于内容共享、存储或分发的各种类型的计算服务(例如,视频共享站点或社交网站)由被称为“云”的网络可访问的计算和存储资源的集合提供。例如,云可以包括服务器计算设备的集合,其可以位于集中或分布的位置,通过通信网络614向经由网络(诸如互联网)连接的各种类型的用户和设备提供基于云的服务。这些云资源可以包括一个或多个内容源616和一个或多个媒体指南数据源618。此外或在替代方案中,远程计算站点可以包括其它用户装备设备,诸如用户电视装备602、用户计算机装备604和无线用户通信设备606。例如,其它用户装备设备可以提供对存储的视频副本或流传输视频的访问。在这种实施例中,用户装备设备可以以对等方式操作,而不与中央服务器通信。
除了其它示例,对于用户装备设备,云还提供对服务(诸如内容存储、内容共享或社交联网服务)的访问,以及对上述任何内容的访问。可以通过云计算服务提供商或通过其它在线服务的提供商在云中提供服务。例如,基于云的服务可以包括内容存储服务、内容共享站点、社交联网站点、或者用户来源的内容经由其分发以供所连接的设备上的其他人收看的其它服务。这些基于云的服务可以允许用户装备设备将内容存储到云并且从云接收内容,而不是在本地存储内容并访问本地存储的内容。
用户可以使用各种内容捕获设备(诸如摄像机、具有视频模式的数码相机、音频记录器、移动电话和手持式计算设备)来记录内容。用户可以直接地(例如,从用户计算机装备604或具有内容捕获特征的无线用户通信设备606)将内容上载到云上的内容存储服务。可替代地,用户可以先将内容传送到用户装备设备(诸如用户计算机装备604)。存储内容的用户装备设备使用通信网络614上的数据传输服务将内容上传到云。在一些实施例中,用户装备设备本身是云资源,并且其它用户装备设备可以直接从用户在其上存储内容的用户装备设备访问内容。
云资源可以由用户装备设备使用例如web浏览器、媒体指南应用、桌面应用、移动应用和/或其访问应用的任意组合来访问。用户装备设备可以是依赖云计算进行应用交付的云客户端,或者用户装备设备可以具有某些功能而无需访问云资源。例如,在用户装备设备上运行的一些应用可以是云应用,即,作为服务经互联网交付的应用,而其它应用可以在用户装备设备上存储和运行。在一些实施例中,用户设备可以同时从多个云资源接收内容。例如,用户设备可以从一个云资源流传输音频,同时从第二个云资源下载内容。或者用户设备可以从多个云资源下载内容,以便更高效的下载。在一些实施例中,用户装备设备可以使用云资源来处理操作,诸如由关于图5描述的处理电路***执行的处理操作。
如本文所提到的,术语“响应于…”是指由于...而被发起。例如,第一动作响应于第二动作而被执行可以包括第一动作和第二动作之间的***式步骤。如本文所提到的,术语“直接响应于...”是指由...造成的。例如,第一动作响应于第二动作而被直接执行可以不包括第一动作和第二动作之间的***式步骤。
图7是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性处理700的流程图。例如,媒体指南应用可以指示控制电路604执行处理700的元素。
应当注意,处理700或其任何步骤可以在图5-6中所示的任何设备上执行或由其提供。例如,处理704可以由控制电路506(图5)按照在用户设备(例如,用户装置设备602、604和/或606(图6))上实现的媒体指南应用的指示来执行,以便在不接收唤醒词的情况下检测口头会话中的关键字。此外,处理700的一个或多个步骤可以并入本文所述的任何其他处理或实施例的一个或多个步骤中或与其组合。
步骤702可以包括媒体指南应用利用用户装备监听多个用户之间的口头会话。在一些实施例中,媒体指南应用可以检测语音,并且相应地记录从语音接收到的音频信号。媒体指南应用可以应用任何适当的语音识别算法来识别单词、短语、声调、声音(例如,哪个用户正在讲话)或会话的其他可听部分。例如,媒体指南应用可以使用神经网络技术、隐马尔可夫模型(HMM)技术、模式识别(例如,将语音与基准进行比较)、基于动态时间规整(DTW)的技术(例如,将用户与用户进行比较,或者将用户与基准进行比较)、生物测定技术(例如,区分不同的说话人)、任何其他合适的语音识别技术、任何其他合适的说话人识别技术、或者其任何组合。
步骤704可以包括媒体指南应用检测口头会话中的关键字而不接收唤醒词。在一些实施例中,媒体指南应用可以从在步骤702识别的多个单词中检测关键字。例如,媒体指南应用可以检测名词(例如,“船”)、专有名词(例如,“Staten Island Ferry”)、简短短语(例如,“汽车追逐”)、动词、形容词、副词、或不是唤醒词的任何组合。在进一步的示例中,媒体指南应用可以同时执行步骤702和704,并且检测从会话直接识别的关键字。关键字可包括单个单词、单词序列(例如,短语)、专有名词、名词、动词、一个或多个单词的任何其它集合或其任何组合。
步骤706可以包括媒体指南应用搜索与关键字(例如,在步骤704检测到的关键字)之一匹配的内容。在一些实施例中,媒体指南应用可以从多个媒体资产查询元数据以找到相关内容。步骤706可以由媒体指南数据源618、用户计算机装备604、用户电视装备602、无线用户通信设备606或其任何组合来执行。例如,用户电视装备602可以监听会话并检测关键字(例如,步骤702和704),然后经由通信网络614将查询发送到媒体指南数据源618以执行步骤706的搜索。因此,在说明性示例中,媒体指南数据源618可以标识具有与搜索关键字相对应的元数据的多个媒体资产。此外,媒体指南数据源618可以将多个媒体资产的列表以及资产本身提供给用户电视装备602。
步骤708可以包括:在没有接收唤醒词的情况下,媒体指南应用自动地将内容呈现给用户。在一些实施例中,媒体指南应用可以通过生成显示屏来在显示设备上呈现可播放剪辑。在一些实施例中,媒体指南应用可用于显示多于一个剪辑。例如,媒体指南应用可以呈现相关剪辑的列表,并基于接收到选择剪辑的用户输入来播放列表中的剪辑之一。
可以预期,图7的步骤或描述可以与本公开的任何其他实施例一起使用。另外,关于图7描述的步骤和描述可以以可替代的顺序或与本公开的进一步目的并行地进行。例如,这些步骤中的每一个可以以任何顺序或并行地或基本同时地执行,以减少滞后或提高***或方法的速度。这些步骤中的任何一个也可以从处理中跳过或省略。此外,应该注意的是,关于图5-6讨论的任何设备或装备都可以用于执行图7中的一个或多个步骤。
图8是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性处理800的流程图。例如,媒体指南应用可以指示控制电路604执行处理800的元素。
应当注意,处理800或其任何步骤可以在图5-6所示的任何设备上执行或由其提供。例如,处理804可以如在用户设备(例如,用户装备设备602、604和/或606(图6))中实现的媒体指南应用所指示的由控制电路506(图5)执行以处理口头会话中的单词,以选择性地从口头会话中检索关键字。另外,处理800的一个或多个步骤可以被合并到本文描述的任何其他处理或实施例的一个或多个步骤中或与之组合。
步骤802可以包括媒体指南应用利用用户装备监听多个用户之间的口头会话。监听口头会话可以包括例如响应于语音的检测或用于监听语音的任何其他合适的动作识别记录从音频输入设备520收集的音频数据的会话(例如,识别来自至少两个不同用户的音频信号)。在一些实施例中,例如,媒体指南应用可以进入收听模式,在该模式中,媒体指南应用处理音频信号,并确定会话是否已经开始,关键字是什么以及什么内容是相关的。媒体指南应用可以例如在预定时间表上、在确定任何用户正在讲话时、在确定特定用户正在讲话时(例如,登录帐户的用户)、在确定超过一个用户讲话时、在受欢迎的节目期间、在备受期待和订阅的事件期间、在体育比赛期间进入收听模式。例如,当呈现流行电视节目的本季首映时,媒体指南应用可以进入收听模式。在一些实施例中,每当用户设备被通电(例如,并且被打开)时,媒体指南应用可以处理音频信号。例如,参考图1,用户设备102可以托管媒体指南应用,该媒体指南应用可以针对可检测的语音连续地监听音频信号。
将理解的是,口头交谈有时被定义为两个或更多人之间的语音交互。但是,单个用户可以与自己会话(例如,自言自语),也可以在没有听众时讲话。例如,在某些情况下,媒体指南应用可以确定任何此类语音都是会话。例如,媒体指南应用可以将用户对显示设备进行评论,例如“玩的好,Steph Curry,组队吧”分析为会话。在另一示例中,媒体指南应用可以确定有多少用户正在讲话(例如,使用语音识别)。在另一示例中,媒体指南应用可以在单个用户的多个声音之间进行区分(例如,用户再现(re-enact)会话并模仿多个声音)。
步骤804可以包括随着口头会话继续,媒体指南应用处理口头会话中的单词,以从口头会话中选择性地检索关键字。媒体指南应用可以使用任何合适的单词检测技术、语音检测技术、模式识别技术、信号处理技术或其任意组合来处理单词。例如,媒体指南应用可以将一系列信号模板与音频信号的一部分进行比较,以找到是否存在匹配项(例如,音频信号中是否包括特定单词)。在另一个示例中,媒体指南应用可以应用学习技术来更好地识别会话中的单词。例如,媒体指南应用可以在多个会话的上下文中收集来自用户的关于多个内容推荐的反馈,并且因此使用过去的数据作为用于进行推荐的训练集。
步骤806可以包括媒体指南应用基于选择性地检索到的关键字在口头会话中检测关键字而不接收唤醒词。在一些实施例中,媒体指南应用可以结合步骤804和806,从语音信号中检测关键字。在一些实施例中,媒体指南应用可以首先处理来自会话的单词,然后在所处理的单词当中检测关键字。在一些实施例中,媒体指南应用可以考虑步骤804的每个检索到的关键字,并且在步骤808处检测哪些关键字用于搜索。
步骤808可以包括媒体指南应用在多个剪辑中搜索与(例如,步骤806的)关键字之一匹配的剪辑。媒体指南应用可以例如在步骤806的检测的关键字中搜索与每个关键字匹配的元数据。例如,媒体指南应用可以生成包括所有关键字的查询(例如,使用字段和布尔运算符)以查询媒体内容数据库(例如,媒体指南数据源618)。在一些实施例中,媒体指南应用可以存储与至少一个关键字匹配的多个剪辑,存储与每个相应的剪辑相对应的多个链接,存储与每个相应的剪辑相对应的元数据,或者以其他方式存储从搜索所产生的多个剪辑的指示符。在一些实施例中,媒体指南应用可以在步骤808处识别内容源以帮助搜索内容。例如,媒体指南应用可以检测与运动相关的关键字,并因此可以在运动集锦和记录的数据库中搜索剪辑。体育的说明性内容源可以包括例如YouTube、SkySports、NBCSports、ESPN或其他来源。在一些实施例中,媒体指南应用可以访问数据库(例如,媒体指南数据源618),该数据库可以包括内容源以及关于该内容源的伴随元数据证明信息。媒体指南应用可以生成查询以搜索数据库,或使用任何其他数据库搜索技术来检索与关键字相对应的一个或多个内容源。
步骤810可以包括媒体指南应用将与多个剪辑中的每个剪辑相关联的元数据与检测到的关键字进行比较。在一些实施例中,元数据可以包括描述性元数据(例如,内容标题、出现在剪辑中的演员、导演、体裁、剪辑等级、剪辑流行度),结构性元数据(例如,剪辑持续时间、用于访问剪辑的参数、剪辑的哪个部分是相关),管理性元数据(例如权限、文件大小、文件类型),任何其他合适的元数据或其任意组合。在一些实施例中,媒体指南应用可以组合步骤808和810,使用每个剪辑的元数据搜索多个剪辑。
步骤812可以包括媒体指南应用基于(例如,步骤810的)比较,选择多个剪辑中具有比与所述剪辑中的另一剪辑相关联的元数据匹配更多所述关键字的元数据的剪辑。在一些实施例中,媒体指南应用可以确定有多少关键字与对应于剪辑的元数据匹配,确定与剪辑的元数据匹配的最长关键字的长度,执行可以帮助选择剪辑的任何其他确定,或其任何组合。在一些实施例中,媒体指南应用可以基于一个或多个辅助选择标准来选择剪辑。例如,媒体指南应用可以考虑多个剪辑中的每个剪辑的流行度,并且至少部分地基于该流行度来选择剪辑(例如,相对于更无名的剪辑选择相对流行的剪辑)。
步骤814可以包括媒体指南应用在不接收唤醒词的情况下自动地在口头会话期间向用户呈现剪辑。媒体指南应用可以响应于检测到会话、识别关键字并基于关键字搜索剪辑而呈现剪辑,而没有任何明确的命令词或有针对性的话语引起特定动作。例如,媒体指南应用可以在会话期间向用户呈现剪辑,而用户甚至没有意识到步骤802到812的执行。因此,媒体指南应用不需要会话停止以发起内容推荐。
可以预期,图8的步骤或描述可以与本公开的任何其他实施例一起使用。另外,关于图8描述的步骤和描述可以以可替代的顺序或并行地进行,以进一步实现本公开的目的。例如,这些步骤中的每一个可以以任何顺序或并行地或基本同时地执行,以减少滞后或提高***或方法的速度。这些步骤中的任何一个也可以从处理中跳过或省略。此外,应该注意的是,关于图5-6讨论的任何设备或装备都可以用于执行图8中的一个或多个步骤。
图9是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性处理900的流程图。例如,媒体指南应用可以指示控制电路604执行处理900的元素。
应当注意,处理900或其任何步骤可以在图5-6所示的任何设备上执行或由其提供。例如,处理902可以如用户设备(例如,用户设备602、604和/或606(图6))上实现的媒体指南应用所指示的由控制电路506(图5)执行以处理口头会话中的单词,以便选择性地从口头会话中检索关键字。另外,处理900的一个或多个步骤可以被合并到本文描述的任何其他处理或实施例的一个或多个步骤中或与之组合。
步骤902可以包括媒体指南应用确定配置为进入收听模式的设备的模式。模式可以包括由例如“睡眠模式”、“收听模式”、“非收听模式”、“开启”、“关闭”、“处理”(例如,忙碌)、“就绪”或任何其他合适的指示器指示的设备的任何合适状态。在一些实施例中,作为步骤902的一部分,媒体指南应用可以进入模式。例如,如果媒体指南应用确定其尚未处于收听模式,则媒体指南应用可以激活列表模式。在一些实施例中,媒体指南应用可以访问存储器中的模式值以确定模式。例如,媒体指南应用可以在存储器中存储与模式相对应的变量(例如,收听模式存储为00),媒体指南应用可以访问该变量以基于该值确定模式(例如,如果变量值为00,则设备处于收听模式)。在一些实施例中,媒体指南应用可以访问存储器中的模式标志以确定模式。例如,媒体指南应用可以访问收听模式标志,并且如果该标志值是1,则媒体指南应用确定设备处于收听模式。
步骤904可以包括媒体指南应用确定是否激活了收听模式。在一些实施例中,媒体指南应用可以在存储器中识别模式标志,以确定是否激活了收听模式。在一些实施例中,媒体指南应用可以检查会话是否正在进行以决定激活列表模式。例如,媒体指南应用可以以预定间隔检测语音,并且如果检测到语音,则媒体指南应用可以激活收听模式。在另一示例中,媒体指南应用可以始终使音频输入设备处于活动状态,并且如果检测到语音,则媒体指南应用可以激活收听模式。在一些实施例中,媒体指南应用可以接收用户输入以激活收听模式,或者如果检测到语音,则准备激活收听模式。
如果媒体指南应用确定未激活收听模式,则媒体指南应用可以前进到步骤902。在一些实施例中,媒体指南应用可以在步骤902和904之间循环,直到检测到会话为止。如果媒体指南应用确定激活了收听模式,则媒体指南应用可以前进到步骤906。
步骤906可以包括媒体指南应用检测口头会话中的单词。在一些实施例中,媒体指南应用可以在会话期间存储所记录的音频的零星片段(即,短持续时间),并处理这些零星片段。在一些实施例中,媒体指南应用可以将会话的相对大的部分(例如,大于10秒)存储为音频文件,并处理该文件。在一些实施例中,媒体指南应用可以通过使用连续计算来处理语音以检测单词。例如,可以对语音实时地执行小波变换,从而提供语音模式的连续(即使稍微滞后)的计算(例如,可以与基准进行比较以识别单词)。根据本公开,在一些实施例中,媒体指南应用可以检测单词以及哪个用户说出单词。
步骤908可以包括媒体指南应用将检测到的单词添加到在会话中检测到的单词列表中。在一些实施例中,媒体指南应用可以在存储器中存储单词。例如,媒体指南应用可以将单词作为ASCII字符(即8位代码)、模式(例如,指示用于匹配单词的语音信号参考)、标识符(例如,单词的代码)、符串、任何其他数据类型或其任意组合的集合存储在存储器中。在一些实施例中,媒体指南应用可以在检测到单词时将单词添加到存储器。例如,媒体指南应用可以将一串先前检测到的单词附加新检测到的单词,将新检测到的单词添加到先前检测到的单词的单元格数组中(例如,将单元格数组的大小增加一个),创建新的与新检测到的单词相对应的变量,创建与新创建的单词相对应的新文件,或者存储在步骤906中检测到的一个或多个单词。
步骤910可以包括媒体指南应用确定检测到的单词的时间戳。在一些实施例中,媒体指南应用可以确定开始时间、停止时间、说话时间(例如,单词被说出时的绝对时间)、处理时间(例如,当找到模式匹配时)、存储时间(例如,当单词被写到存储器中时)、当前时间(例如,时间戳确定时间)、与单词在会话中的相对时间位置相对应的任何其他合适的时间或其任意组合。时间戳可以包括日期,12小时时钟时间,24小时时钟时间,相对于某个事件的经过时间,相对于其他单词的相对时间位置,多个时间步长(例如,表示为10个10微秒时间步长的一百毫秒),其他任何确定性的时间度量标准或其任意组合。例如,时间戳可以包括“2017年10月18日下午5:17:15”、“距会话开始7秒”、“距会话开始0.0001天”或“距会话结束10个时间步长”。在另一个示例中,时间戳可以包括诸如“会话中的6.5到7.6秒”的时间范围。在一些实施例中,时间戳可以另外包括诸如“700毫秒”的持续时间,指示会话中单词的持续时间。在一些实施例中,媒体指南应用可以通过确定单词的开始时间以及与会话中的其他单词相比单词的相对位置来确定时间戳。例如,媒体指南应用可以将用于会话的第八个单词的时间戳确定为会话开始时间,以及数字“8”。在另一示例中,媒体指南应用可以确定会话停止时间以确定单词的时间戳。
步骤912可以包括媒体指南应用将每个处理的单词的时间戳与会话监听窗口的开始时间进行比较。基于在任何其他合适的时间接收指示期望会话监听窗口的用户输入,一旦检测到会话、一旦检测到单词(例如,在步骤906)、一旦激活收听模式(例如,在步骤904)或其任何组合,媒体指南应用可以就生成会话监听窗口。在一些实施例中,媒体指南应用可以确定单词的时间戳是否对应于会话开始之后的时间。例如,媒体指南应用可以确定会话开始于2017年10月19日下午5:45:10,并且与单词相关联的时间戳对应于会话开始4秒的2017年10月19日下午5:45:14。在一些实施例中,媒体指南应用可以同时(或作为单个步骤)执行步骤910和912,但是确定相对于会话监听窗口的开始时间的时间戳。
步骤914可以包括媒体指南应用确定时间戳是否在开始时间的阈值内。在一些实施例中,媒体指南应用可以确定与会话的单词相对应的时间戳和与会话的开始相对应的时间戳之间的差。在一些实施例中,媒体指南应用可以基于存储器约束(例如,仅分配用于10秒会话的足够存储器)来确定阈值。在一些实施例中,媒体指南应用可以接收指示阈值的用户输入。例如,媒体指南应用可以接收用户命令,以仅将会话开始时间的10秒内的单词视为会话的一部分。在一些实施例中,媒体指南应用可以至少部分地基于单词的时间戳、会话监听窗口的开始时间、接收到的用户输入、阈值、会话中确定的间歇(例如,如果检测到间歇,则将间歇之前的单词视为超出阈值)、任何其他合适的确定或信息或其任意组合来执行步骤914的确定。媒体指南应用可以执行步骤914以确定单词是否与会话有关,或者是否优选新的会话监听窗口。
如果媒体指南应用确定时间戳在开始时间的阈值内(例如,图9中的步骤914的“是”路径),则媒体指南应用可以前进到步骤916。步骤916可以包括媒体指南应用暂时存储在会话窗口内检测到的口头会话中的单词,使得丢弃在窗口开始时间之前检测到的单词。
如果媒体指南应用确定时间戳不在开始时间的阈值内(例如,图9中的步骤914的“否”路径),则媒体指南应用可以进行至步骤918。步骤918可以包括:媒体指南应用删除时间戳相对于开始时间早于阈值的单词(例如,不在开始时间的阈值之内)。
步骤920可以包括媒体指南应用识别口头会话中与多个用户中的每个用户的用户简档匹配的单词。多个用户可以包括参与口头会话的一个或多个用户,与用户设备相关联的一个或多个用户,订阅特定服务的一个或多个用户(例如,订阅具有语音激活的个人助手,订阅Hulu),登录到媒体指南应用的一个或多个用户,通过接收标识一个或多个用户的用户输入来标识的一个或多个用户,任何其他相关用户或其任意组合。
步骤922可以包括媒体指南应用基于选择性地检索到的关键字在口头会话中检测关键字而不接收唤醒词。媒体指南应用可以在会话的上下文中提供相关内容,而不接收唤醒词。媒体指南应用可以应用任何合适的语音识别技术、声音识别技术或其组合来检测会话中的关键字。例如,参考图1-2,媒体指南可以在会话100的开始处启动口头会话处理窗口,而用户130或140中的任何一个都不向媒体指南应用给出口头命令。当在会话中说出任何单词时,媒体指南应用可以开始处理会话。因此,如果用户130说出“现在用户设备102开始收听模式”,则用户设备102可以识别话语的单词,并且识别用于搜索相关内容的关键字。在这种情况下,媒体指南应用的动作对于任何其他话语都可能是相同的。因此,媒体指南应用不需要来自用户的口头命令(例如,唤醒词)来开始执行适当的步骤。
步骤924可以包括媒体指南应用在多个剪辑中搜索与关键字之一匹配的剪辑。当媒体指南应用识别一个或多个关键字时,媒体指南应用可进行到步骤924以基于一个或多个关键字执行搜索。媒体指南应用可以应用任何合适的搜索技术来搜索多个剪辑以进行匹配。例如,媒体指南应用可以检索与多个剪辑相关联的元数据,并执行关键字到元数据匹配搜索。在另一示例中,媒体指南应用可以访问数据库,并使用一个或多个关键字来执行搜索。在另一个示例中,媒体指南应用可以标识内容源,然后执行对该内容源的可用内容的搜索。
步骤926可以包括媒体指南应用将与多个剪辑中的每个剪辑相关联的元数据与检测到的关键字进行比较。例如,媒体指南应用可以将与剪辑相对应的描述性元数据与每个关键字进行比较。媒体指南应用可以生成比较度量(例如,多个剪辑中的每个剪辑与关键字匹配的接近程度),以允许进行数值比较。例如,媒体指南应用可以计算多少关键字与对应于剪辑的元数据匹配。在另一示例中,媒体指南应用可以计算关键字中的单词(例如,短语)的最长匹配序列,或者与对应于每个剪辑的元数据中的短语匹配。
步骤928可以包括:媒体指南应用基于比较来选择多个剪辑中具有比与所述剪辑中的另一剪辑相关联的元数据匹配更多所述关键字的元数据的剪辑。在一些实施例中,媒体指南应用可以确定有多少关键字与对应于剪辑的元数据匹配,确定与剪辑的元数据匹配的最长关键字的长度,执行可以帮助选择剪辑的任何其他确定,或其任何组合。在一些实施例中,媒体指南应用可以基于一个或多个辅助选择标准来选择剪辑。例如,媒体指南应用可以为多个剪辑中的每个剪辑考虑可用的源,并至少部分地基于该源来选择剪辑(例如,相对于更无名的源选择相对流行的源)。
步骤930可以包括媒体指南应用自动改变当前呈现在用户装备上的内容以呈现剪辑。在某些情况下,会话可能会在媒体指南应用已经在呈现内容时发生。在一些这样的情况下,媒体指南应用可以例如用在步骤928中选择的剪辑来替换已经在播放的内容。媒体指南应用可以以所选的剪辑应用覆盖、分屏、画中画、完全替换或其他显示改变,以将所选的剪辑呈现给参与会话的用户。
步骤932可以包括媒体指南应用通过剪辑呈现一些检测到的关键字,该剪辑具有响应于在会话中检测到关键字而选择了剪辑的指示。在一些实施例中,媒体指南应用可以与相关剪辑一起呈现在选择剪辑中使用的一个或多个关键字。媒体指南应用可以在与剪辑相同的显示区域或不同的显示区域中呈现一个或多个关键字。在一些实施例中,媒体指南应用可以呈现关键字的子集(例如,最流行的关键字,最具描述性的关键字,最优化搜索的关键字)。在一些实施例中,媒体指南应用可以与关键字一起呈现附加信息。例如,媒体指南应用可以呈现哪个用户说出了每个关键字,一个或多个替代关键字(例如,是否错误地选择了关键字,或者是否错误地检测到单词),会话名称或与会话相关的其他信息。
步骤934可以包括媒体指南应用生成口头会话窗口(例如,在本文中也称为会话处理窗口)。口头会话窗口可以包括持续时间、开始时间和停止时间、数字单词、用于识别语音何时对应于会话的任何其他合适的度量或其任意组合。在一些实施例中,口头会话窗口可以指示会话的时间长度。在一些实施例中,媒体指南应用可以生成口头会话窗口以定义会话的程度(extent)(例如,会话何时开始和何时结束)。因此,在一些实施例中,媒体指南应用可以例如将语音的处理限制为仅在口头会话处理窗口内检测到的语音。将理解,虽然在说明性流程图900中被示为最后步骤,但是步骤934可以在任何合适的时间点执行,并且可以跨越任何合适的时间。例如,媒体指南应用可以确定会话的开始时间和会话处理窗口的开始时间。此外,媒体指南应用可以例如相对于确定开始时间(例如,当会话结束时或预定时间长度之后),在稍后的时间确定口头会话窗口的停止时间。
预期图9的步骤或描述可以与本公开的任何其他实施例一起使用。另外,关于图9描述的步骤和描述可以以可替代的顺序或与本公开的进一步目的并行地进行。例如,这些步骤中的每一个可以以任何顺序或并行地或基本同时地执行,以减少滞后或提高***或方法的速度。这些步骤中的任何一个也可以从处理中跳过或省略。此外,应该注意的是,关于图5-6讨论的任何设备或装备都可以用于执行图9中的一个或多个步骤。
图10是根据本公开的一些实施例的用于在会话的上下文中推荐内容的说明性处理1000的流程图。例如,媒体指南应用可以指示控制电路604执行处理1000的元素。
应当注意,处理1000或其任何步骤可以在图5-6所示的任何设备上执行或由其提供。例如,处理1014可以如用户设备(例如,用户装备设备602、604和/或606(图6))上实现的媒体指南应用所指示的由控制电路506(图5)执行以选择内容源。另外,处理1000的一个或多个步骤可以被合并到本文描述的任何其他处理或实施例的一个或多个步骤中或与之组合。
步骤1002可以包括媒体指南应用进入收听模式。媒体指南应用可以,例如,激活音频输入设备(例如,麦克风),开始记录音频信号,开始处理音频信号,访问一个或多个用户帐户(例如,用于访问用户信息),生成用于显示的会话监听显示,更新存储在存储器中的标志值(例如,处于收听模式时将收听模式标志设置为值1),执行任何其他适当的操作或其任何组合。在一些实施例中,媒体指南应用可以向用户提供它已经进入收听模式的指示。例如,媒体指南应用可以使设备(例如,用户装备设备)上的LED改变颜色、打开、关闭,变暗、变亮、闪烁或以其他方式改变外观以指示进入收听模式。在另一示例中,媒体指南应用可以生成音频消息(例如,使用扬声器514),以警告用户收听模式活跃。
步骤1004可以包括媒体指南应用确定是否检测到语音。在一些实施例中,可以以预定间隔检测语音。在一些实施例中,媒体指南应用可以被配置为检测和识别语音,但是必须响应声音(voice)命令。例如,在一些实施例中,媒体指南应用可以检测、识别和存储单词,但是仅响应于从用户装备(例如,电视遥控器、鼠标、键盘、用户设备上的按钮)接收的命令,而不是响应声音命令。因此,在一些实施例中,媒体指南应用可以收听和处理会话,但是不识别或响应唤醒词。
如果在步骤1004中,媒体指南应用确定尚未检测到语音,则媒体指南应用可以进一步确定如何进行。此外,媒体指南应用可以执行说明性流程图1000的任何步骤以确定是否检测到语音。例如,媒体指南应用可以在预定时间段之后在步骤1004超时(例如,在10秒钟内没有语音表示“未检测到”)。在另一示例中,步骤1002和1004可以以与图10所示相反的顺序执行,使得媒体指南应用仅在检测到语音时才进入收听模式。在另一示例中,媒体指南应用可以要求在步骤1004处识别至少两个声音以指示会话正在进行中。在另一示例中,步骤1004和1006可以以与图10所示相反的顺序执行,使得媒体指南应用仅在识别出一个或多个关键字时才进入收听模式。在另一个示例中,媒体指南应用可以处理音频信号(例如,开窗快速傅立叶变换,小波变换),并确定何时某些合适的频带中的信号能量(例如,频谱强度或频谱密度)大于可指示语音的阈值。在另一个示例中,媒体指南应用可以将语音识别计算和声音识别计算应用于音频信号,并确定何时识别单词。
步骤1006可以包括媒体指南应用识别诸如单词、短语、名称、地点、频道、媒体资产标题之类的关键字或其他关键字。在一些实施例中,媒体指南应用可以识别语音中的单词,并且选择那些单词中的一些作为关键字。例如,媒体指南应用可以识别单词,并且在那些单词中选择不是介词的单词。在另一个示例中,媒体指南应用可以仅将长度至少为3个字符的单词识别为关键字。在另一示例中,媒体指南应用可以将关键字识别为包括两个或更多个单词的短语(例如,为了更具描述性并提供更多的上下文),这可能有助于缩小相关内容的潜在搜索范围。媒体指南应用可以使用任何合适的标准从会话中识别关键字。
步骤1008可以包括媒体指南应用访问一个或多个用户简档以识别单词。除了从语音中识别单词外,媒体指南应用还可以使用用户简档中的信息来提供相关内容。例如,媒体指南应用可以识别关键字“Detroit”,“足球”和“比赛”,并访问用户的简档以确定他们在DVR中存储了“Detroit Lions”比赛。因此,媒体指南应用可以识别单词“Lions”以伴随关键字“Detroit”、“足球”和“比赛”,以更充分地捕获会话的相关信息。在另一个示例中,媒体指南应用可以从语音中识别关键字,以及哪个用户说出了关键字,并访问相应用户的简档以识别单词。从用户的简档中识别出的字词可以包括观看的媒体内容的标题、收藏的节目的标题、购买的媒体内容的标题、推荐的媒体内容的标题、个人信息(例如,用户居住的城市、用户居住的州、人口统计信息)、用户喜欢或最关注的体裁的名称、与该用户关联的先前会话关键字、与该用户的简档关联的任何其他单词或它们的任意组合。
步骤1010可以包括媒体指南应用将单词存储在存储器中。在一些实施例中,媒体指南应用可以将单词与时间戳、会话信息、用户信息、任何其他合适的信息或其任意组合一起存储。媒体指南应用可以任何合适的格式和结构存储单词。
步骤1012可以包括媒体指南应用识别与关键字相关联的内容类型。内容类型可以包括例如电影剪辑、体育比赛剪辑(例如,体育比赛的集锦)、情节性媒体资产的剪辑(例如,电视节目的场景)、任何其他合适的分类媒体内容、其任何细分或它们的任何组合。在一些实施例中,内容类型可以包括内容类型的特征分类。例如,媒体指南应用可以将内容类型识别为体裁。在一些实施例中,内容类型可以包括剪辑长度(例如,短剪辑,长剪辑,场景,预告片)。例如,媒体指南应用可以将内容类型识别为“长度小于30秒的剪辑”。媒体指南应用可以识别内容类型,以帮助识别与正在进行的会话相关的内容、减少潜在的搜索字段、减少潜在的内容源字段、提供持续时间范围内的内容以伴随会话、或者以其他方式帮助提供会话的上下文中的内容。
步骤1014可以包括媒体指南应用选择内容源。内容源可以包括内容提供者、内容订阅服务、媒体指南数据源618、内容服务器、点播内容服务、在线视频服务、任何其他合适的内容提供源或其任意组合。在一些实施例中,媒体指南应用可以基于一个或多个用户的订阅(例如,用户订阅Hulu)来选择内容源。在一些实施例中,媒体指南应用可以基于一个或多个用户登录的一个或多个内容源(例如,用户可以登录到YouTube帐户,用户可以登录到HBO GO)来选择内容源。
步骤1016可以包括媒体指南应用基于识别一个或多个关键字和识别内容类型中的至少一者来搜索剪辑。在一些实施例中,媒体指南应用可以通过将所识别的关键字发送到内容源来查询内容源(例如,在步骤1014选择的内容源)。在一些实施例中,媒体指南应用可以从内容源检索元数据,并且搜索在元数据中包括的一个或多个关键字和单词之间的匹配。因此,媒体指南应用可以基于搜索到的元数据来检索内容。在一些实施例中,媒体指南应用可以使用关键字的任何一个、全部或子集执行一个以上的搜索。例如,媒体指南应用可以以期望数量的搜索结果为目标,并且可以应用关键字和一个或多个搜索过滤器以实现期望数量的搜索结果(例如,在结果的阈值范围内,在结果的阈值数量之上,或低于结果的阈值数量)。媒体指南应用可以应用任何合适的搜索技术、数据库架构、查询语言、逻辑运算符、搜索类型、搜索过滤器、搜索引擎、任何其他合适的工具或其任意组合。例如,媒体指南应用可以应用布尔逻辑(例如,第一关键字AND第二关键字),短语搜索(例如,匹配“MondayNight Football”),截断,通配符(例如,匹配“Game of*”,其中“*”是通配符),元数据字段搜索(例如,搜索标题字段,搜索关键字字段)或其他搜索技术。步骤1016可以包括媒体指南应用检索与媒体内容相对应的任何合适的元数据或其他合适的内容信息。
在一些实施例中,媒体指南应用可以确定一个或多个辅助搜索标准,如流程图1000的步骤1036所示。辅助搜索标准可以包括用于搜索过滤器的标准、阈值、用户简档标准(例如,所应用的父母控制、最喜欢的服务、订阅的服务)、用户定义的条件(例如,定义搜索参数,例如要搜索多少个关键字、要考虑多少个搜索结果)、任何其他合适的条件或其任意组合。在一些实施例中,媒体指南应用可以应用(例如,在步骤1008访问的)来自用户简档的信息,以通过应用过滤器来细化搜索。
步骤1018可以包括媒体指南应用计算与识别出的关键字匹配的每个剪辑的相关性得分。在一些实施例中,媒体指南应用可以通过对匹配在步骤1016中识别出的关键字的关键字的数量求和来计算相关性得分。在一些实施例中,媒体指南应用可以存储为搜索而计算的数据。例如,媒体指南应用可以为每个关键字计算多个关键字到元数据的匹配(例如,与搜索结果的剪辑#2关联的数据与3个关键字匹配)。在另一示例中,媒体指南应用可以从与元数据匹配的会话中计算最长的短语(例如,单词的数量)并存储短语的长度。说明性表1示出了搜索结果、搜索信息和相关性得分的列表。在表1所示的说明性示例中,搜索信息包括匹配的关键字数量,匹配的最长短语的长度以及流行度得分。说明性表1包括示例性相关性得分,其被计算为三个搜索结果得分的平均值(例如,表1中的数字行)。
表1、说明性相关性得分计算
表1的计算是说明性的,并且可以基于任何合适的搜索信息来计算任何合适的相关性得分。例如,相关性得分可以基于和、乘积、加权和、平均值、可以将一个或多个得分作为输入的函数、可以将一个或多个得分作为输入的算法、任何其他合适的计算或其任何组合(例如,加权和)。在进一步的示例中,媒体指南应用可以计算多个相关性得分(例如,两个或更多个)并且以合适的方式组合得分。在进一步的示例中,媒体指南应用可以计算多个相关性得分并存储多个相关性得分而无需合并。
搜索信息可以包括,例如,匹配关键字的数量(例如,每个剪辑)、匹配的最长短语的长度、流行度得分(例如,观看次数、用户评分)、内容源得分(例如,基于用户评论、基于已知可靠性、基于用户是否具有授予访问源的订阅权限)、搜索结果中的先前成员资格(例如重复或常规会话主题)、可用于提供剪辑的多个源、可以指示剪辑相关性的任何其他度量或其任何组合。
步骤1020可以包括媒体指南应用确定与一个或多个相应剪辑相对应的一个或多个相关性得分是否超过阈值。在一些实施例中,媒体指南应用可以顺序地考虑每个剪辑并且对应于相关性得分,将该得分与阈值进行比较,并且进行相关性确定(即,剪辑相关)。例如,对于具有十个剪辑的搜索结果列表,媒体指南应用可以执行十次步骤1020。在一些实施例中,媒体指南应用可以从搜索结果中考虑多个剪辑,将剪辑各自的相关性得分与阈值进行比较,并进行相关性确定。例如,媒体指南应用可以执行与阈值的向量的向量比较,从而将步骤1020作为相对更统一的动作来执行。在一些实施例中,媒体指南应用可以组合步骤1018和1020。例如,媒体指南应用可以在步骤1018计算相关性得分,包括与来自步骤1020的阈值的比较。在一些实施例中,媒体指南应用可以省略步骤1020。例如,媒体指南应用可以为每个剪辑计算相关性得分,并且不与阈值进行任何比较(例如,进入步骤1026)。
如果媒体指南应用在步骤1020确定相关性得分不超过阈值,则媒体指南应用可以进行到步骤1022。步骤1022可以包括媒体指南应用选择剪辑中与所识别的关键字匹配的一个或多个剪辑的下一组。在一些实施例中,媒体指南应用可以存储各自的标志,每个标志对应于剪辑并且指示剪辑的对应的相关性得分是否超过阈值(例如,标志值0表示不超过,标志值1表示超过)。在一些实施例中,媒体指南应用可以重复步骤1020和1022,直到在步骤1020已经评估了搜索结果的整个列表。在一些实施例中,来自步骤1020的剪辑的结果列表(例如,在数量上等于或小于搜索结果)可以存储在存储器中以供在步骤1026中的进一步处理。
步骤1026可以包括媒体指南应用选择最相关的剪辑。选择最相关的剪辑可以包括,例如,从步骤1020识别剪辑的结果列表中的最大相关性得分。在一些实施例中,媒体指南应用可以选择一个以上最相关的剪辑。例如,媒体指南应用可以选择最相关的剪辑以及第二和第三最相关的剪辑(例如,作为替代或备份,或向用户提供可选择的选项)。
在一些实施例中,媒体指南应用可以至少部分地基于一个或多个辅助选择标准来选择最相关的剪辑,如步骤1024所示。步骤1024可以包括媒体指南应用确定辅助选择标准。辅助选择标准可以包括例如用户访问(例如,对内容的父母控制限制)、首选内容源(例如,如果有来自HBO的剪辑,则选择它)、首选剪辑持续时间(例如,如果剪辑小于10秒,优先选择它)、剪辑格式、其他任何合适的标准或其任意组合。
在一些实施例中,媒体指南应用可以从不再感兴趣的搜索结果中消除标题。在一些实施例中,媒体指南应用可以从会话中检测音频提示(例如,不限于直接命令),以优化可用性指南内容。例如,媒体指南应用可能会在会话中检测到“不再向我展示NBC节目”或“我真的讨厌宿醉电影”,并根据这些话语使用关键字来删除搜索结果或生成新关键字。在一些实施例中,媒体指南应用可以使用诸如决策树或随机森林之类的模型来基于检测到的单词来确定关键字。例如,在从会话中识别出话语“我真的很讨厌宿醉电影”时,媒体指南应用可以生成关键字“讨厌”和“宿醉”,从搜索结果中删除电影宿醉或其剪辑。在另一个示例中,媒体指南应用可以存储单词“宿醉”,并使用该单词来细化搜索结果(例如,布尔值NOT排除具有包括单词宿醉的标题的剪辑)。
步骤1028可以包括媒体指南应用生成会话处理显示。可以以任何适当的顺序与说明性流程图1000的其他步骤一起执行步骤1028。例如,媒体指南应用可以生成始终显示的会话处理显示,而与参与模式或会话无关。在另一示例中,如果在步骤1004中检测到语音,则媒体指南应用可以生成会话处理显示。媒体指南应用可以在任何合适的时间生成会话处理显示。在一些实施例中,如果检测到新的会话,则媒体指南应用可以刷新、修改、替换或以其他方式更新会话显示。例如,媒体指南应用可以识别新的会话,并且用新的会话替换会话处理显示,特别是如果新会话的关键字不同于旧会话的关键字的话。在一些实施例中,媒体指南应用可以仅在检测到语音时,以及预定时间(例如,口头会话处理窗口)过后生成并维持会话处理显示。
在某些情况下,媒体指南应用可能会呈现会话信息和相关剪辑,以及管理在会话之前呈现的内容。说明性步骤1030、1032和1034包括一些这样的呈现的描述。媒体指南应用可以执行步骤1030、1032和1034中的任何一个或其任何组合,以向正在进行的会话提供相关内容。媒体指南应用可以省略或选择性地执行步骤1032和1034中的任何一个,以向正在进行的会话提供相关内容。
步骤1030可以包括媒体指南应用呈现最相关的剪辑。在一些实施例中,媒体指南应用可以在会话处理显示的区域中呈现最相关的剪辑。在一些实施例中,媒体指南应用可以自动播放最相关的剪辑(例如,不保持用户输入以开始播放剪辑)。在一些实施例中,媒体指南应用可以保持用户输入以开始播放剪辑。例如,媒体指南应用可以提供开始按钮或播放按钮,并且在接收到用户对按钮的选择时,正在播放剪辑。
步骤1032可以包括媒体指南应用呈现会话信息。在一些实施例中,媒体指南应用可以在会话处理显示中呈现会话信息。会话信息可以包括关于诸如所识别的关键字之类的关键字的发音的信息、所识别的用户(例如,参与会话的用户)、会话开始时间、会话停止时间、会话持续时间、会话标识符(例如,“有关Detroit Lions比赛的星期二聊天”)、任何其他合适的信息或其任意组合。会话信息可以包括诸如一个或多个内容列表(例如,与相关剪辑相对应)、内容源标识、内容类型标识(例如,电影剪辑、广告、比赛剪辑)的有关相关内容的信息、任何其他合适的信息或其任意组合。
步骤1034可以包括媒体指南应用管理先前显示的媒体内容。在某些情况下,媒体指南应用可能已经呈现了媒体内容、媒体资产列表,或者在检测到会话时生成了显示。在某些情况下,媒体指南应用可能会暂停先前显示的内容。例如,一组用户可能正在观看“TheSimpsons”,然后可能开始谈论“Game of Thrones”。对于该示例,在一些实施例中,媒体指南应用可以暂停“The Simpsons”,并呈现可以包括会话信息、相关剪辑和用户列表的会话监听显示。对于该示例,在一些实施例中,媒体指南应用可以继续呈现“The Simpsons”,但是相应音频静音,并呈现可以包括会话信息和相关剪辑(例如,并附带播放时的音频)的会话监控显示(例如,覆盖)。对于该示例,在一些实施例中,媒体指南应用可以向用户呈现可选选项,以指示用户是否希望继续观看先前呈现的内容(即本示例中的“The Simpsons”)还是相关剪辑(即,此示例中来自“Game of Thrones”的相关剪辑)。对于该示例,在一些实施例中,媒体指南应用可以减小先前显示的内容的尺寸,以允许会话处理显示(例如,分屏)。响应于在会话的上下文中呈现相关剪辑,媒体指南应用可以停止、暂停、静音、缩小其显示尺寸、覆盖、覆盖和模糊、从显示中移除或以其他方式管理呈现内容的任何合适的方面。
例如,在除了步骤1030中的相关剪辑之外没有其他内容要管理的情况下,可以省略步骤1034。
可以预期,图10的步骤或描述可以与本公开的任何其他实施例一起使用。另外,关于图10描述的步骤和描述可以以可替代的顺序或与本公开的进一步目的并行地进行。例如,这些步骤中的每一个可以以任何顺序或并行地或基本同时地执行,以减少滞后或提高***或方法的速度。这些步骤中的任何一个也可以从处理中跳过或省略。此外,应该注意的是,关于图5-6讨论的任何设备或装备都可以用于执行图10中的一个或多个步骤。
呈现本公开的上述实施例是为了说明而非限制的目的,并且本公开仅由所附权利要求书限定。另外,应该注意的是,关于图5-6讨论的任何设备或装备都可以用于执行图7-10中的处理700-1000中的一个或多个步骤。此外,应注意,在任何一个实施例中描述的特征和限制可以应用于本文中的任何其他实施例,并且与一个实施例有关的流程图或示例可以以合适的方式与其他任何实施例组合、以不同的顺序完成、使用附加步骤执行、使用省略步骤执行或并行执行。例如,这些步骤中的每一个可以以任何顺序或并行地或基本同时地执行,以减少滞后或提高***或方法的速度。另外,本文描述的***和方法可以实时执行。还应当注意,上述***和/或方法可以应用于其他***和/或方法,或根据其他***和/或方法使用。
Claims (10)
1.一种用于在会话的上下文中推荐内容的方法,所述方法包括:
利用用户装备监听多个用户之间的口头会话;
随着所述口头会话继续,处理所述口头会话中的单词以选择性地从所述口头会话中的单词中检索关键字;
基于选择性检索的关键字,在没有接收到唤醒词的情况下检测口头会话中的关键字;
通过以下操作在多个剪辑中搜索与关键字之一匹配的剪辑:
将与所述多个剪辑中的每个剪辑相关联的元数据与所检测到的关键字进行比较,以及
基于所述比较,选择所述多个剪辑中具有比所述多个剪辑中具有与所述关键字中的至少一个关键字匹配的元数据的另一个剪辑匹配更多数量的关键字的元数据的剪辑;以及
在口头会话期间,在没有接收到唤醒词的情况下自动地向用户呈现所述剪辑。
2.根据权利要求1所述的方法,还包括:
识别与所检测到的关键字相关联的内容类型;以及
基于所识别的内容类型来选择要搜索的内容源。
3.根据权利要求1所述的方法,还包括:
生成口头会话处理窗口;以及
临时存储在所述会话处理窗口内检测到的所述口头会话中的单词,使得丢弃在所述窗口的开始时间之前检测到的单词。
4.根据权利要求1所述的方法,还包括激活收听模式,其中当所述收听模式活跃时执行所述监听,并且当所述收听模式被停用时不执行所述监听。
5.根据权利要求1所述的方法,其中,所述多个剪辑中的每个剪辑小于阈值持续时间。
6.根据权利要求1所述的方法,其中所述关键字与媒体资产中的片段有关,并且其中所述多个剪辑中的每一个表示所述媒体资产的场景中的内容。
7.根据权利要求6所述的方法,其中所述片段是展示体育赛事中的比赛的所述媒体资产的场景或一部分。
8.根据权利要求1所述的方法,其中,在所述口头会话期间向所述用户自动呈现所述内容包括改变当前正在所述用户装备上呈现的内容以呈现所述剪辑。
9.根据权利要求1所述的方法,还包括通过所述剪辑呈现所检测到的关键字中的一些,所述剪辑具有响应于在所述会话中检测到所述关键字而选择所述剪辑的指示。
10.根据权利要求1所述的方法,其中,选择性地检索关键字包括识别所述口头会话中与所述多个用户中的每个用户的用户简档匹配的单词。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/824,788 US11140450B2 (en) | 2017-11-28 | 2017-11-28 | Methods and systems for recommending content in context of a conversation |
US15/824,788 | 2017-11-28 | ||
PCT/US2018/038965 WO2019108257A1 (en) | 2017-11-28 | 2018-06-22 | Methods and systems for recommending content in context of a conversation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111433845A CN111433845A (zh) | 2020-07-17 |
CN111433845B true CN111433845B (zh) | 2024-04-12 |
Family
ID=63015017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880076956.6A Active CN111433845B (zh) | 2017-11-28 | 2018-06-22 | 在会话的上下文中推荐内容的方法和*** |
Country Status (7)
Country | Link |
---|---|
US (3) | US11140450B2 (zh) |
JP (1) | JP7295110B2 (zh) |
KR (1) | KR102581116B1 (zh) |
CN (1) | CN111433845B (zh) |
AR (1) | AR113590A1 (zh) |
CA (1) | CA3081859A1 (zh) |
WO (1) | WO2019108257A1 (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10123058B1 (en) | 2017-05-08 | 2018-11-06 | DISH Technologies L.L.C. | Systems and methods for facilitating seamless flow content splicing |
US11115717B2 (en) * | 2017-10-13 | 2021-09-07 | Dish Network L.L.C. | Content receiver control based on intra-content metrics and viewing pattern detection |
US11140450B2 (en) | 2017-11-28 | 2021-10-05 | Rovi Guides, Inc. | Methods and systems for recommending content in context of a conversation |
CN110637300B (zh) * | 2018-04-25 | 2023-09-19 | 谷歌有限责任公司 | 在联网环境中延迟的双因素认证 |
WO2020005207A1 (en) * | 2018-06-26 | 2020-01-02 | Rovi Guides, Inc. | Augmented display from conversational monitoring |
US10269376B1 (en) * | 2018-06-28 | 2019-04-23 | Invoca, Inc. | Desired signal spotting in noisy, flawed environments |
US10616649B2 (en) * | 2018-07-19 | 2020-04-07 | Rovi Guides, Inc. | Providing recommendations based on passive microphone detections |
US10832659B2 (en) | 2018-08-31 | 2020-11-10 | International Business Machines Corporation | Intent authoring using weak supervision and co-training for automated response systems |
US20200097499A1 (en) * | 2018-09-26 | 2020-03-26 | Rovi Guides, Inc. | Systems and methods for generating query suggestions |
JP2022028094A (ja) * | 2018-12-21 | 2022-02-15 | ソニーグループ株式会社 | 情報処理装置、制御方法、情報処理端末、情報処理方法 |
KR20200084413A (ko) * | 2018-12-21 | 2020-07-13 | 삼성전자주식회사 | 컴퓨팅 장치 및 그 동작 방법 |
US11106875B2 (en) | 2019-05-20 | 2021-08-31 | International Business Machines Corporation | Evaluation framework for intent authoring processes |
US11025990B2 (en) * | 2019-06-17 | 2021-06-01 | Rovi Guides, Inc. | Search and recommendation of media assets through conversational use of catchphrases |
US11227593B2 (en) * | 2019-06-28 | 2022-01-18 | Rovi Guides, Inc. | Systems and methods for disambiguating a voice search query based on gestures |
WO2021022333A1 (en) * | 2019-08-05 | 2021-02-11 | Hoppr Ltd | A method and system for providing content to a media playing device |
CN110767234B (zh) * | 2019-10-31 | 2022-12-23 | 抖音视界有限公司 | 音频信息处理方法、装置、电子设备及存储介质 |
US11380306B2 (en) | 2019-10-31 | 2022-07-05 | International Business Machines Corporation | Iterative intent building utilizing dynamic scheduling of batch utterance expansion methods |
WO2021091526A1 (en) * | 2019-11-04 | 2021-05-14 | Google Llc | Using video clips as dictionary usage examples |
US11977849B2 (en) * | 2020-04-24 | 2024-05-07 | Rajiv Trehan | Artificial intelligence (AI) based automated conversation assistance system and method thereof |
US11277663B2 (en) * | 2020-05-18 | 2022-03-15 | Mercury Analytics, LLC | Systems and methods for providing survey data |
CN111611492A (zh) * | 2020-05-26 | 2020-09-01 | 北京字节跳动网络技术有限公司 | 一种触发搜索的方法、装置、电子设备及存储介质 |
US11190641B1 (en) | 2020-09-30 | 2021-11-30 | Capital One Services, Llc | Automated agent behavior recommendations for call quality improvement |
KR20220091068A (ko) * | 2020-12-23 | 2022-06-30 | 삼성전자주식회사 | 음성 기반 콘텐츠 제공 방법 및 그 전자 장치 |
KR20220118698A (ko) * | 2021-02-19 | 2022-08-26 | 삼성전자주식회사 | 사용자와 대화하는 인공 지능 에이전트 서비스를 지원하는 전자 장치 |
EP4220628A4 (en) | 2021-02-19 | 2024-05-22 | Samsung Electronics Co., Ltd. | ELECTRONIC SERVICE SUPPORT DEVICE FOR ARTIFICIAL INTELLIGENCE (AI) AGENT TALKING WITH USER |
US11978449B2 (en) | 2021-03-02 | 2024-05-07 | Samsung Electronics Co., Ltd. | Electronic device for processing user utterance and operation method therefor |
WO2022208254A1 (en) * | 2021-04-01 | 2022-10-06 | Symmetrics Tech Matrix Pvt Ltd. | Method of performing actions from an on-going conversation window and a user interface thereof |
CN113676764B (zh) * | 2021-08-04 | 2023-12-05 | 深圳康佳电子科技有限公司 | 一种屏幕分屏显示方法、装置及存储介质 |
CA3228869A1 (en) * | 2021-08-31 | 2023-03-09 | Christopher Landry | Dynamic labeling of and generating indications of real-time communication sessions |
CN113704440B (zh) * | 2021-09-06 | 2022-02-18 | 中国计量大学 | 一种基于物品图网络中路径表征的会话推荐方法 |
CN116205200A (zh) * | 2021-11-30 | 2023-06-02 | 腾讯科技(深圳)有限公司 | 视频封面的生成方法、装置、设备、介质及程序产品 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316710A (ja) * | 2002-04-23 | 2003-11-07 | Fujitsu Ltd | コンテンツ配信方法及びその方法における処理をコンピュータに行なわせるためのプログラム |
CN101176087A (zh) * | 2005-03-23 | 2008-05-07 | 阿尔卡特朗讯公司 | 从网络节点实现对数字多媒体内容的播放列表搜索的***和方法 |
JP2008171173A (ja) * | 2007-01-11 | 2008-07-24 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索方法および装置、プログラム |
CN102567441A (zh) * | 2010-10-18 | 2012-07-11 | 微软公司 | 提供与用户会话相关的情境提示 |
JP2015162233A (ja) * | 2014-02-28 | 2015-09-07 | 日本電信電話株式会社 | 収束判定装置、方法、及びプログラム |
US9420227B1 (en) * | 2012-09-10 | 2016-08-16 | Google Inc. | Speech recognition and summarization |
CN106021600A (zh) * | 2016-06-12 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 信息提示方法及装置 |
CN106462636A (zh) * | 2014-06-20 | 2017-02-22 | 谷歌公司 | 解释视频内容中的可听话语信息 |
CN107222757A (zh) * | 2017-07-05 | 2017-09-29 | 深圳创维数字技术有限公司 | 一种语音搜索方法、机顶盒、存储介质、服务器和*** |
Family Cites Families (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6239794B1 (en) | 1994-08-31 | 2001-05-29 | E Guide, Inc. | Method and system for simultaneously displaying a television program and information about the program |
US5553221A (en) * | 1995-03-20 | 1996-09-03 | International Business Machine Corporation | System and method for enabling the creation of personalized movie presentations and personalized movie collections |
US6658662B1 (en) * | 1997-06-30 | 2003-12-02 | Sun Microsystems, Inc. | Retrieving information from a broadcast signal |
US6564378B1 (en) | 1997-12-08 | 2003-05-13 | United Video Properties, Inc. | Program guide system with browsing display |
CN1867068A (zh) | 1998-07-14 | 2006-11-22 | 联合视频制品公司 | 交互式电视节目导视***及其方法 |
AR020608A1 (es) | 1998-07-17 | 2002-05-22 | United Video Properties Inc | Un metodo y una disposicion para suministrar a un usuario acceso remoto a una guia de programacion interactiva por un enlace de acceso remoto |
CA2865444C (en) | 1998-07-17 | 2017-11-28 | United Video Properties, Inc. | Interactive television program guide system having multiple devices within a household |
US7165098B1 (en) | 1998-11-10 | 2007-01-16 | United Video Properties, Inc. | On-line schedule system with personalization features |
WO2000054168A2 (en) * | 1999-03-05 | 2000-09-14 | Canon Kabushiki Kaisha | Database annotation and retrieval |
KR20020027382A (ko) | 2000-05-03 | 2002-04-13 | 요트.게.아. 롤페즈 | 콘텐트 정보의 의미론에 따른 음성 명령 |
US7000242B1 (en) * | 2000-07-31 | 2006-02-14 | Jeff Haber | Directing internet shopping traffic and tracking revenues generated as a result thereof |
KR101548473B1 (ko) | 2001-02-21 | 2015-08-28 | 로비 가이드스, 인크. | 개인용 비디오 녹화 특징을 갖는 대화식 프로그램 가이드를 위한 시스템 및 방법 |
US20020133562A1 (en) * | 2001-03-13 | 2002-09-19 | Newnam Scott G. | System and method for operating internet-based events |
US20020170068A1 (en) * | 2001-03-19 | 2002-11-14 | Rafey Richter A. | Virtual and condensed television programs |
US7035468B2 (en) * | 2001-04-20 | 2006-04-25 | Front Porch Digital Inc. | Methods and apparatus for archiving, indexing and accessing audio and video data |
US7110664B2 (en) * | 2001-04-20 | 2006-09-19 | Front Porch Digital, Inc. | Methods and apparatus for indexing and archiving encoded audio-video data |
US20020162117A1 (en) * | 2001-04-26 | 2002-10-31 | Martin Pearson | System and method for broadcast-synchronized interactive content interrelated to broadcast content |
US7886003B2 (en) * | 2001-07-06 | 2011-02-08 | Ericsson Television, Inc. | System and method for creating interactive events |
US7908628B2 (en) * | 2001-08-03 | 2011-03-15 | Comcast Ip Holdings I, Llc | Video and digital multimedia aggregator content coding and formatting |
JP3762926B2 (ja) * | 2001-08-28 | 2006-04-05 | 松下電器産業株式会社 | 放送受信方法、放送システム、プログラム及び記録媒体 |
US7092888B1 (en) * | 2001-10-26 | 2006-08-15 | Verizon Corporate Services Group Inc. | Unsupervised training in natural language call routing |
US7996232B2 (en) * | 2001-12-03 | 2011-08-09 | Rodriguez Arturo A | Recognition of voice-activated commands |
AU2003280513A1 (en) * | 2002-07-01 | 2004-01-19 | Microsoft Corporation | A system and method for providing user control over repeating objects embedded in a stream |
US7774815B1 (en) * | 2002-09-30 | 2010-08-10 | Arris Group, Inc. | Context-sensitive interactive television ticker |
KR20120038000A (ko) | 2004-01-20 | 2012-04-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 대화의 주제를 결정하고 관련 콘텐트를 획득 및 제시하는 방법 및 시스템 |
US20050188411A1 (en) * | 2004-02-19 | 2005-08-25 | Sony Corporation | System and method for providing content list in response to selected closed caption word |
US20050234992A1 (en) | 2004-04-07 | 2005-10-20 | Seth Haberman | Method and system for display guide for video selection |
US20070124788A1 (en) * | 2004-11-25 | 2007-05-31 | Erland Wittkoter | Appliance and method for client-sided synchronization of audio/video content and external data |
JP4779481B2 (ja) * | 2005-07-19 | 2011-09-28 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US8024768B2 (en) * | 2005-09-15 | 2011-09-20 | Penthera Partners, Inc. | Broadcasting video content to devices having different video presentation capabilities |
US7801910B2 (en) * | 2005-11-09 | 2010-09-21 | Ramp Holdings, Inc. | Method and apparatus for timed tagging of media content |
BRPI0619388A2 (pt) * | 2005-11-29 | 2011-10-04 | Google Inc | aplicações sociais e interativas para mìdia de massa |
US20100153885A1 (en) | 2005-12-29 | 2010-06-17 | Rovi Technologies Corporation | Systems and methods for interacting with advanced displays provided by an interactive media guidance application |
US8209724B2 (en) * | 2007-04-25 | 2012-06-26 | Samsung Electronics Co., Ltd. | Method and system for providing access to information of potential interest to a user |
US8115869B2 (en) * | 2007-02-28 | 2012-02-14 | Samsung Electronics Co., Ltd. | Method and system for extracting relevant information from content metadata |
US8412021B2 (en) * | 2007-05-18 | 2013-04-02 | Fall Front Wireless Ny, Llc | Video player user interface |
US9318108B2 (en) * | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080091713A1 (en) * | 2006-10-16 | 2008-04-17 | Candelore Brant L | Capture of television metadata via OCR |
US7689613B2 (en) * | 2006-10-23 | 2010-03-30 | Sony Corporation | OCR input to search engine |
US8296808B2 (en) * | 2006-10-23 | 2012-10-23 | Sony Corporation | Metadata from image recognition |
US7814524B2 (en) * | 2007-02-14 | 2010-10-12 | Sony Corporation | Capture of configuration and service provider data via OCR |
JP2008162233A (ja) | 2007-01-04 | 2008-07-17 | National Printing Bureau | 真偽判別印刷物、該印刷物の真偽判別方法及び真偽判別システム |
JP2009088687A (ja) | 2007-09-27 | 2009-04-23 | Fujifilm Corp | アルバム作成装置 |
US8000972B2 (en) * | 2007-10-26 | 2011-08-16 | Sony Corporation | Remote controller with speech recognition |
EP2109313B1 (en) * | 2008-04-09 | 2016-01-13 | Sony Computer Entertainment Europe Limited | Television receiver and method |
US8079054B1 (en) * | 2008-04-14 | 2011-12-13 | Adobe Systems Incorporated | Location for secondary content based on data differential |
US20090293081A1 (en) * | 2008-05-22 | 2009-11-26 | At&T Delaware Intellectual Property, Inc. | Methods and computer program products for performing searches at a plurality of content storing locations |
US8423363B2 (en) * | 2009-01-13 | 2013-04-16 | CRIM (Centre de Recherche Informatique de Montréal) | Identifying keyword occurrences in audio data |
US20100316131A1 (en) * | 2009-06-12 | 2010-12-16 | Motorola, Inc. | Macroblock level no-reference objective quality estimation of video |
US9014546B2 (en) * | 2009-09-23 | 2015-04-21 | Rovi Guides, Inc. | Systems and methods for automatically detecting users within detection regions of media devices |
WO2011053271A1 (en) * | 2009-10-29 | 2011-05-05 | Thomson Licensing | Multiple-screen interactive screen architecture |
JP2011180271A (ja) | 2010-02-26 | 2011-09-15 | Daiichikosho Co Ltd | クレイドルを介してホストシステムに接続されるカラオケ選曲予約装置 |
US8818175B2 (en) * | 2010-03-08 | 2014-08-26 | Vumanity Media, Inc. | Generation of composited video programming |
US8572488B2 (en) * | 2010-03-29 | 2013-10-29 | Avid Technology, Inc. | Spot dialog editor |
US20110283189A1 (en) * | 2010-05-12 | 2011-11-17 | Rovi Technologies Corporation | Systems and methods for adjusting media guide interaction modes |
WO2011146276A2 (en) * | 2010-05-19 | 2011-11-24 | Google Inc. | Television related searching |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
US9462340B1 (en) * | 2011-10-13 | 2016-10-04 | Trevor Mathurin | Voice/manual activated and integrated audio/video multi-media, multi-interface system |
US8812527B2 (en) * | 2011-11-29 | 2014-08-19 | International Business Machines Corporation | Automatically recommending asynchronous discussion forum posts during a real-time collaboration |
KR101878488B1 (ko) | 2011-12-20 | 2018-08-20 | 한국전자통신연구원 | 대화 연관 컨텐츠 제공 방법 및 장치 |
WO2013115235A1 (ja) * | 2012-02-03 | 2013-08-08 | シャープ株式会社 | 出力システム、出力システムの制御方法、制御プログラム、および記録媒体 |
US9369670B2 (en) * | 2012-12-19 | 2016-06-14 | Rabbit, Inc. | Audio video streaming system and method |
JP2014126600A (ja) * | 2012-12-25 | 2014-07-07 | Panasonic Corp | 音声認識装置、音声認識方法、およびテレビ |
US20140278834A1 (en) * | 2013-03-14 | 2014-09-18 | Armchair Sports Productions Inc. | Voting on actions for an event |
KR101456974B1 (ko) * | 2013-05-21 | 2014-10-31 | 삼성전자 주식회사 | 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법 |
JP2015052745A (ja) | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
BR112016006860B8 (pt) * | 2013-09-13 | 2023-01-10 | Arris Entpr Inc | Aparelho e método para criar um único fluxo de dados de informações combinadas para renderização em um dispositivo de computação do cliente |
JP6168453B2 (ja) | 2013-09-19 | 2017-07-26 | パナソニックIpマネジメント株式会社 | 信号記録装置、カメラレコーダおよび信号処理装置 |
US9510030B2 (en) * | 2014-02-13 | 2016-11-29 | Piksel, Inc. | Delivering media content to a content consuming user |
US9728229B2 (en) | 2015-09-24 | 2017-08-08 | International Business Machines Corporation | Searching video content to fit a script |
US10796697B2 (en) * | 2017-01-31 | 2020-10-06 | Microsoft Technology Licensing, Llc | Associating meetings with projects using characteristic keywords |
US11140450B2 (en) | 2017-11-28 | 2021-10-05 | Rovi Guides, Inc. | Methods and systems for recommending content in context of a conversation |
-
2017
- 2017-11-28 US US15/824,788 patent/US11140450B2/en active Active
-
2018
- 2018-06-22 KR KR1020207017321A patent/KR102581116B1/ko active IP Right Grant
- 2018-06-22 WO PCT/US2018/038965 patent/WO2019108257A1/en active Application Filing
- 2018-06-22 CN CN201880076956.6A patent/CN111433845B/zh active Active
- 2018-06-22 JP JP2020528892A patent/JP7295110B2/ja active Active
- 2018-06-22 CA CA3081859A patent/CA3081859A1/en active Pending
- 2018-11-28 AR ARP180103481A patent/AR113590A1/es unknown
-
2021
- 2021-09-03 US US17/466,850 patent/US11716514B2/en active Active
-
2023
- 2023-06-13 US US18/209,166 patent/US20230328325A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316710A (ja) * | 2002-04-23 | 2003-11-07 | Fujitsu Ltd | コンテンツ配信方法及びその方法における処理をコンピュータに行なわせるためのプログラム |
CN101176087A (zh) * | 2005-03-23 | 2008-05-07 | 阿尔卡特朗讯公司 | 从网络节点实现对数字多媒体内容的播放列表搜索的***和方法 |
JP2008171173A (ja) * | 2007-01-11 | 2008-07-24 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索方法および装置、プログラム |
CN102567441A (zh) * | 2010-10-18 | 2012-07-11 | 微软公司 | 提供与用户会话相关的情境提示 |
US9420227B1 (en) * | 2012-09-10 | 2016-08-16 | Google Inc. | Speech recognition and summarization |
JP2015162233A (ja) * | 2014-02-28 | 2015-09-07 | 日本電信電話株式会社 | 収束判定装置、方法、及びプログラム |
CN106462636A (zh) * | 2014-06-20 | 2017-02-22 | 谷歌公司 | 解释视频内容中的可听话语信息 |
CN106021600A (zh) * | 2016-06-12 | 2016-10-12 | 腾讯科技(深圳)有限公司 | 信息提示方法及装置 |
CN107222757A (zh) * | 2017-07-05 | 2017-09-29 | 深圳创维数字技术有限公司 | 一种语音搜索方法、机顶盒、存储介质、服务器和*** |
Also Published As
Publication number | Publication date |
---|---|
JP7295110B2 (ja) | 2023-06-20 |
US11140450B2 (en) | 2021-10-05 |
US20210400349A1 (en) | 2021-12-23 |
US11716514B2 (en) | 2023-08-01 |
WO2019108257A1 (en) | 2019-06-06 |
CN111433845A (zh) | 2020-07-17 |
US20190166403A1 (en) | 2019-05-30 |
CA3081859A1 (en) | 2019-06-06 |
US20230328325A1 (en) | 2023-10-12 |
KR20200094162A (ko) | 2020-08-06 |
AR113590A1 (es) | 2020-05-20 |
JP2021505046A (ja) | 2021-02-15 |
KR102581116B1 (ko) | 2023-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111433845B (zh) | 在会话的上下文中推荐内容的方法和*** | |
US11024296B2 (en) | Systems and methods for conversations with devices about media using interruptions and changes of subjects | |
US11200243B2 (en) | Approximate template matching for natural language queries | |
CN110914900B (zh) | 用于为若干语音操作的用户设备生成基于音量的响应的***和方法 | |
US10182266B2 (en) | Systems and methods for automatically enabling subtitles based on detecting an accent | |
US10672390B2 (en) | Systems and methods for improving speech recognition performance by generating combined interpretations | |
US12015827B2 (en) | Systems and methods for detecting a reaction by a user to a media asset to which the user previously reacted at an earlier time, and recommending a second media asset to the user consumed during a range of times adjacent to the earlier time | |
US11375287B2 (en) | Systems and methods for gamification of real-time instructional commentating | |
US11758234B2 (en) | Systems and methods for creating an asynchronous social watching experience among users | |
US11687585B2 (en) | Systems and methods for identifying a media asset from an ambiguous audio indicator | |
US11960516B2 (en) | Methods and systems for playing back indexed conversations based on the presence of other people |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |