CN1735941A - 创建和访问音频内容的菜单而不使用显示器的方法 - Google Patents

创建和访问音频内容的菜单而不使用显示器的方法 Download PDF

Info

Publication number
CN1735941A
CN1735941A CNA2003801083124A CN200380108312A CN1735941A CN 1735941 A CN1735941 A CN 1735941A CN A2003801083124 A CNA2003801083124 A CN A2003801083124A CN 200380108312 A CN200380108312 A CN 200380108312A CN 1735941 A CN1735941 A CN 1735941A
Authority
CN
China
Prior art keywords
audio
bunch
track
audio track
menu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003801083124A
Other languages
English (en)
Other versions
CN100479054C (zh
Inventor
怒尔-埃丁·塔齐恩
让-罗南·维古鲁
伊莎贝拉·格拉斯兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN1735941A publication Critical patent/CN1735941A/zh
Application granted granted Critical
Publication of CN100479054C publication Critical patent/CN100479054C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

一种创建音频内容(例如音乐轨道)的菜单(T)的方法使用了:装置(CL),用于将音频轨道分类为具有相似轨道的簇(C1、…、C3),相似性涉及轨道的物理、感觉和心理特征。所述方法包括:装置(R),用于所述簇(C1、…、C3)的自动代表选择;以及装置(X),用于产生音频轨道的缩略曲表示。所述音频缩略曲与所述菜单(T)相关联。有利地,由于用户可以通过诸如按下用于收听属于相同簇的相关轨道或类似轨道、或者通过选择表示另一簇的另一缩略曲来收听另一类型的音乐的适当按钮,来收听音频缩略曲然后输入命令,不需要图形或文本显示来进行导航。

Description

创建和访问音频内容的菜单而不使用显示器的方法
技术领域
本发明涉及一种音频管理***,允许用户以非常自然的方式来浏览所存储的音频文件。本发明涉及针对音频内容的大容量数字存储回放***,诸如MPEG音频层3(MP3)播放器。
背景技术
受到数字存储和音频压缩技术的最新进步的驱动,管理非常大集合的音频文件的问题变得突出。例如,当前生产的MP3播放器包含10GB硬盘驱动器,使用户能够存储诸如超过300小时的MP3PRO音乐,意味着多于4000个标题。
需要可靠的工具使这些集合可由用户访问。
对音频文件进行索引的传统方式是基于文本元信息的,例如标题、艺术家、曲集或风格,例如针对MP3音频文件的ID3标记。
这种组织存在一些缺陷:
1、元数据是文本而非音频的,因此,不能够提供音频内容的精确表示,如该内容的代表性摘录所能做到的那样。
2、通过风格或艺术家来分类的组织允许用户定位特定的一首音乐。这预先假设用户具有明确的目标,确切知道其想要听什么。用户搜索策略必须是受目标驱动的且确定性的。
3、存在许多风格:例如,音乐档案mp3.com当前列出了其在180个不同子风格下的标题,按照16个主风格组织。用户难以在这样的组织下进行导航。
4、由于先验地对风格进行建立而非从内容自身得出,因此风格有时是主观的。有时,难以对其进行解释。
5、通过风格的分类不能够满足非常简单的用户需要,例如“这首音乐使我放松。我愿意多听这种音乐”。
本发明用于克服这些缺陷。
发明内容
本发明涉及一种使用音频内容的简明代表来导航大量音频文件(例如MP3文件)的方法和***。在用户选择音乐轨道之前,其可以得益于对简明代表摘录的收听,在下文中被称为“音频缩略曲”(audiothumbnail)。音频缩略曲具有足够的长度来识别音乐,例如5或6秒。
对所存储的音频文件进行预处理以提取一些相关和目标描述符。根据本发明,这些描述符用于将音乐轨道分簇为感觉上同类的组。从每一个簇中,自动或手动或半自动选择相关轨道,并从所选择的轨道中提取音频缩略曲。然后,将作为关键短语的这些音频缩略曲排列在树数据结构中或内容表中,使用户能够导航而无需任何可视导航装置,例如显示器等。
另外,音频缩略曲允许用户根据感觉对音频数据库进行导航,而不必记忆文本元素,例如标题或艺术家名。特别适合于:使用户能够浏览其数据库,而无需精确知道他们想要听什么,并且从歌曲簇中根据感觉进行选择。这里,“根据感觉”意味着缩略曲涉及到用户的感觉而非记忆。此外,所述簇是感性的,意味着所述簇的结构化对于用户而言是相关的,因此所述结构化满足了实际用户需求。
使用本发明,用户可以创建超越传统音乐种类(例如通俗或乡村)的播放列表。
附图说明
将参考附图来描述本发明的典型实施例,其中:
图1是使用音频菜单的音频再现***的典型结构;
图2是没有显示器的典型用户接口。
具体实施方式
本发明描述了一种创建、组织和使用针对音频内容的音频表示的方法。图1中示出了本发明的结构。音频轨道,通常是音乐,存储在存储装置S中。在分类器CL中对这些轨道进行分类,并且将这些轨道与轨道簇C1、C2、C3相关联。对于每一个簇,在代表选择器R中选择代表示例。此外,提取器X从所述示例中提取特征样本、或缩略曲,并且将所述缩略曲与内容T的表格相关联。该用户使用接口I来选择由第一缩略曲表示的第一簇,收听所选的缩略曲,并且确定是选择另一簇还是选择与所述第一缩略曲相关的所述第一簇,然后选择属于所述簇的轨道,然后,从存储装置S中读取该轨道并再现。
有利地,与先前的方法相比,该方法更为基于感觉,因此对于用户而言更为方便。根据本发明的基于音频的索引***组合了从其他内容搜索***中已知的两个方法,即,“内容表”方法和“收音机类导航”方法。
所述“内容表”方法涉及内容的名册表,其中根据名册内容的结构来组合总结了实际文本的短代表序列。这通常与分类为主题的逻辑分类关联。使用针对音频内容的该方法意味着:根据以下所定义的客观标准,从音频文件中提取参数或描述符,然后,将同类轨道一起组合在簇中。从用户的观点来看,由于其基于内容的特性比根据风格的先验分类更进一步,因此,这些簇更有意义。例如,可以将来自所有风格的吉他音乐的所有片断一起组合在簇中。所有放松音乐可以构成另一簇。根据本发明,不同的簇构成了数据库中的“内容表”。如同在书的内容表中那样,可能存在不同级别的细节,例如第1章、第1.1章等,如同读者可以逐章导航那样,并且可以确定更详细地读一章,收听者可以逐簇导航,或者从簇中收听更多类似音乐。
“收音机类导航”方法涉及当收听收音机时的典型用户行为。在这种情况下的内容浏览诸如在于:用户扫描汽车收音机上的FM频带,并且收听轨道或切换到下一电台。本发明使用了该概念,其中无线电台对应于轨道簇。于是,“切换到另一电台”对应于“选择另一簇”,并且“收听轨道”对应于“收听该轨道或来自相同簇的类似轨道”。
在下文中,详细描述了在创建和组织音频表示时的前述步骤,当将轨道新添加到数据库上时,或者当对数据库重新组织时,执行这些步骤。
在第一步骤中,从音频轨道中提取描述符。使用三种类型的描述符,试图对用户而言是客观的且仍然相关。
第一类描述符是低级别描述符或物理特征,对于信号处理方法是典型的。示例为谱质心、短时能量或短时平均零交叉。
第二类描述符是介质级描述符或感觉特征,如由音乐家典型使用的。示例是节奏(例如,二元或三元节奏)、音调、形成种类(例如发声或特殊乐器)。
第三类描述符是高级别描述符或轨道的心理和社会特征,对于平均用户而言是正常的。为了试图使这些特征的主观性最小,例如,可以将音乐分类为快乐、焦虑、平静或有活力的。当诸如使用先前所述类型的描述符时,可以在特定程度上或利用特定的概率,将这些特性赋予一首音乐。此外,歌曲可以是高度难忘的,可以传递特定的情绪或感情,可以使用户想起一些事,等等。这可以使用监控算法来自动进行,即,需要用户交互的算法。
第二步骤在于给音乐轨道分簇。使用第一步骤中所定义的描述符,可以将这些轨道分类为同类。与通过艺术家或标题对音乐分类相比,这些类对用户更有价值。可以使用未受监控的算法将轨道分簇为具有类似属性的分组。这样的算法示例是K平均或自组织图。当与现有簇相比,新添加的轨道的相异性达到特定的最小水平时,可以自动地产生新簇,并且在这种情况下,新添加的轨道将与新簇相关联。
此时,对这些轨道进行分类,因此,能够创建内容表。不存在尖锐的所需分类,例如,能够在任意数量的簇中具有相同的轨道。例如,一个簇可以用于吉他音乐,而另一簇可以用于镇静音乐,并且匹配这两个特征的轨道可以与两个簇相关联。在这种情况下,两个簇均可以包含到所述音频轨道的链接,但是轨道自身仅需要被存储一次。
第三步骤在于自动选择每一个簇的代表轨道。有利地,利用传统的代表物件(medoid)选择,来选择针对簇的最具代表性轨道。代表物件(medoid)是其与该簇中所有对象的平均相异度最小的簇中的该对象。例如,可以利用在第一步骤中期间所提取的描述符来确定所述相异度。
在第四步骤中,针对代表物件(medoid)轨道创建并存储音频缩略曲。在本发明的另一实施例中,还可以针对其他轨道创建和存储音频缩略曲。对于缩略曲创建,需要评估哪些标准是使音频轨道以较短音频序列为特征的最佳标准,所述音频序列足够长以识别轨道,例如5或6秒。在本发明的一个实施例中,缩略曲的长度是恒定的,在第二实施例,可以对缩略曲的长度进行修改,并且在第三实施例中,缩略曲的长度可以根据轨道描述符逐轨道地发生改变。另外,在本发明的一个实施例中,缩略曲是来自所述轨道的原始抽样,或者在另一实施例中,从所述轨道中自动合成缩略曲。
在第五步骤中,将音频缩略曲列在虚拟表中,其可以由用户进行扫描,如同通过不同的无线电台来扫描。可以对所述表格进行组织,从而在一个簇内,当通过该表进行扫描时,将首先找到最相关的轨道或代表物件(medoid)。例如,可以根据相关性对簇内的其他轨道进行分类。有利地,不需要图形或文本显示对扫描内容表。所述内容表的结构可以如下:
    <table of content><cluster 1><key phrase for the most relevant song(medoid)><key phrase for secondary song><key phrase 3><cluster 2>…</table of content>
用户可以决定收听当前轨道、或属于相同簇的另一轨道,因此,类似于所述当前轨道。可选地,用户可以决定收听来自另一簇的轨道。有利地,仅需要一个按钮或其他命令输入装置来操作导航***,即“切换簇”。对用户而言更为舒适的是具有三个按钮的设备,如图2所示。一个按钮SD用于“切换到近端簇”,另一按钮SU用于“切换到远端簇”,而一个按钮M用于“切换到来自当前簇的另一轨道。可选地,如果按钮具有多于一个功能或其他用户输入装置,仅具有一个按钮也是足够的。由用户输入控制的其他功能可以是随机轨道选择或随机簇选择模式。另一功能可以是连续再现所有簇的代表,直到用户选择了一个簇为止,由于用户不必手动地扫描内容表,因此所述功能是有利的。
在下面将描述另外的实施例。
在本发明的一个实施例中,音频轨道仅属于一个簇,而在另一实施例中,当各个分类标准并不互斥时,音频轨道可以属于多于一个簇。
在本发明的一个示例中,内容表仅具有一个级别的分簇,如同在先前所述的示例中那样,而在另一实施例中,内容表可以具有多个分层等级的簇。
在本发明的一个实施例中,针对音频轨道的分类规则是最终的,而在另一实施例中,可以对所述规则进行修改。或者通过更新(例如经由因特网)或者通过任意形式的用户交互(例如上载到PC、编辑并从PC中下载)或者通过诸如由人工智能所使用的统计或自学习方法,可以进行所述修改。可以对此进行实现,从而当诸如与一个簇相关的轨道数量远高于与任意其他簇相关的轨道数量时,可以执行具有修改或增强规则的自动或半自动重新分类。
在本发明的一个实施例中,仅针对表示簇的轨道来创建缩略曲。在本发明的另一实施例中,还可以针对其他轨道,例如满足特定条件的轨道(如同非常经常、或非常少或非常长地进行选择)来创建缩略曲。在第三实施例中,针对所有轨道创建缩略曲。
在本发明的一个实施例中,簇内的轨道可以具有恒定的次序,从而用户能够不久就能知道特定轨道何时到来。该次序可以遵循轨道相关性或任意其他参数,例如存储时间、或选择频率。在本发明的另一实施例中,簇内的轨道可以是无序的,或者当用户选择簇时随机地出现。
在本发明的一个实施例中,存在针对每一个簇所选的代表轨道,而在另一实施例中,有利地,可以没有针对所述簇之一的代表轨道,例如最喜爱的簇或针对轨道的簇不可由所采用的方法来分类。
有利地,可以在最好为便携式设备等设备中使用对音频内容的基于感觉的分类和检索的所述方法,以便存储和再现音乐或其他音频数据,例如MP3播放器。

Claims (18)

1、一种创建和访问存储装置(S)中所存储的音频内容的菜单的方法,所述内容由音频轨道构成,并且所述菜单包含所述音频轨道的表示,其特征在于:
-将音频轨道分类(CL)为组或簇(C1、…、C3),其中根据所述音频轨道的特征参数来执行所述分类;
-自动选择(R)作为所述簇的代表的音频轨道,其中根据所述音频轨道和所述簇中的其他音频轨道的特征参数来执行所述选择;
-产生(X)来自所述代表音频轨道的可再现音频摘录,作为所述表示;以及
-将所述音频摘录与菜单列表(T)相关联。
2、根据权利要求1所述的方法,其特征在于用于音频内容分类的所述特征参数包括一个或多个音频描述符,所述音频描述符是音频内容的物理特征、或感觉特征、或心理或社会特征。
3、根据权利要求1或2所述的方法,其特征在于可以将音频轨道分类到多于一个簇(C1、…、C3)中。
4、根据权利要求1到3任一个所述的方法,其特征在于簇(C1、…、C3)内的音频轨道具有可变次序,从而当已经选择了簇(C1、…、C3)时,用户收听随机选择的轨道,其中所述轨道属于所述簇。
5、根据权利要求1到4任一个所述的方法,其特征在于用户可以修改音频轨道自动分类的结果。
6、根据权利要求1到5任一个所述的方法,其特征在于用户可以修改音频轨道自动分类的分类规则。
7、根据权利要求1到6任一个所述的方法,其特征在于根据所述菜单,在所述存储装置(S)内,对实际音频数据进行分簇。
8、根据权利要求1到7任一个所述的方法,其特征在于所述音频摘录是来自音频轨道的样本、或者是由实际音频轨道合成的音频序列。
9、根据权利要求1到8任一个所述的方法,其特征在于针对并非簇的代表的音频轨道另外创建音频摘录。
10、根据权利要求1到9任一个所述的方法,其特征在于音频摘录的长度并非预定的。
11、根据权利要求1到10任一个所述的方法,其特征在于所述簇之一没有代表轨道。
12、根据权利要求1到11任一个所述的方法,其特征在于所述菜单是分层的,从而簇可以包含一个或多个子簇。
13、根据权利要求1到12任一个所述的方法,其特征在于如果检测到所定义的先决条件,则自动地修改所述分类规则,并且可以执行重新分类。
14、根据权利要求13所述的方法,其特征在于所述先决条件包括簇中的轨道数量和另一簇中的轨道数量之间的差达到最大极限值。
15、根据权利要求13所述的方法,其特征在于所述先决条件包括将所有存储的轨道分类为一个簇,以及轨道的总数达到最大极限值。
16、一种创建和访问存储装置(S)中所存储的音频内容的菜单的设备,所述内容由音频轨道构成,并且所述菜单包含音频轨道的表示,其特征在于:
-装置,用于将音频轨道自动分类(CL)为组或簇(C1、…、C3),其中根据所述音频轨道的特征参数来执行所述分类;
-装置,用于自动选择(R)作为所述簇的代表的音频轨道,其中根据所述音频轨道和所述簇中的其他音频轨道的特征参数来执行所述选择;
-装置,用于产生(X)来自所述代表音频轨道的可再现音频摘录;以及
-装置,用于将所述音频摘录与菜单列表(T)相关联。
17、根据权利要求16所述的设备,其特征在于还包括:
-装置,用于选择和再现来自第一簇的第一音频表示;
-针对第一用户输入(M、SU、SD)的装置,所述输入控制是否选择与当前所选的音频缩略曲相关联的簇;以及
-针对第二用户输入(M、SU、SD)的装置,所述输入控制是否选择另一簇。
18、根据权利要求16或17所述的设备,其特征在于:从所述存储装置(S)中读取所选簇的音频轨道,用于回放。
CNB2003801083124A 2003-01-06 2003-11-24 创建和访问音频内容的菜单而不使用显示器的方法 Expired - Fee Related CN100479054C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03290019A EP1435620A1 (en) 2003-01-06 2003-01-06 Method for creating and accessing a menu for audio content without using a display
EP03290019.3 2003-01-06

Publications (2)

Publication Number Publication Date
CN1735941A true CN1735941A (zh) 2006-02-15
CN100479054C CN100479054C (zh) 2009-04-15

Family

ID=32479956

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801083124A Expired - Fee Related CN100479054C (zh) 2003-01-06 2003-11-24 创建和访问音频内容的菜单而不使用显示器的方法

Country Status (8)

Country Link
US (1) US7912565B2 (zh)
EP (1) EP1435620A1 (zh)
JP (2) JP4711683B2 (zh)
KR (1) KR100994407B1 (zh)
CN (1) CN100479054C (zh)
AU (1) AU2003298139A1 (zh)
MX (1) MXPA05007300A (zh)
WO (1) WO2004061848A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140787B (zh) * 2006-09-07 2010-06-02 索尼株式会社 再现设备、再现方法和再现程序
CN106471574A (zh) * 2014-06-30 2017-03-01 索尼公司 信息处理装置和信息处理方法

Families Citing this family (128)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
KR100605262B1 (ko) 2004-10-11 2006-07-28 삼성전자주식회사 콘텐츠 재생장치 및 콘텐츠 재생방법
KR100739723B1 (ko) * 2005-07-19 2007-07-13 삼성전자주식회사 오디오 썸네일 기능을 지원하는 오디오 재생 방법 및 장치
WO2007027013A1 (en) * 2005-07-19 2007-03-08 Samsung Electronics Co., Ltd. Audio reproduction method and apparatus supporting audio thumbnail function
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
WO2007102109A2 (en) * 2006-03-06 2007-09-13 Koninklijke Philips Electronics N.V. System and method of determinng personal music preferences
US7603434B2 (en) * 2006-04-13 2009-10-13 Domingo Enterprises, Llc Central system providing previews of a user's media collection to a portable media player
US20070245378A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews to an associated portable media player
US8316081B2 (en) 2006-04-13 2012-11-20 Domingo Enterprises, Llc Portable media player enabled to obtain previews of a user's media collection
GB0615282D0 (en) * 2006-08-01 2006-09-06 Avantone Oy Jukebox System
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080115173A1 (en) * 2006-11-10 2008-05-15 Guideworks Llc Systems and methods for using playlists
US7873069B2 (en) * 2007-03-12 2011-01-18 Avaya Inc. Methods and apparatus for controlling audio characteristics of networked voice communications devices
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8065628B2 (en) 2007-06-25 2011-11-22 Microsoft Corporation Dynamic user interface for previewing live content
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
WO2010005590A2 (en) * 2008-07-11 2010-01-14 Best Buy Enterprise Services, Inc. Ratings switch for portable media players
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
JP2010086273A (ja) * 2008-09-30 2010-04-15 Kddi Corp 楽曲検索装置、楽曲検索方法、および楽曲検索プログラム
US8862252B2 (en) * 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US8977584B2 (en) 2010-01-25 2015-03-10 Newvaluexchange Global Ai Llp Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9665339B2 (en) 2011-12-28 2017-05-30 Sonos, Inc. Methods and systems to select an audio track
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
CN102854387B (zh) * 2012-08-20 2014-08-20 浙江师范大学 一种无绝缘音频轨道电路轨间泄漏导纳的测试方法
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN104143341B (zh) * 2013-05-23 2015-10-21 腾讯科技(深圳)有限公司 爆音检测方法和装置
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9226072B2 (en) 2014-02-21 2015-12-29 Sonos, Inc. Media content based on playback zone awareness
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9672213B2 (en) 2014-06-10 2017-06-06 Sonos, Inc. Providing media items from playback history
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN105335595A (zh) * 2014-06-30 2016-02-17 杜比实验室特许公司 基于感受的多媒体处理
DE212015000194U1 (de) 2014-08-06 2017-05-31 Apple Inc. Verkleinerte Benutzeroberflächen für Batteriemanagement
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
KR102143308B1 (ko) 2014-09-02 2020-08-10 애플 인크. 경고를 관리하기 위한 축소된 크기의 인터페이스
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10129314B2 (en) * 2015-08-18 2018-11-13 Pandora Media, Inc. Media feature determination for internet-based media streaming
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10141009B2 (en) 2016-06-28 2018-11-27 Pindrop Security, Inc. System and method for cluster-based audio event detection
WO2018053537A1 (en) * 2016-09-19 2018-03-22 Pindrop Security, Inc. Improvements of speaker recognition in the call center
AU2017327003B2 (en) 2016-09-19 2019-05-23 Pindrop Security, Inc. Channel-compensated low-level features for speaker recognition
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US11019201B2 (en) 2019-02-06 2021-05-25 Pindrop Security, Inc. Systems and methods of gateway detection in a telephone network
JP2020135699A (ja) * 2019-02-25 2020-08-31 セイコーエプソン株式会社 表示方法及び表示装置
WO2020198354A1 (en) 2019-03-25 2020-10-01 Pindrop Security, Inc. Detection of calls from voice assistants
US12015637B2 (en) 2019-04-08 2024-06-18 Pindrop Security, Inc. Systems and methods for end-to-end architectures for voice spoofing detection
US11636855B2 (en) 2019-11-11 2023-04-25 Sonos, Inc. Media content based on operational data
DE102023002580A1 (de) 2023-06-26 2024-07-25 Mercedes-Benz Group AG Verfahren zur Erstellung einer Abspielliste von digitalen Inhalten

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2602352B1 (fr) * 1986-07-31 1991-08-16 Kempf Bertrand Banque de donnees audiovisuelle
JPH0745050A (ja) 1993-08-02 1995-02-14 Victor Co Of Japan Ltd 自動分類記録装置
DE19608514A1 (de) * 1996-03-05 1997-09-11 Siemens Ag Inhaltsverzeichnis und Wiedergabegerät für sequentiell betriebene Speicher
US6278446B1 (en) * 1998-02-23 2001-08-21 Siemens Corporate Research, Inc. System for interactive organization and browsing of video
JP2000285242A (ja) * 1999-01-29 2000-10-13 Sony Corp 信号処理方法及び映像音声処理装置
JP4224917B2 (ja) * 1999-02-15 2009-02-18 ソニー株式会社 信号処理方法及び映像音声処理装置
JP4110670B2 (ja) 1999-05-20 2008-07-02 ソニー株式会社 記録装置、再生装置、記録媒体
US7072846B1 (en) * 1999-11-16 2006-07-04 Emergent Music Llc Clusters for rapid artist-audience matching
US6766103B2 (en) * 2000-02-19 2004-07-20 Lg Electronics Inc. Method for recording and reproducing representative audio data to/from a rewritable recording medium
US6225546B1 (en) * 2000-04-05 2001-05-01 International Business Machines Corporation Method and apparatus for music summarization and creation of audio summaries
US6748395B1 (en) * 2000-07-14 2004-06-08 Microsoft Corporation System and method for dynamic playlist of media
JP3719645B2 (ja) * 2000-08-28 2005-11-24 アルパイン株式会社 オーディオプレーヤ
US7277766B1 (en) * 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
US7003515B1 (en) * 2001-05-16 2006-02-21 Pandora Media, Inc. Consumer item matching method and system
US20030158737A1 (en) * 2002-02-15 2003-08-21 Csicsatka Tibor George Method and apparatus for incorporating additional audio information into audio data file identifying information
JP2003317436A (ja) 2002-04-16 2003-11-07 Alpine Electronics Inc オーディオ再生装置およびオーディオ放送受信装置
US6987221B2 (en) * 2002-05-30 2006-01-17 Microsoft Corporation Auto playlist generation with multiple seed songs
US7149755B2 (en) * 2002-07-29 2006-12-12 Hewlett-Packard Development Company, Lp. Presenting a collection of media objects
US7043477B2 (en) * 2002-10-16 2006-05-09 Microsoft Corporation Navigating media content via groups within a playlist
JP2004152327A (ja) 2002-10-28 2004-05-27 Sony Corp 音楽記録再生装置及び方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140787B (zh) * 2006-09-07 2010-06-02 索尼株式会社 再现设备、再现方法和再现程序
CN106471574A (zh) * 2014-06-30 2017-03-01 索尼公司 信息处理装置和信息处理方法
CN106471574B (zh) * 2014-06-30 2021-10-12 索尼公司 信息处理装置和信息处理方法

Also Published As

Publication number Publication date
JP2006513513A (ja) 2006-04-20
AU2003298139A1 (en) 2004-07-29
US20060293771A1 (en) 2006-12-28
KR20050091762A (ko) 2005-09-15
EP1435620A1 (en) 2004-07-07
CN100479054C (zh) 2009-04-15
JP4621782B2 (ja) 2011-01-26
KR100994407B1 (ko) 2010-11-16
WO2004061848A1 (en) 2004-07-22
JP2009134862A (ja) 2009-06-18
JP4711683B2 (ja) 2011-06-29
US7912565B2 (en) 2011-03-22
MXPA05007300A (es) 2006-02-17

Similar Documents

Publication Publication Date Title
CN100479054C (zh) 创建和访问音频内容的菜单而不使用显示器的方法
CN101821735B (zh) 生成与内容项的集合相关联的元数据
US20120023403A1 (en) System and method for dynamic generation of individualized playlists according to user selection of musical features
US7899564B2 (en) Procedure and apparatus for generating automatic replay of recordings
US20090158155A1 (en) Playlist generation, delivery and navigation
KR101090388B1 (ko) 그래픽 인터페이스에 의한 오디오 문서 세트내에서의 내비게이션 방법 및 상기 방법에 의한 내비게이션을 위한 수신기
KR101540429B1 (ko) 콘텐츠 플레이 리스트 추천 방법 및 장치
US20070193437A1 (en) Apparatus, method, and medium retrieving a highlighted section of audio data using song lyrics
WO2009044341A2 (en) Classifying a set of content items
Rizo et al. A Pattern Recognition Approach for Melody Track Selection in MIDI Files.
JP5393977B2 (ja) 情報処理装置、情報処理方法、コンテンツ授受システム、およびコンピュータプログラム
EP1437738B1 (en) Method for creating and accessing a menu for audio content without using a display
KR20070048484A (ko) 음악파일 자동 분류를 위한 특징 데이터베이스 생성 장치및 그 방법과, 그를 이용한 재생 목록 자동 생성 장치 및그 방법
CN101055752B (zh) 一种影音碟片数据的存储方法
KR100408128B1 (ko) 디지털 오디오 데이터 파일이 기록된 기록 매체로부터디지털 오디오 데이터 파일 검색 장치 및 방법
KR100608066B1 (ko) 오디오 데이터 파일 검색 방법
KR100361028B1 (ko) 디지털 오디오 데이터의 파일명 지정 방법
Smoliar et al. Indexing the content of multimedia documents
CN112836083A (zh) 基于rtos***的便于随机寻找播放内容的挑选方法
Kaminskyj Alexandra L. Uitdenbogerd
KR20030044954A (ko) 디지털 오디오 데이터 파일이 기록된 기록 매체로부터디지털 오디오 데이터 파일 검색 장치 및 방법
JP2001167557A (ja) オーディオ情報の特徴記述方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090415

Termination date: 20201124

CF01 Termination of patent right due to non-payment of annual fee