CN103151040A - 用于提供声源信息管理服务的*** - Google Patents

用于提供声源信息管理服务的*** Download PDF

Info

Publication number
CN103151040A
CN103151040A CN201210285766XA CN201210285766A CN103151040A CN 103151040 A CN103151040 A CN 103151040A CN 201210285766X A CN201210285766X A CN 201210285766XA CN 201210285766 A CN201210285766 A CN 201210285766A CN 103151040 A CN103151040 A CN 103151040A
Authority
CN
China
Prior art keywords
sound source
driver
terminal
source information
wireless communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210285766XA
Other languages
English (en)
Inventor
白淳权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Kia Corp
Original Assignee
Hyundai Motor Co
Kia Motors Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co, Kia Motors Corp filed Critical Hyundai Motor Co
Publication of CN103151040A publication Critical patent/CN103151040A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • G06F16/639Presentation of query results using playlists
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

本发明公开了用于提供声源信息管理服务的***。用于提供声源信息管理服务的***管理从驾驶者终端传送的声源信息,并且根据从驾驶者终端传送的语音输入数据经由语音识别提取与语音输入数据相应的声源信息,并且将所提取的声源信息提供至驾驶者终端。

Description

用于提供声源信息管理服务的***
相关申请的交叉引用
本发明要求于2011年10月13日提交的韩国专利申请第10-2011-0104804号的优先权,其全部内容引入本文以供参考。
技术领域
本发明涉及用于提供声源信息管理服务的技术,并且更具体地涉及用于提供声源信息管理服务的***,其通过识别驾驶者的语音来提供相应声源的播放列表。
背景技术
安装在车辆内的音频***通常包括AM/FM无线电接收机、光盘播放器、MPET-1音频层3(MP3)播放器等等。多年来,光盘(CD)播放器是车辆中对于许多消费者的主要音频源。数据容量大约75-80分钟的CD可以存储大约20首歌曲。设计成播放音乐的许多CD的格式设置成波形音频文件(WAV)格式。然而,WAV文件通常也不能将声源信息提供至CD播放器。也就是说,例如在歌曲、标题、艺术家、唱片、年份等等的情形中,WAV文件通常不具有信息域。
MP3 CD播放器主要用于播放数字音频。尽管取决于各个单独歌曲的文件大小和音频的质量,歌曲数目可以变化,但是具有700M容量的MP3格式的CD通常可以存储大约100首歌曲。然而,MP3文件能够包括被称为ID3标签的声源信息,不同于WAV文件,其能够将数据随着音频提供至播放器。MP3文件也可以存储在便携式存储装置(例如,USB存储器、存储卡等等)中,该便携式存储装置可以与音频***连接,从而按照用户的要求将MP3文件提供至音频***。
然而,在WAV和MP3两个格式中,当前不存在用于自动地从存储大量声源的CD或者存储装置中生成播放列表的技术或装置。例如,当驾驶者利用车辆中的常规语音识别***并且语音输入短语“MichaelJackson”时,当前可用的***不能自动地从CD和/或便携式存储装置中检索并编制仅含有“Michael Jackson”的歌曲的播放列表。
发明内容
本发明提供声源信息管理服务,其管理从驾驶者终端传送的声源信息,从驾驶者终端接收语音输入数据并提取与经由语音识别***输入的语音输入数据相应的声源信息,并且将所提取的声源信息提供至驾驶者终端。
此外,本发明提供如下***,该***通过获得并管理与从驾驶者终端传送的所讨论的声源相应的声源信息,从驾驶者终端接收语音输入数据并提取与由语音识别***输入的语音输入数据相应的声源信息,并且将所提取的声源信息提供至驾驶者终端,来提供声源信息管理服务。
根据本发明的示例性实施方式,驾驶者终端包括声源存储单元、语音输入单元、无线通信单元、显示单元、和控制单元,其中该声源存储单元配置成存储具有声源信息的声源,该语音输入单元配置成从驾驶者接收语音输入数据,该无线通信单元配置成将语音输入数据传送到管理服务器并且从管理服务器接收与语音输入数据相应的播放列表,该显示单元配置成在屏幕上显示传送到无线通信单元的播放列表,并且该控制单元配置成在驾驶者已经激活歌曲选择模式时控制语音输入单元从驾驶者接收语音输入数据、控制无线通信单元将语音输入数据通过语音输入单元传送到管理服务器、并且控制显示单元在屏幕上显示通过无线通信单元传送的播放列表。
根据本发明的另一示例性实施方式,提供了用于提供声源信息管理服务的***的管理服务器。管理服务器包括:存储单元,配置成存储关于各个声源的声源信息;无线通信单元,配置成从驾驶者终端接收用于选择歌曲的语音输入数据并将与所接收的语音输入数据相应的播放列表传送到驾驶者终端;语音识别单元,配置成识别传送到无线通信单元的语音输入数据;和控制单元,配置成控制语音识别单元鉴别/识别从驾驶者终端传送的语音输入数据,基于由语音识别单元所识别的结果从存储单元提取相应声源信息从而生成播放列表,并且控制无线通信单元将所生成的播放列表传送到驾驶者终端。
根据本发明的另一示例性实施方式,提供了用于提供声源信息管理服务的***的管理服务器。管理服务器包括:无线通信单元,配置成从驾驶者终端接收选择声源和歌曲的语音输入数据并将与所接收的语音输入数据相应的播放列表传送到驾驶者终端;交互工作单元,配置成接入外部声源服务器,从而共享声源数据库;语音识别单元,配置成识别传送到无线通信单元的语音输入数据;存储单元,配置成存储与传送到无线通信单元的声源有关的声源信息;和控制单元,配置成从声源数据库获得与声源有关的声源信息并在存储单元中存储所获得的声源信息,控制语音识别单元识别从驾驶者终端传送的语音输入数据,基于由语音识别单元所识别的结果提取相应声源信息从而生成播放列表,并且控制无线通信单元将所生成的播放列表传送到驾驶者终端。
根据本发明的另一示例性实施方式,提供了用于在驾驶者终端中提供声源信息管理服务的方法。该方法包括通过声源存储单元存储具有声源信息的声源;通过语音输入单元响应于驾驶者激活歌曲选择模式从驾驶者接收语音输入数据;通过无线通信单元将所接收的语音输入数据传送到管理服务器;并通过显示单元在屏幕上显示从管理服务器传送的播放列表。
根据本发明的另一示例性实施方式,提供了用于在管理服务器中提供声源信息管理服务的方法。该方法包括通过存储单元在存储单元内存储与各个声源有关的声源信息;通过无线通信单元从驾驶者终端接收语音输入数据;通过语音识别单元识别所接收的语音输入数据;通过控制单元基于由语音识别单元所识别的结果从所接收的声源信息提取相应特定声源信息,从而生成播放列表;以及通过无线通信单元将播放列表传送到驾驶者终端。
根据本发明的另一示例性实施方式,提供了用于在管理服务器中提供声源信息管理服务的方法。该方法包括通过无线通信单元从驾驶者终端接收声源;通过控制单元从外部声源数据库获得并存储与该声源相应的声源信息;通过无线通信单元从驾驶者终端接收语音输入数据;通过语音识别单元识别语音输入数据;通过控制单元基于由语音识别单元所识别的结果从存储单元提取相应声源信息,从而生成播放列表;以及通过无线通信单元将播放列表传送到驾驶者终端。
附图说明
从下面结合附图提供的实施方式的描述中,本发明的上述及其它目的和特征变得显而易见,其中:
图1是根据本发明的示例性实施方式的用于提供声源信息管理服务的***的示意图;
图2是根据本发明的示例性实施方式的驾驶者终端的示意图;
图3是根据本发明的示例性实施方式的管理服务器的示意图;
图4是根据本发明的另一示例性实施方式的管理服务器的示意图;
图5是根据本发明的示例性实施方式的用于在驾驶者终端中提供声源信息管理服务的方法的流程图;
图6是根据本发明的示例性实施方式的用于在管理服务器中提供声源信息管理服务的方法的流程图;并且
图7是根据本发明的另一示例性实施方式的用于在管理服务器中提供声源信息管理服务的方法的流程图。
图中各个元件的标记
图1
10:驾驶者终端
20:管理服务器
图2
12:语音输入单元    15:控制单元
11:声源存储单元
13:无线通信单元
14:显示单元
图3
22:无线通信单元    24:控制单元
21:存储单元        23:语音识别单元
图4
41:无线通信单元
45:控制单元        42:交互工作单元
43:语音识别单元        44:存储单元
图5
501:存储具有声源信息的声源
502:根据歌曲选择模式的激活接收驾驶者的语音
503:将所接收的驾驶者的语音传送到管理服务器
504:在屏幕上显示从管理服务器传送的播放列表
图6
601:存储关于各个声源的声源信息
602:从驾驶者终端接收语音
603:识别所接收的语音
604:基于所识别的结果生成播放列表
605:将播放列表传送到驾驶者终端
图7
701:从驾驶者终端接收声源
702:从外部声源数据库获得并存储与声源相应的声源信息
703:从驾驶者终端接收语音
704:识别所接收的语音
705:基于所识别的结果生成播放列表
706:将播放列表传送到驾驶者终端
具体实施方式
在下文中,将参考附图详细描述本发明的示例性实施方式。
应理解,本文使用的术语“车辆”或“车辆的”或其它类似术语包括通常的机动车,例如,包括多功能运动车(SUV)、公共汽车、卡车、各种商务车的客车,包括各种船只和船舶的水运工具,飞行器等等,并且包括混合动力车、电动车、燃烧、***式混合电动车、氢动力车和其它代用燃料车(例如,来源于石油以外的资源的燃料)。
在本发明中,声源是指声源数据,例如音频文件等,并且声源信息是指声源数据内的信息,例如歌曲标题、歌手名字等等。
图1是根据本发明的示例性实施方式的用于提供声源信息管理服务的***的示意图。如图1所示,根据本发明的示例性实施方式的用于提供声源信息管理服务的***包括至少一个驾驶者终端10和管理服务器20。在描述各个部件的过程中,驾驶者终端10安装在车辆内,并且与管理服务器20无线通信。驾驶者终端10是车辆内的多媒体装置,其包括例如播放各种声源的功能、导航功能、多媒体功能等等。
当向驾驶者终端10施加电力时,驾驶者终端10将与声源存储单元11中存储的声源相应的声源信息传送到管理服务器20。在这种情况下,声源存储单元11可以是CD和便携式存储装置。
当声源存储单元11是CD时,在将CD***驾驶者终端10中时,驾驶者终端10可以将与CD中存储的声源相应的声源信息传送到管理服务器20。当声源存储单元11是便携式存储装置时,在将便携式存储装置与驾驶者终端10连接时,可以将与便携式存储装置中存储的声源相应的声源信息传送到管理服务器20。
管理服务器20包括语音识别功能,并且管理从驾驶者终端10传送的声源信息并且在管理服务器20接收与声源信息有关的语音输入数据时经由语音识别基于来自驾驶者的语音输入数据提取声源信息。例如,语音输入数据可以与歌曲标题、歌手名字等等有关。从驾驶者终端10接收该语音输入数据。基于该语音输入数据,管理服务器将所提取的声源信息提供到驾驶者终端10,该提取的声源信息与由驾驶者要求的数据有关。所传送的声源信息被编制成播放列表。在这种情况下,驾驶者终端10可以基于播放列表播放相应声源。
例如,假设与歌手A相互关联的音乐A1、音乐A2、和音乐A3,以及与歌手B相互关联的音乐B1、音乐B2、和音乐B3,以及与歌手C相互关联的音乐C1、音乐C2、和音乐C3随机存储在驾驶者终端10内的声源存储单元11中。在这种情况下,管理服务器20接收并管理关于来自驾驶者终端10的各条音乐数据的声源信息。在这种情况下,管理服务器20仅管理声源信息,并不存储声源数据。之后,当管理服务器20从驾驶者终端10接收歌手A的名字作为语音输入数据时,管理服务器20经由语音识别生成配置有与歌手A有关的音乐即音乐A1、音乐A2、和音乐A3的播放列表,并且将所生成的播放列表提供到驾驶者终端10。
作为另一例子,歌手A的音乐A1和音乐A2以及歌手B的音乐B1存储在声源存储单元11的第一文件夹中,并且歌手A的音乐A3、歌手B的音乐B2、以及歌手C的音乐C1存储在其第二文件夹中,并且歌手B的音乐B3以及歌手C的音乐C2和音乐C3存储在其第三文件夹中。在这种情况下,管理服务器20将与音乐A1、音乐A2、和音乐B1有关的声源信息管理作为第一组,将与音乐A3、音乐B2、和音乐C1有关的声源信息管理作为第二组,并且将与音乐B3、音乐C2、和音乐C3有关的声源信息管理作为第三组。
之后,当管理服务器20从驾驶者终端10接收歌手A的名字作为语音输入数据时,管理服务器20把由音乐A1、音乐A2、和音乐A3组成的播放列表提供到驾驶者终端10。在这种情况下,播放列表内的各条音乐经由声源存储单元11内的声源数据链接,使得驾驶者终端10能够顺序地或者随机地播放音乐A1、音乐A2、和音乐A3。
作为另一例子,当将CD***驾驶者终端10中并且便携式存储装置与其连接时,驾驶者终端10告知管理服务器20声源信息的来源,并且管理服务器20为各个来源存储并管理声源信息。
同时,管理服务器20可以包括交互工作单元42,其配置成与声源服务器交互工作,基于声源关联或歌手/艺术家关联管理该声源服务器。在这种情况下,当管理服务器20从驾驶者终端10接收一部分或者全部声源时,管理服务器20可以通过交互工作单元42接入声源服务器,然后获得与所讨论的声源相应的声源信息。在这种情况下,管理服务器20将ID分配并管理到所得到的声源信息。
这里,一部分声源是指通过与声源服务器交互工作的管理服务器20足以搜索与相应声源相同的声源的量的声源。
在本发明的示例性实施方式中,声源信息是例如ID3标签,包括如下列[表格1]中的信息。声源信息存储在MP3文件格式内的声源中。
[表格1]
  偏移   长度   描述
  0   3   “TAG(标签)”识别字符串
  3   30   歌曲标题字符串
  33   30   歌手(音乐家)字符串
  63   30   唱片字符串
  93   4   唱片发行年份字符串
  97   30   备注字符串
  127   1   类型字节
图2是根据本发明的示例性实施方式的驾驶者终端的示意图。如图2所示,根据本发明的示例性实施方式的驾驶者终端10包括声源存储单元11、语音输入单元12、无线通信单元13、显示单元14、和控制单元15。
在描述各个部件的过程中,声源存储单元11可以是例如CD或者便携式存储装置。声源存储单元11存储多个声源,该多个声源各自具有例如如同上面[表格1]中的声源信息。语音输入单元12从驾驶者接收语音输入数据,从而基于来自驾驶者的语音输入数据和经由控制单元15的控制,从多个声源生成播放列表。
无线通信单元13接收并传送由驾驶者输入且来自控制单元15的语音输入数据,并从管理服务器20接收与语音输入数据相应的播放列表。无线通信单元13可以包括至少一个模块,其能够实施与管理服务器20的无线通信。例如,无线通信单元13可以包括移动通信模块、无线互联网模块等等。
移动通信模块将无线信号传送到移动通信网络中的基站、外部终端、和服务器中的至少一个,并从其中接收无线信号。无线信号可以包括与语音呼叫信号、视频通信呼叫信号、或者字符/多媒体消息的传送和接收相应的各种类型的数据。
无线互联网模块是用于无线互联网接入的模块。无线互联网技术的例子可以包括无线局域网(WLAN)(Wi-Fi)、无线宽带(Wibro)、全球微波接入互操作性(Wimax)、高速下行分组接入(HSDPA)等等。
显示单元14根据控制单元15的控制在屏幕上显示通过无线通信单元13接收的播放列表。显示单元14可以是至少液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT LCD)、有机发光二极管(OLED)、柔性显示器、3D显示器、和根据观察方向差异显示图像的复式显示器(duplex display)中的任何一种。
控制单元15控制语音输入单元12以便在歌曲选择模式已经被驾驶者激活时从驾驶者接收语音输入数据,控制无线通信单元13将通过语音输入单元12接收的语音输入数据传送到管理服务器20,并且控制显示单元14在屏幕上显示通过无线通信单元13传送到控制单元15的播放列表。
此外,当向控制单元15施加电力时,控制单元15通过无线通信单元13将与声源存储单元11中存储的声源有关的声源信息传送到驾驶者终端10。当声源单元11是CD时,在首先将CD***驾驶者终端10中时,控制单元15通过无线通信单元13将与CD中存储的声源有关的声源信息传送到驾驶者终端10。此外,当声源单元11是便携式存储装置时,在便携式存储装置与驾驶者终端10新近连接时,控制单元15通过无线通信单元13将与便携式存储装置中存储的声源有关的声源信息传送到驾驶者终端10。
图3是根据本发明的示例性实施方式的管理服务器的示意图。如图3所示,根据本发明的示例性实施方式的管理服务器20包括存储单元21、无线通信单元22、语音识别单元23、和控制单元24。
在描述各个部件的过程中,存储单元23存储关于各个声源的声源信息。无线通信单元22从驾驶者终端接收用于选择歌曲或者歌曲组的语音输入数据。无线通信单元22将与所接收的语音输入数据相应的播放列表传送到驾驶者终端10。语音识别单元23根据控制单元24的控制识别/解释通过无线通信单元22传送的语音输入数据。该语音识别技术可以是任何语音识别技术,并且被语音数据识别领域的技术人员理解为是公知的。
控制单元24基于通过无线通信单元22从驾驶者终端10传送的语音输入数据控制语音识别单元23识别语音输入数据,基于所解释的结果控制语音识别单元23从存储单元21提取相应声源信息从而生成播放列表,并且控制无线通信单元22将所生成的播放列表传送到驾驶者终端10。此外,控制单元24将通过无线通信单元22从驾驶者终端10传送的声源信息存储在存储单元21中。
图4是根据本发明的另一示例性实施方式的管理服务器的示意图。如图4所示,根据本发明的示例性实施方式的管理服务器包括无线通信单元41、交互工作单元42、语音识别单元43、存储单元44、和控制单元45。在描述各个部件的过程中,无线通信单元41从驾驶者终端10接收一部分或者全部声源,并且从驾驶者终端10接收用于选择歌曲的语音输入数据,并且将与所接收的语音相应的播放列表传送到驾驶者终端。
交互工作单元42根据控制单元45的控制接入外部声源服务器,从而在两个服务器之间共享声源数据库。语音识别单元43根据控制单元45的控制识别通过无线通信单元41传送的语音输入数据。此外,语音识别技术使用本领域内已知的技术。存储单元44存储与通过无线通信单元41传送的声源相应的声源信息。
控制单元45基于外部声源服务器中所包括的声源数据库获得与通过无线通信单元41传送的声源相应的声源信息,并且将所获得的声源信息存储在存储单元44中。控制单元45控制语音识别单元43识别通过无线通信单元41从驾驶者终端10传送的语音输入数据,基于所识别的结果控制语音识别单元43从存储单元41提取相应声源信息从而生成播放列表,并且控制无线通信单元41将所生成的播放列表传送到驾驶者终端10。
图5是根据本发明的示例性实施方式的用于在驾驶者终端中提供声源信息管理服务的方法的流程图。首先,声源存储单元11存储具有声源信息的声源(501)。接下来,在歌曲选择模式已经由驾驶者激活时,语音输入单元12从驾驶者接收语音输入数据(502)。之后,无线通信单元13将通过语音输入单元12接收的来自驾驶者的语音输入数据传送到管理服务器20(503)。之后,显示单元14在车辆内的屏幕上显示从管理服务器20传送的播放列表(504)。
图6是根据本发明的示例性实施方式的用于在管理服务器中提供声源信息管理服务的方法的流程图。首先,存储单元21存储关于各个声源的声源信息(601)。然后,无线通信单元22从驾驶者终端接收语音输入数据(602)。接下来,语音识别单元23根据控制单元24的控制识别所接收的语音输入数据(603)。然后,控制单元24基于语音识别单元23的识别结果从存储单元21提取相应声源信息,从而生成播放列表(604)。无线通信单元22随后根据控制单元24的控制将播放列表传送到驾驶者终端(605),并且驾驶者终端在车辆内的屏幕上显示播放列表。
图7是根据本发明的另一示例性实施方式的用于在管理服务器中提供声源信息管理服务的方法的流程图。首先,无线通信单元41从驾驶者终端接收声源(701)。之后,控制单元45通过无线通信单元41从外部声源数据库获得与声源相应的声源信息,并且将所获得的声源信息存储在存储单元41中(702)。
接下来,无线通信单元41从驾驶者终端接收语音输入数据(703),并且语音识别单元43识别通过无线通信单元41传送的语音(704)。然后,控制单元45基于语音识别单元43的识别结果从存储单元44提取相应声源信息,从而生成播放列表(705)。接下来,无线通信单元41根据控制单元45的控制将播放列表传送到驾驶者终端(706),并且驾驶者终端在车辆内的屏幕上显示播放列表。
如上所述,本发明的示例性实施方式通过管理从驾驶者终端传送的声源信息,通过从驾驶者终端接收语音输入数据并经由语音识别提取与语音输入数据相应的声源信息,来允许驾驶者收听他的/她的想要的音乐。有利地,本发明的示例说明的实施方式将所提取的声源信息提供到驾驶者终端。
进一步,本发明的示例性实施方式通过在与管理服务器通信的外部服务器上获得关于任何给定声源的声源信息,自动提供关于声源的播放列表,甚至关于WAV格式声源的播放列表。
尽管相对于优选的实施方式示出并描述本发明,但是本领域技术人员应当理解,在不偏离如权利要求所限定的本发明的范围的情况下,可以作出各种改变和变更。

Claims (16)

1.一种用于提供声源管理服务的***的驾驶者终端,所述驾驶者终端包括:
声源存储单元,配置成存储具有声源信息的声源;
语音输入单元,配置成从驾驶者接收语音输入数据;
无线通信单元,配置成将所述语音输入数据传送到管理服务器,并且从所述管理服务器接收与所述语音输入数据相应的播放列表;
显示单元,配置成在车辆内的屏幕上显示传送到所述无线通信单元的播放列表;和
控制单元,配置成根据驾驶者对歌曲选择模式的选择激活所述语音输入单元,控制所述无线通信单元将所述语音输入数据传送到所述管理服务器,并且控制所述显示单元在车辆内的所述屏幕上显示通过所述无线通信单元传送的播放列表。
2.根据权利要求1所述的驾驶者终端,其中当将电力施加到所述控制单元时,所述控制单元将关于各个存储声源的声源信息传送到所述管理服务器。
3.根据权利要求1所述的驾驶者终端,其中当将所述声源存储在光盘(CD)中时,在将所述CD***所述驾驶者终端中时,所述控制单元将关于所述声源的声源信息传送到所述管理服务器。
4.根据权利要求1所述的驾驶者终端,其中当将所述声源存储在便携式存储装置中时,在所述便携式存储装置与所述驾驶者终端连接时,所述控制单元将与所述声源有关的声源信息传送到所述管理服务器。
5.根据权利要求1所述的驾驶者终端,其中所述声源信息包括歌曲标题、歌手名字、和唱片发行年份中的至少一个。
6.一种用于提供声源信息管理服务的***的管理服务器,所述管理服务器包括:
存储单元,配置成存储与各个声源有关的声源信息;
无线通信单元,配置成从驾驶者终端接收用于选择歌曲组的语音输入数据,并且将与所接收的语音输入数据相应的播放列表传送到所述驾驶者终端;
语音识别单元,配置成解释传送到所述无线通信单元的语音输入数据;和
控制单元,配置成控制所述语音识别单元解释来自所述驾驶者终端的语音输入数据,基于由所述语音识别单元所解释的结果从所述存储单元提取任何相应声源信息从而生成播放列表,并且控制所述无线通信单元将所生成的播放列表传送到所述驾驶者终端。
7.一种用于提供声源信息管理服务的***的管理服务器,所述管理服务器包括:
无线通信单元,配置成从驾驶者终端接收用于选择声源和歌曲的语音输入数据,并且将与所接收的语音输入数据相应的播放列表传送到所述驾驶者终端;
交互工作单元,配置成接入外部声源服务器,从而共享声源数据库,所述声源数据库含有关于所述管理服务器上的声源的声源信息;
语音识别单元,配置成解释传送到所述无线通信单元的语音输入数据;
存储单元,配置成存储与传送到所述无线通信单元的声源有关的声源信息;和
控制单元,配置成从所述声源数据库获得与所述声源有关的声源信息并且在所述存储单元中存储所获得的声源信息,控制所述语音识别单元解释从所述驾驶者终端传送的语音输入数据,基于由所述语音识别单元所解释的结果提取相应声源信息从而生成播放列表,并且控制所述无线通信单元将所生成的播放列表传送到所述驾驶者终端。
8.一种用于在驾驶者终端中提供声源信息管理服务的方法,所述方法包括:
通过声源存储单元,存储具有声源信息的声源;
通过语音输入单元,响应于驾驶者激活歌曲选择模式,从驾驶者接收语音输入数据;
通过无线通信单元,将从驾驶者接收的语音输入数据传送到管理服务器;和
通过显示单元,在车辆内的屏幕上显示从所述管理服务器传送的播放列表。
9.根据权利要求8所述的方法,还包括在施加电力时将与各个存储声源有关的声源信息传送到所述管理服务器。
10.根据权利要求8所述的方法,其中当将所述声源存储在光盘(CD)中时,在将所述CD***所述驾驶者终端中时,所述无线通信单元将关于所述声源的声源信息传送到所述管理服务器。
11.根据权利要求8所述的方法,还包括当将所述声源存储在便携式存储装置中时,在所述便携式存储装置与所述驾驶者终端连接时,通过所述无线通信单元,将与所述声源有关的声源信息传送到所述管理服务器。
12.根据权利要求8所述的方法,其中所述声源信息包括歌曲标题、歌手名字、和唱片发行年份中的至少一个。
13.一种用于在管理服务器中提供声源信息管理服务的方法,所述方法包括:
通过存储单元,在所述存储单元上存储与各个声源有关的声源信息;
通过无线通信单元,从驾驶者终端接收语音输入数据;
通过语音识别单元,解释所接收的语音输入数据;
通过控制单元,基于由所述语音输入数据识别单元所解释的结果,从各个相应声源提取相应声源信息,从而生成播放列表;和
通过所述无线通信单元,将所述播放列表传送到所述驾驶者终端。
14.根据权利要求13所述的方法,其中所述声源信息包括歌曲标题、歌手名字、和唱片发行年份中的至少一个。
15.一种用于在管理服务器中提供声源信息管理服务的方法,所述方法包括:
通过无线通信单元,从驾驶者终端接收声源;
通过控制单元,从外部声源数据库获得并存储与所述声源相应的声源信息;
通过所述无线通信单元,从所述驾驶者终端接收语音输入数据;
通过语音识别单元,解释所述语音输入数据;
通过所述控制单元,基于由所述语音识别单元所解释的结果,从所述存储单元提取相应声源信息,从而生成播放列表;和
通过所述无线通信单元,将所述播放列表传送到所述驾驶者终端。
16.根据权利要求15所述的方法,其中所述声源信息包括歌曲标题、歌手名字、和唱片发行年份中的至少一个。
CN201210285766XA 2011-10-13 2012-08-10 用于提供声源信息管理服务的*** Pending CN103151040A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2011-0104804 2011-10-13
KR1020110104804A KR101294553B1 (ko) 2011-10-13 2011-10-13 음원정보 관리 서비스 시스템

Publications (1)

Publication Number Publication Date
CN103151040A true CN103151040A (zh) 2013-06-12

Family

ID=47990867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210285766XA Pending CN103151040A (zh) 2011-10-13 2012-08-10 用于提供声源信息管理服务的***

Country Status (5)

Country Link
US (1) US9171544B2 (zh)
JP (1) JP2013088813A (zh)
KR (1) KR101294553B1 (zh)
CN (1) CN103151040A (zh)
DE (1) DE102012213616A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9583100B2 (en) * 2012-09-05 2017-02-28 GM Global Technology Operations LLC Centralized speech logger analysis
DE102013009569B4 (de) * 2013-06-07 2015-06-18 Audi Ag Verfahren zum Betreiben eines Infotainmentsystems zum Beschaffen einer Wiedergabeliste für eine Audiowiedergabe in einem Kraftfahrzeug, Infotainmentsystem sowie Kraftwagen umfassend ein Infotainmentsystem
KR101500177B1 (ko) * 2013-10-29 2015-03-06 현대자동차주식회사 외부 음원 연동이 가능한 차량의 오디오 시스템 및 이를 이용한 외부 음원의 음향 출력 방법
CN105161112B (zh) * 2015-09-21 2019-04-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN106205648A (zh) * 2016-08-05 2016-12-07 易晓阳 一种语音控制音乐网络播放方法
US10068573B1 (en) * 2016-12-21 2018-09-04 Amazon Technologies, Inc. Approaches for voice-activated audio commands
CN107844587B (zh) * 2017-11-16 2022-02-22 百度在线网络技术(北京)有限公司 用于更新多媒体播放列表的方法和装置
JP2021041800A (ja) * 2019-09-10 2021-03-18 株式会社Subaru 車両用制御装置
CN111210826B (zh) * 2019-12-26 2022-08-05 深圳市优必选科技股份有限公司 语音信息处理方法、装置、存储介质和智能终端
KR102362815B1 (ko) * 2020-05-18 2022-02-14 니나노 주식회사 음성 인식 선곡 서비스 제공 방법 및 음성 인식 선곡 장치

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004184858A (ja) * 2002-12-05 2004-07-02 Omron Corp 音声認識サービス仲介システムと、それに用いる音声認識マスター参照方法、プログラム、およびそのプログラムを内蔵する記憶媒体
US20040194611A1 (en) * 2003-04-07 2004-10-07 Yuta Kawana Music delivery system
US20060241798A1 (en) * 2005-04-22 2006-10-26 Sony Corporation Recording and reproducing apparatus, processing method in the apparatus, and program for causing computer to execute the method
JP2007164478A (ja) * 2005-12-14 2007-06-28 Onkyo Corp コンテンツリスト配信方法、クライアント装置およびクライアントプログラム
JP2008243146A (ja) * 2007-03-29 2008-10-09 Clarion Co Ltd 音声認識処理装置及びその制御方法
CN201174237Y (zh) * 2007-10-31 2008-12-31 陈修志 声控式汽车音响
CN101609707A (zh) * 2008-06-20 2009-12-23 索尼株式会社 信息处理装置、信息处理方法和信息处理程序
CN201489315U (zh) * 2009-08-08 2010-05-26 吉林大学 车载语音识别控制***
CN102006373A (zh) * 2010-11-24 2011-04-06 深圳市子栋科技有限公司 基于语音命令控制的车载服务***及方法
CN102148865A (zh) * 2010-02-05 2011-08-10 福特全球技术公司 在车载计算***与远程应用之间进行通信的方法和设备

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0689483A (ja) * 1992-09-07 1994-03-29 Takeshi Miura 人間の音声によって、遠隔操作できる自動車搭載用 音楽録音再生装置
JPH11242496A (ja) 1998-02-26 1999-09-07 Kobe Steel Ltd 情報再生装置
JP2000268545A (ja) 1999-03-17 2000-09-29 Toshiba Video Products Japan Kk 音声再生装置
KR100557178B1 (ko) 1999-07-31 2006-03-03 삼성전자주식회사 엠피3 곡 선택재생방법
KR20010037652A (ko) 1999-10-19 2001-05-15 서주철 오디오 색인화 장치 및 그 방법과 그를 이용한 오디오 검색 시스템 및 그 방법
US7444353B1 (en) * 2000-01-31 2008-10-28 Chen Alexander C Apparatus for delivering music and information
KR100705900B1 (ko) 2000-08-21 2007-04-10 엘지전자 주식회사 개인 멀티미디어 라이브러리 시스템과 이러한 시스템을이용한 개인 멀티미디어 라이브러리 저장 및 브라우징 방법
KR20010099450A (ko) 2001-09-28 2001-11-09 오진근 음악파일 재생장치
JP3997459B2 (ja) * 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
KR20040062317A (ko) 2003-01-02 2004-07-07 엘지전자 주식회사 오디오 데이터 파일의 부가 정보 음성 안내방법
KR100779822B1 (ko) 2005-01-14 2007-11-28 박찬준 차량 운전자의 음성명령에 따른 메시지와 광고를 표시하는정보표시 시스템 및 그 방법
KR100733962B1 (ko) * 2005-11-07 2007-06-29 한국전자통신연구원 홈네트워크 간 미디어 컨텐츠 공유 시스템 및 그 방법
KR20080000203A (ko) 2006-06-27 2008-01-02 엘지전자 주식회사 음성인식을 이용한 음악 파일 검색 방법
KR20100064136A (ko) 2008-12-04 2010-06-14 현대자동차주식회사 멀티미디어 데이터 검색 방법
KR20110054946A (ko) * 2009-11-19 2011-05-25 현대자동차주식회사 차량용 오디오 시스템

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004184858A (ja) * 2002-12-05 2004-07-02 Omron Corp 音声認識サービス仲介システムと、それに用いる音声認識マスター参照方法、プログラム、およびそのプログラムを内蔵する記憶媒体
US20040194611A1 (en) * 2003-04-07 2004-10-07 Yuta Kawana Music delivery system
US20060241798A1 (en) * 2005-04-22 2006-10-26 Sony Corporation Recording and reproducing apparatus, processing method in the apparatus, and program for causing computer to execute the method
JP2007164478A (ja) * 2005-12-14 2007-06-28 Onkyo Corp コンテンツリスト配信方法、クライアント装置およびクライアントプログラム
JP2008243146A (ja) * 2007-03-29 2008-10-09 Clarion Co Ltd 音声認識処理装置及びその制御方法
CN201174237Y (zh) * 2007-10-31 2008-12-31 陈修志 声控式汽车音响
CN101609707A (zh) * 2008-06-20 2009-12-23 索尼株式会社 信息处理装置、信息处理方法和信息处理程序
CN201489315U (zh) * 2009-08-08 2010-05-26 吉林大学 车载语音识别控制***
CN102148865A (zh) * 2010-02-05 2011-08-10 福特全球技术公司 在车载计算***与远程应用之间进行通信的方法和设备
CN102006373A (zh) * 2010-11-24 2011-04-06 深圳市子栋科技有限公司 基于语音命令控制的车载服务***及方法

Also Published As

Publication number Publication date
KR101294553B1 (ko) 2013-08-07
DE102012213616A1 (de) 2013-04-18
US20130096925A1 (en) 2013-04-18
JP2013088813A (ja) 2013-05-13
US9171544B2 (en) 2015-10-27
KR20130040054A (ko) 2013-04-23

Similar Documents

Publication Publication Date Title
CN103151040A (zh) 用于提供声源信息管理服务的***
CN102006373B (zh) 基于语音命令控制的车载服务***及方法
CN104050149B (zh) 针对外部文本数据的联络信息识别***
CN104205038A (zh) 信息处理设备,信息处理方法,信息处理程序和终端设备
GB2545054A (en) Vehicle based content sharing
CN105245956A (zh) 一种音视频数据推荐方法、装置及***
CN103974186B (zh) 用于提供服务的方法和设备
US8484582B2 (en) Entry selection from long entry lists
CN105049465A (zh) 车内网络呈现
CN102435202A (zh) 云端语音导航的方法和装置
CN107040587A (zh) 一种车载电台音乐内容获取方法及装置
CN102426015A (zh) 一种导航***兴趣点的搜索方法及位置服务终端
CN103188312A (zh) 数据处理***及数据处理方法
CN109070749A (zh) 用于选择机动车的信息娱乐***的功能的方法和设备
CN101482424A (zh) 一种车辆导航方法
US20080186209A1 (en) Method of Providing Related Information of a Remote Location on a Guiding System in a Real-Time Manner
CN102200886A (zh) 多功能旅客服务***终端控制器及控制方法
CN101908058B (zh) 计算机实施***
CN102207392A (zh) 一种车载地图实现方法
CN102209088B (zh) 车载音乐的提供、获取方法和装置以及车载音乐传输***
CN103078695A (zh) 电台名称显示方法及其应用
US9287938B2 (en) Method and apparatus for transmission of song identifications
JP2010128304A (ja) 地域別選曲候補提示システム
CN102118207A (zh) 车载资讯的传输方法和***
CN103338180B (zh) 用于获取音频数据包的识别码的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130612