CN105528438A - 将电台广播中的音频内容可视化的方法 - Google Patents

将电台广播中的音频内容可视化的方法 Download PDF

Info

Publication number
CN105528438A
CN105528438A CN201510962572.2A CN201510962572A CN105528438A CN 105528438 A CN105528438 A CN 105528438A CN 201510962572 A CN201510962572 A CN 201510962572A CN 105528438 A CN105528438 A CN 105528438A
Authority
CN
China
Prior art keywords
audio content
content
station broadcast
visualization method
broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510962572.2A
Other languages
English (en)
Inventor
颜卿
刘琦
林立奇
赵冀江
张云绣
王婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Continental Automotive Asia Pacific Beijing Co Ltd
Original Assignee
Continental Automotive Asia Pacific Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive Asia Pacific Beijing Co Ltd filed Critical Continental Automotive Asia Pacific Beijing Co Ltd
Priority to CN201510962572.2A priority Critical patent/CN105528438A/zh
Publication of CN105528438A publication Critical patent/CN105528438A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种将电台广播中的音频内容可视化的方法,包括:收集电台广播中的音频内容;对所收集的音频内容进行声音识别,并基于声音识别结果进行内容搜索;将搜索获得的内容以可视化的方式呈现给用户。本发明充分利用了电台广播的内容信息,使之成为可继续利用的数据资源。并且,对于希望关注电台广播内容的用户,其也可以在驾驶过程中不必分神去听,相应提高了行车的安全。

Description

将电台广播中的音频内容可视化的方法
技术领域
本发明涉及汽车电子应用技术,特别涉及将电台广播中的音频内容可视化的方法。
背景技术
当前,车内信息娱乐***向用户提供了各种路上的信息及娱乐服务,例如电台广播、音乐播放、导航等。其中,电台广播作为最早引入车内的传统娱乐服务,有着其独特的特点。相对其他专注某一类型的娱乐服务,电台广播能够提供更丰富多样的娱乐内容,依据电台节目的不同,有音乐类的,路况播报类的,等等。
因而,如何结合现有的新技术对传统电台广播所提供的信息进一步开发利用,也成为了一个新的话题。
发明内容
本发明解决的问题是提供一种将电台广播中的音频内容可视化的方法,以向用户提供更为丰富的信息及娱乐服务。
为了解决上述问题,本发明将电台广播中的音频内容可视化的方法,包括:收集电台广播中的音频内容;对所收集的音频内容进行声音识别,并基于声音识别结果进行内容搜索;将搜索获得的内容以可视化的方式呈现给用户。
与现有技术相比,上述方案具有以下优点:将本是单向输出的电台广播的音频内容作为数据源,基于此进行声音识别及内容搜索,以将获得的搜索结果作为提供给用户的可视化。因此,充分利用了电台广播的内容信息,使之成为可继续利用的数据资源。并且,对于希望关注电台广播内容的用户,其也可以在驾驶过程中不必分神去听,相应提高了行车的安全。
附图说明
图1是本发明将电台广播中的音频内容可视化的方法的一种实施例的示意图;
图2是本发明将电台广播中的音频内容可视化的方法的一种实施例应用于汽车场景的示意图。
具体实施方式
在下面的描述中,阐述了许多具体细节以便使所属技术领域的技术人员更全面地了解本发明。但是,对于所属技术领域内的技术人员明显的是,本发明的实现可不具有这些具体细节中的一些。此外,应当理解的是,本发明并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和要素的任意组合来实施本发明,而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是权利要求的要素或限定,除非在权利要求中明确提出。
本发明的发明人认为,可以将现有的声音识别技术应用到对电台广播内容的进一步开发中。鉴于现在大数据应用及内容搜索的服务非常完善,完全可以通过内容搜索服务来对此进行技术支持。
根据本发明的一种实施方式,其包括:收集电台广播中的音频内容;对所收集的音频内容进行声音识别,并基于声音识别结果进行内容搜索;将搜索获得的内容以可视化的方式呈现给用户。
上述实施方式将用户所听到的电台广播的信息转换为可以看到的信息。特别是当用户对电台广播的内容感兴趣时,其无需再额外进行人为搜索就可获得后台准备好的信息,这无疑方便了用户的操作。另外,目前虽然也存在一些在线的网络电台能够提供可视化的信息,但保持在线收听需要消耗较多地上网流量,而收听电台广播本身并不消耗上网流量,而接收电台广播信号的设备的价格也很低廉,将电台广播的内容作为数据源显然具有较低的成本且其提供的内容也更加丰富。此外,若用户试图从传统电台切换到网络电台时,还需涉及音源的转换,这也会增加后台处理的时间及资源。而上述实施方式并不需要切换音源,其是在已有电台广播音源输出的基础上再增加视觉内容的叠加。
根据本发明,对于声音识别可以采用下述两种方式中的任意一种:
方式一,从所收集的音频内容中识别声纹,并基于声纹的比对进行内容搜索;有关声纹识别,可以应用专门进行声纹识别的公司(例如科大讯飞)所开发的声纹识别引擎来实现。或者,还可以通过第三方服务平台开放的声纹识别的软件工具开发包(SDK,SoftwareDevelopmentKit)来进行声纹识别处理。由于声纹识别本身为现有技术,此处对声纹识别的细节就不再赘述了。
方式二,对所收集的音频内容进行语义识别获得文字信息,并基于文字信息进行内容搜索;有关语义识别,其包括语音识别及语义分析,类似地,也可应用相关公司所开发的软件***或第三方服务平台开放的SDK。由于语义识别本身为现有技术,此处对语义识别的细节就不再赘述了。
以下以声音识别采用方式一为例,对本发明的详细处理过程进行举例说明。参照图1所示,以请求端作为触发本发明启用及处理部分过程的终端媒介。根据实际应用的不同,请求端可以配置在车载端,或者也可以配置在移动终端(例如手机、平板电脑)。并且,请求端可以是在满足一定条件后(例如检测到电台广播信号)触发本发明启用,这可以通过在请求端进行预先设置来实现。或者,请求端也可具备人机交互设备,通过接收用户基于人机交互设备的操作来触发本发明启用。
通过请求端触发本发明,即将电台广播中的音频内容可视化的需求触发后,先收集电台广播的音频内容,可以采用以下任意一种方式:1)对电台广播输出的音频录音;2)从电台广播的信号中直接获得音频数据,例如抓取电台广播信号中的脉冲编码调制(PCM,PulseCodeModulation)数据。当然,也可以是目前能够应用于本发明音频内容收集的其他方式。
在获得声纹后,请求端向服务器端上传音频以发起声纹识别请求。服务器端在获得所上传的音频后,开始进行声纹识别的处理。
在获得声纹识别的结果后,服务器端会基于结果进行搜索。具体地,将识别获得的声纹与网络中的声纹资源进行比对,以获得匹配的声纹,并进而获得所匹配的审问对应的媒体类型及媒体信息。此处提及的网络中的声纹资源可以是第三方在线提供的声纹库,例如对应各种不同类型歌曲的声纹库,或者,也可以通过预先将大量内容进行声纹识别以在服务器端自行建立声纹库。
例如,若音频内容收集时电台正在播放歌曲,则服务器端声纹识别的结果将包含从歌曲的音频中识别出的声纹(其通常通过字符串的形式来描述)。接下来,通过将识别出的声纹与歌曲的声纹库比对,可以获得匹配的声纹所对应的歌曲的名称、所属专辑等与歌曲相关的信息。
而若音频内容收集时正在播放广告,则服务器端声纹识别的结果将包含从广告的音频中识别出的声纹。接下来,通过将识别出的声纹与广告的声纹库比对,可以获得匹配的声纹所对应的广告所推销的物品或服务的名称、获取物品或服务的链接等与广告相关的信息。
服务器端在搜索获得相关内容后,将形成可供用户终端显示及播放的的可视化数据,并且下发至用户终端。所述可视化数据可通过文字、图片、动画等任意一种方式或组合在用户终端呈现。用户终端可以是具备显示屏的电子设备,例如车载信息娱乐***、手机、平板电脑等。
图2示出了本发明在车中应用的一种实施例。参照图2所示,假设当前车载收音机正在播放FM频段的一个音乐节目。在用户通过按键或语音触发可视化需求后,负责收集音频内容的装置从车载收音机接收的广播信号中抓取PCM数据,并将之发送给云端服务器。
云端服务器在获得PCM数据后进行声纹识别及内容搜索,从PCM数据中识别出声纹,并从网络的声纹库中获得匹配的声纹,并进而获得该匹配的声纹所对应的歌曲名称、所属专辑名称、专辑封面、演唱者。随后,云端服务器将歌曲名称、所属专辑名称、专辑封面、演唱者形成可供车载信息娱乐***显示的数据文件,并下发至汽车的网络通讯设备。
车载信息娱乐***通过网络通讯设备获得上述数据文件,并在其显示屏中显示出来。对于用户而言,其在收听广播的期间就能够在车载信息娱乐***中看到歌曲名称等歌曲相关信息,也能够获得更好的使用体验。
需要说明的是,本发明不仅可以应用于车载环境,同样也可应用于移动终端。相应地,电台广播可由移动终端内置的电台应用提供;鉴于移动终端也都自带录音设备或者可集成抓取音频数据的软件,收集音频内容的操作也可在移动终端处完成;而识别声纹及内容搜索的操作可依旧在服务器端完成;最后服务器端形成的可视化数据可再被下发至移动终端处呈现。
当然,随着如今汽车与移动终端互联技术的应用深入,当汽车与移动终端建立互联后,除声纹识别及内容搜索由服务器端完成外,电台广播提供、音频内容收集及可视化呈现均可自由选择在车载端或移动终端处实现,以提高本发明应用的灵活度。
虽然本发明已以较佳实施例披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内所作的各种更动与修改,均应纳入本发明的保护范围内,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (10)

1.一种将电台广播中的音频内容可视化的方法,其特征在于,包括:
收集电台广播中的音频内容;
对所收集的音频内容进行声音识别,并基于声音识别结果进行内容搜索;
将搜索获得的内容以可视化的方式呈现给用户。
2.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,对所收集的音频内容进行声音识别,并基于声音识别结果进行内容搜索,包括:
从所收集的音频内容中识别声纹,并基于声纹的比对进行内容搜索;
或者,对所收集的音频内容进行语义识别获得文字信息,并基于文字信息进行内容搜索。
3.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,所述内容搜索包括:通过搜索获得提供所述音频内容中的媒体类型及相关信息。
4.如权利要求3所述的将电台广播中的音频内容可视化的方法,其特征在于,若当前电台广播为音乐广播,则通过内容搜索获得的内容为电台广播中播放的歌曲及其相关信息。
5.如权利要求3所述的将电台广播中的音频内容可视化的方法,其特征在于,若当前电台广播为广告广播,则通过内容搜索获得的内容为电台广播中播放的广告及其相关信息。
6.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,以可视化的方式呈现给用户,包括以下述任一项或组合的方式呈现:文字、图片、动画。
7.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,基于用户的操作或在检测到电台广播信号后,收集电台广播的音频内容。
8.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,所述电台广播由车载收音机提供;收集音频内容的操作在车内完成,声音识别及内容搜索的操作在服务器端完成,可视化呈现在车内完成。
9.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,所述电台广播由移动终端内置的电台应用提供;收集音频内容的操作由移动终端完成,声音识别及内容搜索的操作在服务器端完成,可视化呈现在移动终端处完成。
10.如权利要求1所述的将电台广播中的音频内容可视化的方法,其特征在于,收集电台广播中的音频内容,包括:对电台广播输出的音频录音,或者从电台广播的信号中直接获得音频数据。
CN201510962572.2A 2015-12-18 2015-12-18 将电台广播中的音频内容可视化的方法 Pending CN105528438A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510962572.2A CN105528438A (zh) 2015-12-18 2015-12-18 将电台广播中的音频内容可视化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510962572.2A CN105528438A (zh) 2015-12-18 2015-12-18 将电台广播中的音频内容可视化的方法

Publications (1)

Publication Number Publication Date
CN105528438A true CN105528438A (zh) 2016-04-27

Family

ID=55770661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510962572.2A Pending CN105528438A (zh) 2015-12-18 2015-12-18 将电台广播中的音频内容可视化的方法

Country Status (1)

Country Link
CN (1) CN105528438A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464572A (zh) * 2017-08-16 2017-12-12 重庆科技学院 多模式交互音乐感知***及其控制方法
CN107729315A (zh) * 2017-09-28 2018-02-23 努比亚技术有限公司 音频文件的显示方法、终端和计算机存储介质
CN108093278A (zh) * 2017-12-28 2018-05-29 爱驰汽车有限公司 车载广播影像联动***、方法、设备及存储介质
CN108241711A (zh) * 2016-12-27 2018-07-03 乐视汽车(北京)有限公司 歌曲识别方法以及装置
CN108337061A (zh) * 2017-09-26 2018-07-27 郑州升达经贸管理学院 一种音频指纹识别技术的fm播放器
CN109241329A (zh) * 2018-08-03 2019-01-18 百度在线网络技术(北京)有限公司 用于ar场景的音乐检索方法、装置、设备及存储介质
CN110673905A (zh) * 2018-07-03 2020-01-10 上海博泰悦臻网络技术服务有限公司 渲染应用背景的方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342351A (ja) * 2001-05-15 2002-11-29 Ikuo Ota 総合放送データベース作成システム及び放送局放送データベース作成システム
CN103237260A (zh) * 2013-04-09 2013-08-07 上海合合信息科技发展有限公司 实时地从电视、电台频道中获取广告的***及方法
CN103384176A (zh) * 2012-05-04 2013-11-06 上海博泰悦臻电子设备制造有限公司 车载端电台音乐收藏方法及多媒体数据处理***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342351A (ja) * 2001-05-15 2002-11-29 Ikuo Ota 総合放送データベース作成システム及び放送局放送データベース作成システム
CN103384176A (zh) * 2012-05-04 2013-11-06 上海博泰悦臻电子设备制造有限公司 车载端电台音乐收藏方法及多媒体数据处理***
CN103237260A (zh) * 2013-04-09 2013-08-07 上海合合信息科技发展有限公司 实时地从电视、电台频道中获取广告的***及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108241711A (zh) * 2016-12-27 2018-07-03 乐视汽车(北京)有限公司 歌曲识别方法以及装置
CN107464572A (zh) * 2017-08-16 2017-12-12 重庆科技学院 多模式交互音乐感知***及其控制方法
CN107464572B (zh) * 2017-08-16 2020-10-16 重庆科技学院 多模式交互音乐感知***及其控制方法
CN108337061A (zh) * 2017-09-26 2018-07-27 郑州升达经贸管理学院 一种音频指纹识别技术的fm播放器
CN107729315A (zh) * 2017-09-28 2018-02-23 努比亚技术有限公司 音频文件的显示方法、终端和计算机存储介质
CN108093278A (zh) * 2017-12-28 2018-05-29 爱驰汽车有限公司 车载广播影像联动***、方法、设备及存储介质
CN108093278B (zh) * 2017-12-28 2019-04-05 爱驰汽车(上海)有限公司 车载广播影像联动***、方法、设备及存储介质
CN110673905A (zh) * 2018-07-03 2020-01-10 上海博泰悦臻网络技术服务有限公司 渲染应用背景的方法及***
CN109241329A (zh) * 2018-08-03 2019-01-18 百度在线网络技术(北京)有限公司 用于ar场景的音乐检索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN105528438A (zh) 将电台广播中的音频内容可视化的方法
US11133882B2 (en) Content selection based on simulcast data
CN102006373B (zh) 基于语音命令控制的车载服务***及方法
US8401580B2 (en) Processing simulcast data
CN102202082A (zh) 车载通信***及方法
US8583177B2 (en) Receiver for audio player
CN101937693A (zh) 基于语音命令的视音频播放方法及***
CN104794122A (zh) 一种位置信息推荐方法、装置和***
WO2009140828A1 (zh) 生成流媒体增值描述文件及插播多媒体信息的方法、***
US9171544B2 (en) System for providing a sound source information management service
CN105120223A (zh) 一种获取景点视图的方法及***
CN104050149B (zh) 针对外部文本数据的联络信息识别***
CN103078915A (zh) 一种基于云计算车联网的车载语音点歌***及其方法
CN105117102A (zh) 音频界面显示方法和装置
CN101739437A (zh) 一种网络搜音机的实现方法及其专用设备
CN103384176A (zh) 车载端电台音乐收藏方法及多媒体数据处理***
CN106572241A (zh) 一种信息展示方法和装置
CN104009965A (zh) 一种展示移动媒体信息的方法、装置和***
US20190306557A1 (en) In-vehicle Listener and Viewer Data Capture System (LVDCS) and Method
US20090061765A1 (en) Mobile terminal system and method for monitoring music program using music recognition
CN102843431A (zh) 一种车载在线音乐***及其控制方法
JPWO2004111880A1 (ja) コンテンツ取得システム
CN102207941A (zh) 车载音乐的提供、获取方法和装置以及车载音乐传输***
CN102209088B (zh) 车载音乐的提供、获取方法和装置以及车载音乐传输***
CN102289440A (zh) 音乐文件提供方法及其提供***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200082 538 Dalian Road, Yangpu District, Shanghai

Applicant after: Mainland Investment (China) Co., Ltd.

Address before: 200082 538 Dalian Road, Yangpu District, Shanghai

Applicant before: Continental Automotive Asia Pacific (Beijing) Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160427