CN103995890A - 一种实时音频指纹检索库数据更新和检索方法 - Google Patents

一种实时音频指纹检索库数据更新和检索方法 Download PDF

Info

Publication number
CN103995890A
CN103995890A CN201410244730.6A CN201410244730A CN103995890A CN 103995890 A CN103995890 A CN 103995890A CN 201410244730 A CN201410244730 A CN 201410244730A CN 103995890 A CN103995890 A CN 103995890A
Authority
CN
China
Prior art keywords
data
real
time
fingerprint
audio fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410244730.6A
Other languages
English (en)
Inventor
王磊
邱戴飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU SMART SCREEN SOFTWARE CO Ltd
Original Assignee
HANGZHOU SMART SCREEN SOFTWARE CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU SMART SCREEN SOFTWARE CO Ltd filed Critical HANGZHOU SMART SCREEN SOFTWARE CO Ltd
Priority to CN201410244730.6A priority Critical patent/CN103995890A/zh
Publication of CN103995890A publication Critical patent/CN103995890A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种实时音频指纹检索库数据更新和检索方法,实时音频指纹检索库可实时地接收多路音频指纹流,多路音频指纹流每个指纹流中均包含成对的音频指纹、母本元信息,实时音频指纹检索库采用环形队列存储数据,环形队列包括头指针、尾指针、最大容量、当前数量信息,数据从队列的头部添加,每次成功添加数据,头指针往前移,尾指针和头指针之间的数据设为当前有效数据,检索时从队尾开始获取数据,多路音频指纹流每路指纹流数据存入时均设有过期时间,通过所述的尾指针移动使过期数据失效。本发明保证音频指纹数据的实时性,所有音频指纹数据均设有有效期,具备超时音频指纹数据自动删除功能。

Description

一种实时音频指纹检索库数据更新和检索方法
技术领域
本发明涉及音频指纹检索领域,尤其是涉及一种实时音频指纹检索库数据更新和检索方法。
背景技术
音频指纹(audio fingerprint)是根据音频信号计算出的一组哈希值,目前音频指纹技术广泛地被应用到歌曲搜索,盗版检测等领域,随着移动互联网的发展,音频指纹技术也被应用到与电视节目进行实时互动中;音频指纹检索库是用于保存母本音频指纹以及相应的原始信息的库,歌曲搜索检索库的特点是数据量大,一旦入库完成基本不会频繁更新,属于离线库,关注的是***内存消耗和检索速度,电视节目检索库的特点是数据量相对较小,不过由于电视直播的特点,数据库需要实时更新,并且每段指纹需要有一定的生存时间,过了这个时间自动失效,属于在线库,相对于离线库,在线库除了需要关注内存和检索速度之外,还需要关注实时性,指纹超时机制,以及解决时间戳溢出问题。
发明内容
本发明是为了解决在线库音频指纹存储和检索的问题,提供一种具备实时性、指纹有效期、超时指纹删除功能的实时音频指纹检索库数据更新和检索方法。
为了实现上述目的,本发明采用以下技术方案:一种实时音频指纹检索库数据更新和检索方法,所述的实时音频指纹检索库可实时地接收多路音频指纹流,所述的多路音频指纹流每个指纹流中均包含成对的音频指纹、母本元信息,所述实时音频指纹检索库采用环形队列存储数据,所述的环形队列包括头指针、尾指针、最大容量、当前数量信息,所述的数据从队列的头部添加,每次成功添加数据,所述的头指针往前移,所述的尾指针和头指针之间的数据设为当前有效数据,检索时从队尾开始获取数据。本方案音频指纹检索库实时地接收多路音频指纹流,每个指纹流中包含成对的(key,value)数据,其中的key就是音频指纹,value包含母本元信息(例如用于标识频道名或节目内容的索引),在音频指纹库中,以hash表的方式存贮元信息数据,hash的方式可以提供接近0(1)的检索复杂度,每个key对应一个队列,存放相同hash值的音频指纹对应的元信息,因为指纹库有自动过期的特点,所以采用环形队列来存贮,队列有头指针,尾指针,最大容量,以及当前数量等信息,数据从队列的头部添加,每次成功添加数据,头指针往前移,尾指针和头指针之间是当前有效数据,检索时从队尾开始获取数据;在指纹检索库中,指纹数据的实时更新和检索是并发进行的,如果需要保证***、读取的强一致性,需要加锁操作,这样对于实时更新的***必然会造成检索的性能低下,由于本方案中指纹数据是从队列头部更新,尾部超时的,获取时从队尾开始获取,入库时连续在同一个队列中更新的几率较低,并且入库和检索操作都是速度很多的操作,所以在实际中入库、检索操作都不加锁,由于音频指纹流中每秒钟有大量指纹数据,所以这种处理方式不会造成明显的精度下降。
作为优选,所述的多路音频指纹流每路指纹流数据存入时均设有过期时间,通过所述的尾指针移动使过期数据失效。为了实现指纹库过期失效,在音频指纹入库的时候,可先根据每路音频指纹流设置的过期时间,从队尾开始将过期的指纹删除,这里的删除并不需要真正的删除数据操作,只需要移动一下队尾指针;在离线的音频指纹库中,每个音频文件的长度是有限的,少则几分钟,多则几小时,但是在实时流式***中理论上音频指纹流是无限长的,而表示音频指纹流中的时间信息的比特数又是有限的,所以实时音频指纹库中需要考虑时间溢出的问题,在检查超时和获取指纹的时候需要考虑由于时间位数溢出造成的时间戳跳动情况,如果不考虑这个情况,那么会造成每次时间溢出时***的不可用;对于实时音频指纹检索库,需要考虑指纹数据的过期失效机制,以支持一些实时应用,并且保证库的容量不随着时间的增长而不断增大,性能不随着时间的增长而下降。
作为优选,所述的实时音频指纹检索库在检索音频指纹的时候会判断每个获得的母本元信息数据是否在有效时间范围之内,所述实时音频指纹检索库返回在有效时间范围内的检索结果。在每次指纹数据到来的时候更新的方式,不能保证队列中的数据都是100%在有效时间范围之内的,因为如果某一路指纹流出现问题,没有及时更新的情况下,队列中的数据就不能超时,为了解决这个问题,在检索音频指纹的时候,指纹库会判断每个获得的元信息数据是否在有效时间范围之内,只返回在有效时间范围内的检索结果。
因此,本发明具有如下有益效果:1)保证音频指纹数据的实时性;2)所有音频指纹数据均设有有效期;3)具备超时音频指纹数据自动删除功能。
具体实施方式
下面对本发明做进一步的描述。
一种实时音频指纹检索库数据更新和检索方法,实时音频指纹检索库可实时地接收多路音频指纹流,多路音频指纹流每个指纹流中均包含成对的音频指纹、母本元信息,实时音频指纹检索库采用环形队列存储数据,环形队列包括头指针、尾指针、最大容量、当前数量信息,数据从队列的头部添加,每次成功添加数据,头指针往前移,尾指针和头指针之间的数据设为当前有效数据,检索时从队尾开始获取数据,多路音频指纹流每路指纹流数据存入时均设有过期时间,通过尾指针移动使过期数据失效,实时音频指纹检索库在检索音频指纹的时候会判断每个获得的母本元信息数据是否在有效时间范围之内,实时音频指纹检索库只返回在有效时间范围内的检索结果。

Claims (3)

1.一种实时音频指纹检索库数据更新和检索方法,其特征在于,所述的实时音频指纹检索库可实时地接收多路音频指纹流,所述的多路音频指纹流每个指纹流中均包含成对的音频指纹、母本元信息,所述实时音频指纹检索库采用环形队列存储数据,所述的环形队列包括头指针、尾指针、最大容量、当前数量信息,所述的数据从队列的头部添加,每次成功添加数据,所述的头指针往前移,所述的尾指针和头指针之间的数据设为当前有效数据,检索时从队尾开始获取数据。
2.根据权利要求1所述的一种实时音频指纹检索库数据更新和检索方法,其特征在于,所述的多路音频指纹流每路指纹流数据存入时均设有过期时间,通过所述的尾指针移动使过期数据失效。
3.根据权利要求1所述的一种实时音频指纹检索库数据更新和检索方法,其特征在于,所述的实时音频指纹检索库在检索音频指纹的时候会判断每个获得的母本元信息数据是否在有效时间范围之内,所述实时音频指纹检索库返回在有效时间范围内的检索结果。
CN201410244730.6A 2014-05-30 2014-05-30 一种实时音频指纹检索库数据更新和检索方法 Pending CN103995890A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410244730.6A CN103995890A (zh) 2014-05-30 2014-05-30 一种实时音频指纹检索库数据更新和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410244730.6A CN103995890A (zh) 2014-05-30 2014-05-30 一种实时音频指纹检索库数据更新和检索方法

Publications (1)

Publication Number Publication Date
CN103995890A true CN103995890A (zh) 2014-08-20

Family

ID=51310055

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410244730.6A Pending CN103995890A (zh) 2014-05-30 2014-05-30 一种实时音频指纹检索库数据更新和检索方法

Country Status (1)

Country Link
CN (1) CN103995890A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224658A (zh) * 2015-09-30 2016-01-06 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和***
KR101740271B1 (ko) 2015-02-13 2017-05-26 레이 왕 온라인 상에서 실시간으로 업데이트되는 대규모 오디오 핑거프린트 데이터베이스의 구축 방법 및 장치
CN107731220A (zh) * 2017-10-18 2018-02-23 北京达佳互联信息技术有限公司 音频识别方法、装置和服务器
CN109657093A (zh) * 2018-11-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 音频检索方法、装置及存储介质
CN111309728A (zh) * 2020-02-07 2020-06-19 联想(北京)有限公司 一种流量统计方法、装置、***及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101055591A (zh) * 2007-05-25 2007-10-17 中兴通讯股份有限公司 一种全内存数据库的数据存取方法
CN101105786A (zh) * 2006-07-14 2008-01-16 中兴通讯股份有限公司 一种基于共享存储器的双cpu通信方法
WO2008127052A1 (en) * 2007-04-17 2008-10-23 Electronics And Telecommunications Research Institute System and method for searching audio fingerprint by index information
CN101673262A (zh) * 2008-09-12 2010-03-17 未序网络科技(上海)有限公司 音频内容的搜索方法
CN102289518A (zh) * 2011-09-13 2011-12-21 盛乐信息技术(上海)有限公司 音频指纹检索库的更新方法及***
CN102567428A (zh) * 2010-12-30 2012-07-11 ***通信集团浙江有限公司 一种在线数据生命周期管理方法和装置
CN103152423A (zh) * 2013-03-15 2013-06-12 安科智慧城市技术(中国)有限公司 一种云存储***及其数据存取方法
CN103440330A (zh) * 2013-09-03 2013-12-11 网易(杭州)网络有限公司 一种音乐节目信息获取方法和设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105786A (zh) * 2006-07-14 2008-01-16 中兴通讯股份有限公司 一种基于共享存储器的双cpu通信方法
WO2008127052A1 (en) * 2007-04-17 2008-10-23 Electronics And Telecommunications Research Institute System and method for searching audio fingerprint by index information
CN101055591A (zh) * 2007-05-25 2007-10-17 中兴通讯股份有限公司 一种全内存数据库的数据存取方法
CN101673262A (zh) * 2008-09-12 2010-03-17 未序网络科技(上海)有限公司 音频内容的搜索方法
CN102567428A (zh) * 2010-12-30 2012-07-11 ***通信集团浙江有限公司 一种在线数据生命周期管理方法和装置
CN102289518A (zh) * 2011-09-13 2011-12-21 盛乐信息技术(上海)有限公司 音频指纹检索库的更新方法及***
CN103152423A (zh) * 2013-03-15 2013-06-12 安科智慧城市技术(中国)有限公司 一种云存储***及其数据存取方法
CN103440330A (zh) * 2013-09-03 2013-12-11 网易(杭州)网络有限公司 一种音乐节目信息获取方法和设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101740271B1 (ko) 2015-02-13 2017-05-26 레이 왕 온라인 상에서 실시간으로 업데이트되는 대규모 오디오 핑거프린트 데이터베이스의 구축 방법 및 장치
CN105224658A (zh) * 2015-09-30 2016-01-06 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和***
CN105224658B (zh) * 2015-09-30 2018-11-30 北京京东尚科信息技术有限公司 一种大数据的实时查询方法和***
CN107731220A (zh) * 2017-10-18 2018-02-23 北京达佳互联信息技术有限公司 音频识别方法、装置和服务器
WO2019076313A1 (zh) * 2017-10-18 2019-04-25 北京达佳互联信息技术有限公司 音频识别方法、装置和服务器
US11482242B2 (en) 2017-10-18 2022-10-25 Beijing Dajia Internet Information Technology Co., Ltd. Audio recognition method, device and server
CN109657093A (zh) * 2018-11-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 音频检索方法、装置及存储介质
CN111309728A (zh) * 2020-02-07 2020-06-19 联想(北京)有限公司 一种流量统计方法、装置、***及存储介质

Similar Documents

Publication Publication Date Title
CN103995890A (zh) 一种实时音频指纹检索库数据更新和检索方法
US10657174B2 (en) Systems and methods for providing identification information in response to an audio segment
CN102521405B (zh) 支持高速加载的海量结构化数据存储、查询方法和***
EP2898430B1 (en) Mail indexing and searching using hierarchical caches
CN102521406B (zh) 海量结构化数据复杂查询任务的分布式查询方法和***
US9619512B2 (en) Memory searching system and method, real-time searching system and method, and computer storage medium
CN104123238A (zh) 数据存储方法及装置
CN104794228B (zh) 一种搜索结果提供方法及装置
CN112286941B (zh) 一种基于Binlog+HBase+Hive的大数据同步方法和装置
CN106649722B (zh) 一种监控***高频数据的存储及查询方法
CN103744913A (zh) 一种基于搜索引擎技术的数据库检索方法
CN102054000A (zh) 数据查询方法、装置及***
CN101702676A (zh) 数据缓冲处理的方法和装置
CN108874930A (zh) 文件属性信息统计方法、装置、***、设备及存储介质
US8600990B2 (en) Interacting methods of data extraction
CN101256579A (zh) 一种数据库范围查询数据组织的方法
US9996470B2 (en) Workload management in a global recycle queue infrastructure
CN102622353B (zh) 一种固定音频检索方法
CN102630041B (zh) 电视节目数据的处理方法、装置及***
CN102073690B (zh) 一种支持历史Key信息的内存数据库的构建方法
CN102724301B (zh) 云数据库***以及云数据读写处理方法、设备
CN107659626B (zh) 面向临时元数据的分离存储方法
CN109688422A (zh) 一种视频处理的方法及装置
WO2023246259A1 (zh) 视频识别方法、装置、计算机设备和存储介质
CN113348450A (zh) 一种车载数据存储方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140820