CN108389584B - 声音分析方法及装置 - Google Patents

声音分析方法及装置 Download PDF

Info

Publication number
CN108389584B
CN108389584B CN201810096118.7A CN201810096118A CN108389584B CN 108389584 B CN108389584 B CN 108389584B CN 201810096118 A CN201810096118 A CN 201810096118A CN 108389584 B CN108389584 B CN 108389584B
Authority
CN
China
Prior art keywords
audio
audio information
information
sound
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810096118.7A
Other languages
English (en)
Other versions
CN108389584A (zh
Inventor
袁晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ikmak Technology Co ltd
Original Assignee
Shenzhen Ikmak Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ikmak Technology Co ltd filed Critical Shenzhen Ikmak Technology Co ltd
Priority to CN201810096118.7A priority Critical patent/CN108389584B/zh
Priority to PCT/CN2018/091108 priority patent/WO2019148737A1/zh
Publication of CN108389584A publication Critical patent/CN108389584A/zh
Application granted granted Critical
Publication of CN108389584B publication Critical patent/CN108389584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供了一种声音分析方法及装置,获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;确定每个所述音频信息的音频类别;根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层;本发明中提供的声音分析方法及装置,在声音地图中按照音源距离分层显示不同来源的声音,直观显示,且显示内容丰富。

Description

声音分析方法及装置
技术领域
本发明涉及声音识别技术领域,特别涉及一种声音分析方法及装置。
背景技术
视频监控是目前各行业进行安全管理、纠纷处理的重要信息来源,然而视频监控会出现盲区死角,有不良动机的人员会刻意躲避有监控的地方施行违法行为,对事情真相的发现造成很大困扰。
而声音的传播几乎没有盲区限制,小范围的遮挡也不会造成很大的遮蔽。因此,对声音的分析将起到很大的信息补充作用。
目前常见的声音地图一般是指城市或区域噪声地图,将各处噪声的大小使用不同视觉效果呈现在地图上,直观的呈现噪声分布情况。但这种声音地图呈现的信息较少,只能简单表现声音的分贝值,一般只能用于判断噪声的分布,无法对声音进行更多的分析及应用。
发明内容
本发明的主要目的为提供一种声音分析方法,将不同距离的音频分布在声音地图中。
本发明提出一种声音分析方法,包括以下步骤:
获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
确定每个所述音频信息的音频类别;
根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层。
进一步地,所述根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内的步骤之后,包括:
在所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息。
进一步地,所述根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内的步骤之后,包括:
若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。
进一步地,所述确定每个所述音频信息的音频类别的步骤包括:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
进一步地,所述获取待分析音频信息的步骤之后,还包括:
获取所述音频信息的来源地点以及时间信息;
根据所述来源地点以及时间信息,选择第一音频类别;
所述确定每个所述音频信息的音频类别的步骤则包括:
将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
当相似度达到预设值时,确定所述音频信息的音频类别。
本发明还提供了一种声音分析装置,包括:
第一获取单元,用于获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
确定单元,用于确定所述音频信息的音频类别;
第二获取单元,用于根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
分布单元,用于根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层。
进一步地,还包括:
播放单元,用于在所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息。
进一步地,还包括:
分离单元,用于若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。
进一步地,所述确定单元具体用于:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
进一步地,还包括:
第三获取单元,用于获取所述音频信息的来源地点以及时间信息;
选择单元,用于根据所述来源地点以及时间信息,选择第一音频类别;
所述确定单元则包括:
对比子单元,用于将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
确定子单元,用于当所述相似度达到预设值时,确定所述音频信息的音频类别。
本发明中提供的声音分析方法及装置,具有以下有益效果:
本发明中提供的声音分析方法及装置,获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;确定每个所述音频信息的音频类别;根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层;在声音地图中按照音源距离分层显示不同来源的声音,直观显示,且显示内容丰富。
附图说明
图1是本发明一实施例中声音分析方法步骤示意图;
图2是本发明另一实施例中声音分析方法步骤示意图;
图3是本发明又一实施例中声音分析方法步骤示意图;
图4是本发明一实施例中声音分析装置结构框图;
图5是本发明另一实施例中声音分析装置结构框图;
图6是本发明一实施例中确定单元结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”“上述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件、单元、模块和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、单元、模块、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
参照图1,为本发明一实施例中的声音分析方法步骤示意图。
本发明一实施例中提出一种声音分析方法,应用于智能终端,包括以下步骤:
步骤S1,获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
步骤S2,确定每个所述音频信息的音频类别;
步骤S3,根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
步骤S4,根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层。
通常声音地图上只显示各种声音的分贝值,显示的信息较小。在本实施例中,获取到一段音频信息,该音频信息中包括有多种音频类别的音频信息。本实施例中的音频类别指的是根据音频的声源划定的音频类别,例如车辆行走发出的声音、风声、鸟叫声与行人说话的声音均为不同的音频类别。对上述待分析音频信息进行分析,确定出其中包含的每个音频信息的音频类别。
可以理解的是,有些音频可能不具有相应的音源距离,例如风声、雷电声等,本实施例中将此类音频的音源距离设置为无限远。因此,音频类别的不同,获取到的音源距离不同。本实施例中,根据音频类别的不同,按照不同的规则确定其音源距离。音源距离属于音频信息的一个特征信息,该特征信息还可以包括音频类别、分贝值、响度、清晰度等。具体地,可以通过声源定位确定音频信息的音源距离。
最后,本实施例中声音地图中按照音源距离设置有多个分层,每个分层代表不同音源距离的音频信息,将上述获取到音源距离的音频信息按照对应的音源距离分布在声音地图中;同时,还将音频信息对应的音频类别、分贝值等特征信息显示在声音地图内,以便可以直观查看音频的相关信息。
上述步骤S2之后还可以包括以下步骤:
根据音频类别,按照预设方式进行处理。在本实施例中,对于不同音频类别的音频信息,采取不同的处理程序进行处理;处理程序主要包括声源定位、声源去躁、音频优化。
例如,在本实施例中,预设有对多种不同音频类别的音频信息进行处理的方式:
(1)人声:判断人声来源数目,分别进行音源方位及距离判断,并将各人声在清晰度、声音响度方面进行优化呈现。
(2)交通声:交通声主要包括陆地、海面及天空三类;包括汽车、火车、船、飞机等各类交通噪声,以及轮子与地面/铁轨摩擦声、发动机声、排气声、鸣笛声等。针对交通声判断音频信息中的交通声类型,并进行优化后呈现。
(3)工地声:包括打桩机、推土机等施工设备的运行噪声。针对工地声主要判断音源距离及音频类别。
(4)音乐声:常规环境下音乐声的来源一般是商家或个人播放喇叭产生。针对音乐声主要判断音源距离及音频类别。
(5)自然声:包括气候引起的风雨声、雷电声、水流声等。当判断某一特征频率的声音为自然声时,无需判断声源距离,直接将其显示为无限远处的声音。
对音频信息的处理过程可以是在将音频信息分布在声音地图的分层之前,也可以是在分布之后;若处理过程在分布之前,在所述分层内接收到预设的触发信号时,则直接播放所述分层内的所述音频信息;若处理过程在分布之后,则参照图2,在一实施例中,所述根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内的步骤S4之后,包括:
步骤S5,在所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息。
在将音频信息分层分布在声音地图上之后,用户对智能终端进行操作,以触发预设的触发信号,智能终端通过分层所处区域接收到上述触发信号时,则自动播放该分层内分布的音频信息;上述预设的触发信号可以设置为单击触发,或者是双击触发等。优选地,在播放上述音频信息之前,对上述音频信息进行过滤、去噪、音频优化处理。
在另一实施例中,所述根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内的步骤S4之后,包括:
步骤S6,若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。便于对相同音源距离的音频信息进行区分,当其分布在同一分层时,则将多个音频类别分别对应的音频信息进行分离显示,可以是使用不同的线条颜色进行区分。
具体地,在一实施例中,所述确定每个所述音频信息的音频类别的步骤S2包括:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
在本实施例中,***的数据库中预存有诸如人声、交通声、工地声、音乐声、自然声等各类特征音频,在需要确定待分析音频信息的音频类别时,只需将其与数据库中预存的特征音频进行对比,判断是否相似,若相似度达到预设值,则判断其为该特征音频对应的音频类别。
参照图3,在另一实施例中,所述获取待分析音频信息的步骤S1之后,还包括:
步骤S1a,获取所述音频信息的来源地点以及时间信息;
步骤S1b,根据所述来源地点以及时间信息,选择第一音频类别;
所述确定每个所述音频信息的音频类别的步骤S2则包括:
步骤S2a,将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
步骤S2b,当相似度达到预设值时,确定所述音频信息的音频类别。
若将音频信息与数据库中预存特征音频逐一进行对比,则计算量较大、在本实施例中,为了降低计算量,首先从待分析音频信息中获取到去采集音频时的地理信息(来源地点)以及时间信息,根据来源地点以及时间信息,选择在该地点出该时间段出现的主要音频类别(即第一音频类别);例如地点位于城市交通道路时,其音频信息应当主要为交通、其次为人声,则可以将交通声作为第一音频类别。然后,将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并获取所述音频信息与特征音频的相似度,当相似度达到预设值时,确定所述音频信息的音频类别。如此,可以大量降低计算量,提升分析速度。
综上所述,为本发明实施例中提供的声音分析方法,获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;确定每个所述音频信息的音频类别;根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层;在声音地图中按照音源距离分层显示不同来源的声音,直观显示,且显示内容丰富。
参照图4,本发明一实施例中还提供了一种声音分析装置,应用于智能终端,包括:
第一获取单元10,用于获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
确定单元20,用于确定所述音频信息的音频类别;
第二获取单元30,用于根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
分布单元40,用于根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层。
通常声音地图上只显示各种声音的分贝值,显示的信息较小。在本实施例中,获取到一段音频信息,该音频信息中包括有多种音频类别的音频信息。本实施例中的音频类别指的是根据音频的声源划定的音频类别,例如车辆行走发出的声音、风声、鸟叫声与行人说话的声音均为不同的音频类别。对上述待分析音频信息进行分析,确定单元20确定出其中包含的每个音频信息的音频类别。
可以理解的是,有些音频可能不具有相应的音源距离,例如风声、雷电声等,本实施例中将此类音频的音源距离设置为无限远。因此,音频类别的不同,获取到的音源距离不同。本实施例中,第二获取单元30根据音频类别的不同,按照不同的规则确定其音源距离。音源距离属于音频信息的一个特征信息,该特征信息还可以包括音频类别、分贝值、响度、清晰度等。具体地,可以通过声源定位确定音频信息的音源距离。
最后,本实施例中声音地图中按照音源距离设置有多个分层,每个分层代表不同音源距离的音频信息,分布单元40将上述获取到音源距离的音频信息按照对应的音源距离分布在声音地图中;同时,还将音频信息对应的音频类别、分贝值等特征信息显示在声音地图内,以便可以直观查看音频的相关信息。
上述声音分析装置还可以包括:
处理单元,用于根据音频类别,按照预设方式进行处理。在本实施例中,对于不同音频类别的音频信息,采取不同的处理程序进行处理;处理程序主要包括声源定位、声源去躁、音频优化。
例如,在本实施例中,预设有对多种不同音频类别的音频信息进行处理的方式:
(1)人声:判断人声来源数目,分别进行音源方位及距离判断,并将各人声在清晰度、声音响度方面进行优化呈现。
(2)交通声:交通声主要包括陆地、海面及天空三类;包括汽车、火车、船、飞机等各类交通噪声,以及轮子与地面/铁轨摩擦声、发动机声、排气声、鸣笛声等。针对交通声判断音频信息中的交通声类型,并进行优化后呈现。
(3)工地声:包括打桩机、推土机等施工设备的运行噪声。针对工地声主要判断音源距离及音频类别。
(4)音乐声:常规环境下音乐声的来源一般是商家或个人播放喇叭产生。针对音乐声主要判断音源距离及音频类别。
(5)自然声:包括气候引起的风雨声、雷电声、水流声等。当判断某一特征频率的声音为自然声时,无需判断声源距离,直接将其显示为无限远处的声音。
对音频信息的处理过程可以是在将音频信息分布在声音地图的分层之前,也可以是在分布之后;若处理过程在分布之前,在所述分层内接收到预设的触发信号时,则直接播放所述分层内的所述音频信息;若处理过程在分布之后,则在播放之前分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,再播放处理后的所述音频信息。
具体地,参照图5,在一实施例中,还包括:
播放单元50,用于在所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息。
在将音频信息分层分布在声音地图上之后,用户对智能终端进行操作,以触发预设的触发信号,智能终端通过分层所处区域接收到上述触发信号时,则自动播放该分层内分布的音频信息;上述预设的触发信号可以设置为单击触发,或者是双击触发等。优选地,在播放上述音频信息之前,对上述音频信息进行过滤、去噪、音频优化处理。
在另一实施例中,上述装置还包括:
分离单元,用于若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。便于对相同音源距离的音频信息进行区分,当其分布在同一分层时,则将多个音频类别分别对应的音频信息进行分离显示,可以是使用不同的线条颜色进行区分。
具体地,所述确定单元20具体用于:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
在本实施例中,***的数据库中预存有诸如人声、交通声、工地声、音乐声、自然声等各类特征音频,在需要确定待分析音频信息的音频类别时,只需将其与数据库中预存的特征音频进行对比,判断是否相似,若相似度达到预设值,则判断其为该特征音频对应的音频类别。
进一步地,上述声音分析装置还包括:
第三获取单元,用于获取所述音频信息的来源地点以及时间信息;
选择单元,用于根据所述来源地点以及时间信息,选择第一音频类别;
参照图6,所述确定单元20则包括:
对比子单元201,用于将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
确定子单元202,用于当所述相似度达到预设值时,确定所述音频信息的音频类别。
若将音频信息与数据库中预存特征音频逐一进行对比,则计算量较大、在本实施例中,为了降低计算量,首先第三获取单元从待分析音频信息中获取到去采集音频时的地理信息(来源地点)以及时间信息,选择单元根据来源地点以及时间信息,选择在该地点出该时间段出现的主要音频类别(即第一音频类别);例如地点位于城市交通道路时,其音频信息应当主要为交通、其次为人声,则可以将交通声作为第一音频类别。然后,对比子单元201将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并获取所述音频信息与特征音频的相似度,当相似度达到预设值时,确定子单元202则确定所述音频信息的音频类别。如此,可以大量降低计算量,提升分析速度。
综上所述,为本发明实施例中提供的声音分析方法及装置,获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;确定每个所述音频信息的音频类别;根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,其中所述声音地图按照距离进行分层;在声音地图中按照音源距离分层显示不同来源的声音,直观显示,且显示内容丰富。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种声音分析方法,其特征在于,包括以下步骤:
获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
确定每个所述音频信息的音频类别;
根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内;当所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息;其中所述声音地图按照距离进行分层。
2.根据权利要求1所述的声音分析方法,其特征在于,所述根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内的步骤之后,包括:
若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。
3.根据权利要求1所述的声音分析方法,其特征在于,所述确定每个所述音频信息的音频类别的步骤包括:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
4.根据权利要求1所述的声音分析方法,其特征在于,所述获取待分析音频信息的步骤之后,还包括:
获取所述音频信息的来源地点以及时间信息;
根据所述来源地点以及时间信息,选择第一音频类别;
所述确定每个所述音频信息的音频类别的步骤则包括:
将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
当相似度达到预设值时,确定所述音频信息的音频类别。
5.一种声音分析装置,其特征在于,包括:
第一获取单元,用于获取待分析音频信息,所述待分析音频信息中包括有多个不同音频类别的音频信息;
确定单元,用于确定所述音频信息的音频类别;
第二获取单元,用于根据所述音频类别,获取所述音频信息的特征信息;所述特征信息包括音源距离、分贝值;
分布单元,用于根据所述音频信息的音源距离,将所述音频信息分布在声音地图的分层内,播放单元,用于在所述分层内接收到预设的触发信号时,对分层内的所述音频信息进行声源去噪、音频优化处理,并播放处理后的所述音频信息,其中所述声音地图按照距离进行分层。
6.根据权利要求5所述的声音分析装置,其特征在于,还包括:
分离单元,用于若分层中分布有多种音频类别的音频信息时,则将多个音频类别分别对应的音频信息进行分离显示。
7.根据权利要求5所述的声音分析装置,其特征在于,所述确定单元具体用于:
与数据库中预存的特征音频进行对比,以确定所述音频信息的音频类别。
8.根据权利要求5所述的声音分析装置,其特征在于,还包括:
第三获取单元,用于获取所述音频信息的来源地点以及时间信息;
选择单元,用于根据所述来源地点以及时间信息,选择第一音频类别;
所述确定单元则包括:
对比子单元,用于将所述音频信息的频率与数据库中预存的第一音频类别对应特征音频的频率进行对比,并计算所述音频信息与特征音频的相似度;
确定子单元,用于当所述相似度达到预设值时,确定所述音频信息的音频类别。
CN201810096118.7A 2018-01-31 2018-01-31 声音分析方法及装置 Active CN108389584B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810096118.7A CN108389584B (zh) 2018-01-31 2018-01-31 声音分析方法及装置
PCT/CN2018/091108 WO2019148737A1 (zh) 2018-01-31 2018-06-13 声音分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810096118.7A CN108389584B (zh) 2018-01-31 2018-01-31 声音分析方法及装置

Publications (2)

Publication Number Publication Date
CN108389584A CN108389584A (zh) 2018-08-10
CN108389584B true CN108389584B (zh) 2021-03-19

Family

ID=63074916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810096118.7A Active CN108389584B (zh) 2018-01-31 2018-01-31 声音分析方法及装置

Country Status (2)

Country Link
CN (1) CN108389584B (zh)
WO (1) WO2019148737A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986056A (zh) * 2018-08-24 2018-12-11 潘小亮 内容需求判断***
CN109741609B (zh) * 2019-02-25 2021-05-04 南京理工大学 一种基于麦克风阵列的机动车鸣笛声监测方法
CN113496709A (zh) * 2020-04-07 2021-10-12 上海擎感智能科技有限公司 车内音效远程在线评测方法及***、存储介质及服务器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033557A3 (en) * 1999-03-04 2001-08-22 Sony Corporation Navigation apparatus
CN102435198A (zh) * 2010-09-28 2012-05-02 索尼公司 位置信息提供装置和方法、位置信息提供***和程序

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140546A (ja) * 2001-11-07 2003-05-16 Chiri Geographic Information Service Co Ltd 視覚障害者用地図認識音声装置
CN1195972C (zh) * 2002-01-09 2005-04-06 英华达(上海)电子有限公司 利用***测环境噪音的方法及装置
KR101285391B1 (ko) * 2010-07-28 2013-07-10 주식회사 팬택 음향 객체 정보 융합 장치 및 방법
US20130094656A1 (en) * 2011-10-16 2013-04-18 Hei Tao Fung Intelligent Audio Volume Control for Robot
US8183997B1 (en) * 2011-11-14 2012-05-22 Google Inc. Displaying sound indications on a wearable computing system
CN108885771B (zh) * 2016-03-07 2022-07-05 3M创新有限公司 用于个人防护设备的智能安全监视和分析***
CN106251878A (zh) * 2016-08-26 2016-12-21 彭胜 会务语音录入设备
CN106601260B (zh) * 2016-11-30 2020-07-10 中山大学 一种交通噪声地图的虚拟声再现方法
CN107231476A (zh) * 2017-05-31 2017-10-03 深圳市邦华电子有限公司 移动终端及其情景模式设置方法、装置
CN107592129B (zh) * 2017-09-26 2019-10-18 广东小天才科技有限公司 一种用于可穿戴设备的预警方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033557A3 (en) * 1999-03-04 2001-08-22 Sony Corporation Navigation apparatus
CN102435198A (zh) * 2010-09-28 2012-05-02 索尼公司 位置信息提供装置和方法、位置信息提供***和程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Auditory Distance Presentation in an Urban Augmented Reality Environment";Robert Albrecht;《ACM Transactions on Applied Perception》;20150331;第12卷(第2期);第5:1-5:19页 *

Also Published As

Publication number Publication date
CN108389584A (zh) 2018-08-10
WO2019148737A1 (zh) 2019-08-08

Similar Documents

Publication Publication Date Title
CN108389584B (zh) 声音分析方法及装置
Christian et al. Initial investigation into the psychoacoustic properties of small unmanned aerial system noise
Pieretti et al. A new methodology to infer the singing activity of an avian community: The Acoustic Complexity Index (ACI)
CN107393555B (zh) 一种低信噪比异常声音信号的检测***及检测方法
CN107985225A (zh) 提供声音追踪信息的方法、声音追踪设备及具有其的车辆
CN108226854A (zh) 提供后车的可视化信息的装置和方法
Castro et al. Experimental test of birdcall detection by autonomous recorder units and by human observers using broadcast
CN205281786U (zh) 报警***
Oldoni et al. The acoustic summary as a tool for representing urban sound environments
Lemaitre et al. A psychoacoustical study of wind buffeting noise
CN110488225A (zh) 声音方位的指示方法、装置、可读存储介质及移动终端
Gloaguen et al. Road traffic sound level estimation from realistic urban sound mixtures by non-negative matrix factorization
Farahani et al. A spatially based machine learning algorithm for potential mapping of the hearing senses in an urban environment
CN114021384B (zh) 一种基于bim和gis的道路噪声可视化评价方法
Gillibrand et al. An initial study to develop appropriate warning sound for a luxury vehicle using an exterior sound simulator
CN107885845A (zh) 音频分类方法及装置、计算机设备及存储介质
CN103377456B (zh) 一种自适应的数字栅格地图可见水印方法
EP4115415A1 (en) Electronic device, method and computer program
CN114743562B (zh) 一种飞机声纹识别方法、***、电子设备及存储介质
EP3326404A1 (en) Evaluating near range communications quality
Matsinos et al. The Interdisciplinary Development of the Term “Soundscape”, Tracing Its Ecological Roots
CN106326264B (zh) 聚类设备和方法
CN112477757A (zh) 车辆定向预警方法、装置、车辆和存储介质
Leiba et al. Acoustical classification of the urban road traffic with large arrays of microphones
Misdariis et al. Mobility and life quality relationships–Measurement and perception of noise in urban context

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant