CN115547360A - 预警方法、装置、电子设备及存储介质 - Google Patents

预警方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115547360A
CN115547360A CN202211266706.3A CN202211266706A CN115547360A CN 115547360 A CN115547360 A CN 115547360A CN 202211266706 A CN202211266706 A CN 202211266706A CN 115547360 A CN115547360 A CN 115547360A
Authority
CN
China
Prior art keywords
audio
early warning
audio data
keywords
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211266706.3A
Other languages
English (en)
Inventor
卢明
莫传喜
唐军
卢汉利
陆振心
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Hanlin Technology Co ltd
Original Assignee
Guangxi Hanlin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Hanlin Technology Co ltd filed Critical Guangxi Hanlin Technology Co ltd
Priority to CN202211266706.3A priority Critical patent/CN115547360A/zh
Publication of CN115547360A publication Critical patent/CN115547360A/zh
Priority to PCT/CN2023/117773 priority patent/WO2024082865A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/182Level alarms, e.g. alarms responsive to variables exceeding a threshold
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • G08B21/24Reminder alarms, e.g. anti-loss alarms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Emergency Management (AREA)
  • Business, Economics & Management (AREA)
  • Alarm Systems (AREA)

Abstract

本申请实施例公开了一种预警方法、装置、电子设备及存储介质。该方法包括:通过音频采集装置获取目标场所的音频数据;对音频数据进行异常分析,以确定是否存在异常行为;若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值,通过对音频数据进行异常分析得到的预警语音,然后向音频设备发送预警语音,不仅节约了人力,还及时通知目标场所的相关人员将要发生异常事件,使得相关人员及时做出应对措施,进而减少安全场所的损失。

Description

预警方法、装置、电子设备及存储介质
技术领域
本申请涉及音频处理技术领域,具体涉及一种预警方法、装置、电子设备及存储介质。
背景技术
目前,一些安全场所(如银行、珠宝店、博物馆等)的安全保障往往是通过安保人员进行现场巡视,或者对安全场所的监控视频进行实时查看,然后及时做出应对措施,减少安全场所的损失。然而人力资源有限,且安全场所会存在监控盲区,进而安全场所的相关人员不能及时知道安全场所将要发生异常事件。
发明内容
本申请实施例提供了一种预警方法、装置、电子设备及存储介质,通过对在目标场所获取到的音频数据进行异常分析得到预警语音,然后向音频设备发送预警语音,不仅节约了人力,还及时通知目标场所的相关人员将要发生异常事件,使得相关人员及时做出应对措施,进而减少安全场所的损失。
通过音频采集装置获取目标场所的音频数据;
对音频数据进行异常分析,以确定是否存在异常行为;
若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;
向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值。
第二方面,本申请实施例提供一种预警装置,该装置包括:收发单元和处理单元;
收发单元,通过音频采集装置获取目标场所的音频数据;
处理单元,对音频数据进行异常分析,以确定是否存在异常行为;
若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;
向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值。
第三方面,本申请实施例提供一种电子设备,包括:处理器和存储器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。
第五方面,本申请实施例提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。
实施本申请实施例,具有如下有益效果:通过音频采集装置获取目标场所的音频数据;对音频数据进行异常分析,以确定是否存在异常行为;若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值,通过对音频数据进行异常分析得到的预警语音,然后向音频设备发送预警语音,不仅节约了人力,还及时通知目标场所的相关人员将要发生异常事件,使得相关人员及时做出应对措施,进而减少目标场所的损失。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种预警***的示意图;
图2为本申请实施例提供的一种预警***的场景示意图;
图3为本申请实施例提供的一种预警方法的流程示意图;
图4为本申请实施例提供的一种构建目标模型的流程示意图;
图5为本申请实施例提供的对第一音频进行处理,得到第二情绪值的示意图;
图6为本申请实施例提供的一种预警装置的功能单元组成框图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1为本申请实施例提供的一种预警***的示意图。预警***包括音频采集装置101、预警装置102和音频设备103。
其中,音频采集装置101,可以安装在目标场所的隐蔽位置,比如目标场所的隐蔽角落;目标场所可以为银行、珠宝店、博物馆、别墅等等。音频设备103,可以是目标场所安保中心的播放设备、目标场所安保人员携带的播放设备、以及目标场所相关人员(比如目标场所的负责人、店员,等等)的手机,等等;应说明,音频设备103的安装位置和音频采集装置101之间的距离应大于第一阈值。
具体地,音频采集装置101获取目标场所的音频数据,然后音频采集装置101向预警装置102发送音频数据;预警装置102对音频数据进行异常分析,以确定是否存在异常行为;若存在异常行为,预警装置102生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;然后,预警装置102向音频设备103发送预警语音,以通过音频设备103播放预警语音。
示例性的,参阅图2,图2为本申请实施例提供的一种预警***的场景示意图,该场景的预警***包括银行音频采集装置201、预警装置202、银行音频设备203(图2中的银行安保中心的播放设备、银行安保人员携带的播放设备、银行负责人的手机)。其中,银行音频采集装置201的安装位置和银行音频设备203的安装位置之间的距离大于第一阈值。
然后,银行音频采集装置201获取银行隐蔽位置的音频数据,然后银行音频采集装置201向预警装置202发送音频数据;然后预警装置202对音频数据进行异常分析,以确定是否存在异常行为;若检测到存在异常行为,则预警装置202生成预警语音;然后,预警装置202向银行音频设备203(图2中的银行安保中心的播放设备、银行安保人员携带的播放设备、银行负责人的手机)发送预警语音,以通过银行音频设备203播放预警语音。
可以看出,在本申请实施例中,通过音频采集装置获取目标场所的音频数据;对音频数据进行异常分析,以确定是否存在异常行为;若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值,通过对音频数据进行异常分析得到的预警语音,然后向音频设备发送预警语音,不仅节约了人力,还及时通知目标场所的相关人员将要发生异常事件,使得相关人员及时做出应对措施,进而减少安全场所的损失。
参阅图3,图3为本申请实施例提供的一种预警方法的流程示意图,该方法包括但不限于步骤301-306:
301:音频采集装置获取目标场所的音频数据。
其中,音频采集装置可以安装在目标场所的隐蔽位置,比如目标场所的隐蔽角落;目标场所可以为银行、珠宝店、博物馆、别墅等等。
302:音频采集装置向预警装置发送音频数据。相应地,预警装置接收到音频数据。
应说明,在本申请实施例中,音频采集装置在向预警装置发送音频数据时,可以采用Lora(Long Range,远距离)协议进行传输,Lora协议无线传输方式不仅可以实现远距离传输,其传输距离范围长达15至20公里,还可以兼具低功耗、低成本等优点。
在本申请的实施例中,音频采集装置在获取到目标场所的音频数据后,音频采集装置会对音频数据进行数字化,得到第三音频数据;对第三音频数据进行压缩编码,得到第二音频数据;对第二音频数据进行信道编码,得到第一音频数据;然后向预警装置发送第一音频数据,以使预警装置接收到第一音频数据后对音频数据进行异常分析,确定是否存在异常行为。
示例性地,音频采集装置的输出端将音频数据进行数字化,得到第三音频数据;再将第三音频数据进行压缩编码,例如OPUS编码,得到第二音频数据;然后将第二音频数据进行信道编码,例如前向纠错编码(Forward Error Correction,FEC),得到第一音频数据;最后向预警装置发送第一音频数据,即通过Lora协议向预警装置发送第一音频数据,以使预警装置接收到第一音频数据后对音频数据进行异常分析,确定是否存在异常行为。
相适应地,预警装置从音频采集装置接收第一音频数据之后,对第一数字进行信道解码,得到第二音频数据;对第二音频数据进行压缩解码,得到第三音频数据;对第三音频数据进行模拟化,得到音频数据。
应说明,借助Lora协议传输音频数据,提高了传输的效率,进一步提高了通知目标场所的相关人员存在异常行为的速度,使得相关人员对异常行为及时做出应对措施,减少损害。
303:预警装置对音频数据进行异常分析,以确定是否存在异常行为。
在一种可选的实施例中,步骤303可以包括步骤S11-S15:
S11:对音频数据进行语音识别,得到多个第一文本。
其中,多个第一文本对应音频数据中的M个行为人,也即是说,由于每个行为人的声音存在独特性,在对音频数据进行语音识别时,会自动根据每个行为人的音色对音频数据进行语音识别并分类。因此,示例性的,可以对音频数据进行音色识别,得到M个语音流,其中,M个语音流对应音频数据中的M个行为人;然后对每个语音流进行语音识别,得到多个第一文本。
S12:将每个第一文本输入深度学习模型中进行语义分析,得到多个第一关键词。
在本申请的实施例中,可以采用深度学习模型对每个第一文本进行语义分析,实现分词,比如第一文本为“南京市长江大桥”,对第一文本进行语义分析,得到的分词依次为“南京市、长江大桥”,然后得到两个第一关键词即为“南京市”和“长江大桥”。
S13:将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度。
示例性地,将每个行为人对应的多个第一关键词输入目标模型,计算每个第一关键词和词库中的每个目标关键词之间的相似度,得到每个第一关键词对应的多个相似度,然后将每个第一关键词对应的多个相似度中值最大的相似度作为每个第一关键词对应的第一相似度。
在本申请实施例中,构建步骤S13中的目标模型的方法可以包括:获取目标场所的多个历史关键词,其中,多个历史关键词是通过对目标场所的历史音频数据进行语音识别,得到多个历史文本,再对每个历史文本进行语义分析所得到的;将每个历史关键词和词库中的每个目标关键词作为一个关键词组,得到多个关键词组,其中,每个目标关键词为目标场所在发生异常行为时所产生的;计算每个关键词组中的历史关键词和目标关键词之间的相似度,得到多个第二相似度;基于多个关键词组和对应的多个第二相似度对初始模型进行训练,得到目标模型。
示例性地,参阅图4,图4为本申请实施例提供的一种构建目标模型的流程示意图,如图4所示,将目标场所的多个历史关键词即图4中的m个历史关键词中的每个历史关键词,和词库中的(6*n)个目标关键词中的每个目标关键词作为一个关键词组,得到(6*n*m)个关键词组;然后计算每个关键词组中的历史关键词和目标关键词之间的相似度,得到(6*n*m)个第二相似度;然后基于(6*n*m)个关键词组和对应的(6*n*m)个第二相似度训练初始模型,得到目标模型。
S14:根据每个第一关键词对应的第一相似度,对M个行为人中的每个行为人对应的多个第一关键词进行过滤,得到多个第二关键词。
示例性地,比较每个行为人对应的多个第一关键词中的每个第一关键词所对应的第一相似度与阈值的大小,将小于阈值的第一相似度所对应的第一关键词过滤,得到多个候选关键词;然后将多个行为人中每个行为人对应的多个候选关键词均作为第二关键词,得到多个第二关键词。通过对多个第一关键词进行过滤,得到多个第二关键词,减少了关键词的数量,提高了判断异常行为的速率以及准确度。
S15:根据多个第二关键词,确定是否存在异常行为。
在一种可选的实施例中,步骤S15可以包括步骤S21-S23:
S21:对多个第二关键词进行分类,得到多个关键词群。
其中,每个关键词群包含多个第二关键词中的一个或多个,且每个关键词群中的关键词相同。也即是说,按照关键词是否相同,对多个第二关键词进行分类,将相同的一个或多个第二关键词作为一个关键词群。
S22:根据多个关键词群的数量、多个第二关键词的数量、每个关键词群中的关键词的数量以及每个关键词群对应的权重,得到第一预测值。
其中,第一预测值可以通过公式(1)得到:
Figure BDA0003893599890000061
其中,F为第一预测值,n为多个关键词群的数量,A为多个关键词的数量,Bi为第i个关键词群中的关键词的数量,Pi为第i个关键词群对应的权重,X>1。
S23:根据第一预测值,确定是否存在异常行为。
第一预测值可以表征发生异常行为的概率。示例性地,将第一预测值和预设阈值进行比较,若第一预测值大于或者等于预设阈值,则确定存在异常行为。
当然,在一种可选的实施例中,在根据第一预测值,确定是否存在异常行为之前,还可以对音频数据进行预处理,得到第一音频,比如,可以对音频数据进行去噪、预加重等等,本申请对预处理不作限定。然后,对第一音频进行分段处理,得到多个音频段;然后对每个音频段进行特征提取,得到每个音频段的语速特征和声音响度特征;基于每个音频段的语速特征和声音响度特征,得到每个音频段的情绪类别;然后根据情绪类别预设的情绪值,得到每个音频段的第一情绪值;然后将多个音频段对应的多个第一情绪值求平均,得到第二情绪值。
示例性地,参阅图5,图5为本申请实施例提供的对第一音频进行处理,得到第二情绪值的示意图,如图5所示,对第一音频进行分段,得P个音频段;然后将P个音频段输入第一特征提取层,得到P个语速特征,将P个音频段输入第二特征提取层,得到P个声音响度特征,其中,P个语速特征和P个声音响度特征一一对应,第一特征提取层用于对每个音频段进行语速特征的提取,第二特征提取层用于对每个音频段进行声音响度特征的提取。然后将P个语速特征和P个声音响度特征输入深度学***静、开心”,然后为每个语速特征和声音响度特征设置权重,且每个情绪类别设置一个阈值区间。因此,将每个语速特征和对应的声音响度特征进行加权,得到P个目标值;然后将每个目标值与情绪类别的阈值区间进行比对,将每个目标值所属的阈值区间所对应的情绪类别作为该目标值对应的情绪类别,进而得到第一音频段的P个情绪类别。然后,基于P个情绪类别和每个情绪类别预设的情绪值,得到P个情绪类别对应的P个第一情绪值;然后将P个第一情绪值求平均,得到第二情绪值。
然后根据第一预测值、第二情绪值、第一预测值对应的第一权重系数以及第二情绪值对应的第二权重系数,确定是否存在异常行为,也即是说,对第二情绪值和第一预测值进行加权,得到一个目标值,然后将目标值与阈值进行比较,若该目标值大于或者等于阈值,则可以确定存在异常行为。
应说明,基于第一预测值和第二情绪值双重条件判断是否存在异常行为,提升了判断异常行为的准确度。
304:若存在异常行为,预警装置生成预警语音。
其中,预警语音用于提示目标场所即将发生异常事件,预警语音的形式可以是文本形式,也可以是音频形式,本申请对预警语音的形式不作限定。
305:预警装置向音频设备发送预警语音。
其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值。
在一种可选的实施例中,步骤305中向音频设备发送预警语音,可以包括:根据M,确定异常行为的危险等级;根据危险等级,确定频率播放参数;向音频设备发送预警语音和频率播放参数,以通过音频设备按照音频播放参数播放预警语音。通过确定异常行为的危险等级,进而确定频率播放参数,可以提醒向目标场所相关人员该异常行为的危险等级,进而做出相应的应对措施,减少损害。
在一种可选的实施例中,步骤305中向音频设备发送预警语音,还可以包括:对预警语音进行数字化,得到第一音频;对第一音频进行压缩编码,例如OPUS编码,得到第二音频;对第二音频进行信道编码,例如FEC编码,得到第三音频,向音频设备发送第三音频,以使音频设备在接收第三音频后播放预警语音。
306:音频设备播放预警语音。
示例性地,当音频设备的接收端在接收到第三音频后,对第三音频进行信道解码,得到第二音频;对第二音频进行压缩解码,得到第一音频;对第一音频进行模拟化,得到预警语音,然后音频设备播放该预警语音。
可以看出,在本申请实施例中,从音频采集装置获取目标场所的音频数据;然后对音频数据进行异常分析,以确定是否存在异常行为;若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;然后向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值,通过对音频数据进行异常分析得到的预警语音,然后向音频设备发送预警语音,通过智能分析音频数据,判断是否存在异常行为,节约了人力资源;同时借助Lora协议传输预警语音,提高了传输的效率,进一步提高了通知目标场所的相关人员存在异常行为的速度,使得相关人员对异常行为及时做出应对措施,减少损害。
参阅图6,图6为本申请实施例提供的一种预警装置的功能单元组成框图。预警装置600包括:收发单元601和处理单元602;
收发单元601,用于从音频采集装置获取目标场所的音频数据;
获取目标场所的历史视频,其中,历史视频记录了目标场所发生的历史异常行为;
处理单元602,用于对音频数据进行异常分析,以确定是否存在异常行为;
若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;
收发单元601,用于向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值。
在本申请的一个实施方式中,在对音频数据进行异常分析之前方面,处理单元602,具体用于:
从音频采集装置接收第一音频数据;
对第一音频数据进行信道解码,得到第二音频数据;
对第二音频数据进行压缩解码,得到第三音频数据;
对第三音频数据进行模拟化,得到音频数据。
在本申请的一个实施方式中,在对音频数据进行异常分析,以确定是否存在异常行为方面,处理单元602,具体用于:
对音频数据进行语音识别,得到多个第一文本,其中,多个第一文本对应音频数据中的M个行为人;
将每个第一文本输入深度学习模型中进行语义分析,得到多个第一关键词;
将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度;
根据每个第一关键词对应的第一相似度,对M个行为人中的每个行为人对应的多个第一关键词进行过滤,得到多个第二关键词;
根据多个第二关键词,确定是否存在异常行为。
在本申请的一个实施方式中,在将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度之前方面,处理单元602,具体用于:
获取目标场所的多个历史关键词;
将每个历史关键词和词库中的每个目标关键词作为一个关键词组,得到多个关键词组,其中,每个目标关键词为目标场所在发生异常行为时所产生的;
计算每个关键词组中的历史关键词和目标关键词之间的相似度,得到多个第二相似度;
基于多个关键词组和对应的多个第二相似度对初始模型进行训练,得到目标模型。
在本申请的一个实施方式中,在根据多个第二关键词,确定是否存在异常行为方面,处理单元602,具体用于:
对多个第二关键词进行分类,得到多个关键词群,其中,每个关键词群包含多个第二关键词中的一个或多个,且每个关键词群中的关键词相同;
根据多个关键词群的数量、多个第二关键词的数量、每个关键词群中的关键词的数量以及每个关键词群对应的权重,得到第一预测值;
根据第一预测值,确定是否存在异常行为;
其中,第一预测值可以通过公式(2)得到:
Figure BDA0003893599890000091
其中,F为第一预测值,n为多个关键词群的数量,A为多个关键词的数量,Bi为第i个关键词群中的关键词的数量,Pi为第i个关键词群对应的权重,X>1。
在本申请的一个实施方式中,在根据第一预测值,确定是否存在异常行为之前方面,处理单元602,具体用于:
对音频数据进行预处理,得到第一音频;
对第一音频进行分段处理,得到多个音频段;
对每个音频段进行特征提取,得到每个音频段的语速特征和声音响度特征;
基于每个音频段的语速特征和声音响度特征,得到每个音频段的情绪类别;
根据情绪类别预设的情绪值,得到每个音频段的第一情绪值;
将多个音频段对应的多个第一情绪值求平均,得到第二情绪值;
在根据所述第一预测值,确定是否存在所述异常行为方面,处理单元602,具体用于:
根据第一预测值、第二情绪值、第一预测值对应的第一权重系数以及第二情绪值对应的第二权重系数,确定是否存在异常行为。
在本申请的一个实施方式中,在向音频设备发送预警语音方面,处理单元602,具体用于:
根据M,确定异常行为的危险等级;
根据危险等级,确定频率播放参数;
收发单元601向音频设备发送预警语音和频率播放参数,以通过音频设备按照音频播放参数播放预警语音。
参阅图7,图7为本申请实施例提供的一种电子设备的结构示意图。如图7所示,电子设备700包括收发器701、处理器702和存储器703。它们之间通过总线704连接。存储器703用于存储计算机程序和数据,并可以将存储器703存储的数据传输给处理器702。
处理器702用于读取存储器703中的计算机程序执行以下操作:
控制收发器701从音频采集装置获取目标场所的音频数据;
对音频数据进行异常分析,以确定是否存在异常行为;
若存在异常行为,生成预警语音,其中,预警语音用于提示目标场所即将发生异常事件;
控制收发器701向音频设备发送预警语音,以通过音频设备播放预警语音,其中,音频设备的安装位置与音频采集装置之间的距离大于第一阈值。
在本申请的一个实施方式中,在对音频数据进行异常分析之前方面,处理器702,具体用于执行以下步骤:
从音频采集装置接收第一音频数据;
对第一音频数据进行信道解码,得到第二音频数据;
对第二音频数据进行压缩解码,得到第三音频数据;
对第三音频数据进行模拟化,得到音频数据。
在本申请的一个实施方式中,在对音频数据进行异常分析,以确定是否存在异常行为方面,处理器702,具体用于执行以下步骤:
对音频数据进行语音识别,得到多个第一文本,其中,多个第一文本对应音频数据中的M个行为人;
将每个第一文本输入深度学习模型中进行语义分析,得到多个第一关键词;
将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度;
根据每个第一关键词对应的第一相似度,对M个行为人中的每个行为人对应的多个第一关键词进行过滤,得到多个第二关键词;
根据多个第二关键词,确定是否存在异常行为。
在本申请的一个实施方式中,在将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度之前方面,处理器702,具体用于执行以下步骤:
获取目标场所的多个历史关键词;
将每个历史关键词和词库中的每个目标关键词作为一个关键词组,得到多个关键词组,其中,每个目标关键词为目标场所在发生异常行为时所产生的;
计算每个关键词组中的历史关键词和目标关键词之间的相似度,得到多个第二相似度;
基于多个关键词组和对应的多个第二相似度对初始模型进行训练,得到目标模型。
在本申请的一个实施方式中,在根据多个第二关键词,确定是否存在异常行为方面,处理器702,具体用于执行以下步骤:
对多个第二关键词进行分类,得到多个关键词群,其中,每个关键词群包含多个第二关键词中的一个或多个,且每个关键词群中的关键词相同;
根据多个关键词群的数量、多个第二关键词的数量、每个关键词群中的关键词的数量以及每个关键词群对应的权重,得到第一预测值;
根据第一预测值,确定是否存在异常行为;
其中,第一预测值可以通过公式(3)得到:
Figure BDA0003893599890000111
其中,F为第一预测值,n为多个关键词群的数量,A为多个关键词的数量,Bi为第i个关键词群中的关键词的数量,Pi为第i个关键词群对应的权重,X>1。
在本申请的一个实施方式中,在根据第一预测值,确定是否存在异常行为之前方面,处理器702,具体用于执行以下步骤:
对音频数据进行预处理,得到第一音频;
对第一音频进行分段处理,得到多个音频段;
对每个音频段进行特征提取,得到每个音频段的语速特征和声音响度特征;
基于每个音频段的语速特征和声音响度特征,得到每个音频段的情绪类别;
根据情绪类别预设的情绪值,得到每个音频段的第一情绪值;
将多个音频段对应的多个第一情绪值求平均,得到第二情绪值;
在根据第一预测值,确定是否存在异常行为方面,处理器702,具体用于执行以下步骤:
根据第一预测值、第二情绪值、第一预测值对应的第一权重系数以及第二情绪值对应的第二权重系数,确定是否存在异常行为。
在本申请的一个实施方式中,在向音频设备发送预警语音方面,处理器702,具体用于执行以下步骤:
根据M,确定异常行为的危险等级;
根据危险等级,确定频率播放参数;
控制收发器701向音频设备发送预警语音和频率播放参数,以通过音频设备按照音频播放参数播放预警语音。
具体地,上述收发器701可为图6的实施例的预警装置600的收发单元601,上述处理器702可以为图6的实施例的预警装置600的处理单元602。
应理解,本申请中的电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(MobileInternet Devices,简称:MID)或穿戴式设备等。上述电子设备仅是举例,而非穷举,包含但不限于上述电子设备。在实际应用中,上述电子设备还可以包括:智能车载终端、计算机设备等等。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种预警方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种预警方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种预警方法,其特征在于,所述方法包括:
从音频采集装置获取目标场所的音频数据;
对所述音频数据进行异常分析,以确定是否存在异常行为;
若存在所述异常行为,生成预警语音,其中,所述预警语音用于提示所述目标场所即将发生异常事件;
向音频设备发送所述预警语音,以通过所述音频设备播放所述预警语音,其中,所述音频设备的安装位置与所述音频采集装置之间的距离大于第一阈值。
2.根据权利要求1所述的方法,其特征在于,所述从音频采集装置获取目标场所的音频数据,包括:
从所述音频采集装置接收第一音频数据,其中,所述第一音频数据是通过所述音频采集装置对第二音频数据进行信道编码得到,所述第二音频数据是通过所述音频采集装置对第三音频数据进行压缩编码得到,所述第三音频数据是通过所述音频采集装置对所述音频数据进行数字化得到;
对所述第一音频数据进行信道解码,得到所述第二音频数据;
对所述第二音频数据进行压缩解码,得到所述第三音频数据;
对所述第三音频数据进行模拟化,得到所述音频数据。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述音频数据进行异常分析,以确定是否存在所述异常行为,包括:
对所述音频数据进行语音识别,得到多个第一文本,其中,多个第一文本对应所述音频数据中的M个行为人;
将每个第一文本输入深度学习模型中进行语义分析,得到多个第一关键词;
将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度;
根据所述每个第一关键词对应的第一相似度,对所述M个行为人中的每个行为人对应的多个第一关键词进行过滤,得到多个第二关键词;
根据所述多个第二关键词,确定是否存在所述异常行为。
4.根据权利要求3所述的方法,其特征在于,在所述将每个行为人对应的多个第一关键词输入目标模型,得到每个第一关键词对应的第一相似度之前,所述方法还包括:
获取所述目标场所的多个历史关键词;
将每个历史关键词和词库中的每个目标关键词作为一个关键词组,得到多个关键词组,其中,每个目标关键词为所述目标场所在发生异常行为时所产生的;
计算每个关键词组中的历史关键词和目标关键词之间的相似度,得到多个第二相似度;
基于所述多个关键词组和对应的所述多个第二相似度对初始模型进行训练,得到所述目标模型。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述多个第二关键词,确定是否存在所述异常行为,包括:
对所述多个第二关键词进行分类,得到多个关键词群,其中,每个关键词群包含所述多个第二关键词中的一个或多个,且每个关键词群中的关键词相同;
根据所述多个关键词群的数量、所述多个第二关键词的数量、每个关键词群中的关键词的数量以及每个关键词群对应的权重,得到第一预测值;
根据所述第一预测值,确定是否存在所述异常行为;
其中,所述第一预测值满足以下公式:
Figure FDA0003893599880000021
其中,F为所述第一预测值,n为所述多个关键词群的数量,A为所述多个关键词的数量,Bi为第i个关键词群中的关键词的数量,Pi为第i个关键词群对应的权重,X>1。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述第一预测值,确定是否存在所述异常行为之前,所述方法还包括:
对所述音频数据进行预处理,得到第一音频;
对所述第一音频进行分段处理,得到多个音频段;
对每个音频段进行特征提取,得到每个音频段的语速特征和声音响度特征;
基于所述每个音频段的语速特征和声音响度特征,得到每个音频段的情绪类别;
根据情绪类别预设的情绪值,得到所述每个音频段的第一情绪值;
将所述多个音频段对应的多个第一情绪值求平均,得到第二情绪值;
所述根据所述第一预测值,确定是否存在所述异常行为,包括:
根据所述第一预测值、所述第二情绪值、所述第一预测值对应的第一权重系数以及所述第二情绪值对应的第二权重系数,确定是否存在异常行为。
7.根据权利要求4-6任一项所述的方法,其特征在于,所述向音频设备发送所述预警语音,包括:
根据所述M,确定所述异常行为的危险等级;
根据所述危险等级,确定频率播放参数;
向所述音频设备发送所述预警语音和所述频率播放参数,以通过所述音频设备按照所述频率播放参数播放所述预警语音。
8.一种预警装置,其特征在于,所述装置包括:收发单元和处理单元;
所述收发单元,通过音频采集装置获取目标场所的音频数据;
所述处理单元,对所述音频数据进行异常分析,以确定是否存在异常行为;
若存在所述异常行为,生成预警语音,其中,所述预警语音用于提示所述目标场所即将发生异常事件;
向音频设备发送所述预警语音,以通过所述音频设备播放所述预警语音,其中,所述音频设备的安装位置与所述音频采集装置之间的距离大于第一阈值。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述处理器与所述存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7中任一项所述的方法。
CN202211266706.3A 2022-10-17 2022-10-17 预警方法、装置、电子设备及存储介质 Pending CN115547360A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211266706.3A CN115547360A (zh) 2022-10-17 2022-10-17 预警方法、装置、电子设备及存储介质
PCT/CN2023/117773 WO2024082865A1 (zh) 2022-10-17 2023-09-08 预警方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211266706.3A CN115547360A (zh) 2022-10-17 2022-10-17 预警方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115547360A true CN115547360A (zh) 2022-12-30

Family

ID=84735267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211266706.3A Pending CN115547360A (zh) 2022-10-17 2022-10-17 预警方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN115547360A (zh)
WO (1) WO2024082865A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116092280A (zh) * 2023-02-07 2023-05-09 深圳市冠标科技发展有限公司 一种基于远程通信的监督方法及装置
WO2024082865A1 (zh) * 2022-10-17 2024-04-25 广西翰霖科技有限公司 预警方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111275909B (zh) * 2018-12-04 2021-12-28 阿里巴巴集团控股有限公司 一种安防预警方法及装置
CN109634554B (zh) * 2018-12-18 2023-05-26 三星电子(中国)研发中心 用于输出信息的方法和装置
CN115188169B (zh) * 2022-07-11 2024-07-05 山西华兴科软有限公司 一种基于物联网的宿管安全预警***及应用方法
CN115547360A (zh) * 2022-10-17 2022-12-30 广西翰霖科技有限公司 预警方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024082865A1 (zh) * 2022-10-17 2024-04-25 广西翰霖科技有限公司 预警方法、装置、电子设备及存储介质
CN116092280A (zh) * 2023-02-07 2023-05-09 深圳市冠标科技发展有限公司 一种基于远程通信的监督方法及装置
CN116092280B (zh) * 2023-02-07 2024-07-19 深圳市冠标科技发展有限公司 一种基于远程通信的监督方法及装置

Also Published As

Publication number Publication date
WO2024082865A1 (zh) 2024-04-25

Similar Documents

Publication Publication Date Title
CN115547360A (zh) 预警方法、装置、电子设备及存储介质
US11355138B2 (en) Audio scene recognition using time series analysis
CN108564941A (zh) 语音识别方法、装置、设备及存储介质
US20190392858A1 (en) Intelligent voice outputting method, apparatus, and intelligent computing device
CN103500579B (zh) 语音识别方法、装置及***
CN115828112B (zh) 一种故障事件的响应方法、装置、电子设备及存储介质
CN111009238B (zh) 一种拼接语音的识别方法和装置以及设备
CN107122807A (zh) 一种家庭监控方法、服务端及计算机可读存储介质
CN114004210A (zh) 基于神经网络的应急预案生成方法、***、设备及介质
CN109065036A (zh) 语音识别的方法、装置、电子设备及计算机可读存储介质
CN106710588A (zh) 语音数据句类识别方法和装置及***
CN112579744B (zh) 一种在线心理咨询中风险控制的方法
CN113345210B (zh) 一种基于音视频智能判断呼救的方法及装置
CN113099283B (zh) 监控画面和声音同步的方法及相关设备
CN111934800A (zh) 一种广播内容监测方法及***
CN111161759B (zh) 音频质量评价方法、装置、电子设备及计算机存储介质
CN112863492A (zh) 声音事件定位模型训练方法和装置
CN113011875A (zh) 文本处理方法、装置、计算机设备以及存储介质
CN111583608A (zh) 一种基于语音识别、区块链的随身gps报警***及方法
CN117636909B (zh) 一种数据处理方法、装置、设备以及计算机可读存储介质
CN117792547B (zh) 一种应急广播终端安装的判定方法、装置、设备和介质
CN212933746U (zh) 一种基于语音识别、区块链的随身gps报警***
CN113920473B (zh) 完整事件确定方法、存储介质及电子装置
CN210835130U (zh) 一种铁路信号电缆绝缘测试***
CN117633864A (zh) 操作行为的检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination