CN112511698B - 一种基于通用边界检测的实时通话分析方法 - Google Patents

一种基于通用边界检测的实时通话分析方法 Download PDF

Info

Publication number
CN112511698B
CN112511698B CN202011396489.0A CN202011396489A CN112511698B CN 112511698 B CN112511698 B CN 112511698B CN 202011396489 A CN202011396489 A CN 202011396489A CN 112511698 B CN112511698 B CN 112511698B
Authority
CN
China
Prior art keywords
boundary
starting
call
speaking
judging whether
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011396489.0A
Other languages
English (en)
Other versions
CN112511698A (zh
Inventor
刘郁松
何国涛
蒲瑶
李全忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Original Assignee
Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Puqiang Times Zhuhai Hengqin Information Technology Co ltd filed Critical Puqiang Times Zhuhai Hengqin Information Technology Co ltd
Priority to CN202011396489.0A priority Critical patent/CN112511698B/zh
Publication of CN112511698A publication Critical patent/CN112511698A/zh
Application granted granted Critical
Publication of CN112511698B publication Critical patent/CN112511698B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2227Quality of service monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5175Call or contact centers supervision arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供一种基于通用边界检测的实时通话分析方法,方法包括:第一步:通用边界检测;主要包括:判断此边界是否为开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;判断该角色是否有其他角色的开始边界;判断该角色是否记录了开始边界;判断是否有其他角色的开始边界;判断是不是通话的最后一个边界。第二步:基于边界检测的静音分析、抢插话分析,主要包括:判断边界类型;判断一个人说话的时长是否大于最小静音下限;判断两个人说话的时长是否大于插话最小持续时间下限。本发明通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测,使得对时间边界进行一次分析即可完成全类别结果输出。

Description

一种基于通用边界检测的实时通话分析方法
技术领域
本发明属于通讯监听技术领域,具体涉及一种基于通用边界检测的实时通话分析方法。
背景技术
通讯监听技术领域中的实时通话分析主要包括静音分析、抢插话分析。静音分析指对通话过程中发生的超长静音事件进行分析。在业务应用中静音分析结果数据需要包含静音所属的角色信息,用于做不同的处理,例如坐席产生的静音用于评估坐席的服务质量,而客户的静音则往往忽略掉。呼叫中心场景下的静音分析基于“问题对话”模型,即假设说话结束时,说话方发出了一个提问,将说话结束作为静音的开始,当下一句话开始时,将说话开始作为静音的结束,其中静音的所属角色记为说话开始方。抢插话分析分为抢话分析和插话分析,其中抢话分析指一方说话开始和另一方说话结束的间隔太短,判定为发生了抢话。说话间隔太短,会被客户认为说话风格具有进攻性,且没有经过思考和理解,容易答非所问。在部分对坐席服务质量要求很高的呼叫中心坐席抢了客户的话被认定为服务态度不友好。插话分析指两方出现了同时说话的情况,这其中往往表现为争吵、故意打断客户说话,在呼叫中心发生插话被认定为严重服务质量问题。
现有技术中,独立的静音分析、抢话分析、插话分析、正常边界检测执行过程,需要在各自算法中完成边界扫描和比对,重复运算过多。以人工分配方式进行,存在以下不足:
1)实时通话检测采用独立的检测算法,独立的重复运算过多,运算性能低下;
2)离线边界分析技术,无法在通话进行中实时通话边界的检测,适用范围不广。
为此,本发明提供了一种基于通用边界检测的实时通话分析方法,用于解决电话***接入实时分析***后,通过一套方法同时完成静音、抢话、插话、正常说话始终类型的边界检测,使得对时间边界进行一次分析即可完成全类别结果输出。
发明内容
针对现有技术存在的问题为此,本发明提出了一种基于通用边界检测的实时通话分析方法,满足实时通话监听需要。所述方法包括如下步骤:
第一步:通用边界检测
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step2,如果是结束边界,执行step 4;
step2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step1;当该角色没有记录开始边界时,则执行step 3;
step3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step1,等待新的边界输入;当该角色记录开始边界时,执行step5;
step5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段;
第二步:基于边界检测的静音分析、抢插话分析
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束;
与现有方法相比,本发明具有以下优势:
(1)本发明一次分析即可完成全类别结果输出,其中时间边界只需要进行一次扫描,边界匹配和比对过程仅执行一次,本发明相比独立的检测算法具有2-4倍的性能提升。
(2)本发明提供算法可以同步执行,相比离线边界分析技术,适用范围更广。
附图说明
图1通用边界检测流程示意图;
图2基于边界检测的静音分析、抢插话分析流程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
第一步:通用边界检测,参见附图1所示:
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step 2,如果是结束边界,执行step 4;
step 2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step 1;当该角色没有记录开始边界时,则执行step 3;
step 3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step 4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step 1,等待新的边界输入;当该角色记录开始边界时,执行step 5;
step 5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step 6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段。
第二步:基于边界检测的静音分析、抢插话分析,参见附图2所示:
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束。
两种分析算法均基于句子边界,考虑到实时分析的高时效性要求,在一次边界分析过程中同时完成静音分析、抢插话分析有利于提高分析性能。
本发明提出一种通用的边界分析方法,通过将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段。其中没有人说话的片段中,当片段时长大于一个下限(如1秒),则可判定为静音片段,当片段时长小于一个上限(如500ms),则可判定为抢话片段,2个人说话的片段可判断为发生了插话。一个人说话的片段可忽略。
以上所述之实施例仅为本发明的较佳实施例,并非对本发明做任何形式上的限制。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,利用上述揭示的技术内容对本发明技术方案作出更多可能的变动和润饰,或修改均为本发明的等效实施例。故凡未脱离本发明技术方案的内容,依据本发明之思路所作的等同等效变化,均应涵盖于本发明的保护范围内。

Claims (1)

1.一种基于通用边界检测的实时通话分析方法,其特征在于,所述方法包括如下步骤:
第一步:通用边界检测
step1,开始等待新的边界,输入一个边界,判断此边界是否为开始边界,如果是开始边界执行step 2,如果是结束边界,执行step 4;
step 2,对于开始边界,判断拥有该开始边界的角色是否已经记录了开始边界;当该角色已经记录了开始边界时,则此开始边界为异常边界,返回执行step 1;当该角色没有记录开始边界时,则执行step 3;
step 3,判断该角色是否有其他角色的开始边界;当有其他角色的开始边界时,则检测到一个人说话的片段,而后保存该角色说话的开始边界;当没有其他角色的开始边界时,检测到没有人说话片段,而后保存该角色说话的开始边界;而后执行step 6;
step 4,判断该角色是否记录了开始边界;当该角色没有记录开始边界时,则认为此结束边界为异常边界,返回执行step 1,等待新的边界输入;当该角色记录开始边界时,执行step 5;
step 5,判断是否有其他角色的开始边界;当没有其他角色的开始边界时,检测到一个人说话的片段,而后删除该角色说话的开始边界;当有其他角色的开始边界时,检测到两个人说话的片段,而后删除该角色说话的开始边界;而后执行step 6;
step 6,判断是不是通话的最后一个边界;当是通话的最后一个边界时,检测结束;当不是通话的最后一个边界时,返回step 1,等待新的边界输入;
通过通用边界分析将整个通话中的事件片段分解为:没有人说话的片段、1个人说话的片段、2个人说话的片段;
第二步:基于边界检测的静音分析、抢插话分析
step 7,判断边界类型;当边界类型为无人说话的边界时,直接结束;当边界类型为一个人说话的边界时,执行step 8;当边界类型为两个人说话的边界时,执行step 9;
step 8,判断一个人说话的时长是否大于最小静音下限;当时长大于最小静音下限时,输出异常静音结果,然后结束;当时长小于或等于最小静音下限时,判断时长是否小于抢话间隔上限;当时长小于抢话间隔上限时,输出抢话结果,然后结束;当时长大于或等于抢话间隔上限时,执行结束;
step 9,判断两个人说话的时长是否大于插话最小持续时间下限;当时长大于插话最小持续时间下限时,则输出插话结果,然后结束;当时长小于或等于插话最小持续时间下限时,直接结束。
CN202011396489.0A 2020-12-03 2020-12-03 一种基于通用边界检测的实时通话分析方法 Active CN112511698B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011396489.0A CN112511698B (zh) 2020-12-03 2020-12-03 一种基于通用边界检测的实时通话分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011396489.0A CN112511698B (zh) 2020-12-03 2020-12-03 一种基于通用边界检测的实时通话分析方法

Publications (2)

Publication Number Publication Date
CN112511698A CN112511698A (zh) 2021-03-16
CN112511698B true CN112511698B (zh) 2022-04-01

Family

ID=74969560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011396489.0A Active CN112511698B (zh) 2020-12-03 2020-12-03 一种基于通用边界检测的实时通话分析方法

Country Status (1)

Country Link
CN (1) CN112511698B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066496A (zh) * 2021-03-17 2021-07-02 浙江百应科技有限公司 一种音频中对话双方抢话分析方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4221537B2 (ja) * 2000-06-02 2009-02-12 日本電気株式会社 音声検出方法及び装置とその記録媒体
JP5369055B2 (ja) * 2010-06-08 2013-12-18 日本電信電話株式会社 通話単位検出装置、方法及びプログラム
US8681950B2 (en) * 2012-03-28 2014-03-25 Interactive Intelligence, Inc. System and method for fingerprinting datasets
CN102982811B (zh) * 2012-11-24 2015-01-14 安徽科大讯飞信息科技股份有限公司 一种基于实时解码的语音端点检测方法
US9596349B1 (en) * 2015-06-29 2017-03-14 State Farm Mutual Automobile Insurance Company Voice and speech recognition for call center feedback and quality assurance
CN105895116B (zh) * 2016-04-06 2020-01-03 普强信息技术(北京)有限公司 一种双声道语音的抢插话分析方法
CN106847270B (zh) * 2016-12-09 2020-08-18 华南理工大学 一种双门限地名语音端点检测方法
CN108630193B (zh) * 2017-03-21 2020-10-02 北京嘀嘀无限科技发展有限公司 语音识别方法及装置
CN110400100A (zh) * 2019-08-15 2019-11-01 圆通速递有限公司 一种客服质量实时监控***和方法
CN111145782B (zh) * 2019-12-20 2021-07-13 深圳追一科技有限公司 重叠语音识别方法、装置、计算机设备和存储介质
CN111210842B (zh) * 2019-12-27 2023-04-28 中移(杭州)信息技术有限公司 语音质检方法、装置、终端及计算机可读存储介质
CN111147669A (zh) * 2019-12-30 2020-05-12 科讯嘉联信息技术有限公司 一种全量实时自动服务质检***和方法
CN111835925A (zh) * 2020-06-16 2020-10-27 杭州云嘉云计算有限公司 一种面向呼叫中心的离线语音质检及分析***
CN111881272A (zh) * 2020-07-09 2020-11-03 普强时代(珠海横琴)信息技术有限公司 一种电话服务实时预警***和预警方法
CN111951831A (zh) * 2020-08-24 2020-11-17 浙江百应科技有限公司 一种基于ai实现音频质检的方法

Also Published As

Publication number Publication date
CN112511698A (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN108962282B (zh) 语音检测分析方法、装置、计算机设备及存储介质
US10410636B2 (en) Methods and system for reducing false positive voice print matching
US9571638B1 (en) Segment-based queueing for audio captioning
US9412371B2 (en) Visualization interface of continuous waveform multi-speaker identification
US7069218B2 (en) System and method for detection and analysis of audio recordings
CN110177182B (zh) 敏感数据处理方法、装置、计算机设备及存储介质
KR101795593B1 (ko) 전화상담원 보호 장치 및 그 방법
US20110218798A1 (en) Obfuscating sensitive content in audio sources
CN108010513B (zh) 语音处理方法及设备
CN112468659B (zh) 应用于电话客服的质量评价方法、装置、设备及存储介质
US11375062B2 (en) Systems for detecting harassing communication
CN112511698B (zh) 一种基于通用边界检测的实时通话分析方法
US8949134B2 (en) Method and apparatus for recording/replaying application execution with recorded voice recognition utterances
US10924611B2 (en) Voice recognition system and call evaluation setting method
CN113542509B (zh) 一种应急处理方法、装置、存储介质和设备
CN112565242B (zh) 基于声纹识别的远程授权方法、***、设备及存储介质
CN107645613A (zh) 服务转接的方法和装置
CN111565254B (zh) 通话数据质检方法、装置、计算机设备和存储介质
JP6733901B2 (ja) 心理分析装置、心理分析方法、およびプログラム
US8051026B2 (en) Rules collector system and method with user interaction
CN113810548A (zh) 基于iot的智能通话质检方法***
CN111582708A (zh) 医疗信息的检测方法、***、电子设备及计算机可读存储介质
CN113286035B (zh) 异常呼叫检测方法、装置、设备及介质
CN113178196B (zh) 音频数据提取方法、装置、计算机设备和存储介质
CN115766943A (zh) 通话未接通状态的确定方法及装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Real Time Call Analysis Method Based on Universal Boundary Detection

Effective date of registration: 20230414

Granted publication date: 20220401

Pledgee: Hengqin Guangdong Macao Deep Cooperation Zone Branch of Guangdong Shunde Rural Commercial Bank Co.,Ltd.

Pledgor: Puqiang times (Zhuhai Hengqin) Information Technology Co.,Ltd.

Registration number: Y2023980038072