CN113065328A - 一种基于正则和文本截断的对话内容分析方法 - Google Patents

一种基于正则和文本截断的对话内容分析方法 Download PDF

Info

Publication number
CN113065328A
CN113065328A CN202110366084.0A CN202110366084A CN113065328A CN 113065328 A CN113065328 A CN 113065328A CN 202110366084 A CN202110366084 A CN 202110366084A CN 113065328 A CN113065328 A CN 113065328A
Authority
CN
China
Prior art keywords
conversation
text
regular
content analysis
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110366084.0A
Other languages
English (en)
Inventor
董金杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Baiying Technology Co Ltd
Original Assignee
Zhejiang Baiying Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Baiying Technology Co Ltd filed Critical Zhejiang Baiying Technology Co Ltd
Priority to CN202110366084.0A priority Critical patent/CN113065328A/zh
Publication of CN113065328A publication Critical patent/CN113065328A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种基于正则和文本截断的对话内容分析方法,本方案能够带来以下好处:该方案以作为插件的形式放入工作手机来进行工作,能够做到多机互换通用;通过人工对话,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,能够减少人工成本,避免不必要的重复劳动;通过人机对话,避免纯人工的对话造成误判等问题,减少对话内容分析来说可能造成误差;通过人机对话,提高对话效率,解决了人工对话内容分析无法较快的反馈***从而介入到对话,避免对对话进行干涉;在对话内容分析的交互体验、对话分析速度和准确度上进行大大提高。

Description

一种基于正则和文本截断的对话内容分析方法
技术领域
本发明属于软件领域,涉及一种基于正则和文本截断的对话内容分析方法。
背景技术
目前,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,对于人力消耗上成本较高,而且对质检员来说,重复的劳动没有很好的实现个人价值,也容易造成身心的疲惫。
纯人工的对话内容分析可能偏主观,容易造成误判等,对于对话内容分析来说可能造成误差。
人工对话内容分析无法较快的反馈***从而介入到对话,对对话进行干涉。
综上,现有方案在对话内容分析的交互体验、对话分析速度和准确度上仍有待提高。
发明内容
鉴于现有技术中所存在的问题,本发明采用的技术方案是一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:
步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则;
步骤二,将输入的对话音频文件或者音频流转换为对话文本内容;
步骤三,获取对话分析规则中的正则规则,按顺序采用第一组正则规则对对话文本进行遍历,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;
步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历。
作为本发明的一种优选方案,所述对话音频文件或者音频流通过asr转换为对话文本内容。
作为本发明的一种优选方案,所述的界面为展示对话的交互界面或前端界面。
作为本发明的一种优选方案,所述对话的音频流或者音频文件经过格式转换后,同步或异步进行对话内容分析,并通过接口同步返回或者接口推送异步返回记录。
本发明的有益效果:本方案能够带来以下好处:
1.该方案以作为插件的形式放入工作手机来进行工作,能够做到多机互换通用;
2.通过人工对话,针对语音质检和通话音频分析大部分通过人力重复听来进行对话内容的分析,能够减少人工成本,避免不必要的重复劳动;
3.通过人机对话,避免纯人工的对话造成误判等问题,减少对话内容分析来说可能造成误差;
4.通过人机对话,提高对话效率,解决了人工对话内容分析无法较快的反馈***从而介入到对话,避免对对话进行干涉;
5.在对话内容分析的交互体验、对话分析速度和准确度上进行大大提高。
附图说明
图1为本实用的流程图。
具体实施方式
如图1所示,本发明公开了一种基于正则和文本截断的对话内容分析方法,采用的技术方案是,一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:
步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则,所述的界面为展示对话的交互界面或前端界面;
步骤二,将输入的对话音频文件或者音频流转换为对话文本内容,所述对话音频文件或者音频流通过asr转换为对话文本内容,所述对话的音频流或者音频文件经过格式转换后,同步或异步进行对话内容分析,并通过接口同步返回或者接口推送异步返回记录;
步骤三,获取对话分析规则中的正则规则,所述正则规则为不同的选择性法规的规则列表,按顺序采用第一组正则规则对对话文本进行遍历,确认是否存在句子命中正则规则中的第一条规则,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,直至命中语句或者非命中语句到末尾的文本,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;
步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历,完成后对所有结果进行统计分析,之后输出。
现有对话双方A和B的以下一段对话:
A:你好。
B:你好,我是xxx。
A:你好,我这边是xx的客服,xxx。
A:xxxx。
B:不需要。
A:您可以再考虑下。
这样一段对话文本,一组正则规则为
A:*.客服。
B:你好。
当A的正则命中后,需要把上文的[A:你好,我这边是xx的客服,xxx]这一句的后一句到文本结尾截取出来,否则B:你好,这个正则从头开始遍历也能在B的第一句话命中,这样对话顺序就不是正则规则需要的顺序了
然后非命中语句说话人指的是上文中[A:你好,我这边是xx的客服,xxx]这一句命中了,A为命中语句的说话人B为非命中语句的说话人,这里从B的不需要开始截取而不是从A的[A:你好,我这边是xx的客服,xxx]这里截取是因为示例正则中下一次判断对象为B的说话内容,所以不需要对A的其他语句再做遍历)。
本文中未详细说明的部件为现有技术。
上述虽然对本发明的具体实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化,而不具备创造性劳动的修改或变形仍在本发明的保护范围以内。

Claims (4)

1.一种基于正则和文本截断的对话内容分析方法,其特征在于:以作为插件形式放入工作手机,通过语音质检方式将对话内容进行分析,包含以下步骤:
步骤一,通过界面或者接口创建由正则编写的包含多条正则规则的对话分析规则;
步骤二,将输入的对话音频文件或者音频流转换为对话文本内容;
步骤三,获取对话分析规则中的正则规则,按顺序采用第一组正则规则对对话文本进行遍历,如果第一组正则规则命中对话语句,则将对话语句的下一句至对话结束的对话文本通过文本截断的方式截取出来,并记录这一组正则规则命中,如果第一组正则规则未命中对话语句,则将遍历的所有对话文本截取出来,记录这一组正则规则未命中;
步骤四,下一组正则规则以步骤三的方式将步骤三中截取出来的对话文本进行遍历,以此类推,直到所有正则规则完成遍历。
2.根据权利要求1所述的基于正则和文本截断的对话内容分析方法,其特征在于:所述对话音频文件或者音频流通过asr转换为对话文本内容。
3.根据权利要求1所述的基于正则和文本截断的对话内容分析方法,其特征在于:所述的界面为展示对话的交互界面或前端界面。
4.根据权利要求1所述的基于正则和文本截断的对话内容分析方法,其特征在于:所述对话的音频流或者音频文件经过格式转换后,同步或异步进行对话内容分析,并通过接口同步返回或者接口推送异步返回记录。
CN202110366084.0A 2021-04-06 2021-04-06 一种基于正则和文本截断的对话内容分析方法 Pending CN113065328A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110366084.0A CN113065328A (zh) 2021-04-06 2021-04-06 一种基于正则和文本截断的对话内容分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110366084.0A CN113065328A (zh) 2021-04-06 2021-04-06 一种基于正则和文本截断的对话内容分析方法

Publications (1)

Publication Number Publication Date
CN113065328A true CN113065328A (zh) 2021-07-02

Family

ID=76566003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110366084.0A Pending CN113065328A (zh) 2021-04-06 2021-04-06 一种基于正则和文本截断的对话内容分析方法

Country Status (1)

Country Link
CN (1) CN113065328A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028910A (ja) * 2017-08-03 2019-02-21 株式会社野村総合研究所 対話分析システムおよび対話分析プログラム
CN110929011A (zh) * 2019-11-28 2020-03-27 北京思特奇信息技术股份有限公司 一种对话分析方法、装置和设备
CN110956956A (zh) * 2019-12-13 2020-04-03 集奥聚合(北京)人工智能科技有限公司 基于策略规则的语音识别方法及装置
CN111984779A (zh) * 2020-09-10 2020-11-24 支付宝(杭州)信息技术有限公司 一种对话文本分析方法、装置、设备和可读介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019028910A (ja) * 2017-08-03 2019-02-21 株式会社野村総合研究所 対話分析システムおよび対話分析プログラム
CN110929011A (zh) * 2019-11-28 2020-03-27 北京思特奇信息技术股份有限公司 一种对话分析方法、装置和设备
CN110956956A (zh) * 2019-12-13 2020-04-03 集奥聚合(北京)人工智能科技有限公司 基于策略规则的语音识别方法及装置
CN111984779A (zh) * 2020-09-10 2020-11-24 支付宝(杭州)信息技术有限公司 一种对话文本分析方法、装置、设备和可读介质

Similar Documents

Publication Publication Date Title
CN108962282B (zh) 语音检测分析方法、装置、计算机设备及存储介质
TWI657342B (zh) 一種句子相似度判斷方法
US20180227421A1 (en) System and methods for analyzing online forum language
CN1230764C (zh) 用于语音识别的设备、方法和计算机***
CN102903361A (zh) 一种通话即时翻译***和方法
CA2641853A1 (en) A mass-scale, user-independent, device-independent, voice messaging system
CN111489765A (zh) 一种基于智能语音技术的话务服务质检方法
CN112580367A (zh) 一种话务质检方法及装置
WO2014176983A1 (zh) 显示图像的方法、装置、移动终端及计算机存储介质
CN110705317B (zh) 翻译方法及相关装置
CN106847305A (zh) 一种处理客服电话的录音数据的方法及装置
CN107808660A (zh) 训练神经网络语言模型的方法和装置及语音识别方法和装置
CN111128241A (zh) 语音通话的智能质检方法及***
CN103186522A (zh) 电子设备及其自然语言分析方法
EP2763136B1 (en) Method and system for obtaining relevant information from a voice communication
CN113724709A (zh) 文本内容匹配方法、装置、电子设备及存储介质
CN104461042B (zh) 基于退回键自动进行纠错的日文输入方法及***
CN111062211A (zh) 信息提取方法、装置、电子设备及存储介质
CN113065328A (zh) 一种基于正则和文本截断的对话内容分析方法
JP5910194B2 (ja) 音声対話要約装置、音声対話要約方法およびプログラム
CN110580899A (zh) 语音识别方法及装置、存储介质、计算设备
US7571093B1 (en) Method of identifying duplicate voice recording
CN115101068A (zh) 一种多人对话场景下提高音频转写准确性的方法和***
CN115691500A (zh) 一种基于时延神经网络的电力客服语音识别方法及装置
JP6492698B2 (ja) 情報処理システム、情報処理方法、及び、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination