CN113434670A - 话术文本生成方法、装置、计算机设备和存储介质 - Google Patents

话术文本生成方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113434670A
CN113434670A CN202110692177.2A CN202110692177A CN113434670A CN 113434670 A CN113434670 A CN 113434670A CN 202110692177 A CN202110692177 A CN 202110692177A CN 113434670 A CN113434670 A CN 113434670A
Authority
CN
China
Prior art keywords
text data
text
target
preset
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110692177.2A
Other languages
English (en)
Inventor
张映
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weikun Shanghai Technology Service Co Ltd
Original Assignee
Weikun Shanghai Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weikun Shanghai Technology Service Co Ltd filed Critical Weikun Shanghai Technology Service Co Ltd
Priority to CN202110692177.2A priority Critical patent/CN113434670A/zh
Priority to PCT/CN2021/109281 priority patent/WO2022267174A1/zh
Publication of CN113434670A publication Critical patent/CN113434670A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及人工智能技术领域,提供一种话术文本生成方法、装置、计算机设备和存储介质。所述方法包括:获取用户的录音文件和业绩数据,对录音文件进行语音转义,得到与录音文件对应的文本数据,对文本数据进行关键词识别,提取目标文本数据,根据目标文本数据和业绩数据,得到用户的评价信息,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。采用本方法能够得到更为全面准确的评价信息,进而能够根据更全面准确的评价信息,客观地对目标文本数据进行分类,然后基于分类后的文本数据,整理出更为合理且贴近实际的优秀话术,更符合实际应用场景需求,给用户带来便捷。

Description

话术文本生成方法、装置、计算机设备和存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种话术文本生成方法、装置、计算机设备和存储介质。
背景技术
随着市场竞争越来越强烈,呼叫中心的客服人员的服务质量的要求也越来也高。在目前的电话销售***中,客服人员与客户的每次通话都会保存相应的录音文件,为提高客服人员的业务能力,通常会通过分析客服人员的录音文件对其服务质量进行评估,以达到提升业务能力的目的。
目前,通过分析客服的录音文件以提升业务能力的做法,多是先对录音文件进行语音识别得到对应的文本数据,进一步,采用自然语音处理技术和评分机制,对录音文件对应的文本数据进行处理,得到客服人员相应的通话质量评分,进而根据评分,筛选出优秀的话术文本。
上述方法,仅以录音文件为分析对象,从录音文件这一维度对客服人员进行评价,评价维度过于单一,无法确保最终得到的话术文本符合实际应用场景需求。
发明内容
基于此,有必要针对上述技术问题,提供一种能够更加符合实际应用场景需求的话术文本生成方法、装置、计算机设备和存储介质。
一种话术文本生成方法,所述方法包括:
获取用户的录音文件和业绩数据;
对录音文件进行语音转义,得到与录音文件对应的文本数据;
对文本数据进行关键词识别,提取目标文本数据;
根据目标文本数据和业绩数据,得到用户的评价信息;
根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
在一个实施例中,对文本数据进行关键词识别,提取目标文本数据包括:
根据预设无效关键词对文本数据进行关键词识别,删除预设无效关键词对应的文本数据,得到初始文本数据;
根据预设有效关键词,对初始文本数据进行关键词识别,提取与预设有效关键词对应的目标文本数据。
在一个实施例中,根据目标文本数据和业绩数据,得到用户的评价信息包括:
通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果;
基于分析结果和业绩数据,结合预设评价规则,得到用户的评价信息。
在一个实施例中,通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果包括:
通过预设分词工具对目标文本数据进行分词处理,得到关键词序列;
将关键词序列中的关键词与预设关键词进行匹配,得到匹配结果;
根据匹配结果,对目标文本数据进行用户意图识别以及用语规范识别,得到分析结果。
在一个实施例中,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术,得到目标话术文本包括:
根据评价信息,对目标文本数据进行排序,得到排名结果;
将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据;
根据第一类文本数据、第二类文本数据和预设基础话术,得到目标话术文本。
在一个实施例中,根据第一类文本数据、第二类文本数据和预设基础话术文本,得到目标话术文本包括:
将第一类文本数据和第二类文本数据分别与预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本;
根据第一话术文本和第二话术文本,对预设基础话术文本进行内容增减操作,得到目标话术文本。
在一个实施例中,获取用户的录音文件包括:
获取初始录音文件;
根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
一种话术文本生成装置,所述装置包括:
数据获取模块,用于获取用户的录音文件和业绩数据;
语音转义模块,用于对录音文件进行语音转义,得到与录音文件对应的文本数据;
文本筛选模块,用于对文本数据进行关键词识别,提取目标文本数据;
评价信息确定模块,用于根据目标文本数据和业绩数据,得到用户的评价信息;
话术整理模块,用于根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用户的录音文件和业绩数据;
对录音文件进行语音转义,得到与录音文件对应的文本数据;
对文本数据进行关键词识别,提取目标文本数据;
根据目标文本数据和业绩数据,得到用户的评价信息;
根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取用户的录音文件和业绩数据;
对录音文件进行语音转义,得到与录音文件对应的文本数据;
对文本数据进行关键词识别,提取目标文本数据;
根据目标文本数据和业绩数据,得到用户的评价信息;
根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
上述话术文本生成方法、装置、计算机设备和存储介质,在通过对录音文件进行语音转义得到对应的文本数据之后,并不是直接对文本数据进行处理,而是通过对文本数据进行关键词识别,提取目标文本数据,以达到精简文本数据的目的,减少数据处理工作量;并且,从实际需求的角度出发,从录音文件和业绩数据两个维度进行评价,得到更为全面准确的评价信息,进而能够根据更全面准确的评价信息,客观地对目标文本数据进行分类,然后基于分类后的文本数据,整理出更为合理且贴近实际的优秀话术,更符合实际应用场景需求,给用户带来便捷。
附图说明
图1为一个实施例中话术文本生成方法的应用环境图;
图2为一个实施例中话术文本生成方法的流程示意图;
图3为另一个实施例中话术文本生成方法的详细流程示意图;
图4为一个实施例中话术文本生成装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的话术文本生成方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。具体可以是,管理人员于终端102登录业务管理***,通过在***操作界面进行操作,向服务器104发送录音文件处理消息,服务器102接收该录音文件处理消息,获取已存在的坐席的录音文件和业绩数据,对录音文件进行语音转义,得到与录音文件对应的文本数据,然后,基于语音识别文字转义的基础,对文本数据进行关键词识别,提取出目标文本数据,再根据目标文本数据和业绩数据,得到用户的评价信息,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种话术文本生成方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,获取用户的录音文件和业绩数据。
本实施例中,用户以坐席为例,录音文件为经过筛选后的有效录音文件,且录音文件和业绩数据均携带有坐席的身份标识,以便进行后续的分类处理。身份标识可以是位置识别码或员工编号等身份标识信息。业绩数据包括成交量和客户满意度等。具体实施时,可以是管理人员设置定时任务,使得服务器102每日在固定时间段获取前一天留存的录音文件。
步骤204,对录音文件进行语音转义,得到与录音文件对应的文本数据。
语音转义即指将语音数据快速精确转换为文字,也可称为语音识别。目前,业内已经有了比较成熟的语音转义的解决方案,提供语音转义的第三方服务有百度,腾讯,科大讯飞等等。本实施例中,可以是调用第三方服务对录音文件进行语音转义,得到与录音文件对应的文本数据。
步骤206,对文本数据进行关键词识别,提取目标文本数据。
目标文本数据即指有效文本数据。在提取出录音文件对应的文本数据后,由于并非所有的文本数据都是有效的信息,因此,可以进一步对文本数据进行精简,过滤掉无效文本数据,得到目标文本数据。具体的,可以是对文本数据进行关键词识别,识别出无效部分并进行删除,从而再进一步提取得到目标文本数据。
步骤208,根据目标文本数据和业绩数据,得到用户的评价信息。
评价信息可以是评分、等级和/或评语等信息。本实施例中,评价信息以综合评分为例进行说明。具体的,综合评分主要根据客户满意度和业务能力进行评定,客户满意度可表征为***评分,***评分由基础服务分和***扣除分得到。其中,基础服务分由每次通话结束后的客户评分计算均值得到,***扣除分基于对坐席的通话质量进行评估得到。通话质量的判定可以通过关键词识别确定。业务能力可以根据成交量和话术规范程度进行评定。其中,话术规范程度可以是对目标文本数据进行关键词匹配得出。
步骤210,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
实际应用中,电话销售行业内都是有其一套固定的话术的。本实施例中,预设基础话术即指固定话术。具体的,可根据综合评分将坐席划分为优秀坐席和差劲坐席,进而对优秀坐席和差劲坐席所对应的目标文本数据进行分类,得到优秀文本数据和差劲文本数据,再基于优秀文本数据、差劲文本数据和预设基础话术,分析坐席脱离基础话术之外自由发挥的部分,整理出怎么样的话术客户更感兴趣,怎么的话术会让客户失去兴趣,得到目标话术。
上述话术文本生成方法中,在通过对录音文件进行语音转义得到对应的文本数据之后,并不是直接对文本数据进行处理,而是通过对文本数据进行关键词识别,提取目标文本数据,以达到精简文本数据的目的,减少数据处理工作量;并且,从实际需求的角度出发,从录音文件和业绩数据两个维度进行评价,得到较为全面的评价信息,进而能够根据更全面准确的评价信息,客观地对目标文本数据进行分类,然后基于分类后的文本数据,整理出更为合理且贴近实际的优秀话术,更符合实际应用场景需求,给用户带来便捷。
在一个实施例中,获取用户的录音文件包括:获取初始录音文件,根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
实际应用中,由于每位坐席一天要进行多次通话,得到多份录音文件,故,***中存在的录音文件的数量也十分庞大。若要对每份录音文件都进行处理,则工作量比较巨大。经发现,一份一分钟左右的录音文件一般只有坐席的开场问候以及产品介绍,然后通话就被客户挂断,基于此,针对通话时长较短的通话录音文件,可以将其定义为无效录音文件进行过滤。因此,本实施例中,需要在对录音文件进行文字转义之前,过滤掉无效录音文件。具体的,可以是将录音时长小于1分钟的录音文件确定为无效录音文件,只提取录音时长大于或等于1分钟的录音文件。上述做法,精简了海量的录音文件,节省后续为录音文件的文字转义的时间,提升处理速度。
如图3所示,在一个实施例中,步骤206包括:步骤226,根据预设无效关键词对文本数据进行关键词识别,删除预设无效关键词对应的文本数据,得到初始文本数据,根据预设有效关键词,对初始文本数据进行关键词识别,提取与预设有效关键词对应的目标文本数据。
一份由录音文件转义得到的文本数据中,其包括有效内容和无效内容。其中,有效内容可重点包括客户产生兴趣与业务席进行互动的片段,无效内容可包括各类问候语(如您好,再见,祝您生活愉快等)、固定话术或者是产品介绍。在完成语音转义,进行后续处理之前,将此部分无效内容删除,以精简文本数据。具体的,可以是根据固定话术中的要素和产品介绍相关要素确定无效关键词进行关键词识别,识别出无效文本进而将其删除。无效文本的去除可采用停用词技术处理,将此部分无效内容进行提取并删除,得到初始文本数据。考虑到客户互动过程中有相关产品描述和推销内容,因此,可根据产品特征以及产品销售相关的要素确定有效关键词,例如金融类产品可设定起投,收益以及风险等有效关键词,对初始文本数据进行关键词识别,提取出坐席脱离话术之外与客户产生互动的自由发挥的文本数据。例如以客户咨询详细信息的关键词为起点,到之后客户表示不感兴趣,或者客户有成交意愿为终点这一段文本数据确定为重点片段即有效内容,得到有效文本数据。本实施例中,通过关键词识别,识别出有效的文本数据,以便精准高效地进行后续整理话术工作的开展,节省时间。
如图3所示,在一个实施例中,步骤208包括:步骤228,通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果,基于分析结果和业绩数据,结合预设评价规则,得到用户的评价信息。
具体实施时,可以是采用预设的分词工具对目标文本数据进行分词处理,将目标文本数据拆分为若干个关键词组成的关键词序列,再将关键词序列中的关键词与预设关键词进行匹配,得到匹配结果,然后根据匹配结果,进行用户意图识别和用语规范识别等,以此对通话质量进行评估,给出相应的***扣除分。具体的,预设关键词包括用户意图关键词和用语规范关键词,若匹配出与用户意图关键词(如不需要、没兴趣等)相匹配的关键词,则可确定用户意图为无意愿,若匹配出与用户规范关键词的相匹配的关键词超过预设阈值如5个,则判定用语符合规范,否则,用语不符合规范。在另一个实施例中,基于自然语言处理技术对录音文件分析还包括断话识别、冷场识别、语气识别、情绪识别、方言使用识别、语义清晰度识别、语句连贯性识别等。本实施例中,可以是通过关键词如没兴趣,不需要等,识别用户意图,在识别出客户表达不耐烦的关键词之后,即识别出用户意图为“无意愿”后,判断坐席是否礼貌的表示抱歉,或者充耳不闻继续介绍产品,若坐席的表现为充耳不闻,继续喋喋不休介绍产品,且最后被客户直接挂断,则***按照预设评分规则自动相应计扣除分。然后,在基础服务分即基础上减去***扣除分,得到***评分。进一步的,获取业绩数据中的绩效评分,按照预设评价规则,分别为绩效评分和***评分设定相应的权重,然后进行求和,得到坐席的综合评分。本实施例中,通过对目标文本数据进行分析,结合预设评价规则,能够智能且客观地为坐席给出相应的综合评分,以便对坐席进行考核,提升坐席的服务质量。
如图3所示,在一个实施例中,步骤210包括:步骤230,根据评价信息,对目标文本数据进行排序,得到排名结果,将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据,根据第一类文本数据、第二类文本数据和预设基础话术,得到目标话术文本。
具体实施时,业绩数据、综合评分和文本数据均携带有坐席身份标识信息,可以根据坐席身份标识信息展开话术整理。即根据各坐席的综合评分,对坐席进行排名,然后将前十名的坐席划分为优秀坐席,并将其对应的文本数据划分为第一类文本数据即优秀文本,将倒数前十名的坐席划分为差劲坐席,并将其对应的文本数据划分为第二类文本数据即差劲文本。然后,结合预设基础话术文本,对优秀文本数据和差劲文本数据进行比较,整理出合理的目标话术。本实施例中,根据综合评分能够客观地对坐席进行排名,得到优秀坐席和差劲坐席,且进一步分析优秀坐席和差劲坐席的文本数据,能更加贴近实际情况,整理出更为合理的话术。
在一个实施例中,根据第一类文本数据、第二类文本数据和预设基础话术文本,得到目标话术文本包括:将第一类文本数据和第二类文本数据分别与预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本,根据第一话术文本和第二话术文本,对预设基础话术文本进行内容增减操作,得到目标话术文本。
由于所有的电话销售都是有固定的基础话术的,可以通过将第一类文本数据和第二类文本数据分别与固定的基础话术进行比较,对应提取出脱离基础话术之外的与客户进行互动的优秀互动内容和差劲互动内容,然后按照权重10-1的方式将排名前十的坐席的优秀互动片段进行排名,得到优秀文本排行,将排名倒数前十的坐席的差劲互动片段进行排名,得到糟粕文本排行,通过分析大量的优秀文本和糟粕文本,总结出话术共同点,得到优秀话术和差劲话术,然后将优秀话术加入基础话术,从基础话术中删减掉差劲话术,以此,整理得到更为合理的目标话术,从而有效地提升坐席的业务能力。
为更加清楚地描述本申请,下面将结合一个具体实例,进行说明:
管理人员对服务器设置定时任务,使得服务器在每天晚上固定时段获取前一天的所有坐席的录音文件,当接收到终端发送的话术文本生成消息时,服务器获取已存的坐席的录音文件和业绩数据,由于录音文件数据庞大,且存在很多时长很短的无效录音文件,因此,将录音时长小于1分钟的录音文件作为无效录音文件进行过滤,提取出有效的录音文件,调用第三方服务如科大讯飞语音转义服务,对录音文件进行语音转义,得到与录音文件对应的文本数据。然后,根据预设无效关键词对文本数据进行关键词识别,删除无效关键词对应的无效文本数据,得到初始文本数据,再根据预设有效关键词,对初始文本数据进行关键词识别,提取与有效关键词对应的目标文本数据即重点文本数据。基于自然语言处理技术,对目标文本数据进行用户意图识别、断话识别和用语规范识别等,得到分析结果,基于分析结果和业绩数据,结合预设评价规则,确定坐席的综合评分。根据坐席的综合评分,对坐席进行排序,得到排名结果,将排名前十名的坐席所对应的文本数据归类为第一类文本数据即优秀文本数据,将倒数前十名的坐席所对应的文本数据归类为第二类文本数据即差劲文本数据,将优秀文本数据和差劲本数据与预设基础话术进行比较,分别提取出优秀坐席和差劲坐席脱离基础话术之外的自由发挥部分的优秀互动片段和差劲互动片段,然后按照权重10-1的方式将排名前十的坐席的优秀互动片段进行排名,得到优秀文本排行,将排名倒数前十的坐席的差劲互动片段进行排名,得到糟粕文本排行,通过分析大量的优秀文本和糟粕文本,总结出话术共同点,得到优秀话术和差劲话术,然后将优秀话术加入基础话术,从基础话术中删减掉差劲话术,以此,整理得到更为合理的目标话术。上述方法,在通过对录音文件进行语音转义得到对应的文本数据之后,并不是直接对文本数据进行处理,而是通过对文本数据进行关键词识别,提取目标文本数据,以达到精简文本数据的目的,减少数据处理工作量,并且,通过结合目标文本数据和业绩数据,从通话质量和业务能力两个维度进行评价,得到更为全面准确的评价信息,进而能够根据更全面准确的评价信息,客观地对目标文本数据进行分类,然后基于分类后的文本数据,整理出更为合理且贴近实际的优秀话术,更符合实际应用场景需求,给用户带来便捷。
应该理解的是,虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种话术文本生成装置,包括:数据获取模块510、数据获取模块520、文本筛选模块530、评价信息确定模块540和话术整理模块550,其中:
数据获取模块510,用于获取用户的录音文件和业绩数据。
语音转义模块520,用于对录音文件进行语音转义,得到与录音文件对应的文本数据。
文本筛选模块530,用于对文本数据进行关键词识别,提取目标文本数据。
评价信息确定模块540,用于根据目标文本数据和业绩数据,得到用户的评价信息。
话术整理模块550,用于根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
在一个实施例中,文本筛选模块530还用于根据预设无效关键词对文本数据进行关键词识别,删除预设无效关键词对应的文本数据,得到初始文本数据,根据预设有效关键词,对初始文本数据进行关键词识别,提取与预设有效关键词对应的目标文本数据。
在一个实施例中,评价信息确定模块540还用于通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果,基于分析结果和业绩数据,结合预设评价规则,得到用户的评价信息。
在一个实施例中,评价信息确定模块540还用于通过预设分词工具对目标文本数据进行分词处理,得到关键词序列,将关键词序列中的关键词与预设关键词进行匹配,得到匹配结果,根据匹配结果,对目标文本数据进行用户意图识别以及用语规范识别,得到分析结果。
在一个实施例中,话术整理模块550还用于根据评价信息,对目标文本数据进行排序,得到排名结果,将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据,根据第一类文本数据、第二类文本数据和预设基础话术,得到目标话术文本。
在一个实施例中,话术整理模块550还用于将第一类文本数据和第二类文本数据分别与预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本,根据第一话术文本和第二话术文本,对预设基础话术文本进行内容增减操作,得到目标话术文本。
在一个实施例中,数据获取模块510还用于获取初始录音文件,根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
关于话术文本生成装置的具体实施例可以参见上文中对于话术文本生成方法的实施例,在此不再赘述。上述话术文本生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储录音文件和预设评价规则等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种话术文本生成方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取用户的录音文件和业绩数据,对录音文件进行语音转义,得到与录音文件对应的文本数据,对文本数据进行关键词识别,提取目标文本数据,根据目标文本数据和业绩数据,得到用户的评价信息,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预设无效关键词对文本数据进行关键词识别,删除预设无效关键词对应的文本数据,得到初始文本数据,根据预设有效关键词,对初始文本数据进行关键词识别,提取与预设有效关键词对应的目标文本数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果,基于分析结果和业绩数据,结合预设评价规则,得到用户的评价信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过预设分词工具对目标文本数据进行分词处理,得到关键词序列,将关键词序列中的关键词与预设关键词进行匹配,得到匹配结果,根据匹配结果,对目标文本数据进行用户意图识别以及用语规范识别,得到分析结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据评价信息,对目标文本数据进行排序,得到排名结果,将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据,根据第一类文本数据、第二类文本数据和预设基础话术,得到目标话术文本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将第一类文本数据和第二类文本数据分别与预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本,根据第一话术文本和第二话术文本,对预设基础话术文本进行内容增减操作,得到目标话术文本。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取初始录音文件,根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取用户的录音文件和业绩数据,对录音文件进行语音转义,得到与录音文件对应的文本数据,对文本数据进行关键词识别,提取目标文本数据,根据目标文本数据和业绩数据,得到用户的评价信息,根据评价信息对目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据预设无效关键词对文本数据进行关键词识别,删除预设无效关键词对应的文本数据,得到初始文本数据,根据预设有效关键词,对初始文本数据进行关键词识别,提取与预设有效关键词对应的目标文本数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过预设自然语言处理技术,对目标文本数据进行分析,得到分析结果,基于分析结果和业绩数据,结合预设评价规则,得到用户的评价信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过预设分词工具对目标文本数据进行分词处理,得到关键词序列,将关键词序列中的关键词与预设关键词进行匹配,得到匹配结果,根据匹配结果,对目标文本数据进行用户意图识别以及用语规范识别,得到分析结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据评价信息,对目标文本数据进行排序,得到排名结果,将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据,根据第一类文本数据、第二类文本数据和预设基础话术,得到目标话术文本。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将第一类文本数据和第二类文本数据分别与预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本,根据第一话术文本和第二话术文本,对预设基础话术文本进行内容增减操作,得到目标话术文本。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取初始录音文件,根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种话术文本生成方法,其特征在于,所述方法包括:
获取用户的录音文件和业绩数据;
对所述录音文件进行语音转义,得到与所述录音文件对应的文本数据;
对所述文本数据进行关键词识别,提取目标文本数据;
根据所述目标文本数据和所述业绩数据,得到所述用户的评价信息;
根据所述评价信息对所述目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
2.根据权利要求1所述的方法,其特征在于,所述对所述文本数据进行关键词识别,提取目标文本数据包括:
根据预设无效关键词对所述文本数据进行关键词识别,删除所述预设无效关键词对应的文本数据,得到初始文本数据;
根据预设有效关键词,对所述初始文本数据进行关键词识别,提取与所述预设有效关键词对应的目标文本数据。
3.根据权利要求1所述的方法,其特征在于,所述分析所述目标文本数据和所述业绩数据,得到所述用户的评价信息包括:
通过预设自然语言处理技术,对所述目标文本数据进行分析,得到分析结果;
基于所述分析结果和所述业绩数据,结合预设评价规则,得到所述用户的评价信息。
4.根据权利要求3所述的方法,其特征在于,所述通过预设自然语言处理技术,对所述目标文本数据进行分析,得到分析结果包括:
通过预设分词工具对目标文本数据进行分词处理,得到关键词序列;
将所述关键词序列中的关键词与预设关键词进行匹配,得到匹配结果;
根据所述匹配结果,对所述目标文本数据进行用户意图识别以及用语规范识别,得到分析结果。
5.根据权利要求1所述的方法,其特征在于,所述根据所述评价信息对所述目标文本数据进行分类,根据分类结果和预设基础话术,得到目标话术文本包括:
根据所述评价信息,对所述目标文本数据进行排序,得到排名结果;
将第一预设名次范围内的目标文本数据归类为第一类文本数据,将第二预设名次范围内的目标文本数据归类为第二类文本数据;
根据所述第一类文本数据、所述第二类文本数据和预设基础话术,得到目标话术文本。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一类文本数据、所述第二类文本数据和预设基础话术文本,得到目标话术文本包括:
将所述第一类文本数据和所述第二类文本数据分别与所述预设基础话术文本进行比较,对应提取出第一话术文本和第二话术文本;
根据所述第一话术文本和所述第二话术文本,对所述预设基础话术文本进行内容增减操作,得到目标话术文本。
7.根据权利要求1至6任一项所述的方法,其特征在于,获取用户的录音文件包括:
获取初始录音文件;
根据预设时长阈值,筛选出所述初始录音文件中与所述预设时长阈值匹配的录音文件。
8.一种话术文本生成装置,其特征在于,所述装置包括:
数据获取模块,用于获取用户的录音文件和业绩数据;
语音转义模块,用于对所述录音文件进行语音转义,得到与所述录音文件对应的文本数据;
文本筛选模块,用于对所述文本数据进行关键词识别,得到目标文本数据;
评价信息确定模块,用于根据所述目标文本数据和所述业绩数据,得到所述用户的评价信息;
话术整理模块,用于根据所述评价信息对所述目标文本数据进行分类,根据分类结果和预设基础话术文本,得到目标话术文本。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110692177.2A 2021-06-22 2021-06-22 话术文本生成方法、装置、计算机设备和存储介质 Pending CN113434670A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110692177.2A CN113434670A (zh) 2021-06-22 2021-06-22 话术文本生成方法、装置、计算机设备和存储介质
PCT/CN2021/109281 WO2022267174A1 (zh) 2021-06-22 2021-07-29 话术文本生成方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110692177.2A CN113434670A (zh) 2021-06-22 2021-06-22 话术文本生成方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113434670A true CN113434670A (zh) 2021-09-24

Family

ID=77756985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110692177.2A Pending CN113434670A (zh) 2021-06-22 2021-06-22 话术文本生成方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN113434670A (zh)
WO (1) WO2022267174A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757862A (zh) * 2023-01-09 2023-03-07 百融至信(北京)科技有限公司 批量录音匹配话术文本的方法和装置、电子设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116361429B (zh) * 2023-01-19 2024-02-02 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、***、设备及存储介质
CN116980522B (zh) * 2023-09-22 2024-01-09 湖南三湘银行股份有限公司 一种基于智能质检客户画像的通知的***和方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763499A (zh) * 2018-05-30 2018-11-06 平安科技(深圳)有限公司 基于智能语音的呼叫质检方法、装置、设备及存储介质
CN110189751A (zh) * 2019-04-24 2019-08-30 中国联合网络通信集团有限公司 语音处理方法及设备
CN110472017A (zh) * 2019-08-21 2019-11-19 佰聆数据股份有限公司 一种话术分析和话题点识别匹配的方法及***
CN111160017A (zh) * 2019-12-12 2020-05-15 北京文思海辉金信软件有限公司 关键词抽取方法、话术评分方法以及话术推荐方法
WO2021003930A1 (zh) * 2019-07-10 2021-01-14 深圳前海微众银行股份有限公司 客服录音的质检方法、装置、设备及计算机可读存储介质
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质
CN112885332A (zh) * 2021-01-08 2021-06-01 天讯瑞达通信技术有限公司 一种语音质检方法、***及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763499A (zh) * 2018-05-30 2018-11-06 平安科技(深圳)有限公司 基于智能语音的呼叫质检方法、装置、设备及存储介质
CN110189751A (zh) * 2019-04-24 2019-08-30 中国联合网络通信集团有限公司 语音处理方法及设备
WO2021003930A1 (zh) * 2019-07-10 2021-01-14 深圳前海微众银行股份有限公司 客服录音的质检方法、装置、设备及计算机可读存储介质
CN110472017A (zh) * 2019-08-21 2019-11-19 佰聆数据股份有限公司 一种话术分析和话题点识别匹配的方法及***
CN111160017A (zh) * 2019-12-12 2020-05-15 北京文思海辉金信软件有限公司 关键词抽取方法、话术评分方法以及话术推荐方法
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质
CN112885332A (zh) * 2021-01-08 2021-06-01 天讯瑞达通信技术有限公司 一种语音质检方法、***及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115757862A (zh) * 2023-01-09 2023-03-07 百融至信(北京)科技有限公司 批量录音匹配话术文本的方法和装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2022267174A1 (zh) 2022-12-29

Similar Documents

Publication Publication Date Title
CN110444198B (zh) 检索方法、装置、计算机设备和存储介质
US10771627B2 (en) Personalized support routing based on paralinguistic information
US8306814B2 (en) Method for speaker source classification
CN104598445B (zh) 自动问答***和方法
CN109767787B (zh) 情绪识别方法、设备及可读存储介质
CN113434670A (zh) 话术文本生成方法、装置、计算机设备和存储介质
US20210012777A1 (en) Context acquiring method and device based on voice interaction
CN102623011B (zh) 信息处理装置、信息处理方法及信息处理***
CN111311327A (zh) 基于人工智能的服务评价方法、装置、设备及存储介质
CN110177182B (zh) 敏感数据处理方法、装置、计算机设备及存储介质
CN110310663A (zh) 违规话术检测方法、装置、设备及计算机可读存储介质
CN111640436B (zh) 向坐席提供通话对象的动态客户画像的方法
US9904927B2 (en) Funnel analysis
CN113094578A (zh) 基于深度学习的内容推荐方法、装置、设备及存储介质
US11687946B2 (en) Systems and methods for detecting complaint interactions
KR20180120488A (ko) 텍스트 마이닝 기법을 활용한 고객 불만에 대한 분류 및 예측 방법
CN113360622A (zh) 用户对话信息的处理方法、装置及计算机设备
Galanis et al. Classification of emotional speech units in call centre interactions
CN116631412A (zh) 一种通过声纹匹配判断语音机器人的方法
CN111599382B (zh) 语音分析方法、装置、计算机设备和存储介质
CN115831125A (zh) 语音识别方法、装置、设备、存储介质及产品
CN114356982A (zh) 营销合规性检查方法、装置、计算机设备及存储介质
US11398239B1 (en) ASR-enhanced speech compression
CN115733925A (zh) 业务语音意图呈现方法、装置、介质及电子设备
CN114254088A (zh) 自动应答模型的构建方法和自动应答方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination