CN110460798B - 视频访谈服务处理方法、装置、终端与存储介质 - Google Patents

视频访谈服务处理方法、装置、终端与存储介质 Download PDF

Info

Publication number
CN110460798B
CN110460798B CN201910563766.3A CN201910563766A CN110460798B CN 110460798 B CN110460798 B CN 110460798B CN 201910563766 A CN201910563766 A CN 201910563766A CN 110460798 B CN110460798 B CN 110460798B
Authority
CN
China
Prior art keywords
information
user
voice information
preset
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910563766.3A
Other languages
English (en)
Other versions
CN110460798A (zh
Inventor
张奕
赵芝松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910563766.3A priority Critical patent/CN110460798B/zh
Publication of CN110460798A publication Critical patent/CN110460798A/zh
Application granted granted Critical
Publication of CN110460798B publication Critical patent/CN110460798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • G06F16/637Administration of user profiles, e.g. generation, initialization, adaptation or distribution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种视频访谈服务处理方法,包括:获取参与访谈的用户信息;根据所述用户信息读取语音数据库中的预设语音信息;采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;将用户输出的语音信息转换为文字信息;检测文字信息中是否存在预设关键字;若文字信息中存在预设关键字,则获取预设关键字,并根据预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。本发明还提供一种视频访谈服务处理装置、终端与计算机可读存储介质。本发明使得访谈双方还能够通过文字形式进行交流;且能够避免因稽核人员经验不足或临场状态较差,在访谈时产生无话题可讲,气氛尴尬等问题。

Description

视频访谈服务处理方法、装置、终端与存储介质
技术领域
本发明涉及数据分析技术领域,具体涉及一种视频访谈服务处理方法、视频访谈服务处理装置、终端与计算机可读存储介质。
背景技术
随着技术的进步,人与人的远程沟通方式从书信,电报,语音电话发展到视频电话。由于视频电话具有实时性好、互动性强的特点,使其迅速得到了广大用户的喜爱和追捧,越来越多的行业开始利用视频电话进行相关工作,例如,采访者与被访谈者可以通过视频电话的方式进行沟通,从而避免由于地域等条件限制影响双方沟通进程。
现有的视频通话一般只需要同时传输视频数据和音频数据,也即通话双方只会进行视频交流及音频交流,不能够将音频信息转换为文字信息,进行文字交流,使得交谈双方必须认真倾听对方谈话内容才能正常沟通;且在视频电话过程中,采访者与被访谈者的交流互动主要是采用采访者主动引导话题,被访谈者答复的方式进行,而在实际采访人员经验不足或者临场状态较差时,往往容易发生采访人员没有话题可讲,气氛尴尬等问题,体验较差。
发明内容
鉴于以上内容,有必要提出一种视频访谈服务处理方法、视频访谈服务处理装置、终端以及计算机可读存储介质,使得访谈双方还能够通过文字形式进行交流;且能够避免因稽核人员经验不足或临场状态较差,在访谈时产生无话题可讲,气氛尴尬等问题。
本发明实施例第一方面提供一种视频访谈服务处理方法,所述视频访谈服务处理方法包括:
在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;
根据所述用户信息读取语音数据库中的预设语音信息;
在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;
将用户输出的语音信息转换为文字信息;
检测所述文字信息中是否存在预设关键字;
若检测结果为所述文字信息中存在预设关键字,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,在根据所述用户信息读取语音数据库中的预设语音信息之前,所述方法还包括:
检测所述语音数据库中是否存储有对应所述用户信息的预设语音信息;
若检测结果为所述语音数据库中未存储有对应所述用户信息的预设语音信息,则采集该用户的语音信息,得到该用户对应的预设语音信息;
将该用户对应的预设语音信息保存至所述语音数据库中。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,所述将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息包括:
获取所述用户输出的语音信息与所述预设语音信息中的音色信息;
将所述用户输出的语音信息中的音色信息与所述预设语音信息中的音色信息进行匹配,得到当前输出语音信息的用户信息。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,在所述将用户输出的语音信息转换为文字信息之前,所述方法还包括:
获取用户输出的语音信息的清晰度;
判断用户输出的语音信息的清晰度是否满足预设清晰度阈值;
若判断结果为所述用户输出的语音信息的清晰度不满足预设清晰度阈值,则确认导致用户输出的语音信息的清晰度不满足预设清晰度阈值的原因;
根据原因在方案库中匹配出解决方案,并输出解决方案。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,所述根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术包括:
提取由稽核人员输出的所述语音信息转换的文字信息;
获取所述文字信息中的预设关键字;
根据所述预设关键字确定话术类别,并获取当前话术类别对应的话术列表;
在所述话术列表中获取当前正在进行的话术所在的位置;
获取当前正在进行的话术对应的下一话术,并将下一话术作为推荐话术输出给稽核人员。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,在所述输出推荐话术之后,所述方法还包括:
在预设时间间隔内,检测稽核人员是否采纳推荐的话术;
若检测结果为所述稽核人员未采纳推荐的话术,则取消当前推荐的话术,并执行下一轮的话术推荐。
进一步的,在本发明实施例提供的上述视频访谈服务处理方法中,所述方法还包括:
检测输出的语音信息或文字信息中是否存在预设敏感词汇;
若检测结果为输出的语音信息或文字信息中存在预设敏感词汇,则确定输出敏感词汇的用户信息,并向该用户输出告警提示。
本发明实施例第二方面还提供一种视频访谈服务处理装置,所述视频访谈服务处理装置包括:
用户信息获取模块,用于在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;
语音信息读取模块,用于根据所述用户信息读取语音数据库中的预设语音信息;
语音匹配模块,用于在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;
文字转换模块,用于将用户输出的语音信息转换为文字信息;
关键字检测模块,用于检测所述文字信息中是否存在预设关键字;
话术推荐模块,用于在检测结果为所述文字信息中存在预设关键字时,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。
本发明实施例第三方面还提供一种终端,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述任意一项所述视频访谈服务处理方法。
本发明实施例第四方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述视频访谈服务处理方法。
本发明实施例提供一种视频访谈服务处理方法、视频访谈服务处理装置、终端及计算机可读存储介质,在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;根据所述用户信息读取语音数据库中的预设语音信息;在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;将用户输出的语音信息转换为文字信息;检测所述文字信息中是否存在预设关键字;若检测结果为所述文字信息中存在预设关键字,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。利用本发明实施例,通过语音转文字服务使得访谈双方还能够通过文字形式进行交流;且通过话术推荐服务,在视频访谈过程中进行话术推荐,避免因稽核人员经验不足或临场状态较差,在访谈时产生无话题可讲,气氛尴尬等问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明第一实施方式提供的视频访谈服务处理方法的流程图。
图2是本发明一实施方式的终端的结构示意图。
图3是图2所示的终端的示例性的功能模块图。
主要元件符号说明
终端 1
存储器 10
显示屏 20
处理器 30
视频访谈服务处理装置 100
用户信息获取模块 101
语音信息读取模块 102
语音匹配模块 103
文字转换模块 104
关键字检测模块 105
话术推荐模块 106
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
图1是本发明第一实施方式的视频访谈服务处理方法的流程图,所述视频访谈服务处理方法可以应用于终端1,所述终端1可以是例如智能手机、笔记本电脑、台式/平板电脑、智能手表以及个人数字助理(Personal Digital Assistant,PDA)等智能设备。如图1所示,所述视频访谈服务处理方法可以包括如下步骤:
S101:在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息。
在本实施方式中,在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息。稽核人员与被稽核人员可以是一对一关系(也即一个稽核人员对应一个被稽核人员)、多对一关系(也即多个稽核人员对应一个被稽核人员)或者多对多关系(多个稽核人员对应多个被稽核人员)。所述用户信息可以为用户的姓名与预留手机号等信息。
S102:根据所述用户信息读取语音数据库中的预设语音信息。
在本实施方式中,提供一语音数据库,所述语音数据库中用于存放所述稽核人员的预设语音信息及对应所述稽核人员信息、所述被稽核人员的预设语音信息及对应所述被稽核人员信息。所述预设语音信息可以为终端用户预先设置的,例如,所述预设语音信息包括:“您好,很高兴见到您!”在根据所述用户信息读取语音数据库中的预设语音信息之前,所述方法还包括:检测所述语音数据库中是否存储有对应所述用户信息的预设语音信息;若检测结果为所述语音数据库中未存储有对应所述用户信息的预设语音信息,则采集该用户的语音信息,得到该用户对应的预设语音信息;将该用户对应的预设语音信息保存至所述语音数据库中。根据所述用户信息读取语音数据库中的预设语音信息,并将读取出的所述预设语音信息临时保存至同一新建文件夹中。
S103:在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息。
在本实施方式中,在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息。所述将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息包括:获取所述用户输出的语音信息与所述预设语音信息中的音色信息;将所述用户输出的语音信息中的音色信息与所述预设语音信息中的音色信息进行匹配,得到当前输出语音信息的用户信息。不同用户会拥有不同的音色信息,因而根据用户输出的语音信息中的音色信息可以确认当前用户的身份信息。由于读取出的所述预设语音信息临时保存至同一新建文件夹中,因而在获取预设语音信息中的音色信息时,只需对新建文件夹中的预设语音信息进行操作,提高了匹配速率。
S104:将用户输出的语音信息转换为文字信息。
在本实施方式中,将用户输出的语音信息转换为文字信息,可以实现文字信息与所述语音信息同步在显示界面展示。所述文字信息对应于用户信息,在当前用户进行语音说话时,在显示界面上,同步显示当前用户输出的文字信息。
在用户输出语音信息时,可能由于各种原因无法识别用户输出的语音信息,因而无法准确将用户输出的语音信息转换为文字信息。因而,在所述将用户输出的语音信息转换为文字信息之前,所述方法还包括:获取用户输出的语音信息的清晰度;判断用户输出的语音信息的清晰度是否满足预设清晰度阈值;若判断结果为所述用户输出的语音信息的清晰度不满足预设清晰度阈值,则确认导致用户输出的语音信息的清晰度不满足预设清晰度阈值的原因;根据原因在方案库中匹配出解决方案,并输出解决方案。其中,所述确认导致用户输出的语音信息的清晰度不满足预设清晰度阈值的原因包括以下中的一种或多种:获取用户输出的语音信息的音量值;判断用户输出的语音信息的音量值是否低于第一预设阈值。或者,获取用户的人脸距离终端的距离值;判断用户的人脸距离终端的距离值是否大于第二预设阈值;或者,获取用户输出语音信息的速度;判断用户输出语音信息的速度是否大于第三预设阈值。所述第一/第二/第三预设阈值均为终端用户根据经验设置的值。本实施例还提供一方案库,所述方案库中用于存储导致用户输出的语音信息的清晰度无法满足预设清晰度阈值的解决方案。所述根据原因在方案库中匹配出解决方案,并输出解决方案包括:若判定用户输出的语音信息的音量值低于第一预设阈值,则提示用户提高音量。或者,若判定用户的人脸距离终端的距离值大于第二预设阈值,则提示用户靠近终端。或者,若判定用户输出语音信息的速度大于第三预设阈值,则提示用户降低输出语音信息的速度。
在所述将用户输出的语音信息转换为文字信息之后,所述方法还包括:获取本次视频访谈的预设访谈信息;将所述预设访谈信息以及所述文字信息进行保存。通过将所述预设访谈信息以及所述文字信息进行保存,留存记录,可以方便以后查看。所述预设访谈信息包括:视频访谈中出席的稽核人员信息与被稽核人员信息、视频访谈的主题、视频访谈的时间、视频访谈所采用服务对应的IP地址与端口号的信息。本发明实施例提供一视频访谈服务控制页面,在视频访谈服务控制页面中,包含预设个数(例如,语音转文字服务的个数为2个,话术推荐服务的个数为1个,此处根据实际需要进设置)的语音转文字服务以及话术推荐服务的IP地址以及端口号。在所述视频访谈服务控制页面中,可以对所述语音转文字服务或所述话术推荐服务进行逻辑编辑以及删除;也可以设定某个服务是否为使用的服务。例如,所述语音转文字服务的个数为2个,分别为第一语音转文字服务以及第二语音转文字服务。对于所述第一语音转文字服务以及所述第二语音转文字服务,存在与服务对应的IP地址以及端口号。若设定所述第一语音转文字服务为使用的服务,则在视频访谈过程中,访问所述第一语音转文字服务的IP地址以及端口号。通过在视频访谈服务控制页面对服务地址进行设置,使得服务地址的设置更加方便。
S105:检测所述文字信息中是否存在预设关键字,若检测结果为所述文字信息中存在预设关键字,则执行步骤S106。
在本实施方式中,检测所述文字信息中是否存在预设关键字,所述预设关键字为预先设置的,与话术匹配的关键字,根据所述预设关键字能够在话术服务数据库中匹配对应话术。
S106:获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。
话术推荐服务用于在用户对话过程中,根据用户输出的语音信息对用户进行话术推荐。例如,向所述稽核人员推荐需要进行访谈的话题等。本发明实施例提供一个话术服务数据库,所述话术服务数据库中用于存储不同类别的话术。话术的呈现形式可以是按照话术列表的形式进行呈现,将一个类别所有可能用到的话术都在列表中呈现。
在本实施方式中,获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。所述根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术包括:提取由稽核人员输出的所述语音信息转换的文字信息;获取所述文字信息中的预设关键字;根据所述预设关键字确定话术类别,并获取当前话术类别对应的话术列表;在所述话术列表中获取当前正在进行的话术所在的位置;获取当前正在进行的话术对应的下一话术,并将下一话术作为推荐话术输出给稽核人员。对于当前推荐的话术,可以按照预设突出方式进行突出表示,所述预设突出方式可以为对当前推荐的话术进行标粗或加亮。可以理解的是,在实际视频访谈过程中,稽核人员并不一定按照话术列表中对应的话术顺序进行访谈,有时候会跳过某些话术,也有时候会新增某些话术。针对跳过某些话术的情况,还可以提示当前稽核人员未采用的话术,避免因稽核人员不够专业而导致视频访谈内容不够全面。针对新增某些话术的情况,还可以记录下新增的话术,在稽核人员视频访谈结束后,弹出提示框,提示稽核人员是否需要将当前新增的话术添加至话术服务数据库中。
在所述输出推荐话术之后,所述方法还包括:在预设时间间隔内,检测稽核人员是否采纳推荐的话术;若检测结果为所述稽核人员未采纳推荐的话术,则取消当前推荐的话术,并执行下一轮的话术推荐。所述预设时间间隔为终端用户预先设置的,例如,所述预设时间间隔为5秒。
所述方法还包括:检测输出的语音信息或文字信息中是否存在预设敏感词汇;若检测结果为输出的语音信息或文字信息中存在预设敏感词汇,则确定输出敏感词汇的用户信息,并向该用户输出告警提示。所述预设敏感词汇包括不文明的语言及其他限定的词汇。向用户输出告警提示,提示用户注意文明用语,可以保证访谈秩序。对于所述稽核人员,还可以对经常输出敏感词汇的稽核人员贴上标签,由公司安排相关人员对贴上标签的稽核人员采取相应措施,例如,教育培训等。
本发明实施例提供一种视频访谈服务处理方法,在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;根据所述用户信息读取语音数据库中的预设语音信息;在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;将用户输出的语音信息转换为文字信息;检测所述文字信息中是否存在预设关键字;若检测结果为所述文字信息中存在预设关键字,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。利用本发明实施例,通过语音转文字服务使得访谈双方还能够通过文字形式进行交流;且通过话术推荐服务,在视频访谈过程中进行话术推荐,避免因稽核人员经验不足或临场状态较差,在访谈时产生无话题可讲,气氛尴尬等问题。
以上是对本发明实施例所提供的方法进行的详细描述。根据不同的需求,所示流程图中方块的执行顺序可以改变,某些方块可以省略。下面对本发明实施例所提供的终端1进行描述。
本发明实施例还提供一种终端1,包括存储器10、处理器30及存储在存储器10上并可在处理器30上运行的计算机程序,所述处理器30执行所述程序时实现上述任一实施方式中所述的视频访谈服务处理方法的步骤。
图2是本发明一实施方式的终端1的结构示意图,如图2所示,终端1包括存储器10,存储器10中存储有视频访谈服务处理装置100。所述的终端1可以是手机、平板电脑、个人数字助理等具有应用显示功能的终端1。所述视频访谈服务处理装置100可以在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;根据所述用户信息读取语音数据库中的预设语音信息;在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;将用户输出的语音信息转换为文字信息;检测所述文字信息中是否存在预设关键字;若检测结果为所述文字信息中存在预设关键字,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。利用本发明实施例,通过语音转文字服务使得访谈双方还能够通过文字形式进行交流;且通过话术推荐服务,在视频访谈过程中进行话术推荐,避免因稽核人员经验不足或临场状态较差,在访谈时产生无话题可讲,气氛尴尬等问题。
本实施方式中,终端1还可以包括显示屏20及处理器30。存储器10、显示屏20可以分别与处理器30电连接。
所述的存储器10可以是不同类型存储设备,用于存储各类数据。例如,可以是终端1的存储器、内存,还可以是可外接于该终端装置1的存储卡,如闪存、SM卡(Smart MediaCard,智能媒体卡)、SD卡(Secure Digital Card,安全数字卡)等。此外,存储器10可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器10用于存储各类数据,例如,所述终端1中安装的各类应用程序(Applications)、应用上述视频访谈服务处理方法而设置、获取的数据等信息。
显示屏20安装于终端1,用于显示信息。
处理器30用于执行所述视频访谈服务处理方法以及所述终端1内安装的各类软件,例如操作***及应用显示软件等。处理器30包含但不限于处理器(Central ProcessingUnit,CPU)、微控制单元(Micro Controller Unit,MCU)等用于解释计算机以及处理计算机软件中的数据的装置。
所述的视频访谈服务处理装置100可以包括一个或多个的模块,所述一个或多个模块被存储在终端1的存储器10中并被配置成由一个或多个处理器(本实施方式为一个处理器30)执行,以完成本发明实施例。例如,参阅图3所示,所述视频访谈服务处理装置100可以包括用户信息获取模块101、语音信息读取模块102、语音匹配模块103、文字转换模块104、关键字检测模块105与话术推荐模块106。本发明实施例所称的模块可以是完成一特定功能的程序段,比程序更适合于描述软件在处理器中的执行过程。
可以理解的是,对应上述视频访谈服务处理方法中的各实施方式,终端1可以包括图3中所示的各功能模块中的一部分或全部,各模块的功能将在以下具体介绍。需要说明的是,以上视频访谈服务处理方法的各实施方式中相同的名词相关名词及其具体的解释说明也可以适用于以下对各模块的功能介绍。为节省篇幅及避免重复起见,在此就不再赘述。
用户信息获取模块101可以用于在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息。
语音信息读取模块102可以用于根据所述用户信息读取语音数据库中的预设语音信息。
语音匹配模块103可以用于在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息。
文字转换模块104可以用于将用户输出的语音信息转换为文字信息。
关键字检测模块105可以用于检测所述文字信息中是否存在预设关键字。
话术推荐模块106可以用于在检测结果为所述文字信息中存在预设关键字时,则获取所述预设关键字,并根据所述预设关键字在话术服务数据库中匹配对应话术,输出推荐话术。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施方式中的视频访谈服务处理方法的步骤。
所述视频访谈服务处理装置100/终端1/计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器30是所述视频访谈服务处理装置100/终端1的控制中心,利用各种接口和线路连接整个视频访谈服务处理装置100/终端1的各个部分。
所述存储器10用于存储所述计算机程序和/或模块,所述处理器30通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器10内的数据,实现所述视频访谈服务处理装置100/终端1的各种功能。所述存储器10可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在本发明所提供的几个具体实施方式中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的***实施方式仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
对于本领域技术人员而言,显然本发明实施例不限于上述示范性实施例的细节,而且在不背离本发明实施例的精神或基本特征的情况下,能够以其他的具体形式实现本发明实施例。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明实施例的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。
以上实施方式仅用以说明本发明实施例的技术方案而非限制,尽管参照以上较佳实施方式对本发明实施例进行了详细说明,本领域的普通技术人员应当理解,可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

Claims (9)

1.一种视频访谈服务处理方法,其特征在于,所述视频访谈服务处理方法包括:
在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;
根据所述用户信息读取语音数据库中的预设语音信息;
在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;
将用户输出的语音信息转换为文字信息;
检测所述文字信息中是否存在预设关键字;
若检测结果为所述文字信息中存在预设关键字,则提取由稽核人员输出的所述语音信息转换的文字信息;
获取所述文字信息中的预设关键字;
根据所述预设关键字确定话术类别,并获取当前话术类别对应的话术列表;
在所述话术列表中获取当前正在进行的话术所在的位置;
获取当前正在进行的话术对应的下一话术,并将下一话术作为推荐话术输出给稽核人员。
2.根据权利要求1所述的视频访谈服务处理方法,其特征在于,在根据所述用户信息读取语音数据库中的预设语音信息之前,所述方法还包括:
检测所述语音数据库中是否存储有对应所述用户信息的预设语音信息;
若检测结果为所述语音数据库中未存储有对应所述用户信息的预设语音信息,则采集该用户的语音信息,得到该用户对应的预设语音信息;
将该用户对应的预设语音信息保存至所述语音数据库中。
3.根据权利要求1所述的视频访谈服务处理方法,其特征在于,所述将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息包括:
获取所述用户输出的语音信息与所述预设语音信息中的音色信息;
将所述用户输出的语音信息中的音色信息与所述预设语音信息中的音色信息进行匹配,得到当前输出语音信息的用户信息。
4.根据权利要求1所述的视频访谈服务处理方法,其特征在于,在所述将用户输出的语音信息转换为文字信息之前,所述方法还包括:
获取用户输出的语音信息的清晰度;
判断用户输出的语音信息的清晰度是否满足预设清晰度阈值;
若判断结果为所述用户输出的语音信息的清晰度不满足预设清晰度阈值,则确认导致用户输出的语音信息的清晰度不满足预设清晰度阈值的原因;
根据原因在方案库中匹配出解决方案,并输出解决方案。
5.根据权利要求1所述的视频访谈服务处理方法,其特征在于,在所述输出推荐话术之后,所述方法还包括:
在预设时间间隔内,检测稽核人员是否采纳推荐的话术;
若检测结果为所述稽核人员未采纳推荐的话术,则取消当前推荐的话术,并执行下一轮的话术推荐。
6.根据权利要求1所述的视频访谈服务处理方法,其特征在于,所述方法还包括:
检测输出的语音信息或文字信息中是否存在预设敏感词汇;
若检测结果为输出的语音信息或文字信息中存在预设敏感词汇,则确定输出敏感词汇的用户信息,并向该用户输出告警提示。
7.一种视频访谈服务处理装置,其特征在于,所述视频访谈服务处理装置包括:
用户信息获取模块,用于在视频访谈开始之前,获取参与访谈的用户信息,所述用户信息包括稽核人员信息与被稽核人员信息;
语音信息读取模块,用于根据所述用户信息读取语音数据库中的预设语音信息;
语音匹配模块,用于在视频访谈过程中,采集当前用户输出的语音信息,并将用户输出的语音信息与所述预设语音信息进行匹配,得到当前输出语音信息的用户信息;
文字转换模块,用于将用户输出的语音信息转换为文字信息;
关键字检测模块,用于检测所述文字信息中是否存在预设关键字;
话术推荐模块,用于在检测结果为所述文字信息中存在预设关键字时,则提取由稽核人员输出的所述语音信息转换的文字信息;
获取所述文字信息中的预设关键字;
根据所述预设关键字确定话术类别,并获取当前话术类别对应的话术列表;
在所述话术列表中获取当前正在进行的话术所在的位置;
获取当前正在进行的话术对应的下一话术,并将下一话术作为推荐话术输出给稽核人员。
8.一种终端,其特征在于,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6中任意一项所述视频访谈服务处理方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述视频访谈服务处理方法。
CN201910563766.3A 2019-06-26 2019-06-26 视频访谈服务处理方法、装置、终端与存储介质 Active CN110460798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910563766.3A CN110460798B (zh) 2019-06-26 2019-06-26 视频访谈服务处理方法、装置、终端与存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910563766.3A CN110460798B (zh) 2019-06-26 2019-06-26 视频访谈服务处理方法、装置、终端与存储介质

Publications (2)

Publication Number Publication Date
CN110460798A CN110460798A (zh) 2019-11-15
CN110460798B true CN110460798B (zh) 2022-10-11

Family

ID=68481159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910563766.3A Active CN110460798B (zh) 2019-06-26 2019-06-26 视频访谈服务处理方法、装置、终端与存储介质

Country Status (1)

Country Link
CN (1) CN110460798B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116361429A (zh) * 2023-01-19 2023-06-30 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、***、设备及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084318B (zh) * 2020-09-25 2024-02-20 支付宝(杭州)信息技术有限公司 一种对话辅助方法、***及装置
CN112182197A (zh) * 2020-11-09 2021-01-05 北京明略软件***有限公司 话术推荐方法、装置、设备及计算机可读介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109215654A (zh) * 2018-10-22 2019-01-15 北京智合大方科技有限公司 实时语音识别和自然语言处理的移动端智能客服辅助***

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162977A (zh) * 2015-08-26 2015-12-16 上海银天下科技有限公司 说辞推荐方法和装置
CN108062316A (zh) * 2016-11-08 2018-05-22 百度在线网络技术(北京)有限公司 一种辅助客户服务的方法和装置
CN207149252U (zh) * 2017-08-01 2018-03-27 安徽听见科技有限公司 语音处理***
CN109033257A (zh) * 2018-07-06 2018-12-18 中国平安人寿保险股份有限公司 话术推荐方法、装置、计算机设备和存储介质
CN109166572A (zh) * 2018-09-11 2019-01-08 深圳市沃特沃德股份有限公司 机器人阅读的方法和阅读机器人
CN109885679A (zh) * 2019-01-11 2019-06-14 平安科技(深圳)有限公司 获取优选话术的方法、装置、计算机设备和存储介质
CN109902146A (zh) * 2019-01-23 2019-06-18 深圳壹账通智能科技有限公司 贷款信息获取方法、装置、终端及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109215654A (zh) * 2018-10-22 2019-01-15 北京智合大方科技有限公司 实时语音识别和自然语言处理的移动端智能客服辅助***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116361429A (zh) * 2023-01-19 2023-06-30 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、***、设备及存储介质
CN116361429B (zh) * 2023-01-19 2024-02-02 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、***、设备及存储介质

Also Published As

Publication number Publication date
CN110460798A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
US10678501B2 (en) Context based identification of non-relevant verbal communications
US11935540B2 (en) Switching between speech recognition systems
US10971153B2 (en) Transcription generation from multiple speech recognition systems
US10388272B1 (en) Training speech recognition systems using word sequences
EP3254453B1 (en) Conference segmentation based on conversational dynamics
US10334384B2 (en) Scheduling playback of audio in a virtual acoustic space
US20200127865A1 (en) Post-conference playback system having higher perceived quality than originally heard in the conference
US10057707B2 (en) Optimized virtual scene layout for spatial meeting playback
US10516782B2 (en) Conference searching and playback of search results
US8880403B2 (en) Methods and systems for obtaining language models for transcribing communications
Przybocki et al. NIST speaker recognition evaluations utilizing the Mixer corpora—2004, 2005, 2006
CA3060748A1 (en) Automated transcript generation from multi-channel audio
CN110460798B (zh) 视频访谈服务处理方法、装置、终端与存储介质
US20180191912A1 (en) Selective conference digest
US20040064322A1 (en) Automatic consolidation of voice enabled multi-user meeting minutes
US20110004473A1 (en) Apparatus and method for enhanced speech recognition
US20180190266A1 (en) Conference word cloud
CN114514577A (zh) 生成和传输口头通信的文字记录的方法和***
KR102548365B1 (ko) 회의 기록 자동 생성 방법 및 그 장치
CN115831125A (zh) 语音识别方法、装置、设备、存储介质及产品
CN113037610B (zh) 语音数据处理方法、装置、计算机设备和存储介质
Perepelytsia et al. Acoustic compression in Zoom audio does not compromise voice recognition performance
Roshan et al. Capturing important information from an audio conversation
CN112784038A (zh) 信息的识别方法、***、计算设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant