CN114880472A - 数据处理方法、装置及设备 - Google Patents

数据处理方法、装置及设备 Download PDF

Info

Publication number
CN114880472A
CN114880472A CN202210461027.5A CN202210461027A CN114880472A CN 114880472 A CN114880472 A CN 114880472A CN 202210461027 A CN202210461027 A CN 202210461027A CN 114880472 A CN114880472 A CN 114880472A
Authority
CN
China
Prior art keywords
target
feedback information
keyword
determining
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210461027.5A
Other languages
English (en)
Inventor
王昊天
吴晓烽
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202210461027.5A priority Critical patent/CN114880472A/zh
Publication of CN114880472A publication Critical patent/CN114880472A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供了一种数据处理方法、装置及设备,所述方法包括:获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。

Description

数据处理方法、装置及设备
技术领域
本说明书实施例涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及设备。
背景技术
随着互联网行业的迅速发展,网络风险也随之增多,在风控场景下,应用服务商可以在为用户提供服务前,通过客服人员与用户进行交互,以根据用户的反馈信息确定当前业务(如转账、充值、提现等业务)是否存在风险,为降低人工参与的成本,可以通过人机交互的方式进行风险控制。例如,计算机可以通过历史反馈信息和对应的意图标签,对预设意图识别模型进行训练,并在接收到用户的反馈信息后,通过训练后的意图识别模型,确定与用户反馈信息对应的用户真实意图,以对当前的业务进行风险控制。
但是,在黑产的欺诈手法发生新的变化时,接收到的用户反馈信息可能也会产生新的变化,而在风控数据量大、更新速度快的情况下,模型更新的数据处理压力较大,无法对意图识别模型进行及时的更新,这就可能导致无法通过意图识别模型确定新的用户反馈信息对应的用户的真实意图,风控效果差,因此,需要一种在风控场景下,能及时准确的确定用户真实意图以进行风险控制的解决方案。
发明内容
本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种在风控场景下,能及时准确的确定用户真实意图以进行风险控制的解决方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
第一方面,本说明书实施例提供了一种数据处理方法,包括:获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
第二方面,本说明书实施例提供了一种数据处理方法,包括:获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;获取与所述历史话术对应的第一关键词;基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
第三方面,本说明书实施例提供了一种数据处理装置,所述装置包括:信息获取模块,用于获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;类型确定模块,用于基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;风险确定模块,用于基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
第四方面,本说明书实施例提供了一种数据处理装置,包括:第一获取模块,用于获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;第二获取模块,用于获取与所述历史话术对应的第一关键词;模型训练模块,用于基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
第五方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
第六方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备为区块链***中的设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;获取与所述历史话术对应的第一关键词;基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
第七方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
第八方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;获取与所述历史话术对应的第一关键词;基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1A为本说明书一种数据处理方法实施例的流程图;
图1B为本说明书一种数据处理方法实施例的处理过程示意图;
图2为本说明书一种针对目标话术的反馈信息的示意图;
图3为本说明书一种话术的预设关联关系的示意图;
图4为本说明书另一种数据处理方法实施例的处理过程示意图;
图5为本说明书另一种数据处理方法实施例的处理过程示意图;
图6A为本说明书又一种数据处理方法实施例的流程图;
图6B为本说明书又一种数据处理方法实施例的处理过程示意图;
图7为本说明书又一种数据处理方法实施例的处理过程示意图;
图8为本说明书一种序列示意图;
图9为本说明书一种数据处理装置实施例的结构示意图;
图10为本说明书另一种数据处理装置实施例的结构示意图;
图11为本说明书一种数据处理设备的结构示意图。
具体实施方式
本说明书实施例提供一种数据处理方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1A和图1B所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为终端设备或服务器,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。
该方法具体可以包括以下步骤:
在S102中,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词。
其中,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,目标业务可以是任意涉及用户隐私、财产安全等业务,例如,目标业务可以是资源转移业务、隐私信息更新业务(如修改登录密码、新增用户信息等)等,目标话术可以是在目标用户触发执行的目标业务的情况下,用于获取目标用户针对目标业务的反馈信息,反馈信息可以是任意文字信息、语音信息等,例如,目标业务可以为资源转移业务,目标话术可以是“是否和资源转移对象是网上认识的?”,目标用户针对该目标话术的反馈信息可以是“是的”、“不是”等任意信息,目标关键词可以是能够表征目标话术的真实意图的关键词,例如,假设目标话术为“是否是可信机构联系您进行转账”,该目标话术对应的关键词可以包括“可信机构”和“转账”,由于该目标话术的真实意图是确定转账行为是否存在风险,而关键词“可信机构”并不能体现出该行为(即转账行为)的风险性,因此,与该目标话术对应的目标关键词可以是“转账”。
在实施中,随着互联网行业的迅速发展,网络风险也随之增多,在风控场景下,应用服务商可以在为用户提供服务前,通过客服人员与用户进行交互,以根据用户的反馈信息确定当前业务(如转账、充值、提现等业务)是否存在风险,为降低人工参与的成本,可以通过人机交互的方式进行风险控制。例如,计算机可以通过历史反馈信息和对应的意图标签,对预设意图识别模型进行训练,并在接收到用户的反馈信息后,通过训练后的意图识别模型,确定与用户反馈信息对应的用户真实意图,以对当前的业务进行风险控制。
但是,在黑产的欺诈手法发生新的变化时,接收到的用户反馈信息可能也会产生新的变化,而在风控数据量大、更新速度快的情况下,模型更新的数据处理压力较大,无法对意图识别模型进行及时的更新,这就可能导致无法通过意图识别模型确定新的用户反馈信息对应的用户的真实意图,风控效果差,因此,需要一种在风控场景下,能及时准确的确定用户真实意图以进行风险控制的解决方案。为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
以目标业务为电子设备(即终端设备或服务器)中安装的资源管理应用程序中的资源转移业务为例,目标用户可以触发启动资源管理应用程序,并在该资源管理应用程序中触发执行资源转移业务。电子设备在检测到目标用户触发执行目标业务的情况下,可以输出目标话术,并接收目标用户针对目标话术输入的反馈信息。
例如,如图2所示,电子设备在检测到目标用户触发执行资源转移业务的情况下,可以显示带有预设提示信息(即话术Q1、话术Q2)的提示页面,并可以接收目标用户针对该预设提示信息在提示页面输入的反馈信息。
在接收到目标用户针对话术输入的反馈信息后,可以将多个话术中的一个或多个确定为目标话术,并获取与目标话术对应的目标关键词。例如,可以将图2中的话术Q1以及话术Q2中的一个或两个作为目标话术,再通过预设的关键词字典,对目标话术进行关键词匹配,将与关键词字典中匹配的关键词,作为目标话术对应的目标关键词,具体如,目标话术可以为话术Q2,话术Q2与关键词字典相匹配的关键词可以为“返利”和“佣金”,那么,目标话术对应的目标关键词即可以为“返利”和“佣金”。
另外,在与目标用户针对目标业务进行交互的过程中,可能有多个话术以及对应的反馈信息,且这多个话术之间可能存在预设关联关系(如图3所示),例如,如图2和图3所示,在目标用户针对话术Q1的反馈信息为“对,网上认识的。”的情况下,终端设备可以获取与该反馈信息对应的话术Q2,若根据目标用户针对Q1的反馈信息,确定输出的话术为Q3,则可以再根据目标用户针对话术Q3的反馈信息,确定再次输出的话术(如话术Q4或话术Q5),直到无可输出话术或目标用户结束交互过程为止,然后,可以结合图3所示的话术之间的预设关联关系以及输出的话术,确定目标话术。例如,假设输出的话术为:话术Q1-话术Q3-话术Q4,为提高数据处理效率,可以根据话术的优先级,确定目标话术,如可以将优先级较高的话术Q3和话术Q4确定为目标话术。
上述目标话术的确定方法是一种可选地、可实现的获取方法,在实际应用场景中,还可以有多种不同的获取方法,可以根据实际应用场景的不同而有多不同,本说明书实施例对此不作具体限定。
此外,目标话术对应的目标关键词可以是目标话术中包含的词,也可以是目标话术中不包含的词,例如,假设目标话术为“是否在交备用金”,则对应的目标关键词可以包括目标话术中包含的词“备用金”,也可以包括目标话术中不包含的词,如“贷款”、“欺诈”等。
上述目标话术对应的目标关键词的获取方法也是一种可选地、可实现的获取方法,在实际应用场景中,还可以有多种不同的获取方法,如可以在人工输入目标话术阶段,由人工确定目标话术对应的目标关键词等,目标话术对应的目标关键词的获取方法可以根据实际应用场景的不同而有多不同,本说明书实施例对此不作具体限定。
在S104中,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型。
其中,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,意图类型可以包括确认类、否认类和其他等,预先学习的句式知识可以是在对分类模型进行训练的过程中,分类模型学习到的句子结构知识,例如,句式知识可以包括肯定句式、否定句式(包括反问句式等)等,具体如,预先学习的句式知识可以为“xx了”、“有xx”等肯定句式,“什么xx?”、“没有xx”等否定句式,以使预先训练的分类模型可以根据预先学习的句式知识准确的确定反馈信息对应的意图类型。
在实施中,当目标话术有多个时,可以依次将目标话术、目标关键词、反馈信息输入预先训练的分类模型,得到每个反馈信息对应的意图类型。例如,如图2所示,话术Q1和话术Q2都为目标话术,可以将话术Q1、目标关键词1(即与话术Q1对应的目标关键词)、反馈信息A1输入预先训练的分类模型,得到反馈信息A1对应的意图类型,再将话术Q2、目标关键词2(即与话术Q2对应的目标关键词)、反馈信息A2输入预先训练的分类模型,得到反馈信息A2对应的意图类型。
在S106中,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。
在实施中,若目标话术的真实意图是确定转账行为是否存在风险,而与该目标话术对应的反馈信息的意图类型是确认类,则可以确定目标业务存在风险,即可以根据目标话术的真实意图以及反馈信息对应的意图类型,确定目标业务是否存在风险。
此外,如果确定执行目标业务存在风险,则可以暂停执行目标业务,或者,可以向目标用户输出预设告警提示信息,以提示用户触发执行该目标业务存在风险。
在风控数据量大、更新速度快的情况下,如果重新采集新的反馈信息对分类模型进行再训练,就存在耗时较大、风控延迟较高的问题,且在将交互***打包成产品交付给其他客户时,采集新的数据以及重新进行模型训练的成本较大,而基于上述步骤S102~S106,在针对目标话术的反馈信息发生新的变化的情况下,仍可以根据预先训练的分类模型准确的确定反馈信息对应的意图类型,并根据目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险,而不需要对分类模型进行再训练,提高了风险控制的及时性和准确性。
本说明书实施例提供一种数据处理方法,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。这样,由于预先训练的分类模型可以基于预先学习的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息对应的意图类型,实现自适应识别新反馈信息的意图的效果,在根据目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例二
本说明书实施例提供一种数据处理方法,该方法的执行主体可以为终端设备或服务器,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
在S102中,获取目标用户对目标话术的反馈信息。
如图4所示,在获取到目标用户对目标话术的反馈信息后,可以通过S402~S404,获取目标话术对应的目标关键词。
在S402中,基于目标话术和预先训练的关键词提取模型,确定目标话术对应的第一关键词。
其中,关键词提取模型为可以基于历史话术对由机器学习算法构建的模型进行训练得到。
在实施中,可以基于预设训练周期获取预设数量的历史话术,并基于预设数量的历史话术对由神经网络算法构建的关键词提取模型进行训练,得到预先训练的关键词提取模型。
再将目标话术输入预先训练的关键词提取模型,得到目标话术对应的一个或多个第一关键词。
在S404中,对第一关键词进行筛选处理,得到目标话术对应的目标关键词。
在实施中,由于基于关键词提取模型得到的第一关键词中,可以包含不能表征目标话术的真实意图的关键词,例如,假设目标话术为“是否是可信机构联系您进行转账”,基于预先训练的关键词提取模型提取出的第一关键词可以包括“可信机构”和“转账”,由于该目标话术的真实意图是确定转账行为是否存在风险,而第一关键词“可信机构”并不能体现出该行为(即转账行为)的风险性,所以,需要对第一关键词进行筛选处理,得到能够表征目标话术的真实意图的关键词。
例如,可以采取人工审核的方式,对第一关键词进行筛选处理,得到目标话术对应的目标关键词,除此之外,还可以有多种筛选处理方式,可以根据实际应用场景的不同选取不同的筛选处理方式,本说明书实施例对此不做具体限定。
此外,如图5所示,在获取到目标用户对目标话术的反馈信息后,还可以通过S502~S504,获取目标话术对应的目标关键词。
在S502中,基于目标话术和预先训练的关键词提取模型,确定目标话术对应的第一关键词。
其中,关键词提取模型可以为基于历史话术对由机器学习算法构建的模型进行训练得到。
在S504中,基于预先构建的关键词对应关系,获取与第一关键词对应的目标关键词。
在实施中,例如,假设预先构建的关键词对应关系可以如下表1所示,可以根据表1中的关键词对应关系,获取与第一关键词对应的目标关键词。
表1
第一关键词 目标关键词
转账 转账、汇款、付款
佣金 佣金、转账、支付
返利 转账、支付
另外,在得到第一关键词后,也可以对第一关键词进行筛选处理,并根据筛选处理后的第一关键词和预先构建的关键词对应关系,获取与筛选处理后的第一关键词对应的目标关键词。
在S104中,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型。
其中,预先训练的分类模型可以用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型。
如图4或图5所示,在得到反馈信息对应的意图类型后,若目标话术有多个,则可以继续执行S406~S408,以确定目标业务是否存在风险。
在S406中,基于目标话术对应的预设权重、反馈信息以及反馈信息对应的意图类型,确定每个目标话术对应的风险分值。
在实施中,可以根据目标话术对应的预设权重、目标话术的真实意图以及反馈信息对应的意图类型,确定目标话术的反馈信息的风险分值,例如,假设意图类型包括确认类、否认类和其他类,若目标话术是“是否是可信机构联系您进行转账”,则针对该目标话术的不同的意图类型对应的基础分值可以为:确认类对应的基础分值可以为1,否认类对应的基础分值可以为0,其他类对应的基础分值可以为0.5。可以根据反馈信息对应的意图类型,确定该目标话术的基础风险分值,在通过目标话术对应的预设权重,确定该目标话术的反馈信息对应的风险分值,如针对该目标话术的反馈信息的意图类型为确认类,针对该目标话术的预设权重为1.2,则该目标话术的反馈信息对应的风险分值可以为1*1.2=1.2。
上述目标话术对应的风险分值的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不做具体限定。
在S408中,基于每个目标话术对应的风险分值,确定目标业务是否存在风险。
在实施中,可以将目标话术对应的风险分值的均值、和值、最大值等数值中的一个确定为触发执行目标业务的目标分值,若该目标分值大于预设风险分值,则可以确定目标业务存在风险。
或者,还可以根据每个目标话术的反馈信息对应的风险分值与预设风险分值之间的关系,确定存在风险的反馈信息的数量,若该数量大于预设数量阈值,则可以确定目标业务存在风险。例如,假设预设数量阈值为2,目标话术可以有5个,若存在3个目标话术对应的反馈信息的风险分值大于预设风险分值,则可以认为触发执行该目标业务存在风险。
上述目标业务是否存在风险的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不做具体限定。
本说明书实施例提供一种数据处理方法,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。这样,由于预先训练的分类模型可以基于预先学习的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息对应的意图类型,实现自适应识别新反馈信息的意图的效果,在根据目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例三
如图6A和图6B所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为终端设备或服务器,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。
该方法具体可以包括以下步骤:
在S602中,获取历史话术,历史话术的历史反馈信息,以及历史反馈信息对应的意图类型。
在实施中,可以基于预设训练周期获取预设数量的历史话术,以及与每个历史话术对应的历史反馈信息、每个历史反馈信息对应的意图类型。
在S604中,获取与历史话术对应的第一关键词。
在实施中,历史话术对应的第一关键词的获取方法可以参见实施例一和实施例二中的目标话术的目标关键词的获取方法,在此不再赘述。
在S606中,基于历史话术、第一关键词、历史反馈信息以及历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型。
其中,预先训练的分类模型可以用于基于目标话术、目标话术的反馈信息、目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定目标话术的反馈信息对应的意图类型。
这样,可以让分类模型学习到关键词附近的句式是代表肯定还是代表否定,当反馈信息发生新的变化时,可以根据目标话术对应的目标关键词知识,结合分类模型已经学习到的句式知识,判断用户的意图(即反馈信息的意图类型),无需人工设计规则,且对分类模型的修改较小,训练过程较方便。
本说明书实施例提供一种数据处理方法,通过获取历史话术,历史话术的历史反馈信息,以及历史反馈信息对应的意图类型,获取与历史话术对应的第一关键词,基于历史话术、第一关键词、历史反馈信息以及历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,预先训练的分类模型可以用于基于目标话术、目标话术的反馈信息、目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定目标话术的反馈信息对应的意图类型。这样,由于预先训练的分类模型可以基于在训练过程中嘘嘘到的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息的意图类型,实现自适应识别新反馈信息对应的意图的效果,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例四
如图7所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为终端设备或服务器,终端设备可以如个人计算机等设备,也可以如手机、平板电脑等移动终端设备,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:
在S602中,获取历史话术,历史话术的历史反馈信息,以及历史反馈信息对应的意图类型。
在S604中,获取与历史话术对应的第一关键词。
在S702中,基于历史话术和历史反馈信息,确定语义字符序列。
在实施中,假设历史话术为“对方有没有要求您下载指定的APP呢?”,对应的历史反馈信息为“下载了”,则可以确定如图8所示的语义字符序列,即可以基于历史话术和历史反馈信息中包含的字符,确定语义字符序列。
在S704中,基于语义字符序列中每个字符的位置信息,确定字符位置序列。
在实施中,如图8所示,字符位置序列中的序列号即为语义字符序列中每个字符的位置信息。
在S706中,基于历史话术、历史反馈信息和第一关键词,确定语句分块序列。
在实施中,在实际应用中,上述S706的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤三处理:
步骤一,将历史话术确定为第一语块,并生成与第一语块对应的第一子序列。
在实施中,第一子序列中的序列号可以相同,例如,如图8所示的语句分块序列中与第一语块对应的第一子序列中的序列号可以为“0”。
步骤二,将历史反馈信息确定为第二语块,并基于第一关键词和第二语块,生成第二子序列。
在实施中,可以将第二语块中与第一关键词匹配的字符对应的序列号确定为第一序列号,与目标关键词不匹配的字符对应的序列号确定为第二序列号,第一序列号与第二序列号不同,再基于第一序列号和第二序列号,确定第二子序列。
例如,如图8所示,假设第一关键词为“下载”,则第二子序列中与该第一关键词匹配的字符对应的序列号可以为第一序列号(即“2”),与该第一关键词不匹配的字符对应的序列号可以为第二序列号(即“1”)。
上述第二子序列的确定方法是一种可选地、可实现的确定方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同而有所不同,本说明书实施例对此不做具体限定。
步骤三,基于第一子序列和第二子序列,确定语句分块序列。
其中,第一子序列中的序列号与第二子序列中的序列号不同。
这样,由于第一子序列中的序列号与第二子序列中的序列号不同,所以,可以通过第一子序列和第二子序列实现语句分块,并且,在第二子序列中,还可以根据第一序列号和第二序列号,实现对“第一关键词”的标注,即将反馈信息中与第一关键词匹配的字符在第二子序列中标注出来,便于分类模型根据语句分块序列,学习关键词附近的句式知识。
在S708中,将语义字符序列、字符位置序列和语句分块序列输入分类模型进行训练,得到预先训练的分类模型。
在实施中,可以基于语义字符序列、字符位置序列和语句分块序列,确定目标特征向量,在将目标特征向量输入分类模型进行训练。
在实际应用中,上述S708的处理方式可以多种多样,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤三处理:
步骤一,在每次迭代训练时,生成随机概率。
在实施中,可以基于预设随机数生成算法,在每次迭代训练时,生成随机概率。
步骤二,若历史反馈信息中包含与第一关键词匹配的目标字符,且随机概率大于预设概率阈值,则对语义字符序列中与目标字符对应的字符进行屏蔽处理或替换处理,得到处理后的语义字符序列。
在实施中,为了使分类模型能够更好的学习到语义字符序列中的信息,可以在训练过程中有概率的屏蔽或替换第一关键词,以强制分类模型利用处理后的语义字符序列进行判断。
具体地,若在迭代训练时生成的随机概率大于预设概率阈值,且历史反馈信息中包含与第一关键词匹配的目标字符,则可以对语义字符序列中与目标字符对应的字符进行随机替换处理,或将语义字符序列中与目标字符对应的字符替换为[mask],以得到处理后的语义字符序列。
步骤三,将处理后的语义字符序列、字符位置序列和语句分块序列输入分类模型进行迭代训练,得到预先训练的分类模型。
在实施中,也可以基于处理后的语义字符序列、字符位置序列和语句分块序列,确定目标特征向量,在将目标特征向量输入分类模型进行训练。
此外,实施例一和实施例二中采用的预先训练的分类模型可以如实施例三和实施例四中的预先训练的分类模型,且实施例一和实施例二中将目标话术、目标关键词以及反馈信息输入分类模型进行处理的过程,也可参见实施例三和实施例四中的模型训练过程。
本说明书实施例提供一种数据处理方法,通过获取历史话术,历史话术的历史反馈信息,以及历史反馈信息对应的意图类型,获取与历史话术对应的第一关键词,基于历史话术、第一关键词、历史反馈信息以及历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,预先训练的分类模型可以用于基于目标话术、目标话术的反馈信息、目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定目标话术的反馈信息对应的意图类型。这样,由于预先训练的分类模型可以基于在训练过程中嘘嘘到的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息的意图类型,实现自适应识别新反馈信息对应的意图的效果,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例五
以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图9所示。
该数据处理装置包括:信息获取模块901、类型确定模块902和风险确定模块903,其中:
信息获取模块901,用于获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
类型确定模块902,用于基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
风险确定模块903,用于基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
本说明书实施例中,所述信息获取模块901,用于:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
对所述第一关键词进行筛选处理,得到所述目标话术对应的目标关键词。
本说明书实施例中,所述信息获取模块901,用于:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
基于预先构建的关键词对应关系,获取与所述第一关键词对应的所述目标关键词。
本说明书实施例中,所述目标话术有多个,所述风险确定模块903,用于:
基于所述目标话术对应的预设权重、所述反馈信息以及所述反馈信息对应的意图类型,确定每个所述目标话术对应的风险分值;
基于所述每个所述目标话术对应的风险分值,确定所述目标业务是否存在风险。
本说明书实施例提供一种数据处理装置,本说明书实施例提供一种数据处理方法,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。这样,由于预先训练的分类模型可以基于预先学习的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息对应的意图类型,实现自适应识别新反馈信息对应的意图的效果,在根据目标话术和反馈信息的意图类型,确定目标业务是否存在风险,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例六
以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图10所示。
该数据处理装置包括:第一获取模块1001、第二获取模块1002和模型训练模块1003,其中:
第一获取模块1001,用于获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
第二获取模块1002,用于获取与所述历史话术对应的第一关键词;
模型训练模块1003,用于基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
本说明书实施例中,所述模型训练模块1003,用于:
基于所述历史话术和所述历史反馈信息,确定语义字符序列;
基于所述语义字符序列中每个字符的位置信息,确定字符位置序列;
基于所述历史话术、所述历史反馈信息和所述第一关键词,确定语句分块序列;
将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练,得到所述预先训练的分类模型。
本说明书实施例中,所述模型训练模块1003,用于:
将所述历史话术确定为第一语块,并生成与所述第一语块对应的第一子序列;
将所述历史反馈信息确定为第二语块,并基于所述第一关键词和所述第二语块,生成第二子序列;
基于所述第一子序列和所述第二子序列,确定所述语句分块序列,所述第一子序列中的序列号与所述第二子序列中的序列号不同。
本说明书实施例中,所述模型训练模块1003,用于:
将所述第二语块中与所述第一关键词匹配的字符对应的序列号确定为第一序列号,与所述目标关键词不匹配的字符对应的序列号确定为第二序列号,所述第一序列号与所述第二序列号不同;
基于所述第一序列号和所述第二序列号,确定所述第二子序列。
本说明书实施例中,所述模型训练模块1003,用于:
在每次迭代训练时,生成随机概率;
若所述历史反馈信息中包含与所述第一关键词匹配的目标字符,且所述随机概率大于预设概率阈值,则对所述语义字符序列中与所述目标字符对应的字符进行屏蔽处理或替换处理,得到处理后的语义字符序列;
将所述处理后的语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行迭代训练,得到所述预先训练的分类模型。
本说明书实施例提供一种数据处理装置,通过获取历史话术,历史话术的历史反馈信息,以及历史反馈信息对应的意图类型,获取与历史话术对应的第一关键词,基于历史话术、第一关键词、历史反馈信息以及历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,预先训练的分类模型可以用于基于目标话术、目标话术的反馈信息、目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定目标话术的反馈信息对应的意图类型。这样,由于预先训练的分类模型可以基于在训练过程中嘘嘘到的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息的意图类型,实现自适应识别新反馈信息对应的意图的效果,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例七
基于同样的思路,本说明书实施例还提供一种数据处理设备,如图11所示。
数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器1101和存储器1102,存储器1102中可以存储有一个或一个以上存储应用程序或数据。其中,存储器1102可以是短暂存储或持久存储。存储在存储器1102的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器1101可以设置为与存储器1102通信,在数据处理设备上执行存储器1102中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源1103,一个或一个以上有线或无线网络接口1104,一个或一个以上输入输出接口1105,一个或一个以上键盘1106。
具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
可选地,所述获取所述目标话术对应的目标关键词,包括:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
对所述第一关键词进行筛选处理,得到所述目标话术对应的目标关键词。
可选地,所述获取所述目标话术对应的目标关键词,包括:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
基于预先构建的关键词对应关系,获取与所述第一关键词对应的所述目标关键词。
可选地,所述目标话术有多个,所述基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险,包括:
基于所述目标话术对应的预设权重、所述反馈信息以及所述反馈信息对应的意图类型,确定每个所述目标话术对应的风险分值;
基于所述每个所述目标话术对应的风险分值,确定所述目标业务是否存在风险。
另外,具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
获取与所述历史话术对应的第一关键词;
基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
可选地,所述基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,包括:
基于所述历史话术和所述历史反馈信息,确定语义字符序列;
基于所述语义字符序列中每个字符的位置信息,确定字符位置序列;
基于所述历史话术、所述历史反馈信息和所述第一关键词,确定语句分块序列;
将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练,得到所述预先训练的分类模型。
可选地,所述基于所述历史话术、所述历史反馈信息和所述第一关键词,确定语句分块序列,包括:
将所述历史话术确定为第一语块,并生成与所述第一语块对应的第一子序列;
将所述历史反馈信息确定为第二语块,并基于所述第一关键词和所述第二语块,生成第二子序列;
基于所述第一子序列和所述第二子序列,确定所述语句分块序列,所述第一子序列中的序列号与所述第二子序列中的序列号不同。
可选地,所述基于所述第一关键词和所述第二语块,生成第二子序列,包括:
将所述第二语块中与所述第一关键词匹配的字符对应的序列号确定为第一序列号,与所述目标关键词不匹配的字符对应的序列号确定为第二序列号,所述第一序列号与所述第二序列号不同;
基于所述第一序列号和所述第二序列号,确定所述第二子序列。
可选地,所述将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练,得到所述预先训练的分类模型,包括:
在每次迭代训练时,生成随机概率;
若所述历史反馈信息中包含与所述第一关键词匹配的目标字符,且所述随机概率大于预设概率阈值,则对所述语义字符序列中与所述目标字符对应的字符进行屏蔽处理或替换处理,得到处理后的语义字符序列;
将所述处理后的语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行迭代训练,得到所述预先训练的分类模型。
本说明书实施例提供一种数据处理设备,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。这样,由于预先训练的分类模型可以基于预先学习的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息对应的意图类型,实现自适应识别新反馈信息的意图的效果,在根据目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
实施例八
本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书实施例提供一种计算机可读存储介质,获取目标用户对目标话术的反馈信息,并获取目标话术对应的目标关键词,目标话术可以用于在与目标用户的交互过程中,获取目标用户针对目标业务的反馈信息,基于目标话术、目标关键词、反馈信息以及预先训练的分类模型,确定反馈信息对应的意图类型,预先训练的分类模型用于根据目标关键词、目标话术、反馈信息,以及预先学习的句式知识,确定反馈信息对应的意图类型,基于目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险。这样,由于预先训练的分类模型可以基于预先学习的句式知识,结合目标话术对应的目标关键词等,确定目标用户的反馈信息对应的意图类型,所以,在用户的反馈信息产生新的变化的情况下,可以不用重新对分类模型进行训练,就能准确的确定目标用户的反馈信息对应的意图类型,实现自适应识别新反馈信息的意图的效果,在根据目标话术和反馈信息对应的意图类型,确定目标业务是否存在风险,即可以在风控场景下,能及时准确的确定用户真实意图以进行风险控制。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (15)

1.一种数据处理方法,包括:
获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
2.根据权利要求1所述的方法,所述获取所述目标话术对应的目标关键词,包括:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
对所述第一关键词进行筛选处理,得到所述目标话术对应的目标关键词。
3.根据权利要求1所述的方法,所述获取所述目标话术对应的目标关键词,包括:
基于所述目标话术和预先训练的关键词提取模型,确定所述目标话术对应的第一关键词,所述关键词提取模型为基于历史话术对由机器学习算法构建的模型进行训练得到;
基于预先构建的关键词对应关系,获取与所述第一关键词对应的所述目标关键词。
4.根据权利要求2或3所述的方法,所述目标话术有多个,所述基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险,包括:
基于所述目标话术对应的预设权重、所述反馈信息以及所述反馈信息对应的意图类型,确定每个所述目标话术对应的风险分值;
基于所述每个所述目标话术对应的风险分值,确定所述目标业务是否存在风险。
5.一种数据处理方法,包括:
获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
获取与所述历史话术对应的第一关键词;
基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
6.根据权利要求5所述的方法,所述基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,包括:
基于所述历史话术和所述历史反馈信息,确定语义字符序列;
基于所述语义字符序列中每个字符的位置信息,确定字符位置序列;
基于所述历史话术、所述历史反馈信息和所述第一关键词,确定语句分块序列;
将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练,得到所述预先训练的分类模型。
7.根据权利要求6所述的方法,所述基于所述历史话术、所述历史反馈信息和所述第一关键词,确定语句分块序列,包括:
将所述历史话术确定为第一语块,并生成与所述第一语块对应的第一子序列;
将所述历史反馈信息确定为第二语块,并基于所述第一关键词和所述第二语块,生成第二子序列;
基于所述第一子序列和所述第二子序列,确定所述语句分块序列,所述第一子序列中的序列号与所述第二子序列中的序列号不同。
8.根据权利要求6所述的方法,所述基于所述第一关键词和所述第二语块,生成第二子序列,包括:
将所述第二语块中与所述第一关键词匹配的字符对应的序列号确定为第一序列号,与所述目标关键词不匹配的字符对应的序列号确定为第二序列号,所述第一序列号与所述第二序列号不同;
基于所述第一序列号和所述第二序列号,确定所述第二子序列。
9.根据权利要求7所述的方法,所述将所述语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行训练,得到所述预先训练的分类模型,包括:
在每次迭代训练时,生成随机概率;
若所述历史反馈信息中包含与所述第一关键词匹配的目标字符,且所述随机概率大于预设概率阈值,则对所述语义字符序列中与所述目标字符对应的字符进行屏蔽处理或替换处理,得到处理后的语义字符序列;
将所述处理后的语义字符序列、所述字符位置序列和所述语句分块序列输入所述分类模型进行迭代训练,得到所述预先训练的分类模型。
10.一种数据处理装置,包括:
信息获取模块,用于获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
类型确定模块,用于基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
风险确定模块,用于基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
11.一种数据处理装置,包括:
第一获取模块,用于获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
第二获取模块,用于获取与所述历史话术对应的第一关键词;
模型训练模块,用于基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
12.一种数据处理设备,所述数据处理设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
13.一种数据处理设备,所述数据处理设备为区块链***中的设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
获取与所述历史话术对应的第一关键词;
基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
14.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:
获取目标用户对目标话术的反馈信息,并获取所述目标话术对应的目标关键词,所述目标话术用于在与所述目标用户的交互过程中,获取所述目标用户针对目标业务的反馈信息;
基于所述目标话术、所述目标关键词、所述反馈信息以及预先训练的分类模型,确定所述反馈信息对应的意图类型,所述预先训练的分类模型用于根据所述目标关键词、所述目标话术、所述反馈信息,以及预先学习的句式知识,确定所述反馈信息对应的意图类型;
基于所述目标话术和所述反馈信息对应的意图类型,确定所述目标业务是否存在风险。
15.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:
获取历史话术,所述历史话术的历史反馈信息,以及所述历史反馈信息对应的意图类型;
获取与所述历史话术对应的第一关键词;
基于所述历史话术、所述第一关键词、所述历史反馈信息以及所述历史反馈信息对应的意图类型,对分类模型进行训练,得到预先训练的分类模型,所述预先训练的分类模型用于基于目标话术、所述目标话术的反馈信息、所述目标话术对应的目标关键词,以及在训练过程中学习到的句式知识,确定所述目标话术的反馈信息对应的意图类型。
CN202210461027.5A 2022-04-28 2022-04-28 数据处理方法、装置及设备 Pending CN114880472A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210461027.5A CN114880472A (zh) 2022-04-28 2022-04-28 数据处理方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210461027.5A CN114880472A (zh) 2022-04-28 2022-04-28 数据处理方法、装置及设备

Publications (1)

Publication Number Publication Date
CN114880472A true CN114880472A (zh) 2022-08-09

Family

ID=82672632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210461027.5A Pending CN114880472A (zh) 2022-04-28 2022-04-28 数据处理方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114880472A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115423485A (zh) * 2022-11-03 2022-12-02 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备
CN115658891A (zh) * 2022-10-18 2023-01-31 支付宝(杭州)信息技术有限公司 一种意图识别的方法、装置、存储介质及电子设备
WO2024093403A1 (zh) * 2022-11-03 2024-05-10 支付宝(杭州)信息技术有限公司 一种意图识别方法、装置、设备及可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815314A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 一种意图识别方法、识别设备及计算机可读存储介质
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN112988991A (zh) * 2021-02-04 2021-06-18 支付宝(杭州)信息技术有限公司 一种通过人机对话进行反欺诈干预的方法和***
CN113033160A (zh) * 2019-12-09 2021-06-25 阿里巴巴集团控股有限公司 对话的意图分类方法及设备和生成意图分类模型的方法
CN113094481A (zh) * 2021-03-03 2021-07-09 北京智齿博创科技有限公司 意图识别方法、装置、电子设备及计算机可读存储介质
WO2021232725A1 (zh) * 2020-05-22 2021-11-25 百度在线网络技术(北京)有限公司 基于语音交互的信息核实方法、装置、设备和计算机存储介质
CN113836930A (zh) * 2021-09-28 2021-12-24 浙大城市学院 一种中文危险化学品命名实体识别方法
CN113837638A (zh) * 2021-09-29 2021-12-24 支付宝(杭州)信息技术有限公司 话术确定方法、装置及设备
CN113901837A (zh) * 2021-10-19 2022-01-07 斑马网络技术有限公司 一种意图理解方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN109815314A (zh) * 2019-01-04 2019-05-28 平安科技(深圳)有限公司 一种意图识别方法、识别设备及计算机可读存储介质
CN113033160A (zh) * 2019-12-09 2021-06-25 阿里巴巴集团控股有限公司 对话的意图分类方法及设备和生成意图分类模型的方法
WO2021232725A1 (zh) * 2020-05-22 2021-11-25 百度在线网络技术(北京)有限公司 基于语音交互的信息核实方法、装置、设备和计算机存储介质
CN112988991A (zh) * 2021-02-04 2021-06-18 支付宝(杭州)信息技术有限公司 一种通过人机对话进行反欺诈干预的方法和***
CN113094481A (zh) * 2021-03-03 2021-07-09 北京智齿博创科技有限公司 意图识别方法、装置、电子设备及计算机可读存储介质
CN113836930A (zh) * 2021-09-28 2021-12-24 浙大城市学院 一种中文危险化学品命名实体识别方法
CN113837638A (zh) * 2021-09-29 2021-12-24 支付宝(杭州)信息技术有限公司 话术确定方法、装置及设备
CN113901837A (zh) * 2021-10-19 2022-01-07 斑马网络技术有限公司 一种意图理解方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658891A (zh) * 2022-10-18 2023-01-31 支付宝(杭州)信息技术有限公司 一种意图识别的方法、装置、存储介质及电子设备
CN115423485A (zh) * 2022-11-03 2022-12-02 支付宝(杭州)信息技术有限公司 数据处理方法、装置及设备
WO2024093403A1 (zh) * 2022-11-03 2024-05-10 支付宝(杭州)信息技术有限公司 一种意图识别方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
Kamath et al. Deep learning for NLP and speech recognition
CN111563144B (zh) 基于语句前后关系预测的用户意图识别方法及装置
CN114880472A (zh) 数据处理方法、装置及设备
US11847423B2 (en) Dynamic intent classification based on environment variables
CN108346107B (zh) 一种社交内容风险识别方法、装置以及设备
CN111428042A (zh) 对话服务中的实体级澄清
US20230029759A1 (en) Method of classifying utterance emotion in dialogue using word-level emotion embedding based on semi-supervised learning and long short-term memory model
WO2021012649A1 (zh) 问答样本的扩展方法及装置
CN111930623B (zh) 一种测试案例构建方法、装置及电子设备
CN110674188A (zh) 一种特征提取方法、装置及设备
CN115545002B (zh) 一种模型训练和业务处理的方法、装置、存储介质及设备
JP2022040026A (ja) エンティティリンキング方法、装置、電子デバイス及び記憶媒体
CN113837638A (zh) 话术确定方法、装置及设备
CA3123387C (en) Method and system for generating an intent classifier
CN114969293A (zh) 数据处理方法、装置及设备
CN111831814A (zh) 摘要生成模型的预训练方法、装置、电子设备和存储介质
CN113297366A (zh) 多轮对话的情绪识别模型训练方法、装置、设备及介质
Tajane et al. AI based chat-bot using azure cognitive services
CN113836268A (zh) 文档理解方法及装置、电子设备和介质
US20220414344A1 (en) Method and system for generating an intent classifier
CN113312451B (zh) 文本标签确定方法和装置
CN113887206A (zh) 一种模型训练及关键词提取方法及装置
CN116308738B (zh) 一种模型训练的方法、业务风控的方法及装置
CN116127062A (zh) 预训练语言模型的训练方法、文本情感分类方法及装置
CN111046658B (zh) 一种乱序文本识别方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination