CN113112282A - 基于客户画像处理咨诉问题的方法、装置、设备及介质 - Google Patents
基于客户画像处理咨诉问题的方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113112282A CN113112282A CN202110423425.3A CN202110423425A CN113112282A CN 113112282 A CN113112282 A CN 113112282A CN 202110423425 A CN202110423425 A CN 202110423425A CN 113112282 A CN113112282 A CN 113112282A
- Authority
- CN
- China
- Prior art keywords
- client
- consult
- information
- portrait
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 230000009193 crawling Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 19
- 230000006399 behavior Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000008901 benefit Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000003068 static effect Effects 0.000 claims description 5
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013016 damping Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
- G06Q30/016—After-sales
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能领域,尤其涉及分类领域的一种基于客户画像处理咨诉问题的方法、装置、设备及介质。本发明包括:获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键词;通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生成客户画像,得到客户二级标签。通过客户画像和基于客户二级标签生成咨诉处理建议使咨诉处理人员更加全面的快速地了解客户的性格、爱好、学历、潜在需求等信息,更准确的把握客户工单的需求,加快处理工单的速度,缩短工单处理时效,减少电话回访客户、分析问题的时间,提高客户满意度和节省人工。
Description
技术领域
本发明涉及人工智能领域,尤其涉及分类领域的一种基于客户画像处理 咨诉问题的方法、装置、设备及介质。
背景技术
随着网络技术的迅速发展,网上办理业务的方式越来越普及。在进行网 上办理业务时,客户通常会因为对客服的服务态度、业务费用等问题进行电 话咨诉,如响应或处理的结果不满意,会进一步向上级监管部门咨诉。现有 的处理方法是通过坐席把客户的诉求以工单的形式录入咨诉工单***。一般 通过这两个主要步骤处理客户工单:
1、根据工单的内容、紧急程度、业务类别等信息理解待处理的工单。
2、电话客户,进一步了解确认客户的诉求,处理工单。
由于坐席理解上的差异,录入的工单质量参差不齐,工单往往并不能准 确反映客户的诉求,加上咨诉处理人员通常并不了解客户的具体情况,且没 有指导性的去回访客户,工单处理结果容易给客户造成比较差的体验,且浪 费了大量人力和时间分析问题、回访客户。
发明内容
基于此,有必要针对上述技术问题,提供一种基于客户画像处理咨诉问 题的方法、装置、设备及介质,当有客户的咨诉工单需要处理时,将该客户 的客户画像和基于客户二级标签生成咨诉处理建议可视化的展现给咨诉处理 人员,使咨诉处理人员能够更加全面的快速地了解目标客户的性格、爱好、 学历、潜在需求等信息,更准确的把握客户工单的需求,加快处理工单的速 度,缩短工单处理时效,减少电话回访客户、分析问题的时间,提高客户满 意度和节省人工。
一种基于客户画像处理咨诉问题的方法,包括:
获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键 词;
通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生 成客户画像,得到客户二级标签。
一种基于客户画像处理咨诉问题的装置,包括:
关键词模块,用于获取客户咨诉信息,将所述客户咨诉信息进行语义分 析,得到咨诉关键词;
一级标签模块,用于通过网络数据爬取表征客户行为信息和基本信息的 客户一级标签;
二级标签模块,将所述咨诉关键词和所述客户一级标签输入客户画像模 型进行分析,生成客户画像,得到客户二级标签。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在 所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令 时实现上述基于客户画像处理咨诉问题的方法。
一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指 令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述基于 客户画像处理咨诉问题的方法。
上述基于客户画像处理咨诉问题的方法、装置、设备及介质,获取客户 咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键词,明确了客 户咨诉的关键词;进一步的,通过网络数据爬取表征客户行为信息和基本信 息的客户一级标签,获得了客户更多的现有信息资料;将所述咨诉关键词和 所述客户一级标签输入客户画像模型进行分析,生成客户画像,得到客户二 级标签,基于客户一级标签所获得的客户的二级标签更加丰富,基于所述关 键词所获得的客户二级标签更加准确。通过客户画像和基于客户二级标签生 成咨诉处理建议使咨诉处理人员能够更加全面的快速地对咨诉处理问题作出 处理判断,更准确的把握目标客户工单的需求,加快处理工单的速度,缩短 工单处理时效,减少电话回访客户、分析问题的时间,提高客户满意度和节 省人工。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的 描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于客户画像处理咨诉问题的方法的一应用环 境示意图;
图2是本发明一实施例中基于客户画像处理咨诉问题的方法的一流程示 意图;
图3是本发明一实施例中基于客户画像处理咨诉问题的方法的一流程示 意图;
图4是本发明一实施例中基于客户画像处理咨诉问题的方法的一流程示 意图;
图5是本发明一实施例中基于客户画像处理咨诉问题的方法的一流程示 意图;
图6是本发明一实施例中基于客户画像处理咨诉问题的装置的一结构示 意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创 造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供的基于客户画像处理咨诉问题的方法,可应用在如图1的 应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于 各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。 服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于客户画像处理咨诉问题的方 法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10、获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉 关键词。
具体的,当检测到有咨诉工单录入时,获取咨诉工单中坐席人员录入的 咨诉内容生成第一文字文本,并根据咨诉工单中咨诉客户的身份信息在客户 数据库中匹配出客户一段时间内的通话记录,将所述通话记录中的通话语音, 转译成第二文字文本,将所述第二文字文本结合第一文字文本,生成客户咨 诉信息。当咨诉信息生成时,遍历咨诉信息中所包含的文字文本信息,分析 出咨诉信息中语句的句法结构和句中词的词义等信息,根据句法结构和词义 结合上下文关系,抽取出咨诉关键词。例如,一个客户在一周内投诉了银行3 次,将客户给银行的电话内容转译成第一文字文本,通过语义分析抽取出投 诉、抹黑、赔偿等咨诉关键词。
可理解的,语义分析是指根据句子的句法结构和句子中每个实词的词义 推导出来能够反映这个句子意义的某种形式化表示,将人类能够理解的自然 语言转化为计算机能够理解的形式语言。
S20、通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
可理解的,网络数据的来源可以是客户运用的各种社交、服务、生活等 应用软件和相关网络平台。
具体的,通过爬取各种社交、服务、生活等应用软件和相关网络平台的 网络数据,从中获取表征客户行为信息和基本信息的客户一级标签。客户一 级标签包含客户的性别、年龄、职业、教育程度等基本信息和兴趣、购物评 价等行为信息。其中,客户一级标签客户的基本信息和行为信息随着时间的 变化可能产生变化,比如,客户教育程度随时都有可能更新。所以,客户一 级标签可根据需要,定时地进行更新、补充完善。
S30、将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分 析,生成客户画像,得到客户二级标签。
将经过语义分析得到的关键词和爬取网络数据所获得的客户一级标签输 入客户画像模型中,通过客户画像模型中已经形成的映射关系对关键词和客 户一级标签进行匹配分类,得到表征客户咨诉性格的标签和表征客户相关信 息的标签生成客户的客户画像,从客户画像中获取表征客户咨诉性格的标签 作为客户第二标签。其中,客户的咨诉性格可具体分为冷静理性型、利益型、 敏感型和抱怨型,除冷静理性型、利益型、敏感型和抱怨型之外,还可根据 实际实施情况,及时对客户的咨诉性格分类进行完善、更新,使之对客户的咨诉性格作出更准确的分类。
在具体实施例中,获取客户咨诉信息,将所述客户咨诉信息进行语义分 析,得到咨诉关键词,明确了客户咨诉的关键词;进一步的,通过网络数据 爬取表征客户行为信息和基本信息的客户一级标签,获得了客户更多的现有 信息资料;将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分 析,生成客户画像,得到客户二级标签,基于客户一级标签所获得的客户的 二级标签更加丰富,基于所述关键词所获得的客户二级标签更加准确。通过 客户画像和基于客户二级标签生成咨诉处理建议使咨诉处理人员能够更加全 面的快速地对咨诉处理问题作出处理判断,更准确的把握目标客户工单的需 求,加快处理工单的速度,缩短工单处理时效,减少电话回访客户、分析问 题的时间,提高客户满意度和节省人工。
可选的,在步骤S10中,如图3所示,即所述获取客户咨诉信息的方法 包括以下步骤:
S101、当检测到有咨诉工单录入时,获取咨诉工单中坐席人员录入的咨 诉内容生成第一文字文本。
具体的,当***检测到有坐席人员录入新的工单时,即检测到创建了新 的工单,待该咨诉工单录入完成并保存后,发送生成第一文字文本的请求, 获取该咨诉工单中坐席人员录入的客户本次的咨诉内容,并将咨诉内容生成 第一文字文本。
S102、获取所述咨诉工单中客户在客户数据库中一段时间内的通话记录。
具体的,获取咨诉工单中咨诉客户的身份信息,根据客户的身份信息在 客户数据库中匹配出客户一段时间内的通话记录,可理解的,客户数据库用 于存储客户历史通话记录以及通话语音。其中,一段时间可以是预设的某个 时间,比如,一个月或者一个季度。通话记录是客户就客服的服务态度、业 务费用等问题进行电话咨诉的记录。通常,一个客户的咨诉问题会经过多次 通话去沟通解决,所以获取某一段时间内的通话记录能更好的反映客户的诉 求,获取获取某一段时间内的通话记录还能反馈出客户历史咨诉的情况。
S103、将所述通话记录中的通话语音,转译成第二文字文本,将所述第 二文字文本结合第一文字文本,生成客户咨诉信息。
具体的,得到客户一段时间内的通话记录后,依次获取通话记录中所存 储的通话语音,将所获取的通话语音转译成第二文字文本。第二文字文本转 译完成后,将第二文字文本添加在第一文字文本中,使第一文字文本与第二 文字文本相结合,生成客户咨诉信息。客户咨诉信息除了包含本次和某时间 段内客户就客服的服务态度、业务费用等问题,还可包括预设时间段内客户 咨诉的频率和次数。
在具体实施例中,当检测到有咨诉工单录入时,获取咨诉工单中坐席人 员录入的咨诉内容生成第一文字文本;获取所述咨诉工单中客户在客户数据 库中一段时间内的通话记录;将所述通话记录中的通话语音,转译成第二文 字文本,将所述第二文字文本结合第一文字文本,生成客户咨诉信息。通过 获取客户某一段时间内的语音通话和本次客诉工单,使客户咨诉信息更完善。
可选的,步骤S30中,所述客户二级标签表征客户的咨诉性格,所述咨 诉性格可具体分为冷静理性型、利益型、敏感型和抱怨型。
可选的,步骤S30中,还可根据客户二级标签生成咨诉处理建议指导咨 诉处理人员去处理咨诉问题。
具体的,例如,冷静理性型,表示客户在理财购物方面冷静而理性,不 盲目消费或者购买理财业务。当客户为冷静理性型时,建议咨诉处理人员电 话客户就事论事,不盲目引导推荐业务;
利益型,表示客户在理财购物方面比较看中得失。当客户为利益型时, 建议咨诉处理人员考虑该客户可能是想通过咨诉获得相应的补偿,电话客户 沟通处理后,定时进行电话回访;
敏感型,表示客户在理财购物方面的信息比较敏感,容易受一些信息干 扰。当客户为敏感型时,建议建议咨诉处理人员在电话客户时,多点耐心和 客户多沟通;
抱怨型,表示客户在理财购物方面不够冷静,且通常喜欢咨诉。当客户 为抱怨型时,需要细心安抚,定时进行电话回访,引导客户理性理财购物。
另外,还可根据实际实施情况,及时对客户的咨诉性格分类进行完善、 更新,使之对客户的咨诉性格作出更准确的分类。
可选的,在步骤S10中,如图4所示,所述将所述客户咨诉信息进行语 义分析,得到咨诉关键词的方法包括以下步骤:
S104、利用浅层神经网络模型对所述客户咨诉信息自动学习,将所述客 户咨诉信息中包含的词语表示为词向量,并对所述咨诉信息进行数据预处理, 得到候选咨诉关键词。
具体的,利用浅层神经网络模型对客户咨诉信息自动学习,统计客户咨 诉信息中词语出现的情况,并把词语嵌入到100-500的高维空间,在高维空 间中,词语被表示为词向量的形式。
可进一步的,对客户咨诉信息进行分词、词性标注、去重和去除停用词 等数据预处理操作。然后对经过数据预处理操作得到的预处理客户咨诉信息 采用精确模式的结巴分词,获得若干个候选咨诉关键词。其中,结巴分词通 常分为全模式、精确模式和搜索引擎模式这三种模式:全模式,把句子中所 有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;精确模式, 试图将句子最精确地切开,适合文本分析;搜索引擎模式,在精确模式的基 础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
S105、根据所述候选咨诉关键词,获取候选咨诉关键词向量,通过K-Means 算法对所述候选咨诉关键词向量进行聚类分析,得到咨诉关键词。
具体的,遍历候选咨诉关键词,并在词向量中获取与候选咨诉关键词相 对应的词向量表示为候选咨诉关键词向量,通过K-Means算法对候选咨诉关 键词向量进行聚类分析,得到各个类别的聚类中心,并计算各个类别中,组 内词语与聚类中心的欧几里得距离,按距离大熊啊进行降序排列,获取候选 咨诉关键词向量的排名结果,将排名在前的若干个候选咨诉关键词向量的相 对应的候选咨诉关键词作为咨诉关键词。
在具体实施例中,通过利用浅层神经网络模型对所述客户咨诉信息自动 学习,将所述客户咨诉信息中包含的词语表示为词向量,并对所述咨诉信息 进行数据预处理,得到候选咨诉关键词;根据所述候选咨诉关键词,获取候 选咨诉关键词向量,通过K-Means算法对所述候选咨诉关键词向量进行聚类 分析,得到咨诉关键词,从客户咨诉信息中获取咨诉关键字,使客户咨诉信 息更加精确且简短,更有利于准确的分类。
可选的,步骤S20中,如图5所示,所述将所述咨诉关键词和所述客户 一级标签输入客户画像模型进行分析之前还包括:
S201、获取样本客户信息特征,生成训练集。
具体的,通过数据爬取得到样本客户信息特征,将得到的样本客户信息 特征生成一个训练集。其中,信息特征包括性别、年龄、职业、教育程度、 兴趣、理财、购物等相关信息。
S202、计算每个信息特征对所述训练集的基尼系数,选择基尼系数最小 的信息特征对所述训练集进行分类,得到待处理子训练集。
可理解的,训练集的基尼系数反映了从训练集中随机抽取两个样本,其 类别不一样的概率。基尼指数越小,数据集的纯度越高,相比于信息增益, 信息增益比等作为特征选择方法,基尼指数省略了对数计算,运算量比较小。
在分类问题中,假设训练集有k个类别,第k个类别的概率为pK,则第 k个类别对训练集的基尼系数的表达式为:
根据上述基尼系数的表达公式,依次计算出每个信息特征对训练集的基 尼系数并按降序进行排序,选择基尼系数最小的信息特征作为分类节点对训 练集进行分类,得到待处理的子训练集。
S203、对所述待处理子训练集进行递归调用,生成客户画像模型。
具体的,对待处理的子训练集进行递归调用,即对剩余的信息特征进行 步骤S202的调用,直到剩余的信息特征小于等于零终止递归调用时,客户画 像模型也随即生成。
可选的,生成的客户画像模型还需要验证其分类的准确性。
可选的,生成的客户画像模型还可以进行剪枝。
具体的,遍历客户画像模型的每个分类节点,计算出每个分类节点的节 点损失,进而遍历客户画像模型的所有以分类节点为根节点的待处理子训练 集,计算出每个待处理子训练集的损失。
可理解的,客户画像模型的节点数为T,损失函数的表达式为:
Ca(T)=C(T)+a|T|
其中,C(T)为客户画像模型对训练集的损失。a≥0,a代表一个权衡训 练集损失C(T)与结点数T的参数,Ca(T)代表了客户画像模型的整体损失。 当a越大时,|T|越小,客户画像模型的规模越小;反之,当a越小时,|T| 越大,客户画像模型的规模越大。
例如,把客户画像模型的节点t看作叶节点计算其损失:
Ca(t)=C(t)+a|1|
然后计算以t为根节点时,待处理子训练集Tt的损失:
Ca(Tt)=C(Tt)+a|Tt|
当某个分类节点的节点损失小于等于以该分类节点为根节点的待处理子 训练集的损失时,对该分类节点进行剪枝。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后, 各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实 施过程构成任何限定。
在一实施例中,提供一种基于客户画像处理咨诉问题的装置,该基于客 户画像处理咨诉问题的装置与上述实施例中基于客户画像处理咨诉问题的方 法一一对应。如图6所示,该基于客户画像处理咨诉问题的装置包括关键词 模块、一级标签模块和二级标签模块。各功能模块详细说明如下:
关键词模块,用于获取客户咨诉信息,将所述客户咨诉信息进行语义分 析,得到咨诉关键词;
一级标签模块,用于通过网络数据爬取表征客户行为信息和基本信息的 客户一级标签;
二级标签模块,将所述咨诉关键词和所述客户一级标签输入客户画像模 型进行分析,生成客户画像,得到客户二级标签。
可选的,关键词模块,即所述获取客户咨诉信息,包括:第一文字文本 单元、通话记录单元和咨诉信息单元。
第一文字文本单元,用于当检测到有咨诉工单录入时,获取咨诉工单中 坐席人员录入的咨诉内容生成第一文字文本;
通话记录单元,用于获取所述咨诉工单中客户在客户数据库中一段时间 内的通话记录;
咨诉信息单元,用于将所述通话记录中的通话语音,转译成第二文字文 本,将所述第二文字文本结合第一文字文本,生成客户咨诉信息。
可选的,所述二级标签模块还包括:二级标签单元。
二级标签单元,用于表征客户的咨诉性格,所述咨诉性格可具体分为冷 静理性型、利益型、敏感型和抱怨型。
可选的,所述二级标签模块,还包括:咨诉建议单元。
咨诉建议单元,用于根据客户二级标签生成咨诉处理建议指导咨诉处理 人员去处理咨诉问题。
可选的,所述关键词模块,即所述将所述客户咨诉信息进行语义分析, 得到咨诉关键词的方法包括:
候选咨诉关键词单元,用于利用浅层神经网络模型对所述客户咨诉信息 自动学习,将所述客户咨诉信息中包含的词语表示为词向量,并对所述咨诉 信息进行数据预处理,得到候选咨诉关键词;
咨诉关键词单元,用于根据所述候选咨诉关键词,获取候选咨诉关键词 向量,通过K-Means算法对所述候选咨诉关键词向量进行聚类分析,得到咨 诉关键词。
可选的,所述二级标签模块之前,将所述咨诉关键词和所述客户一级标 签输入客户画像模型进行分析之前还包括:
训练集单元,用于获取样本客户信息特征,生成训练集;
待处理子训练集单元,用于计算每个信息特征对所述训练集的基尼系数, 选择基尼系数最小的信息特征对所述训练集进行划分,得到待处理子训练集;
客户画像模型单元,用于对所述待处理子训练集进行递归调用,生成客 户画像模型。
关于基于客户画像处理咨诉问题的装置的具体限定可以参见上文中对于 基于客户画像处理咨诉问题的方法的限定,在此不再赘述。上述基于客户画 像处理咨诉问题的装置中的各个模块可全部或部分通过软件、硬件及其组合 来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中, 也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行 以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器, 其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理 器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计 算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可 读存储介质存储有操作***、计算机可读指令和数据库。该内存储器为可读 存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的 数据库用于存储基于客户画像处理咨诉问题的方法所涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被 处理器执行时以实现一种基于客户画像处理咨诉问题的方法。本实施例所提 供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端, 其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理 器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器 用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存 储器。该非易失性存储介质存储有操作***和计算机可读指令。该内存储器 为可读存储介质中的操作***和计算机可读指令的运行提供环境。该计算机 设备的网络接口用于与外部服务器通过网络连接通信。该计算机可读指令被 处理器执行时以实现一种基于客户画像处理咨诉问题的方法。本实施例所提 供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储 在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读 指令时实现以下步骤:
获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键 词;
通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生 成客户画像,得到客户二级标签。
在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可 读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和 易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读 指令被一个或多个处理器执行时实现以下步骤:
获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键 词;
通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生 成客户画像,得到客户二级标签。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流 程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可 读指令可存储于一非易失性可读取存储介质或易失性可读存储介质中,该计 算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申 请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何 引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存 储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可 擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可 得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、 双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链 路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM (RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动 态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以 上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而 将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划 分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参 照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技 术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱 离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之 内。
Claims (10)
1.一种基于客户画像处理咨诉问题的方法,其特征在于,包括:
获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键词;
通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生成客户画像,得到客户二级标签。
2.如权利要求1所述的基于客户画像处理咨诉问题的方法,其特征在于,所述获取客户咨诉信息的方法包括:
当检测到有咨诉工单录入时,获取咨诉工单中坐席人员录入的咨诉内容生成第一文字文本;
获取所述咨诉工单中客户在客户数据库中一段时间内的通话记录;
将所述通话记录中的通话语音,转译成第二文字文本,将所述第二文字文本结合第一文字文本,生成客户咨诉信息。
3.如权利要求2所述的基于客户画像处理咨诉问题的方法,其特征在于,
所述客户二级标签表征客户的咨诉性格,所述咨诉性格可具体分为冷静理性型、利益型、敏感型和抱怨型。
4.如权利要求3所述的基于客户画像处理咨诉问题的方法,其特征在于,根据客户二级标签生成咨诉处理建议指导咨诉处理人员去处理咨诉问题。
5.如权利要求1所述的基于客户画像处理咨诉问题的方法,其特征在于,所述将所述客户咨诉信息进行语义分析,得到咨诉关键词的方法包括以下步骤:
利用浅层神经网络模型对所述客户咨诉信息自动学习,将所述客户咨诉信息中包含的词语表示为词向量,并对所述咨诉信息进行数据预处理,得到候选咨诉关键词;
根据所述候选咨诉关键词,获取候选咨诉关键词向量,通过K-Means算法对所述候选咨诉关键词向量进行聚类分析,得到咨诉关键词。
6.如权利要求1所述的基于客户画像处理咨诉问题的方法,其特征在于,所述将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析之前还包括:
获取样本客户信息特征,生成训练集;
计算每个信息特征对所述训练集的基尼系数,选择基尼系数最小的信息特征对所述训练集进行划分,得到待处理子训练集;
对所述待处理子训练集进行递归调用,生成客户画像模型。
7.一种基于客户画像处理咨诉问题的装置,其特征在于,包括:
关键词模块,用于获取客户咨诉信息,将所述客户咨诉信息进行语义分析,得到咨诉关键词;
一级标签模块,用于通过网络数据爬取表征客户行为信息和基本信息的客户一级标签;
二级标签模块,将所述咨诉关键词和所述客户一级标签输入客户画像模型进行分析,生成客户画像,得到客户二级标签。
8.如权利要求7所述的基于客户画像处理咨诉问题的装置,其特征在于,所述获取客户咨诉信息包括:
第一文字文本单元,用于当检测到有咨诉工单录入时,获取咨诉工单中坐席人员录入的咨诉内容生成第一文字文本;
通话记录单元,用于获取所述咨诉工单中客户在客户数据库中一段时间内的通话记录;
咨诉信息单元,用于将所述通话记录中的通话语音,转译成第二文字文本,将所述第二文字文本结合第一文字文本,生成客户咨诉信息。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述基于客户画像处理咨诉问题的方法。
10.一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至5中任一项所述基于客户画像处理咨诉问题的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423425.3A CN113112282A (zh) | 2021-04-20 | 2021-04-20 | 基于客户画像处理咨诉问题的方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110423425.3A CN113112282A (zh) | 2021-04-20 | 2021-04-20 | 基于客户画像处理咨诉问题的方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113112282A true CN113112282A (zh) | 2021-07-13 |
Family
ID=76718630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110423425.3A Pending CN113112282A (zh) | 2021-04-20 | 2021-04-20 | 基于客户画像处理咨诉问题的方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113112282A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822062A (zh) * | 2021-09-22 | 2021-12-21 | 未鲲(上海)科技服务有限公司 | 文本数据处理方法、装置、设备及可读存储介质 |
CN114121039A (zh) * | 2021-11-19 | 2022-03-01 | 北京京东振世信息技术有限公司 | 一种声音处理方法、装置、设备及存储介质 |
CN117556802A (zh) * | 2024-01-12 | 2024-02-13 | 碳丝路文化传播(成都)有限公司 | 一种基于大语言模型的用户画像方法、装置、设备及介质 |
CN117610891A (zh) * | 2024-01-22 | 2024-02-27 | 湖南小翅科技有限公司 | 一种基于大数据的灵活用工接单与风险控制*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222333A (zh) * | 2019-05-20 | 2019-09-10 | 平安普惠企业管理有限公司 | 一种语音交互方法、装置以及相关设备 |
CN111210201A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 职业标签建立方法、装置、电子设备及存储介质 |
CN111274380A (zh) * | 2020-01-16 | 2020-06-12 | 平安银行股份有限公司 | 基于大数据的咨询投诉信息处理方法及相关装置 |
-
2021
- 2021-04-20 CN CN202110423425.3A patent/CN113112282A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110222333A (zh) * | 2019-05-20 | 2019-09-10 | 平安普惠企业管理有限公司 | 一种语音交互方法、装置以及相关设备 |
CN111210201A (zh) * | 2020-01-02 | 2020-05-29 | 平安科技(深圳)有限公司 | 职业标签建立方法、装置、电子设备及存储介质 |
CN111274380A (zh) * | 2020-01-16 | 2020-06-12 | 平安银行股份有限公司 | 基于大数据的咨询投诉信息处理方法及相关装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822062A (zh) * | 2021-09-22 | 2021-12-21 | 未鲲(上海)科技服务有限公司 | 文本数据处理方法、装置、设备及可读存储介质 |
CN114121039A (zh) * | 2021-11-19 | 2022-03-01 | 北京京东振世信息技术有限公司 | 一种声音处理方法、装置、设备及存储介质 |
CN117556802A (zh) * | 2024-01-12 | 2024-02-13 | 碳丝路文化传播(成都)有限公司 | 一种基于大语言模型的用户画像方法、装置、设备及介质 |
CN117556802B (zh) * | 2024-01-12 | 2024-04-05 | 碳丝路文化传播(成都)有限公司 | 一种基于大语言模型的用户画像方法、装置、设备及介质 |
CN117610891A (zh) * | 2024-01-22 | 2024-02-27 | 湖南小翅科技有限公司 | 一种基于大数据的灵活用工接单与风险控制*** |
CN117610891B (zh) * | 2024-01-22 | 2024-04-02 | 湖南小翅科技有限公司 | 一种基于大数据的灵活用工接单与风险控制*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11816439B2 (en) | Multi-turn dialogue response generation with template generation | |
US11907274B2 (en) | Hyper-graph learner for natural language comprehension | |
CN108536800B (zh) | 文本分类方法、***、计算机设备和存储介质 | |
CN110222167B (zh) | 一种获取目标标准信息的方法和*** | |
CN113112282A (zh) | 基于客户画像处理咨诉问题的方法、装置、设备及介质 | |
CN110738545A (zh) | 基于用户意向识别的产品推荐方法、装置、计算机设备和存储介质 | |
WO2021139343A1 (zh) | 基于自然语言处理的数据分析方法、装置和计算机设备 | |
CN112380331A (zh) | 信息推送的方法和装置 | |
US11765267B2 (en) | Tool for annotating and reviewing audio conversations | |
US20160283876A1 (en) | System and method for providing automomous contextual information life cycle management | |
CN110377733A (zh) | 一种基于文本的情绪识别方法、终端设备及介质 | |
CN112288279A (zh) | 基于自然语言处理和线性回归的业务风险评估方法和装置 | |
CN113919437A (zh) | 生成客户画像的方法、装置、设备及存储介质 | |
CN114399396A (zh) | 保险产品推荐方法、装置、计算机设备及存储介质 | |
CN112256863A (zh) | 一种确定语料意图的方法、装置及电子设备 | |
CN112597292B (zh) | 问题回复推荐方法、装置、计算机设备和存储介质 | |
CN112860878A (zh) | 业务数据推荐方法、存储介质及设备 | |
CN112749238A (zh) | 搜索排序方法、装置、电子设备以及计算机可读存储介质 | |
CN110197196B (zh) | 问题处理方法、装置、电子设备以及存储介质 | |
CN115481231A (zh) | 会话控制方法、装置、计算机设备和存储介质 | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
CN115129863A (zh) | 意图识别方法、装置、设备、存储介质和计算机程序产品 | |
CN114417045A (zh) | 基于神经网络保险案件抽检方法、***、设备及存储介质 | |
CN114238798A (zh) | 基于神经网络的搜索排序方法、***、设备及存储介质 | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |