CN112685514A - Ai智能客户价值管理平台 - Google Patents
Ai智能客户价值管理平台 Download PDFInfo
- Publication number
- CN112685514A CN112685514A CN202110021661.2A CN202110021661A CN112685514A CN 112685514 A CN112685514 A CN 112685514A CN 202110021661 A CN202110021661 A CN 202110021661A CN 112685514 A CN112685514 A CN 112685514A
- Authority
- CN
- China
- Prior art keywords
- data
- platform
- analysis
- database
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000007726 management method Methods 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 238000005516 engineering process Methods 0.000 claims abstract description 16
- 238000007405 data analysis Methods 0.000 claims abstract description 12
- 230000000007 visual effect Effects 0.000 claims abstract description 12
- 230000008676 import Effects 0.000 claims abstract description 4
- 238000010586 diagram Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 16
- 238000013523 data management Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 11
- 238000007418 data mining Methods 0.000 claims description 10
- 230000002452 interceptive effect Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000008901 benefit Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 210000001503 joint Anatomy 0.000 claims description 5
- 238000007619 statistical method Methods 0.000 claims description 5
- 238000007621 cluster analysis Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000005065 mining Methods 0.000 claims description 4
- 238000012800 visualization Methods 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000008520 organization Effects 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000012300 Sequence Analysis Methods 0.000 claims description 2
- 238000007635 classification algorithm Methods 0.000 claims description 2
- 238000013145 classification model Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 claims description 2
- 238000013500 data storage Methods 0.000 claims description 2
- 238000003066 decision tree Methods 0.000 claims description 2
- 230000003203 everyday effect Effects 0.000 claims description 2
- 239000006260 foam Substances 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 238000000611 regression analysis Methods 0.000 claims description 2
- 239000013589 supplement Substances 0.000 claims description 2
- 230000004083 survival effect Effects 0.000 claims description 2
- 238000012795 verification Methods 0.000 claims description 2
- 238000007794 visualization technique Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 244000035744 Hura crepitans Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及呼叫***的技术领域,特别是涉及一种AI智能客户价值管理平台,整合多渠道入口、AI机器人外呼、大数据分析技术三个主要能力;数据库核心包括采集模块、分群模块、分析模块和数据模块,采集模块:支持多渠道数据导入和采集;分群模块:将客户数据通过大数据算法进行自动分群;分析模块:多维度数据报表及可视化分析界面;数据模块:底层数据库的储存管理。
Description
技术领域
本发明涉及呼叫***的技术领域,特别是涉及一种AI智能客户价值管理平台。
背景技术
传统呼叫中心业务均为劳动密集型,坐席人员需求量大、流失高、业务品质依赖坐席人员经验,使得为支撑业务稳定,人力成本支出占比不断加大,而且随着人口红利消失,工资福利成本也逐步上升,其次Excel、Word等传统管理工具过时数据分配、营销过程和结果不能直接分析和把控,并且新业务无法快速测试和反应,通讯资源缺少专业的呼叫中心运营及资源保障,话费成本高、人工转化率低、浪费数据和时间。
各中小企当前使用的软件和工具均缺乏整合,呼叫中心、通讯资源、BI、自动外呼、客户管理***等,出现***功能上、应用上无法兼容,多平台多环境处理的情况,影响整体效率。
故对产品的要求分为以下5个方面:
呼叫中心***中通过AI技术的运用,将有效降低人工坐席数量,进而降低管理成本、培训成本、人力成本等相关的投入,在同等业务规模下实现呼叫中心“轻量化”;
结合AI技术将有效提升原有业务的自动化处理程度,并且基于语音机器人的特性,也大幅提升企业对业务波动的抵御能力,保障运营稳定;
AI语音机器人的外呼能力大幅优于传统人工坐席,多样化的人机交互方式,有效提升业务效率;
多维度客户画像工具、多元AI交互场景、智配流程管理工具,将助力用户精准获客,增加转化提升经营效益;
灵活的机器人话术配置,多种机器人语音,构建高度拟人化的交互体验,为客户提供满意的服务体验。
发明内容
为解决上述技术问题,本发明提供一种整合多渠道入口、AI机器人外呼、大数据分析技术三个主要能力的AI智能客户价值管理平台。
本发明的AI智能客户价值管理平台,数据库核心包括采集模块、分群模块、分析模块和数据模块,
采集模块:支持多渠道数据导入和采集
数据通过多渠道富媒体的方式进行数据采集,数据类型包括基础数据与平面文本文件(Excel)、音频数据和视频数据等,均采集到我们的大数据平台体系中,平台可适配支持多种类型的数据源,结构化数据采集主要来自于业务***输入,或者通过API接口与其他******对接,或文本文件等形成的结构化数据,数据平台通过ETL(Extract,Transform,Load)进行数据库的构建,将数据平台中所需的数据按数据仓库建立的方法每天或定期从各渠道中进行数据采集,并根据各个不同的渠道数据源进行数据调整,并且平台在数据采集过程中会将原始数据进行抽取、清洗、合并和装载,在此过程中必须保证数据的完备性和数据的一致性,当业务数据量过大,未避免Mysql数据仓库压力过大,亦可将业务数据通过kettle迁移到hadoop平台的数据库Hbase中。
在非结构化数据采集的部分,视频信息、音频信息、微博实时数据、传感器采集的设备数据、移动端收集的数据以及其他流数据等非结构化数据,我们将通过传感器接口、视频接入设备、网络爬虫工具和流处理程序等方式分别进行采集并存储到HDFS和Hbase中。
分群模块:将客户数据通过大数据算法进行自动分群
数据平台基于已采集的数据利用机器学习算法技术,通过特征归类形成近似的分群和分组,数据库训练集由数据库记录(Record)组成,每一条记录包含多个字段或属性(Atribute),构成一个特征向量,训练集每条记录还有一个特定的标签(ClassLabel)与之对应,该类标签采用经验法则由***自动生成,一个具体样本的形式可为样本向量:(v1,v2,...,vn;c),在这里vi表示字段值,c表示类别,分类的目的是分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的描述或者模型,由此生成的类描述用来对未来的测试数据进行分类,虽然随处的是生成的随机变量,***仍可以由此进行归类和定义,故***由此对数据库中的每一个类有一个新的标示,新的数据通过近似的元素将被被聚合,实现数据学习,在持续的学习下将衍生出新的目标函数或规则,把每个属性集x映射到一个预先定义的类标号y。
数据平台中分类模型的构造分为训练和测试两个阶段。在构造模型前,要求将数据集随机的分为训练集和测试集,在训练阶段,使用训练数据集,通过分析由属性描述的数据库元组来构造模型,通过数据的积累和抽检验证评估模型的分类准确率,持续进行数据元组的调优,我们平台的分类算法,是引用KNN近似算法(K-NearestNeighbor)是一种基于实例的分类方法,是一种非参数的分类方法,通过测量不同特征值之间的距离进行分类,它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数,KNN算法中,所选择的邻居都是已经正确分类的对象,该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
KNN方法在类别决策时,只与极少量的相邻样本有关,因此,采用这种方法可以较好的避免样本的不平衡问题,另外,由于KNN方法主要是靠周围有限的临近的样本,而不是靠判别类域的方法来确定所属类别,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为合适,平台数据库针对于计算量大的问题,采用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本,对样本进行组织与整理,分群分层,尽可能将计算压缩在接近测试样本领域的小范围内,避免盲目的与训练样本集中的每个样本进行距离计算,使得***在数据库运行的过程中保持稳定。
分析模块:多维度数据报表及可视化分析界面
数据平台提供的数据分析中的可视化方法及工具,包括表格、直方图、散点图、折线图、柱状图、饼图、面积图、流程图、泡沫图表等,其次常用图表的多个数据系列或组合像时间线、维恩图、数据流图、实体关系图等,其次也包括了专用的分析工具,如平行坐标用于绘制多维度个体数据,树状图用于可视化层次结构,锥形树图用于特殊数据的分层如三维空间中的组织体以及语义网络等。
此外,***的数据挖掘工具采取的是类似Tableau可支持交互式和直观数据分析,内置内存数据引擎来加速可视化处理,利用基于Hadoop的一个数据仓库工具Hive,将查询结构化并为内存分析缓存信息,通过缓存信息,Hadoop集群延迟的可能性会大大减小,为用户与大数据应用提供了一个交互互动机制,平台的大数据分析工具可以轻而易举地处理ZB(十万亿亿字节)和PB(千万亿字节)数据,交互式可视化集群分析方法是集群模式最直接的方法,可视化多维数据便于用户交互式分析数据和认识集群结构。
平行坐标和散点图矩阵通常被用来分析十个维度以内的数据,而星型坐标则可以处理数十个维度,基于星型坐标的集群可视化利用潜在映射模型的性能部分地保持这个位置关系大幅提升数据分析可用性。
数据模块:底层数据库的储存管理
***平台通过关系型数据库MySQL和hadoop的HBase数据库共同承担对结构化的数据的存储和管理,以MySQL建立传统数据仓库来实现对用于结构化数据和元数据的集中存储与管理,并根据需求建立面向部门和主题的数据集市,中央数据仓库将被划分为三个逻辑存储区间:ODS(Operational Data Store)、DW(Data Warehourse)、DM(Data Mar)):ODS将存放各业务***的原始数据,包括与原结构相同的业务数据以及经过初步整理后的业务数据;DW区域存放经过整理过的数据,是大数据分析平台真正的数据中心;DM区域存放各个应用***(web应用、BI、OLAP、Data Mining等)所需的综合数据。与此同时我们在MySQL和HBase数据库之间建立连接,利用Kettle定时进行数据交换,两种数据仓库共同大数据应用提供数据支撑,从而实现数据共享,分摊压力和数据备份的目的。
对于非结构化数据存储和管理方面,由于Mysql不支持对非结构化数据的存储,利用大数据应用框架Hadoop平台的数据仓库作为传统数据仓库的补充,实现对非结构化数据的存储和管理,并对来自网络的海量数据查询提供支撑,Hadoop的多多功能组件HDFS分布式文件***,分布式存储大数据文件,Hbase可扩展的分布式列存储NoSQL数据库,用于存储结构化和非结构化数据,平台为满足不同用户的个性化数据使用需求,***安排提供了三中大数据应用方式,第一种支持利用java或C等开发语言编写程序实现对Hadoop平台和MySQL数据仓库中数据的应用;第二种是适用于IBM-Cognos作为信息共享的工具,Cognos作为多样化的前端分析展示工具,支持建立DMR和OLAP两种模型,提供了在线报表、OlAP分析、仪表板、记分卡、实时查询、Office集成、移动APP等多种信息共享技术;第三种IBM-SPSS作为数据挖掘工具,SPSS支持以Hadoop平台和MySQL搭建挖掘模型,用于统计学分析运算、数据挖掘、预测分析和决策支持任务,支持描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等多类统计分析和挖掘算法。
本发明的AI智能客户价值管理平台,***整体采用前后端分离架构,前端使用JavaScript语言,采用Ant Design of React框架,报表采用Echarts实现前端展示,后端主要采用java开发语言,包括但不限于springboot,mybatis,shiro,druid,tomcat,logback,easyexcel相关组件,底层存储涉及到mysql8.0,Redis 5.0.8,Apache Kafka 2.3.1,Nacos配置中心,阿里云对象存储等。
本发明的AI智能客户价值管理平台,分类学习所获得的模型表示为分类规则形式、决策树形式或数学公式形式。
本发明的AI智能客户价值管理平台,KNN算法中,通过计算对象间距离来作为各个对象之间的非相似性指标,避免了对象之间的匹配问题,同时KNN通过依据k个对象中占优的类别进行决策,而不是单一的对象类别决策,这两点就是KNN算法的优势。
附图说明
图1是本发明的AI智能外呼智配流程架构图;
图2是本发明的数据管理核心图;
图3是本发明的通讯部署架构图;
图4是本发明的核心模块架构图;
图5是本发明的业务流程架构图;
图6是本发明的数据库核心框图;
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例:如图1至图6所示
主要技术:***整体采用前后端分离架构,前端使用JavaScript语言,采用AntDesign of React框架,报表采用Echarts实现前端展示,后端主要采用java开发语言,包括但不限于springboot,mybatis,shiro,druid,tomcat,logback,easyexcel相关组件,底层存储涉及到mysql8.0,Redis 5.0.8,Apache Kafka 2.3.1,Nacos配置中心,阿里云对象存储等,整体实现了整个项目的稳定性和安全性。
语音识别领域研究,声学模型是语音识别的核心技术,语音声学模型用了两种深度学习网络架构的组合cnn+tdnnf,其中cnn用来增强语音特征提取,tdnnf则是业界最新最前沿的声学建模技术、语言模型研究、大数据深度学习及自主可控的语音转写引擎,提高速度响应。
自然语言理解研究,机器人***支持意图、实体、变量及多轮会话赋值等能力,采用语法规则+自然语言理解(NLP)的形式识别客户意图,提升意图识别准确率,降低训练周期与成本,计算句子的语义相似度时,使用TensorFlow框架,训练MatchPyramid、DSSM、LSTM、BERT等多种深度学习的模型用于更深层次的语义理解,最终通过对不同模型的结果的分析,综合了各个模型的优点,训练了我们自己的深度学习模型,将强化学习也引入了的***中,持续提升我们的模型的准确率。
BERT语言表示模型,它代表Transformer的双向编码器表示,与最近的其他语言表示模型不同,BERT旨在通过联合调节所有层中的上下文来预先训练深度双向表示,因此,预训练的BERT表示可以通过一个额外的输出层进行微调,适用于广泛任务的最先进模型的构建,比如问答任务和语言推理,无需针对具体任务做大幅架构修改,双向的意思表示它在处理一个词的时候,能考虑到该词前面和后面单词的信息,从而获取上下文的语义,通过数据化及模型积累降低训练成本提高机器学习效率
语音合成,又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话,研究方向为拟真度及流畅度及合成预算时间优化。
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。
难点问题:通过高度封装的接口和呼叫中心进行了对接,在不影响整体软件架构和部署架构的前提下,使***快速支持了AI自动外呼功能,完成了对各类场景的外呼。
技术路线:通过多端(PC、小程序、H5等)收集,主动上报的机制进行采集数据回收,对采集数据,通过直接处理、自然语言处理、语义分析等多种技术手段进行统计分析,最终形成完整的分析报告,体现出对不同类型的问卷,问卷中不同类型的问题的反馈情况,基于采集的数据,对需要特别关注人员建立用户分群,并通过呼叫中心相关技术对需要重点关注人群进行智能外呼回访,达到对重点人群的重点关注,以及疫情变化的实时监测。
实施方案:
1、数据管理核心
统一数据管理平台,管理所有核心数据及标签,可以不限制扩展标签(自定义),数据管理平台拥有总标签管理定义的权限,数据管理平台和业务流程平台通过加密接口(SSL)交互数据,业务平台可以读取数据管理平台所有标签,但是显示内容由数据管理平台做权限管理,数据管理平台可以导入导出数据,如果重复标签可以进行撞库自动填上标签,并生成日志,数据标签自带业务场景(POS机,教育,或其他)等***标签,并且可以设置,如果撞库的数据,自动更新活跃度,数据可以定义加密和非加密权限数据有立体维度的结构,包括跟进记录,流转记录,购买记录,标签记录等,数据***高可用包括安全性,稳定性,容灾性,支持双机方案,数据***有组织结构及管理权限,数据***可以设置流转的方式,包括子***每天的请求量,请求限制等,数据***具有高可用的分析报表,数据***后期具备自动分类的机器学习能力。
2、业务子***设计
基于***流程设计,可以读取主数据库***标签内容,但是根据子***权限获取和显示数据,支持呼叫中心的前台操作功能,如点击拨号,转接,查看录音等,支持对接云端、本地的IPPBX***,支持号码加密,支持数据获取及像下级分发管理,支持电销的主流程,从数据平台过来的数据直接到公司池进行转化,支持首电客户,支持一般客户,跟进意向数据和非意向数据到子***公共池,并且定时回收至数据管理平台,子***支持域名访问,每个分公司或者渠道客户沙盒部署(即独立部署),一台服务器支持至少支持1000用户,子***支持本地部署,支持回访提醒,支持历史跟进及商机,子***支持快速部署及维护。
3、IPPBX呼叫中心***设计
IPPBX***支持与业务***N对N的对接方案,IPPBX支持呼入,呼出,弹屏,录音,转接,示忙、示闲,点击拨号、API、三方通话、语音质检、通话保持、通话恢复等基础软交换业务,IPPBX支持云端部署和本地部署,支持常用线路,单机最大支持500并发。
4、简洁清晰的可视化中控台,全面掌握实时业务动态
中控台页面分为关键指标统计、话务统计、坐席统计等模块,均显示当天实时数据信息,便于用户全面掌握业务动态,关键指标模块显示呼叫总量,接通量、接通率、转人工量、转人工率、成单量、成单率等外呼及业务数据;话务统计模块显示实时呼出量、实时接通量、实时接通率、实时转接数、实时转接率、机器人并发量等;坐席统计模块显示各分机号码当前示忙、示闲、通话、振铃等话机状态。
5、自定义客户标签功能,协助用户丰富客户画像的管理
自定义客户标签功能,可根据用户业务需要添加或删除,字段类型也提供多种方式输入,相关设置实时生效,保障业务调整的时效性,其次,各标签可单独设置是否在详情列表中显示、是否作为查询条件、是否为客户必填项等,提升了标签使用的灵活性。
项目的创新点:基于saas云平台,线上开户快速使用,丰富多元的API接口阵列,满足任何******或核心***的快速对接,呼叫中心、BI、CRM、IPPBX通讯全核心一体化融合,突破设备和多平台的壁垒,一套***完成从资源前端到客户终端的贯穿。
结合AI智能与传统呼叫中心选项式智配组合应用方式,解决AI智能在发展中的平滑过度,根据不同的场景、业务选择不同的人机结合方式,充分、精准、高效的释放AI能力优势。
交付流程:对接通讯线路→数据库部署→***对接→开通账号→配置语音机器人话术→业务流程设置→测试→培训并交付。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。
Claims (4)
1.一种AI智能客户价值管理平台,其特征在于,数据库核心包括采集模块、分群模块、分析模块和数据模块,
采集模块:支持多渠道数据导入和采集
数据通过多渠道富媒体的方式进行数据采集,数据类型包括基础数据与平面文本文件(Excel)、音频数据和视频数据等,均采集到我们的大数据平台体系中,平台可适配支持多种类型的数据源,结构化数据采集主要来自于业务***输入,或者通过API接口与其他******对接,或文本文件等形成的结构化数据,数据平台通过ETL(Extract,Transform,Load)进行数据库的构建,将数据平台中所需的数据按数据仓库建立的方法每天或定期从各渠道中进行数据采集,并根据各个不同的渠道数据源进行数据调整,并且平台在数据采集过程中会将原始数据进行抽取、清洗、合并和装载,在此过程中必须保证数据的完备性和数据的一致性,当业务数据量过大,未避免Mysql数据仓库压力过大,亦可将业务数据通过kettle迁移到hadoop平台的数据库Hbase中。
在非结构化数据采集的部分,视频信息、音频信息、微博实时数据、传感器采集的设备数据、移动端收集的数据以及其他流数据等非结构化数据,我们将通过传感器接口、视频接入设备、网络爬虫工具和流处理程序等方式分别进行采集并存储到HDFS和Hbase中。
分群模块:将客户数据通过大数据算法进行自动分群
数据平台基于已采集的数据利用机器学习算法技术,通过特征归类形成近似的分群和分组,数据库训练集由数据库记录(Record)组成,每一条记录包含多个字段或属性(Atribute),构成一个特征向量,训练集每条记录还有一个特定的标签(ClassLabel)与之对应,该类标签采用经验法则由***自动生成,一个具体样本的形式可为样本向量:(v1,v2,...,vn;c),在这里vi表示字段值,c表示类别,分类的目的是分析输入数据,通过在训练集中的数据表现出来的特性,为每一个类找到一种准确的描述或者模型,由此生成的类描述用来对未来的测试数据进行分类,虽然随处的是生成的随机变量,***仍可以由此进行归类和定义,故***由此对数据库中的每一个类有一个新的标示,新的数据通过近似的元素将被被聚合,实现数据学习,在持续的学习下将衍生出新的目标函数或规则,把每个属性集x映射到一个预先定义的类标号y。
数据平台中分类模型的构造分为训练和测试两个阶段。在构造模型前,要求将数据集随机的分为训练集和测试集,在训练阶段,使用训练数据集,通过分析由属性描述的数据库元组来构造模型,通过数据的积累和抽检验证评估模型的分类准确率,持续进行数据元组的调优,我们平台的分类算法,是引用KNN近似算法(K-NearestNeighbor)是一种基于实例的分类方法,是一种非参数的分类方法,通过测量不同特征值之间的距离进行分类,它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数,KNN算法中,所选择的邻居都是已经正确分类的对象,该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
KNN方法在类别决策时,只与极少量的相邻样本有关,因此,采用这种方法可以较好的避免样本的不平衡问题,另外,由于KNN方法主要是靠周围有限的临近的样本,而不是靠判别类域的方法来确定所属类别,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为合适,平台数据库针对于计算量大的问题,采用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本,对样本进行组织与整理,分群分层,尽可能将计算压缩在接近测试样本领域的小范围内,避免盲目的与训练样本集中的每个样本进行距离计算,使得***在数据库运行的过程中保持稳定。
分析模块:多维度数据报表及可视化分析界面
数据平台提供的数据分析中的可视化方法及工具,包括表格、直方图、散点图、折线图、柱状图、饼图、面积图、流程图、泡沫图表等,其次常用图表的多个数据系列或组合像时间线、维恩图、数据流图、实体关系图等,其次也包括了专用的分析工具,如平行坐标用于绘制多维度个体数据,树状图用于可视化层次结构,锥形树图用于特殊数据的分层如三维空间中的组织体以及语义网络等。
此外,***的数据挖掘工具采取的是类似Tableau可支持交互式和直观数据分析,内置内存数据引擎来加速可视化处理,利用基于Hadoop的一个数据仓库工具Hive,将查询结构化并为内存分析缓存信息,通过缓存信息,Hadoop集群延迟的可能性会大大减小,为用户与大数据应用提供了一个交互互动机制,平台的大数据分析工具可以轻而易举地处理ZB(十万亿亿字节)和PB(千万亿字节)数据,交互式可视化集群分析方法是集群模式最直接的方法,可视化多维数据便于用户交互式分析数据和认识集群结构。
平行坐标和散点图矩阵通常被用来分析十个维度以内的数据,而星型坐标则可以处理数十个维度,基于星型坐标的集群可视化利用潜在映射模型的性能部分地保持这个位置关系大幅提升数据分析可用性。
数据模块:底层数据库的储存管理
***平台通过关系型数据库MySQL和hadoop的HBase数据库共同承担对结构化的数据的存储和管理,以MySQL建立传统数据仓库来实现对用于结构化数据和元数据的集中存储与管理,并根据需求建立面向部门和主题的数据集市,中央数据仓库将被划分为三个逻辑存储区间:ODS(Operational Data Store)、DW(Data Warehourse)、DM(Data Mar)):ODS将存放各业务***的原始数据,包括与原结构相同的业务数据以及经过初步整理后的业务数据;DW区域存放经过整理过的数据,是大数据分析平台真正的数据中心;DM区域存放各个应用***(web应用、BI、OLAP、Data Mining等)所需的综合数据。与此同时我们在MySQL和HBase数据库之间建立连接,利用Kettle定时进行数据交换,两种数据仓库共同大数据应用提供数据支撑,从而实现数据共享,分摊压力和数据备份的目的。
对于非结构化数据存储和管理方面,由于Mysql不支持对非结构化数据的存储,利用大数据应用框架Hadoop平台的数据仓库作为传统数据仓库的补充,实现对非结构化数据的存储和管理,并对来自网络的海量数据查询提供支撑,Hadoop的多多功能组件HDFS分布式文件***,分布式存储大数据文件,Hbase可扩展的分布式列存储NoSQL数据库,用于存储结构化和非结构化数据,平台为满足不同用户的个性化数据使用需求,***安排提供了三中大数据应用方式,第一种支持利用java或C等开发语言编写程序实现对Hadoop平台和MySQL数据仓库中数据的应用;第二种是适用于IBM-Cognos作为信息共享的工具,Cognos作为多样化的前端分析展示工具,支持建立DMR和OLAP两种模型,提供了在线报表、OlAP分析、仪表板、记分卡、实时查询、Office集成、移动APP等多种信息共享技术;第三种IBM-SPSS作为数据挖掘工具,SPSS支持以Hadoop平台和MySQL搭建挖掘模型,用于统计学分析运算、数据挖掘、预测分析和决策支持任务,支持描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等多类统计分析和挖掘算法。
2.如权利要求1所述的AI智能客户价值管理平台,其特征在于,***整体采用前后端分离架构,前端使用JavaScript语言,采用Ant Design of React框架,报表采用Echarts实现前端展示,后端主要采用java开发语言,包括但不限于springboot,mybatis,shiro,druid,tomcat,logback,easyexcel相关组件,底层存储涉及到mysql8.0,Redis 5.0.8,ApacheKafka 2.3.1,Nacos配置中心,阿里云对象存储等。
3.如权利要求2所述的AI智能客户价值管理平台,其特征在于,分类学习所获得的模型表示为分类规则形式、决策树形式或数学公式形式。
4.如权利要求3所述的AI智能客户价值管理平台,其特征在于,KNN算法中,通过计算对象间距离来作为各个对象之间的非相似性指标,避免了对象之间的匹配问题,同时KNN通过依据k个对象中占优的类别进行决策,而不是单一的对象类别决策,这两点就是KNN算法的优势。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110021661.2A CN112685514A (zh) | 2021-01-08 | 2021-01-08 | Ai智能客户价值管理平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110021661.2A CN112685514A (zh) | 2021-01-08 | 2021-01-08 | Ai智能客户价值管理平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112685514A true CN112685514A (zh) | 2021-04-20 |
Family
ID=75456352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110021661.2A Pending CN112685514A (zh) | 2021-01-08 | 2021-01-08 | Ai智能客户价值管理平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112685514A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506137A (zh) * | 2021-07-14 | 2021-10-15 | 广州钛动科技有限公司 | 一种电子邮件营销分析方法、***和设备 |
CN113779761A (zh) * | 2021-08-10 | 2021-12-10 | 南京莱斯信息技术股份有限公司 | 一种群众防空组织数据分析***及方法 |
CN117290429A (zh) * | 2023-11-24 | 2023-12-26 | 山东焦易网数字科技股份有限公司 | 通过自然语言调用数据***接口的方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709754A (zh) * | 2016-11-25 | 2017-05-24 | 云南电网有限责任公司昆明供电局 | 一种用基于文本挖掘的电力用户分群方法 |
CN109272155A (zh) * | 2018-09-11 | 2019-01-25 | 郑州向心力通信技术股份有限公司 | 一种基于大数据的企业行为分析*** |
CN110163621A (zh) * | 2018-02-10 | 2019-08-23 | 广州供电局有限公司 | 一种电力客服大数据决策支持*** |
CN110782318A (zh) * | 2019-10-21 | 2020-02-11 | 五竹科技(天津)有限公司 | 基于音频交互的营销方法、装置以及存储介质 |
CN111475509A (zh) * | 2020-04-03 | 2020-07-31 | 李俊宏 | 一种基于大数据的用户画像和多维分析*** |
CN111640040A (zh) * | 2020-04-07 | 2020-09-08 | 国网新疆电力有限公司 | 基于客户画像技术的供电客户价值评价方法及大数据平台 |
CN111768850A (zh) * | 2020-06-05 | 2020-10-13 | 上海森亿医疗科技有限公司 | 医院数据分析方法、医院数据分析平台、设备和介质 |
CN112070126A (zh) * | 2020-08-21 | 2020-12-11 | 江西国云科技有限公司 | 一种物联网数据挖掘方法 |
CN112184489A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种电力用户分群管理***及方法 |
-
2021
- 2021-01-08 CN CN202110021661.2A patent/CN112685514A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709754A (zh) * | 2016-11-25 | 2017-05-24 | 云南电网有限责任公司昆明供电局 | 一种用基于文本挖掘的电力用户分群方法 |
CN110163621A (zh) * | 2018-02-10 | 2019-08-23 | 广州供电局有限公司 | 一种电力客服大数据决策支持*** |
CN109272155A (zh) * | 2018-09-11 | 2019-01-25 | 郑州向心力通信技术股份有限公司 | 一种基于大数据的企业行为分析*** |
CN110782318A (zh) * | 2019-10-21 | 2020-02-11 | 五竹科技(天津)有限公司 | 基于音频交互的营销方法、装置以及存储介质 |
CN111475509A (zh) * | 2020-04-03 | 2020-07-31 | 李俊宏 | 一种基于大数据的用户画像和多维分析*** |
CN111640040A (zh) * | 2020-04-07 | 2020-09-08 | 国网新疆电力有限公司 | 基于客户画像技术的供电客户价值评价方法及大数据平台 |
CN111768850A (zh) * | 2020-06-05 | 2020-10-13 | 上海森亿医疗科技有限公司 | 医院数据分析方法、医院数据分析平台、设备和介质 |
CN112070126A (zh) * | 2020-08-21 | 2020-12-11 | 江西国云科技有限公司 | 一种物联网数据挖掘方法 |
CN112184489A (zh) * | 2020-09-30 | 2021-01-05 | 深圳供电局有限公司 | 一种电力用户分群管理***及方法 |
Non-Patent Citations (2)
Title |
---|
姜巍;: "数据挖掘技术的分类算法分析研究", 电脑知识与技术, no. 01, 5 January 2009 (2009-01-05) * |
林赐云: "《吉林大学"十三五"本科规划教材 交通管理信息***原理与应用》", 30 June 2019, 天津大学出版社, pages: 74 - 75 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506137A (zh) * | 2021-07-14 | 2021-10-15 | 广州钛动科技有限公司 | 一种电子邮件营销分析方法、***和设备 |
CN113779761A (zh) * | 2021-08-10 | 2021-12-10 | 南京莱斯信息技术股份有限公司 | 一种群众防空组织数据分析***及方法 |
CN113779761B (zh) * | 2021-08-10 | 2023-11-24 | 南京莱斯信息技术股份有限公司 | 一种群众防空组织数据分析***及方法 |
CN117290429A (zh) * | 2023-11-24 | 2023-12-26 | 山东焦易网数字科技股份有限公司 | 通过自然语言调用数据***接口的方法 |
CN117290429B (zh) * | 2023-11-24 | 2024-02-20 | 山东焦易网数字科技股份有限公司 | 通过自然语言调用数据***接口的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112685514A (zh) | Ai智能客户价值管理平台 | |
US20190286996A1 (en) | Human-machine interactive method and device based on artificial intelligence | |
CN107766511A (zh) | 智能问答方法、终端及存储介质 | |
CN110472017A (zh) | 一种话术分析和话题点识别匹配的方法及*** | |
CN109033387A (zh) | 一种融合多源数据的物联网搜索***、方法及存储介质 | |
CN109460737A (zh) | 一种基于增强式残差神经网络的多模态语音情感识别方法 | |
US20100161604A1 (en) | Apparatus and method for multimedia content based manipulation | |
JP2020521210A (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
JP2021504818A (ja) | 基礎ナレッジ・グラフへの重ね合わせによるインコヒーレント・ノードの構造化 | |
CN111098312A (zh) | 窗口政务服务机器人 | |
US20200125602A1 (en) | System and method for querying a data repository | |
CN111709575A (zh) | 基于c-lstm的学业成绩预测方法 | |
CN110532309B (zh) | 一种高校图书馆用户画像***的生成方法 | |
US10586237B2 (en) | Method, apparatus, and computer-readable media for customer interaction semantic annotation and analytics | |
Gao | [Retracted] Research and Implementation of Intelligent Evaluation System of Teaching Quality in Universities Based on Artificial Intelligence Neural Network Model | |
CN111813956A (zh) | 知识图谱构建方法、装置、信息穿透方法和*** | |
CN107784033A (zh) | 一种基于会话进行推荐的方法和装置 | |
Karakus et al. | Call center performance evaluation using big data analytics | |
CN113656647B (zh) | 一种面向智能运维的工程档案数据管理平台、方法及*** | |
CN111177559A (zh) | 文旅服务推荐方法、装置、电子设备及存储介质 | |
CN109766451A (zh) | 一种云计算平台及其调度、数据分析方法 | |
CN103077207A (zh) | 一种微博开心指数分析方法及*** | |
CN110929007A (zh) | 一种电力营销知识体系平台及应用方法 | |
Ahmed et al. | Sentiment analysis for smart cities: state of the art and opportunities | |
CN110334088A (zh) | 教育数据管理*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |