CN110222272A - 一种潜在客户挖掘与推荐方法 - Google Patents

一种潜在客户挖掘与推荐方法 Download PDF

Info

Publication number
CN110222272A
CN110222272A CN201910311200.1A CN201910311200A CN110222272A CN 110222272 A CN110222272 A CN 110222272A CN 201910311200 A CN201910311200 A CN 201910311200A CN 110222272 A CN110222272 A CN 110222272A
Authority
CN
China
Prior art keywords
user
model
commodity
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910311200.1A
Other languages
English (en)
Other versions
CN110222272B (zh
Inventor
郝志峰
申策
蔡瑞初
温雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910311200.1A priority Critical patent/CN110222272B/zh
Publication of CN110222272A publication Critical patent/CN110222272A/zh
Application granted granted Critical
Publication of CN110222272B publication Critical patent/CN110222272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Accounting & Taxation (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Finance (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种潜在客户挖掘与推荐方法,本发明从社交平台上获取用户的个人信息和社交活动信息,并与本地存储的用户购物记录融合,经过数据清洗和筛选后,得到用于训练和测试潜在客户分类模型的数据;然后根据用户个人信息、社交记录、购物记录构造用户画像,同时将用户的社交记录和购物记录处理为可供模型使用的特征向量形式,然后训练用户兴趣预测模型,将用户分为潜在客户和路人;最后识别并根据潜在客户的兴趣提供更有针对性的商品页面展示给他们。本发明可以在精准分类用户的同时判断用户的兴趣;根据用户的兴趣判断展示相应的产品或实施精准广告投放,实现潜在客户的转化;对于老客户也可以提供针对性的推荐,增加客户黏性。

Description

一种潜在客户挖掘与推荐方法
技术领域
本发明涉及客户挖掘方法技术领域,尤其是一种潜在客户挖掘与推荐方法。
背景技术
在这个竞争日益激烈的电子商务时代,在原有客户的基础上不断拓展新的客户,增加客户总量和客户黏度,企业就能够得到更多的经济效益和市场竞争优势,越来越多的商家通过网上商城售卖货品,在商家进行促销的过程中,十分关心的一个问题是:如何根据商家现在已拥有的客户的信息(比如客户的年龄、性别、家庭地址等信息),挖掘出潜在的客户,实现客户的精准触达。
现有的潜在客户挖掘技术主要分为基于用户属性标签和基于用户浏览行为两类。
基于用户属性标签的潜在客户挖掘技术如阿里巴巴集团控股有限公司的申请号为201510176915、发明名称为“挖掘潜在客户的方法和装置”的发明专利;北京国双科技有限公司的申请号为201510696762、发明名称为“挖掘潜在客户的方法和装置”的专利申请等。上述技术主要通过整理筛选用户属性标签(性别、年龄等),按照属性标签将用户聚类,组成不同的社群,通过计算用户属于哪一个社群,从而判断用户是否为潜在客户。
基于用户浏览行为的潜在客户挖掘技术如焦点科技股份有限公司的申请号为201510903856、发明名称为“一种基于客户行为特征的潜在客户挖掘方法”的发明专利;平安科技(深圳)有限公司的申请号为201710807133、发明名称为“一种潜在客户的识别方法及终端设备”的发明专利等。上述技术主要利用客户浏览、收藏等行为,通过对比计算用户浏览行为和客户浏览行为之间的相似程度,判断用户是否为潜在客户。
但是,现有技术只使用了电商网站内部存储的客户属性标签和行为记录等信息,对于新登陆网站的用户,存在用户信息过少导致的挖掘精度低的问题,同时难以精确判断用户兴趣,无法有效的指导企业制定相应策略实现客户转化。
随着第三方账号登陆技术的发展,越来越多的用户开始选择使用自己的社交账号(QQ、微博、Twitter、Facebook等)登陆电商网站,交叉客户(既是电商网站的客户,又是其他社交网站的客户)的数量正在逐渐增长。W.X.Zhao等学者的研究表明,用户的社交行为是帮助预测用户购买兴趣的重要信息源。因此如何有效利用交叉客户的社交行为,从使用社交账号登陆网站的新用户中挖掘潜在客户,并制定相应策略实现客户转化,是有待解决的问题。
发明内容
针对现有技术的不足,本发明提供一种潜在客户挖掘与推荐方法,本发明利用交叉客户的社交行为特征,挖掘使用社交账号登陆电商网站用户中的潜在客户,并预测用户有可能购买的商品,为客户转化提供准确的参照依据。
本发明的技术方案为:一种潜在客户挖掘与推荐方法,包括以下步骤:
S1)、从社交平台上获取用户的个人信息和社交活动数据,并对获取到的粗糙原始数据进行清洗,去除状态码等与用户信息无关的数据,同时对文本信息进行格式化,去除文本中的特殊字符,将清洗过的数据存储到用户社交活动数据库中;
S2)、根据用户的个人信息、社交行为信息、以及购物行为信息进行筛选,选取关键信息构建用户画像;
S3)、对各种不同类型的数据进行特征化处理,将其转化为可供模型训练的特征向量;
S4)、训练、更新因子分解机模型、svm模型和xgboost模型组成的模型池,预测用户对商品的兴趣,使用用户画像和整理出的特征向量作为模型池的输入,将用户近期的实际购买结果作为标签对模型进行单独训练,然后根据误差通过梯度下降法更新模型的参数,提升模型的预测精度;
S5)、测试、调整模型,使用与训练不同的另一批用户的数据对模型进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S4)重新训练模型;
S6)、使用训练好的模型对所有用户进行预测,获取用户最新的兴趣分布,并采用直接覆盖法或按权重相加法更新用户兴趣预测结果;
S7)、根据用户的浏览记录、购物记录以及时间因素,将用户分为老客户和新用户,新用户将用于挖掘潜在客户,然后利用svm分类模型将新用户分为潜在客户和不太可能产生购买行为的路人,并从新用户中挖掘潜在客户;
S8)、训练、更新svm分类模型,使用步骤S3)和步骤S6)中获取的特征作为svm分类模型的输入,将对用户进行推荐后的实际转化情况作为标签训练svm分类模型,然后根据误差通过随机梯度下降法更新模型的参数,提升模型的预测精度;
S9)、测试并调整模型,使用与训练用户不同的另一批用户的数据进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S8)重新训练模型;
S10)、使用S9)训练的模型对所有新用户进行预测,将新用户分为***和不太可能产生购买行为的路人,并更新新客推荐数据库;
S11)、对于新访问平台的用户,判断用户是否为潜在客户,并从新客推荐数据库中查询到访用户的信息,如果有用户对应的兴趣信息,则筛选与用户兴趣相符的商品,生成商品列表;
S12)、在前端页面展示和推荐商品列表中的商品,或将商品包装成广告精准投放给用户。
进一步的,步骤S1)采用爬虫技术获取从多个社交网站上获取用户的个人信息和社交活动信息。
进一步的,步骤S2)中,所述的用户个人信息主要包括性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数,所述的社交行为信息包括发送文本、关注话题、转发评论,所述的购物行为信息包括浏览信息、收藏信息、购买信息、评价信息。
进一步的,步骤S3)中,所述的特征向量包括用户特征向量和商品特征向量;所述的用户特征向量由用户个人特征、用户社交行为特征和用户-商品交互特征组成,所述的商品特征向量由商品类别特征、购物上下文特征和商品-用户交互特征组成。
进一步的,步骤S3)中,对各种不同类型的数据进行特征化处理,具体包括对数值型数据进行归一化,对类别标签型数据进行one-hot离散向量化,对文本内容进行word2vec词向量化和doc2vec文本向量化,对缺失数据进行补齐,最终获得用户向量表示、用户社交、购物行为向量表示,商品向量表示。
进一步的,步骤S3)中,对性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数等用户个人信息进行向量化处理,构造用户个人特征,其中性别、地域、年龄、工作数据采用了one-hot向量表示法,其他数值类型的数据采用max-min归一化表示。
进一步的,步骤S3)中,所述的用户社交行为特征主要包含用户社交中发送的文本信息,将用户一定时间内发送的文本信息拼接成一个文档,通过分词工具将文档分词并去除停用词,然后通过word2vec工具将每个词转化为对应的词向量,并将所有的词向量相加并归一化,得到相应的文档的向量表示;同时通过doc2vec工具生成文档对应的文档向量,最后将两个表示向量拼接,作为用户社交行为特征向量。
进一步的,所述的用户-商品交互特征是指将用户购买的商品通过one-hot表示成向量形式,即购买过的商品位置值为1,没有购买过的位置值为0。
进一步的,所述的购物上下文特征是指将用户的购物记录按照购买时间先后进行排序,构造用户购买商品序列,将每件商品视作一个单词,然后通过word2vec工具中的skip-gram模型进行训练,训练完成后可以获得每件商品对应的向量,该向量作为商品的购物上下文特征。
进一步的,步骤S4)中,将因子分解机模型、svm模型和xgboost模型预测的平均结果作为最终输出结果,负责预测用户对商品的兴趣。
进一步的,步骤S7)、所述的潜在客户是指可能购买的人,所述的路人是指只浏览但不太可能购买商品的人。
本发明的有益效果为:
1、用户在社交平台的个人信息和行为数据包含着大量的有用信息,比其他使用用户浏览行为的潜在客户挖掘***精度更高,可以更精确的判断用户兴趣。
2、对于登录平台浏览商品的用户,可以根据预测结果,将其感兴趣的商品展示给该用户,提升转化率。
3、对于浏览平台的用户,可以根据预测结果,对其进行广告投放,实现客户转化。
4、对于老客户也可以提供针对性的推荐,增加客户黏性。
附图说明
图1为本发明的流程示意图;
图2为本发明潜在客户挖掘模型的训练流程图;
图3为本发明潜在客户识别与转化的流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1所示,一种潜在客户挖掘与推荐方法,包括以下步骤:
S1)、采用爬虫技术从社交平台上获取用户的个人信息和社交活动数据,并对获取到的粗糙原始数据进行清洗,去除状态码等与用户信息无关的数据,同时对文本信息进行格式化,去除文本中的特殊字符,将清洗过的数据存储到用户社交活动数据库中,并定期从社交平台上获取相应的数据,实时更新数据库中的数据;
S2)、根据用户的个人信息、社交行为信息、以及购物行为信息进行筛选,选取关键信息构建用户画像,其中,所述的用户个人信息主要包括性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数,所述的社交行为信息包括发送文本、关注话题、转发评论等信息,所述的购物行为信息包括浏览信息、收藏信息、购买信息、评价信息等信息;
S3)、对各种不同类型的数据进行特征化处理,将其转化为可供模型训练的特征向量,具体包括对数值型数据进行归一化,对类别标签型数据进行one-hot离散向量化,对文本内容进行word2vec词向量化和doc2vec文本向量化,对缺失数据进行补齐,最终获得用户向量表示、用户社交、购物行为向量表示,商品向量表示,其中,所述的特征向量包括用户特征向量和商品特征向量;所述的用户特征向量由用户个人特征、用户社交行为特征和用户-商品交互特征组成,所述的商品特征向量由商品类别特征、购物上下文特征和商品-用户交互特征组成。
对性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数等用户个人信息进行向量化处理,构造用户个人特征,其中性别、地域、年龄、工作等标签类型的离散数据采用了one-hot向量表示,如[1,0]表示性别为女,[0,1]表示性别为男,[0,0]则表示性别未知),其中,年龄按每10年分一段,其余的数值类型的数据如用户等级、关注数、粉丝数等采用了max-min归一化表示。
用户社交行为特征主要包含了用户社交中发送的文本信息,将用户最近3个月发送的文本信息拼接成一个文档,通过分词工具将文档分词并去除停用词,然后通过word2vec工具将每个词转化为对应的100维词向量,并将所有的词向量相加并归一化,得到相应的文档的向量表示;同时通过doc2vec工具生成文档对应的文档向量,最后将两个表示向量拼接,作为用户社交行为特征向量。
将用户购买的商品通过one-hot表示成向量形式,即购买过的商品位置值为1,没有购买过的位置值为0,作为用户-商品交互特征。
为了方便用户购物时查询和筛选,通常将商品会被划分为不同的类别,如服饰、食品等,使用one-hot表示法表示商品对应的类别特征。
将用户的购物记录按照购买时间先后进行排序,构造用户购买商品序列,将每件商品视作一个单词,然后通过word2vec工具中的skip-gram模型进行训练,训练完成后可以获得每件商品对应的向量,作为商品的购物上下文特征。而用户对于每件商品的喜好程度的真实标签,通过用户的历史购物记录进行构建,若用户之前购买过该商品,则商品对应的值为1;反之若用户没有购买过该商品,则商品对应的值为0。
S4)、训练、更新因子分解机模型、svm模型和xgboost模型组成的模型池,预测用户对商品的兴趣,将用户向量与每件商品的商品向量拼接作为模型池的输入,将一批特征向量分别输入到3个模型中,并使用模型预测用户对商品的喜好评分,然后根据用户实际标签值,分别计算模型预测结果与实际标签结果之间的差值,通过批梯度下降算法,对3个模型的参数进行更新,通过不断迭代更新的方式,逐步提高模型预测精度,使得模型的预测值逐步逼近真实购买情况,其训练流程图参见图2。
S5)、测试、调整模型,使用与训练不同的另一批用户的数据对模型进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S4)重新训练模型;
S6)、使用训练好的模型对所有用户进行预测,获取用户最新的兴趣分布,并采用直接覆盖法或按权重相加法更新用户兴趣预测结果;
S7)、根据用户的浏览记录、购物记录以及时间因素,将用户分为老客户和新用户,新用户将用于挖掘潜在客户,然后利用svm分类模型将新用户分为潜在客户和路人,并从新用户中挖掘潜在客户,并且每隔一定周期使用svm分类模型对所有新加入用户进行分类预测;
S8)、训练、更新svm分类模型,使用步骤S3)和步骤S6)中获取的特征作为svm分类模型的输入,将对用户进行推荐后的实际转化情况作为标签训练svm分类模型,然后根据误差通过随机梯度下降法更新模型的参数,提升模型的预测精度;
S9)、测试并调整模型,使用与训练用户不同的另一批用户的数据进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S8)重新训练模型;
S10)、使用S9)训练的模型对所有新用户进行预测,将新用户分为***和不太可能产生购买行为的路人,并更新新客推荐数据库;
S11)、对于新访问平台的用户,判断用户是否为潜在客户,并从新客推荐数据库中查询到访用户的信息,如果有用户对应的兴趣信息,则筛选与用户兴趣相符的商品,生成商品列表;
S12)、在前端页面展示和推荐商品列表中的商品,或将商品包装成广告精准投放给用户,具体如图3所示。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (10)

1.一种潜在客户挖掘与推荐方法,其特征在于,包括以下步骤:
S1)、从社交平台上获取用户的个人信息和社交活动数据,并对获取到的粗糙原始数据进行清洗,去除状态码与用户信息无关的数据,同时对文本信息进行格式化,去除文本中的特殊字符,将清洗过的数据存储到用户社交活动数据库中;
S2)、根据用户的个人信息、社交行为信息、以及购物行为信息进行筛选,选取关键信息构建用户画像;
S3)、对各种不同类型的数据进行特征化处理,将其转化为可供模型训练的特征向量;
S4)、训练、更新因子分解机模型、svm模型和xgboost模型组成的模型池,预测用户对商品的兴趣,使用用户画像和整理出的特征向量作为模型池的输入,将用户近期的实际购买结果作为标签对模型进行单独训练,然后根据误差通过梯度下降法更新模型的参数,提升模型的预测精度;
S5)、测试、调整模型,使用与训练不同的另一批用户的数据对模型进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S4)重新训练模型;
S6)、使用训练好的模型对所有用户进行预测,获取用户最新的兴趣分布,并采用直接覆盖法或按权重相加法更新用户兴趣预测结果;
S7)、根据用户的浏览记录、购物记录以及时间因素,将用户分为老客户和新用户,新用户将用于挖掘潜在客户,然后利用svm分类模型将新用户分为潜在客户和不太可能产生购买行为的路人,从新用户中挖掘潜在的客户;
S8)、训练、更新svm分类模型,使用步骤S3)和步骤S6)中获取的特征作为svm分类模型的输入,将对用户进行推荐后的实际转化情况作为标签训练svm分类模型,然后根据误差通过随机梯度下降法更新模型的参数,提升模型的预测精度;
S9)、测试并调整模型,使用与训练用户不同的另一批用户的数据进行交叉测试,当测试效果高于阈值,则得到训练好的模型,否则采取特征筛选、调整参数的方式并按照步骤S8)重新训练模型;
S10)、使用S9)训练的模型对所有新用户进行预测,将新用户分为***和不太可能产生购买行为的路人,并更新新客推荐数据库;
S11)、对于新访问平台的用户,判断用户是否为潜在客户,并从新客推荐数据库中查询到访用户的信息,如果有用户对应的兴趣信息,则筛选与用户兴趣相符的商品,生成商品列表;
S12)、在前端页面展示和推荐商品列表中的商品,或将商品包装成广告精准投放给用户。
2.根据权利要求1所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S2)中,所述的用户个人信息主要包括性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数,所述的社交行为信息主要包括发送文本、关注话题、转发评论,所述的购物行为信息包括浏览信息、收藏信息、购买信息、评价信息。
3.根据权利要求1所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S3)中,对各种不同类型的数据进行特征化处理,具体包括对数值型数据进行归一化,对类别标签型数据进行one-hot离散向量化,对文本内容进行word2vec词向量化和doc2vec文本向量化,对缺失数据进行补齐,最终获得用户向量表示、用户社交、购物行为向量表示,商品向量表示。
4.根据权利要求1所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S3)中,所述的特征向量包括用户特征向量和商品特征向量;所述的用户特征向量由用户个人特征、用户社交行为特征和用户-商品交互特征组成,所述的商品特征向量由商品类别特征、购物上下文特征和商品-用户交互特征组成。
5.根据权利要求4所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S3)中,对性别、年龄、地域、工作、学校、兴趣标签、用户等级、用户信誉、关注数、粉丝数用户个人信息进行向量化处理,构造用户个人特征,其中性别、地域、年龄、工作数据采用了one-hot向量表示法,其他数值类型的数据采用max-min归一化表示。
6.根据权利要求4所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S3)中,所述的用户社交行为特征主要包含用户社交中发送的文本信息,将用户一定时间内发送的文本信息拼接成一个文档,通过分词工具将文档分词并去除停用词,然后通过word2vec工具将每个词转化为对应的词向量,并将所有的词向量相加并归一化,得到相应的文档的向量表示;同时通过doc2vec工具生成文档对应的文档向量,最后将两个表示向量拼接,作为用户社交行为特征向量。
7.根据权利要求4所述的一种潜在客户挖掘与推荐方法,其特征在于:所述的用户-商品交互特征是指将用户购买的商品通过one-hot表示成向量形式,即购买过的商品位置值为1,没有购买过的位置值为0。
8.根据权利要求4所述的一种潜在客户挖掘与推荐方法,其特征在于:所述的购物上下文特征是指将用户的购物记录按照购买时间先后进行排序,构造用户购买商品序列,将每件商品视作一个单词,然后通过word2vec工具中的skip-gram模型进行训练,训练完成后可以获得每件商品对应的向量,该向量作为商品的购物上下文特征。
9.根据权利要求1所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S4)中,将因子分解机模型、svm模型和xgboost模型预测的平均结果作为最终输出结果,负责预测用户对商品的兴趣。
10.根据权利要求1所述的一种潜在客户挖掘与推荐方法,其特征在于:步骤S4)中,用户对于每件商品的喜好程度的真实标签,通过用户的历史购物记录进行构建,若用户之前购买过该商品,则商品对应的值为1;反之若用户没有购买过该商品,则商品对应的值为0,预测用户对商品的兴趣,将用户向量与每件商品的商品向量拼接作为模型池的输入,并使用模型预测用户对商品的喜好评分,然后根据用户实际标签值,分别计算模型预测结果与实际标签结果之间的差值,通过批梯度下降算法,对3个模型的参数进行更新,通过不断迭代更新的方式逐步提高模型预测精度。
CN201910311200.1A 2019-04-18 2019-04-18 一种潜在客户挖掘与推荐方法 Active CN110222272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910311200.1A CN110222272B (zh) 2019-04-18 2019-04-18 一种潜在客户挖掘与推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910311200.1A CN110222272B (zh) 2019-04-18 2019-04-18 一种潜在客户挖掘与推荐方法

Publications (2)

Publication Number Publication Date
CN110222272A true CN110222272A (zh) 2019-09-10
CN110222272B CN110222272B (zh) 2022-10-14

Family

ID=67822621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910311200.1A Active CN110222272B (zh) 2019-04-18 2019-04-18 一种潜在客户挖掘与推荐方法

Country Status (1)

Country Link
CN (1) CN110222272B (zh)

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889716A (zh) * 2019-09-29 2020-03-17 清华大学 识别潜在注册用户的方法及装置
CN110933472A (zh) * 2019-12-02 2020-03-27 深圳市云积分科技有限公司 一种用于实现视频推荐的方法和装置
CN111127074A (zh) * 2019-11-26 2020-05-08 杭州聚效科技有限公司 一种数据推荐方法
CN111144986A (zh) * 2019-12-25 2020-05-12 清华大学 一种基于分享行为的社交电商网站商品推荐方法及装置
CN111177581A (zh) * 2019-12-25 2020-05-19 清华大学 一种基于多平台的社交电商网站商品推荐方法及装置
CN111199421A (zh) * 2019-12-20 2020-05-26 北京淇瑀信息科技有限公司 一种基于社交关系的用户推荐方法、装置及电子设备
CN111598256A (zh) * 2020-05-18 2020-08-28 北京互金新融科技有限公司 目标客户的默搭购买行为的处理方法和装置
CN111598613A (zh) * 2020-04-28 2020-08-28 杭州沃朴物联科技有限公司 红包发放方法、装置、设备及介质
CN111651686A (zh) * 2019-09-24 2020-09-11 北京嘀嘀无限科技发展有限公司 一种测试处理方法、装置、电子设备及存储介质
CN111814092A (zh) * 2020-07-21 2020-10-23 上海数鸣人工智能科技有限公司 基于用户上网行为用于人工智能算法的数据预处理方法
CN112016003A (zh) * 2020-08-19 2020-12-01 重庆邮电大学 基于cnn的社交小众用户标签挖掘及相似用户推荐方法
CN112070615A (zh) * 2020-09-02 2020-12-11 中国银行股份有限公司 基于知识图谱的理财产品推荐方法及装置
CN112200601A (zh) * 2020-09-11 2021-01-08 深圳市法本信息技术股份有限公司 物品推荐方法、装置及可读存储介质
CN112269911A (zh) * 2020-11-11 2021-01-26 深圳视界信息技术有限公司 设备信息识别方法、模型训练方法、装置、设备及介质
CN112287213A (zh) * 2020-10-21 2021-01-29 重庆电子工程职业学院 一种基于大数据的信息分析方法
CN112288549A (zh) * 2020-11-18 2021-01-29 杭州拼便宜网络科技有限公司 一种商品推荐列表生成方法、装置、设备及可读存储介质
CN112435067A (zh) * 2020-11-30 2021-03-02 翼果(深圳)科技有限公司 跨电商平台与社交平台的智能广告投放方法及***
CN112508603A (zh) * 2020-11-26 2021-03-16 泰康保险集团股份有限公司 养老社区潜在客户信息挖掘方法及装置
CN112561555A (zh) * 2019-09-26 2021-03-26 北京国双科技有限公司 一种产品数据的处理方法和装置
CN112667919A (zh) * 2020-12-28 2021-04-16 山东大学 一种基于文本数据的个性化社区矫正方案推荐***及其工作方法
CN112667911A (zh) * 2021-01-14 2021-04-16 中山世达模型制造有限公司 一种利用社交软件大数据找寻潜在客户的方法
WO2021135842A1 (zh) * 2020-01-02 2021-07-08 ***通信有限公司研究院 群体不满意用户识别方法、装置、设备及存储介质
CN113177151A (zh) * 2021-05-28 2021-07-27 中山世达模型制造有限公司 一种潜在客户筛选方法
CN113379529A (zh) * 2021-06-07 2021-09-10 广发银行股份有限公司 一种协同决策引擎应用框架
CN113393271A (zh) * 2021-06-15 2021-09-14 湖南汽车工程职业学院 一种产品客户大数据适用匹配***及计算机存储介质
CN113744002A (zh) * 2020-05-27 2021-12-03 北京沃东天骏信息技术有限公司 推送信息的方法、装置、设备和计算机可读介质
CN113822596A (zh) * 2021-10-12 2021-12-21 深圳市我们在线教育有限公司 基于大数据的客户筛选方法
CN114187036A (zh) * 2021-11-30 2022-03-15 深圳市喂车科技有限公司 一种基于行为特征识别的互联网广告智能推荐管理***
CN114267457A (zh) * 2021-12-03 2022-04-01 爱优牙信息技术(深圳)有限公司 一种匹配定向客户的牙医服务平台
CN114387064A (zh) * 2022-01-13 2022-04-22 福州大学 一种基于综合相似度的电商平台潜在客户推荐方法及***
CN114595323A (zh) * 2022-03-04 2022-06-07 北京百度网讯科技有限公司 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN114841760A (zh) * 2022-06-30 2022-08-02 北京聚云数字信息技术有限公司 一种基于受众行为特征分析的广告推荐管理方法及***
CN116308464A (zh) * 2023-05-11 2023-06-23 广州钛动科技股份有限公司 目标客户获取***和方法
CN116485560A (zh) * 2023-06-21 2023-07-25 杭州大鱼网络科技有限公司 一种基于反馈机制的目标用户筛选方法及***
CN116523572A (zh) * 2023-06-28 2023-08-01 悦享星光(北京)科技有限公司 一种基于客户行为特征的客户挖掘方法及***
CN116894692A (zh) * 2023-09-11 2023-10-17 北京亿家老小科技有限公司 一种线上网络销售用户潜在需求分析监控方法及***
CN116957691A (zh) * 2023-09-19 2023-10-27 翼果(深圳)科技有限公司 针对电商商家商品的跨平台智能广告投放方法及***
CN117035853A (zh) * 2023-10-09 2023-11-10 销生客(北京)数字科技有限公司 一种基于大数据的潜在客户身份标记***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488697A (zh) * 2015-12-09 2016-04-13 焦点科技股份有限公司 一种基于客户行为特征的潜在客户挖掘方法
US20160267498A1 (en) * 2015-03-10 2016-09-15 Wipro Limited Systems and methods for identifying new users using trend analysis
WO2017157146A1 (zh) * 2016-03-15 2017-09-21 平安科技(深圳)有限公司 基于用户画像的个性化推荐方法、装置、服务器及存储介质
CN108090162A (zh) * 2017-12-13 2018-05-29 北京百度网讯科技有限公司 基于人工智能的信息推送方法和装置
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160267498A1 (en) * 2015-03-10 2016-09-15 Wipro Limited Systems and methods for identifying new users using trend analysis
CN105488697A (zh) * 2015-12-09 2016-04-13 焦点科技股份有限公司 一种基于客户行为特征的潜在客户挖掘方法
WO2017157146A1 (zh) * 2016-03-15 2017-09-21 平安科技(深圳)有限公司 基于用户画像的个性化推荐方法、装置、服务器及存储介质
CN108090162A (zh) * 2017-12-13 2018-05-29 北京百度网讯科技有限公司 基于人工智能的信息推送方法和装置
CN109376766A (zh) * 2018-09-18 2019-02-22 平安科技(深圳)有限公司 一种画像预测分类方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李飞等: "基于决策树C4.5算法的大数据保险业模型研究", 《中国市场》 *

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651686B (zh) * 2019-09-24 2021-02-26 北京嘀嘀无限科技发展有限公司 一种测试处理方法、装置、电子设备及存储介质
CN111651686A (zh) * 2019-09-24 2020-09-11 北京嘀嘀无限科技发展有限公司 一种测试处理方法、装置、电子设备及存储介质
CN112561555A (zh) * 2019-09-26 2021-03-26 北京国双科技有限公司 一种产品数据的处理方法和装置
CN110889716A (zh) * 2019-09-29 2020-03-17 清华大学 识别潜在注册用户的方法及装置
CN111127074A (zh) * 2019-11-26 2020-05-08 杭州聚效科技有限公司 一种数据推荐方法
CN111127074B (zh) * 2019-11-26 2023-04-25 杭州聚效科技有限公司 一种数据推荐方法
CN110933472A (zh) * 2019-12-02 2020-03-27 深圳市云积分科技有限公司 一种用于实现视频推荐的方法和装置
CN110933472B (zh) * 2019-12-02 2021-10-22 深圳市云积分科技有限公司 一种用于实现视频推荐的方法和装置
CN111199421B (zh) * 2019-12-20 2023-09-29 北京淇瑀信息科技有限公司 一种基于社交关系的用户推荐方法、装置及电子设备
CN111199421A (zh) * 2019-12-20 2020-05-26 北京淇瑀信息科技有限公司 一种基于社交关系的用户推荐方法、装置及电子设备
CN111177581A (zh) * 2019-12-25 2020-05-19 清华大学 一种基于多平台的社交电商网站商品推荐方法及装置
CN111144986B (zh) * 2019-12-25 2024-05-31 清华大学 一种基于分享行为的社交电商网站商品推荐方法及装置
CN111144986A (zh) * 2019-12-25 2020-05-12 清华大学 一种基于分享行为的社交电商网站商品推荐方法及装置
WO2021135842A1 (zh) * 2020-01-02 2021-07-08 ***通信有限公司研究院 群体不满意用户识别方法、装置、设备及存储介质
CN111598613A (zh) * 2020-04-28 2020-08-28 杭州沃朴物联科技有限公司 红包发放方法、装置、设备及介质
CN111598256B (zh) * 2020-05-18 2023-08-08 北京互金新融科技有限公司 目标客户的默搭购买行为的处理方法和装置
CN111598256A (zh) * 2020-05-18 2020-08-28 北京互金新融科技有限公司 目标客户的默搭购买行为的处理方法和装置
CN113744002A (zh) * 2020-05-27 2021-12-03 北京沃东天骏信息技术有限公司 推送信息的方法、装置、设备和计算机可读介质
CN111814092A (zh) * 2020-07-21 2020-10-23 上海数鸣人工智能科技有限公司 基于用户上网行为用于人工智能算法的数据预处理方法
CN112016003A (zh) * 2020-08-19 2020-12-01 重庆邮电大学 基于cnn的社交小众用户标签挖掘及相似用户推荐方法
CN112070615A (zh) * 2020-09-02 2020-12-11 中国银行股份有限公司 基于知识图谱的理财产品推荐方法及装置
CN112200601A (zh) * 2020-09-11 2021-01-08 深圳市法本信息技术股份有限公司 物品推荐方法、装置及可读存储介质
CN112200601B (zh) * 2020-09-11 2024-05-14 深圳市法本信息技术股份有限公司 物品推荐方法、装置及可读存储介质
CN112287213A (zh) * 2020-10-21 2021-01-29 重庆电子工程职业学院 一种基于大数据的信息分析方法
CN112269911A (zh) * 2020-11-11 2021-01-26 深圳视界信息技术有限公司 设备信息识别方法、模型训练方法、装置、设备及介质
CN112288549A (zh) * 2020-11-18 2021-01-29 杭州拼便宜网络科技有限公司 一种商品推荐列表生成方法、装置、设备及可读存储介质
CN112288549B (zh) * 2020-11-18 2024-05-31 杭州拼便宜网络科技有限公司 一种商品推荐列表生成方法、装置、设备及可读存储介质
CN112508603A (zh) * 2020-11-26 2021-03-16 泰康保险集团股份有限公司 养老社区潜在客户信息挖掘方法及装置
CN112435067A (zh) * 2020-11-30 2021-03-02 翼果(深圳)科技有限公司 跨电商平台与社交平台的智能广告投放方法及***
CN112667919A (zh) * 2020-12-28 2021-04-16 山东大学 一种基于文本数据的个性化社区矫正方案推荐***及其工作方法
CN112667911A (zh) * 2021-01-14 2021-04-16 中山世达模型制造有限公司 一种利用社交软件大数据找寻潜在客户的方法
CN113177151A (zh) * 2021-05-28 2021-07-27 中山世达模型制造有限公司 一种潜在客户筛选方法
WO2022246923A1 (zh) * 2021-05-28 2022-12-01 中山世达模型制造有限公司 一种潜在客户筛选方法
CN113379529A (zh) * 2021-06-07 2021-09-10 广发银行股份有限公司 一种协同决策引擎应用框架
CN113393271A (zh) * 2021-06-15 2021-09-14 湖南汽车工程职业学院 一种产品客户大数据适用匹配***及计算机存储介质
CN113393271B (zh) * 2021-06-15 2022-09-23 湖南汽车工程职业学院 一种产品客户大数据适用匹配***及计算机存储介质
CN113822596A (zh) * 2021-10-12 2021-12-21 深圳市我们在线教育有限公司 基于大数据的客户筛选方法
CN113822596B (zh) * 2021-10-12 2023-08-29 深圳市单仁牛商科技股份有限公司 基于大数据的客户筛选方法
CN114187036B (zh) * 2021-11-30 2022-10-11 深圳市喂车科技有限公司 一种基于行为特征识别的互联网广告智能推荐管理***
CN114187036A (zh) * 2021-11-30 2022-03-15 深圳市喂车科技有限公司 一种基于行为特征识别的互联网广告智能推荐管理***
CN114267457B (zh) * 2021-12-03 2022-11-29 爱优牙信息技术(深圳)有限公司 一种匹配定向客户的牙医服务平台
CN114267457A (zh) * 2021-12-03 2022-04-01 爱优牙信息技术(深圳)有限公司 一种匹配定向客户的牙医服务平台
CN114387064A (zh) * 2022-01-13 2022-04-22 福州大学 一种基于综合相似度的电商平台潜在客户推荐方法及***
CN114595323B (zh) * 2022-03-04 2023-03-10 北京百度网讯科技有限公司 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN114595323A (zh) * 2022-03-04 2022-06-07 北京百度网讯科技有限公司 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN114841760B (zh) * 2022-06-30 2022-09-02 北京聚云数字信息技术有限公司 一种基于受众行为特征分析的广告推荐管理方法及***
CN114841760A (zh) * 2022-06-30 2022-08-02 北京聚云数字信息技术有限公司 一种基于受众行为特征分析的广告推荐管理方法及***
CN116308464A (zh) * 2023-05-11 2023-06-23 广州钛动科技股份有限公司 目标客户获取***和方法
CN116308464B (zh) * 2023-05-11 2023-09-08 广州市沃钛移动科技有限公司 目标客户获取***和方法
CN116485560A (zh) * 2023-06-21 2023-07-25 杭州大鱼网络科技有限公司 一种基于反馈机制的目标用户筛选方法及***
CN116523572B (zh) * 2023-06-28 2023-09-08 悦享星光(北京)科技有限公司 一种基于客户行为特征的客户挖掘方法及***
CN116523572A (zh) * 2023-06-28 2023-08-01 悦享星光(北京)科技有限公司 一种基于客户行为特征的客户挖掘方法及***
CN116894692B (zh) * 2023-09-11 2023-11-24 北京亿家老小科技有限公司 一种线上网络销售用户潜在需求分析监控方法及***
CN116894692A (zh) * 2023-09-11 2023-10-17 北京亿家老小科技有限公司 一种线上网络销售用户潜在需求分析监控方法及***
CN116957691A (zh) * 2023-09-19 2023-10-27 翼果(深圳)科技有限公司 针对电商商家商品的跨平台智能广告投放方法及***
CN116957691B (zh) * 2023-09-19 2024-01-19 翼果(深圳)科技有限公司 针对电商商家商品的跨平台智能广告投放方法及***
CN117035853A (zh) * 2023-10-09 2023-11-10 销生客(北京)数字科技有限公司 一种基于大数据的潜在客户身份标记***
CN117035853B (zh) * 2023-10-09 2024-02-02 销生客(北京)数字科技有限公司 一种基于大数据的潜在客户身份标记***

Also Published As

Publication number Publication date
CN110222272B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
CN110222272A (zh) 一种潜在客户挖掘与推荐方法
Liu et al. Analyzing changes in hotel customers’ expectations by trip mode
Kirby-Hawkins et al. An investigation into the geography of corporate e-commerce sales in the UK grocery market
Li et al. Is peer evaluation of consumer online reviews socially embedded?–An examination combining reviewer’s social network and social identity
Kuo et al. Application of quality function deployment to improve the quality of Internet shopping website interface design
Luo Analyzing the impact of social networks and social behavior on electronic business during COVID-19 pandemic
CN103886074B (zh) 基于社交媒体的商品推荐***
CN102902691B (zh) 推荐方法及***
CN103246980B (zh) 信息输出方法及服务器
CN105488697A (zh) 一种基于客户行为特征的潜在客户挖掘方法
CN106327227A (zh) 一种信息推荐***及信息推荐方法
CN102968506A (zh) 一种基于扩展特征向量的个性化协同过滤推荐方法
CN104679771A (zh) 一种个性化数据搜索方法和装置
Rezaeinia et al. Recommender system based on customer segmentation (RSCS)
Mei et al. Overview of Web mining technology and its application in e-commerce
CN104408648A (zh) 一种挑选商品的方法及装置
CN104574153A (zh) 快速的负序列挖掘模式在客户购买行为分析中的应用
CN104537553A (zh) 重复负序列模式在客户购买行为分析中的应用
Niu et al. Product hierarchy-based customer profiles for electronic commerce recommendation
CN109919728A (zh) 一种微商城的商品推荐方法
Čavoški et al. Agent-based modelling and simulation in the analysis of customer behaviour on B2C e-commerce sites
Faraone et al. Using context to improve the effectiveness of segmentation and targeting in e-commerce
Nurmi et al. Promotionrank: Ranking and recommending grocery product promotions using personal shopping lists
Wu et al. [Retracted] Using the Mathematical Model on Precision Marketing with Online Transaction Data Computing
Pirani et al. Analysis and optimization of online sales of products

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant