CN111582975A

CN111582975A - 基于用户、产品和广告相结合的人工智能推荐方法及***

Info

Publication number: CN111582975A
Application number: CN202010328145.XA
Authority: CN
Inventors: 许立达
Original assignee: Individual
Current assignee: Individual
Priority date: 2020-04-23
Filing date: 2020-04-23
Publication date: 2020-08-25
Anticipated expiration: 2040-04-23
Also published as: CN111582975B

Abstract

本发明提供一种基于用户、产品和广告相结合的人工智能推荐方法及***，所述人工智能推荐方法包括以下步骤：步骤S1，获取用户个人信息；步骤S2，将产品基本信息和商家信息进行结合以产生并存储产品信息；步骤S3，结合所述个人信息数据库和所述产品使用信息数据库，通过余弦相似度实现对用户的初步产品推荐；步骤S4，将广告商信息和基本广告信息进行结合以产生并存储广告信息；步骤S5，根据每个商家在所述产品使用信息数据库中的信息，生成并发送对应其产品的第一产品报告；步骤S6，生成并发送对应广告商的第二产品报告。本发明能够实现用户对推荐产品的主动反馈，并有效地对用户、商家和广告商三者的需求进行了有机结合。

Description

基于用户、产品和广告相结合的人工智能推荐方法及***

技术领域

本发明涉及一种智能推荐方法，尤其涉及一种基于用户、产品和广告相结合的人工智能推荐方法，并涉及采用了该基于用户、产品和广告相结合的人工智能推荐方法的人工智能推荐***。

背景技术

已有人工智能平台推荐***流程描述：一般根据产品相近度或根据用户购买记录，进行相关推荐，比如用户买了牙膏，***会推荐牙刷；因为牙刷和牙膏属于相近产品。或根据用户相似度和根据用户购买记录，比如用户买了很多书籍，那么算法将用户归于爱读书，并对该用户推荐其他爱读书用户所购买的商品等。

这种现有的人工智能平台推荐***存在以下不足：一、现有推荐***流程不提供用户实时反馈的机会，比如***向用户推荐了牙刷，但用户无法告诉***他不喜欢推荐的牙刷，***也因此失去一次对用户偏好再学***台上买了很多幼儿教育书和历史书，却没办法实现主动学***台只对消费者推荐产品，而不考虑商家或广告商的需求。

发明内容

本发明所要解决的技术问题是需要提供一种能够实现用户对推荐产品的主动反馈，并结合将用户、商家和广告商三者需求的人工智能推荐方法，还进一步提供采用了该人工智能推荐方法的人工智能推荐***。

对此，本发明提供一种基于用户、产品和广告相结合的人工智能推荐方法，包括以下步骤：

步骤S1，获取用户个人信息，并存储至个人信息数据库中；

步骤S2，获取商家信息和产品基本信息，通过机器学习模块对商家的产品基本信息进行学习，将所述产品基本信息和商家信息进行结合以产生产品信息，并将所述产品信息存储至产品使用信息数据库中；

步骤S3，结合所述个人信息数据库和所述产品使用信息数据库，通过余弦相似度实现对用户的初步产品推荐，记录并更新用户的反馈和平台活动结果；

步骤S4，获取广告商信息和基本广告信息，通过机器学***台活动结果；

步骤S5，根据每个商家在所述产品使用信息数据库中的信息，生成对应其产品的第一产品报告，并将所述第一产品报告发送给所述商家；

步骤S6，根据每个广告商的广告在所述广告使用信息数据库中的信息，生成对应广告商的第二产品报告，并将所述第二产品报告发送给所述广告商。

本发明的进一步改进在于，所述步骤S1包括以下子步骤：

步骤S101，获取用户的基本注册信息，包括用户的账号、密码、注册时间和注册地区；

步骤S102，统计用户的问卷内容，包括使用该平台的目的、目前的偏好、目前所处的职业/行业、未来计划以及对该平台的计划使用时间中的任意一项或几项；

步骤S103，将所述用户的基本注册信息和问卷内容进行合并形成用户个人信息；

步骤S104，将所述用户个人信息的文字信息转换成数字信息，由此形成用户个人信息的信息矩阵；

步骤S105，在个人信息数据库中对用户个人信息的信息矩阵的数据按比例进行调整，使得所有的数值都在0至10中间。

本发明的进一步改进在于，所述步骤S104中，通过独热编码将所述用户个人信息的文字信息转换成数字信息，将用户个人信息的所有文字信息通过0和1来表达；所述步骤S105中，对数据进行调整的比例为预先设定的数值。

本发明的进一步改进在于，所述步骤S2包括以下子步骤：

步骤S201，获取商家的基本注册信息，包括用户的账号、密码、注册时间、注册地区和评分；

步骤S202，统计商家的问卷内容，包括商家的主要领域、商家目标用户人群和目标平台中的任意一项或几项；

步骤S203，将所述商家的基本注册信息的问卷内容进行合并形成商家信息；

步骤S204，上传视频和产品基本信息至产品基本信息模块，产品基本信息包括视频类别、简介、评分和时长中的任意一项或几项；

步骤S205，对产品基本信息模块中的产品信息进行图像识别、语音识别和自然语言处理，进而将视频图像和音频转化成文本得到视频特征；

步骤S206，将视频特征的文字信息转换为数字信息，并按比例将其转换为0至10之间的数，产生产品信息矩阵。

本发明的进一步改进在于，所述步骤S205中，图像识别的过程为将视频进行图像分割，并对分割后的图像进行转化成为数列，将图像的数列输入至卷积神经网络中进行训练，得到各个图像输出出现的最大概率物体，以此作为视频图像的视频特征；语音识别的过程为将音频转换成文本后，通过自然语言处理对所述文本进行特征提取，以此作为音频的视频特征；所述步骤S206中，通过独热编码将所述视频特征的文字信息转换成数字信息，并将其按照比例转换成0至10之间的数。

本发明的进一步改进在于，所述步骤S3包括以下子步骤：

步骤S301，对个人信息数据库中的个人信息进行权重分配，包括用户最初的使用平台目的的权重、用户领域偏好的权重、用户职业的权重、用户对视频长度的偏好权重以及视频难度偏好的权重中的任意一种或几项；

步骤S302，根据所述个人信息的权重分配的得到个人信息数据库中的个人信息向量；

步骤S303，对产品使用信息数据库中的产品信息进行权重分配，包括商家使用平台目的的权重、产品领域的平均权重、商家职业的权重、商家偏好人群的权重、产品时长的权重、视频难度权重、产品评分权重以及商家评分权重中的任意一项或几项；

步骤S304，根据所述产品信息的权重分配得到产品使用信息数据库中的产品信息向量；

步骤S305，对所述个人信息向量和产品信息向量进行余弦相似度计算，根据余弦相似度由高到低进行排列实现推荐；

步骤S306，通过用户对推荐结果的反馈及用户在平台活动，动态记录并对所述个人信息数据库和产品使用信息数据库的数据进行权重更新。

本发明的进一步改进在于，所述步骤S4包括以下子步骤：

步骤S401，获取广告商信息和基本广告信息；

步骤S402，对广告商信息和基本广告信息进行权重分配，进而将广告商信息和基本广告信息分别转为广告商信息向量和广告信息向量；

步骤S403，对所述产品信息向量和广告商信息向量，或对所述个人信息向量和广告商信息向量进行余弦相似度计算，根据余弦相似度由高到低进行排列实现推荐；

步骤S404，通过用户对推荐结果的反馈及用户在平台活动，动态记录并对所述广告使用信息数据库、产品使用信息数据库和个人信息数据库的数据进行权重更新。

本发明的进一步改进在于，所述步骤S5中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该商家的同类产品，进而生成对应的第一产品报告，并将所述第一产品报告定期发送给所述商家。

本发明的进一步改进在于，所述步骤S6中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该广告商的同类产品，进而生成对应的第二产品报告，并将所述第二产品报告定期发送给所述广告家。

本发明还提供一种基于用户、产品和广告相结合的人工智能推荐***，采用了如上所述的基于用户、产品和广告相结合的人工智能推荐方法。

与现有技术相比，本发明的有益效果在于：通过用户对推荐产品的主动反馈，并结合用户的个人信息与偏好、商家的个体信息与偏好以及广告商的个体信息与偏好，结合用户对产品的使用信息和反馈信息，实时动态地给用户最贴切的产品推荐和广告推荐；在此基础上，还通过对用户群体的了解，为商家和广告商提供市场需求走向信息，从而帮助商家和广告商进行更为有效和合理的资源安排。

附图说明

图1是本发明一种实施例的工作流程示意图；

图2是本发明一种实施例的详细工作流程示意图；

图3是本发明一种实施例中统计的用户问卷内容示意图；

图4是本发明一种实施例中统计的商家问卷内容示意图；

图5是本发明一种实施例对推荐结果进行反馈的示意图；

图6是本发明一种实施例在用户收到推荐的广告时的示意图；

图7是本发明一种实施例在用户观看完推荐的广告时的示意图。

图8是本发明一种实施例的产品报告的示意图。

具体实施方式

下面结合附图，对本发明的较优的实施例作进一步的详细说明。

如图1和图2所示，本例提供一种基于用户、产品和广告相结合的人工智能推荐方法，包括以下步骤：

步骤S1，获取用户个人信息，并存储至个人信息数据库中；

本例所述商家指的是商品供应商或产品供应商，所述广告也可以是广告供应商；值得说明的是，本例旨在提供基于用户、产品和广告相结合的人工智能推荐方法及***，流程中的所涉及到的各个步骤或模块单独的具体实施方法和细节可各有不同，在本实施例中，将通过视频平台的角度，用至少一种实现方法，来阐述各个步骤/模块的实现方式；在实际应用中，如果针对的不是视频平台，可以适应性修改为与平台对应的处理方式。

本例所述步骤S1可以通过以下方式来实现，用户进入消费者端(a1)提供基本注册信息(a2)，并在用户问卷模块(b)中填写个人问卷，用户问卷模块(b)将所收集的信息转换为用户个人信息(c1)，个人信息数据库(c2)将用户个人信息(c1)收入其中。更为具体的，本例所述步骤S1优选包括以下子步骤：

步骤S101，获取用户的基本注册信息(a2)，包括但不限于用户的账号(也称用户名)、密码、注册时间和注册地区(简称地址)；

步骤S102，统计用户的问卷内容(b)，包括但不限于使用该平台的目的(也称使用平台目的)、目前的偏好、目前所处的职业/行业、未来计划以及对该平台的计划使用时间(简称使用计划(小时/周))中的任意一项或几项，如图3所示；

步骤S103，将所述用户的基本注册信息(a2)和问卷内容(b)进行合并形成用户个人信息(c1)，合并的形式优选以表格形式进行合并，如下表所示；

id

用户名

地址

注册时间

使用平台目的

偏好

未来计划

使用计划(小时/周)

职业

dahh98ol

jackson

北京

12/30/2019

娱乐

军事类/经济类

军事

2

教师

sakh81id

kingofgame

深圳

5/16/2018

学习

游戏类

电脑科学

10

学生

lvmd03ug

jambond

重庆

11/22/2019

兴趣拓展

生活类

无

3

数据分析师

…

步骤S104，将所述用户个人信息的文字信息转换成数字信息，由此形成用户个人信息的信息矩阵，如下表所示；这样设计的原因在于，由于推荐所涉及的方法只能对数字进行处理，而目前用户的信息都是文字而非数字，因此，需要预先进行转换；

id

地址北京

地址深圳

地址重庆

使用平台目的娱乐

…

偏好军事

…

未来计划军事

…

使用计划(小时/周)

职业教师

…

dahh98ol

1

0

1

…

1

…

1

…

2

1

…

sakh81id

0

1

0

…

0

…

0

…

10

0

…

lvmd03ug

0

1

0

…

0

…

0

…

3

0

…

本例所述步骤S104中，通过独热编码将所述用户个人信息的文字信息转换成数字信息，将用户个人信息的所有文字信息通过0和1来表达，也就是说，本例将文字信息转为数字信息的优选转换方式可以是独热编码(one-hot encoding),比如用户所处的职业为金融，并且对金融有兴趣，那么将信息矩阵中偏好金融的数值和职业金融的数值设置为1；如果用户在之前的问卷中没有体现对体育的兴趣也不从事体育这个行业，那么信息矩阵中偏好体育的数值和职业体育的数值设置为0。如此一来，用户所有的个人信息特征都可用0和1来代表，使得推荐***能够理解用户的特征。

需要指出的是，独特编码产生的用户信息矩阵中的长度将会远远大于用户的非矩阵信息。这是由于独热编码带来的数据稀缺性造成的。比如在问卷中的问题“使用该平台的目的是：”里有三个选项，包括娱乐、学习和拓展兴趣，在用户的信息中，当用户选择了“娱乐”，这个结果将会被记录如下：

用户ID	使用平台目的
		1	娱乐

而当转换成为信息矩阵后，这个结果将会被记录如下：

用户ID	使用平台目的娱乐	使用平台目的学习	使用平台目的拓展兴趣
				1	1	0	0

由此一来，原本1*2的形状就会拓展变为1*4的形状，即在用户信息矩阵中将没有信息的数值自动设置为0。

步骤S105，在个人信息数据库中对用户个人信息的信息矩阵的数据按比例进行调整，使得所有的数值都在0至10中间；所述步骤S105中，对数据进行调整的比例为预先设定的数值，如0-10之间的数值，该数值可以根据实际需求和使用环境进行自定义的设置和调整。

个人信息数据库(c2)中，将对用户个人信息的信息矩阵的数据按比例进行调整，使得所有的数值都在0至10中间,方便推荐所涉及的方法进行公平的运算。具体按何种比例来转换，一个可行的方法是人为的设定一个值。比如一周使用5小时很短，那么视频长度偏好可以为1,一周使用10小时可以将视频长度偏好转换为5，而大于20小时，可以设为10。对于只有0和1的数据，可以保守的将他们乘以7，这样原来如果使用平台目的娱乐为1，那么现在则为7。

id

地址北京

…

使用平台目的娱乐

…

偏好军事

…

职业教师

…

视频长度偏好

视频难度偏好

广告偏好军事

…

广告使用平台目的学习

…

广告偏好学生

…

dahh98ol

1

…

1

…

1

…

1

…

5

…

5

…

5

…

sakh81id

0

…

0

…

0

…

0

…

5

…

5

…

5

…

lvmd03ug

0

…

0

…

0

…

5

…

5

…

5

…

而由于当前步骤中用户还未开始使用产品，个人信息数据库(c2)(见上表)的数据暂且与用户个人信息的信息矩阵相同,而在用户个人信息中没有的信息(比如用户对视频长度的偏好，用户对广告的偏好)，数据库的信息将会采取中间数(比如5)，使得用户在尚未录入的特征不偏向其中一方。

当用户之后的步骤里对视频产品有所使用后，所有的信息都将更新，如下表所示。

id

地址北京

…

使用平台目的娱乐

…

偏好军事

…

职业教师

…

视频长度偏好

视频难度偏好

广告偏好军事

…

广告使用平台目的学习

…

广告偏好学生

…

dahh98ol

9

…

8

…

9

…

8

…

10

3

…

9

…

5

…

sakh81id

1

…

2

…

1

…

0

…

8

1

…

4

…

3

…

lvmd03ug

0

…

5

…

0

…

5

…

1

7

6

…

2

…

1

…

本例所述步骤S2中，商家进入商家端(m1)提供基本注册信息(m2)，并在商家问卷模块(i)中填写商家问卷，商家问卷模块(i)将所收集的信息转换为商家信息(k)。商家同时上传产品至产品模块(n1)并填写基本产品信息(n2)。机器学习模块(j1)对商家的产品基本信息(n2)进行学习，并与和商家的信息(k)结合，进而产生产品信息(h1)。产品使用信息数据库模块(h2)收录产品信息(h1)。

更为具体的，本例所述步骤S2包括以下子步骤：

步骤S201，获取商家的基本注册信息(m2)，包括但不限于用户的账号(也称用户名)、密码、注册时间、注册地区和评分，该步骤与步骤S101类似；

步骤S202，统计商家的问卷内容(i)，包括但不限于商家的主要领域(简称领域)、商家目标用户人群(也称偏好用户)和目标平台(也称偏好平台目的)中的任意一项或几项，如图4所示；

步骤S203，将所述商家的基本注册信息(m2)的问卷内容(i)进行合并形成商家信息(k)，该商家信息(k)的记录模式与用户个人信息(c1)相似，都以文字信息为主，如下表所示；

商家Id

名称

注册时间

专注领域

商家职业

偏好人群

偏好平台目的

商家评分

uwjs99pl

金融知多少

3/5/2019

经济

券商

学生

学习

暂无

plkm776i

military001

6/18/2018

军事

教授

无

暂无

12lkso90

小明老师

4/28/2019

教育

教师

无

娱乐

暂无

…

步骤S204，商家在产品模块(n1)上传视频，并填写产品基本的信息至产品基本信息模块，产品基本信息包括但不限于视频类别、简介、评分和时长中的任意一项或几项，如下表所示；

产品Id

商家id

产品领域类别

产品简介

时长(秒)

产品热度

产品评分

产品难度

1x920slu1p

uwjs99pl

经济

你想知道关于xxx

600

暂无

10xxp296hf

plkm776i

二战

xxx

300

暂无

9ksmu3of9d

12lkso90

数学

xxx

1000

暂无

…

步骤S205，对产品基本信息模块(n2)中的产品信息进行图像识别、语音识别和自然语言处理，进而将视频图像和音频转化成文本得到视频特征；优选的，所述步骤S205中，图像识别的过程为将视频进行图像分割，并对分割后的图像进行转化成为数列，将图像的数列输入至卷积神经网络中进行训练，得到各个图像输出出现的最大概率物体，以此作为视频图像的视频特征；语音识别的过程为将音频转换成文本后，通过自然语言处理对所述文本进行特征提取，以此作为音频的视频特征；

本例所述步骤S205优选通过机器学习模块(j1)将对产品基本信息模块(n2)的产品信息进行学习。机器学习模块(j1)所涉及的算法在这是广义上通过统计模型或神经网路对所涉及的数据进行处理的过程，本例将人工智能、机器学习和深度学习等相关的概念统一称作为机器学习。因为单个机器学习的定义和相关算法不是本发明的核心，所以这里的机器学习模块所涉及的算法可以是任何的涉及统计学和电脑科学的算法：可以涵盖深度学习(如递归神经网络和卷积神经网络)，也可涵盖最基本的预测性模型(如线性回归)。本例机器学习模块(j1)提到的所有算法皆为高阶样本行的一个描述和实施，因为具体算法的实施因公司和研究机构的资源和风格都会有所不同，所以在本申请中为了不偏离本申请的重点，仅做样本性的讨论。

本例所使用的机器学习主要为对产品基本信息模块(n2)中的产品信息进行图像识别(image recognition)、语音识别(speech recognition)和自然语言处理(naturallanguage processing)。

其中，图像识别用于在识别商家的视频的主要信息，这有助与进一步加强***对商家视频内容的理解。因为仅输入商家填写的视频类别，是远远不够推荐***真正的了解被推荐视频的内容。比如视频的分类的经济，但图像识别后的结果显示为坦克、士兵，那该视频极有可能同时属于战争和经济，视频涉及的是战争时的经济，而非和平情况下的经济。

自然语言处理用于理解视频中所涉及音频和视频的简介，同样是为了进一步加强***对商家视频内容的理解。语音识别将把视频里的音频转换为文本，自然语言处理将对转换而来的文本进行处理并提取核心内容。比如，如果视频里的音频核心是损失和二战，那么该视频所涉及的内容很有可能为二战时经济的损失。自然语言处理也将对作者填写的视频简介里的文本进行提炼。继续使用上一段落中的例子，如果简介提炼出的核心是生存，那么该视频一定与二战相关，而涉及的内容基本确定为二战时经济的损失和人类的生存。

本例的图像识别用于提取视频内容所涉及的算法是卷积神经网络(Convolutional Neural Network)。目前主流的使用于图像识别的卷积神经网络的具体实施算法有CNN-16和Resnet50。需要再次说明的是，本例在这里通过卷积神经网络来描述其实现过程，但是在实际应用中，这个算法可以被灵活的更换，所以这里仅进行高阶的概述而非仔细的讨论算法实施的具体细节和难度等。因此，优选的，首先视频可以被分为100幅图像(如果一个视频100秒，那每一秒的画面将会是一副图像)。图像将被转化为数列，每一个图像的数列单独的被输入进卷积神经网络。

同样需要指出的是，现在大部分图像识别都使用预训练模型(pre-trainedmodel)。一个卷积神经网络的预训练模型已经通过之前大量的训练记录了各个不同物体的数字矩阵的表达方式，因此在使用图像识别的时候，仅需对神经网络最后的一层或两层进行训练。因此，这个步骤中便也可使用预训练模型，将100辐图像依次输入该神经网中，每一幅图像都将有至少一个预测物体的对应值。最直接的方法是取每幅图占面积最大的物体和该物体对应的最大概率的实体。由此一来100幅图像就会有100个对应的最大概率物体。为了提取该视频的主要图像内容，最后的结果可以对100个图像的物体进行出现频率的统计和排名，并提出排名前3的图像，作为该视频的主要特征。

需要说明的是，算法的使用者可以使用如上提到的自己训练出来的模型，但鉴于市面上已有很多公司提供图像识别的服务，算法的使用者也可以使用其他算法来进行最后的频率统计和排名，因此，可以不用在自己***内训练图像识别的模型，省时省力。

本例所述语音识别为用于对语音的识别，从而产生语音的文本。当视频中的音频已被转换为文本后，可通过自然语言处理来对文本的核心概念进行提取。一个可行的方法是通过主题模型(topic modeling)的隐狄利克雷分布(lda)来提取每个文本的主题，当然，在实际应用中，算法也可以实际的需求和应用的不同而更改。

隐狄利克雷分布(lda)需要手动指定一个文本的主题数目，比如5个。使用主题模型的意义在于一个文档可以有多个不同的主题，而每个主题可以是一连串的词汇构成。具体实施隐狄利克雷分布的流程可以概括为：先将文本进行基本的处理，比如分词处理。分词处理的意义再于将句子的单词分开。比如“我喜欢喝可乐”可以分为“我喜欢喝可乐”三部分。再把停用词去掉，比如“我饿了”这里的“了”对文本理解没有帮助，可以作为停用词去掉。再将文本通过词袋(bag-of-words)或词频-逆文本频率(TF-IDF)模型,将文本变为一个向量。此时将文本的向量置入隐狄利克雷分布模型里，并设置5个主题(主题数量为预先设定，可以自定义设置和调整)。如此一来，便有了5个主题的主要词汇。这里可将每个主题前4个重要的词汇进行提取，这样便有了20个关于这个文本的主题词汇，然后通过最大概率对词汇出现频率进行统计和排名，可以同样提出三个最相关的主题词汇。

由此一来产品信息(h1)便可分别通过视频图像和音频转化成文本而来的主要视频特征。这里核心词汇可以是如“通货膨胀、人民、经济”等从视频里的音频内容和视频简介得来的信息。核心图像可以收入从视频图像提取的主要特征如“人、飞机、坦克”等。产品信息(h1)将结合产品基本信息(n2)提供的类别、时长，和商家信息(k)里提供的商家领域、偏好人群和偏好视频类的信息，详见下表。

产品Id

商家id

产品领域类别

核心词汇

核心图像

时长(秒)

商家专注领域

商家职业

偏好人群

偏好平台目的

商家评分

产品热度

产品评分

产品难度

1x920slu1p

uwjs99pl

经济

战争、通货膨胀、经济

金钱、飞机

600

经济

券商

学生

学习

暂无

10xxp296hf

plkm776i

二战

武器

飞机、士兵、坦克

300

军事

教授

无

暂无

9ksmu3of9d

12lkso90

数学

二次方程

公式

1000

教育

教师

无

娱乐

暂无

…

步骤S206，将视频特征的文字信息转换为数字信息，如同样采用独热编码实现，并按比例将其转换为0至10之间的数，产生产品信息矩阵，如下表所示。

产品Id

商家id

产品领域经济平均权重

…

产品领域经济

…

核心词汇涉及经济

…

核心图像涉及经济

…

商家专注领域经济

…

商家职业券商

…

偏好人群学生

…

偏好平台目的学习

…

时长

商家评分

产品热度

产品评分

产品难度

1x920slu1p

uwjs99pl

7.25

…

10

…

7

…

5

…

7

…

5

…

7

…

10

…

5

暂无

10xxp296hf

plkm776i

3

…

0

…

3

…

5

…

4

…

1

…

2

…

2

…

3

暂无

9ksmu3of9d

12lkso90

0.75

…

0

…

0

…

0

…

3

…

0

…

1

…

1

…

9

暂无

…

本例所述步骤S206中，通过独热编码将所述视频特征的文字信息转换成数字信息，并将其按照比例转换成0至10之间的数。

由于商家的产品还未被用户使用，产品使用信息数据库(h2)(如下表所示)的数据暂且与产品信息矩阵相同，而在产品信息矩阵没有的信息，数据库的信息将会采取中间数(处理方法类似步骤S105),直到用户使用该视频后，将会更新对应的数据,即热门度、正面度、评分、视频难度等。

产品Id

商家id

产品领域经济平均权重

…

产品领域经济

…

核心词汇涉及经济

…

核心图像涉及经济

…

商家专注领域经济

…

商家职业券商

…

偏好人群学生

…

偏好平台目的学习

…

时长

商家评分

产品热度

产品评分

产品难度

1x920slu1p

uwjs99pl

7.25

…

10

…

7

…

5

…

7

…

5

…

7

…

10

…

5

10xxp296hf

plkm776i

3

…

0

…

3

…

5

…

4

…

1

…

2

…

2

…

3

5

9ksmu3of9d

12lkso90

0.75

…

0

…

0

…

0

…

3

…

0

…

1

…

1

…

9

5

…

需要指出的是，本例所述步骤S205中提取视频内容和文本主题数目的结果会使得产品信息矩阵里的核心词汇涉及xx和核心图像涉及xx等列的过于庞大。因为一个视频可以产生任何三个关键字，有n个视频就很可能有3xn个关键词。一个可以解决的方式是建立公司自己的词典，确保产品信息矩阵里核心词汇涉及xx和核心图像涉及xx等列的维度和限度的统一。比如军事类视频的关键词所对应的词汇可以包括飞机、战争和士兵等，经济类视频的关键词所对应的词汇可以包括经济、股市和通货膨胀等。如此一来，当一个视频的内容涉及通货膨胀和战争的词汇，算法便可将该视频在经济类和军事类的权重提升(比如在上一段落产品信息矩阵里的核心图像涉及经济从5上升至7)，使得视频更靠近军事类和经济类视频。如果提出的关键词不在任何字典的对应领域里，那么该词可以忽略不计。具体字典实例可以为:

本例所述步骤S3中，产品推荐***(s1)结合个人信息数据库(c2)，产品使用信息数据库(h2)，通过余弦相似度(cosine similarity)来为用户做初步产品推荐(e)。

更为具体的，所述步骤S3包括以下子步骤：

步骤S301，用户的首次产品推荐的数据将根据***目前对用户最初的了解来进行，目前已知的是个人信息数据库(c2)；因此，对个人信息数据库中的个人信息进行权重分配，包括但不限于用户最初的使用平台目的的权重、用户领域偏好的权重、用户职业的权重、用户对视频长度的偏好权重以及视频难度偏好的权重中的任意一种或几项，如下表所示；这里的各个权重，可以为预先设置的权重，如1～10中的数值，也可以是根据实际需求进行自定义修改和调整的权重。

id

地址北京

…

使用平台目的娱乐

…

偏好军事

…

职业教师

…

视频长度偏好

视频难度偏好

广告偏好军事

…

广告使用平台目的学习

…

广告偏好学生

…

dahh98ol

1

…

1

…

1

…

1

…

5

…

5

…

5

…

sakh81id

0

…

0

…

0

…

0

…

5

…

5

…

5

…

lvmd03ug

0

…

0

…

0

…

5

…

5

…

5

…

步骤S302，根据所述个人信息的权重分配的得到个人信息数据库中的个人信息向量(c2)，以用户id为dahh98ol举例，该用户的向量为[1,…,1,…1,…,5,…,5,…]，本例暂时不将地址转为向量；

每个视频在产品使用信息数据库(h2)中信息如下表所示，步骤S303中，对产品使用信息数据库中的产品信息进行权重分配，包括但不限于商家使用平台目的的权重、产品领域的平均权重、商家职业的权重、商家偏好人群的权重、产品时长的权重、视频难度权重、产品评分权重以及商家评分权重中的任意一项或几项；这里的各个权重，可以为预先设置的权重，如1～10中的数值，也可以是根据实际需求进行自定义修改和调整的权重。

步骤S304，根据所述产品信息的权重分配得到产品使用信息数据库中的产品信息向量；根据此信息，本例得到每个产品在产品使用信息数据库(h2)的向量。而在步骤S302已对向量进行举例，这里不再重复阐述。在执行的时候需要注意用户和产品向量的大小要是相同的。

产品Id

商家id

产品领域经济平均权重

…

产品领域经济

…

核心词汇涉及经济

…

核心图像涉及经济

…

商家专注领域经济

…

商家职业券商

…

偏好人群学生

…

偏好平台目的学习

…

时长

商家评分

产品热度

产品评分

产品难度

1x920slu1p

uwjs99pl

7.25

…

10

…

7

…

5

…

7

…

5

…

7

…

10

…

5

10xxp296hf

plkm776i

3

…

0

…

3

…

5

…

4

…

1

…

2

…

2

…

3

5

9ksmu3of9d

12lkso90

0.75

…

0

…

0

…

0

…

3

…

0

…

1

…

1

…

9

5

…

步骤S305，对所述个人信息向量和产品信息向量进行余弦相似度计算，根据余弦相似度由高到低进行排列实现推荐；通过对每个用户和所有的产品向量进行余弦相似度计算，公式为

A和B分别表示个人信息向量和产品信息向量的数值，其余弦相似度计算结果为包含0和1之间的任何数，1为最相近，0为最不相近。当一个用户有10个最相近的产品时，可以通过余弦相似度计算由高到低排列选取最高的10个，最终产品的排名将有各个产品的商家评分、产品热度和产品难度来做决定。用户最终将收到商家评分和产品热度最高的视频推荐。在10个最相似的视频中，***可以为用户最终推荐综合评分和热度的最好的三个视频作为产品推荐模块(e)的产品推荐。产品将以难度排列，告诉用户可以先观看视频A(难度3)，再看视频B(难度5),最后看视频C(难度9)，给予用户有层次的推荐，让用户能够根据视频难度的级别逐级观看。

在用户得到产品推荐后，可以对推荐的结果进行反馈(即收藏或移除)，如图5所示，并记录在在推荐反馈模块(r1)。如果用户对一个推荐的视频进行移除的话，该视频则从用户的界面消失，同时界面将使用步骤S305里推荐排名第四的视频来填补被移除的视频。被移除的视频所具备的特征将更新用户在个人信息数据库(c2)的信息和对应的向量。比如当被移除的推荐产品的产品领域经济平均权重为10(最高)，则说明用户不喜欢完全偏向经济的视频，说明该视频可能过于枯燥。因此***可以更新并降低用户偏好经济的权重(比如从8降至7)。

如此一来，用户在个人信息数据库(c2)的信息和向量得以根据用户对推荐的反馈进行更新。同理，如果用户对一个产品领域经济平均权重为10的推荐产品选择了收藏，则说明用户喜欢纯粹关于经济的视频，用户偏好经济权重也可以相应的更新和提升(比如从8升至9)。如果一个产品的产品领域经济平均权重为10的视频被很多用户偏好经济权重为10的用户所移除，则说明该产品的产品领域经济平均权重需要降低(比如从10降至9)。因为如果热爱经济视频的用户都不喜欢这个视频，很有可能说明这个视频和经济并非那么相关。由此一来，这个视频在产品使用信息数据库(h2)的信息也将更新。

也就是说，本例的具体权重升降的速度和大小可以视平台大小和商业需求来决定。

当用户观看了一个视频，或者对一个视频进行了评分和难度的评分，这些信息将被记录在平台活动记录模块(g1),并对个人信息数据库模块(c2)和产品使用信息数据库模块(h2)的数据进行更新。比如一个用户观看了很多军事类的视频，那么该用户个人信息数据库模块(c2)的偏好军事的权重将会得到提升。同样如果该用户看了很多难度高的视频，那么该用户的视频难度偏好也将提升。如果一个用户对产品给予了评分或对产品的难度进行了评分，该产品在产品使用信息数据库模块(h2)的产品评分也将更新。如果的一个视频在一定时间内被大量的观看，那该视频的产品热度也将提升。

由此一来，更新后的平台活动记录模块(g1)和个人信息数据库模块(c2)将被重新置于产品推荐***模块(s1)，使得用户每时每刻都能得到最新最贴切的产品推荐(e)。

本例所述步骤S4中，广告商进入广告商端(x1)提供基本注册信息(x2)，并在广告商问卷模块(w)中填写广告问卷，广告商问卷模块(w)将所收集的信息转换为广告商信息(v)。广告商同时上传广告至广告模块(v1)并填写基本广告信息(v2)。机器学习模块(j2)对广告的基本广告信息(v2)进行学习，并与和广告商信息(v)结合，进而产生广告信息(t1)。广告使用信息数据库模块(t2)收录广告信息(t1)。

更为具体的，本例所述步骤S4包括以下子步骤：

步骤S401，获取广告商信息和基本广告信息，获取的方式与步骤S201至S205类似，不同在于数据记录的名称会有所不同以及广告产品不存产品难度、产品长度和广告商职业。这里为了避免同样篇幅的阐述，仅展现最终广告使用信息数据库模块(t2)的样式，如下表所示。需要注明的是尽管这个模块的一些列名称与产品使用信息数据库(h2)一样，但在这里是对广告产品的信息记录，而不是商家产品的记录。

广告Id

广告商id

产品领域经济平均权重

…

产品领域经济

…

核心词汇涉及经济

…

核心图像涉及经济

…

商家专注领域经济

…

偏好人群学生

…

偏好平台目的学习

…

广告商评分

产品热度

产品评分

0soeepnks1

0alskdjgjg

3.75

…

3

…

2

…

3

…

7

…

7

…

2

…

5

iw009kfnvc

9sd0lkmnhf

7

…

7

…

8

…

6

…

7

…

3

…

8

…

5

utor03mc8h

kg9445kgpq

1.5

…

2

…

1

…

0

…

3

…

1

…

1

…

5

…

步骤S402，对广告商信息和基本广告信息进行权重分配，进而将广告商信息和基本广告信息分别转为广告商信息向量和广告信息向量；同样的，这里的各个权重，可以为预先设置的权重，如1～10中的数值，也可以是根据实际需求进行自定义修改和调整的权重。

本例所述步骤S402将步骤S401的每个广告商的信息转为向量，包括但不限于广告商使用平台目的的权重、产品领域的平均权重和偏好人群的权重，结合步骤S302的用户在个人信息数据库(c2)的向量(包括但不限于用户广告使用平台目的的权重、用户广告产品偏好的权重和用户广告人群偏好的权重)以及步骤S303每个视频在产品使用信息数据库(h2)的向量(包括但不限于商家使用平台目的的权重、产品领域的平均权重和产品偏好人群的权重)。

步骤S403，对所述产品信息向量和广告商信息向量，或对所述个人信息向量和广告商信息向量进行余弦相似度计算，根据余弦相似度由高到低进行排列实现推荐；当每个用户得到子步骤S305的产品推荐后，便有了该商家的产品在产品使用信息数据库(h2)的向量。

由于余弦相似度计算只能对两个向量进行比较，这里必须要做出选择：即要么计算产品信息向量和广告产品向量的相似度，要么计算个人信息向量和广告产品向量的相似度。一个可行的方式是轮换，即首次向用户推荐的广告可以是和视频内容相近，第二次推荐可以是和用户相近的广告。假设通过用户和广告商的余弦相似度计算产生了3个最相近的广告，但如果最终只能向用户推送一个广告，那么可以将剩余的三个广告进行商家和广告商之间的余弦相似度计算，也就是说，本例所述步骤S403可以先对所述个人信息向量和广告商信息向量进行余弦相似度计算，然后对计算结果中的广告商信息向量与产品信息向量进行二次余弦相似度计算，以推荐出更为符合三方需求的推荐结果，最后还可以结合本例的广告使用信息数据库模块(t2)的广告商评分、产品热度和产品评分来得到最终的一个广告推荐。

当用户收到广告推荐***模块(s2)推荐的广告时，如图6所示，可对该广告进行反馈，并记录在广告推荐反馈模块(r2)。用户可对广告做出不相关和跳过的选择。这里假设任何广告5秒过后便可跳过，而且不论广告是否相关都要5秒之后才能跳过。假如有一个广告是关于一个楼盘的信息，如果用户在过了5秒后立刻选择跳过，但却没有在这期间对广告做不不相关的推荐，那么***可以假设该广告是有一定相关性的，由此一来用户在个人信息数据库(c2)的信息也将更新(如广告偏好房产从权重5提升至权重6)。同理，如果用户对这个广告做出了不相关的反馈，那么用户的广告偏好房产可从权重5降至权重4。如果该广告被很多广告偏好房产极高的用户做出不相关的反馈，那么便说明该广告并非与地产的广告那么相关，因此可以将广告使用信息数据库模块(t2)里的信息更新，即产品领域房产从权重9降至权重8。

当用户没有选择跳过广告而是观看完了整个广告、甚至在观看完后对广告进行了评分，如图7所示，这信息将被记录在平台活动记录模块(g2)并对广告使用信息数据库模块(t2)进行更新。比如一个用户看完了一个地产的广告，那么该用户个人信息数据库模块(c2)的广告偏好房产的权重将会得到提升。如果用户对这个广告给予了评分，该广告在广告使用信息数据库模块(t2)的产品评分也将更新。如果的一个广告在一定时间内被大量的用户看完，那该视频的产品热度也将提升。由此一来，更新后的广告使用信息数据库模块(t2)进行和个人信息数据库模块(c2)将被重新置于广告推荐***模块(s2),使得用户每时每刻都能得到最新最贴切的广告推荐(q),也为广告商(x1)最大化信息投放的准确度。

本例所述步骤S5根据每个商家视频在产品使用信息数据库(h2)信息，***会生成该产品的产品报告(o)，如图8所示，包含但不限于产品的主要用户群、产品完成率、评分和同类产品的比较等。

优选的，本例所述步骤S5中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该商家的同类产品，进而生成对应的第一产品报告，并将所述第一产品报告定期发送给所述商家，比如每周定期发送，以帮助商家更好的完善他们的产品内容，从而为客户提供更高质量，提供切合市场需求的产品。

与步骤S5相似，本例步骤S6根据每个广告商广告在广告使用信息数据库(t2)信息，***会生成该产品的产品报告(z)，包括但不限于产品的主要用户群、产完成率、评分和同类产品的比较等。

优选的，本例所述步骤S6中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该广告商的同类产品，进而生成对应的第二产品报告，并将所述第二产品报告定期发送给所述广告家，，比如每周定期发送，以帮助广告商更好的完善他们的产品内容，从而为客户提供更高质量，提供切合市场需求的广告信息。

本例还提供一种基于用户、产品和广告相结合的人工智能推荐***，采用了如上所述的基于用户、产品和广告相结合的人工智能推荐方法。

综上所述，本例通过用户对推荐产品的主动反馈，并结合用户的个人信息与偏好、商家的个体信息与偏好以及广告商的个体信息与偏好，结合用户对产品的使用信息和反馈信息，实时动态地给用户最贴切的产品推荐和广告推荐；在此基础上，还通过对用户群体的了解，为商家和广告商提供市场需求走向信息，从而帮助商家和广告商进行更为有效和合理的资源安排。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，包括以步骤：

步骤S1，获取用户个人信息，并存储至个人信息数据库中；

2.根据权利要求1所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S1包括以下子步骤：

3.根据权利要求2所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S104中，通过独热编码将所述用户个人信息的文字信息转换成数字信息，将用户个人信息的所有文字信息通过0和1来表达；所述步骤S105中，对数据进行调整的比例为预先设定的数值。

4.根据权利要求1至3任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S2包括以下子步骤：

5.根据权利要求4所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S205中，图像识别的过程为将视频进行图像分割，并对分割后的图像进行转化成为数列，将图像的数列输入至卷积神经网络中进行训练，得到各个图像输出出现的最大概率物体，以此作为视频图像的视频特征；语音识别的过程为将音频转换成文本后，通过自然语言处理对所述文本进行特征提取，以此作为音频的视频特征；所述步骤S206中，通过独热编码将所述视频特征的文字信息转换成数字信息，并将其按照比例转换成0至10之间的数。

6.根据权利要求1至3任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S3包括以下子步骤：

7.根据权利要求1至3任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S4包括以下子步骤：

步骤S401，获取广告商信息和基本广告信息；

8.根据权利要求1至3任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S5中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该商家的同类产品，进而生成对应的第一产品报告，并将所述第一产品报告定期发送给所述商家。

9.根据权利要求1至3任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法，其特征在于，所述步骤S6中，通过用户的职业和偏好实现用户群的分析，通过看完视频的用户除以所有观看了该视频的用户数得到产品完成率，通过余弦相似度计算该广告商的同类产品，进而生成对应的第二产品报告，并将所述第二产品报告定期发送给所述广告家。

10.一种基于用户、产品和广告相结合的人工智能推荐***，其特征在于，采用了如权利要求1至9任意一项所述的基于用户、产品和广告相结合的人工智能推荐方法。