CN113988060A - 数据信息推荐方法、装置、终端设备和存储介质 - Google Patents
数据信息推荐方法、装置、终端设备和存储介质 Download PDFInfo
- Publication number
- CN113988060A CN113988060A CN202111012365.2A CN202111012365A CN113988060A CN 113988060 A CN113988060 A CN 113988060A CN 202111012365 A CN202111012365 A CN 202111012365A CN 113988060 A CN113988060 A CN 113988060A
- Authority
- CN
- China
- Prior art keywords
- user
- model
- target
- determining
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 95
- 230000006399 behavior Effects 0.000 claims description 114
- 230000002194 synthesizing effect Effects 0.000 claims description 17
- 239000002131 composite material Substances 0.000 claims description 15
- 238000005315 distribution function Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 238000005065 mining Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 77
- 230000009471 action Effects 0.000 description 13
- 230000004927 fusion Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种数据信息推荐方法、装置、终端设备和存储介质,通过响应于用户输入的目标需求信息,获取目标需求信息中包括的不同类型的数据内容;根据不同类型对应的目标数据内容,确定初始特征模型;获取用户的隐式行为信息,并根据用户的隐式行为信息,确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型;根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D‑S证据理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,结合目标数据内容的特征向量,采用初始特征模型挖掘用户显性需求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂移问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据信息推荐方法、装置、终 端设备和存储介质。
背景技术
在合适的条件下,将合适的消息推荐给合适的用户,则需要用到推荐技术, 而推荐技术的核心是推荐算法,现有技术中通常采用的推荐算法中只能从单一 方向进行推荐,但是随着用户数量的不断增加和项目规模的不断扩大,采用单 一方向的推荐算法已经无法解决面临的问题,会出现冷启动和概念漂移问题。
发明内容
本发明意在提供一种数据信息推荐方法、装置、终端设备和存储介质,以 解决现有技术中存在的不足,本发明要解决的技术问题通过以下技术方案来实 现。
第一个方面,本发明实施例提供一种数据信息推荐方法,所述方法包括:
响应于用户输入的目标需求信息,获取所述目标需求信息中包括的不同类 型的数据内容,所述不同类型至少包括方向维度、目标维度和区域维度;
根据所述不同类型对应的目标数据内容,确定初始特征模型;其中,所述 初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确 定的;
获取用户的隐式行为信息,并根据所述用户的隐式行为信息,确定用户行 为模型;
根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型;
根据所述目标数据内容和所述用户兴趣模型,确定推荐数据信息集合;
根据D-S证据理论和所述推荐数据信息集合,确定目标数据信息,并将 所述目标数据信息推荐给用户。
可选地,响应于用户输入的目标需求信息,获取所述目标需求信息中包括 的不同类型的数据内容,包括:
响应于用户输入的目标需求信息,从预先建立的数据内容数据库中获取与 所述不同类型对应的目标数据内容,所述目标数据内容为富文本性质的数据内 容;
根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键词的维度;
根据Python Gensim主题模型和所述关键词,确定与所述关键词对应的关 键词特征向量;
将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。
可选地,所述根据所述不同类型对应的目标数据内容,确定初始特征模型, 包括:
根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重,确 定方向维度上的初始特征模型;
根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重,确 定目标维度上的初始特征模型;
根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重,确 定区域维度上的初始特征模型。
可选地,所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的 一种或多种;
所述根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型,包 括:
根据所述用户行为模型对所述初始特征模型进行修正,得到所述用户兴趣 模型。
可选地,所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用 户兴趣模型和区域维度的用户兴趣模型,所述根据所述目标数据内容和所述用 户兴趣模型,确定推荐数据信息集合,包括:
计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似 度;
若所述第一余弦相似度满足第一预设条件,则将资料数据向量模型中的方 向维度的特征向量,确定为方向维度的推荐数据信息集合;
计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似 度;
若所述第二余弦相似度满足第二预设条件,则将资料数据向量模型中的目 标维度的特征向量,确定为目标维度的推荐数据信息集合;
计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似 度;
若所述第三余弦相似度满足第三预设条件,则将资料数据向量模型中的区 域维度的特征向量,确定为区域维度的推荐数据信息集合。
可选地,所述根据D-S证据理论和所述推荐数据信息集合,确定目标数 据信息,并将所述目标数据信息推荐给用户,包括:
基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预 设条件的目标数据信息推荐给用户。
可选地,所述基于D-S证据理论对不同类型对应的推荐数据进行排序, 将满足第四预设条件的目标数据信息推荐给用户,包括:
在不同类型对应的推荐数据信息集合中,分别确定每一个目标数据内容对 应的推荐度;
分别确定每个类型对应的权重值;
根据所述每一个目标数据内容对应的推荐度和所述权重值,按照信度分配 函数,计算第一信度值,并根据平均信度分配函数,计算第一均值;
根据所述目标数据内容,计算正交化系数;
根据第一信度值和对应的正交化系数,按照D-S证据理论的合成公式进 行合成,得到第一合成值;
根据所述第一合成值和所述第一均值,计算得到第二合成值,其中,所述 第二合成值为任意两个不同类型的目标数据内容进行合成的结果;
根据所述第二合成值与第三个类型的目标数据内容进行合成,得到第三合 成值;
将第四合成值按照从大到小的顺序进行排序;
将所述第四合成值大于第四值,则将与所述第四合成值对应的目标数据信 息推荐给用户。
第二个方面,本发明实施例提供一种数据信息推荐装置,所述装置包括:
获取模块,用于响应于用户输入的目标需求信息,获取所述目标需求信息 中包括的不同类型的数据内容,用于响应于用户输入的目标需求信息,获取所 述目标需求信息中包括的不同类型的数据内容,,所述不同类型至少包括方向 维度、目标维度和区域维度;
初始特征模型确定模块,用于根据所述不同类型对应的目标数据内容,确 定初始特征模型;其中,所述初始特征模型是根据是不同类型的目标数据内容 和不同类型对应的权重值确定的;
用户行为模型确定模块,用于获取用户的隐式行为信息,并根据所述用户 的隐式行为信息,确定用户行为模型;
用户兴趣模型确定模块,用于根据所述初始特征模型和所述用户行为模型, 确定用户兴趣模型;
确定模块,用于根据所述目标数据内容和所述用户兴趣模型,确定推荐数 据信息集合;
推荐模块,用于根据D-S证据理论和所述推荐数据信息集合,确定目标 数据信息,并将所述目标数据信息推荐给用户。
可选地,所述获取模块用于:
响应于用户输入的目标需求信息,从预先建立的数据内容数据库中获取与 所述不同类型对应的目标数据内容,所述目标数据内容为富文本性质的数据内 容;
根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键词的维度;
根据Python Gensim主题模型和所述关键词,确定与所述关键词对应的关 键词特征向量;
将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。
可选地,所述初始特征模型确定模块用于:
所述根据所述不同类型对应的目标数据内容,确定初始特征模型,包括:
根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重,确 定方向维度上的初始特征模型;
根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重,确 定目标维度上的初始特征模型;
根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重,确 定区域维度上的初始特征模型。
可选地,所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的 一种或多种;
所述用户兴趣模型确定模块用于:
根据所述用户行为模型对所述初始特征模型进行修正,得到所述用户兴趣 模型。
可选地,所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用 户兴趣模型和区域维度的用户兴趣模型,所述确定模块用于:
计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似 度;
若所述第一余弦相似度满足第一预设条件,则将资料数据向量模型中的方 向维度的特征向量,确定为方向维度的推荐数据信息集合;
计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似 度;
若所述第二余弦相似度满足第二预设条件,则将资料数据向量模型中的目 标维度的特征向量,确定为目标维度的推荐数据信息集合;
计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似 度;
若所述第三余弦相似度满足第三预设条件,则将资料数据向量模型中的区 域维度的特征向量,确定为区域维度的推荐数据信息集合。
可选地,所述推荐模块用于:
基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预 设条件的目标数据信息推荐给用户。
可选地,所述推荐模块具体用于:
在不同类型对应的推荐数据信息集合中,分别确定每一个目标数据内容对 应的推荐度;
分别确定每个类型对应的权重值;
根据所述每一个目标数据内容对应的推荐度和所述权重值,按照信度分配 函数,计算第一信度值,并根据平均信度分配函数,计算第一均值;
根据所述目标数据内容,计算正交化系数;
根据第一信度值和对应的正交化系数,按照D-S证据理论的合成公式进 行合成,得到第一合成值;
根据所述第一合成值和所述第一均值,计算得到第二合成值,其中,所述 第二合成值为任意两个不同类型的目标数据内容进行合成的结果;
根据所述第二合成值与第三个类型的目标数据内容进行合成,得到第三合 成值;
将第四合成值按照从大到小的顺序进行排序;
将所述第四合成值大于第四值,则将与所述第四合成值对应的目标数据信 息推荐给用户。
第三个方面,本发明实施例提供一种终端设备,包括:至少一个处理器和 存储器;
所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的 计算机程序,以实现第一个方面提供的数据信息推荐方法。
第四个方面,本发明实施例提供一种计算机可读存储介质,该计算机可读 存储介质中存储有计算机程序,所述计算机程序被执行时实现第一个方面提供 的数据信息推荐方法。
本发明实施例包括以下优点:
本发明实施例提供的数据信息推荐方法、装置、终端设备和存储介质,通 过响应于用户输入的目标需求信息,获取目标需求信息中包括的不同类型的数 据内容,不同类型至少包括方向维度、目标维度和区域维度;根据不同类型对 应的目标数据内容,确定初始特征模型;其中,初始特征模型是根据是不同类 型的目标数据内容和不同类型对应的权重值确定的;获取用户的隐式行为信息, 并根据用户的隐式行为信息,确定用户行为模型;根据初始特征模型和用户行 为模型,确定用户兴趣模型;根据目标数据内容和用户兴趣模型,确定推荐数 据信息集合;根据D-S证据理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采 用初始特征模型挖掘用户显性需求,解决冷启动问题;同时利用用户行为特征 挖掘用户隐性需求,解决概念漂移问题。
附图说明
图1是本发明的一种数据信息推荐方法实施例的流程示意图;
图2是本发明的再一种数据信息推荐方法实施例的流程示意图;
图3是本发明的用户关注模型的示意图;
图4是本发明的一种数据信息推荐装置实施例的结构框图;
图5是本发明的一种终端设备的结构示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征 可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明一实施例提供一种数据信息推荐方法,用于获取到合适的数据内容 推荐给合适的用户。本实施例的执行主体为数据信息推荐装置,设置在终端设 备上,例如,终端设备至少包括手机终端、平板终端和计算机终端等。
参照图1,示出了本发明的一种数据信息推荐方法实施例的步骤流程图, 该方法具体可以包括如下步骤:
S101、响应于用户输入的目标需求信息,获取所述目标需求信息中包括的 不同类型的数据内容,所述不同类型至少包括方向维度、目标维度和区域维度;
具体地,预先将数据内容保存在数据库中,数据内容是富文本性质,虽然 可能包含图片等多媒体数据,但是文本内容仍然是主体信息,所包含的内容属于 文本类型,该数据内容可以是大量文本情报数据,其中蕴含着大量的目标活动、 动向、意图、趋势等揭示战场内涵、内幕的重要信息。本发明实施例可以在大 量的文本情报数据中快速识别出合适的文本数据推荐给合适和用户,该终端设 备上安装有推荐***,用户在终端设备上输入目标需求信息,也就是用户所关 注的内容,终端设备获取到用户的目标需求信息,该目标需求信息包括不同类 型的数据内容,不同类型至少包括方向维度、目标维度和区域维度,也就是说 终端设备在预先建立的情报数据库中查找到与目标需求信息对应的不同类型 的数据内容。
S102、根据所述不同类型对应的目标数据内容,确定初始特征模型;其中, 所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重 值确定的;
具体地,终端设备上的推荐***中用户与项目的互动行为有两种表现形式: 显式的行为数据与隐式的行为数据。显式数据是用户对项目的直接评分,隐式 数据包括用户对项目的行为动作,隐式数据间接的表明了用户对于项目的兴趣 特征。推荐***获取的不同类型的数据内容建立初始特征模型,也就是用户关 注模型。关注模型使用了层次订阅方式,方便用户灵活配置自己想要的情报内 容,配置与扩展提供了多样的订阅推荐方式。***从方向、区域、目标三个维 度进行用户关注模型设计,如图3所示。
S103、获取用户的隐式行为信息,并根据所述用户的隐式行为信息,确定 用户行为模型;
具体地,基于用户隐式行为信息,如浏览、评论、收藏、分享、下载等, 根据该用户的隐式行为信息确定用户行为模型。用户的行为全集中包含了情报 内容相关的信息和用户的所有行为特征。***记录的用户行为特征有浏览、评 论、收藏、分享和下载,不同的行为动作体现了用户不同的情感倾向。
S104、根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型;
具体地,在初始特征模型长时间未更新的情况下,初始特征模型不能完全 表达用户兴趣,抽取用户动作中所包含的情感,需要对初始特征模型进行修正, 也即是根据用户行为模型对初始特征模型进行修正,建立用户兴趣模型。
S105、根据所述目标数据内容和所述用户兴趣模型,确定推荐数据信息集 合;
具体地,在预先建立的情报数据库即目标数据内容的数据库中,需要确定 每个目标数据内容对应的向量模型,也就是情报数据的情报向量模型,然后计 算用户兴趣模型与情报向量模型的余弦相似度,分别选出不同维度(方向、目 标和区域)的候选推荐情报集合,将得到的三个集合的目标数据内容确定为推 荐数据信息集合。
S106、根据D-S证据理论和所述推荐数据信息集合,确定目标数据信息, 并将所述目标数据信息推荐给用户。
具体地,基于D-S证据理论对不同维度的候选情报进行综合排序,将排 序在前的预设数值的目标数据信息推荐给用户,其中,目标数据信息是符合条 件的目标数据内容。
本发明实施例提供的数据信息推荐方法,通过响应于用户输入的目标需求 信息,获取目标需求信息中包括的不同类型的数据内容,不同类型至少包括方 向维度、目标维度和区域维度;根据不同类型对应的目标数据内容,确定初始 特征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同类型 对应的权重值确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息, 确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型; 根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据 理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需 求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂 移问题。
本发明又一实施例对上述实施例提供的数据信息推荐方法做进一步补充 说明。
可选地,响应于用户输入的目标需求信息,获取所述目标需求信息中包括 的不同类型的数据内容,包括:
步骤A1、响应于用户输入的目标需求信息,从预先建立的数据内容数据 库中获取与所述不同类型对应的目标数据内容,所述目标数据内容为富文本性 质的数据内容;
步骤A2、根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键 词的维度;
步骤A3、根据Python Gensim主题模型和所述关键词,确定与所述关键 词对应的关键词特征向量;
步骤A4、将所述目标数据内容中的关键词特征向量确定为资料数据向量 模型。
可选地,所述根据所述不同类型对应的目标数据内容,确定初始特征模型, 包括:
步骤B1、根据所述方向维度的目标数据内容对应的特征向量和方向兴趣 度权重,确定方向维度上的初始特征模型;
步骤B2、根据所述目标维度的目标数据内容对应的特征向量和目标兴趣 度权重,确定目标维度上的初始特征模型;
步骤B3、根据所述区域维度的目标数据内容对应的特征向量和区域兴趣 度权重,确定区域维度上的初始特征模型。
可选地,所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的 一种或多种;
所述根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型,包 括:
根据所述用户行为模型对所述初始特征模型进行修正,得到所述用户兴趣 模型。
可选地,所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用 户兴趣模型和区域维度的用户兴趣模型,所述根据所述目标数据内容和所述用 户兴趣模型,确定推荐数据信息集合,包括:
步骤C1、计算所述方向维度的用户兴趣模型与资料数据向量模型的第一 余弦相似度;
步骤C2、若所述第一余弦相似度满足第一预设条件,则将资料数据向量 模型中的方向维度的特征向量,确定为方向维度的推荐数据信息集合;
步骤C3、计算所述目标维度的用户兴趣模型与资料数据向量模型的第二 余弦相似度;
步骤C4、若所述第二余弦相似度满足第二预设条件,则将资料数据向量 模型中的目标维度的特征向量,确定为目标维度的推荐数据信息集合;
步骤C5、计算所述区域维度的用户兴趣模型与资料数据向量模型的第三 余弦相似度;
步骤C6、若所述第三余弦相似度满足第三预设条件,则将资料数据向量 模型中的区域维度的特征向量,确定为区域维度的推荐数据信息集合。
可选地,所述根据D-S证据理论和所述推荐数据信息集合,确定目标数 据信息,并将所述目标数据信息推荐给用户,包括:
基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预 设条件的目标数据信息推荐给用户。
该步骤具体包括:
步骤D1、在不同类型对应的推荐数据信息集合中,分别确定每一个目标 数据内容对应的推荐度;
步骤D2、分别确定每个类型对应的权重值;
步骤D3、根据所述每一个目标数据内容对应的推荐度和所述权重值,按 照信度分配函数,计算第一信度值,并根据平均信度分配函数,计算第一均值;
步骤D4、根据所述目标数据内容,计算正交化系数;
步骤D5、根据第一信度值和对应的正交化系数,按照D-S证据理论的合 成公式进行合成,得到第一合成值;
步骤D6、根据所述第一合成值和所述第一均值,计算得到第二合成值, 其中,所述第二合成值为任意两个不同类型的目标数据内容进行合成的结果;
步骤D7、根据所述第二合成值与第三个类型的目标数据内容进行合成, 得到第三合成值;
具体地,可以将方向维度和区域维度先进行合成,然后再和目标维度进行 合成,也可以先将方向维度和目标维度进行合成,再和区域维度进行合成,或 者,先将区域维度和目标维度进行合成,然后再与方向维度进行合成。
步骤D8、将第四合成值按照从大到小的顺序进行排序;
步骤D9、将所述第四合成值大于第四值,则将与所述第四合成值对应的 目标数据信息推荐给用户。
第四值可以根据需要进行设定,在本发明实施例中不做具体限定。
如图2所示,本发明的再一种数据信息推荐方法实施例的流程示意图,该 数据信息推荐方法包括:
S1、对入库情报建立向量空间模型,实现情报文本向量化;
情报信息的一大特点是富文本性质,虽然可能包含图片等多媒体数据,但 是文本内容仍然是主体信息,所包含的内容属于文本类型,要构建情报信息的 推荐***,首先应将情报文本向量化。基于情报的高维性以及用户模型的构建, ***采用向量空间模型来表示情报特征向量。
给定情报集合DS={d1,d2,…,dn},其向量空间模型表示为:
步骤1:关键词维度确定。关键词用于表征情报特性,经过实验,***关 键词个数在(5,8)之间时效果最好;同时考虑关键词数量增加会导致M的 维度m增大,以及情报维度分析,***提取每篇文档中的前5个关键词来表 征该情报特性,接着采用TF-IDF算法(termfrequency–inverse document frequency,词频-逆向文件频率))得出新闻集中关键词集的维度m=600; TF-IDF算法是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。
步骤2:关键词向量化;推荐***使用Python Gensim主题模型中的 word2vec工具,将情报di中的关键词kj转化为向量vkj,维度为m。
步骤3:根据公式计算出情报di的特征向量v(di)。
步骤4:权重wij的计算。推荐***采用信息检索领域的成熟技术TF-IDF 进行权重计算。
Count(i,j)表示关键词j在新闻i中的频数,size(i)表示新闻i的总词数,n 表示情报集总数,count(i)表示关键词j出现过的新闻数量。
S2、对入库的情报根据方向、区域、目标进行多维度分类标注;
具体的,管理员负责将情报加入***情报资料库即预先建立的情报数据库, 管理员可以手工设置情报的分类,对于未分类的情报,推荐***自动进行分类 并给情报即数据内容打上类别标签。
分类方法为:文本即数据内容向量化后,利用深度模型得到文本即数据内 容的语义表示,并在此之上进行文本分类,形成各个文本类型概率,并选取最 大值作为该文本类型。
S3、通过用户填报,获取用户对不同维度(方向、目标和区域)的关注内 容,各维度的初始特征模型根据该类别所有文本情报即数据内容加权平均求出, 其中,权值根据该类别情报数量占总情报数量比例计算得到,例如方向维度的 情报数量占总情报数据的比例;
推荐***中用户与项目的互动行为有两种表现形式:显式的行为数据与隐 式的行为数据。显式数据是用户对项目的直接评分,隐式数据包括用户对项目 的行为动作,隐式数据间接的表明了用户对于项目的兴趣特征。***通过建立 关注模型,获取用户显示行为特征,建立用户初始模型;并基于用户隐式行为, 如浏览、评论、收藏、分享、下载等,对初始模型进行修正,最终建立用户兴 趣模型。
关注模型使用了层次订阅方式,方便用户灵活配置自己想要的情报内容, 配置与扩展提供了多样的订阅推荐方式。推荐***从方向、区域、目标三个维 度进行用户关注模型设计,如图2所示。
用户初始模型是根据该维度关注对象所包含的所有情报特征向量根据兴 趣度加权平均求出。以方向维度为例,所有方向维度情报资料可以表示为 {(L1,w1,N1),…,(Lm,wm,Nm)},其中Li表示方向i的特征向量,wi表示方向 i的权重(即该类别情报兴趣度),Ni表示方向i包含的所有情报数量。用户 方向维度上的初始模型表示如下:
其中Li表示方向i的特征向量,根据该方向所包含的所有情报特征向量 计算平均值;Wi表示方向i的值根据方向i包含的情报数量占所有方向中情报 数量总和的权重来计算。
Dj表示方向i中的用户浏览过的情报资料集合,Vdj表示情报特征向量。
S4、根据用户隐式行为如浏览、评论、收藏、分享、下载等,建立用户 行为模型;
具体的,在关注模型长时间未更新的情况下,用户初始模型不能完全表达 用户兴趣,抽取用户动作中所包含的情感,修正用户初始模型十分有必要。
假如用户ui近期(例如设置一个月内)己访问情报集合为DS(ui)={(id1,Aα),(id2,Aβ),…,(idn,Aγ)},(idn,Aγ)表示用户ui近期对情报idn产生了行为Aγ。
从上式可以看出,用户的行为全集中包含了情报内容相关的信息和用户的 所有行为特征。***记录的用户行为特征有浏览、评论、收藏、分享和下载, 不同的行为动作体现了用户不同的情感倾向,***根据经验值赋予不同的行 为特征权重。
表1行为权重值表
行为 | 浏览 | 评论 | 收藏 | 分享 | 下载 |
权重值 | 0.7 | 0.1 | 0.9 | 0.7 | 1.0 |
同时含有情感倾向的行为特征虽然对兴趣影响大,但是多个动作的影响不 会是线性叠加的,因此计算采用指数函数形式,计算方法如下:
wi,j表示对于情报i的第j个行为动作的权重,wi′表示情报i综合后行为 权重。如果只有一种动作(如浏览),wi′=0.504,可以反映用户对该情报存 在一定兴趣,如果出现多个动作(如所有动作),wi′=0.967,反应出用户对 该情报兴趣是极大的,但是兴趣权重不会超过上限。
在行为数据符合正态分布的情况下,用户的内容兴趣度模型可以认为是在 特征集合的时间段内,有互动行为的情报的文本向量的加权平均值。
方向、区域、目标三个维度的用户饮食模型分别用uaction-d、uaction-f、 uaction-o表示。
S5、根据用户行为模型对初始特征模型进行修正,建立用户兴趣模型;
具体的,基于用户隐式行为特征模型对基于关注的用户初始模型进行修正, 公式如下:
u=α×uinit+(1-α)×uaction
其中参数α可以控制初始模型和行为修正模型对用户模型的影响程度。由 于用户的兴趣偏好会受到外界各种情况的影响,用户岗位、参与任务、承担 项目的变化都会使得兴趣模型发生改变,从而造成用户兴趣的概念漂移。因 此,***考虑初始模型定义时间越久远,发生概念漂移的可能性越大,则动 作修正对用户模型的影响越大。参数α定义如下:
当初始模型定义在一个月以内,则α=1,表示初始模型不需要修正;当初 始模型定义距离当前时间为六个月,α=0.55,表示初始模型和行为修正模型 的影响比例相当;当模型定义距离当前时间为一年,α=0.3,表示以行为修正 模型为主。
S6、计算用户兴趣模型与情报向量模型的余弦相似度,分别选出不同维 度(方向、目标和区域)的候选推荐情报集合;
具体的,***使用余弦相似度计算出候选情报di与(Vdi为di的特征向 量)用户之间的相似性,分别选出不同维度(方向、目标和区域)的候选推 荐情报集合。
S7、最后基于改进的D-S证据理论对不同维度的候选情报进行综合排序, 将前n个情报推荐给用户,n为大于0的自然数,在本发明实施例中可以根 据需要自行设定。
得到候选结果集合RL、RF、RO之后,常规做法是对各个集合进行去重处理, 然后将各个集合的并集作为结果集合推荐给用户。该方法忽略了不同情况下 推荐效果的差异问题。本发明实施例提供一种基于改进的D-S证据理论对不 同维度的候选情报进行综合排序的方法,将前n个情报推荐给用户。
首先,D-S证据理论为将不同的信息源采集的信息进行融合提供了行之有 效的合并规则,这样在推荐结果综合排序中,就可以综合各方的数据源,从 而消除由于单方面的信息源造成的不确定性,增强最终推荐结果的准确性与 合理性;其次,不同维度的情报存在相互关联性,D-S证据合成方法即是将 这些相互关联的多源信息进行融合从而获取更加准确的信息。
以上就是D-S证据合成理论的突出优点,但是,D-S证据理论也存在本身 的不足之处:在数据高度冲突的情况下会导致与实际结果相悖的结果。因此, 为了克服D-S证据合成理论的不足,***对理论中的基本可信度分配模型进 行修改,以使D-S证据合成方法在各种实际情况中,能够对数据进行正常的 融合并给出较为正确的结果。两个证据融合的计算方法如下:
(1)计算经过权重分配后的信度分配函数;
(2)第二步计算平均信度分配函数;
(3)求正交化系数(正交化系数根据原始值计算);
(4)将新的信都值按D-S证据理论的合成公式进行合成;
(5)将步骤2和步骤4的结果相加,得到最终的合成结果;
(6)归一化后得到最终结果。
下面通过举例说明。首先针对每个维度的候选情报集合,通过将近似度归 一化,得到各个维度的推荐度。如下表2,在方向维度,候选集的推荐度分 别为{0.56,0.36,0,0.10,0},0表示该情报未出现在方向维度候选集中。各 维度的权重由用户通过关注模型设置,假设分别为0.3、0.2、0.5。
表2候选集推荐度列表
(1)首先通过上述方法计算方向、区域2个证据融合结果;
A.计算经过权重分配后的信度分配函数(第一行、第二行),以及平均信 度分配函数(第三行);其中根据方向加权0.3和区域加权0.2的比值,二者 的权重系数为0.6和0.4;
表3方向、区域融合过程
B.正交化系数1-K=1-0.54*0.55-0.36*0.85-0.1*1=0.297;
C.将新的信都值按D-S证据理论的合成公式进行合成,如 M(1)’=0.324*0.18/0.297=0.196364;
D.将均值和D-S合成值相加,得到第5行数值;规一化后得到最终结果 (第六行)。
(2)将上述2个维度(方向、区域)融合结果与第三个维度(目标)进 行融合,其中融合结果与方向的权重系数为0.5和0.5,最终的结果见表2;
(3)最后,根据融合后的推荐度进行候选集排序,分别为{情报4,情报 2,情报3,情报1,情报5}。将最后得到的排序发送给用户。
本发明实施例采用面向项目的协同过滤方法,结合情报特征,采用用户关 注模型挖掘用户显性需求,解决冷启动问题;同时利用用户行为特征挖掘用户 隐性需求,解决概念漂移问题;同时,利用改进的D-S证据理论方法,对多 维度的候选集进行融合排序,实现情报综合推荐。也可以对三个维度的用户兴 趣模型进行融合后,进行相似度计算,从而对用户进行合适的数据内容推荐。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列 的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动 作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时 进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优 选实施例,所涉及的动作并不一定是本发明实施例所必须的。
本发明实施例提供的数据信息推荐方法,通过响应于用户输入的目标需求 信息,获取目标需求信息中包括的不同类型的数据内容,不同类型至少包括方 向维度、目标维度和区域维度;根据不同类型对应的目标数据内容,确定初始 特征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同类型 对应的权重值确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息, 确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型; 根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据 理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需 求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂 移问题。
本发明另一实施例提供一种数据信息推荐装置,用于执行上述实施例提供 的数据信息推荐方法。
参照图4,示出了本发明的一种数据信息推荐装置实施例的结构框图,该 装置具体可以包括如下模块:获取模块301、初始特征模型确定模块302、用 户行为模型确定模块303、用户兴趣模型确定模块304、确定模块305和推荐 模块306,其中:
获取模块301用于响应于用户输入的目标需求信息,获取目标需求信息中 包括的不同类型的数据内容,不同类型至少包括方向维度、目标维度和区域维 度;
初始特征模型确定模块302用于根据不同类型对应的目标数据内容,确定 初始特征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同 类型对应的权重值确定的;
用户行为模型确定模块303用于获取用户的隐式行为信息,并根据用户的 隐式行为信息,确定用户行为模型;
用户兴趣模型确定模块304用于根据初始特征模型和用户行为模型,确定 用户兴趣模型;
确定模块305用于根据目标数据内容和用户兴趣模型,确定推荐数据信息 集合;
推荐模块306用于根据D-S证据理论和推荐数据信息集合,确定目标数 据信息,并将目标数据信息推荐给用户。
本发明实施例提供的数据信息推荐装置,通过响应于用户输入的目标需求 信息,获取目标需求信息中包括的不同类型的数据内容,不同类型至少包括方 向维度、目标维度和区域维度;根据不同类型对应的目标数据内容,确定初始 特征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同类型 对应的权重值确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息, 确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型; 根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据 理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需 求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂 移问题。
本发明又一实施例对上述实施例提供的数据信息推荐装置做进一步补充 说明。
可选地,所述获取模块用于:
响应于用户输入的目标需求信息,从预先建立的数据内容数据库中获取与 所述不同类型对应的目标数据内容,所述目标数据内容为富文本性质的数据内 容;
根据TF-IDF算法确定所述目标数据内容中的关键词和所述关键词的维度;
根据Python Gensim主题模型和所述关键词,确定与所述关键词对应的关 键词特征向量;
将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。
可选地,所述初始特征模型确定模块用于:
所述根据所述不同类型对应的目标数据内容,确定初始特征模型,包括:
根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重,确 定方向维度上的初始特征模型;
根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重,确 定目标维度上的初始特征模型;
根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重,确 定区域维度上的初始特征模型。
可选地,所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的 一种或多种;
所述用户兴趣模型确定模块用于:
根据所述用户行为模型对所述初始特征模型进行修正,得到所述用户兴趣 模型。
可选地,所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用 户兴趣模型和区域维度的用户兴趣模型,所述确定模块用于:
计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似 度;
若所述第一余弦相似度满足第一预设条件,则将资料数据向量模型中的方 向维度的特征向量,确定为方向维度的推荐数据信息集合;
计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似 度;
若所述第二余弦相似度满足第二预设条件,则将资料数据向量模型中的目 标维度的特征向量,确定为目标维度的推荐数据信息集合;
计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似 度;
若所述第三余弦相似度满足第三预设条件,则将资料数据向量模型中的区 域维度的特征向量,确定为区域维度的推荐数据信息集合。
可选地,所述推荐模块用于:
基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预 设条件的目标数据信息推荐给用户。
可选地,所述推荐模块具体用于:
在不同类型对应的推荐数据信息集合中,分别确定每一个目标数据内容对 应的推荐度;
分别确定每个类型对应的权重值;
根据所述每一个目标数据内容对应的推荐度和所述权重值,按照信度分配 函数,计算第一信度值,并根据平均信度分配函数,计算第一均值;
根据所述目标数据内容,计算正交化系数;
根据第一信度值和对应的正交化系数,按照D-S证据理论的合成公式进 行合成,得到第一合成值;
根据所述第一合成值和所述第一均值,计算得到第二合成值,其中,所述 第二合成值为任意两个不同类型的目标数据内容进行合成的结果;
根据所述第二合成值与第三个类型的目标数据内容进行合成,得到第三合 成值;
将第四合成值按照从大到小的顺序进行排序;
将所述第四合成值大于第四值,则将与所述第四合成值对应的目标数据信 息推荐给用户。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简 单,相关之处参见方法实施例的部分说明即可。
本发明实施例提供的数据信息推荐装置,通过响应于用户输入的目标需求 信息,获取目标需求信息中包括的不同类型的数据内容,不同类型至少包括方 向维度、目标维度和区域维度;根据不同类型对应的目标数据内容,确定初始 特征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同类型 对应的权重值确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息, 确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型; 根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据 理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需 求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂 移问题。
本发明再一实施例提供一种终端设备,用于执行上述实施例提供的数据信 息推荐方法。
图5是本发明的一种终端设备的结构示意图,如图5所示,该终端设备包 括:至少一个处理器801和存储器802;
存储器存储计算机程序;至少一个处理器执行存储器存储的计算机程序, 以实现上述实施例提供的数据信息推荐方法。
本实施例提供的终端设备,通过响应于用户输入的目标需求信息,获取目 标需求信息中包括的不同类型的数据内容,不同类型至少包括方向维度、目标 维度和区域维度;根据不同类型对应的目标数据内容,确定初始特征模型;其 中,初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值 确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息,确定用户行 为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型;根据目标数 据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据理论和推荐 数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实 施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需求,解决 冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂移问题。
本申请又一实施例提供一种计算机可读存储介质,该计算机可读存储介质 中存储有计算机程序,计算机程序被执行时实现上述任一实施例提供的数据信 息推荐方法。
根据本实施例的计算机可读存储介质,通过响应于用户输入的目标需求信 息,获取目标需求信息中包括的不同类型的数据内容,不同类型至少包括方向 维度、目标维度和区域维度;根据不同类型对应的目标数据内容,确定初始特 征模型;其中,初始特征模型是根据是不同类型的目标数据内容和不同类型对 应的权重值确定的;获取用户的隐式行为信息,并根据用户的隐式行为信息, 确定用户行为模型;根据初始特征模型和用户行为模型,确定用户兴趣模型; 根据目标数据内容和用户兴趣模型,确定推荐数据信息集合;根据D-S证据 理论和推荐数据信息集合,确定目标数据信息,并将目标数据信息推荐给用户,本发明实施例结合目标数据内容的特征根,采用初始特征模型挖掘用户显性需 求,解决冷启动问题;同时利用用户行为特征挖掘用户隐性需求,解决概念漂 移问题。
应该指出,上述详细说明都是示例性的,旨在对本申请提供进一步的说明。 除非另有指明,本文使用的所有技术和科学术语均具有与本申请所属技术领域 的普通技术人员的通常理解所相同的含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图 限制根据本申请所述的示例性实施方式。如在这里所使用的,除非上下文另外 明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在 本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器 件、组件和/或它们的组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、 “第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应 该理解这样使用的术语在适当情况下可以互换,以便这里描述的本申请的实施 方式能够以除了在这里图示或描述的那些以外的顺序实施。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的 包含。例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必 限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些 过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,在这里可以使用空间相对术语,如“在……之上”、“在…… 上方”、“在……上表面”、“上面的”等,用来描述如在图中所示的一个器件或 特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包 含除了器件在图中所描述的方位之外的在使用或操作中的不同方位。例如,如 果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或 构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或 构造之下”。因而,示例性术语“在……上方”可以包括“在……上方”和“在…… 下方”两种方位。该器件也可以其他不同方式定位,如旋转90度或处于其他方位,并且对这里所使用的空间相对描述作出相应解释。
在上面详细的说明中,参考了附图,附图形成本文的一部分。在附图中, 类似的符号典型地确定类似的部件,除非上下文以其他方式指明。在详细的说 明书、附图及权利要求书中所描述的图示说明的实施方案不意味是限制性的。 在不脱离本文所呈现的主题的精神或范围下,其他实施方案可以被使用,并且 可以作其他改变。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领 域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之 内。
Claims (10)
1.一种数据信息推荐方法,其特征在于,所述方法包括:
响应于用户输入的目标需求信息,获取所述目标需求信息中包括的不同类型的数据内容,所述不同类型至少包括方向维度、目标维度和区域维度;
根据所述不同类型对应的目标数据内容,确定初始特征模型;其中,所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的;
获取用户的隐式行为信息,并根据所述用户的隐式行为信息,确定用户行为模型;
根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型;
根据所述目标数据内容和所述用户兴趣模型,确定推荐数据信息集合;
根据D-S证据理论和所述推荐数据信息集合,确定目标数据信息,并将所述目标数据信息推荐给用户。
2.根据权利要求1所述的方法,其特征在于,响应于用户输入的目标需求信息,获取所述目标需求信息中包括的不同类型的数据内容,包括:
响应于用户输入的目标需求信息,从预先建立的数据内容数据库中获取与所述不同类型对应的目标数据内容,所述目标数据内容为富文本性质的数据内容;
根据TF-IDF算法确定所述目标数据内容中的关键词和关键词的维度;
根据Python Gensim主题模型和所述关键词,确定与所述关键词对应的关键词特征向量;
将所述目标数据内容中的关键词特征向量确定为资料数据向量模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述不同类型对应的目标数据内容,确定初始特征模型,包括:
根据所述方向维度的目标数据内容对应的特征向量和方向兴趣度权重,确定方向维度上的初始特征模型;
根据所述目标维度的目标数据内容对应的特征向量和目标兴趣度权重,确定目标维度上的初始特征模型;
根据所述区域维度的目标数据内容对应的特征向量和区域兴趣度权重,确定区域维度上的初始特征模型。
4.根据权利要求1所述的方法,其特征在于,所述隐式行为信息至少包括浏览、评论、收藏、分享、下载中的一种或多种;
所述根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型,包括:
根据所述用户行为模型对所述初始特征模型进行修正,得到所述用户兴趣模型。
5.根据权利要求4所述的方法,其特征在于,所述用户兴趣模型包括方向维度的用户兴趣模型、目标维度的用户兴趣模型和区域维度的用户兴趣模型,所述根据所述目标数据内容和所述用户兴趣模型,确定推荐数据信息集合,包括:
计算所述方向维度的用户兴趣模型与资料数据向量模型的第一余弦相似度;
若所述第一余弦相似度满足第一预设条件,则将资料数据向量模型中的方向维度的特征向量,确定为方向维度的推荐数据信息集合;
计算所述目标维度的用户兴趣模型与资料数据向量模型的第二余弦相似度;
若所述第二余弦相似度满足第二预设条件,则将资料数据向量模型中的目标维度的特征向量,确定为目标维度的推荐数据信息集合;
计算所述区域维度的用户兴趣模型与资料数据向量模型的第三余弦相似度;
若所述第三余弦相似度满足第三预设条件,则将资料数据向量模型中的区域维度的特征向量,确定为区域维度的推荐数据信息集合。
6.根据权利要求2所述的方法,其特征在于,所述根据D-S证据理论和所述推荐数据信息集合,确定目标数据信息,并将所述目标数据信息推荐给用户,包括:
基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预设条件的目标数据信息推荐给用户。
7.根据权利要求6所述的方法,其特征在于,所述基于D-S证据理论对不同类型对应的推荐数据进行排序,将满足第四预设条件的目标数据信息推荐给用户,包括:
在不同类型对应的推荐数据信息集合中,分别确定每一个目标数据内容对应的推荐度;
分别确定每个类型对应的权重值;
根据所述每一个目标数据内容对应的推荐度和所述权重值,按照信度分配函数,计算第一信度值,并根据平均信度分配函数,计算第一均值;
根据所述目标数据内容,计算正交化系数;
根据第一信度值和对应的正交化系数,按照D-S证据理论的合成公式进行合成,得到第一合成值;
根据所述第一合成值和所述第一均值,计算得到第二合成值,其中,所述第二合成值为任意两个不同类型的目标数据内容进行合成的结果;
根据所述第二合成值与第三个类型的目标数据内容进行合成,得到第三合成值;
将第四合成值按照从大到小的顺序进行排序;
将所述第四合成值大于第四值,则将与所述第四合成值对应的目标数据信息推荐给用户。
8.一种数据信息推荐装置,其特征在于,所述装置包括:
获取模块,用于响应于用户输入的目标需求信息,获取所述目标需求信息中包括的不同类型的数据内容,用于响应于用户输入的目标需求信息,获取所述目标需求信息中包括的不同类型的数据内容,所述不同类型至少包括方向维度、目标维度和区域维度;
初始特征模型确定模块,用于根据所述不同类型对应的目标数据内容,确定初始特征模型;其中,所述初始特征模型是根据是不同类型的目标数据内容和不同类型对应的权重值确定的;
用户行为模型确定模块,用于获取用户的隐式行为信息,并根据所述用户的隐式行为信息,确定用户行为模型;
用户兴趣模型确定模块,用于根据所述初始特征模型和所述用户行为模型,确定用户兴趣模型;
确定模块,用于根据所述目标数据内容和所述用户兴趣模型,确定推荐数据信息集合;
推荐模块,用于根据D-S证据理论和所述推荐数据信息集合,确定目标数据信息,并将所述目标数据信息推荐给用户。
9.一种终端设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的计算机程序,以实现权利要求1-7中任一项所述的数据信息推荐方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现权利要求1-7中任一项所述的数据信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012365.2A CN113988060A (zh) | 2021-08-31 | 2021-08-31 | 数据信息推荐方法、装置、终端设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012365.2A CN113988060A (zh) | 2021-08-31 | 2021-08-31 | 数据信息推荐方法、装置、终端设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988060A true CN113988060A (zh) | 2022-01-28 |
Family
ID=79735283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111012365.2A Pending CN113988060A (zh) | 2021-08-31 | 2021-08-31 | 数据信息推荐方法、装置、终端设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988060A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971817A (zh) * | 2022-07-29 | 2022-08-30 | 中国电子科技集团公司第十研究所 | 基于用户需求画像的产品自适应服务方法、介质及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109785064A (zh) * | 2019-01-14 | 2019-05-21 | 南京信息工程大学 | 一种基于多源信息融合的移动电子商务推荐方法和*** |
CN111861678A (zh) * | 2020-08-03 | 2020-10-30 | 上海风秩科技有限公司 | 一种资源推荐方法、装置、电子设备及存储介质 |
-
2021
- 2021-08-31 CN CN202111012365.2A patent/CN113988060A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109785064A (zh) * | 2019-01-14 | 2019-05-21 | 南京信息工程大学 | 一种基于多源信息融合的移动电子商务推荐方法和*** |
CN111861678A (zh) * | 2020-08-03 | 2020-10-30 | 上海风秩科技有限公司 | 一种资源推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
YU YALING等: "Research on Software Behavior Evaluation Method Based on System Calls", 《INTERNATIONAL CONFERENCE ON ADVANCES IN MECHANICAL ENGINEERING AND INDUSTRIAL INFORMATICS》, 11 April 2015 (2015-04-11) * |
朱娟;唐晓波;: "基于三层知识融合模型的个性化商品推荐", 图书馆学研究, no. 05, 15 March 2017 (2017-03-15) * |
李满天;王劲林;邓浩江;刘学;: "一种面向排序的Top-N推荐算法", 计算机仿真, no. 05, 15 May 2013 (2013-05-15) * |
马丽娜;: "基于证据理论的网络数据不确定推荐方法", 电脑知识与技术, vol. 15, no. 35, 20 December 2019 (2019-12-20) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971817A (zh) * | 2022-07-29 | 2022-08-30 | 中国电子科技集团公司第十研究所 | 基于用户需求画像的产品自适应服务方法、介质及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mokhtari et al. | A bibliometric analysis and visualization of the Journal of Documentation: 1945–2018 | |
Wu et al. | Flame: A probabilistic model combining aspect based opinion mining and collaborative filtering | |
Zhong et al. | Comsoc: adaptive transfer of user behaviors over composite social network | |
Fukuda et al. | On the convergence of the projected gradient method for vector optimization | |
US8577834B2 (en) | Methodologies and analytics tools for locating experts with specific sets of expertise | |
CN108885624B (zh) | 信息推荐***及方法 | |
CN103593425B (zh) | 基于偏好的智能检索方法及*** | |
US8826125B2 (en) | System and method for providing news articles | |
CN104794242B (zh) | 一种搜索方法 | |
CN103309886A (zh) | 一种基于交易平台的结构化信息搜索方法和装置 | |
CN104517216A (zh) | 增强推荐***和方法 | |
US10002187B2 (en) | Method and system for performing topic creation for social data | |
US20160140220A1 (en) | Method for automatic thematic classification of a digital text file | |
Geiß et al. | Neckar: A named entity classifier for wikidata | |
Ortega et al. | Artificial intelligence scientific documentation dataset for recommender systems | |
KR102030149B1 (ko) | 사용자 커리큐럼 추천 방법 및 이를 이용한 사용자 맞춤형 소프트웨어 교육용 시스템 | |
Li et al. | Social recommendation based on trust and influence in SNS environments | |
CN109597899A (zh) | 媒体个性化推荐***的优化方法 | |
Tu et al. | Inferring correspondences from multiple sources for microblog user tags | |
Soo Kim | Text recommender system using user's usage patterns | |
CN113988060A (zh) | 数据信息推荐方法、装置、终端设备和存储介质 | |
Baby et al. | A hybrid product recommendation system based on weather analysis | |
Zhang et al. | CRUC: Cold-start recommendations using collaborative filtering in internet of things | |
CN110083766B (zh) | 一种基于元路径引导嵌入的查询推荐方法及装置 | |
Kim et al. | Product recommendation system based user purchase criteria and product reviews |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |