CN115098777A - 一种基于数据分析的用户个性化推荐方法和*** - Google Patents

一种基于数据分析的用户个性化推荐方法和*** Download PDF

Info

Publication number
CN115098777A
CN115098777A CN202210746729.8A CN202210746729A CN115098777A CN 115098777 A CN115098777 A CN 115098777A CN 202210746729 A CN202210746729 A CN 202210746729A CN 115098777 A CN115098777 A CN 115098777A
Authority
CN
China
Prior art keywords
user
content
database
basic
browsing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210746729.8A
Other languages
English (en)
Inventor
林永兴
陈汉平
蓝庆青
胡萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keyi College of ZSTU
Original Assignee
Keyi College of ZSTU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Keyi College of ZSTU filed Critical Keyi College of ZSTU
Priority to CN202210746729.8A priority Critical patent/CN115098777A/zh
Publication of CN115098777A publication Critical patent/CN115098777A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种基于数据分析的用户个性化推荐方法及***,包括步骤:收集注册用户的基本信息;对所述基本信息进行分类处理;根据分类处理后的所述基本信息构建多维基础大数据库;根据所述多维基础大数据库为所述注册用户推荐可能感兴趣内容,获取浏览量数据;根据所述浏览量数据对所述注册用户的所述可能感兴趣内容进行评判;根据所述可能感兴趣内容的评判结果,为注册用户进行个性化推荐。本申请基于用户的基本信息构建多维基础大数据库,可以有效提高用户找到自己兴趣内容的效率并且可以减少为新用户构建个性化标签的时间。

Description

一种基于数据分析的用户个性化推荐方法和***
技术领域
本申请涉及大数据分析处理领域,具体涉及一种基于数据分析的用户个性化推荐方法和***。
背景技术
近年来,随着智能手机和其他智能设备的兴起,全球网络中的在线人数急剧增加。我们的生活被数字信息包围,而这些所谓的数字信息就是我们通常所说的“数据”,我们可以称之为大数据浪潮。而随着时代的发展,生活节奏加快,对于用户而言,希望更快、更便捷地找到自己感兴趣的内容,对于门户网站运营商或平台而言,希望根据用户特点更有针对性的为用户提供相应资讯或广告,以提高用户粘性和推广目标达成度,而这一切都离不开对用户的个性进行分析。
目前针对用户个性化推荐方法多数仅以标签与个人浏览历史为主要参考的推送形式,对于新注册用户而言,这种推送形式存在推送效率低、精准度低的技术缺陷。
发明内容
本申请提出了一种基于数据分析的用户个性化推荐方法,通过建立多维大数据库对信息进行交叉处理,多方面覆盖用户可能感兴趣内容。根据浏览情况进行过滤、筛选,最终达到对用户进行个性化推荐的目的。
为实现上述目的,本申请提供了一种基于数据分析的用户个性化推荐方法,包括以下步骤:
收集注册用户的基本信息;
对所述基本信息进行分类处理;
根据分类处理后的所述基本信息构建多维基础大数据库;
根据所述多维基础大数据库为所述注册用户推荐可能感兴趣内容,获取浏览量数据;
根据所述浏览量数据对所述注册用户的所述可能感兴趣内容进行评判,得到评判结果;
根据所述评判结果,为注册用户进行个性化推荐。
可选的,所述注册用户的基本信息包括性别、年龄、职业和兴趣爱好。
优选的,构建所述多维基础大数据库的方法包括:将新注册用户的信息从性别角度、年龄角度、职业角度和兴趣爱好角度进行分类数据收集并建立多个小数据库;根据所述小数据库建立多维基础大数据库。
可选的,所述浏览量数据包括:各性别用户最多浏览信息种类,各年龄段用户最多浏览信息种类,各职业用户浏览信息种类和各兴趣爱好用户最多浏览信息种类。
可选的,筛选出用户的所述感兴趣内容的方法包括:
根据所述多维基础大数据库对用户进行初步内容推荐;
根据用户对推荐的所述初步内容的浏览情况进行分析,判断用户是否对推荐的所述初步内容感兴趣,过滤所述初步内容中浏览情况较差的内容并根据所述多维基础大数据库继续推荐新内容,最终筛选出所述用户感兴趣内容。
可选的,用户所述可能感兴趣内容的评判指标包括:同标签内容停留时间、同标签内容点击频率和同标签内容搜索频率。
本申请还提供了一种基于数据分析的用户个性化推荐***,其特征如下,包括:基础数据收集模块、数据分析模块、多维基础大数据库模块、浏览量数据处理模块和推送模块;
所述基础数据收集模块用于收集注册用户的基本信息;
所述数据分析模块用于对所述基本信息进行分类处理;
所述多维基础大数据库模块用于根据分类处理后的所述基本信息构建多维基础大数据库;
所述浏览量数据处理模块用于根据所述多维基础大数据库为所述注册用户推荐可能感兴趣内容,获取浏览量数据;
所述浏览量数据处理模块还用于对所述可能感兴趣内容进行评判,得到评判结果;
所述推送模块用于根据所述评判结果,为所述注册用户进行个性化推荐。
优选的,所述多维大数据库模块包括:性别数据库、年龄段数据库、职业数据库和兴趣爱好数据库。
与现有技术相比,本申请的有益效果如下:
本申请基于多个数据库信息的交叉进行内容推送。根据性别、年龄、职业和兴趣爱好多种信息进行内容网覆盖,过滤筛选出用户可能感兴趣内容。与现在多数仅以标签与个人浏览历史为主要参考的推送形式相比,可以更快、更精准地推送用户感兴趣内容。
附图说明
为了更清楚地说明本申请的技术方案,下面对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本实施例一方法流程示意图;
图2为本实施例二***结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
实施例一
图1所示为本申请实施例一的一种基于数据分析的用户个性化推荐方法中的方法流程图,包括以下步骤:
先将所有注册用户信息进行收集,包括:该用户的性别、年龄、职业和兴趣爱好,其中兴趣爱好可以在注册时以问卷形式取得。根据用户的注册信息进行内容初步推荐,例如:某用户性别为男,年龄25岁,职业教师,兴趣爱好体育和军事。那么就可以为其推荐18-40岁兴趣爱好为体育和军事的男性教师可能感兴趣的内容。
同时将收集到的实施例一中用户的信息数据进行分类,归纳进多维基础大数据库中,多维基础大数据库为多个数据库的信息进行交叉组成的信息网。其中包括:性别数据库、年龄段数据库、职业数据库和兴趣爱好数据库。
根据实施例一中用户对初步推荐的内容的浏览情况保留感兴趣内容,过滤不感兴趣内容,再从多维基础大数据库中寻找与其信息条件相似的用户,例如:性别为男,年龄25岁,职业司机,爱好为体育和军事。通过不断缩小限定范围最终筛选出用户感兴趣内容以达到个性化推荐的目的。
初步推送内容的方法包括:以实施例一中用户为例,先分别从男性数据库、18-40岁年龄段数据库、教师数据库、体育内容数据库和军事内容数据库为实施例一中用户推送可能感兴趣的内容;然后对实施例一中用户对初步推荐的内容的浏览情况进行评价。
对初步推荐的内容的浏览情况进行评价的方法包括:对实施例一中用户在同标签内容停留时间、同标签内容点击频率和同标签内容搜索频率三个方面进行评判。首先当实施例一中用户在某一标签停留超过一定时间或者对某一标签的点击超过一定频率,那么可以认为实施例一中用户对这些标签内容感兴趣并进行推送;同时,当实施例一中用户对推送内容进行搜索的频率大幅减小时,那么可以认为推送内容为实施例一中用户感兴趣内容。其余则为不感兴趣内容,可以过滤掉。
如此循环直至实施例一中用户对推送内容及同标签内容的停留时间、点击频率达到相对稳定及对同标签内容搜索频率大幅减小时,则确定该类型内容为用户感兴趣内容。最终达成为用户进行个性化推荐的目的。
如此方法还可以通过信息匹配更准确地为新用户进行内容推荐:当新用户注册成功时,可以直接为其推荐与其相同性别、年龄段、职业和兴趣爱好用户感兴趣内容以缩短新用户找到兴趣内容的时间。
实施例二
如图2所示为一种基于数据分析的用户个性化推荐***的结构示意图,包括:基础数据收集模块、分析模块、多维基础大数据库模块、浏览量数据处理模块、过滤模块和推送模块。
基础数据收集模块用于收集注册用户信息,包括:该用户的性别、年龄、职业和兴趣爱好。之后将信息输入分析模块对数据进行分析并利用推送模块根据用户的注册信息进行内容初步推荐,例如:某用户性别为女,年龄22岁,职业护士,兴趣爱好美妆和美食。那么就可以为其推荐18-40岁兴趣爱好为美妆和美食的女性护士可能感兴趣的内容。
同时将收集到的实施例二中用户的信息数据利用分析模块进行分类,归纳进多维基础大数据模块中,多维基础大数据模块由多个数据库模块组成。其中包括:性别数据库模块、年龄段数据库模块、职业数据库模块和兴趣爱好数据库模块。
浏览量数据处理模块根据实施例二中用户对初步推荐的内容的浏览情况保留感兴趣内容,通过过滤模块过滤掉不感兴趣内容,再从多维基础大数据模块中寻找与其信息条件相似的用户,例如:性别为女,年龄22岁,职业教师,爱好为美妆和美食。通过不断缩小限定范围最终筛选出用户感兴趣内容以达到个性化推荐。对初步推荐的内容的浏览情况进行评价的方法包括:
以实施例二中用户为例,先从多维基础大数据模块中的性别数据库、年龄段数据库、职业数据库、兴趣爱好数据库中筛选出匹配实施例二中用户信息的内容利用推送模块为实施例二中用户推送可能感兴趣的内容。之后利用浏览量数据处理模块根据实施例二中用户对初步推荐内容的浏览情况进行评价,方法包括:对实施例二中用户在同标签内容停留时间、同标签内容点击频率和同标签内容搜索频率三个方面进行评判。首先当实施例二中用户在某一标签停留超过一定时间或者对某一标签的点击超过一定频率,那么可以认为实施例二中用户对这些标签内容感兴趣并进行推送;同时,当实施例二中用户对推送内容进行搜索的频率大幅减小时,那么可以认为推送内容为实施例二中用户感兴趣内容。其余则为不感兴趣内容,通过过滤模块过滤掉。
如此循环直至实施例二中用户对推送内容及同标签内容的停留时间、点击频率达到相对稳定及对同标签内容搜索频率大幅减小时,则确定该类型内容为用户感兴趣内容。最终达成为用户进行个性化推荐。
此***还可以通过信息匹配更准确地为新用户进行内容推荐:当新用户注册成功时,可以直接为其推荐与其相同性别、年龄段、职业和兴趣爱好用户感兴趣内容以缩短新用户找到兴趣内容的时间。
以上所述的实施例仅是对本申请优选方式进行的描述,并非对本申请的范围进行限定,在不脱离本申请设计精神的前提下,本领域普通技术人员对本申请的技术方案做出的各种变形和改进,均应落入本申请权利要求书确定的保护范围内。

Claims (8)

1.一种基于数据分析的用户个性化推荐方法,其特征如下,包括以下步骤:
收集注册用户的基本信息;
对所述基本信息进行分类处理;
根据分类处理后的所述基本信息构建多维基础大数据库;
根据所述多维基础大数据库为所述注册用户推荐可能感兴趣内容,获取浏览量数据;
根据所述浏览量数据对所述注册用户的所述可能感兴趣内容进行评判,得到评判结果;
根据所述评判结果,为注册用户进行个性化推荐。
2.根据权利要求1所述的基于数据分析的用户个性化推荐方法,其特征如下,所述注册用户的基本信息包括性别、年龄、职业和兴趣爱好。
3.根据权利要求1所述的基于数据分析的用户个性化推荐方法,其特征如下,构建所述多维基础大数据库的方法包括:将新注册用户的信息从性别角度、年龄角度、职业角度和兴趣爱好角度进行分类数据收集并建立多个小数据库;根据所述小数据库建立多维基础大数据库。
4.根据权利要求1所述的基于数据分析的用户个性化推荐方法,其特征如下,所述浏览量数据包括:各性别用户最多浏览信息种类,各年龄段用户最多浏览信息种类,各职业用户浏览信息种类和各兴趣爱好用户最多浏览信息种类。
5.根据权利要求1所述的基于数据分析的用户个性化推荐方法,其特征如下,筛选出用户的所述感兴趣内容的方法包括:
根据所述多维基础大数据库对用户进行初步内容推荐;
根据用户对推荐的所述初步内容的浏览情况进行分析,判断用户是否对推荐的所述初步内容感兴趣,过滤所述初步内容中浏览情况较差的内容并根据所述多维基础大数据库继续推荐新内容,最终筛选出所述用户感兴趣内容。
6.根据权利要求1所述的基于数据分析的用户个性化推荐方法,其特征如下,用户所述可能感兴趣内容的评判指标包括:同标签内容停留时间、同标签内容点击频率和同标签内容搜索频率。
7.一种基于数据分析的用户个性化推荐***,其特征如下,包括:基础数据收集模块、数据分析模块、多维基础大数据库模块、浏览量数据处理模块和推送模块;
所述基础数据收集模块用于收集注册用户的基本信息;
所述数据分析模块用于对所述基本信息进行分类处理;
所述多维基础大数据库模块用于根据分类处理后的所述基本信息构建多维基础大数据库;
所述浏览量数据处理模块用于根据所述多维基础大数据库为所述注册用户推荐可能感兴趣内容,获取浏览量数据;
所述浏览量数据处理模块还用于对所述可能感兴趣内容进行评判,得到评判结果;
所述推送模块用于根据所述评判结果,为所述注册用户进行个性化推荐。
8.根据权利要求7所述的基于数据分析的用户个性化推荐***,其特征如下,所述多维大数据库模块包括:性别数据库、年龄段数据库、职业数据库和兴趣爱好数据库。
CN202210746729.8A 2022-06-29 2022-06-29 一种基于数据分析的用户个性化推荐方法和*** Withdrawn CN115098777A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210746729.8A CN115098777A (zh) 2022-06-29 2022-06-29 一种基于数据分析的用户个性化推荐方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210746729.8A CN115098777A (zh) 2022-06-29 2022-06-29 一种基于数据分析的用户个性化推荐方法和***

Publications (1)

Publication Number Publication Date
CN115098777A true CN115098777A (zh) 2022-09-23

Family

ID=83295299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210746729.8A Withdrawn CN115098777A (zh) 2022-06-29 2022-06-29 一种基于数据分析的用户个性化推荐方法和***

Country Status (1)

Country Link
CN (1) CN115098777A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117473165A (zh) * 2023-11-20 2024-01-30 河北汉统信息科技有限公司 一种基于大数据的用户关注需求分析处理***及方法
CN117540093A (zh) * 2023-11-21 2024-02-09 深圳市弘裕金联科技有限公司 一种基于大数据的用户行为分析方法和***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117473165A (zh) * 2023-11-20 2024-01-30 河北汉统信息科技有限公司 一种基于大数据的用户关注需求分析处理***及方法
CN117540093A (zh) * 2023-11-21 2024-02-09 深圳市弘裕金联科技有限公司 一种基于大数据的用户行为分析方法和***

Similar Documents

Publication Publication Date Title
CN105224699B (zh) 一种新闻推荐方法及装置
CN107862022B (zh) 文化资源推荐***
US8650198B2 (en) Systems and methods for facilitating the gathering of open source intelligence
CN111191122A (zh) 一种基于用户画像的学习资源推荐***
CN103226578B (zh) 面向医学领域的网站识别和网页细分类的方法
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN115098777A (zh) 一种基于数据分析的用户个性化推荐方法和***
CN106991175B (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
CN106682686A (zh) 一种基于手机上网行为的用户性别预测方法
CN111914172B (zh) 一种基于用户标签的医学信息推荐方法及***
CN107918618B (zh) 数据处理方法及装置
CN108959329B (zh) 一种文本分类方法、装置、介质及设备
CN112258254B (zh) 基于大数据架构的互联网广告风险监测方法及***
CN110633406A (zh) 事件专题的生成方法、装置、存储介质和终端设备
CN106897359A (zh) 互联网信息收集及关联方法
CN112149422B (zh) 一种基于自然语言的企业新闻动态监测方法
CN111447575A (zh) 短信息推送方法、装置、设备及存储介质
CN108446333B (zh) 一种大数据文本挖掘处理***及其方法
CN108647312A (zh) 一种用户偏好分析方法及其装置
CN112148952A (zh) 一种任务执行方法、装置、设备及计算机可读存储介质
CN105512300A (zh) 信息过滤方法及***
CN110717089A (zh) 一种基于网络日志的用户行为分析***及方法
CN106708829A (zh) 一种数据推荐方法及推荐***
CN105389714B (zh) 一种从行为数据识别用户特性的方法
CN109829033B (zh) 数据展示方法和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220923