CN113761384B - 基于大数据的游客分级数据处理方法及*** - Google Patents
基于大数据的游客分级数据处理方法及*** Download PDFInfo
- Publication number
- CN113761384B CN113761384B CN202111323075.XA CN202111323075A CN113761384B CN 113761384 B CN113761384 B CN 113761384B CN 202111323075 A CN202111323075 A CN 202111323075A CN 113761384 B CN113761384 B CN 113761384B
- Authority
- CN
- China
- Prior art keywords
- product
- user
- page
- ranking
- grading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000007405 data analysis Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000007726 management method Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 21
- 230000006399 behavior Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 abstract description 5
- 238000012937 correction Methods 0.000 abstract description 3
- 230000007547 defect Effects 0.000 abstract description 3
- 239000000047 product Substances 0.000 description 169
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 230000004308 accommodation Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9562—Bookmark management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理领域,尤其是一种基于大数据的游客分级数据处理方法及***。该方法和***用于执行步骤如下:页面标记:作为总体产品页面库;用户判断:判断用户为新用户还是老用户;一次推送,随机调取部分页面标签推送给用户端;基础分析:设置该用户的初始分级;更新推送:结合初始推送列表和例外页面标签生成新的基础页面列表,替换原有的基础页面列表,并推送给客户端;例外记录:记录用户所浏览的例外的分级信息;大数据分析:根据每个页面集合中的页面数量计算得出各个页面集合的数据占比;生成迭代页面列表,迭代更新基础页面列表。本发明通过推送标签迭代校正来弥补数据样本相对单一的不足,提高推送的准确性,提高数据交互效率。
Description
技术领域
本发明涉及数据处理领域,尤其是一种基于大数据的游客分级数据处理方法及***。
背景技术
在旅游行业中,旅游项目的分类和用户的喜好存在多样性。例如,不同的用户往往在自然景区、人文景区、休旅活动、境外游等旅游项目的偏好各不相同。为了更好的贴近用户的消费***台和旅游服务机构往往会根据用户的浏览历史、消费历史和相关信息进行大数据收集和运算,通过聚类分析等算法对每个用户进行画像,获取每个用户的消费偏好、消费水平等参数,根据所得的用户画像向用户推送相关的产品介绍,从而提高广告推送的达成率,也减少了用户无关信息的接收率,提高了信息交互的效率。
但是,随着人们对个人数据信息的保护意识加强和监管的日趋严格,关于用户的详细位置信息、身份信息等与用户个人密切相关的信息的获取权限受到了制约,就趋势而言,此类信息以后将不再能主动搜集,那么能够进行大数据分析的对象只剩下用户在单一平台上的搜索记录、浏览记录和消费记录这几个主要指标,通过仅有的几个少数指标和少量的数据进行的用户画像的精确度相较以往大幅下降,造成推送内容的准确性也相应降低,降低了信息交互的效率。因此,如何在不搜集用户个人信息的基础上仍然能够提高推送的准确性成为了业内亟待解决的问题。
发明内容
第一方面,本发明提供一种解决上述不足的基于大数据的游客分级数据处理方法。
该方法包括步骤:
S1、页面标记:对应每一个旅游服务产品生成一个可供浏览的产品页面和对应每一产品页面的页面标签,并为该产品页面标记旅游产品分级和消费分级,旅游产品分级和消费分级合并为产品分级,作为总体可提供的服务产品的产品页面库;
S2、用户判断:判断用户为新用户还是老用户,新用户从步骤S3往下进行,老用户从步骤S5往下进行;
S3、一次推送,从产品页面库中随机调取部分页面标签,随机排序形成基础页面标签列表推送给用户端;
S4、基础分析:搜集用户的搜索记录、产品页面浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录确定旅游产品分级,通过浏览记录和/或消费记录确定消费分级,合并旅游产品分级和消费分级作为该用户的初始分级;
S5、更新推送:根据用户的初始分级调取相对应的页面标签生成初始推送列表,并随机***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签生成新的基础页面列表,替换原有的基础页面列表,并推送给客户端;
S6、例外记录:记录用户所浏览的例外页面标签对应的产品页面的分级信息;
S7、大数据分析:获取每个初始分级相同的用户群的与初始分类相关的搜索记录和浏览记录中对应产品页面、以及例外页面标签对应的搜索记录和浏览记录的产品页面,形成多个页面集合,然后根据每个页面集合中的页面数量计算得出各个页面集合的数据占比;
S8、迭代推送:根据每个初始分级相同的用户群各个页面集合的数据占比从产品页面库中按照该比例调取页面标签,生成迭代页面列表,迭代更新基础页面列表。
采用了上述方法后,可以通过收集数据样本相对单一的单个用户的搜索记录、浏览记录和消费记录,初步确定用户的初始分级,然后通过非直接相关的增补标签的浏览和消费记录来作为校正用户初始分级的变量因素,最后通过对集体用户的初始分级和变量因素的综合计算,获得最终的推送标签集合,通过推送标签迭代校正来弥补数据样本相对单一的不足,提高推送的准确性,提高数据交互效率。
在一种可能的实现方式中,步骤S4中通过搜索记录确定基础产品分级时,读取搜索记录对应的结果列表,从结果列表中的标签中读取的产品分级编码,采用多数结果的产品分级编码作为该搜索记录对应的产品分级编码。
第二方面,本发明还提供了一种基于大数据的游客分级数据处理***,其特征在于,该***包括:
用户界面模块,用于获取用户的输入信息,并向用户展示数据;
用户管理模块,与用户界面模块进行数据通信,存储用户从用户界面模块获取的输入信息;
产品标签库模块,用于存储对应每个旅游服务产品的产品页面和页面标签;
产品分级写入模块,与产品标签库模块进行数据通信,用于定义旅游服务产品的产品分级,并将该产品分级写入产品标签库模块中对应的产品标签中;
推送模块,与用户界面模块和产品标签库模块进行数据通信,根据从用户界面模块接收的用户的输入信息,从产品分级模块中调取相应的页面标签,形成推送列表并推送到用户界面模块;
基础分析模块,读取用户管理模块获取的输入信息中的搜索记录、浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录从产品分级写入模块中获取旅游产品分级,通过浏览记录和/或消费记录从产品分级写入模块中获取消费分级,合并旅游产品分级和消费分级作为该用户的初始分级,并将该初始分级发送到用户管理模块;
推送更新模块,与用户管理模块进行数据通信,读取用户管理模块中的初始分级,根据初始分级信息生成初始推送列表,并***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签更新基础列表,形成更新列表推送给用户界面模块;
例外记录存储模块,与用户界面模块进行数据通信,记录用户所浏览的非直接相关的例外页面标签的对应的产品页面的分级信息;
大数据分析模块,与用户管理模块和基础分析模块进行数据通信,获取每一个初始分级相同的用户的与初始分级相关的搜索记录、浏览记录和消费记录中对应产品页面的数量总和、以及例外页面标签对应的浏览记录和消费记录的产品分级数量总和,计算每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例;
推送迭代模块,与用户管理模块、大数据分析模块和推送模块进行数据通信,根据每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例从产品标签库中按照该比例调取页面标签迭代更新对应用户群的更新列表。
附图说明
图1为第一实施例的流程示意图。
图2为第二实施例的步骤S1的具体流程示意图。
图3为第一和第二实施例步骤S4的具体流程示意图。
图4为第一和第二实施例的步骤S5的具体流程示意图。
图5为第三实施例的总体***的模块结构图。
图6为第三实施例的用户界面模块的模块结构图。
图7为第三实施例的产品分级写入模块的模块结构图。
图8为第三实施例的基础分析模块的模块结构图。
图9为第三实施例的大数据分析模块的模块机构图。
具体实施方式
首先对本发明的各个实施例的总体思路和体系做一个整体介绍。现有的大数据分析中,在对用户进行画像分析时,需要调用诸多的数据和信息,例如用户的根据用户浏览器浏览信息,搜索引擎的搜索信息,网购的购买记录,可以获取用户的商品和服务偏好,通过获取用户的详细位置信息,例如住址,工作单位,可以获取用户的消费能力,通过用户的身份证号码,可以获取用户的性别、年龄、籍贯等信息,用以对用户偏好及消费能力进行补充调整,从而获取精准的用户画像,向用户推送合适的信息,提高信息投放的准确率。但是随着隐私信息保护制度和技术的发展,上述信息均不能在无用户许可的情况下获取。首先最主要的身份证信息,作为个人的重要隐私信息,以及住址、工作单位等信息,作为商业信息时,将面临严格的管制,达到非必要不采集的要求。用户的详细外置信息、用户浏览器浏览信息,搜索引擎的搜索信息,网购的购买记录等信息均需要获得用户的许可才能进行采集,对于此类信息的公开,用户往往趋于保守,因此,基于全方位大数据的用户画像策略在今后面临数据源不足,关键信息缺失的问题,基于大数据的用户画像的人工智能运算和推介算法也面临失效。
现有的一些电子商务平台存在一些根据用户的搜索、浏览、收藏、购买记录来进行产品列表推荐的算法,此类算法基于产品或者品牌关键字进行列表推荐,推荐结果的局限性大,主要用于用户需求明确的使用场景中,对于用户的衍生需求的探索度不足,需求的挖掘不够深入。
因此本发明的以下实施例着眼于对用户的单一数据进行加工,然后通过对全体用户的大数据分析来产生推荐列表。是推荐列表中包含用户的重要关切信息,衍生需求信息以及需求发掘信息,更好的进行客户服务和产品推荐。
第一实施例主要介绍基于大数据的游客分级数据处理方法的基本步骤,如图1-图4所示,具体包括步骤:
S1、页面标记:对应每一个旅游服务产品生成一个可供浏览的产品页面和对应每一产品页面的页面标签,并为该产品页面标记旅游产品分级和消费分级,旅游产品分级和消费分级合并为产品分级,作为总体可提供的服务产品的产品页面库;
具体可以依照如下步骤来进行:
S11、根据产品页面对应的旅游产品的产品类型和价格区间,分别为不同的产品类型和价格区间分别定义字符串标识;
S12、定义产品分级变量,将产品类型对应的字符串标识和价格区间对应的字符串标识合并写入产品分级变量,得到同产品类型同价格区间的产品分级编码;
S13、使用产品分级编码对相对应的产品页面进行标记。
对于旅游产品而言,根据兴趣取向首先要对旅游产品的核心内容进行分类,对于旅游产品的分类,有山川林海类等地形地貌景观为游览主体的风景类产品,例如黄山、张家界、三峡、九寨沟、三亚等;以历史人文景点的为游览主体的景区类产品,例如黄鹤楼、兵马俑、碑林、故宫等;以主题类游玩设施为游览主题的旅游园区,如迪斯尼乐园,长隆水上乐园、动植物园、环球影城等;根据上述的类型可以判断各个用户群的总体兴趣倾向,因此可以对其进行分级,例如自然风景类分配为A级、人文景区分配为B级、主题园区分配为C级,另外还有不特定的旅游产品,例如境外游,可以分配为D级,也可以将一个景区分配在多个级别中,例如嵩山少林寺,武当山道教建筑群,此类景区既有山林类的自然风景又有宗教文化景点,则可以将此类景区分配两个分级,即A级和B级。根据旅游产品的特点,除了作为游览的核心内容以外,往往还有配套的交通、住宿服务进行打包,根据交通、住宿条件的差别,总体的价格往往有巨大差异,例如对于同一景区的游玩而言,含飞机票和五星级酒店的服务包的价格与火车票和普通宾馆的服务包价格之间往往差异巨大,这样服务包根据价格区间的不同面向了不同消费水平的用户。所以除了对旅游产品进行分类以外,还要对消费水平进行分级,例如,0-2000为01级,2001-5000为02级,5001-10000为03级,10001-20000为04级,20001以上为05级。对旅游产品分级和消费分级完成以后,将二者合而为一,形成一个产品分级,例如A03、C02、D05等,即根据该产品分级将位于同样消费区间针对同类旅游项目的产品划归为同一分级。
S2、用户判断:判断用户为新用户还是老用户,新用户从步骤S3往下进行,老用户从步骤S5往下进行;
当一用户使用时,先要对用户进行判断,新用户是从来没有搜索和查看记录的用户,老用户则有过搜索和查看记录,二者在作出推送时应通过不同的策略,所以需要加以区分并指定不同的推送流程。
S3、一次推送,从产品页面库中随机调取部分页面标签,随机排序形成基础页面标签列表推送给用户端;对于新用户,在进行首次推送时,由于尚未采集到关于新用户的兴趣范围等信息,所以需要主动的随机给用户进行内容推送,提供一个获取用户输入操作的基本接口,使用户可以根据兴趣范围进行浏览查看,以此来存储用户的浏览记录。
S4、基础分析:搜集用户的搜索记录、产品页面浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录确定旅游产品分级,通过浏览记录和/或消费记录确定消费分级,合并旅游产品分级和消费分级作为该用户的初始分级;
在用户进行了搜索、浏览和消费行为中的一种或多种以后,通过对用户搜索、浏览和消费的页面确定初始分级,初始分级的基本格式与产品分级相一致,合并旅游产品分级和消费分级作为该用户的初始分级包括步骤:
S41、在用户的账户下创建一初始分级变量;
S42、将获取的旅游产品分级和消费分级对应的字符串标识合并写入初始分级变量,创建该用户的初始分级编码。
此处需要另外说明的是,由于消费记录对应的页面必然来自浏览记录中存在的页面,所以消费记录是可选增项,实际的实施中也可以只考虑搜索记录和浏览记录即可。
S5、更新推送:根据用户的初始分级调取相对应的页面标签生成初始推送列表,并随机***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签生成新的基础页面列表,替换原有的基础页面列表,并推送给客户端;
具体而言,根据用户的初始分级生成初始推送列表包括步骤:
S51、根据用户的初始分级编码,在标签库中查找与初始分级编码相同的产品分级编码:
S52、读取该产品分级编码下的产品标签;
S53、对读取的产品标签进行排序,形成初始推送列表。
其中,与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的增补标签包括与初始分级编码的产品分级编码不同的产品分级编码对应的产品标签、与初始分级编码的消费分级不同的产品分级编码对应的产品标签、以及与初始分级编码的旅游产品分级和消费分级均不相同的产品分级编码对应的产品标签。
例如用户的初始分级为B03,那么产品分级为B03的产品页面作为基础的调取对象。同时,同时为了扩展推送的针对范围,起到发掘用户需求的目的,本实施例中还将旅游产品分级相同但是消费分级接近的产品页面作为调取对象,例如B02、B04;此外,还围绕初始分级所在的消费范围,加入额外的消费分级相同但旅游产品不同的产品页面作为调取对象,例如A03、C03。除此之外,还需要未旅游产品分级和消费分级与初始分级都不相同的产品页面留出小部分比例,例如C01、D05。此时形成新的推送列表的产品页面对象集合即选择完成,对于此时产品页面对象集合中各个部分所占的比例可以随机选取,也可以人为设置,根据与用户初始分级的关联程度可以从大到小的分配占比份额,例如初始分级完全相关的占比50%,初始分级中单项相关的各占20%,初始分级不相关的占10%,此处占比仅为举例说明,实际占比可以根据需要设置。
形成了新的推送列表以后,将新的推送列表从步骤S3中一次推送的列表的已显示列表的最末端处***原有列表,替换掉原有列表未显示的部分,形成新的推送列表,用户直接在原有界面下滑即可查看新的推送列表。
S6、例外记录:记录用户所浏览的例外页面标签对应的产品页面的分级信息;
本步骤记录用户对旅游产品分级和消费分级与初始分级完全不对应的产品页面的浏览记录,并记录此类完全不对应的产品页面的浏览记录对于总浏览记录的占比。根据该占比可以在该占比的前提下尽可能多的更换包括的产品分级,在不影响总体推送内容的情况下,全面的发掘用户对不同方向的旅游产品的兴趣点。
上述的步骤针对单个用户的查询和浏览记录的记录分析和推送机制的指定,但是单个用户的查询和浏览操作都存在较大的不确定性,由于单个用户的查询和浏览记录毕竟数量有限,因此据此而得出的推送列表的内容往往具有个别性,即对于初始分级相同的同类型用户,其获得的列表内容往往差异较大,因此需要基于上述的步骤对数据进行进一步的处理,得到一个适用于多数的同类型用户的推送列表,进一步提高推送的整体准确度,以达到提高成交率的目的。所以基于上述步骤的处理结果进一步进行步骤S7的处理。
S7、大数据分析:获取每个初始分级相同的用户群的与初始分类相关的搜索记录和浏览记录中对应产品页面、以及例外页面标签对应的搜索记录和浏览记录的产品页面,形成多个页面集合,然后根据每个页面集合中的页面数量计算得出各个页面集合的数据占比;
在步骤S7中,在前述步骤对于单个用户的数据处理的基础上,对于每个初始分级相同的同类型用户的整体数据进行进一步的加工,将同类型用户的整体搜索记录和浏览记录对应的产品页面的总量进行进一步的处理,得到对应每个不同的产品分级的页面集合,并根据每个页面集合中的页面数量,计算各个页面集合的总数量占比。
例如,初始分类为A02的同类用户组成的用户群中,总体浏览过的产品页面对应的产品分级包括A02、。其中根据计算占比,得到A02(64%)、C03(17%)、D02(7%)、A01(6%)、B05(4%)、A03(1%)、E04(1%)。
S8、迭代推送:根据每个初始分级相同的用户群各个页面集合的数据占比从产品页面库中按照该比例调取页面标签,生成迭代页面列表,迭代更新基础页面列表。
当获得步骤S7中所得到的比例以后,对于初始分级为A02的用户,即从产品页面库中按照所得的比例调取相应比例的页面标签,形成新的推送列表,***到步骤S5中更新后的推送列表,进行二次更新。形成了新的推送列表以后,将新的推送列表从步骤S5中更新推送的列表的已显示列表的最末端处***原有列表,替换掉原有列表未显示的部分,形成新的推送列表,用户直接在原有界面下滑即可查看新的推送列表。
随着用户浏览数量的增大,以及用户量的增大,页面集合数量和页面集合的占比随之持续的变化,是的列表不断的自我迭代,达到更加准确的推送效果。
采用第一实施例的方法可以通过收集数据样本相对单一的单个用户的搜索记录、浏览记录和消费记录,初步确定用户的初始分级,然后通过非直接相关的增补标签的浏览和消费记录来作为校正用户初始分级的变量因素,最后通过对集体用户的初始分级和变量因素的综合计算,获得最终的推送标签集合,通过推送标签迭代校正来弥补数据样本相对单一的不足,提高推送的准确性,提高数据交互效率。
在第一实施例中通过搜索记录来确定产品分级时,由于搜索行为往往在用户端是关键词的输入操作,而关键词本身不携带产品分级所需要的编码信息,此时往往需要通过智能语义分析来给关键词分配一个相应的产品分级编码才能与后续的数据处理步骤相匹配。而关键词的形式内容灵活性很大,通过智能语义分析算法给关键词来分配合适的产品分级编码将极大的增加算法的复杂性和服务器的运算速度,为了简化算法,在第一实施例的基础上进一步提出第二实施例。
第二实施例主要基于第一实施例的步骤S4进一步的进行搜索记录的处理,在步骤S4中通过搜索记录确定基础产品分级时,读取搜索记录对应的结果列表,从结果列表中的标签中读取的产品分级编码,采用多数结果的产品分级编码作为该搜索记录对应的产品分级编码。
采用上述的处理方法以后,借助通常的搜索运算得出搜索结果列表,对于搜索结果中占多数的产品分级编码作为该搜索记录对应的产品分级编码,只需要增加一个计数计算即可对搜索关键词对应的产品分级编码进行分配,大幅简化了算法的规模和复杂性,提高了运行效率。
本发明的第三实施例提供了一种基于大数据的游客分级数据处理***,如图5所示,该***包括:
用户界面模块1,用于获取用户的输入信息,并向用户展示数据;用户界面模块1位于用户端,是一个具有指令输入和显示输出的计算终端,可以为联网的计算机、移动通信设备等。
用户管理模块2,与用户界面模块进行数据通信,存储用户从用户界面模块获取的输入信息;
存储用户输入的信息包括用户注册的账户,及对于内容的查询浏览记录等信息。
产品标签库模块3,用于存储对应每个旅游服务产品的产品页面和页面标签;
产品分级写入模块4,与产品标签库模块3进行数据通信,用于定义旅游服务产品的产品分级,并将该产品分级写入产品标签库模块3中对应的产品标签中;
推送模块5,与用户界面模块1和产品标签库模块3进行数据通信,根据从用户界面模块1接收的用户的输入信息,从产品分级模块3中调取相应的页面标签,形成推送列表并推送到用户界面模块1;
基础分析模块6,读取用户管理模块2获取的输入信息中的搜索记录、浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录从产品分级写入模块中获取旅游产品分级,通过浏览记录和/或消费记录从产品分级写入模块4中获取消费分级,合并旅游产品分级和消费分级作为该用户的初始分级,并将该初始分级发送到用户管理模块2;
推送更新模块7,与用户管理模块2进行数据通信,读取用户管理模块2中的初始分级,根据初始分级信息生成初始推送列表,并***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签更新基础列表,形成更新列表推送给用户界面模块1;
例外记录存储模块8,与用户界面模块1进行数据通信,记录用户所浏览的非直接相关的例外页面标签的对应的产品页面的分级信息;
大数据分析模块9,与用户管理模块2和基础分析模块6进行数据通信,获取每一个初始分级相同的用户的与初始分级相关的搜索记录、浏览记录和消费记录中对应产品页面的数量总和、结合例外记录存储模块8中的例外页面标签对应的浏览记录和消费记录的产品分级数量总和,计算每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例;
推送迭代模块10,与用户管理模块2、大数据分析模块9和推送模块5进行数据通信,根据每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例从产品标签库3中按照该比例调取页面标签迭代更新对应用户群的更新列表。
本实施例中,如图6和图7所示,所述的用户界面模块1包括搜索单元11、推送列表显示单元12、以及记录浏览和消费对应的产品标签的页面标签记录单元13;所述的产品分级写入模块4包括对旅游产品服务进行产品分级的分级定义单元41,以及将定义单元生成的产品分级信息写入到产品标签库模块3中的标签写入单元42;
本实施例中,如图8所示,所述的基础分析模块6包括从所述的用户界面模块1的标签记录单元13获取数据的记录读取单元61、根据记录读取单元61中的标签的旅游产品分级信息和消费分级生成用户的初始分级的用户分级单元62、以及将用户分级单元62发送到对应的用户管理模块的用户分级写入单元63。
本实施例中,如图9所示,所述的大数据分析模块9包括从所有用户管理模块2中调取一组初始分级相同的用户的全部搜索记录、浏览记录和消费记录对应产品标签的数据获取单元91,对获取的产品标签按照产品分级进行分类的分类单元92、对各个分类中的产品标签数据总量进行统计的统计单元93、以及对统计的数据总量进行比例计算的比例计算单元94。
总体而言,第三实施例的数据处理***基于各个模块和单元执行第一实施例和第二实施例中所述的数据处理方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.基于大数据的游客分级数据处理方法,其特征在于,该方法包括步骤:
S1、页面标记:对应每一个旅游服务产品生成一个可供浏览的产品页面和对应每一产品页面的页面标签,并为该产品页面标记旅游产品分级和消费分级,旅游产品分级和消费分级合并为产品分级,作为总体可提供的服务产品的产品页面库;
S2、用户判断:判断用户为新用户还是老用户,新用户从步骤S3往下进行,老用户从步骤S5往下进行;
S3、一次推送,从产品页面库中随机调取部分页面标签,随机排序形成基础页面标签列表推送给用户端;
S4、基础分析:搜集用户的搜索记录、产品页面浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录确定旅游产品分级,通过浏览记录和/或消费记录确定消费分级,合并旅游产品分级和消费分级作为该用户的初始分级;
S5、更新推送:根据用户的初始分级调取相对应的页面标签生成初始推送列表,并随机***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签生成新的基础页面列表,替换原有的基础页面列表,并推送给客户端;
S6、例外记录:记录用户所浏览的例外页面标签对应的产品页面的分级信息;
S7、大数据分析:获取每个初始分级相同的用户群的与初始分类相关的搜索记录和浏览记录中对应产品页面、以及例外页面标签对应的搜索记录和浏览记录的产品页面,形成多个页面集合,然后根据每个页面集合中的页面数量计算得出各个页面集合的数据占比;
S8、迭代推送:根据每个初始分级相同的用户群各个页面集合的数据占比从产品页面库中按照该比例调取页面标签,生成迭代页面列表,迭代更新基础页面列表。
2.如权利要求1所述的基于大数据的游客分级数据处理方法,其特征在于,步骤S1进一步包括步骤:
S11、根据产品页面对应的旅游产品的产品类型和价格区间,分别为不同的产品类型和价格区间分别定义字符串标识;
S12、定义产品分级变量,将产品类型对应的字符串标识和价格区间对应的字符串标识合并写入产品分级变量,得到同产品类型同价格区间的产品分级编码;
S13、使用产品分级编码对相对应的产品页面进行标记。
3.如权利要求2所述的基于大数据的游客分级数据处理方法,其特征在于,步骤S4中通过搜索记录确定基础产品分级时,读取搜索记录对应的结果列表,从结果列表中的标签中读取的产品分级编码,采用多数结果的产品分级编码作为该搜索记录对应的产品分级编码。
4.如权利要求3所述的基于大数据的游客分级数据处理方法,其特征在于,步骤S4中合并旅游产品分级和消费分级作为该用户的初始分级包括步骤:
S41、在用户的账户下创建一初始分级变量;
S42、将获取的旅游产品分级和消费分级对应的字符串标识合并写入初始分级变量,创建该用户的初始分级编码。
5.如权利要求4所述的基于大数据的游客分级数据处理方法,其特征在于,步骤S5中根据用户的初始分级生成初始推送列表包括步骤:
S51、根据用户的初始分级编码,在标签库中查找与初始分级编码相同的产品分级编码:
S52、读取该产品分级编码下的产品标签;
S53、对读取的产品标签进行排序,形成初始推送列表。
6.如权利要求5所述的基于大数据的游客分级数据处理方法,其特征在于,步骤S5中的与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的增补标签包括与初始分级编码的产品分级编码不同的产品分级编码对应的产品标签、与初始分级编码的消费分级不同的产品分级编码对应的产品标签、以及与初始分级编码的旅游产品分级和消费分级均不相同的产品分级编码对应的产品标签。
7.基于大数据的游客分级数据处理***,其特征在于,该***包括:
用户界面模块,用于获取用户的输入信息,并向用户展示数据;
用户管理模块,与用户界面模块进行数据通信,存储用户从用户界面模块获取的输入信息;
产品标签库模块,用于存储对应每个旅游服务产品的产品页面和页面标签;
产品分级写入模块,与产品标签库模块进行数据通信,用于定义旅游服务产品的产品分级,并将该产品分级写入产品标签库模块中对应的产品标签中;
推送模块,与用户界面模块和产品标签库模块进行数据通信,根据从用户界面模块接收的用户的输入信息,从产品分级模块中调取相应的页面标签,形成推送列表并推送到用户界面模块;
基础分析模块,读取用户管理模块获取的输入信息中的搜索记录、浏览记录和消费记录中的一种或多种,通过搜索记录和/或浏览记录从产品分级写入模块中获取旅游产品分级,通过浏览记录和/或消费记录从产品分级写入模块中获取消费分级,合并旅游产品分级和消费分级作为该用户的初始分级,并将该初始分级发送到用户管理模块;
推送更新模块,与用户管理模块进行数据通信,读取用户管理模块中的初始分级,根据初始分级信息生成初始推送列表,并***一组与用户的初始分级的旅游产品分级和消费分级中至少一项非直接相关的例外页面标签,结合初始推送列表和例外页面标签更新基础列表,形成更新列表推送给用户界面模块;
例外记录存储模块,与用户界面模块进行数据通信,记录用户所浏览的非直接相关的例外页面标签的对应的产品页面的分级信息;
大数据分析模块,与用户管理模块和基础分析模块进行数据通信,获取每一个初始分级相同的用户的与初始分级相关的搜索记录、浏览记录和消费记录中对应产品页面的数量总和、以及例外页面标签对应的浏览记录和消费记录的产品分级数量总和,计算每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例;
推送迭代模块,与用户管理模块、大数据分析模块和推送模块进行数据通信,根据每个初始分级相同的用户群搜索、浏览和消费行为对应的页面标签占总量的比例从产品标签库中按照该比例调取页面标签迭代更新对应用户群的更新列表。
8.如权利要求7所述的基于大数据的游客分级数据处理***,其特征在于,所述的用户界面模块包括搜索单元、推送列表显示单元、以及记录浏览和消费对应的产品标签的页面标签记录单元;所述的产品分级写入模块包括对旅游产品服务进行产品分级的分级定义单元,以及将定义单元生成的产品分级信息写入到产品标签库中的标签写入单元。
9.如权利要求8所述的基于大数据的游客分级数据处理***,其特征在于,所述的基础分析模块,包括从所述的用户界面模块的标签记录单元获取数据的记录读取单元、根据记录读取单元中的标签的旅游产品分级信息和消费分级生成用户的初始分级的用户分级单元、以及将用户分级单元发送到对应的用户管理模块的用户分级写入单元。
10.如权利要求9所述的基于大数据的游客分级数据处理***,其特征在于,所述的大数据分析模块包括从所有用户管理模块中调取一组初始分级相同的用户的全部搜索记录、浏览记录和消费记录对应产品标签的数据获取单元,对获取的产品标签按照产品分级进行分类的分类单元、对各个分类中的产品标签数据总量进行统计的统计单元、以及对统计的数据总量进行比例计算的比例计算单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323075.XA CN113761384B (zh) | 2021-11-10 | 2021-11-10 | 基于大数据的游客分级数据处理方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111323075.XA CN113761384B (zh) | 2021-11-10 | 2021-11-10 | 基于大数据的游客分级数据处理方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113761384A CN113761384A (zh) | 2021-12-07 |
CN113761384B true CN113761384B (zh) | 2022-02-08 |
Family
ID=78784808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111323075.XA Active CN113761384B (zh) | 2021-11-10 | 2021-11-10 | 基于大数据的游客分级数据处理方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113761384B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756427B (zh) * | 2023-06-27 | 2024-05-14 | 鼎翰文化股份有限公司 | 一种基于大数据的旅游信息推送*** |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040019561A1 (en) * | 2002-05-07 | 2004-01-29 | Gabriela Isturiz | Electronic billing system utilizing a universal billing format data transmission |
US20140180811A1 (en) * | 2012-12-22 | 2014-06-26 | Coupons.Com Incorporated | Automatic recommendation of electronic offers to an offer provider based on historical transaction data and offer data |
CN109582876B (zh) * | 2018-12-19 | 2021-05-11 | 广州易起行信息技术有限公司 | 旅游行业用户画像构造方法、装置和计算机设备 |
-
2021
- 2021-11-10 CN CN202111323075.XA patent/CN113761384B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113761384A (zh) | 2021-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Önder et al. | Tracing tourists by their digital footprints: The case of Austria | |
CN102549563B (zh) | 语义交易所 | |
CN109542916A (zh) | 平台商品入驻方法、装置、计算机设备及存储介质 | |
CN102208088A (zh) | 服务器设备、客户端设备、内容推荐方法和程序 | |
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
Kim et al. | Assessing and mapping cultural ecosystem services of an urban forest based on narratives from blog posts | |
CN103309869A (zh) | 数据对象的展示关键词推荐方法及*** | |
US20120143598A1 (en) | Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program | |
CN104050243A (zh) | 一种将搜索与社交相结合的网络搜索方法及其*** | |
CN111626777B (zh) | 选址方法、选址决策***、存储介质及电子设备 | |
CN113761384B (zh) | 基于大数据的游客分级数据处理方法及*** | |
CN115422438A (zh) | 铁路物资供应资源推荐方法、***和存储介质 | |
CN114936301A (zh) | 智能家居建材数据的管理方法、装置、设备及存储介质 | |
KR100902674B1 (ko) | 문서 탐색 서비스 제공 방법 및 시스템 | |
CN110110218A (zh) | 一种身份关联方法及终端 | |
Mor et al. | Who is a tourist? Classifying international urban tourists using machine learning | |
CN104615636A (zh) | 一种基于互联网的个人与商业资源匹配的方法 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN108804491A (zh) | 项目推荐方法、装置、计算设备及存储介质 | |
JPH09101971A (ja) | パーソナル電子書籍装置 | |
CN117194780A (zh) | 生成式人工智能的旅游行程定制方法、装置及设备 | |
CN101482881A (zh) | 用于确定文档的含义以使文档与内容匹配的方法和*** | |
Andrunyk et al. | Information System of Photostock Web Galleries Based on Machine Learning Technology. | |
US20180330422A1 (en) | Recommender systems and methods for pricing and evaluation of fine art works | |
JP7212103B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |