CN117688243A - 一种基于大数据的关键词筛选推荐的方法及*** - Google Patents
一种基于大数据的关键词筛选推荐的方法及*** Download PDFInfo
- Publication number
- CN117688243A CN117688243A CN202311752161.1A CN202311752161A CN117688243A CN 117688243 A CN117688243 A CN 117688243A CN 202311752161 A CN202311752161 A CN 202311752161A CN 117688243 A CN117688243 A CN 117688243A
- Authority
- CN
- China
- Prior art keywords
- keyword
- keywords
- search
- user
- ending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012216 screening Methods 0.000 title claims abstract description 33
- 230000006399 behavior Effects 0.000 claims description 93
- 238000004590 computer program Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 241001122767 Theaceae Species 0.000 description 10
- 230000035622 drinking Effects 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大数据的关键词筛选推荐的方法,包括:通过大数据获取用户群体的第一搜索行为和关联搜索行为;按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合;基于形成的关键词集合进行关键词的筛选推荐;该基于大数据的关键词筛选推荐的方法能够基于大数据用户的搜索结果来进行关键词的文本预测,从而保证推荐的关键词能够更好的满足搜索用户的真实需求。
Description
技术领域
本发明涉及一种基于大数据的关键词筛选推荐的方法及***。
背景技术
搜索是互联网应用中用户主动获取信息的重要手段,它可以帮助用户快速找到所需的信息。在用户浏览文章或发起搜索时,应用***可以预测用户的搜索行为并提供关键词推荐,这种推荐可以有效地缩短搜索路径,并激发用户的搜索需求。
然而,传统的搜索推荐词往往只从相关性和点击率两个角度来构建推荐***。在这种情况下,推荐***主要考虑两个关键词之间的文本相关性和预测用户的点击率。这种方案虽然可以有效地缩短搜索路径并提高用户的搜索效率,但是它推荐的关键词往往不能很好地满足搜索用户的真实需求。
这是因为一些低质量的虚假关键词往往更具有吸引力,能够吸引更多的用户点击。而基于预测点击率产生的推荐质量问题往往会导致用户对搜索结果的不满和失望。因此,我们需要一种更加智能的搜索推荐***,能够更好地满足用户的真实需求,避免低质虚假关键词的干扰。
发明内容
针对现有技术中的不足,本发明的目的是提供一种能够基于大数据用户的搜索结果来进行关键词的文本预测,从而保证推荐的关键词能够更好的满足搜索用户的真实需求的基于大数据的关键词筛选推荐的方法及***。
本发明解决其技术问题所采用的技术方案是:
一种基于大数据的关键词筛选推荐的方法,包括:
通过大数据获取用户群体的第一搜索行为和关联搜索行为;
按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合;
基于形成的关键词集合进行关键词的筛选推荐。
作为优选,该第一搜索行为包括用户在进行信息检索时首次输入的搜索关键词或搜索短语;该关联搜索行为包括用户在进行第一搜索行为后继续输入的与首次输入的搜索关键词或搜索短语存在关联的搜索关键词或搜索短语。
作为优选,按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类的方法为:
根据用户注册信息、历史行为数据或其他可靠数据源,将用户按照年龄段进行分类,包括12-17岁的青少年、18-35岁的青年、36-55岁的中年和55岁以上的老年;
将第一搜索行为和关联搜索行为与其对应分类的年龄段进行关联。
作为优选,该连续关键词为最后一次关联搜索行为之前出现的所有关键词或搜索短语,若仅存在第一搜索行为,则连续关键词为0,该结束关键词为最后一次关联搜索行为时出现的关键词或搜索短语,若仅存在第一搜索行为,则结束关键词则为第一搜索行为中出现的关键词或搜索短语。
作为优选,按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合的方法为:
将每一用户的连续关键词和结束关键词中出现的关键词组合为一下层关键词集合;
将存在年龄段相同用户的各个下层关键词集合合并为一中层关键词集合;
每存在一结束关键词相同的中层关键词集合合并为一上层关键词集合。
作为优选,基于形成的关键词集合进行关键词的筛选推荐的方法为:
根据用户输入的关键词索引匹配对应年龄段的上层关键词集合;
若匹配一个以上的、对应年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个对应年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到对应年龄段的上层关键词集合,则索引匹配其他相邻年龄段的上层关键词集合;
若匹配一个以上的、其他相邻年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个其他相邻年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到其他相邻年龄段的上层关键词集合,则索引匹配全年龄段的上层关键词集合;
若匹配一个以上的、全年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个全年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到全年龄段的上层关键词集合,则根据算关键词之间的相关度来进行关联性分析,并选择关联性最高的上层关键词集合,并根据结束关键词的词频进行排序推荐或直接以该上层关键词集合得的结束关键词进行推荐。
作为优选,结束关键词的词频计算方法为:包含该结束关键词的中层关键词集合数/中层关键词集合的总数。
本发明所要解决的另一技术问题为提供一种基于大数据的关键词筛选推荐的***,包括有:
数据采集与处理模块:用于从大数据源中获取用户的搜索行为和关联搜索行为数据,并对采集到的数据进行预处理和清洗,提取出有效的搜索关键词;
用户分类模块:根据年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
关键词提取模块:根据分类结果,提取用户群体的第一搜索行为和关联搜索行为中的连续关键词和结束关键词,形成关键词集合;
关键词筛选推荐模块:基于形成的关键词集合,进行关键词的筛选和推荐;
用户界面模块:用于与用户进行交互,展示推荐的关键词结果。
本发明所要解决的另一技术问题为提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
本发明所要解决的另一技术问题为提供一种计算机存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
本发明的有益效果是:
通过对用户群体进行细致的分类,可以更好地理解不同年龄段用户的兴趣和需求,从而实现针对性的关键词推荐。这样的个性化推荐能够提升用户体验,增加用户对推荐内容的接受度和满意度;通过大数据获取用户搜索行为并提取关键词集合,可以基于真实数据进行关键词筛选推荐,而非基于假设或抽样数据。这样能够更准确地捕捉用户的兴趣和需求,使得推荐的关键词更具针对性和实效性。
由于大数据分析具有较高的处理速度和实时性,这种方法能够在用户搜索行为发生变化时及时作出调整,保持关键词推荐的时效性和适应性;通过对用户的搜索行为进行分析,可以更好地了解用户的需求和偏好,从而让用户感到自己的意见被重视,增加用户对推荐***的信任感和使用意愿;该方法可以广泛应用于搜索引擎、电子商务平台等领域,为用户提供更精准的关键词推荐,从而提升广告投放效果、搜索结果精准度,对商业运营具有积极的促进作用。
具体实施方式
下面结合具体实施例对本发明作进一步说明,以使本领域技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例
一种基于大数据的关键词筛选推荐的方法,包括:
通过大数据获取用户群体的第一搜索行为和关联搜索行为;
按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合;
基于形成的关键词集合进行关键词的筛选推荐。
数据采集和处理:收集用户的搜索行为数据,包括用户的第一搜索行为和关联搜索行为,并对这些数据进行整合和清洗。
用户群体分类:根据用户的年龄段对搜索行为数据进行分类,使用统计分析方法来对用户进行年龄段分类。
关键词集合提取:对每个年龄段的用户群体,提取其第一搜索行为和关联搜索行为中的连续关键词和结束关键词,形成相应的关键词集合。
该第一搜索行为包括用户在进行信息检索时首次输入的搜索关键词或搜索短语;该关联搜索行为包括用户在进行第一搜索行为后继续输入的与首次输入的搜索关键词或搜索短语存在关联的搜索关键词或搜索短语。
基于分词技术,将搜索短语提取为搜索关键词,对于中文搜索短语,可以使用中文分词技术将其分解成单个词语,对于英文搜索短语,可以使用空格或标点符号进行分词,通过上述方式将搜索关键词或搜索短语统一变为关键词来进行提取。
按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类的方法为:
根据用户注册信息、历史行为数据或其他可靠数据源,将用户按照年龄段进行分类,包括12-17岁的青少年、18-35岁的青年、36-55岁的中年和55岁以上的老年;
将第一搜索行为和关联搜索行为与其对应分类的年龄段进行关联。
不同年龄段的用户有不同的兴趣和需求,通过对用户进行年龄段分类,可以更准确地了解用户的偏好和兴趣,从而为其提供个性化的关键词推荐服务,通过对用户进行年龄段分类,可以根据不同年龄段的用户特点,针对性地推荐适合他们的关键词。这能够提高用户的搜索效率,减少无关或不感兴趣的搜索结果的干扰,提升用户的搜索体验。
该连续关键词为最后一次关联搜索行为之前出现的所有关键词或搜索短语,若仅存在第一搜索行为,则连续关键词为0,该结束关键词为最后一次关联搜索行为时出现的关键词或搜索短语,若仅存在第一搜索行为,则结束关键词则为第一搜索行为中出现的关键词或搜索短语。
在该方案中,所提及的结束关键词为最后一次关联搜索行为时出现的关键词或搜索短语,也即是用户终止搜索行为时出现的关键词或搜索短语,其包括了用户输入在搜索栏中的关键词或搜索短语,以及用户点入搜索页面时出现的关键词或搜索短语,这种结束关键词一般代表用户已经通过搜索行为确定了搜索结果。
而将连续关键词和结束关键词与用户的搜索行为紧密联系起来,可以更准确地描述用户的搜索行为,把握用户需求和偏好。这有助于提高搜索引擎的推荐效果和搜索结果的精准性。
按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合的方法为:
将每一用户的连续关键词和结束关键词中出现的关键词组合为一下层关键词集合;
将存在年龄段相同用户的各个下层关键词集合合并为一中层关键词集合;
每存在一结束关键词相同的中层关键词集合合并为一上层关键词集合。
通过将每个用户的连续关键词和结束关键词中出现的关键词组合成下层关键词集合,可以对用户搜索行为进行数据整合和归纳。这有助于清晰地了解用户的搜索偏好和需求,并能够更好地为用户提供个性化的搜索结果和推荐服务。
将存在年龄段相同用户的下层关键词集合合并为中层关键词集合,可以进行用户群体分析。通过分析不同用户群体的搜索行为,可以发现他们的共同兴趣、需求和偏好,为不同用户群体提供定制化的搜索服务和推荐内容。
每当存在一致的结束关键词的中层关键词集合合并为上层关键词集合,可以更好地理解用户的意图和需求。这有助于优化搜索算法,提高搜索结果的相关性和准确性,使用户能够更快捷地找到符合其需求的信息。
这种层级分类的方法具有良好的可扩展性和可应用性。可以根据需要不断添加新的层级,将更多的搜索行为特征纳入考虑。同时,这种分类方法也可以应用于其他领域的数据分析和挖掘,提供更深入的洞察和决策支持。
基于形成的关键词集合进行关键词的筛选推荐的方法为:
根据用户输入的关键词索引匹配对应年龄段的上层关键词集合;
若匹配一个以上的、对应年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个对应年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到对应年龄段的上层关键词集合,则索引匹配其他相邻年龄段的上层关键词集合;
若匹配一个以上的、其他相邻年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个其他相邻年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到其他相邻年龄段的上层关键词集合,则索引匹配全年龄段的上层关键词集合;
若匹配一个以上的、全年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个全年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到全年龄段的上层关键词集合,则根据算关键词之间的相关度来进行关联性分析,并选择关联性最高的上层关键词集合,并根据结束关键词的词频进行排序推荐或直接以该上层关键词集合得的结束关键词进行推荐。
其中,结束关键词的词频计算方法为:包含该结束关键词的中层关键词集合数/中层关键词集合的总数。
通过匹配用户输入的关键词索引对应年龄段的上层关键词集合,可以针对不同年龄段用户的需求进行个性化推荐。同时,根据结束关键词的词频进行排序推荐,能够更好地反映用户的搜索偏好和需求。
当未匹配到对应年龄段的上层关键词集合时,可以索引匹配其他相邻年龄段或全年龄段的上层关键词集合。这种跨年龄段推荐能够为用户提供更多的选项和可能性,更好地满足用户需求。
通过算关键词之间的相关度来进行关联性分析,并选择关联性最高的上层关键词集合进行推荐,能够提供更加精准的搜索结果和推荐内容,帮助用户更快速地找到所需信息。
通过根据用户输入的关键词索引匹配对应年龄段的上层关键词集合,并根据结束关键词的词频进行排序推荐或直接以该上层关键词集合得的结束关键词进行推荐,可以提高用户搜索的效率和准确性,从而提高用户的使用体验。
例如根据记录的数据,共5名用户进行了搜索行为,留下以下记录。
26岁{杯子、茶杯、喝水杯、咖啡杯}、23岁{杯子、茶杯、喝水杯、马克杯}、24岁{泡咖啡、杯子、咖啡杯}、46岁{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}、47岁{杯子、茶杯、茶杯过滤、茶杯过滤嘴}。
则下层关键词集合为[{杯子、茶杯、喝水杯、咖啡杯}{杯子、喝水杯、马克杯}{泡咖啡、杯子、咖啡杯}{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}{杯子、茶杯、茶杯过滤、茶杯过滤嘴}];
而中层关键词集合分别为[{杯子、茶杯、喝水杯、咖啡杯}{杯子、茶杯、喝水杯、马克杯}{泡咖啡、杯子、咖啡杯}]和[{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}{杯子、茶杯、茶杯过滤、磁弹泡茶杯}];
上层关键词集合分别为[{杯子、茶杯、喝水杯、咖啡杯}{泡咖啡、杯子、咖啡杯}]、[{杯子、茶杯、喝水杯、马克杯}]和[{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}{杯子、茶杯、茶杯过滤、磁弹泡茶杯}]。
当标记为青年的用户搜索“茶杯”时,则根据匹配的上层关键词集合为[{杯子、茶杯、喝水杯、咖啡杯}{泡咖啡、杯子、咖啡杯}]和[{杯子、茶杯、喝水杯、马克杯}],其中咖啡杯的词频高于马克杯,因此关键词推荐顺序为“咖啡杯、马克杯”,而当标记为青年的用户搜索“茶杯过滤”时,由于未在同年龄段搜索到对应的上层关键词集合,因此扩展到中年的年龄段搜索对应的上层关键词集合,根据匹配的上层关键词集合为[{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}{杯子、茶杯、茶杯过滤、磁弹泡茶杯}],因此关键词推荐为“磁弹泡茶杯”,而标记为中年的用户搜索“杯子”时,则根据匹配的上层关键词集合为[{杯子、保温杯、茶杯过滤磁力、磁弹泡茶杯}{杯子、茶杯、茶杯过滤、磁弹泡茶杯}],因此关键词推荐为“磁弹泡茶杯”。
一种基于大数据的关键词筛选推荐的***,包括有:
数据采集与处理模块:用于从大数据源中获取用户的搜索行为和关联搜索行为数据,并对采集到的数据进行预处理和清洗,提取出有效的搜索关键词;
用户分类模块:根据年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
关键词提取模块:根据分类结果,提取用户群体的第一搜索行为和关联搜索行为中的连续关键词和结束关键词,形成关键词集合;
关键词筛选推荐模块:基于形成的关键词集合,进行关键词的筛选和推荐;
用户界面模块:用于与用户进行交互,展示推荐的关键词结果。
通过用户分类模块对用户群体进行分类,可以根据不同年龄段的用户搜索行为和关联搜索行为进行个性化的关键词推荐。这样可以更好地满足不同用户群体的需求,提高用户体验;通过数据采集与处理模块,***能够从大数据源中获取用户的搜索行为和关联搜索行为数据,并对数据进行预处理和清洗。这样***能够基于真实的用户行为数据进行决策和推荐,提高了决策的准确性和有效性。
关键词提取模块能够有效提取用户群体的第一搜索行为和关联搜索行为中的连续关键词和结束关键词,形成关键词集合。这有助于***实现精准的关键词推荐,提高搜索结果的相关性和准确性;用户界面模块能够与用户进行交互,展示推荐的关键词结果。通过友好的用户界面,用户可以更直观地了解到推荐的关键词,从而更快速地找到所需信息;:由于***基于大数据源,可以实时地获取最新的用户搜索行为数据,并根据最新数据进行关键词的筛选和推荐。这样可以保证***推荐的关键词具有时效性和最新性。
本实施例还提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
本实施例还提供一种计算机存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将***的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
本发明的上述实施例并不是对本发明保护范围的限定,本发明的实施方式不限于此,凡此种种根据本发明的上述内容,按照本领域的普通技术知识和惯用手段,在不脱离本发明上述基本技术思想前提下,对本发明上述结构做出的其它多种形式的修改、替换或变更,均应落在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的关键词筛选推荐的方法,其特征在于,包括:
通过大数据获取用户群体的第一搜索行为和关联搜索行为;
按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合;
基于形成的关键词集合进行关键词的筛选推荐。
2.根据权利要求1所述的基于大数据的关键词筛选推荐的方法,其特征在于,该第一搜索行为包括用户在进行信息检索时首次输入的搜索关键词或搜索短语;该关联搜索行为包括用户在进行第一搜索行为后继续输入的与首次输入的搜索关键词或搜索短语存在关联的搜索关键词或搜索短语。
3.根据权利要求1或2所述的基于大数据的关键词筛选推荐的方法,其特征在于,按照年龄段对用户群体的第一搜索行为和关联搜索行为进行分类的方法为:
根据用户注册信息、历史行为数据或其他可靠数据源,将用户按照年龄段进行分类,包括12-17岁的青少年、18-35岁的青年、36-55岁的中年和55岁以上的老年;
将第一搜索行为和关联搜索行为与其对应分类的年龄段进行关联。
4.根据权利要求3所述的基于大数据的关键词筛选推荐的方法,其特征在于,该连续关键词为最后一次关联搜索行为之前出现的所有关键词或搜索短语,若仅存在第一搜索行为,则连续关键词为0,该结束关键词为最后一次关联搜索行为时出现的关键词或搜索短语,若仅存在第一搜索行为,则结束关键词则为第一搜索行为中出现的关键词或搜索短语。
5.根据权利要求4所述的基于大数据的关键词筛选推荐的方法,其特征在于,按照分类结果提取第一搜索行为和关联搜索行为中的连续关键词和结束关键词形成关键词集合的方法为:
将每一用户的连续关键词和结束关键词中出现的关键词组合为一下层关键词集合;
将存在年龄段相同用户的各个下层关键词集合合并为一中层关键词集合;
每存在一结束关键词相同的中层关键词集合合并为一上层关键词集合。
6.根据权利要求5所述的基于大数据的关键词筛选推荐的方法,其特征在于,基于形成的关键词集合进行关键词的筛选推荐的方法为:
根据用户输入的关键词索引匹配对应年龄段的上层关键词集合;
若匹配一个以上的、对应年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个对应年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到对应年龄段的上层关键词集合,则索引匹配其他相邻年龄段的上层关键词集合;
若匹配一个以上的、其他相邻年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个其他相邻年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到其他相邻年龄段的上层关键词集合,则索引匹配全年龄段的上层关键词集合;
若匹配一个以上的、全年龄段的上层关键词集合,则根据结束关键词的词频进行排序推荐;
若匹配一个全年龄段的上层关键词集合,则直接以该上层关键词集合得的结束关键词进行推荐;
若未匹配到全年龄段的上层关键词集合,则根据算关键词之间的相关度来进行关联性分析,并选择关联性最高的上层关键词集合,并根据结束关键词的词频进行排序推荐或直接以该上层关键词集合得的结束关键词进行推荐。
7.根据权利要求6所述的基于大数据的关键词筛选推荐的方法,其特征在于,结束关键词的词频计算方法为:包含该结束关键词的中层关键词集合数/中层关键词集合的总数。
8.一种基于大数据的关键词筛选推荐的***,其特征在于,包括有:
数据采集与处理模块:用于从大数据源中获取用户的搜索行为和关联搜索行为数据,并对采集到的数据进行预处理和清洗,提取出有效的搜索关键词;
用户分类模块:根据年龄段对用户群体的第一搜索行为和关联搜索行为进行分类;
关键词提取模块:根据分类结果,提取用户群体的第一搜索行为和关联搜索行为中的连续关键词和结束关键词,形成关键词集合;
关键词筛选推荐模块:基于形成的关键词集合,进行关键词的筛选和推荐;
用户界面模块:用于与用户进行交互,展示推荐的关键词结果。
9.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于大数据的关键词筛选推荐的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311752161.1A CN117688243B (zh) | 2023-12-19 | 2023-12-19 | 一种基于大数据的关键词筛选推荐的方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311752161.1A CN117688243B (zh) | 2023-12-19 | 2023-12-19 | 一种基于大数据的关键词筛选推荐的方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117688243A true CN117688243A (zh) | 2024-03-12 |
CN117688243B CN117688243B (zh) | 2024-06-18 |
Family
ID=90133337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311752161.1A Active CN117688243B (zh) | 2023-12-19 | 2023-12-19 | 一种基于大数据的关键词筛选推荐的方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117688243B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598607A (zh) * | 2015-01-29 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 推荐搜索短语的方法及*** |
CN104933100A (zh) * | 2015-05-28 | 2015-09-23 | 北京奇艺世纪科技有限公司 | 关键词推荐方法和装置 |
CN109190049A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 关键词推荐方法、***、电子设备和计算机可读介质 |
CN109634991A (zh) * | 2018-12-12 | 2019-04-16 | 安徽讯呼信息科技有限公司 | 一种基于大数据的搜索方法 |
CN109871483A (zh) * | 2019-01-22 | 2019-06-11 | 珠海天燕科技有限公司 | 一种推荐信息的确定方法及装置 |
CN111639255A (zh) * | 2019-03-01 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 搜索关键词的推荐方法、装置、存储介质及电子设备 |
CN114265981A (zh) * | 2021-12-22 | 2022-04-01 | 北京字节跳动网络技术有限公司 | 推荐词确定方法、装置、设备及存储介质 |
CN114417221A (zh) * | 2022-01-24 | 2022-04-29 | 周丽萍 | 一种基于互联网的大数据运算***及其实施方法 |
KR102552849B1 (ko) * | 2022-07-27 | 2023-07-10 | (주)유밥 | 콘텐츠 추천 장치 및 방법 |
-
2023
- 2023-12-19 CN CN202311752161.1A patent/CN117688243B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598607A (zh) * | 2015-01-29 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 推荐搜索短语的方法及*** |
CN104933100A (zh) * | 2015-05-28 | 2015-09-23 | 北京奇艺世纪科技有限公司 | 关键词推荐方法和装置 |
CN109190049A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 关键词推荐方法、***、电子设备和计算机可读介质 |
CN109634991A (zh) * | 2018-12-12 | 2019-04-16 | 安徽讯呼信息科技有限公司 | 一种基于大数据的搜索方法 |
CN109871483A (zh) * | 2019-01-22 | 2019-06-11 | 珠海天燕科技有限公司 | 一种推荐信息的确定方法及装置 |
CN111639255A (zh) * | 2019-03-01 | 2020-09-08 | 北京字节跳动网络技术有限公司 | 搜索关键词的推荐方法、装置、存储介质及电子设备 |
CN114265981A (zh) * | 2021-12-22 | 2022-04-01 | 北京字节跳动网络技术有限公司 | 推荐词确定方法、装置、设备及存储介质 |
CN114417221A (zh) * | 2022-01-24 | 2022-04-29 | 周丽萍 | 一种基于互联网的大数据运算***及其实施方法 |
KR102552849B1 (ko) * | 2022-07-27 | 2023-07-10 | (주)유밥 | 콘텐츠 추천 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN117688243B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Athey et al. | The impact of aggregators on internet news consumption | |
US10366119B2 (en) | Customized content stream utilizing dwelltime-based machine learning | |
US8868570B1 (en) | Selection and display of online content items | |
CN110019943B (zh) | 视频推荐方法、装置、电子设备和存储介质 | |
CA2940843C (en) | Method and system for targeted advertising based on topical memes | |
US20140067535A1 (en) | Concept-level User Intent Profile Extraction and Applications | |
CN106383887A (zh) | 一种环保新闻数据采集和推荐展示的方法及*** | |
CN105426514A (zh) | 个性化的移动应用app推荐方法 | |
CN104462336A (zh) | 信息推送方法和装置 | |
Chiny et al. | Netflix recommendation system based on TF-IDF and cosine similarity algorithms | |
CN105338408B (zh) | 基于时间因子的视频推荐方法 | |
CN109241451A (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
US20200327600A1 (en) | Method and system for providing product recommendation to a user | |
CN110910207A (zh) | 一种提升商品推荐多样性的方法及*** | |
Menk et al. | Recommendation systems for tourism based on social networks: A survey | |
CN111651670A (zh) | 基于用户行为图谱的内容检索方法、装置终端和存储介质 | |
CN112784141A (zh) | 搜索结果质量确定方法、装置、存储介质和计算机设备 | |
CN112989824A (zh) | 信息推送方法及装置、电子设备及存储介质 | |
CN111914079A (zh) | 一种基于用户标签的话题推荐方法及*** | |
JP5548900B2 (ja) | 複数の属性を利用したWebページ推薦方法 | |
Ashraf et al. | Personalized news recommendation based on multi-agent framework using social media preferences | |
CN114201680A (zh) | 一种向用户推荐营销产品内容的方法 | |
CN117688243B (zh) | 一种基于大数据的关键词筛选推荐的方法及*** | |
KR100901782B1 (ko) | 마케팅 정보 생성 방법 및 시스템 | |
CN110334294B (zh) | 网址导航方法、装置、计算机可读存储介质和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |