CN111737562A - 内容化页面的创建、推荐方法、***、电子设备及介质 - Google Patents
内容化页面的创建、推荐方法、***、电子设备及介质 Download PDFInfo
- Publication number
- CN111737562A CN111737562A CN201910553352.2A CN201910553352A CN111737562A CN 111737562 A CN111737562 A CN 111737562A CN 201910553352 A CN201910553352 A CN 201910553352A CN 111737562 A CN111737562 A CN 111737562A
- Authority
- CN
- China
- Prior art keywords
- words
- page
- content
- search
- materials
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000000463 material Substances 0.000 claims abstract description 147
- 230000006399 behavior Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 21
- 235000015278 beef Nutrition 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000003542 behavioural effect Effects 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 235000013409 condiments Nutrition 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种内容化页面的创建、推荐方法、***、电子设备及存储介质。其中,创建方法包括:设置描述物品的一级检索词;根据一级检索词检索素材库,得到关联素材;根据关联素材中词汇出现的频次选择多个词汇作为二级检索词;将一级检索词与不同二级检索词分别进行组合,形成多个检索条件;分别根据每一检索条件检索素材库,得到不同二级检索词对应的内容素材;建立表征一级检索词并链接至内容化页面的接口,其中,内容化页面包括检索到的多个内容素材。本发明创建了由描述物品的素材构成的内容化页面,较之简单的物品,内容丰富,种类繁多,能够应用于千人千面中,以吸引用户更长时间地停留在互联网站中。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种内容化页面的创建、推荐方法、***、电子设备及介质。
背景技术
用户基于互联网站进行物品购买时,往往通过搜索关键词的方式直接访问目标物品,而不是按照物品类目一级一级地进入到物品详情页面,从而,尽管互联网站数据库中存在大量的物品、类目信息等,用户购买了目标物品之后往往会立刻离开该互联网站,而不会继续浏览互联网站中的其他物品、类目的内容,故而,用户在互联网站上的停留时间较短,换言之,该互联网站对于用户的吸引力不足。
发明内容
本发明的实施例要解决的技术问题是为了克服现有技术中互联网站对于用户的吸引力不足的缺陷,提供一种内容化页面的创建、推荐方法、***、电子设备及介质。
本发明的实施例是通过下述技术方案来解决上述技术问题:
一种内容化页面的创建方法,其特点在于,所述创建方法包括:
设置描述物品的一级检索词;
根据所述一级检索词检索素材库,得到关联素材,其中,所述素材库包括多个描述物品的素材;
根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词;
将所述一级检索词与不同二级检索词分别进行组合,形成多个检索条件;
分别根据每一检索条件检索所述素材库,得到不同二级检索词对应的内容素材;
建立表征所述一级检索词并且链接至所述内容化页面的接口,所述内容化页面包括检索到的多个内容素材。
较佳地,所述根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词的步骤包括:
对于每一词汇,计算所述词汇在所有关联素材中出现的第一频次;
对于每一词汇,计算所述词汇在所有关联素材中的TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文档频率,TF-IDF与词汇在单个关联素材中的出现频次成正比,与其在所有关联素材中的出现频次成反比)频次;
对于每一词汇,根据所述词汇的第一频次和TF-IDF频次计算所述词汇的综合频次;
从所述关联素材中选择多个综合频次较高的词汇作为二级检索词。
较佳地,在所述根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词的步骤之后,所述创建方法还包括:
分别计算每一二级检索词与所述一级检索词的相似度得分;
删除多个相似度得分较低的二级检索词。
较佳地,所述素材的类型包括物品、文章、图片、视频、音频中的至少一种。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现上述任一种内容化页面的创建方法。
一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现上述任一种内容化页面的创建方法的步骤。
一种内容化页面的推荐方法,其特点在于,所述推荐方法包括:
获取用户的行为数据;
查找与所述行为数据匹配度最高的一级检索词;
基于所述一级检索词,根据上述任一种内容化页面的创建方法建立表征所述一级检索词并链接至内容化页面的接口;
在所述用户的应用界面显示所述接口。
较佳地,所述行为数据包括用户画像和/或实时行为数据。
较佳地,在所述接口链接至的内容化页面中,多个内容素材按照与所述行为数据匹配度由高到低的顺序排列。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现上述任一种内容化页面的推荐方法。
一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现上述任一种内容化页面的推荐方法的步骤。
一种内容化页面的创建***,其特点在于,所述创建***包括:
一级检索词设置模块,用于设置描述物品的一级检索词;
关联素材获取模块,用于根据所述一级检索词检索素材库,得到关联素材,其中,所述素材库包括多个描述物品的素材;
二级检索词选择模块,用于根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词;
检索条件组合模块,用于将所述一级检索词与不同二级检索词分别进行组合,形成多个检索条件;
内容素材获取模块,用于分别根据每一检索条件检索所述素材库,得到不同二级检索词对应的内容素材;
创建模块,用于建立表征所述一级检索词并且链接至所述内容化页面的接口,所述内容化页面包括检索到的多个内容素材。
较佳地,所述二级检索词选择模块包括:
第一频次计算单元,对于每一词汇,用于计算所述词汇在所有关联素材中出现的第一频次;
第二频次计算单元,对于每一词汇,用于计算所述词汇在所有关联素材中的TF-IDF频次;
综合频次计算单元,对于每一词汇,用于根据所述词汇的第一频次和TF-IDF频次计算所述词汇的综合频次;
二级检索词选择单元,用于从所述关联素材中选择多个综合频次较高的词汇作为二级检索词。
较佳地,所述创建***还包括:
相似度计算模块,用于分别计算每一二级检索词与所述一级检索词的相似度得分;
二级检索词删除模块,用于删除多个相似度得分较低的二级检索词。
较佳地,所述素材的类型包括物品、文章、图片、视频、音频中的至少一种。
一种内容化页面的推荐***,其特点在于,所述推荐***包括行为数据获取模块、一级检索词查找模块、接口显示模块以及上述任一种内容化页面的创建***;
所述行为数据获取模块用于获取用户的行为数据;
所述一级检索词查找模块用于查找与所述行为数据匹配度最高的一级检索词;
所述内容化页面的创建***用于基于所述一级检索词,建立表征所述一级检索词并链接至内容化页面的接口;
所述接口显示模块用于在所述用户的应用界面显示所述接口。
较佳地,所述行为数据包括用户画像和/或实时行为数据。
较佳地,在所述接口链接至的内容化页面中,多个内容素材按照与所述行为数据匹配度由高到低的顺序排列。
本发明的实施例的积极进步效果在于:本发明的实施例创建了由描述物品的素材构成的内容化页面,较之简单的物品,内容丰富,种类繁多,能够应用于千人千面中,以吸引用户更长时间地停留在互联网站中。
附图说明
图1为根据本发明实施例1的内容化页面的创建方法的流程图。
图2为根据本发明实施例2的电子设备的硬件结构示意图。
图3为根据本发明实施例4的内容化页面的推荐方法的流程图。
图4为根据本发明实施例7的内容化页面的创建***的模块示意图。
图5为根据本发明实施例8的内容化页面的推荐***的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种内容化页面的创建方法,图1示出了本实施例的流程图。参照图1,本实施例的创建方法包括:
S101、设置描述物品的一级检索词;
S102、根据一级检索词检索素材库,得到关联素材;
S103、根据关联素材中词汇出现的频次选择多个词汇作为二级检索词;
S104、分别计算每一二级检索词与一级检索词的相似度得分;
S105、删除多个相似度得分较低的二级检索词;
S106、将一级检索词与不同二级检索词分别进行组合,形成多个检索条件;
S107、分别根据每一检索条件检索素材库,得到不同二级检索词对应的内容素材;
S108、建立表征一级检索词并且链接至内容化页面的接口。
具体地,在步骤S101中设置描述物品的一级检索词,该一级检索词既可以单个词汇,例如,“火锅”、“连衣裙”、“时尚”、“保暖”等,也可以由多个词汇组合而成,例如,“潮汕火锅”,“复古连衣裙”,“嘻哈宽松”,“潮流搭配”等。
当一级检索词是单个词汇时,以“火锅”为例,则在步骤S102中以“火锅”为检索条件在素材库中检索,其中,素材库包括多个描述物品的素材,并且素材的类型包括但不限于物品、文章、图片、视频、音频,此外,对于视频、音频等多媒体素材,可以仅对其文本内容,例如,标题、内容简介等,进行检索,以得到关联素材,例如,关联的物品可以包括:“电火锅”、“羊肉片”、“牛肉片”,关联的文章内容可以包括:“火锅必备食材”,关联的图片标题可以包括:“电火锅修理图”,关联的视频标题可以包括:“手把手教你制作火锅底料”,关联的音频标题可以包括:“火锅爽”。
在步骤S103中,从步骤S102中检索到的关联素材中选择多个出现频次高的词汇作为二级检索词。具体地,对于关联素材中的每一词汇,例如,“羊肉片”,计算其在所有关联素材中出现的第一频次,记作F1;计算其在所有关联素材中的TF-IDF频次,记作F2;根据第一频次F1和TF-IDF频次F2计算其综合频次F3,例如,可以为第一频次F1和TF-IDF频次设置不同权重;如此,计算关联素材中每一词汇的综合频次F3,再从关联素材中选择多个综合频次F3较高的词汇作为二级检索词。
又有,检索库内容繁多,即使可以在步骤S103中对二级检索词的选择数量进行自定义设置,也很容易带来许多与一级检索词偏离,甚至毫无关联的词汇,例如,用以修理电火锅的“螺丝刀”。为了对步骤S103中的二级检索词进行筛选,在步骤S104中,分别计算步骤S103中得到的每一二级检索词与一级检索词的相似度得分,具体地,可以将二级检索词和一级检索词分别使用Word2Vec(用来产生词向量的模型)转换成向量格式,再就转换后的向量进行相似度得分的计算。
在步骤S105中,对步骤S103中得到的二级检索词进行了筛选,也即,从中删除了多个步骤S104中计算得到的相似度得分较低的二级检索词,诸如,“螺丝刀”,使得保留下来的二级检索词(诸如,“羊肉片”)与一级检索词“火锅”相关联。
在步骤S106中,例如,步骤S105保留下来的二级检索词包括“羊肉片”、“牛肉片”,则一级检索词与不同二级检索词分别进行组合所形成的检索条件包括:“火锅,羊肉片”、“火锅,牛肉片”。
在步骤S107中,根据步骤S106中得到的每一检索条件再次检索素材库,得到不同二级检索词对应的内容素材,例如,内容素材可以是既包括“火锅”又包括“羊肉片”的素材,也可以是既包括“火锅”又包括“牛肉片”的素材。
在步骤S108中,根据步骤S101设置的一级检索词以及步骤S107中检索得到的内容素材建立内容化页面,具体地,创建表征步骤S101设置的一级检索词并且链接至包括步骤S107中检索得到的内容素材的内容化页面的接口。例如,接口可以表征火锅的图片作为封面图像,点击该接口之后,链接到的内容化页面中,包括步骤S107中检索到的涵盖物品、文章、图片、视频、音频等的内容素材。
当一级检索词由多个词汇组合而成时,以“潮汕火锅”为例,则步骤S102还包括对一级检索词进行分词的步骤,具体地,可以利用IK算法(一种分词算法)或者IK-MAX算法(一种根据最大长度优先准则进行分词的算法)对“潮汕火锅”进行分词,假设分词后得到一级检索分词“潮汕”、“火锅”。之后,以“潮汕”、“火锅”为检索条件在素材库中检索,得到关联素材。
在步骤S103中,同样地,从步骤S102中检索到的关联素材中选择多个出现频次高的词汇作为二级检索词。在步骤S104中,计算二级检索词与一级检索词的相似度得分时,可以首先计算二级检索词与各一级检索分词的相似度子得分,再根据该二级检索词的相似度子得分计算二级检索词和一级检索词的相似度得分。例如,对于二级检索词“羊肉片”,先计算“羊肉片”和“潮汕”的相似度子得分Score1,“羊肉片”和“火锅”的相似度子得分Score2,再根据Score1和Score2(可以为Score1和Score2设置不同权重)计算“羊肉片”和“潮汕火锅”的相似度得分Score。
在步骤S105中,删除相似度得分较低的二级检索词。在步骤S106中,对于二级检索词“羊肉片”、“牛肉片”,则一级检索词与不同二级检索词分别进行组合所形成的检索条件包括:“潮汕,火锅,羊肉片”、“潮汕,火锅,牛肉片”。
在步骤S107中,根据步骤S106中得到的每一检索条件再次检索素材库,得到不同二级检索词对应的内容素材。在步骤S108中,根据步骤S101设置的一级检索词以及步骤S107中检索得到的内容素材建立内容化页面。
在本实施例中,实现了内容化页面的创建,并且是由描述物品的素材所构成的内容化页面,较之简单的物品,内容更加丰富,种类更加繁多,能够应用于千人千面中,以吸引用户更长时间地停留在互联网站中。
实施例2
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1提供的内容化页面的创建方法。
图2示出了本实施例的硬件结构示意图,如图2所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同***组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的内容化页面的创建方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)***、磁带驱动器以及数据备份存储***等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例3
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1提供的内容化页面的创建方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1中的内容化页面的创建方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
实施例4
在实施例1的基础上,本实施例提供一种内容化页面的推荐方法,图3示出了本实施例的流程图。参照图3,本实施例的推荐方法包括:
S201、获取用户的行为数据;
S202、查找与行为数据匹配度最高的一级检索词;
S203、基于一级检索词,建立表征一级检索词并链接至内容化页面的接口;
S204、在用户的应用界面显示接口。
在本实施例中,为了实现内容化页面的推荐,首先在步骤S201中获取用户的行为数据,其中,行为数据可以包括但不限于用户画像、实时行为数据等表征用户特征(例如,性别、年龄)、历史行为特征(例如,历史订单、浏览记录)、实时行为特征(实时搜索词、实时点击数据)的数据。
在步骤S202中查找实施例1中设置的,且与步骤S201中获取的行为数据匹配度最高的一级检索词。在步骤S203中,则基于步骤S202中确定的一级检索词以及实施例1中的内容化页面的创建方法,建立表征步骤S202中确定的一级检索词且链接至内容化页面的接口,并在步骤S204中显示在用户的应用界面,从而,用户可以通过点击该接口,以浏览该接口链接至的内容化页面所包括的内容素材。其中,为了进一步契合用户的喜好,内容化页面中的多个内容素材可以按照与行为数据匹配度由高到低的顺序排列。
在实施例1的基础上,本实施例实现了内容化页面在千人千面中的推荐应用,不同用户可以在应用界面上浏览到契合各自喜好的内容化页面,从而可以更长时间的停留在互联网站中,浏览其感兴趣的素材内容。
实施例5
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例4提供的内容化页面的推荐方法。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例4提供的内容化页面的推荐方法的步骤。
实施例7
本实施例提供一种内容化页面的创建***,图4示出了本实施例的模块示意图。参照图4,本实施例的创建***1包括:
一级检索词设置模块11,用于设置描述物品的一级检索词。其中,一级检索词既可以单个词汇,例如,“火锅”、“连衣裙”、“时尚”、“保暖”等,也可以由多个词汇组合而成,例如,“潮汕火锅”,“复古连衣裙”,“嘻哈宽松”,“潮流搭配”等。
关联素材获取模块12,用于根据一级检索词检索素材库,得到关联素材。当一级检索词是单个词汇时,以“火锅”为例,则以“火锅”为检索条件在素材库中检索,其中,素材库包括多个描述物品的素材,并且素材的类型包括但不限于物品、文章、图片、视频、音频,此外,对于视频、音频等多媒体素材,可以仅对其文本内容,例如,标题、内容简介等,进行检索,以得到关联素材,例如,关联的物品可以包括:“电火锅”、“羊肉片”、“牛肉片”,关联的文章内容可以包括:“火锅必备食材”,关联的图片标题可以包括:“电火锅修理图”,关联的视频标题可以包括:“手把手教你制作火锅底料”,关联的音频标题可以包括:“火锅爽”。
二级检索词选择模块13,用于根据关联素材中词汇出现的频次选择多个词汇作为二级检索词。具体地,参见图4,二级检索词选择模块13包括第一频次计算单元131、第二频次计算单元132、综合频次计算单元133、二级检索词选择单元134。对于关联素材中的每一词汇,例如,“羊肉片”,第一频次计算单元131计算其在所有关联素材中出现的第一频次,记作F1;第二频次计算单元132计算其在所有关联素材中的TF-IDF(Term Frequency–InverseDocument Frequency,词频-逆文档频率,TF-IDF与词汇在单个关联素材中的出现频次成正比,与其在所有关联素材中的出现频次成反比)频次,记作F2;综合频次计算单元133根据第一频次F1和TF-IDF频次F2计算其综合频次F3,例如,可以为第一频次F1和TF-IDF频次设置不同权重;如此,计算关联素材中每一词汇的综合频次F3,二级检索词选择单元134再从关联素材中选择多个综合频次F3较高的词汇作为二级检索词。
相似度计算模块14,用于分别计算每一二级检索词与一级检索词的相似度得分。由于检索库内容繁多,即使二级检索词选择模块13可以对二级检索词的选择数量进行自定义设置,也很容易带来许多与一级检索词偏离,甚至毫无关联的词汇,例如,用以修理电火锅的“螺丝刀”。为了对二级检索词选择模块13选择的二级检索词进行筛选,相似度计算模块14分别计算二级检索词选择模块13选择的每一二级检索词与一级检索词的相似度得分,具体地,可以将二级检索词和一级检索词分别使用Word2Vec(用来产生词向量的模型)转换成向量格式,再就转换后的向量进行相似度得分的计算。
二级检索词删除模块15,用于删除多个相似度得分较低的二级检索词。二级检索词删除模块15对二级检索词选择模块13选择的二级检索词进行了筛选,也即,从中删除了相似度计算模块14计算得到的相似度得分较低的二级检索词,诸如,“螺丝刀”,使得保留下来的二级检索词(诸如,“羊肉片”)与一级检索词“火锅”相关联。
检索条件组合模块16,用于将一级检索词与不同二级检索词分别进行组合,形成多个检索条件。例如,二级检索词删除模块15保留下来的二级检索词包括“羊肉片”、“牛肉片”,则一级检索词与不同二级检索词分别进行组合所形成的检索条件包括:“火锅,羊肉片”、“火锅,牛肉片”。
内容素材获取模块17,用于分别根据每一检索条件检索素材库,得到不同二级检索词对应的内容素材。根据检索条件组合模块16得到的每一检索条件再次检索素材库,得到不同二级检索词对应的内容素材,例如,内容素材可以是既包括“火锅”又包括“羊肉片”的素材,也可以是既包括“火锅”又包括“牛肉片”的素材。
创建模块18,用于建立表征一级检索词并且链接至内容化页面的接口,其中,该内容化页面包括检索到的多个内容素材。根据一级检索词设置模块11设置的一级检索词以及内容素材获取模块17检索得到的内容素材建立内容化页面,具体地,创建表征一级检索词设置模块11设置的一级检索词并且链接至包括内容素材获取模块17检索得到的内容素材的内容化页面的接口。例如,接口可以表征火锅的图片作为封面图像,点击该接口之后,链接到的内容化页面中,包括内容素材获取模块17检索到的涵盖物品、文章、图片、视频、音频等的内容素材。
当一级检索词由多个词汇组合而成时,以“潮汕火锅”为例,关联素材获取模块12还可以用于对一级检索词进行分词,具体地,可以利用IK算法(一种分词算法)或者IK-MAX算法(一种根据最大长度优先准则进行分词的算法)对“潮汕火锅”进行分词,假设分词后得到一级检索分词“潮汕”、“火锅”。之后,以“潮汕”、“火锅”为检索条件在素材库中检索,得到关联素材。
二级检索词选择模块13同样从关联素材获取模块12检索到的关联素材中选择多个出现频次高的词汇作为二级检索词。相似度计算模块14计算二级检索词与一级检索词的相似度得分时,可以首先计算二级检索词与各一级检索分词的相似度子得分,再根据该二级检索词的相似度子得分再计算二级检索词和一级检索词的相似度得分。例如,对于二级检索词“羊肉片”,先计算“羊肉片”和“潮汕”的相似度子得分Score1,“羊肉片”和“火锅”的相似度子得分Score2,再根据Score1和Score2(可以为Score1和Score2设置不同权重)计算“羊肉片”和“潮汕火锅”的相似度得分Score。
二级检索词删除模块15用于删除相似度得分较低的二级检索词。对于二级检索词“羊肉片”、“牛肉片”,检索条件组合模块16将一级检索词与不同二级检索词分别进行组合所形成的检索条件包括:“潮汕,火锅,羊肉片”、“潮汕,火锅,牛肉片”。
内容素材获取模块17根据检索条件组合模块16得到的每一检索条件再次检索素材库,得到不同二级检索词对应的内容素材。创建模块18根据一级检索词设置模块11设置的一级检索词以及内容素材获取模块17检索得到的内容素材建立内容化页面。
在本实施例中,实现了内容化页面的创建,并且是由描述物品的素材所构成的内容化页面,较之简单的物品,内容更加丰富,种类更加繁多,能够应用于千人千面中,以吸引用户更长时间地停留在互联网站中。
实施例8
在实施例7的基础上,本实施例提供一种内容化页面的推荐***,图5示出了本实施例的模块示意图。参照图5,本实施例的推荐***2包括:
行为数据获取模块21,用于获取用户的行为数据。在本实施例中,为了实现内容化页面的推荐,行为数据获取模块21获取用户的行为数据,其中,行为数据可以包括但不限于用户画像、实时行为数据等表征用户特征(例如,性别、年龄)、历史行为特征(例如,历史订单、浏览记录)、实时行为特征(实时搜索词、实时点击数据)的数据。
一级检索词查找模块22,用于查找与行为数据匹配度最高的一级检索词。具体地,一级检索词查找模块22用于查找实施例1中设置的,且与行为数据获取模块21获取的行为数据匹配度最高的一级检索词。
实施例1中的内容化页面的创建***1,用于基于一级检索词查找模块22查找到的一级检索词,建立表征一级检索词查找模块22查找到的一级检索词并链接至内容化页面的接口。
接口显示模块23,用于在用户的应用界面显示创建***1创建的接口,从而,用户可以通过点击该接口,以浏览该接口链接至的内容化页面所包括的内容素材。其中,为了进一步契合用户的喜好,内容化页面中的多个内容素材可以按照与行为数据匹配度由高到低的顺序排列。
在实施例7的基础上,本实施例实现了内容化页面在千人千面中的推荐应用,不同用户可以在应用界面上浏览到契合各自喜好的内容化页面,从而可以更长时间的停留在互联网站中,浏览其感兴趣的素材内容。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (12)
1.一种内容化页面的创建方法,其特征在于,所述创建方法包括:
设置描述物品的一级检索词;
根据所述一级检索词检索素材库,得到关联素材,其中,所述素材库包括多个描述物品的素材;
根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词;
将所述一级检索词与不同二级检索词分别进行组合,形成多个检索条件;
分别根据每一检索条件检索所述素材库,得到不同二级检索词对应的内容素材;
建立表征所述一级检索词并且链接至所述内容化页面的接口,所述内容化页面包括检索到的多个内容素材。
2.如权利要求1所述的内容化页面的创建方法,其特征在于,所述根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词的步骤包括:
对于每一词汇,计算所述词汇在所有关联素材中出现的第一频次;
对于每一词汇,计算所述词汇在所有关联素材中的TF-IDF频次;
对于每一词汇,根据所述词汇的第一频次和TF-IDF频次计算所述词汇的综合频次;
从所述关联素材中选择多个综合频次较高的词汇作为二级检索词。
3.如权利要求1或2所述的内容化页面的创建方法,其特征在于,在所述根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词的步骤之后,所述创建方法还包括:
分别计算每一二级检索词与所述一级检索词的相似度得分;
删除多个相似度得分较低的二级检索词。
4.如权利要求1所述的内容化页面的创建方法,其特征在于,所述素材的类型包括物品、文章、图片、视频、音频中的至少一种。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-4中任一项所述的内容化页面的创建方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的内容化页面的创建方法的步骤。
7.一种内容化页面的推荐方法,其特征在于,所述推荐方法包括:
获取用户的行为数据;
查找与所述行为数据匹配度最高的一级检索词;
基于所述一级检索词,根据权利要求1-4中任一项所述的内容化页面的创建方法建立表征所述一级检索词并链接至内容化页面的接口;
在所述用户的应用界面显示所述接口。
8.如权利要求7所述的内容化页面的推荐方法,其特征在于,所述行为数据包括用户画像和/或实时行为数据。
9.如权利要求7所述的内容化页面的推荐方法,其特征在于,在所述接口链接至的内容化页面中,多个内容素材按照与所述行为数据匹配度由高到低的顺序排列。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求7-9中任一项所述的内容化页面的推荐方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求7-9中任一项所述的内容化页面的推荐方法的步骤。
12.一种内容化页面的创建***,其特征在于,所述创建***包括:
一级检索词设置模块,用于设置描述物品的一级检索词;
关联素材获取模块,用于根据所述一级检索词检索素材库,得到关联素材,其中,所述素材库包括多个描述物品的素材;
二级检索词选择模块,用于根据所述关联素材中词汇出现的频次选择多个词汇作为二级检索词;
检索条件组合模块,用于将所述一级检索词与不同二级检索词分别进行组合,形成多个检索条件;
内容素材获取模块,用于分别根据每一检索条件检索所述素材库,得到不同二级检索词对应的内容素材;
创建模块,用于建立表征所述一级检索词并且链接至所述内容化页面的接口,所述内容化页面包括检索到的多个内容素材。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910553352.2A CN111737562A (zh) | 2019-06-25 | 2019-06-25 | 内容化页面的创建、推荐方法、***、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910553352.2A CN111737562A (zh) | 2019-06-25 | 2019-06-25 | 内容化页面的创建、推荐方法、***、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111737562A true CN111737562A (zh) | 2020-10-02 |
Family
ID=72646076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910553352.2A Pending CN111737562A (zh) | 2019-06-25 | 2019-06-25 | 内容化页面的创建、推荐方法、***、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111737562A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027207A (ja) * | 2006-07-21 | 2008-02-07 | Gunma Univ | 検索装置及び検索方法 |
CN103984740A (zh) * | 2014-05-23 | 2014-08-13 | 合一网络技术(北京)有限公司 | 基于组合标签的检索页显示的方法和*** |
CN105243065A (zh) * | 2014-06-24 | 2016-01-13 | 中兴通讯股份有限公司 | 一种素材信息输出方法和*** |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
CN105589967A (zh) * | 2015-12-23 | 2016-05-18 | 北京奇虎科技有限公司 | 多级相关新闻的查找方法及装置 |
CN108229990A (zh) * | 2016-12-14 | 2018-06-29 | 北京奇虎科技有限公司 | 一种广告标题生成方法、装置和设备 |
CN109190050A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 基于文章配图提供推荐词的方法、装置及电子设备 |
-
2019
- 2019-06-25 CN CN201910553352.2A patent/CN111737562A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008027207A (ja) * | 2006-07-21 | 2008-02-07 | Gunma Univ | 検索装置及び検索方法 |
CN103984740A (zh) * | 2014-05-23 | 2014-08-13 | 合一网络技术(北京)有限公司 | 基于组合标签的检索页显示的方法和*** |
CN105302810A (zh) * | 2014-06-12 | 2016-02-03 | 北京搜狗科技发展有限公司 | 一种信息搜索方法和装置 |
CN105243065A (zh) * | 2014-06-24 | 2016-01-13 | 中兴通讯股份有限公司 | 一种素材信息输出方法和*** |
CN105589967A (zh) * | 2015-12-23 | 2016-05-18 | 北京奇虎科技有限公司 | 多级相关新闻的查找方法及装置 |
CN108229990A (zh) * | 2016-12-14 | 2018-06-29 | 北京奇虎科技有限公司 | 一种广告标题生成方法、装置和设备 |
CN109190050A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 基于文章配图提供推荐词的方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10180979B2 (en) | System and method for generating suggestions by a search engine in response to search queries | |
US9348935B2 (en) | Systems and methods for augmenting a keyword of a web page with video content | |
KR101872547B1 (ko) | 엔티티와 연관된 액션 및 제공자의 제시 기법 | |
US7979462B2 (en) | Head-to-head comparisons | |
US9135350B2 (en) | Computer-generated sentiment-based knowledge base | |
US8484179B2 (en) | On-demand search result details | |
US20140317078A1 (en) | Method and system for retrieving information | |
US11080287B2 (en) | Methods, systems and techniques for ranking blended content retrieved from multiple disparate content sources | |
EP2945073A2 (en) | Method and apparatus for providing recommended information | |
CN109168047B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
US9594540B1 (en) | Techniques for providing item information by expanding item facets | |
US20120109945A1 (en) | Method and system of improving navigation within a set of electronic documents | |
JP2011227717A (ja) | 情報提示装置 | |
US20180060427A1 (en) | Navigating a Taxonomy Using Search Queries | |
CN105589852B (zh) | 一种信息推荐的方法和装置 | |
US20180025364A1 (en) | Information processing apparatus, information processing method, and program | |
CN113079417A (zh) | 生成弹幕的方法、装置、设备和存储介质 | |
CN111444405A (zh) | 用于搜索中的用户交互方法、装置、移动终端和存储介质 | |
WO2015025248A2 (en) | A system apparatus circuit method and associated computer executable code for hybrid content recommendation | |
JP6928044B2 (ja) | 提供装置、提供方法及び提供プログラム | |
WO2015101945A1 (en) | Generating a news timeline and recommended news editions | |
JP2017162212A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US8271875B2 (en) | Providing help information | |
US20150348098A1 (en) | Identifying A Product Placement Opportunity Within A Screenplay | |
US20160034958A1 (en) | Generating Advertisements For Search Results That Are Associated With Entities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |