CN114780844A - 基于用户习惯的小说推荐方法及*** - Google Patents

基于用户习惯的小说推荐方法及*** Download PDF

Info

Publication number
CN114780844A
CN114780844A CN202210427059.3A CN202210427059A CN114780844A CN 114780844 A CN114780844 A CN 114780844A CN 202210427059 A CN202210427059 A CN 202210427059A CN 114780844 A CN114780844 A CN 114780844A
Authority
CN
China
Prior art keywords
novel
word
module
result
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210427059.3A
Other languages
English (en)
Other versions
CN114780844B (zh
Inventor
吴鲲
李志烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yingxiong Network Technology Co ltd
Original Assignee
Hangzhou Yingxiong Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yingxiong Network Technology Co ltd filed Critical Hangzhou Yingxiong Network Technology Co ltd
Priority to CN202210427059.3A priority Critical patent/CN114780844B/zh
Publication of CN114780844A publication Critical patent/CN114780844A/zh
Application granted granted Critical
Publication of CN114780844B publication Critical patent/CN114780844B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户习惯的小说推荐方法,通过层层过滤、筛选,环环相扣,将数量庞大的小说库规模缩小为适宜在不同星期的不同阅读时段推荐给不同用户的第三小说集或第一小说集或第二小说集,且以小说类型、作者姓名、作者国籍、小说标题、历史阅读的小说文本内容、小说库中的小说摘要为过滤、筛选条件,筛选过程简单、计算复杂度低,同时确保了小说推荐的速度和推荐准确度。本发明还公开了一种基于用户习惯的小说推荐方法。

Description

基于用户习惯的小说推荐方法及***
技术领域
本发明涉及数据推送技术领域,具体涉及一种基于用户习惯的小说推荐方法及***。
背景技术
不同用户在不同时段阅读的小说风格、类型通常并不相同,比如男生倾向于在夜晚时段阅读悬疑类或者恐怖类的小说,而女生在夜晚时段更倾向于阅读言情类或文学类的小说。同个读者在一天内的不同时段阅读的小说类型通常也不一致,比如在上午时段可能更倾向于阅读悬疑类或推理类的小说,而在午休时段更倾向于阅读科幻类的小说,下午时段更倾向于阅读武侠类、武打类的小说,而夜晚时段则更倾向于阅读言情类或历史类的小说。因此在推荐小说时,首先要解决的是如何满足不同用户在不同时段对于不同风格、类型的小说的阅读需求。
第二,用户的小说阅读习惯并非是固定不变的,比如,有些用户习惯在周末甚至周末的某个固定时段阅读悬疑类或推理类小说,而在周一到周五则倾向于阅读非悬疑或非推理类的小说,或者更为细致地,上周的周一到周三阅读悬疑类小说,周四、周五阅读科幻类小说,周六、周日阅读文学类小说,而这周的周一到周三阅读科幻类小说,周四、周五阅读文学类小说,周六、周阅读悬疑类小说,甚至更为细致的,在周一到周五的每一日的A阅读时段阅读悬疑类小说,在B阅读时段阅读科幻类小说,在C阅读时段阅读武侠类小说,在D阅读时段阅读言情类小说等等。针对同个用户的阅读习惯非固定不变这种情况时,该如何有针对性的在不同的阅读时段为不同的用户推荐小说?
第三,网络上可推荐的小说数量非常庞大,如何从数量庞大的可推荐小说库中快速且较为精准的匹配出符合不同用户在不同星期不同时段的阅读兴趣的小说推荐给对应的用户成为小说推荐亟待解决的第三个技术问题。
发明内容
本发明以提高小说推荐针对性和及时性,满足不同用户在不同星期不同时段的小说推荐需求为目的,提供了一种基于用户习惯的小说推荐方法及***。
为达此目的,本发明采用以下技术方案:
提供一种基于用户习惯的小说推荐方法,包括步骤:
S1,获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户在每个历史阅读时段阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取待进行小说推荐的时间点所属的阅读时段;
S2,在关联所述用户的所述小说推荐过滤词库中进一步获取关联待进行小说推荐的所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
S3,将可推荐的所述小说库中的每篇小说的类型对应的类型词与关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S4;
若匹配失败,则转入步骤S4;
S4,将经步骤S3过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词与关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S5;
若匹配失败,则转入步骤S5;
S5,将经步骤S4过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词与关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S6;
若否,则转入步骤S6;
S6,对步骤S1获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并将经步骤S5过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
S7,计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
S8,对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接后,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
S9,对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个所述第二拼接结果分别对应的第二编码结果;
S10,计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(1)计算所述第一编码结果与每个所述第二编码结果的相似度frs
Figure BDA0003608838940000031
公式(1)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
S11,判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在待进行小说推荐的所述时间点待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
S12,判断所述第一小说集中的数据是否为空,
若是,则将步骤S5过滤剩余的所述小说库中的小说加入到第二小说集中,然后转入步骤S13;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说,然后转入步骤S13;
S13,对步骤S1获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容分别对应的第三分词结果,并对所述第一小说集中或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
S14,对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
S15,将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
S16,通过以下公式(2)计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab
Figure BDA0003608838940000032
公式(2)中,
Figure BDA0003608838940000033
表示所述第四句向量中的第b个词向量的转置;
va表示第三句向量中的第a个词向量;
S17,通过以下公式(3)计算所述第三句向量与所述第四句向量之间的相关性per′ab
Figure BDA0003608838940000041
公式(3)中,la、lb分别表示所述第三句向量和所述第四句向量中的词向量的数量;
S18,判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小说作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
S19,判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户。
作为优选,步骤S1中,构建并动态更新关联每个所述用户的所述小说推荐过滤词库的方法步骤包括:
S11,获取连续历史星期的每个历史星期wk中的每一天dl中的每个阅读时段qm内用户i的屏蔽小说数据集Si,Si中的每条屏蔽小说数据sx包括所屏蔽的小说标题、文本内容、小说类型、作者姓名、作者国籍以及加入屏蔽的时间,sx的数据构成通过如下表达式(4)表达:
Figure BDA0003608838940000042
表达式(4)中,
Figure BDA0003608838940000043
分别表示Si中的第x条数据sx中的小说标题、文本内容、小说类型、作者姓名、作者国籍以及加入屏蔽的时间;
wk表示第k个历史星期;
dl表示某个历史星期中的星期l;
qm表示某个历史星期l中的第m个阅读时段;
Figure BDA0003608838940000044
表示所记录的用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx
l=1,2,3,4,5,6,7;
S12,判断sx中的数据元素ej对应的数据
Figure BDA0003608838940000045
在历史每个星期的同个星期l的同个阅读时段qm内被屏蔽数量的总数SUM是否大于预设的第一数量阈值nv1
若是,则通过以下公式(5)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000046
所对应的类型词作为在当前星期l的同个阅读时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000051
公式(5)中,
Figure BDA0003608838940000052
表示ej对应的类型为y的数据
Figure BDA0003608838940000053
在历史星期wk中的星期l的阅读时段qm内被屏蔽的数量;
u表示数据
Figure BDA0003608838940000054
的第u个参数,n表示数据
Figure BDA0003608838940000055
的参数u的数量;
p表示连续历史星期wk的数量;
若否,则转入步骤S13;
S13,判断SUM是否大于预设的第二数量阈值nv2且小于等于所述第一数量阈值nv1
若是,则通过以下公式(6)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000056
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000057
若否,则转入步骤S14;
S14,判断SUM是否小于等于预设的所述第二数量阈值nv2
若是,则通过以下公式(7)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000058
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000059
公式(7)中,q表示划定的一天时间内的阅读时段的数量;
cl表示历史星期wk中的星期l在计算概率
Figure BDA00036088389400000510
时所占的权重;
ck表示历史星期wk在计算概率
Figure BDA00036088389400000511
时所占的权重;
Figure BDA0003608838940000061
Figure BDA0003608838940000062
步骤S15,判断所计算的概率
Figure BDA0003608838940000063
是否大于为类型为y的数据
Figure BDA0003608838940000064
所预设的概率阈值Pvy
若是,则将类型为y的数据
Figure BDA0003608838940000065
所对应的类型词作为待加入的过滤词;
若否,则不将类型为y的数据
Figure BDA0003608838940000066
所对应的类型词作为待加入的过滤词;
S16,轮询判断在当前时间将待加入的过滤词加入到所述小说推荐过滤词库内的关联对应阅读时段的过滤词集中后,所述过滤词集中的数据量是否大于对应设置的数据量阈值,
若是,则按照记录的过滤词加入时间的先后顺序将历史最先加入到对应的所述过滤词集中的第一过滤词删除后,将待加入的第二过滤词加入到关联所述阅读时段且对应类型为y的数据
Figure BDA0003608838940000067
的所述过滤词集中并记录加入时间;
若否,则直接将待加入的所述第二过滤词加入到关联对应阅读时段的所述过滤词集中并记录加入时间。
作为优选,p=4。
作为优选,q=4,q=1时表示阅读时段05:00-10:00;q=2时表示阅读时段处于10:00-14:00;q=3时表示阅读时段处于14:00-18:00;q=4时表示阅读时段处于18:00-22:00。
作为优选,j=1,2,3,j=1时,数据元素e1表示
Figure BDA0003608838940000068
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的小说类型;
j=2时,数据元素e2表示
Figure BDA0003608838940000069
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者姓名;
j=3时,数据元素e3表示
Figure BDA00036088389400000610
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者国籍;
数据
Figure BDA00036088389400000611
包括所屏蔽的小说类型、作者姓名、作者国籍中的任意一种或多种,当
Figure BDA00036088389400000612
表示小说类型时,y=1,2,3,4,5,6,7,8,分别表示所屏蔽的小说类型为武打小说、武侠小说、推理小说、悬疑小说、历史小说、军事小说、言情小说和科幻小说中的任意一种;
Figure BDA0003608838940000071
表示小说作者的姓名时,y=9;当
Figure BDA0003608838940000072
表示小说作者的国籍时,y=10。
作为优选,步骤S7中,计算拆得的每个词对应的所述加权哈希值的方法步骤包括:
S71,计算拆得的每个词对应的哈希值;
S72,计算从所述第一分词结果中拆得的每个词在所有所述第一分词结果中出现的次数,并计算从所述第二分词结果中拆得的每个词在所有所述第二分词结果中出现的次数;
S73,计算拆得的每个词对应的哈希值与对应的出现次数的乘积作为该词对应的加权哈希值,计算方法为:
对每个词对应的哈希值中的元素“1”乘对应出现次数的正值,对元素“0”乘对应出现次数的负值,所得序列作为该词对应的所述加权哈希值。
作为优选,步骤S8中,对所述第一分词结果或所述第二分词结果中的每个拆得的词分别对应的所述加权哈希值进行拼接的方法为:
对所述第一分词结果或所述第二分词结果中的每个拆得的词对应的所述加权哈希值中处于相同位置的元素值进行累加得到对应的所述第一拼接结果或所述第二拼接结果。
本发明还提供了一种基于用户习惯的小说推荐***,可实现所述的小说推荐方法,所述小说推荐***包括:
数据获取模块,用户获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户历史阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取当前星期l的当前小说推荐时间点所属的阅读时段;
词集获取模块,连接所述数据获取模块,用于在关联所述用户的所述小说推荐过滤词库中进一步获取关联所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
第一匹配模块,连接所述数据获取模块和所述词集获取模块,用于将可推荐的所述小说库中的每篇小说的类型对应的类型词语关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第二匹配模块,连接所述第一匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第一匹配模块完成匹配后,进一步将经所述第一匹配模块过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词语关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第三匹配模块,连接所述第二匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第二匹配模块完成匹配后,进一步将经所述第二匹配模块过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词语关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
小说标题分词模块,连接所述第三匹配模块、所述数据获取模块,用于以所述第三匹配模块完成匹配为指令,对获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并对过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
加权哈希值计算模块,连接所述小说标题分词模块,用于计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
加权哈希值拼接模块,连接所述加权哈希值计算模块,用于对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
编码模块,连接所述加权哈希值拼接模块,用于对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个第二拼接结果分别对应的第二编码结果;
相似度计算模块,连接所述编码模块,用于计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(8)计算所述第一编码结果与每个所述第二编码结果的相似度frs
Figure BDA0003608838940000081
公式(8)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
第一判断模块,连接所述相似度计算模块,用于判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在所述阅读时段内待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
第二判断模块,连接所述第一判断模块和所述第三匹配模块,用于判断所述第一小说集中的数据是否为空,
若是,则将所述第三匹配模块完成匹配后过滤剩余的所述小说库中的小说加入到第二小说集中;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说;
文本内容分词模块,连接所述第二判断模块和所述数据获取模块,用于以所述第二判断模块完成判断为指令,对获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容对应的第三分词结果,并对所述第一小说集或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
词向量转换及上下文预测模块,连接所述文本内容分词模块,用于对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
句向量形成模块,连接所述词向量转换及上下文预测模块,用于将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
词向量相关性计算模块,连接所述句向量形成模块,用于计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab
句向量相关性计算模块,连接所述词向量相关性计算模块,用于根据perab计算所述第三句向量与所述第四句向量之间的相关性per′ab
第三判断模块,连接所述句向量相关性计算模块,用于判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小数作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
第四判断模块,用于判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户。
本发明具有以下有益效果:
1、根据用户在历史星期的每个星期的每个时段的小说阅读屏蔽记录,事先构建并动态更新小说推荐过滤词库,在为该用户推荐小说时,将小说库中的每篇小说的类型、作者姓名、作者国籍按先后顺序与对应的第一过滤词集、第二过滤词集、第三过滤词集进行词匹配,以大幅减小小说库的规模,使得经过滤剩余的小说库中的小说与该用户的阅读兴趣更有契合点。且以小说类型、作者姓名、作者国籍为小说过滤条件,由于小说类型、作者姓名、作者国籍的词匹配长度很小,前期的第一过滤、第二过滤、第三过滤的速度很快,有利于提升整体的小说推荐速度。
2、通过对经前期3道过滤后小说库中的剩余的小说的标题进行编码计算,以及对该用户在历史每个阅读时段所阅读的每个小说标题进行编码计算,并通过计算两个编码结果的相似度frs,并以frs为小说过滤条件对经前期3道过滤后小说库中剩余的小说作进一步的过滤、筛选,能够在此阶段筛选出具有高匹配度的容易满足该用户在对应的阅读时段的阅读兴趣的待推荐小说,而且,此阶段由于仅对长度有限的小说标题进行相似度匹配,筛选速度很快。
3、经过前期的3道过滤和一次基于标题的可推荐小说筛选,小说库中适于在该阅读时段推荐给该用户的小说数量大幅下降,确保了第三阶段的小说文本匹配的速度。在小说文本匹配阶段,只需要将用户在历史指定时段阅读的小说的文本内容与经前期过滤、筛选加入到第一小说集或加入到第二小说集中的可推荐小说的小说摘要进行相关性匹配,由于历史指定阅读时段的阅读的小说文本内容有限,且加入到第一小说集或第二小说集的可推荐小说的数量由于经前期3道过滤和一次基于标题的可推荐小说的筛选后大幅降低,因此在此阶段的历史文本内容与小说摘要的相关性匹配的速度同样很快,且通过Skip-Gram模型预测从历史阅读的小说文本内容以及小说摘要中拆得的每个词对应的上下文,并形成历史文本内容对应的第一句向量,形成小说摘要对应的第二句向量,通过分析第一句向量与第二句向量中的每个词的相关性,以及分析第一句向量与第二句向量间的相关性,提升了此阶段的历史文本内容与小说摘要的相关性分析的准确度,有利于进一步从第一小说集或第二小说集中筛选出适合在该阅读时段推荐给该用户的第三小说集。
综上,本发明通过层层过滤、筛选,环环相扣,将数量庞大的小说库规模缩小为适宜在不同星期的不同阅读时段推荐给不同用户的第三小说集或第一小说集或第二小说集,且以小说类型、作者姓名、作者国籍、小说标题、历史阅读的小说文本内容、小说库中的小说摘要为过滤、筛选条件,筛选过程简单、计算复杂度低,同时确保了小说推荐的速度和推荐准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的基于用户习惯的小说推荐方法的实现步骤图;
图2是本发明一实施例提供的基于用户习惯的小说推荐***的结构示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明一实施例提供的基于用户习惯的小说推荐方法,如图1所示,包括:
步骤S1,获取关联每个用户的小说推荐过滤词库,以及获取每个用户在每个历史阅读时段(本申请中,将一天中的阅读时段分为4个,05:00-10:00、10:00-14:00、14:00-18:00、18:00-22:00分别为一个阅读时段)阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取待进行小说推荐的时间点所述的阅读时段;
本申请中,关联每个用户的小说推荐过滤词库是动态更新而并非固定不变的,这样做的目的是迎合每个用户在不同时期的阅读习惯变化,以提高小说推荐的有效性和准确度。本申请构建并动态更新关联每个用户的小说推荐过滤词库的方法包括:
步骤S11,获取连续历史星期的每个历史星期wk中的每一天dl中的每个阅读时段qm内用户i的屏蔽小说数据集Si,Si中的每条屏蔽小说数据sx包括所屏蔽的小说标题、文本内容、小说类型、作者姓名、作者国籍以及加入屏蔽的时间,sx的数据构成通过如下表达式(1)表达:
Figure BDA0003608838940000121
表达式(1)中,
Figure BDA0003608838940000122
分别表示Si中的第x条数据sx中的小说标题、文本内容、小说类型(武打小说、武侠小说、推理小说、悬疑小说、历史小说、军事小说、言情小说和科幻小说等中的任意一种)、作者姓名、作者国籍以及加入屏蔽的时间;
wk表示第k个历史星期;
dl表示某个历史星期中的星期l;
qm表示某个历史星期l中的第m个阅读时段;
Figure BDA0003608838940000123
表示所记录的用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx
l=1,2,3,4,5,6,7;
S12,判断sx中的数据元素ej(j=1,2,3,j=1时,数据元素e1表示
Figure BDA0003608838940000124
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的小说类型;j=2时,数据元素e2表示
Figure BDA0003608838940000125
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者姓名;j=3时,数据元素e3表示
Figure BDA0003608838940000126
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者国籍)对应的数据
Figure BDA0003608838940000127
在历史每个星期的同个星期l的同个阅读时段qm内被屏蔽数量的总数SUM是否大于预设的第一数量阈值nv1
若是,则通过以下公式(2)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000128
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000131
公式(2)中,
Figure BDA0003608838940000132
表示ej对应的类型为y的数据
Figure BDA0003608838940000133
的同一参数在历史星期wk中的星期l的阅读时段qm内被屏蔽的数量;
u表示数据
Figure BDA0003608838940000134
的第u个参数,n表示数据
Figure BDA0003608838940000135
的参数u的数量;p表示连续历史星期wk的数量;
若否,则转入步骤S13;
此处举例而言,假设ej=e2,则步骤S2中作为判断对象的数据
Figure BDA0003608838940000136
为小说的作者姓名,此时类型y=小说作者姓名,假设历史星期wk-3、wk-2、wk-1、wk中的同个星期l(比如星期三)的上午05:00-10;00该用户的屏蔽的作者姓名分别为小丁、小李;小王、小李、小丁;小夏、小沈、小阮、小何;小丁,那么SUM=2+3+4+1=10,如果设置的第一数量阈值nv1为3,则符合
Figure BDA0003608838940000137
的计算条件,然后以小丁、小李、小王、小夏、小沈、小阮、小何分别为参数u,计算每个参数u(类型词)作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率
Figure BDA0003608838940000138
比如对于小丁,根据公式(2),
Figure BDA0003608838940000139
Figure BDA00036088389400001310
而对于小李,
Figure BDA00036088389400001311
若针对小说作者姓名设置的第一数量阈值nv1为30%,则小丁被列为过滤词加入到关联被屏蔽的作者姓名的第一过滤词集中。
对于类型y=小说作者国籍或小说类型的数据
Figure BDA00036088389400001312
计算相应的概率
Figure BDA00036088389400001313
的方式与y=小说作者姓名的原理一致,因此在此不再赘述。
以历史每个星期的同个星期l的同个阅读时段qm内的被屏蔽数据去判断是否作为在当前星期l的同个阅读时段qm进行小说推荐的过滤词虽然准确度很高,但数据量不一定足够,虽然可以通过设置历史星期wk中p的长度以获取更多的数据,但距离当前星期l的时间距离越远数据的价值越低,对于提升小说推荐的准确度不利,因此为了解决这个问题,当SUM小于等于第一数量阈值nv1,构建小说推荐过滤词库的过程转入:
步骤S13,判断SUM是否大于预设的第二数量阈值nv2且小于等于第一数量阈值nv1
若是,则通过以下公式(3)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000141
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000142
若否,则转入步骤S14;
公式(3)与公式(2)的区别是,公式(3)中加入概率计算的数据不再局限于同个星期l的同个阅读时段,而是获取历史不同星期l中的同个阅读时段,比如公式(2)中加入概率计算的数据全部为历史星期的星期三的同个阅读时段的数据,而公式(3)中的数据为历史星期的周一到周末7天中的每天内的同个阅读时段的数据,但数量可能还不够,为了解决数据量还不足够的问题,如图2所示,继续转入:
S14,判断SUM是否小于等于预设的第二数量阈值nv2
若是,则通过以下公式(4)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure BDA0003608838940000143
所对应的类型词(参数u)作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure BDA0003608838940000144
公式(4)中,q表示划定的一天时间内的阅读时段的数量;本申请中,q=4,q=1时表示阅读时段05:00-10:00;q=2时表示阅读时段处于10:00-14:00;q=3时表示阅读时段处于14:00-18:00;q=4时表示阅读时段处于18:00-22:00。
cl表示历史星期wk中的星期l在计算概率
Figure BDA0003608838940000145
时所占的权重;
ck表示历史星期wk在计算概率
Figure BDA0003608838940000146
时所占的权重;
距离待进行小说推荐的当前星期l的时间越近的数据价值越大,因此公式(4)在计算
Figure BDA0003608838940000147
时,本申请赋予不同历史星期l以及不同历史星期wk不同的权重。
为了加快计算速度,
Figure BDA0003608838940000148
步骤S15,判断所计算的概率
Figure BDA0003608838940000151
是否大于为类型为y的数据
Figure BDA0003608838940000152
所预设的概率阈值Pvy
若是,则将类型为y的数据
Figure BDA0003608838940000153
所对应的类型词(参数u)作为待加入的过滤词;
若否,则不将类型为y的数据
Figure BDA0003608838940000154
所对应的类型词作为待加入的过滤词;
S16,轮询判断在当前时间将待加入的过滤词加入到小说推荐过滤词库内的关联对应阅读时段的过滤词集中后,过滤词集中的数据量是否大于对应设置的数据量阈值,
若是,则按照记录的过滤词加入时间的先后顺序将历史最先加入到对应的过滤词集中的第一过滤词删除后,将待加入的第二过滤词加入到关联阅读时段且对应类型为y的数据
Figure BDA0003608838940000155
的过滤词集中并记录加入时间;
若否,则直接将待加入的所述第二过滤词加入到关联阅读时段且对应类型为y的数据
Figure BDA0003608838940000156
的过滤词集中并记录加入时间。
请继续参照图1,本实施例提供的基于用户习惯的小说推荐方法还包括:
步骤S2,在关联用户的小说推荐过滤词库中进一步获取关联待进行小说推荐的阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;步骤S3,将可推荐的小说库中的每篇小说的类型对应的类型词(比如言情小说)与关联用户的第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将小说库中的对应小说过滤掉,然后转入步骤S4;
若匹配失败,则转入步骤S4;
比如,关联该用户的某个阅读时段的第一过滤词集中存储的小说类型的类型词为言情小说和科幻小说,则将小说库中匹配到的言情小说和科幻小说过滤掉;
步骤S4,将经步骤S3过滤剩余的小说库中的每篇小说的作者姓名对应的类型词(即作者姓名)与关联用户的第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将小说库中的对应小说过滤掉,然后转入步骤S5;
若匹配失败,则转入步骤S5;
步骤S5,将经步骤S4过滤剩余小说库中的每篇小说的作者国籍对应的类型词(即作者国籍)与关联用户的第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将小说库中的对应小说过滤掉,然后转入步骤S6;
若否,则转入步骤S6;
步骤S6,对步骤S1获取的用户在历史的阅读时段阅读的小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并将经步骤S5过滤剩余的小说库中的每篇小说的小说标题进行分词,得到过滤剩余的小说库中的每篇小说的小说标题对应的第二分词结果;分词方法可采用现有的jieba分词方法,为了提升分词准确度,可以对jieba词典进行词扩充;
步骤S7,计算每个第一分词结果以及每个第二分词结果中的每个拆得的词对应的加权哈希值;
举例而言,假设历史阅读的某个小说标题为“错误的选择却是正确的决定”,其对应的第一分词结果为“错误;的;选择;却;是;正确;的;决定”,首先对每个分得的词计算哈希值,比如“错误”的哈希值为“1101011”,“错误”这个词在历史阅读的小说标题库中的出现次数假设为5次,那么本申请以以下方法计算该词的加权哈希值:
对“1101011”中的元素“1”乘以对应出现次数即5的正值,对元素“0”乘以对应出现次数的负值,所得序列作为“错误”该词对应的加权哈希值,即“5,5,-5,5,-5,5,5”。
步骤S8,对归属于第一分词结果以及归属于第二分词结果的每个拆得的词所对应的加权哈希值进行拼接后,得到每个第一分词结果分别对应的第一拼接结果以及每个第二分词结果分别对应的第二拼接结果;
举例而言,“错误”和“的”的加权哈希值分别为“5,5,-5,5,-5,5,5”和“8,-8,8,8,8,-8”,那么“错误”和“的”的加权哈希值拼接结果为“13,-3,3,13,3,13,-3”,这样,第一拼接结果和第二拼接结果均为一串长序列;
步骤S9,对每个第一拼接结果以及每个第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个第一拼接结果分别对应的第一编码结果以及每个第二拼接结果分别对应的第二编码结果;
比如对于长序列“13,-3,3,13,3,13,-3”,其编码结果为“1,0,1,1,1,1,0”。
步骤S10,计算第一编码结果与每个第二编码结果中的差异元素数量Nde,然后通过以下公式(5)计算第一编码结果与每个第二编码结果的相似度frs
Figure BDA0003608838940000161
公式(5)中,lr表示第一编码结果或第二编码结果中的元素数量;这里需要说明的是,为了便于计算第一编码结果与每个第二编码结果的序列长度一致;
Nde的计算方式为:
假设第一编码结果为“1,0,1,1,1,1,0”,第二编码结果为“1,0,1,1,1,1,1”,则Nde=1,则根据公式(5),
Figure BDA0003608838940000171
步骤S11,判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的第二编码结果对应的可推荐小说加入到在待进行小说推荐的时间点待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的第二编码结果对应的可推荐小说加入到第一小说集中;
步骤S12,判断第一小说集中的数据是否为空,
若是,则将步骤S5过滤剩余的小说库中的小说加入到第二小说集中,然后转入步骤S13;
若否,则过滤掉未加入到第一小说集中的小说库中的小说,然后转入步骤S13
步骤S13,对步骤S1获取的小说文本库中存储的用户在历史的该阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容分别对应的第三分词结果,并对第一小说集中或第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
步骤S14,对每个所第三分词结果和每个第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
步骤S15,将归属于第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个第三分词结果对应的第三句向量,并将归属于第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个第四分词结果对应的第四句向量;
步骤S16,通过以下公式(6)计算第三句向量与第四句向量中的每个词向量之间的相关性perab
Figure BDA0003608838940000172
公式(6)中,
Figure BDA0003608838940000173
表示所述第四句向量中的第b个词向量的转置;
va表示第三句向量中的第a个词向量;
步骤S17,通过以下公式(7)计算第三句向量与第四句向量之间的相关性per′ab
Figure BDA0003608838940000174
公式(7)中,la、lb分别表示第三句向量和第四句向量中的词向量的数量;
步骤S18,判断per′ab是否大于预设的相关性阈值,
若是,则将第四句向量对应的小说作为待推荐小说加入到第三小说集中;
若否,则不将第四句向量对应的小说作为待推荐小说;
S19,判断第三小说集中的数据是否为空,
若是,则在第一小说集或第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的该时间点推送给用户;
若否,则在第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在该时间点推送给用户。
本发明还提供了一种基于用户习惯的小说推荐***,可实现所述的小说推荐方法,如图2所示,该小说推荐***包括:
数据获取模块,用户获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户在每个历史阅读时段阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取当前星期l的当前小说推荐时间点所属的阅读时段;
词集获取模块,连接所述数据获取模块,用于在关联所述用户的所述小说推荐过滤词库中进一步获取关联待进行小说推荐的所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
第一匹配模块,连接所述数据获取模块和所述词集获取模块,用于将可推荐的所述小说库中的每篇小说的类型对应的类型词语关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第二匹配模块,连接所述第一匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第一匹配模块完成匹配后,进一步将经所述第一匹配模块过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词语关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第三匹配模块,连接所述第二匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第二匹配模块完成匹配后,进一步将经所述第二匹配模块过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词语关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
小说标题分词模块,连接所述第三匹配模块、所述数据获取模块,用于以所述第三匹配模块完成匹配为指令,对获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并对过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
加权哈希值计算模块,连接所述小说标题分词模块,用于计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
加权哈希值拼接模块,连接所述加权哈希值计算模块,用于对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
编码模块,连接所述加权哈希值拼接模块,用于对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个第二拼接结果分别对应的第二编码结果;
相似度计算模块,连接所述编码模块,用于计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(8)计算所述第一编码结果与每个所述第二编码结果的相似度frs
Figure BDA0003608838940000191
公式(8)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
第一判断模块,连接所述相似度计算模块,用于判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在待进行小说推荐的所述时间点待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
第二判断模块,连接所述第一判断模块和所述第三匹配模块,用于判断所述第一小说集中的数据是否为空,
若是,则将所述第三匹配模块完成匹配后过滤剩余的所述小说库中的小说加入到第二小说集中;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说;
文本内容分词模块,连接所述第二判断模块和所述数据获取模块,用于以所述第二判断模块完成判断为指令,对获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容对应的第三分词结果,并对所述第一小说集或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
词向量转换及上下文预测模块,连接所述文本内容分词模块,用于对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
句向量形成模块,连接所述词向量转换及上下文预测模块,用于将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
词向量相关性计算模块,连接所述句向量形成模块,用于计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab
句向量相关性计算模块,连接所述词向量相关性计算模块,用于根据perab计算所述第三句向量与所述第四句向量之间的相关性per′ab
第三判断模块,连接所述句向量相关性计算模块,用于判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小数作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
第四判断模块,用于判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户。
综上,本发明通过层层过滤、筛选,环环相扣,将数量庞大的小说库规模缩小为适宜在不同星期的不同阅读时段推荐给不同用户的第三小说集或第一小说集或第二小说集,且以小说类型、作者姓名、作者国籍、小说标题、历史阅读的小说文本内容、小说库中的小说摘要为过滤、筛选条件,筛选过程简单、计算复杂度低,同时确保了小说推荐的速度和推荐准确度。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (8)

1.一种基于用户习惯的小说推荐方法,其特征在于,包括步骤:
S1,获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户在每个历史阅读时段阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取待进行小说推荐的时间点所属的阅读时段;
S2,在关联所述用户的所述小说推荐过滤词库中进一步获取关联待进行小说推荐的所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
S3,将可推荐的所述小说库中的每篇小说的类型对应的类型词与关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S4;
若匹配失败,则转入步骤S4;
S4,将经步骤S3过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词与关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S5;
若匹配失败,则转入步骤S5;
S5,将经步骤S4过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词与关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉,然后转入步骤S6;
若否,则转入步骤S6;
S6,对步骤S1获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并将经步骤S5过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
S7,计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
S8,对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接后,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
S9,对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个所述第二拼接结果分别对应的第二编码结果;
S10,计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(1)计算所述第一编码结果与每个所述第二编码结果的相似度frs
Figure FDA0003608838930000021
公式(1)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
S11,判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在待进行小说推荐的所述时间点待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
S12,判断所述第一小说集中的数据是否为空,
若是,则将步骤S5过滤剩余的所述小说库中的小说加入到第二小说集中,然后转入步骤S13;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说,然后转入步骤S13;
S13,对步骤S1获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容分别对应的第三分词结果,并对所述第一小说集中或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
S14,对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
S15,将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
S16,通过以下公式(2)计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab
Figure FDA0003608838930000022
公式(2)中,
Figure FDA0003608838930000023
表示所述第四句向量中的第b个词向量的转置;
va表示第三句向量中的第a个词向量;
S17,通过以下公式(3)计算所述第三句向量与所述第四句向量之间的相关性per′ab
Figure FDA0003608838930000031
公式(3)中,la、lb分别表示所述第三句向量和所述第四句向量中的词向量的数量;
S18,判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小说作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
S19,判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在待进行小说推荐的所述时间点推送给所述用户。
2.根据权利要求1所述的基于用户习惯的小说推荐方法,其特征在于,步骤S1中,构建并动态更新关联每个所述用户的所述小说推荐过滤词库的方法步骤包括:
S11,获取连续历史星期的每个历史星期wk中的每一天dl中的每个阅读时段qm内用户i的屏蔽小说数据集Si,Si中的每条屏蔽小说数据sx包括所屏蔽的小说标题、文本内容、小说类型、作者姓名、作者国籍以及加入屏蔽的时间,sx的数据构成通过如下表达式(4)表达:
Figure FDA0003608838930000032
表达式(4)中,
Figure FDA0003608838930000033
分别表示Si中的第x条数据sx中的小说标题、文本内容、小说类型、作者姓名、作者国籍以及加入屏蔽的时间;
wk表示第k个历史星期;
dl表示某个历史星期中的星期l;
qm表示某个历史星期l中的第m个阅读时段;
Figure FDA0003608838930000034
表示所记录的用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx
l=1,2,3,4,5,6,7;
S12,判断sx中的数据元素ej对应的数据
Figure FDA0003608838930000035
在历史每个星期的同个星期l的同个阅读时段qm内被屏蔽数量的总数SUM是否大于预设的第一数量阈值nv1
若是,则通过以下公式(5)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure FDA0003608838930000036
所对应的类型词作为在当前星期l的同个阅读时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure FDA0003608838930000041
公式(5)中,
Figure FDA0003608838930000042
表示ej对应的类型为y的数据
Figure FDA0003608838930000043
在历史星期wk中的星期l的阅读时段qm内被屏蔽的数量;
u表示数据
Figure FDA0003608838930000044
的第u个参数,n表示数据
Figure FDA0003608838930000045
的参数u的数量;
p表示连续历史星期wk的数量;
若否,则转入步骤S13;
S13,判断SUM是否大于预设的第二数量阈值nv2且小于等于所述第一数量阈值nv1
若是,则通过以下公式(6)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure FDA0003608838930000046
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure FDA0003608838930000047
若否,则转入步骤S14;
S14,判断SUM是否小于等于预设的所述第二数量阈值nv2
若是,则通过以下公式(7)计算加入屏蔽的数据元素ej对应的类型为y的数据
Figure FDA0003608838930000048
所对应的类型词作为在当前星期l的同个时段qm进行小说推荐时的过滤词的概率,然后跳转到步骤S15:
Figure FDA0003608838930000049
公式(7)中,q表示划定的一天时间内的阅读时段的数量;
cl表示历史星期wk中的星期l在计算概率
Figure FDA00036088389300000410
时所占的权重;
ck表示历史星期wk在计算概率
Figure FDA00036088389300000411
时所占的权重;
Figure FDA0003608838930000051
Figure FDA0003608838930000052
步骤S15,判断所计算的概率
Figure FDA0003608838930000053
是否大于为类型为y的数据
Figure FDA0003608838930000054
所预设的概率阈值Pvy
若是,则将类型为y的数据
Figure FDA0003608838930000055
所对应的类型词作为待加入的过滤词;
若否,则不将类型为y的数据
Figure FDA0003608838930000056
所对应的类型词作为待加入的过滤词;
S16,轮询判断在当前时间将待加入的过滤词加入到所述小说推荐过滤词库内的关联对应阅读时段的过滤词集中后,所述过滤词集中的数据量是否大于对应设置的数据量阈值,
若是,则按照记录的过滤词加入时间的先后顺序将历史最先加入到对应的所述过滤词集中的第一过滤词删除后,将待加入的第二过滤词加入到关联所述阅读时段且对应类型为y的数据
Figure FDA0003608838930000057
的所述过滤词集中并记录加入时间;
若否,则直接将待加入的所述第二过滤词加入到关联对应阅读时段的所述过滤词集中并记录加入时间。
3.根据权利要求2所述的基于用户习惯的小说推荐方法,其特征在于,p=4。
4.根据权利要求2所述的基于用户习惯的小说推荐方法,其特征在于,q=4,q=1时表示阅读时段05:00-10:00;q=2时表示阅读时段处于10:00-14:00;q=3时表示阅读时段处于14:00-18:00;q=4时表示阅读时段处于18:00-22:00。
5.根据权利要求2所述的基于用户习惯的小说推荐方法,其特征在于,j=1,2,3,j=1时,数据元素e1表示
Figure FDA0003608838930000058
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的小说类型;
j=2时,数据元素e2表示
Figure FDA0003608838930000059
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者姓名;
j=3时,数据元素e3表示
Figure FDA00036088389300000510
即表示用户i在第k个历史星期wk中的星期l中的第m个阅读时段qm内屏蔽的第x条小说数据sx中记录的作者国籍;
数据
Figure FDA00036088389300000511
包括所屏蔽的小说类型、作者姓名、作者国籍中的任意一种或多种,当
Figure FDA00036088389300000512
表示小说类型时,y=1,2,3,4,5,6,7,8,分别表示所屏蔽的小说类型为武打小说、武侠小说、推理小说、悬疑小说、历史小说、军事小说、言情小说和科幻小说中的任意一种;
Figure FDA0003608838930000061
表示小说作者的姓名时,y=9;当
Figure FDA0003608838930000062
表示小说作者的国籍时,y=10。
6.根据权利要求1所述的基于用户习惯的小说推荐方法,其特征在于,步骤S7中,计算拆得的每个词对应的所述加权哈希值的方法步骤包括:
S71,计算拆得的每个词对应的哈希值;
S72,计算从所述第一分词结果中拆得的每个词在所有所述第一分词结果中出现的次数,并计算从所述第二分词结果中拆得的每个词在所有所述第二分词结果中出现的次数;
S73,计算拆得的每个词对应的哈希值与对应的出现次数的乘积作为该词对应的加权哈希值,计算方法为:
对每个词对应的哈希值中的元素“1”乘对应出现次数的正值,对元素“0”乘对应出现次数的负值,所得序列作为该词对应的所述加权哈希值。
7.根据权利要求1所述的基于用户习惯的小说推荐方法,其特征在于,步骤S8中,对所述第一分词结果或所述第二分词结果中的每个拆得的词分别对应的所述加权哈希值进行拼接的方法为:
对所述第一分词结果或所述第二分词结果中的每个拆得的词对应的所述加权哈希值中处于相同位置的元素值进行累加得到对应的所述第一拼接结果或所述第二拼接结果。
8.一种基于用户习惯的小说推荐***,可实现如权利要求1-7任意一项所述的小说推荐方法,其特征在于,包括:
数据获取模块,用户获取关联每个用户的小说推荐过滤词库,以及获取每个所述用户历史阅读的小说标题库、小说文本库,并获取可推荐的小说库中的每篇小说的类型、作者姓名、作者国籍、小说标题以及小说摘要,以及获取当前星期l的当前小说推荐时间点所属的阅读时段;
词集获取模块,连接所述数据获取模块,用于在关联所述用户的所述小说推荐过滤词库中进一步获取关联所述阅读时段的小说类型、作者姓名、作者国籍分别对应的第一过滤词集、第二过滤词集和第三过滤词集;
第一匹配模块,连接所述数据获取模块和所述词集获取模块,用于将可推荐的所述小说库中的每篇小说的类型对应的类型词语关联所述用户的所述第一过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第二匹配模块,连接所述第一匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第一匹配模块完成匹配后,进一步将经所述第一匹配模块过滤剩余的所述小说库中的每篇小说的作者姓名对应的类型词语关联所述用户的所述第二过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
第三匹配模块,连接所述第二匹配模块、所述数据获取模块和所述词集获取模块,用于在所述第二匹配模块完成匹配后,进一步将经所述第二匹配模块过滤剩余的所述小说库中的每篇小说的作者国籍对应的类型词语关联所述用户的所述第三过滤词集中存储的类型词进行词匹配,
若匹配成功,则将所述小说库中的对应小说过滤掉;
若匹配失败,则不对所述小说库进行小说过滤;
小说标题分词模块,连接所述第三匹配模块、所述数据获取模块,用于以所述第三匹配模块完成匹配为指令,对获取的所述用户在历史的所述阅读时段阅读的所述小说标题库中存储的每个小说标题进行分词,得到每个小说标题对应的第一分词结果,并对过滤剩余的所述小说库中的每篇小说的小说标题进行分词,得到过滤剩余的所述小说库中的每篇小说的小说标题对应的第二分词结果;
加权哈希值计算模块,连接所述小说标题分词模块,用于计算每个所述第一分词结果以及每个所述第二分词结果中的每个拆得的词对应的加权哈希值;
加权哈希值拼接模块,连接所述加权哈希值计算模块,用于对归属于所述第一分词结果以及归属于所述第二分词结果的每个拆得的词所对应的所述加权哈希值进行拼接,得到每个所述第一分词结果分别对应的第一拼接结果以及每个所述第二分词结果分别对应的第二拼接结果;
编码模块,连接所述加权哈希值拼接模块,用于对每个所述第一拼接结果以及每个所述第二拼接结果中大于“0”的数值置“1”,小于“0”的数值置“0”,得到每个所述第一拼接结果分别对应的第一编码结果以及每个第二拼接结果分别对应的第二编码结果;
相似度计算模块,连接所述编码模块,用于计算所述第一编码结果与每个所述第二编码结果中的差异元素数量Nde,然后通过以下公式(8)计算所述第一编码结果与每个所述第二编码结果的相似度frs
Figure FDA0003608838930000071
公式(8)中,lr表示所述第一编码结果或所述第二编码结果中的元素数量;
第一判断模块,连接所述相似度计算模块,用于判断frs是否大于预设的相似度阈值,
若是,则将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到在所述阅读时段内待推荐给所述用户的第一小说集中;
若否,则不将参与相似度frs计算的所述第二编码结果对应的可推荐小说加入到所述第一小说集中;
第二判断模块,连接所述第一判断模块和所述第三匹配模块,用于判断所述第一小说集中的数据是否为空,
若是,则将所述第三匹配模块完成匹配后过滤剩余的所述小说库中的小说加入到第二小说集中;
若否,则过滤掉未加入到所述第一小说集中的所述小说库中的小说;
文本内容分词模块,连接所述第二判断模块和所述数据获取模块,用于以所述第二判断模块完成判断为指令,对获取的所述小说文本库中存储的所述用户在历史的所述阅读时段内阅读的每篇小说的文本内容进行分词,得到每篇文本内容对应的第三分词结果,并对所述第一小说集或所述第二小说集中存储的每篇可推荐小说的小说摘要进行分词,得到每篇小说摘要对应的第四分词结果;
词向量转换及上下文预测模块,连接所述文本内容分词模块,用于对每个所述第三分词结果和每个所述第四分词结果中拆得的每个词转换为对应的词向量,并使用Skip-Gram模型预测每个拆得的词对应的上下文;
句向量形成模块,连接所述词向量转换及上下文预测模块,用于将归属于所述第三分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第三分词结果对应的第三句向量,并将归属于所述第四分词结果的所有词向量与每个词向量对应的上下文进行拼接得到每个所述第四分词结果对应的第四句向量;
词向量相关性计算模块,连接所述句向量形成模块,用于计算所述第三句向量与所述第四句向量中的每个词向量之间的相关性perab
句向量相关性计算模块,连接所述词向量相关性计算模块,用于根据perab计算所述第三句向量与所述第四句向量之间的相关性per′ab
第三判断模块,连接所述句向量相关性计算模块,用于判断per′ab是否大于预设的相关性阈值,
若是,则将所述第四句向量对应的小数作为待推荐小说加入到第三小说集中;
若否,则不将所述第四句向量对应的小说作为待推荐小说;
第四判断模块,用于判断所述第三小说集中的数据是否为空,
若是,则在所述第一小说集或所述第二小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户;
若否,则在所述第三小说集中随机选择任意一篇或多篇小说作为待推荐小说并在所述当前小说推荐时间点推送给所述用户。
CN202210427059.3A 2022-04-21 2022-04-21 基于用户习惯的小说推荐方法及*** Active CN114780844B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210427059.3A CN114780844B (zh) 2022-04-21 2022-04-21 基于用户习惯的小说推荐方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210427059.3A CN114780844B (zh) 2022-04-21 2022-04-21 基于用户习惯的小说推荐方法及***

Publications (2)

Publication Number Publication Date
CN114780844A true CN114780844A (zh) 2022-07-22
CN114780844B CN114780844B (zh) 2022-10-28

Family

ID=82430605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210427059.3A Active CN114780844B (zh) 2022-04-21 2022-04-21 基于用户习惯的小说推荐方法及***

Country Status (1)

Country Link
CN (1) CN114780844B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160112394A1 (en) * 2014-10-20 2016-04-21 Yp Llc Systems and methods for implementing a personalized provider recommendation engine
CN105677715A (zh) * 2015-12-29 2016-06-15 海信集团有限公司 一种基于多用户的视频推荐方法及装置
CN110688476A (zh) * 2019-09-23 2020-01-14 腾讯科技(北京)有限公司 一种基于人工智能的文本推荐方法及装置
CN110851710A (zh) * 2019-10-28 2020-02-28 上海连尚网络科技有限公司 一种小说推荐方法及设备
CN111008336A (zh) * 2019-12-23 2020-04-14 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、设备及可读存储介质
CN111737586A (zh) * 2020-08-19 2020-10-02 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
EP3754518A1 (en) * 2019-06-19 2020-12-23 Citrix Systems, Inc. Identification and recommendation of file content segments
US20210034688A1 (en) * 2019-07-31 2021-02-04 Rovi Guides, Inc. Systems and methods for recommending collaborative content
CN112632397A (zh) * 2021-01-04 2021-04-09 同方知网(北京)技术有限公司 基于多类型学术成果画像及混合推荐策略的个性化推荐方法
CN112989074A (zh) * 2021-04-23 2021-06-18 腾讯科技(深圳)有限公司 多媒体信息推荐方法、装置、电子设备及存储介质
CN113536785A (zh) * 2021-06-15 2021-10-22 合肥讯飞数码科技有限公司 一种文本推荐方法、智能终端及计算机可读存储介质
CN114048383A (zh) * 2021-11-18 2022-02-15 百度在线网络技术(北京)有限公司 信息推荐方法及装置、电子设备和介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160112394A1 (en) * 2014-10-20 2016-04-21 Yp Llc Systems and methods for implementing a personalized provider recommendation engine
CN105677715A (zh) * 2015-12-29 2016-06-15 海信集团有限公司 一种基于多用户的视频推荐方法及装置
EP3754518A1 (en) * 2019-06-19 2020-12-23 Citrix Systems, Inc. Identification and recommendation of file content segments
US20210034688A1 (en) * 2019-07-31 2021-02-04 Rovi Guides, Inc. Systems and methods for recommending collaborative content
CN110688476A (zh) * 2019-09-23 2020-01-14 腾讯科技(北京)有限公司 一种基于人工智能的文本推荐方法及装置
CN110851710A (zh) * 2019-10-28 2020-02-28 上海连尚网络科技有限公司 一种小说推荐方法及设备
CN111008336A (zh) * 2019-12-23 2020-04-14 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、设备及可读存储介质
CN111737586A (zh) * 2020-08-19 2020-10-02 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112632397A (zh) * 2021-01-04 2021-04-09 同方知网(北京)技术有限公司 基于多类型学术成果画像及混合推荐策略的个性化推荐方法
CN112989074A (zh) * 2021-04-23 2021-06-18 腾讯科技(深圳)有限公司 多媒体信息推荐方法、装置、电子设备及存储介质
CN113536785A (zh) * 2021-06-15 2021-10-22 合肥讯飞数码科技有限公司 一种文本推荐方法、智能终端及计算机可读存储介质
CN114048383A (zh) * 2021-11-18 2022-02-15 百度在线网络技术(北京)有限公司 信息推荐方法及装置、电子设备和介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JIAN CHEN等: "Data Analysis and Knowledge Discovery in Web Recruitment—Based on Big Data Related Jobs", 《2019 INTERNATIONAL CONFERENCE ON MACHINE LEARNING, BIG DATA AND BUSINESS INTELLIGENCE (MLBDBI)》 *
MA, CHAO等: "Content Feature Extraction-based Hybrid Recommendation for Mobile Application Services", 《CMC-COMPUTERS MATERIALS & CONTINUA》 *
张峰铭: "基于文本分析的专家推荐***研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
张翔: "个性化小说推荐***的设计与实现", 《中国优秀硕士学位论文全文数据库哲学与人文科学辑》 *
林俊俊: "面向用户个性化兴趣准确表达的推荐算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN114780844B (zh) 2022-10-28

Similar Documents

Publication Publication Date Title
US20240169375A1 (en) Linguistic extraction of temporal and location information for a recommender system
US10866982B2 (en) Intelligent content recommender for groups of users
CN111708901B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
US9402101B2 (en) Content presentation method, content presentation device, and program
US7437296B2 (en) Speech recognition dictionary creation apparatus and information search apparatus
CN100508592C (zh) 创建用户简档和为用户提供节目建议的方法、装置
KR20190070911A (ko) 온라인 강의 시스템에서 강사를 추천하는 방법
Wang et al. Retweet wars: Tweet popularity prediction via dynamic multimodal regression
EP2040215A2 (en) A recommender system with ad-hoc, dynamic model composition
CN110489633A (zh) 一种基于图书馆数据的智慧大脑服务平台
Sihwi et al. Twitter sentiment analysis of movie reviews using information gain and naïve bayes classifier
WO2016190126A1 (ja) 情報処理装置、情報処理方法、およびプログラム
CN111984821A (zh) 确定视频动态封面的方法、装置、存储介质及电子设备
CN114339417A (zh) 一种视频推荐的方法、终端设备和可读存储介质
CN112560450A (zh) 一种文本纠错方法及装置
CN111125344A (zh) 相关词推荐方法和装置
US10740621B2 (en) Standalone video classification
CN109101505A (zh) 一种推荐方法、推荐装置和用于推荐的装置
CN117271799A (zh) 一种基于知识图谱的多轮问答方法及***
CN113849657A (zh) 一种智慧监管黑匣子的结构化资料处理方法
CN113423014B (zh) 一种播放信息的推送方法、装置、终端设备及存储介质
CN114780844B (zh) 基于用户习惯的小说推荐方法及***
CN110083769B (zh) 一种面向用户偏好演化的移动应用推荐方法
CN112015972A (zh) 一种信息推荐方法、装置、电子设备以及存储介质
CN110413899B (zh) 服务器存储新闻的存储资源优化方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant