CN113392327B - 基于用户网站访问记录的图书推荐方法 - Google Patents

基于用户网站访问记录的图书推荐方法 Download PDF

Info

Publication number
CN113392327B
CN113392327B CN202110752490.0A CN202110752490A CN113392327B CN 113392327 B CN113392327 B CN 113392327B CN 202110752490 A CN202110752490 A CN 202110752490A CN 113392327 B CN113392327 B CN 113392327B
Authority
CN
China
Prior art keywords
book
characters
user
information
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110752490.0A
Other languages
English (en)
Other versions
CN113392327A (zh
Inventor
王芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rentian Bookstore Group Co ltd
Original Assignee
Binzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Binzhou University filed Critical Binzhou University
Priority to CN202110752490.0A priority Critical patent/CN113392327B/zh
Publication of CN113392327A publication Critical patent/CN113392327A/zh
Application granted granted Critical
Publication of CN113392327B publication Critical patent/CN113392327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于用户网站访问记录的图书推荐方法,该方法包括:接收用户的登录用户名和图书搜索关键字,根据登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;根据图书搜索关键字对网站访问记录进行筛选,网站访问记录中所包含的网站的页面中包含图书搜索关键字;确定筛选结果后,确定网站中的目标页面,根据目标页面的数量确定图书搜索关键字对应的待推荐图书;根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取待推荐图书以及待推荐图书中的精彩片段;通过增加用户的探索欲,使得用户可以更深入去了解推荐的图书,提高用户与推荐内容之间的黏性。

Description

基于用户网站访问记录的图书推荐方法
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于用户网站访问记录的图书推荐方法。
背景技术
随着网络的普及,互联网信息过载的时代已经来临。如何过滤掉无关、无用的信息,将用户感兴趣的信息直接呈现给用户,是互联网发展中一个非常重要的课题。在图书销售领域,亚马逊、当当网等网上书店都运用各种信息技术来改进图书推荐服务。但图书推荐服务***仍存在较多的不足,如个性化推荐不精准问题、尚未实现智能化图书检索、社会化推荐不足等,这些问题都是亟待解决的。
图书是人们生活的一部分,与其他电子商务品类相比,图书读者的个性化需求更加明显,所以图书销售也直接受益于推荐***的发展。图书是人们的精神食粮,是人们生活必不可缺少的部分。在图书销售市场竞争越趋白热化的今天,如何将图书推荐给真正需要它的人们,如何使人们快速地获得自己需要的图书,这成为了图书销售的制胜关键。随着人们个性化需求越加明显,目前的图书推荐服务***已越显不足。
但是,相关推荐内容与用户需求的匹配度较低,使得用户处理更多的低价值信息,而推荐内容如何高度匹配提高用户需求,快速获取用户的关注度成为人们亟待解决的问题。
发明内容
为此,本发明提供一种基于用户网站访问记录的图书推荐***,可以解决快速获取用户关注度,提高用户黏性的问题。
为实现上述目的,本发明提供一种基于用户网站访问记录的图书推荐方法,包括:
接收用户的登录信息和图书搜索关键字,所述登录信息包括用户的登录用户名;
根据所述登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;
根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字;
确定筛选结果后,确定网站中的目标页面,根据目标页面的数量确定图书搜索关键字对应的待推荐图书;
根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取待推荐图书以及待推荐图书中的精彩片段;
在确定待推荐图书时,根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字包括:确定图书搜索关键字所对应的网站访问记录中,若图书搜索关键字在该网站访问记录中所包含的页面中,则将该页面筛选出来,若该图书搜索关键字不在网站访问记录中所包含的页面中,则无需对该页面进行筛选,将包含图书搜索关键字的页面进行筛选并集中至页面集合中;
将页面集合后,根据目标页面的数量以及图书搜索关键字确认的图书排序的关系确定待推荐图书,搜索任意图书搜索关键字,则产生第一图书排序,该第一图书排序的先后顺序是与该图书搜索关键字的相关度进行确定,在确定该顺序之后,若目标页面的数量≥预设目标数量,则选择该排序中的第一本图书作为推荐的图书;当目标页面的数量<预设目标数量时,根据目标页面的实际数量选择第一排序中的第2至第c本待推荐图书;
根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户包括:
预先设置图书的精彩片段,在每个图书中包括多个精彩片段,根据用户在目标页面停留的时间长度确定对应的图书中需要显示的精彩片段内容,在中央处理器内设置有显示矩阵D(Ti,Pi),其中Ti表示用户在目标页面停留的时间长度,Pi表示图书中的精彩片段内容;
若用户在目标页面停留的时间长度为T1,则中央处理器根据显示矩阵D(Ti,Pi)中确定P1作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为T2,则中央处理器根据显示矩阵D(Ti,Pi)中确定P2作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为Tn,则中央处理器根据显示矩阵D(Ti,Pi)中确定Pn作为图书中的精彩片段内容进行展示。
进一步地,确认用户在第一时间周期内的网站访问记录包括:提取用户登录的全部网站IP地址;
确定用户在不同的网站IP地址内停留的时间长度;
根据停留时间确定全部网站的重要程度排序,在中央处理器内设置有预设时间长度T0;
选择访问时间长度≥预设时间长度T0的网站作为用户在第一时间周期内的网站访问记录。
进一步地,在确定某一网站的页面中是否包含该图书搜索关键字时,
将每个网页信息的长度Li分别与图书搜索关键字的标准字段长度进行比较,若Li<图书搜索关键字的标准字段长度ln,则表示该网页内不包含图书搜索关键字;
若Li≥图书搜索关键字的标准字段长度ln,则将满足长度要求的网页信息建立网页信息矩阵M(M1,M2…Mx),其中x<n,对于网页信息矩阵中的网页信息进行判断时,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
进一步地,在确定网页信息内是否包含关键字时,还包括:从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
进一步地,在比较的过程中,若网页信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是网页信息中包含图书搜索关键字,此时判定网页信息Mi中不包含标准字段的字符。
进一步地,若对于网页信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,若小于等于90%则需要进一步判断。
进一步地,当需要对网页信息是否包含图书搜索关键字进行进一步判断时,近似信息库内包含有图书搜索关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对网页信息进行进一步判断,判段网页信息内是否包含关键字的相似或相近字段,若包含,则该网页信息包含图书搜索关键字,若不包含相似或相近字段,则认定该网页信息不包含图书搜索关键字。
进一步地,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含关键字;
从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字。
进一步地,在确认用户在第一时间周期内的网站访问记录时,设置标准网站浏览时间,若对于任意网站,若用户的在该网站的浏览时间<预设的标准浏览时间,则剔除该网站,不作为用户在第一时间周期内的网站访问记录;若≥预设的标准浏览时间,则将该网站作为用户在第一时间周期内的网站访问记录。
进一步地,用户的登录用户名有多个,根据当前的登录用户名,确定用户的ID,在各网站上确定该ID的其他用户登录用户名,确定用户在第一时间周期内的网站访问记录是该用户以各用户登录用户名和以共同的IP地址进行登录网站的访问信息。
与现有技术相比,本发明的有益效果在于,通过根据用户在目标页面停留的时间长度确定图书中的精彩片段进行显示的内容,在实际应用过程中,若用户在目标页面停留的时间较长,则表示用户在一定程度长对该目标页面的内容比较感兴趣,需要进行深度思考,而此时若是给用户推荐的精彩内容较为简单,则不符合用户的思考习惯,因此在实际推荐过程中,则为用户推荐的内容是符合用户兴趣且具备一定深度的内容,进而增加用户的探索欲,使得用户可以更深入去了解推荐的图书,提高用户与推荐内容之间的黏性。
尤其,通过监测用户在访问网站时对各个页面的浏览时间进行监测,选择浏览时间较长的页面为目标页面,基于浏览时间和浏览页面的内容确定用户的兴趣点,进而根据用户的兴趣点相关度最高的图书,将该图书推荐给用户,并将该图书中与用户兴趣点相关度最高的精彩片段显示给用户。
尤其,对于图书的选择是在基于图书搜索关键字的基础上结合用户的网站访问记录中的目标页面的数量继续选择的,使得对于图书的推荐更符合用户在第一时间周期内的网站访问情况,提高图书推荐的精准度。本发明实施例通过用户在一定时间内的网站访问情况对图书的排序进行调整,使得图书的推荐更为精确,使得推荐的图书更匹配用户的网站浏览状况。
尤其,本发明实施例通过对网页信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定网页信息中是否包含图书搜索关键字,若是包含关键字则可以进一步判定其是否为目标网页,通过图书搜索关键字的判断实现对目标网页的精准确定,提高图书推荐以及图书精彩片段推荐的准确性。
尤其,通过对网页信息Mi中选择的n个字符与标准字段的字符存在差异的第一个字符开始重新选择n个字符继续比较,该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,进一步提高对网页信息内是否包含图书搜索关键字判断的准确性,提高判断的合理性和全面性。
通过判定网页信息中是否包含图书搜索关键字的近似字段信息Y1,Y2…Yn,且近似字段信息与关键字信息对于网页信息的判定至关重要,提高对网页信息中是否包含图书搜索关键字的判定的准确率,进一步提高图书推荐的准确性。
附图说明
图1为本发明实施例提供的基于用户网站访问记录的图书推荐方法的流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,本发明实施例提供的基于用户网站访问记录的图书推荐方法包括:
步骤S100:接收用户的登录信息和图书搜索关键字,所述登录信息包括用户的登录用户名;
步骤S200:根据所述登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;
步骤S300:根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字;
步骤S400:确定筛选结果后,确定网站中的目标页面,根据目标页面确定图书搜索关键字对应的图书;
步骤S500:根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取图书以及图书中的精彩片段;
具体而言,本发明实施例的执行主体为一终端,该终端可以是手机、平板或是笔记本电脑等,终端在接收到用户的登录信息后,再获取对应的图书搜索关键字。
具体而言,在步骤S200中,登录用户名可以是用户的手机号码还可以是用户的身份证号码,获取该手机号码在第一时间周期内的网站访问记录,本领域技术人员可以理解的是,在第一时间周期内用户的网站访问记录可以是多个,访问网站的种类,以及浏览网站中的页面内容也是多种多样的,但是在这些页面内容中有用户感兴趣的,也有用户不感兴趣直接跳转离开的。
具体而言,在步骤S500中,本发明实施例通过监测用户在访问网站时对各个页面的浏览时间进行监测,选择浏览时间较长的页面为目标页面,基于浏览时间和浏览页面的内容确定用户的兴趣点,进而根据用户的兴趣点相关度最高的图书,将该图书推荐给用户,并将该图书中与用户兴趣点相关度最高的精彩片段显示给用户。
具体而言,所述确认用户在第一时间周期内的网站访问记录包括:提取用户登录的全部网站IP地址;
确定用户在不同的网站IP内停留的时间长度;
根据停留时间确定全部网站的重要程度排序,在中央处理器内设置有预设时间长度T0;
选择访问时间长度≥预设时间长度T0的网站作为用户在第一时间周期内的网站访问记录。
在步骤S500中,根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户包括:
预先设置图书的精彩片段,在每个图书中包括多个精彩片段,根据用户在目标页面停留的时间长度确定对应的图书中需要显示的精彩片段内容,在中央处理器内设置有显示矩阵D(Ti,Pi),其中Ti表示用户在目标页面停留的时间长度,Pi表示图书中的精彩片段内容。
具体而言,若用户在目标页面停留的时间长度为T1,则中央处理器根据显示矩阵D(Ti,Pi)中确定P1作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为T2,则中央处理器根据显示矩阵D(Ti,Pi)中确定P2作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为Tn,则中央处理器根据显示矩阵D(Ti,Pi)中确定Pn作为图书中的精彩片段内容进行展示。
具体而言,本发明实施例提供的基于用户网站访问记录的图书推荐方法,通过根据用户在目标页面停留的时间长度确定图书中的精彩片段进行显示的内容,在实际应用过程中,若用户在目标页面停留的时间较长,则表示用户在一定程度长对该目标页面的内容比较感兴趣,需要进行深度思考,而此时若是给用户推荐的精彩内容较为简单,则不符合用户的思考习惯,因此在实际推荐过程中,则为用户推荐的内容是符合用户兴趣且具备一定深度的内容,进而增加用户的探索欲,使得用户可以更深入去了解推荐的图书,提高用户与推荐内容之间的黏性。
具体而言,在步骤S200中,设置标准网站浏览时间,若对于任意网站,若用户的在该网站的浏览时间<预设的标准浏览时间,则剔除该网站,不作为用户在第一时间周期内的网站访问记录;若用户的在该网站的浏览时间≥预设的标准浏览时间,则将该网站作为用户在第一时间周期内的网站访问记录。
具体而言,在实际应用过程中,用户的登录用户名可以有多个,根据当前的登录用户名,确定用户的ID,在各网站上确定该ID的其他用户登录用户名,在实际应用中,确定用户在第一时间周期内的网站访问记录是该用户以各用户登录用户名或以共同的IP地址进行登录网站的访问信息,本发明实施例并不局限于单一的登录用户名信息来确定用户的网站访问记录,对于用户网站访问记录的确定更为精准,提高图书推荐的准确性,可以进一步提高基于网站访问信息进行图书推荐的精准度,便于与用户之间建立更为精准的联系。
具体而言,在步骤S300中,根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字包括:确定图书搜索关键字所对应的网站访问记录中,若图书搜索关键字在该网站访问记录中所包含的页面中,则将该页面筛选出来,若该图书搜索关键字不在网站访问记录中所包含的页面中,则无需对该页面进行筛选,将包含图书搜索关键字的页面进行筛选并集中至页面集合中。
将页面集合后,根据目标页面的数量以及图书搜索关键字确认的图书排序的关系确定待推荐图书,具体而言,当不考虑网站访问记录的情况下,搜索任意图书搜索关键字,则会产生一个图书排序,该图书排序的先后顺序是与该图书搜索关键字的相关度进行确定,在确定该顺序之后,在本发明实施例中,该排序与目标页面的数量一一对应,具体而言,若目标页面的数量≥预设目标数量,则选择该排序中的第一本图书作为推荐的图书;当目标页面的数量<预设目标数量时,根据目标页面的实际数量选择根据图书搜索关键字排序后的第2-第n本待推荐图书。
本发明实施例中对于图书的选择是在基于图书搜索关键字的基础上结合用户的网站访问记录中的目标页面的数量继续选择的,使得对于图书的推荐更符合用户在第一时间周期内的网站访问情况,提高图书推荐的精准度。本发明实施例通过用户在一定时间内的网站访问情况对图书的排序进行调整,使得图书的推荐更为精确,使得推荐的图书更匹配用户的网站浏览状况。
具体而言,在确定某一网站的页面中是否包含该图书搜索关键字时,采用以下方法:
将每个网页信息的长度Li分别与图书搜索关键字的标准字段长度进行比较,若Li<图书搜索关键字的标准字段长度ln,则表示该网页内不包含图书搜索关键字;
若Li≥图书搜索关键字的标准字段长度ln,则将满足长度要求的网页信息建立网页信息矩阵M(M1,M2…Mx),其中x<n,对于网页信息矩阵中的网页信息进行判断时,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
具体而言,在确定网页信息内是否包含关键字时,还包括:从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
具体而言,本发明实施例通过对网页信息中的n个字符与标准字段的字符进行比较,以根据比较结果确定网页信息中是否包含图书搜索关键字,若是包含关键字则可以进一步判定其是否为目标网页,通过图书搜索关键字的判断实现对目标网页的精准确定,提高图书推荐以及图书精彩片段推荐的准确性。
具体而言,在比较的过程中,若网页信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是网页信息中包含图书搜索关键字,此时判定网页信息Mi中不包含标准字段的字符。
具体而言,若对于网页信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,若小于等于90%则需要进一步判断。
具体而言,通过对网页信息Mi中选择的n个字符与标准字段的字符存在差异的第一个字符开始重新选择n个字符继续比较,该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,进一步提高对网页信息内是否包含图书搜索关键字判断的准确性,提高判断的合理性和全面性。
具体而言,当需要对网页信息是否包含图书搜索关键字进行进一步判断时,近似信息库内包含有图书搜索关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似或相近字段,根据近似信息库对网页信息进行进一步判断,判段网页信息内是否包含关键字的相似或相近字段,若包含,则该网页信息包含图书搜索关键字,若不包含相似或相近字段,则认定该网页信息不包含图书搜索关键字。
具体而言,在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含关键字;
从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字。
具体而言,本发明实施例通过判定网页信息中是否包含图书搜索关键字的近似字段信息Y1,Y2…Yn,且近似字段信息与关键字信息对于网页信息的判定至关重要,提高对网页信息中是否包含图书搜索关键字的判定的准确率,进一步提高图书推荐的准确性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于用户网站访问记录的图书推荐方法,其特征在于,包括:
接收用户的登录信息和图书搜索关键字,所述登录信息包括用户的登录用户名;
根据所述登录用户名和网站浏览时间,确认用户在第一时间周期内的网站访问记录;
根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字;
确定筛选结果后,确定网站中的目标页面,根据目标页面的数量确定图书搜索关键字对应的待推荐图书;
根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户,以使用户获取待推荐图书以及待推荐图书中的精彩片段;
在确定待推荐图书时,根据所述图书搜索关键字对所述网站访问记录进行筛选,所述网站访问记录中所包含的网站的页面中包含所述图书搜索关键字包括:确定图书搜索关键字所对应的网站访问记录中,若图书搜索关键字在该网站访问记录中所包含的页面中,则将该页面筛选出来,将筛选出来的页面作为目标页面,若该图书搜索关键字不在网站访问记录中所包含的页面中,则无需对该页面进行筛选,将包含图书搜索关键字的页面进行筛选并集中至页面集合中;
将页面集合后,根据目标页面的数量以及图书搜索关键字确认的图书排序的关系确定待推荐图书,搜索任意图书搜索关键字,则产生第一图书排序,该第一图书排序的先后顺序是与该图书搜索关键字的相关度进行确定,在确定该第一图书排序之后,若目标页面的数量≥预设目标数量,则选择该第一图书排序中的第一本图书作为推荐的图书;当目标页面的数量<预设目标数量时,根据目标页面的实际数量选择第一图书排序中的第2至第c本待推荐图书,c大于2;
根据用户在目标页面停留的时间分析用户的兴趣点,将图书中的兴趣点对应的精彩片段显示给用户包括:
预先设置图书的精彩片段,在每个图书中包括多个精彩片段,根据用户在目标页面停留的时间长度确定对应的图书中需要显示的精彩片段内容,在中央处理器内设置有显示矩阵D(Ti,Pi),其中Ti表示用户在目标页面停留的时间长度,Pi表示图书中的精彩片段内容;
若用户在目标页面停留的时间长度为T1,则中央处理器根据显示矩阵D(Ti,Pi)中确定P1作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为T2,则中央处理器根据显示矩阵D(Ti,Pi)中确定P2作为图书中的精彩片段内容进行展示;若用户在目标页面停留的时间长度为Tn,则中央处理器根据显示矩阵D(Ti,Pi)中确定Pn作为图书中的精彩片段内容进行展示。
2.根据权利要求1所述的基于用户网站访问记录的图书推荐方法,其特征在于,
确认用户在第一时间周期内的网站访问记录包括:提取用户登录的全部网站IP地址;
确定用户在不同的网站IP地址内停留的时间长度;
根据停留时间确定全部网站的重要程度排序,在中央处理器内设置有预设时间长度T0;
选择访问时间长度≥预设时间长度T0的网站作为用户在第一时间周期内的网站访问记录。
3.根据权利要求1所述的基于用户网站访问记录的图书推荐方法,其特征在于,在确定某一网站的页面中是否包含该图书搜索关键字时,
将每个网页信息的长度Li分别与图书搜索关键字的标准字段长度进行比较,若Li<图书搜索关键字的标准字段长度ln,则表示该网页内不包含图书搜索关键字;
若Li≥图书搜索关键字的标准字段长度ln,则将满足长度要求的网页信息建立网页信息矩阵M(M1,M2…Mx),其中x<满足长度要求的网页信息的总数,对于网页信息矩阵中的网页信息进行判断时,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与图书搜索关键字的标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
4.根据权利要求3所述的基于用户网站访问记录的图书推荐方法,其特征在于,
在确定网页信息内是否包含图书搜索关键字时,还包括:从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与标准字段的字符进行比较,若n个字符中与标准字段的字符重合率大于90%则表示网页信息Mi中包含图书搜索关键字。
5.根据权利要求4所述的基于用户网站访问记录的图书推荐方法,其特征在于,在比较的过程中,若网页信息Mi中进行k次比较之后,其中有0.2×k次的比较结果是网页信息中包含图书搜索关键字,此时判定网页信息Mi中不包含标准字段的字符。
6.根据权利要求4所述的基于用户网站访问记录的图书推荐方法,其特征在于,
若对于网页信息Mi中选择的n个字符与标准字段的字符进行比较时,若n个字符中与标准字段的字符重合率小于等于90%,则找到出现差异的第一个字符位,从第一个差异位开始重新选择n个字符,将该n个字符与标准字段的字符进行比较,若重合率高于90%,则表示该网页信息内包含图书搜索关键字,若小于等于90%则需要进一步判断。
7.根据权利要求6所述的基于用户网站访问记录的图书推荐方法,其特征在于,
当需要对网页信息是否包含图书搜索关键字进行进一步判断时,近似信息库内包含有图书搜索关键字的多个近似字段信息,分别为Y1,Y2…Yn,近似字段为关键字的相似字段,根据近似信息库对网页信息进行进一步判断,判段网页信息内是否包含关键字的相似字段,若包含,则该网页信息包含图书搜索关键字,若不包含相似字段,则认定该网页信息不包含图书搜索关键字。
8.根据权利要求7所述的基于用户网站访问记录的图书推荐方法,其特征在于,
在进行比较时,将每个近似字段信息均添加一转化码,将近似信息库内的近似字段信息Y1,Y2…Yn更新为Y11,Y12…Y1n,从网页信息Mi中的第1个字符开始,选择n个字符,将n个字符分别与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第2个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含关键字;
从网页信息Mi中的倒数第一个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含图书搜索关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的倒数第二个字符,从后往前选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字;
从网页信息Mi中的第k个字符开始,选择n个字符,将n个字符与近似字段信息Y11,Y12…Y1n分别进行比较,若n个字符中与近似字段信息的重合率大于90%则表示网页信息Mi中包含关键字相似或相近信息,属于包含图书搜索关键字。
9.根据权利要求1所述的基于用户网站访问记录的图书推荐方法,其特征在于,
在确认用户在第一时间周期内的网站访问记录时,设置标准网站浏览时间,若对于任意网站,若用户的在该网站的浏览时间<预设的标准浏览时间,则剔除该网站,不作为用户在第一时间周期内的网站访问记录;若用户的在该网站的浏览时间≥预设的标准浏览时间,则将该网站作为用户在第一时间周期内的网站访问记录。
10.根据权利要求9所述的基于用户网站访问记录的图书推荐方法,其特征在于,用户的登录用户名有多个,根据当前的登录用户名,确定用户的ID,在各网站上确定该ID的其他登录用户名,确定用户在第一时间周期内的网站访问记录是该用户以各登录用户名和以共同的IP地址进行登录网站的访问信息。
CN202110752490.0A 2021-07-02 2021-07-02 基于用户网站访问记录的图书推荐方法 Active CN113392327B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110752490.0A CN113392327B (zh) 2021-07-02 2021-07-02 基于用户网站访问记录的图书推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110752490.0A CN113392327B (zh) 2021-07-02 2021-07-02 基于用户网站访问记录的图书推荐方法

Publications (2)

Publication Number Publication Date
CN113392327A CN113392327A (zh) 2021-09-14
CN113392327B true CN113392327B (zh) 2022-09-23

Family

ID=77624970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110752490.0A Active CN113392327B (zh) 2021-07-02 2021-07-02 基于用户网站访问记录的图书推荐方法

Country Status (1)

Country Link
CN (1) CN113392327B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304315B (zh) * 2023-02-27 2024-02-06 广州兴趣岛信息科技有限公司 一种网上教学用内容智能推荐***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336836A (zh) * 2013-07-12 2013-10-02 贝壳网际(北京)安全技术有限公司 一种页面搜索方法和页面搜索装置
CN105045864A (zh) * 2015-07-10 2015-11-11 浙江工商大学 一种数字化资源个性化推荐方法
CN109727088A (zh) * 2018-11-08 2019-05-07 深圳壹账通智能科技有限公司 一种基于浏览器的商品推荐方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929959B (zh) * 2012-10-10 2016-02-17 杭州东信北邮信息技术有限公司 一种基于用户行为的图书推荐方法
CN110430477A (zh) * 2019-08-12 2019-11-08 广州华多网络科技有限公司 直播内容的推荐方法、装置、计算机设备和存储介质
CN111831884B (zh) * 2020-07-14 2021-02-05 深圳市众创达企业咨询策划有限公司 一种基于信息查找的匹配***与方法
CN112532755B (zh) * 2021-02-18 2021-05-04 广州汇图计算机信息技术有限公司 一种基于异构信息网络的兴趣列表推送***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336836A (zh) * 2013-07-12 2013-10-02 贝壳网际(北京)安全技术有限公司 一种页面搜索方法和页面搜索装置
CN105045864A (zh) * 2015-07-10 2015-11-11 浙江工商大学 一种数字化资源个性化推荐方法
CN109727088A (zh) * 2018-11-08 2019-05-07 深圳壹账通智能科技有限公司 一种基于浏览器的商品推荐方法及装置

Also Published As

Publication number Publication date
CN113392327A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
US20190266202A1 (en) Distributed personal information aggregator
JP5166949B2 (ja) レコメンド情報生成装置およびレコメンド情報生成方法
US9300755B2 (en) System and method for determining information reliability
US9002894B2 (en) Objective and subjective ranking of comments
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US8745067B2 (en) Presenting comments from various sources
US20120158720A1 (en) Social network powered search enhancements
US20120023085A1 (en) Social graph search system
US20080222143A1 (en) Method and system for displaying links to search results with corresponding images
US20060282413A1 (en) System and method for a search engine using reading grade level analysis
JP2000187666A (ja) 関連情報提供システム、嗜好類似度評価システム、情報紹介システム、関心情報取得方法、嗜好類似度評価方法及び記録媒体
CN101154224A (zh) 一种网址导航方法及***
EP1999645A1 (en) System and method for information retrieval
CN103186666A (zh) 基于收藏进行搜索的方法、装置与设备
WO2016162843A1 (en) Processing a search query and retrieving targeted records from a networked database system
CN113392327B (zh) 基于用户网站访问记录的图书推荐方法
KR100861336B1 (ko) 영상 앨범 제공 방법, 영상 앨범 제공 시스템, 영상 등록방법 및 서비스 정보 제공 방법
KR100478924B1 (ko) 다수의 검색 기준을 이용한 커뮤니티 검색 서비스 시스템 및 그 검색 방법
CN111259274A (zh) 信息处理方法、装置、设备以及信息显示装置
JP2012242844A (ja) レコメンド情報生成装置およびレコメンド情報生成方法
JP6056327B2 (ja) 電子商取引サーバ装置
KR20020014026A (ko) 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스
US20150058307A1 (en) Device for rapid provision of information
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치
JP2003067410A (ja) 情報提供システム、サーバコンピュータ、プログラム、及び記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230920

Address after: Building 1, Yard 15, Xiaoyue Middle Road, Fengtai District, Beijing, 100000

Patentee after: Beijing Rentian Bookstore Group Co.,Ltd.

Address before: 256600, No. five, 391 the Yellow River Road, Bincheng District, Shandong, Binzhou

Patentee before: BINZHOU University

TR01 Transfer of patent right