CN111859135B - 适应于新学术平台的匿名用户行为挖掘与资源推荐方法 - Google Patents

适应于新学术平台的匿名用户行为挖掘与资源推荐方法 Download PDF

Info

Publication number
CN111859135B
CN111859135B CN202010712811.XA CN202010712811A CN111859135B CN 111859135 B CN111859135 B CN 111859135B CN 202010712811 A CN202010712811 A CN 202010712811A CN 111859135 B CN111859135 B CN 111859135B
Authority
CN
China
Prior art keywords
user
platform
data
recommendation
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202010712811.XA
Other languages
English (en)
Other versions
CN111859135A (zh
Inventor
赵亮
陶余会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI CHUWA SOFTWARE CO Ltd
Fudan University Press Co ltd
Original Assignee
SHANGHAI CHUWA SOFTWARE CO Ltd
Fudan University Press Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI CHUWA SOFTWARE CO Ltd, Fudan University Press Co ltd filed Critical SHANGHAI CHUWA SOFTWARE CO Ltd
Priority to CN202010712811.XA priority Critical patent/CN111859135B/zh
Publication of CN111859135A publication Critical patent/CN111859135A/zh
Application granted granted Critical
Publication of CN111859135B publication Critical patent/CN111859135B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于数据挖掘与分析、人工智能技术领域,具体为一种适应于新学术平台的匿名用户行为挖掘与资源推荐方法。本发明包括两个部分:(一)适应于新学术平台的匿名用户行为挖掘,以便全面刻画平台用户画像,便于后续为其推荐有用平台资源;(二)基于项集相似性计算的协同过滤个性化推荐,实现精准学术推荐,帮助各类用户从平台获得最大收益。本发明针对实际平台采用行之有效的措施挖掘匿名用户行为特征,对平台用户全方位画像,采用维数简化和项集相似性计算两个过程,在提高精确度的同时减少计算耗费,解决应用协同过滤技术的推荐***所存在的稀疏性和扩展性问题,从而实现高效推荐。

Description

适应于新学术平台的匿名用户行为挖掘与资源推荐方法
技术领域
本发明属于数据挖掘与分析、人工智能技术领域,具体涉及一种适应于新学术平台的匿名用户行为挖掘与个性化推荐方法。
背景技术
新学术平台是自主开发建设的平台(http://fae.shchuwa.cn/),平台提供论文首发***、期刊数字化采编出版***、新世纪人文社科类图书数据库和评价***、学术入门推荐***等功能。涉及的主要技术有:基于领域本体的知识挖掘技术、知识挖掘与知识元自动抽取技术、基于全文内容的分析技术;自然语言处理技术、大数据治理技术等等;句法分析技术、文本分类技术、数据挖掘技术、语义分析技术、机器学***台的建设,首先,是营造出公开透明的科技成果交流共享空间,有助于科研人员公平竞争;其次,是保障优秀科研成果首发权认定,有助于扩大中国科技工作者的国际影响力,促进原创成果涌现;第三,是缩短科技成果发布周期,有助于推动科技成果快速流转、有效转化;第四,打造多维科技论文集成创作平台,突破传统科技论文发表周期长、表达方式单一等诸多限制,实现作者、读者、编审人员的跨时空沟通和零距离管理;第五,与传统学术期刊建立全面合作,有助于出版社自身业务的扩展和深化,打造全新数字出版以及按需出版新业态;第六,在全面、权威学术大数据基础上,建立科学学术评价指标体系,为学术界提供最有价值的分析服务,社会效益显著。
本项目平台既是论文数字出版与科研成果共享平台,也是数字出版业务平台。既能为作者、期刊和其他出版商、普通商业公司提供数字化出版发行服务;又能在平台上销售按需印刷的图书或电子书,实现网络出版和网络营销一体化,为平台拥有者带来直接的经济利益。
平台的大部分***功能深入使用时,要求用户必须成为注册用户,才能使用;但是,不可避免地会存在大量未注册用户浏览和阅读平台文章。对于注册用户,由于填写了必要的信息,针对其特点的推荐比较容易实现;但是大量未注册用户,必须先通过其平台浏览行为,挖掘分析其特点,得出用户画像后,才能实施个性化推荐,从而实现平台更多的经济效益。
本发明提出了一种适应于新学术平台的匿名用户行为挖掘与个性化推荐方法,实现平台各类用户画像,帮助各类用户从平台获得各自的最大收益。
发明内容
本发明的目的在于提供一种能够全面刻画平台用户画像,实现精准学术推荐、帮助各类用户从平台获得最大收益的适应于新学术平台的匿名用户行为挖掘与个性化推荐方法。
本发明方法包括两个部分:(一)适应于新学术平台的匿名用户行为挖掘,以便全面刻画平台用户画像,便于后续为其推荐有用平台资源;(二)基于项集相似性计算的协同过滤个性化推荐,实现精准学术推荐,帮助各类用户从平台获得最大收益。具体步骤为:
为实现上述目的,本发明采用以下技术方案:
(一)适应于新学术平台的匿名用户行为挖掘,包括以下步骤:
步骤1、获取匿名用户在新学术平台的浏览行为数据:
新学术平台自主开发有程序ce.js文件,使得平台具备获取访客行为数据的能力,用户访问新学术平台时,ce.js文件将抓取访客行为信息,访客的运行环境信息等,通过Ajax发送给平台的ce.php处理,ce.php将ce.js发过来的信息处理之后,分配保存到数据库相应的数据表中,便于下一步分析预处理。
步骤2、用户行为数据预处理:
获取的用户行为数据经分别处理后存储到相关的下述3个表中:log_visit,log_action,log_link_visit_action。ce.js可以记录用户、页面浏览、数据转化信息,部分跟踪数据来源于浏览器端Javascript直接获取,如屏幕分辨率、操作***,有些数据来源于服务器PHP解析,如IP地址、user agent。每个独立访客都在cookie中分配一个独立的id。每一次访问都会在log_visit表中创建一行数据。
步骤3抽取用户行为数据特征:
会话是一个用户在一个特定的时间间隔内的路径,路径是用户按时间顺序访问的URL序列,相同的URL可以在一条路径中多次出现;会话的特征分为时间和空间两方面,时间特征包括每页的浏览时间,一段有向路径的浏览时间等;空间特征包括页面的浏览顺序,链接的点击等。如果一个访客两次访问相隔时间超过30分钟,这个访客会在log_visit表中***两条会话数据。每浏览一个页面,log_visit表都会被更新,因为它要储存这个访客的页面访问量、最后页面访问时间等信息。从前述三个预处理获得的表中抽取出与用户行为特征密切相关的特征,便于下一步计算。
本发明主要抽取两个最基本的特征:(1)点击(Hits):截取不同跨度子路径在会话中出现的次数;(2)访问时间(View times):截取会话中不同跨度子路径的访问时间。
步骤4、特征聚类计算:
N-hop表示路径跨度为N;
Figure GDA0002643464690000021
表示两个会话P、Q在跨度为u的子路径集u-level上的相似性;
对于任意u-hop的子路径(u=0,1,...,N),用特征值矩阵HHits和HVT描述其特征,矩阵集由不同跨度子路径的特征矩阵组成。设会话中包含有L个不同的页面,分别是p1到pL,则在u-level的特征值矩阵分别为:
Figure GDA0002643464690000031
Figure GDA0002643464690000032
Figure GDA0002643464690000033
Figure GDA0002643464690000034
Figure GDA0002643464690000035
每个项是跨度为u的有向子路径。
Figure GDA0002643464690000036
Figure GDA0002643464690000037
即相应路径的浏览时间;则:
Figure GDA0002643464690000038
会话P、Q之间的相似性计算就分解为不同跨度的子路径之间的相似性的计算,将其展开为向量,转化为通过计算向量之间的欧几里得距离比较其相似性,距离越小,则越相似,如下:
Figure GDA0002643464690000039
根据数据子集相似性,采用挖掘算法对会话数据集合分类。
所述挖掘算法【1】为:
输入:一组会话S;
输出:一组聚集C={C1,C2,…},Ci∈S;
具体过程为:
(1)C初值为空;
(2)对S中每个会话s;
寻找聚集c,使s和c的质心距离d(s,c)(相似性)最短,记为dmin
如果dmin小于距离阈值Distance,则将s加入c;
否则,将{s}加入C。
距离阈值Distance通常根据一段时间内的数据分析结果进行选取。
通过用户会话的聚集,可以刻画出用户的行为特征,便于下一步根据其特征为其推荐用户最感兴趣的学术资源(如专著、论文、专家等)。
(二)基于项集相似性计算的协同过滤个性化推荐,具体步骤如下:
步骤1、数据准备与表达:
将输入数据表述为一个m×n的用户-项评估矩阵R,m是用户数,n是项数,rij是第i个用户对第j项的评估数值,评估值与项的内容有关,对于本发明针对的新学术平台,项是平台大数据中的图书、论文、专家学者等内容,评估值用数值如1~5等表示感兴趣的级别。
步骤2、计算推荐数据集:
采用推荐算法【2】计算推荐数据集;
所述推荐算法,具体流程为:
输入:用户U、与之对应的已选项集Iu、推荐用户-项评估矩阵R;
对于匿名用户,Iu可以为前述算法获得的一组聚集C;
输出:与Iu最相似的top-N推荐集。
具体过程为:
(1)去掉矩阵R中的稀疏值后规范化,将每行规范化为相同长度,得到矩阵R′;
(2)对矩阵R′进行单值分解,计算相应简化的用户矩阵和项矩阵;
(3)分析用户矩阵,采用向量空间计算方法得到邻居集P;
(4)以邻居集P中的用户为基础,得到矩阵R的大小为m′×n′的子集Rt,m′是邻居集P中的用户数,n′是邻居集P中的项数;
(5)对Iu,在Rt中用条件概率方法计算它的最相似集C′t,C′t=Ct-Iu,Ct是Iu中每个项的相似项(k个)的总和;
(6)将C′中任意项C按sim(C,Iu)排列,最前的N个项作为top-N推荐集。
与现有技术相比,本发明的效益在于:针对实际平台采用行之有效的措施挖掘匿名用户行为特征,对平台用户全方位画像,采用维数简化和项集相似性计算两个过程,提高了精确度的同时减少了计算耗费,解决应用协同过滤技术的推荐***所存在的稀疏性和扩展性问题,从而实现高效推荐。
附图说明
图1为本发明的流程简图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细描述。
在以本发明技术方案为前提下进行使用,以便相关领域的技术人员能更好地理解本发明的技术特点和功能特点,但本发明的保护范围不限于下述使用案例。
在本使用案例中,编程语言采用JavaScript、PHP、Java语言编写;新学术平台全部是自主开发的包含多个应用***的服务于学术研究的平台,在此平台实现匿名用户行为挖掘与学术资源推荐,具体过程如下:
S1、将一段JavaScript代码ce.js植入新学术平台,完整捕获平台用户行为数据;
S2、对S1获取的数据进行过滤与特征抽取(采用发明(一)中的步骤2和步骤3所述方法);
S3、采用前述(一)步骤4中的挖掘算法,计算出用户行为特征向量(空间)C,作为下面S4中的已选项集Iu
S4、按前述(二)中的步骤1准备好数据(新学术平台所有学术资源的向量空间构建)与表达;
S5、按前述(二)中的步骤2提供的推荐算法,计算出推荐数据集。
参考文献
1.名用户的网络浏览特征挖掘.赵亮,张守志,范晓锋.《计算机研究与发展》第39卷第12期,2002年12月.
2.个性化推荐算法设计.赵亮,胡乃静,张守志.《计算机研究与发展》第39卷第8期,2002年12月.。

Claims (1)

1.一种适应于新学术平台的匿名用户行为挖掘与资源推荐方法,其特征在于,包括两个主步骤:(一)适应于新学术平台的匿名用户行为挖掘,以便全面刻画平台用户画像,便于后续为其推荐有用平台资源;(二)基于项集相似性计算的协同过滤个性化推荐,实现精准学术推荐,帮助各类用户从平台获得最大收益;具体步骤为:
(一)适应于新学术平台的匿名用户行为挖掘,具体步骤为:
步骤1、获取匿名用户在新学术平台的浏览行为数据:
新学术平台具有程序ce.js文件,使得平台具备获取访客行为数据的能力,用户访问新学术平台时,ce.js文件将抓取访客行为信息、访客的运行环境信息,通过Ajax发送给平台的ce.php处理,ce.php将ce.js发过来的信息处理之后,分配保存到数据库相应的数据表中,便于下一步分析预处理;
步骤2、用户行为数据预处理:
获取的用户行为数据经分别处理后存储到相关的下述3个表中:log_visit,log_action,log_link_visit_action;ce.js记录用户、页面浏览、数据转化信息,部分跟踪数据包括屏幕分辨率、操作***,来源于浏览器端Javascript直接获取;有些数据包括IP地址、user agent,来源于服务器PHP解析;每个独立访客都在cookie中分配一个独立的id;每一次访问都在log_visit表中创建一行数据;
步骤3抽取用户行为数据特征:
会话是一个用户在一个特定的时间间隔内的路径,路径是用户按时间顺序访问的URL序列,相同的URL可以在一条路径中多次出现;会话的特征分为时间和空间两个方面,时间特征包括每页的浏览时间、一段有向路径的浏览时间;空间特征包括页面的浏览顺序、链接的点击;如果一个访客两次访问相隔时间超过30分钟,这个访客在log_visit表中***两条会话数据;每浏览一个页面、log_visit表都被更新,因为它要储存这个访客的页面访问量、最后页面访问时间信息;从步骤2中所述三个预处理获得的表中抽取出与用户行为特征密切相关的特征,便于下一步计算;
抽取的特征主要为两个:(1)点击:截取不同跨度子路径在会话中出现的次数;(2)访问时间:截取会话中不同跨度子路径的访问时间;
步骤4、特征聚类计算:
设N-hop表示路径跨度为N;
Figure FDA0003588339760000011
表示两个会话P、Q在跨度为u的子路径集u-level上的相似性;对于任意u-hop的子路径(u=0,1,...,N),用特征值矩阵HHits和HVT描述其特征,矩阵集由不同跨度子路径的特征矩阵组成;设会话中包含有L个不同的页面,分别是p1到pL,则在u-level的特征值矩阵分别为:
Figure FDA0003588339760000021
Figure FDA0003588339760000022
Figure FDA0003588339760000023
Figure FDA0003588339760000024
Figure FDA0003588339760000025
每个项是跨度为u的有向子路径,
Figure FDA0003588339760000026
Figure FDA0003588339760000027
即相应路径的浏览时间;则:
Figure FDA0003588339760000028
会话P、Q之间的相似性计算分解为不同跨度的子路径之间的相似性的计算,将其展开为向量,转化为通过计算向量之间的欧几里得距离比较其相似性,距离越小越相似;具体如下:
Figure FDA0003588339760000029
根据数据子集相似性,采用挖掘算法对会话数据集合分类;
(二)基于项集相似性计算的协同过滤个性化推荐,具体步骤如下:
步骤1、数据准备与表达:
将输入数据表述为一个m×n的用户-项评估矩阵R,m是用户数,n是项数,rij是第i个用户对第j项的评估数值,评估值与项的内容有关,所述项是平台大数据中的图书、论文、专家学者内容,评估值用数值1~5表示感兴趣的级别;
步骤2、计算推荐数据集:
采用推荐算法计算得到推荐数据集;
(一)步骤4中所述挖掘算法,其流程为:
输入:一组会话S;
输出:一组聚集C=*C1,C2,…+,Ci∈S;
具体过程为:
(1)C初值为空;
(2)对S中每个会话s;
寻找聚集c,使s和c的质心距离d(s,c)最短,记为dmin
如果dmin小于距离阈值Distance,则将s加入c;
否则,将{s}加入C;
距离阈值Distance根据一段时间内的数据分析结果进行选取;
通过用户会话的聚集,可以刻画出用户的行为特征,便于下一步根据其特征为其推荐用户最感兴趣的学术资源;
(二)步骤2中所述推荐算法,其流程为:
输入:用户U、与之对应的已选项集Iu、推荐用户-项评估矩阵R;
对于匿名用户,Iu为挖掘算法获得的一组聚集,记为C;
输出:与Iu最相似的top-N推荐集;
具体过程为:
(1)去掉矩阵R中的稀疏值后规范化,将每行规范化为相同长度,得到矩阵R′;
(2)对矩阵R′进行单值分解,计算相应简化的用户矩阵和项矩阵;
(3)分析用户矩阵,采用向量空间计算方法得到邻居集P;
(4)以邻居集P中的用户为基础,得到矩阵R的大小为m′×n′的子集Rt,m′是邻居集P中的用户数,n′是邻居集P中的项数;
(5)对Iu,在Rt中用条件概率方法计算它的最相似集Ct′,Ct′=Ct-Iu,Ct是Iu中每个项的相似项(k个)的总和;
(6)将C′中任意项C按sim(C,Iu)排列,最前的N个项作为top-N推荐集。
CN202010712811.XA 2020-07-22 2020-07-22 适应于新学术平台的匿名用户行为挖掘与资源推荐方法 Expired - Fee Related CN111859135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010712811.XA CN111859135B (zh) 2020-07-22 2020-07-22 适应于新学术平台的匿名用户行为挖掘与资源推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010712811.XA CN111859135B (zh) 2020-07-22 2020-07-22 适应于新学术平台的匿名用户行为挖掘与资源推荐方法

Publications (2)

Publication Number Publication Date
CN111859135A CN111859135A (zh) 2020-10-30
CN111859135B true CN111859135B (zh) 2022-08-02

Family

ID=72949262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010712811.XA Expired - Fee Related CN111859135B (zh) 2020-07-22 2020-07-22 适应于新学术平台的匿名用户行为挖掘与资源推荐方法

Country Status (1)

Country Link
CN (1) CN111859135B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076476B (zh) * 2021-04-01 2021-11-30 重庆邮电大学 一种微博异构信息的用户画像构建方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN103678620A (zh) * 2013-12-18 2014-03-26 国家电网公司 一种基于用户历史行为特征的知识文档推荐方法
CN103778145A (zh) * 2012-10-22 2014-05-07 ***通信集团广东有限公司 一种信息推荐方法和***
CN108388508A (zh) * 2018-01-29 2018-08-10 华南理工大学 一种基于用户会话和层次聚类算法的测试用例选择方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458B (zh) * 2008-09-27 2012-09-19 华为技术有限公司 一种基于协同过滤的推荐方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN103778145A (zh) * 2012-10-22 2014-05-07 ***通信集团广东有限公司 一种信息推荐方法和***
CN103678620A (zh) * 2013-12-18 2014-03-26 国家电网公司 一种基于用户历史行为特征的知识文档推荐方法
CN108388508A (zh) * 2018-01-29 2018-08-10 华南理工大学 一种基于用户会话和层次聚类算法的测试用例选择方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于推荐权重和动态可靠近邻的协同过滤算法";郑上;《万方数据库》;20170630;第28-33页 *

Also Published As

Publication number Publication date
CN111859135A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
Bucur Using opinion mining techniques in tourism
CN101794311B (zh) 基于模糊数据挖掘的中文网页自动分类方法
CN110968782B (zh) 一种面向学者的用户画像构建及应用方法
CN107705066A (zh) 一种商品入库时信息录入方法及电子设备
CN108021651B (zh) 一种网络舆情风险评估方法及装置
Manley et al. A review of machine learning and big data applications in addressing ecosystem service research gaps
CN106095966B (zh) 一种用户可扩展的标签标注方法及***
CN106462807A (zh) 根据大规模非结构化数据学习多媒体语义
CN114238573A (zh) 基于文本对抗样例的信息推送方法及装置
CN111767725A (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN105912684B (zh) 基于视觉特征和语义特征的跨媒体检索方法
Liang et al. Co-clustering WSDL documents to bootstrap service discovery
Neelima et al. An overview on web usage mining
CN111859135B (zh) 适应于新学术平台的匿名用户行为挖掘与资源推荐方法
CN103095849A (zh) 基于QoS属性预测和纠错的有监督Web服务发现方法及***
CN110717089A (zh) 一种基于网络日志的用户行为分析***及方法
CN108595466B (zh) 一种互联网信息过滤以及互联网用户信息和网帖结构分析方法
CN104462241A (zh) 基于url中锚文字和周边文本的人口属性分类方法及装置
Chen et al. Hybrid deep collaborative filtering for job recommendation
Di Corso et al. Towards automated visualisation of scientific literature
Pujar et al. A systematic review web content mining tools and its applications
Yuliang et al. A novel approach for Web page modeling in personal information extraction
Priyatam et al. Don't Use a Lot When Little Will Do: Genre Identification Using URLs.
Liu et al. Tagging items automatically based on both content information and browsing behaviors
Prasad et al. Face-Based Alumni Tracking on Social Media Using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220802