CN111914173B - 内容处理方法、装置、计算机***和存储介质 - Google Patents

内容处理方法、装置、计算机***和存储介质 Download PDF

Info

Publication number
CN111914173B
CN111914173B CN202010786109.8A CN202010786109A CN111914173B CN 111914173 B CN111914173 B CN 111914173B CN 202010786109 A CN202010786109 A CN 202010786109A CN 111914173 B CN111914173 B CN 111914173B
Authority
CN
China
Prior art keywords
content
user
target content
interest
electronic book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010786109.8A
Other languages
English (en)
Other versions
CN111914173A (zh
Inventor
陈祥旭
宋堃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010786109.8A priority Critical patent/CN111914173B/zh
Publication of CN111914173A publication Critical patent/CN111914173A/zh
Application granted granted Critical
Publication of CN111914173B publication Critical patent/CN111914173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种内容处理方法、内容处理装置、计算机***和计算机可读存储介质,涉及计算机视觉、深度学习和云计算领域。具体实现方案为:获取用户视线指向的电子书中的目标内容;对目标内容进行分析,确定目标内容的特征信息;根据目标内容的特征信息预测用户感兴趣的内容;以及摘抄用户感兴趣的内容。在本公开的实现方案中,例如可以利用深度学习算法确定目标内容的特征信息,将目标内容的特征信息发给云端服务器预测用户感兴趣的内容。

Description

内容处理方法、装置、计算机***和存储介质
技术领域
本公开涉及计算机视觉、深度学习和云计算领域,更具体地,涉及一种内容处理方法、一种内容处理装置、一种计算机***和一种计算机可读存储介质。
背景技术
随着移动终端的普及,电子书阅读方式越来越符合读者的阅读习惯,移动终端上的阅读产值和份额不断扩大。相比于传统纸质图书,电子书具有快捷、便携、低碳、环保等特征。
但从阅读的角度来看,无论是阅读纸质书还是阅读电子书,读者对于阅读本身获取信息及知识的本质是一样的,读者都会有摘抄书籍内容的习惯。根据相关线上数据统计,读者摘抄书籍内容总量及频次数据量庞大,反映出读者对于书籍内容摘抄的需求旺盛。当前,当读者阅读电子书时,如果想要摘抄电子书中的内容,需要手动截取并选中相关内容片段,之后形成摘抄。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:通过用户手动截取并选中相关内容片段的摘抄方式,导致用户操作路径和耗时都比较长,并且容易中断用户阅读,打断用户阅读思路,降低了阅读的流畅度和阅读体验。
发明内容
有鉴于此,本公开提供了一种内容处理方法、一种内容处理装置、一种计算机***和一种计算机可读存储介质。
本公开的一个方面提供了一种内容处理方法,包括:获取用户视线指向的电子书中的目标内容;对上述目标内容进行分析,确定上述目标内容的特征信息;根据上述目标内容的特征信息预测上述用户感兴趣的内容;以及摘抄上述用户感兴趣的内容。
本公开的另一个方面提供了一种内容处理装置,包括:获取模块,用于获取用户视线指向的电子书中的目标内容;确定模块,用于对上述目标内容进行分析,确定上述目标内容的特征信息;预测模块,用于根据上述目标内容的特征信息预测上述用户感兴趣的内容;以及摘抄模块,用于摘抄上述用户感兴趣的内容。
本公开的另一方面提供了一种计算机***,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述方法。
根据本公开的实施例,通过在用户阅读电子书的过程中,基于用户实时阅读的目标内容对用户感兴趣的内容进行预测,可以***用户喜欢的书籍内容并自动摘抄,改善了传统的低效摘抄方式,所以至少部分地克服了相关技术中用户通过手动截取并选中相关内容片段的摘抄方式,导致用户操作路径和耗时都比较长,并且容易中断用户阅读的技术问题,进而达到了提高用户阅读的流畅度和阅读体验的技术效果。。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1示意性示出了根据本公开实施例的可以应用内容处理方法及装置的示例性***架构;
图2示意性示出了根据本公开实施例的内容处理方法的流程图;
图3示意性示出了根据本公开实施例的根据目标内容的特征信息预测用户感兴趣的内容的流程图;
图4示意性示出了根据本公开实施例的用户在阅读电子书的过程中进行内容摘抄的应用场景图;
图5示意性示出了根据本公开实施例的获取用户视线指向的电子书中的目标内容的流程图;
图6示意性示出了根据本公开另一实施例的内容处理方法的流程图;
图7示意性示出了根据本公开实施例的内容处理装置的框图;以及
图8示意性示出了根据本公开实施例的适于实现内容处理方法的计算机***的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
本公开的实施例提供了一种内容处理方法装置,该方法包括:获取用户视线指向的电子书中的目标内容;对目标内容进行分析,确定目标内容的特征信息;根据目标内容的特征信息预测用户感兴趣的内容;以及摘抄用户感兴趣的内容。
图1示意性示出了根据本公开实施例的可以应用内容处理方法及装置的示例性***架构。
需要注意的是,图1所示仅为可以应用本公开实施例的***架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、***、环境或场景。例如,在另一实施例中,可以应用内容处理方法及装置的示例性***架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的内容处理方法及装置。
如图1所示,根据该实施例的***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的内容处理方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的内容处理装置也可以设置于终端设备101、102、或103中。
或者,本公开实施例所提供的内容处理方法一般也可以由服务器105执行。相应地,本公开实施例所提供的内容处理装置一般可以设置于服务器105中。本公开实施例所提供的内容处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的内容处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
例如,在用户在线阅读电子书时,终端设备101、102、103可以获取用户视线指向的电子书中的目标内容,然后将获取的目标内容发送给服务器105,由服务器105对目标内容进行分析,确定目标内容的特征信息;根据目标内容的特征信息预测用户感兴趣的内容;以及摘抄用户感兴趣的内容。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对目标内容进行分析,并最终实现摘抄用户感兴趣的内容。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图2示意性示出了根据本公开实施例的内容处理方法的流程图。
如图2所示,该方法包括操作S210~S240。
在操作S210,获取用户视线指向的电子书中的目标内容。
根据本公开的实施例,在用户阅读电子书时,可以通过视线追踪技术,先确定用户视线指向的电子书中的区域,然后识别用户目光注视的该区域中的内容。
在操作S220,对目标内容进行分析,确定目标内容的特征信息。
根据本公开的实施例,可以通过对目标内容进行语义分析来确定目标内容的标签,其中,标签可以作为目标内容的特征信息,标签可以指示目标内容的风格类型。
根据本公开的实施例,标签的类型不做限定,例如,标签的类型包括但不限于如情感、理论、哲学、励志、商业等其他风格类型的标签。
根据本公开的实施例,例如,通过对目标内容进行语义分析提炼出目标内容的标签为商业风格的标签,说明用户比较喜欢商业风格的文章或书籍。
在操作S230,根据目标内容的特征信息预测用户感兴趣的内容。
根据本公开的实施例,根据目标内容的特征信息预测用户感兴趣的内容可以包括:预测用户在本次阅读电子书时剩余的未阅读的内容中用户感兴趣的内容;对于用户已经阅读过的内容,由于可能存在因用户浏览速度过快而没有注意到该内容,导致遗漏了重要的内容,因此,本公开的实施例也可以预测用户在本次阅读电子书时已经阅读过的内容中用户感兴趣的内容。
根据本公开的实施例,根据目标内容的特征信息预测用户感兴趣的内容还可以包括:预测用户还没有阅读过的其他电子书中的内容。
在操作S240,摘抄用户感兴趣的内容。
根据本公开的实施例,在预测得到用户感兴趣的内容之后,电子设备可以自动摘抄用户感兴趣的内容。相比于根据用户特征对用户喜好进行产品推荐而言,本公开的实施例可以进一步实现在用户无感知的情况下,无需用户在电子书中进行手动标注,手动选中内容,可以自动生成摘抄,而不打断用户正常的阅读思路。
根据本公开的实施例,在用户阅读电子书的过程中,可以根据目标内容的特征信息生成推荐书籍,在预测用户还没有阅读过的其他电子书中的内容时,可以自动生成推荐书籍全文个性化的内容摘抄,推荐给用户,使得可以提高书籍推荐到实际阅读的转化率。
根据本公开的实施例,对于用户阅读的非主动推荐的书籍,例如因用户搜索而展示的书籍,也可以自动生成书籍全文个性化的内容摘抄,提高阅读转化率。
根据本公开的实施例,自动摘抄得到的用户感兴趣的内容可以存储在电子设备中,并可以响应于用户操作进行展示。例如,将自动摘抄得到的用户感兴趣的内容以文档的形式存储在电子设备中,用户可以点击文档以展示摘抄内容。
根据本公开的实施例,在用户阅读电子书的过程中,还可以改变用户感兴趣的内容的展示方式,以便将用户感兴趣的内容与电子书中的其他内容进行区别展示。
例如,在用户阅读电子书的过程中,可以***用户感兴趣的内容,然后将用户感兴趣的内容进行高亮显示,或者,在用户感兴趣的内容下方添加下划线等等。
根据本公开的实施例,在用户阅读电子书的过程中,可以***用户感兴趣的内容,自动生成全文摘抄,供用户阅读,从而提高用户阅读效率。
根据本公开的实施例,在用户阅读电子书时,通过获取用户视线指向的电子书中的目标内容,然后对用户视线指向的目标内容进行分析,确定目标内容的特征信息,根据特征信息对用户感兴趣的内容进行预测,并实现自动摘抄。通过在用户阅读电子书的过程中,基于用户实时阅读的目标内容对用户感兴趣的内容进行预测,可以***用户喜欢的书籍内容并自动摘抄,改善了传统的低效摘抄方式,所以至少部分地克服了相关技术中用户通过手动截取并选中相关内容片段的摘抄方式,导致用户操作路径和耗时都比较长,并且容易中断用户阅读的技术问题,进而达到了提高用户阅读的流畅度和阅读体验的技术效果。
下面参考图3~图6,结合具体实施例对图2所示的方法做进一步说明。
图3示意性示出了根据本公开实施例的根据目标内容的特征信息预测用户感兴趣的内容的流程图。
如图3所示,该方法包括操作S310~S330。
在操作S310,根据目标内容的特征信息确定用户的用户画像。
根据本公开的实施例,可以对目标内容的特征信息提炼内容标签,形成用户画像。例如,对目标内容的特征信息提炼出包括商业和理论等特征,那么,可以确定该用户的用户画像可能是商人,比较喜欢商业理论和商业案例。
根据本公开的实施例,可以利用深度学习大数据分析模块根据内容标签形成用户画像。
在操作S320,根据用户画像对电子书中多个区域内的内容分别进行预测,确定每个区域的预测评估值。
根据本公开的实施例,电子书中的多个区域可以是展示有不同内容的区域,其中,区域可以用段落进行划分,例如,一个区域可以对应于一个段落,或者,一个区域对应于三个段落等等。
根据本公开的实施例,在形成用户画像之后,可以根据确定的用户画像对每个区域内的内容进行预测,确定每个区域的预测评估值。具体地,可以对推荐书籍全文内容进行逐句检索,将书籍内容和用户画像进行匹配打分,以确定每个区域的预测评估值。
在操作S330,根据每个区域的预测评估值预测用户感兴趣的内容。
根据本公开的实施例,根据每个区域的预测评估值,一方面可以进行相关书籍推荐,另一方面,可以***用户喜欢的内容。
根据本公开的实施例,根据每个区域的预测评估值预测用户感兴趣的内容时,可以将每个区域的预测评估值与预设阈值进行比较,预设阈值例如可以包括第一评估阈值和第二评估阈值。
根据本公开的实施例,可以将预测评估值高于第一评估阈值的区域内的内容确定为用户感兴趣的内容。
根据本公开的实施例,第一评估阈值的大小可以根据实际情况进行确定,例如,第一评估阈值的大小为0.9,那么,可以将预测评估值高于0.9的区域内的内容确定为用户感兴趣的内容。
根据本公开的实施例,将预测评估值低于第一评估阈值且高于第二评估阈值的区域内的内容确定为用户可能感兴趣的内容。
根据本公开的实施例,第二评估阈值的大小可以根据实际情况进行确定,例如,第二评估阈值的大小为0.6,那么,可以将预测评估值低于0.9,高于0.6的区域内的内容确定为用户感兴趣的内容。
根据本公开的实施例,对于用户可能感兴趣的内容,可以响应于用户操作之后,再进行自动摘抄。
具体地,例如,可以在预测评估值低于第一评估阈值且高于第二评估阈值的区域展示提示信息,然后响应于用户观察到提示信息后触发的摘抄操作,自动摘抄用户可能感兴趣的内容。
根据本公开的实施例,该提示信息例如可以是“收藏一下吧”,或者“这个区域的内容可自动摘抄”。如果用户观察到提示信息后,确实想对该部分内容进行摘抄,可以触发一键收藏的功能,实现自动摘抄该用户可能感兴趣的内容。
图4示意性示出了根据本公开实施例的用户在阅读电子书的过程中进行内容摘抄的应用场景图。
如图4所示,用户当前视线指向电子书中的虚线区域部分,然后对虚线区域内的目标内容进行分析,确定目标内容的特征信息,随后可以根据目标内容的特征信息预测用户感兴趣的内容。对于用户感兴趣的内容可以在用户无感知的情况下自动摘抄。对于用户可能感兴趣的内容,可以主动提示“收藏一下吧”,在用户点击“收藏一下吧”的情况下,可以实现自动摘抄该用户可能感兴趣的内容。根据本公开的实施例,还可以在电子书中显示“智能摘抄”这一控件,用于开启视线追踪功能。
根据本公开的实施例,可以根据用户画像***用户感兴趣的书籍内容,对于预测评估值比较高的内容自动形成书籍内容摘抄,对于预测评估值中等的,可以主动提示用户摘抄,用户可以一键实现收藏,提高摘抄效率。
根据本公开的实施例,在用户阅读电子书的过程中,还可以基于获取到的目标内容的特征信息更新用户画像。
根据本公开的实施例,为了提高预测准确度,在用户阅读电子书的过程中,可以对获取到的目标内容的特征信息进行分析,通过提高或降低用户画像中相应标签的权重,更新并完善用户画像,根据更新后的用户画像预测用户感兴趣的内容。
例如,对于用户视线指向的区域并多次阅读的内容自动提示一键收藏,根据用户是否进行一键收藏操作,相应的提高或降低用户画像中相应标签的权重,从而更新用户画像,以完善用户画像。
或者,根据用户阅读预测摘抄的反馈信息,包括用户是否阅读、阅读时长、阅读频次、是否一键收藏等,相应的提高或降低用户画像中相应标签的权重,从而更新用户画像,以完善用户画像。
根据本公开的实施例,在用户阅读电子书时,通过视线追踪技术,识别用户目光注视的内容。通常情况下,用户想要摘抄的内容一般会进行二次及以上阅读,此时可智能识别用户阅读频次高的内容,在用户无感知的情况下,自动生成摘抄,不打断用户正常的阅读思路。
图5示意性示出了根据本公开实施例的获取用户视线指向的电子书中的目标内容的流程图。
如图5所示,该方法包括操作S510~S530。
在操作S510,在用户阅读电子书的过程中,采用视线追踪技术跟踪用户阅读的内容。
根据本公开的实施例,视线追踪技术可以使用目前较为成熟的眼球追踪技术,确定用户视线在电子书上的注视区域,根据注视区域确定用户阅读的内容。
在操作S520,计算用户对阅读的内容的阅读频次。
根据本公开的实施例,阅读频次可以表征用户在一段时间内对电子书内容的喜好程度。阅读频次越高,用户可能越喜欢这部分内容。根据本公开的实施例,可以计算用户在一段时间内对相同位置的内容进行阅读的阅读频次。例如,用户在3分钟之内阅读了3次相同位置的内容,那么阅读频次为3分钟3次。当然,用户对阅读的内容的阅读频次也可以不限定在一段时间内,而只计算用户对阅读的总次数。
在操作S530,将阅读频次满足预设条件的内容确定为目标内容。
根据本公开的实施例,预设条件可以根据实际情况进行设定,例如,预设条件可以是大于等于2次。
根据本公开的实施例,例如,用户对某一内容的阅读频次为3次,大于等于2次,可以将用户阅读的该内容确定为目标内容。
根据本公开的实施例,根据阅读频次确定目标内容,可以提高摘抄准确度。
图6示意性示出了根据本公开另一实施例的内容处理方法的流程图。
如图6所示,该方法包括操作S601~S610。
在操作S601,展示电子书。
在操作S602,用户阅读上述展示的电子书。
在操作S603,利用视线追踪技术进行视线追踪。
在操作S604,标记阅读频次高的内容。在用户阅读电子书时,通过视线追踪,实时跟踪用户阅读内容,并标记用户阅读频次高的内容,执行操作S610,自动形成摘抄内容。
在操作S605,上传摘抄内容至后台服务器。
在操作S606,提炼内容标签。
在操作S607,形成用户画像。移动设备端可以将摘抄的内容上传至后台,通过语义理解,提炼出内容标签,比如,情感、理论、哲学、优美等等标签,最后,通过大数据分析,形成用户画像,包括用户喜欢什么类型的书籍,什么语言风格的书籍等等。
在操作S608,智能预测。根据用户画像,可以***电子书中用户喜欢的书籍内容,对于预测评估值比较高的内容可以自动形成书籍内容摘抄,对于预测评估值中等的内容可以自动提示摘抄。通过用户画像,可以完善书籍推荐***,推荐不同的电子书,以实现更加精准的推荐,提高推荐转化率。
在操作S609,自主提示摘抄。
在操作S610,形成摘抄内容。
根据本公开的实施例,可以结合人工智能视线追踪技术,在用户无感知,且不打断用户阅读的情况下,实现自动摘抄,此外,结合大数据分析,精准预判用户喜欢的文章内容,实现多维度的自动摘抄和智能摘抄提示,可以较好的改善传统的低效的摘抄方式,提供给用户更好的阅读体验。
图7示意性示出了根据本公开实施例的内容处理装置的框图。
如图7所示,内容处理装置700包括:获取模块710、确定模块720、预测模块730和摘抄模块740。
获取模块710用于获取用户视线指向的电子书中的目标内容。
确定模块720用于对目标内容进行分析,确定目标内容的特征信息。
预测模块730用于根据目标内容的特征信息预测用户感兴趣的内容。
摘抄模块740用于摘抄用户感兴趣的内容。
根据本公开的实施例,在用户阅读电子书时,通过获取用户视线指向的电子书中的目标内容,然后对用户视线指向的目标内容进行分析,确定目标内容的特征信息,根据特征信息对用户感兴趣的内容进行预测,并实现自动摘抄。通过在用户阅读电子书的过程中,基于用户实时阅读的目标内容对用户感兴趣的内容进行预测,可以***用户喜欢的书籍内容并自动摘抄,改善了传统的低效摘抄方式,所以至少部分地克服了相关技术中用户通过手动截取并选中相关内容片段的摘抄方式,导致用户操作路径和耗时都比较长,并且容易中断用户阅读的技术问题,进而达到了提高用户阅读的流畅度和阅读体验的技术效果。
根据本公开的实施例,预测模块730包括:第一确定单元、第二确定单元和预测单元。
第一确定单元用于根据目标内容的特征信息确定用户的用户画像。
第二确定单元用于根据用户画像对电子书中多个区域内的内容分别进行预测,确定每个区域的预测评估值。
预测单元用于根据每个区域的预测评估值预测用户感兴趣的内容。
根据本公开的实施例,上述内容处理装置700还包括更新模块,用于在所述用户阅读所述电子书的过程中,基于获取到的目标内容的特征信息更新所述用户画像。
根据本公开的实施例,预测单元用于将预测评估值高于第一评估阈值的区域内的内容确定为用户感兴趣的内容。
根据本公开的实施例,预测单元还用于:将预测评估值低于第一评估阈值且高于第二评估阈值的区域内的内容确定为用户可能感兴趣的内容。
根据本公开的实施例,摘抄模块包括:展示单元和摘抄单元。
展示单元用于在预测评估值低于第一评估阈值且高于第二评估阈值的区域展示提示信息。
摘抄单元用于响应于用户观察到提示信息后触发的摘抄操作,摘抄用户可能感兴趣的内容。
根据本公开的实施例,获取模块710包括:跟踪单元、计算单元和第三确定单元。
跟踪单元用于在用户阅读电子书的过程中,采用视线追踪技术跟踪用户阅读的内容。
计算单元用于计算用户对阅读的内容的阅读频次。
第三确定单元用于将阅读频次满足预设条件的内容确定为目标内容。
根据本公开的实施例,确定模块720用于通过对目标内容进行语义分析来确定目标内容的标签,其中,标签指示了目标内容的风格类型。
根据本公开的实施例,内容处理装置700还包括处理模块,用于在用户阅读电子书的过程中,改变用户感兴趣的内容的展示方式,以便将用户感兴趣的内容与电子书中的其他内容进行区别展示。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块710、确定模块720、预测模块730和摘抄模块740中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块710、确定模块720、预测模块730和摘抄模块740中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块710、确定模块720、预测模块730和摘抄模块740中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
需要说明的是,本公开的实施例中内容处理装置部分与本公开的实施例中内容处理方法部分是相对应的,内容处理装置部分的描述具体参考内容处理方法部分,在此不再赘述。
图8示意性示出了根据本公开实施例的适于实现上文描述的方法的计算机***的框图。图8示出的计算机***仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的计算机***800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有***800操作所需的各种程序和数据。处理器801、ROM 802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,***800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。***800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
根据本公开的实施例,还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时可以实现上述任意实施例的方法。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种内容处理方法,包括:
获取用户视线指向的电子书中的目标内容;
对所述目标内容进行分析,确定所述目标内容的特征信息;
根据所述目标内容的特征信息预测用户感兴趣的内容;以及
摘抄所述用户感兴趣的内容;
其中,根据所述目标内容的特征信息预测所述用户感兴趣的内容包括:
根据所述目标内容的特征信息确定所述用户的用户画像;
根据所述用户画像对所述电子书中多个区域内的内容分别进行预测,确定每个所述区域的预测评估值;以及
根据每个所述区域的预测评估值预测所述用户感兴趣的内容。
2.根据权利要求1所述的方法,其中,根据每个所述区域的预测评估值预测所述用户感兴趣的内容包括:
将预测评估值高于第一评估阈值的区域内的内容确定为所述用户感兴趣的内容。
3.根据权利要求1或2所述的方法,其中,
根据每个所述区域的预测评估值预测所述用户感兴趣的内容包括:
将预测评估值低于第一评估阈值且高于第二评估阈值的区域内的内容确定为所述用户可能感兴趣的内容;
摘抄所述用户感兴趣的内容包括:
在所述预测评估值低于第一评估阈值且高于第二评估阈值的区域展示提示信息;以及
响应于所述用户观察到所述提示信息后触发的摘抄操作,摘抄所述用户可能感兴趣的内容。
4.根据权利要求1所述的方法,还包括:
在所述用户阅读所述电子书的过程中,基于获取到的目标内容的特征信息更新所述用户画像。
5.根据权利要求1所述的方法,其中,获取用户视线指向的电子书中的目标内容包括:
在所述用户阅读所述电子书的过程中,采用视线追踪技术跟踪所述用户阅读的内容;
计算所述用户对阅读的内容的阅读频次;以及
将阅读频次满足预设条件的内容确定为所述目标内容。
6.根据权利要求1所述的方法,其中,对所述目标内容进行分析,确定所述目标内容的特征信息包括:
通过对所述目标内容进行语义分析来确定所述目标内容的标签,其中,所述标签指示了所述目标内容的风格类型。
7.根据权利要求1所述的方法,还包括:
在所述用户阅读所述电子书的过程中,改变所述用户感兴趣的内容的展示方式,以便将所述用户感兴趣的内容与所述电子书中的其他内容进行区别展示。
8.一种内容处理装置,包括:
获取模块,用于获取用户视线指向的电子书中的目标内容;
确定模块,用于对所述目标内容进行分析,确定所述目标内容的特征信息;
预测模块,用于根据所述目标内容的特征信息预测用户感兴趣的内容;以及
摘抄模块,用于摘抄所述用户感兴趣的内容;
其中,所述预测模块包括:
第一确定单元,用于根据所述目标内容的特征信息确定所述用户的用户画像;
第二确定单元,用于根据所述用户画像对所述电子书中多个区域内的内容分别进行预测,确定每个所述区域的预测评估值;以及
预测单元,用于根据每个所述区域的预测评估值预测所述用户感兴趣的内容。
9.根据权利要求8所述的装置,其中,所述预测单元用于:
将预测评估值高于第一评估阈值的区域内的内容确定为所述用户感兴趣的内容。
10.根据权利要求8或9所述的装置,其中,
所述预测单元还用于:
将预测评估值低于第一评估阈值且高于第二评估阈值的区域内的内容确定为所述用户可能感兴趣的内容;
所述摘抄模块包括:
展示单元,用于在所述预测评估值低于第一评估阈值且高于第二评估阈值的区域展示提示信息;以及
摘抄单元,用于响应于所述用户观察到所述提示信息后触发的摘抄操作,摘抄所述用户可能感兴趣的内容。
11.根据权利要求8所述的装置,还包括:
更新模块,用于在所述用户阅读所述电子书的过程中,基于获取到的目标内容的特征信息更新所述用户画像。
12.根据权利要求8所述的装置,其中,所述获取模块包括:
跟踪单元,用于在所述用户阅读所述电子书的过程中,采用视线追踪技术跟踪所述用户阅读的内容;
计算单元,用于计算所述用户对阅读的内容的阅读频次;以及
第三确定单元,用于将阅读频次满足预设条件的内容确定为所述目标内容。
13.根据权利要求8所述的装置,其中,所述确定模块用于:
通过对所述目标内容进行语义分析来确定所述目标内容的标签,其中,所述标签指示了所述目标内容的风格类型。
14.根据权利要求8所述的装置,还包括:
处理模块,用于在所述用户阅读所述电子书的过程中,改变所述用户感兴趣的内容的展示方式,以便将所述用户感兴趣的内容与所述电子书中的其他内容进行区别展示。
15.一种计算机***,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任一项所述的方法。
16.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至7中任一项所述的方法。
CN202010786109.8A 2020-08-06 2020-08-06 内容处理方法、装置、计算机***和存储介质 Active CN111914173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010786109.8A CN111914173B (zh) 2020-08-06 2020-08-06 内容处理方法、装置、计算机***和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010786109.8A CN111914173B (zh) 2020-08-06 2020-08-06 内容处理方法、装置、计算机***和存储介质

Publications (2)

Publication Number Publication Date
CN111914173A CN111914173A (zh) 2020-11-10
CN111914173B true CN111914173B (zh) 2024-02-23

Family

ID=73287633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010786109.8A Active CN111914173B (zh) 2020-08-06 2020-08-06 内容处理方法、装置、计算机***和存储介质

Country Status (1)

Country Link
CN (1) CN111914173B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115994717B (zh) * 2023-03-23 2023-06-09 中国科学院心理研究所 一种用户评估方式确定方法、***、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107066085A (zh) * 2017-01-12 2017-08-18 惠州Tcl移动通信有限公司 一种基于眼球追踪控制终端的方法及装置
US10255249B1 (en) * 2014-12-23 2019-04-09 Amazon Technologies, Inc. Previewing electronic book content within third-party websites
CN110032350A (zh) * 2019-04-16 2019-07-19 维沃移动通信有限公司 一种信息处理方法及终端
CN111488057A (zh) * 2020-03-30 2020-08-04 维沃移动通信有限公司 页面内容处理方法及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180081969A1 (en) * 2016-09-20 2018-03-22 Xerox Corporation Method and system for data processing to predict domain knowledge of user for content recommendation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10255249B1 (en) * 2014-12-23 2019-04-09 Amazon Technologies, Inc. Previewing electronic book content within third-party websites
CN107066085A (zh) * 2017-01-12 2017-08-18 惠州Tcl移动通信有限公司 一种基于眼球追踪控制终端的方法及装置
CN110032350A (zh) * 2019-04-16 2019-07-19 维沃移动通信有限公司 一种信息处理方法及终端
CN111488057A (zh) * 2020-03-30 2020-08-04 维沃移动通信有限公司 页面内容处理方法及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于Android的推荐阅读***设计;查英华;朱其慎;;智能计算机与应用;20161228(06);全文 *

Also Published As

Publication number Publication date
CN111914173A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
US10897445B2 (en) System and method for contextual mail recommendations
US10089295B2 (en) Selection of page templates for presenting digital magazine content based on characteristics of additional page templates
CN105917369B (zh) 修改广告大小调整以用于在数字杂志中呈现
US9483855B2 (en) Overlaying text in images for display to a user of a digital magazine
US10102278B2 (en) Methods and systems for modifying a user profile for a recommendation algorithm and making recommendations based on user interactions with items
US10311476B2 (en) Recommending magazines to users of a digital magazine server
US20150363499A1 (en) Search based on combining user relationship datauser relationship data
US10091326B2 (en) Modifying content regions of a digital magazine based on user interaction
CN107908616B (zh) 预测趋势词的方法和装置
US9378299B1 (en) Browsing pages in an electronic document
US11507253B2 (en) Contextual information for a displayed resource that includes an image
CN111028087A (zh) 信息展示方法、装置和设备
CN106899755B (zh) 信息分享方法、信息分享装置及终端
CN111914173B (zh) 内容处理方法、装置、计算机***和存储介质
JP5813052B2 (ja) 情報処理装置、方法及びプログラム
US10242069B2 (en) Enhanced template curating
JP6157965B2 (ja) 電子機器、方法、およびプログラム
CN103257976A (zh) 数据对象的显示方法和显示装置
US20170097991A1 (en) Automatically branding topics using color
CN113468354A (zh) 推荐图表的方法、装置、电子设备及计算机可读介质
CN111026981A (zh) 热点话题的可视化展示方法、装置和设备
US20170177577A1 (en) Biasing scrubber for digital content
US20210174007A1 (en) Creation apparatus and non-transitory computer readable medium
US10013468B2 (en) Multivariable objects navigation tool
CN113158055A (zh) 信息召回方法和信息召回装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant