一种文档阅读情况的采集方法及装置
技术领域
本说明书实施例涉及互联网应用技术领域,尤其涉及一种文档阅读情况的采集方法及装置。
背景技术
用户可以通过浏览器客户端或其他专用客户端阅读文档,而客户端可以通过采集与分析用户阅读文档的情况,进一步地做出相应的调整与引导,例如为用户推荐感兴趣的内容、判断向用户提供的技术文档的阅读难度、等等,从而为用户提供更好的阅读体验。
现有技术中,一般通过采集用户是否打开某文档、是否翻到文档的末尾等数据,来判断用户是否阅读过该文档,但这种方案无法排除用户误操作的情况,如用户误打开文档、误操作直接翻到文档末尾等,使得采集的数据与分析的结果误差较大。
基于现有技术,需要一种更准确地确定文档阅读情况并进行相应处理的方案。
发明内容
针对上述技术问题,本说明书实施例提供一种文档阅读情况处理方法及装置,技术方案如下:
一种文档阅读情况处理方法,该方法包括:
接收文档展示操作触发,展示该操作触发指定的目标文档;
在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
其中,所述阅读状态表示用户当前正在阅读所述目标文档,所述翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段;
从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
一种文档阅读情况处理装置,该装置包括:
文档展示模块,用于接收文档展示操作触发,展示该操作触发指定的目标文档;
状态判断模块,用于在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
片段记录模块,用于如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,
辅助提供模块,用于根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
所述片段记录模块,还用于如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
其中,所述阅读状态表示用户当前正在阅读所述目标文档,所述翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段;
文档推荐模块,用于从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
本说明书实施例所提供的技术方案,在用户打开某一文档后,分别采集用户阅读该文档的各个阅读片段、对应的片段阅读时长、以及跳过未阅读的片段等数据,从而通过更多样、更准确的数据,对用户对文档的阅读情况进行更准确的分析,并采取相应的辅助、推荐等处理。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本说明书实施例的文档阅读情况处理方法的流程示意图;
图2是本说明书实施例的文档阅读情况处理装置的一种结构示意图;
图3是本说明书实施例的辅助提供模块的结构示意图;
图4是本说明书实施例的文档阅读情况处理装置的另一种结构示意图;
图5是用于配置本说明书实施例装置的一种设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
针对现有技术的问题,本说明书实施例提供一种文档阅读情况处理方法,参见图1所示,该方法可以包括以下步骤:
S101,接收文档展示操作触发,展示该操作触发指定的目标文档;
用户可以通过终端设备的客户端阅读文档,本说明书实施例中的终端设备可以为手机、平板电脑、台式电脑等可以展示文档的设备;而客户端可以为终端设备中安装的浏览器客户端,也可以为阅读软件、社交软件等可以展示文档的其他专用客户端,本说明书实施例对此均不做限定。
此外,这里的文档展示操作触发,可以为文档打开操作触发,例如,用户通过点击超链接、点击文档文件等方式,打开某文档网页或文档文件;也可以为文档恢复显示操作触发,例如,用户通过电脑浏览器打开了某文档网页,则用户切换到其他网页时该文档网页被隐藏,当用户切换回该文档网页时即进行了文档展示操作触发。
S102,在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
客户端当前展示的目标文档通常为阅读状态或翻页状态,阅读状态表示用户当前正在阅读所述目标文档,而翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段。
本说明书实施例中,具体可以通过多种方式判断所述目标文档当前的状态,本说明书实施例对此并不做限定。
在一种具体实施方式中,由于用户在翻页时通常需要进行翻页操作触发,因此可以首先确定当前是否接收到翻页操作触发,若未接收到翻页操作触发,则确定。
进一步地,若接收到翻页操作触发,可以直接确定所述目标文档当前为翻页状态。但考虑到用户可能会在翻页的同时进行阅读,为了更准确地确定目标文档当前的状态,可以确定该操作触发对应的翻页速度,并判断所述翻页速度是否大于预设速度阈值。
具体地,速度阈值可以预先统计用户在阅读状态与翻页状态下的翻页速度数据,并对数据进行处理后得到可以用户进行状态区分的速度阈值。可以理解的是,本说明书实施例中并不需要限定翻页方式,例如,可以通过滚动、覆盖、仿真等多种方式翻页,因此相应地,也可以为不同翻页方式预设不同的速度阈值,甚至可以为不同类型的文档或各个文档均设置对应的速度阈值,从而更准确地区分阅读状态与翻页状态,本领域技术人员可以根据实际需求灵活地设置速度阈值,本说明书实施例对此不做限定。
在判断所述翻页速度是否大于预设速度阈值后,若所述翻页速度大于预设速度阈值,则确定所述目标文档当前为翻页状态;否则确定所述目标文档当前为阅读状态。
S103,如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
在对用户的文档阅读情况进行处理时,可以根据用户对片段的阅读时长,判断用户是否在阅读该片段时遇到疑问,或该片段存在一定理解难度,需要提供阅读辅助。因此,可以预设阅读辅助策略集,并设置不同片段阅读时长与不同阅读辅助策略的对应关系。
例如,可以通过阅读辅助策略为用户推荐内容相关的文档,即阅读辅助策略集中可以包括辅助文档推送策略,用于从所述阅读片段的片段内容中提取若干阅读辅助关键词,并根据所提取的关键词确定向用户推送的与所述阅读片段内容相关联的阅读辅助文档。
又如,可以通过阅读辅助策略提示文档维护人员该文档较难,需要进行修改与编辑降低阅读难度,即阅读辅助策略集中可以包括文档难度提示策略,用于向文档维护人员发出文档难度提示,以使文档维护人员根据该提示对所述阅读片段的内容进行编辑。
再如,可以通过阅读辅助策略向用户推送人工或智能疑问解答服务窗口等等,向用户提供易于理解文档内容的辅助服务,本说明书实施例具体的阅读辅助策略不做限定。
在根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略时,首先可以确定预设阅读辅助策略集中的各阅读辅助策略对应的片段阅读时长范围,然后根据所述各片段阅读时长范围,将所统计的片段阅读时长对应的阅读辅助策略确定为针对所述阅读片段的阅读辅助策略。例如,片段阅读时长为2-5分钟时对应辅助文档推送策略,5-10分钟时对应文档难度提示策略,等等。
S104,如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
S105,从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
本说明书实施例中还可以根据用户阅读与未读的片段内容,获取用户的文档阅读需求,从而向用户推荐符合用户需求的其他文档。
例如,可以对片段内容进行语义分析、从片段内容中提取关键字,根据用户阅读片段确定用户关注的内容,并根据用户未读片段确定用户不关注的内容,从而向用户推荐符合用户需求的文档。
又如,还可以根据用户对文档的其他操作,如选取、复制、笔记、高亮、批注等操作,获取用户的文档阅读需求并进行文档推荐。
此外,还可以统计用户对目标文档整体的阅读时长,从而分析文档的阅读体验,具体地,可以在接收到文档展示操作触发的情况下,启动对文档阅读时长的统计,如果是新打开的文档,则为开始文档阅读时长的统计,如果是隐藏后恢复显示的文档,则为继续文档阅读时长的统计,文档阅读时长用于表示用户阅读所述目标文档的时长。在接收到文档切换操作触发的情况下,暂停或停止对所述文档阅读时长的统计,即如果是关闭该文档,则可以停止对文档阅读时长的统计,而如果只是隐藏该文档,则可以暂停对文档阅读时长的统计。
下面结合一个更为具体的实例,对本说明书提供的文档阅读情况处理方法进行说明。
假设某产品平台通过平台网站向用户提供产品使用说明的技术文档,并采集用户对文档的阅读情况数据,从而分析用户对于所提供技术文档的阅读体验。
当用户打开某技术文档的页面时,可以开始对文档阅读时长的统计,并判断当前为阅读状态或翻页状态。
如果为阅读状态,则可以统计对当前文档片段的片段阅读时长,并在时长达到预设阈值的情况下,提示文档维护人员用户对该片段的阅读时间过长,可能存在一定的阅读难度,需要重新编辑、修改以使内容更易理解。
如果为翻页状态,则可以统计用户跳过未阅读的内容,并将该部分内容标注为用户不感兴趣、不需要的内容,从而由文档维护人员判断该部分内容是否冗余,是否需要删减等。
此外,可以对用户阅读与未读片段进行语义分析,提取片段内容的关键字,并通过搜索引擎或者平台内部的搜索,向用户推荐用户存在需求的其他文档。
当用户隐藏当前文档页面时,可以暂停对文档阅读时长的计时,当用户关闭当前文档页面时,可以停止对文档阅读时长的计时,并根据所统计的文档阅读时长,分析该文档的难度与阅读体验,确定是否需要对文档进行修改等。
可见,应用上述方案,可以从多种维度更准确地分析与处理用户对文档的阅读情况,从而针对性地提高用户的阅读体验。
相应于上述方法实施例,本说明书实施例还提供一种文档阅读情况处理装置,参见图2所示,该装置可以包括:
文档展示模块110,用于接收文档展示操作触发,展示该操作触发指定的目标文档;
状态判断模块120,用于在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
片段记录模块130,用于如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,
辅助提供模块140,用于根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
所述片段记录模块130,还用于如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
其中,所述阅读状态表示用户当前正在阅读所述目标文档,所述翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段;
文档推荐模块150,用于从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
在本说明书提供的一种具体实施方式中,所述阅读辅助策略集,可以包括以下一种或多种策略:
辅助文档推送策略,用于:从所述阅读片段的片段内容中提取若干阅读辅助关键词,并根据所提取的关键词确定向用户推送的与所述阅读片段内容相关联的阅读辅助文档;
文档难度提示策略,用于:向文档维护人员发出文档难度提示,以使文档维护人员根据该提示对所述阅读片段的内容进行编辑。
在本说明书提供的一种具体实施方式中,参见图3所示,所述辅助提供模块140,可以包括:
范围确定单元141,用于确定预设阅读辅助策略集中的各阅读辅助策略对应的片段阅读时长范围;
策略确定单元142,用于根据所述各片段阅读时长范围,将所统计的片段阅读时长对应的阅读辅助策略确定为针对所述阅读片段的阅读辅助策略。
在本说明书提供的一种具体实施方式中,所述状态判断模块120,具体可以用于:
确定当前是否接收到翻页操作触发;
若未接收到翻页操作触发,则确定所述目标文档当前为阅读状态;
在本说明书提供的一种具体实施方式中,所述状态判断模块120,还可以具体用于:
若接收到翻页操作触发,则确定该操作触发对应的翻页速度,并判断所述翻页速度是否大于预设速度阈值;
若所述翻页速度大于预设速度阈值,则确定所述目标文档当前为翻页状态;否则确定所述目标文档当前为阅读状态。
在本说明书提供的一种具体实施方式中,参见图4所示,所述装置还可以包括文档记录模块160,具体用于:
在接收到文档展示操作触发的情况下,展示该操作指定的目标文档,并启动对文档阅读时长的统计;所述文档阅读时长用于表示用户阅读所述目标文档的时长;以及,
在接收到文档关闭操作触发的情况下,暂停或停止对所述文档阅读时长的统计。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现前述的文档阅读情况处理方法。该方法至少包括:
一种文档阅读情况处理方法,该方法包括:
接收文档展示操作触发,展示该操作触发指定的目标文档;
在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
其中,所述阅读状态表示用户当前正在阅读所述目标文档,所述翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段;
从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
图5示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作***和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的文档阅读情况处理方法。该方法至少包括:
一种文档阅读情况处理方法,该方法包括:
接收文档展示操作触发,展示该操作触发指定的目标文档;
在接收到针对所述目标文档的任意操作触发的情况下,判断所述目标文档当前的状态;
如果所述目标文档当前为阅读状态,则记录所述目标文档当前显示的阅读片段,并统计用户阅读所述阅读片段的片段阅读时长;以及,根据预设的片段阅读时长与阅读辅助策略的对应关系,从预设阅读辅助策略集中确定针对所述阅读片段的阅读辅助策略,所述阅读辅助策略用于根据阅读片段的内容向用户提供阅读辅助;
如果所述目标文档当前为翻页状态,则记录所述目标文档中跳过未阅读的未读片段;
其中,所述阅读状态表示用户当前正在阅读所述目标文档,所述翻页状态表示用户当前正在翻页并跳过所述目标文档的若干片段;
从所述阅读片段与未读片段的片段内容中,提取若干用户需求特征,并向用户推荐与所提取的用户需求特征匹配的文档。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。