CN109343696A - 一种电子书的评论方法、装置及计算机可读存储介质 - Google Patents

一种电子书的评论方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109343696A
CN109343696A CN201810955566.8A CN201810955566A CN109343696A CN 109343696 A CN109343696 A CN 109343696A CN 201810955566 A CN201810955566 A CN 201810955566A CN 109343696 A CN109343696 A CN 109343696A
Authority
CN
China
Prior art keywords
user
content
audio data
comment
ebook content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810955566.8A
Other languages
English (en)
Other versions
CN109343696B (zh
Inventor
董箫
董一箫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Migu Cultural Technology Co Ltd
China Mobile Communications Group Co Ltd
MIGU Digital Media Co Ltd
Original Assignee
Migu Cultural Technology Co Ltd
China Mobile Communications Group Co Ltd
MIGU Digital Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Migu Cultural Technology Co Ltd, China Mobile Communications Group Co Ltd, MIGU Digital Media Co Ltd filed Critical Migu Cultural Technology Co Ltd
Priority to CN201810955566.8A priority Critical patent/CN109343696B/zh
Publication of CN109343696A publication Critical patent/CN109343696A/zh
Application granted granted Critical
Publication of CN109343696B publication Critical patent/CN109343696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种电子书的评论方法,包括:获取用户对当前阅读的电子书内容的注视时长;确定所述注视时长是否大于或等于目标时长阈值;当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。本发明还同时公开了一种电子书的评论装置以及计算机可读存储介质。

Description

一种电子书的评论方法、装置及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种电子书的评论方法、装置及计算机可读存储介质。
背景技术
目前,用户在阅读电子图书时,可以对电子图书进行批注或评论。其中,在对电子图书进行批注或评论时,用户一般是通过实体键盘或虚拟键盘来手动输入评论或批注,由于手动输入需要耗费用户较长的时间,因此,会导致用户添加评论的效率降低,从而降低用户体验。
发明内容
有鉴于此,本发明实施例期望提供一种电子书的评论方法、装置及计算机可读存储介质,能够提高在图书中添加评论的效率。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种电子书的评论方法,所述方法包括:
获取用户对当前阅读的电子书内容的注视时长;
确定所述注视时长是否大于或等于目标时长阈值;
当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;
基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
上述方案中,在所述确定所述注视时长是否大于或等于目标时长阈值之前,所述方法还包括:
确定所述用户当前阅读的电子书内容的阅读难度;
基于确定的阅读难度,确定目标时长阈值。
上述方案中,所述确定所述用户当前阅读的电子书内容的阅读难度,包括:
根据所述用户当前阅读的电子书内容中句子的长度,确定所述用户当前阅读的电子书内容的阅读难度;
和/或,根据所述用户当前阅读的电子书内容中专业词的数量,确定所述用户当前阅读的电子书内容的阅读难度;
和/或,根据所述用户当前阅读的电子书内容的标签,确定所述用户当前阅读的电子书内容的文字类别,以及基于确定的文字类别,确定所述用户当前阅读的电子书内容的阅读难度。
上述方案中,所述基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论,包括:
确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
上述方案中,所述确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论,包括:
根据所述音频数据中是否包含预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
和/或,确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度,以及基于确定的内容相似度,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。
本发明实施例提供一种电子书的评论装置,所述装置包括:
获取模块,用于获取用户对当前阅读的电子书内容的注视时长;
确定模块,用于确定所述注视时长是否大于或等于目标时长阈值;
监控模块,用于当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;
评论模块,用于基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
上述方案中,所述评论模块,具体用于确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
上述方案中,所述评论模块,具体用于根据所述音频数据中是否包含预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;和/或,确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度,以及基于确定的内容相似度,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上面任一项所述评论方法的步骤。
本发明实施例提供一种电子书的评论装置,其特征在于,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序;
其中,所述处理器用于运行所述计算机程序时,执行上面任一项所述评论方法的步骤。
本发明实施例提供的电子书的评论方法、装置及计算机可读存储介质,获取用户对当前阅读的电子书内容的注视时长;确定所述注视时长是否大于或等于目标时长阈值;当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。本发明实施例中,当用户对当前阅读的电子书内容的注视时长大于或等于所述目标时长阈值时,监控用户的音频数据,如此,能够基于所述音频数据对所述电子书内容进行评论。显然,用户无需动手就可以对当前阅读的电子书内容进行评论,如此,可以快速实现对电子书内容进行评论,因而有助于提高在电子图书中添加评论的效率,进而提高用户体验。
附图说明
图1为本发明实施例电子书的评论方法的实现流程示意图;
图2为本发明实施例电子书的评论装置的组成结构示意图一;
图3为本发明实施例电子书的评论装置的组成结构示意图二。
具体实施方式
本发明实施例中,获取用户对当前阅读的电子书内容的注视时长;确定所述注视时长是否大于或等于目标时长阈值;当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
如图1所示,详细说明本发明实施例电子书的评论方法,本实施例的评论方法应用于终端侧,包括以下步骤:
步骤101:获取用户对当前阅读的电子书内容的注视时长。
其中,用户当前阅读的电子书内容可以为所述用户眼球注视的电子书内容。
这里,终端可以利用现有技术,如眼球追踪技术,来获取用户眼球的运动信息;基于所述运动信息,确定所述用户对当前阅读的电子书内容的注视位置;并获取所述用户对所述注视位置的注视时长。
实际应用时,所述终端可以通过图像捕捉或扫描提取方式,获取用户的运动信息;所述运动信息可以包括:眼球的位置变化信息、眼球的运动方向信息等等。
当所述终端采用指定识别精度不同的现有技术来确定用户的眼球对电子书内容的注视位置时,确定的注视位置可以不同,其中,指定识别精度可以为用户的眼球对电子书内容的注视位置的识别精度。
在一个实施例中,当终端采用的现有技术的指定识别精度较高时,确定的注视位置越精确。
举例来说,当所述终端基于现有技术对用户眼球的注视位置的识别精度较高时,确定出的注视位置可以为当前阅读的电子书内容的某一行,当所述终端基于现有技术对用户眼球的注视位置的识别精度较低时,确定出的注视位置可以为当前阅读的电子书内容的某一段。
在一个实施例中,上述确定的注视位置可以为电子书的某一行、电子书的某一段等。
举例来说,所述用户眼球对当前阅读的电子书内容的注视位置可以是所述用户当前阅读的第N页第N行,也可以是所述用户当前阅读的第N页中第N个段落。其中,N为正整数。
在一个实施例中,当基于指定识别精度较高的现有技术来较精确地确定用户的眼球在电子书内容上的注视位置时,如电子书内容的某一行时,用户对应的该确定的注视位置的注视时长可以较短,对应地,当基于指定识别精度较低的现有技术来不太精确地确定用户的眼球在电子书内容上的注视位置时,如电子书内容的某一段时,用户对应的该确定的注视位置的注视时长可以较长。
步骤102:确定所述注视时长是否大于或等于目标时长阈值。
在一实施例中,在所述确定所述注视时长是否大于或等于目标时长阈值之前,所述方法还包括:确定所述用户当前阅读的电子书内容的阅读难度;基于确定的阅读难度,确定目标时长阈值。
在本方案中,可以基于多种方法来确定当前阅读的电子书内容的阅读难度,下面对其中的几种确定方法来进行说明:
在一实施例中,在确定当前阅读的电子书内容的阅读难度时,可以根据所述用户当前阅读的电子书内容中句子的长度,来确定当前阅读的电子书内容的阅读难度。
当句子的长度较长时,一般会包含较多词性,如名词、动词、形容词,或会使用一些较复杂的句式,如排比式、倒装式等,由此可知,句子的长度较长时,其对应的复杂度较高,可读性也较差,因此,对应的阅读难度通常也较高。故本实施例中,可以根据句子的长度来确定当前阅读的电子书内容的阅读难度。当所述用户眼球注视的电子书内容中的句子较长时,对应的当前阅读的电子书内容的阅读难度较高;当所述用户眼球注视的电子书内容中的句子较短时,对应的当前阅读的电子书内容的阅读难度较低。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:根据预设专业词库,确定所述用户当前阅读的电子书内容中专业词的数量,确定所述用户当前阅读的电子书内容的阅读难度。
其中,专业词库可以包括各行业的专业词,比如傅里叶变化、麦克斯韦方程等等。
当所述用户眼球注视的电子书内容中专业词数量较多时,用户不易理解当前阅读的电子书内容,由此可知,专业词数量较多时,其对应的可理解性较差,因此,对应的阅读难度通常也较高。故本实施例中,可以根据专业词数量来确定当前阅读的电子书内容的阅读难度。当所述用户眼球注视的电子书内容中专业词数量较多时,对应的当前阅读的电子书内容的阅读难度较高;当所述用户眼球注视的电子书内容中专业词数量较少时,对应的当前阅读的电子书内容的阅读难度较低。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:根据用户的行为记录,确定用户擅长的专业领域;确定所述用户当前阅读的电子书内容中涉及的专业词是否为所述用户擅长的专业领域内的专业词;若是,则对应的当前阅读的电子书内容的阅读难度较低,若不是,则对应的当前阅读的电子书内容的阅读难度较高。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:根据所述用户当前阅读的电子书内容的标签,确定所述用户当前阅读的电子书内容的文字类别,以及基于所述确定的文字类别,确定所述用户当前阅读的电子书内容的阅读难度。
举例来说,可以根据当前阅读的电子书内容的标签来确定对应的电子书内容是否为用文言文写成的,当确定对应的电子书内容是用文言文写成的,则确定当前阅读的电子书内容的阅读难度较高;当确定对应的电子书内容不是用文言文写成的,则确定当前阅读的电子书内容的阅读难度较低。
其中,在根据当前阅读的电子书内容的标签来确定对应的电子书内容是否为用文言文写成时,可以判断当前阅读的电子书内容的标签是否为指定标签,如古文、古代文学、古代语言等,若当前阅读的电子书内容的标签是指定标签,则确定当前阅读的电子书内容的阅读难度较高;若当前阅读的电子书内容的标签不是指定标签,则确定当前阅读的电子书内容的阅读难度较低。
在上述示例中,在确定当前阅读的电子书内容的标签是否是指定标签时,可以根据预设的指定标签库来确定当前阅读的电子书内容的标签是否是指定标签。具体地,当确定的当前阅读的电子书内容的标签与预设的指定标签库中的标签相匹配时,可以确定当前阅读的电子书内容的标签是指定标签;当确定的当前阅读的电子书内容的标签与预设的指定标签库中的标签不匹配时,可以确定当前阅读的电子书内容的标签不是指定标签。其中,预设的指定标签库中的标签可以用来标识对应的电子书内容使用文言文写成的。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:基于当前阅读的电子书的作者所属的年代,确定当前阅读的电子书内容的阅读难度。
举例来说,如果当前阅读的电子书的作者所属的年代较早,比如唐朝,则确定当前阅读的电子书内容的阅读难度较大;如果当前阅读的电子书的作者所属的年代较近,比如21世纪初,则确定当前阅读的电子书内容的阅读难度较小。
若当前阅读的电子书的作者所属的年代较早,则当前阅读的电子书的作者所处的背景环境与阅读该电子书的用户所处的背景环境差距较大,由此可知,用户理解起来较为困难,故本实施例中,可以根据当前阅读的电子书的作者所属的年代来确定当前阅读的电子书内容的阅读难度。当所述用户当前阅读的电子书中的背景环境与阅读该电子书的用户所处的背景环境差距较大时,对应的当前阅读的电子书内容的阅读难度较高;当所述用户当前阅读的电子书中的背景环境与阅读该电子书的用户所处的背景环境差距较小时,对应的当前阅读的电子书内容的阅读难度较低。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:基于获取用户的母语信息,以及所述用户当前阅读的电子书的文字类别,确定当前阅读的电子书内容的阅读难度。
举例来说,可以先获取用户的母语信息,如英语、韩语等等;如果确定用户的母语信息为英语,以及当前阅读的电子书的文字类别也是英语,则确定当前阅读的电子书内容的阅读难度较低;如果,确定用户的母语信息为英语,当前阅读的电子书的文字类别是韩语,则确定当前阅读的电子书内容的阅读难度较高。
在一实施例中,所述确定当前阅读的电子书内容的阅读难度,包括:基于用户当前阅读的电子书的内容所包括的文字数量,来确定当前阅读的电子书内容的阅读难度。
当所述用户当前阅读的电子书的内容所包括的文字数量较多时,用户理解起来较为困难,故本实施例中,可以根据用户当前阅读的电子书的内容所包括的文字数量来确定当前阅读的电子书内容的阅读难度。若当前阅读的电子书的内容所包括的文字数量较多时,则确定当前阅读的电子书内容的阅读难度较高;若当前阅读的电子书的内容所包括的文字数量较少时,则确定当前阅读的电子书内容的阅读难度较低。
在一个实施例中,在确定所述用户当前阅读的电子书内容的阅读难度后,可以根据阅读难度来确定与电子书内容对应的目标时长阈值。
当确定的所述用户当前阅读的电子书内容的阅读难度越高时,对应的目标时长阈值越大;当确定的所述用户当前阅读的电子书内容的阅读难度越低时,对应的目标时长阈值越低。
具体地,可以针对每页电子书内容的阅读难度,设置目标时长阈值;或者,针对每页电子书内容中每个段落的阅读难度,设置目标时长阈值;或者,针对每页电子书内容中每个段落包含的行数,设置目标时长阈值;或者,针对每页电子书内容中每行的阅读难度,设置目标时长阈值。需要说明的是,每个段落包含的行数越多时,设置的目标时长阈值越大。
其中,确定的阅读难度与确定出的目标时长阈值可以为正相关,即阅读难度越大,目标时长阈值越大。
步骤103:当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控。
在一实施例中,所述终端可以根据所述用户对当前阅读的电子书内容的注视时长以及目标时长阈值,确定是否开启语音监控,具体地,当确定所述注视时长大于或等于所述目标时长阈值时,开启语音监控。
在上述实施例中,当注视时长大于所述目标时长阈值时,可以确定用户可能是对该段内容比较感兴趣,在用户对注视的电子书内容比较感兴趣的情况下,用户发表语音的倾向比较大,因此,此时,可以开启对应的语音监控,以对用户发表的语音进行监控。由于可以根据用户的行为来确定用户是否有较大的发表语音的倾向,以及在用户有较大的发表语音的倾向的情况下,开启对用户的语音监控,因此,所述终端可以根据用户的行为来控制开启语音监控的时机,从而能够节省终端的硬件资源。
在一实施例中,当确定所述注视时长大于或等于所述目标时长阈值时,生成提示消息;所述提示消息用于提示用户确定是否开启语音监控;接收所述用户针对所述提示消息的操作;所述操作是针对所述提示消息的响应操作;当所述操作表征所述用户确定开启语音监控时,开启语音监控。
在上述实施例中,当注视时长大于所述目标时长阈值时,可以生成对应的提示消息以提示用户是否开启语音监控,当用户根据该提示消息确定开启语音监控时,终端可以开启对应的语音监控,以对用户发表的语音进行监控;当用户根据该提示消息确定不开启语音监控时,终端可以不开启对应的语音监控,也不对用户发表的语音进行监控。
在上述实施例中,终端可以根据接收的所述用户针对所述提示消息的操作来判断用户是否确定开启语音监控,其中,所述操作是针对所述提示消息的响应操作,具体地,该操作可以为对与所述提示消息对应的提示按钮的点击操作等。
步骤104:基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
这里,所述终端获取所述用户的音频数据后,可以对所述音频数据进行语音识别处理,得到相应的文本内容。
具体地,对所述音频数据进行语音识别处理的过程可以包括:对所述音频数据进行特征提取,提取特征数据;利用特征数据,以及机器学习模型,得到识别出的文本内容。其中,所述机器学习模型包括但不限于隐马尔科夫模型(HMM,Hidden Markov Model)模型。
在一个实施例中,所述基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论,包括:确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
这里,需要先确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。具体如下:
在一个实施例中,所述确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论,包括:根据识别所述音频数据得到的内容中是否包含第一预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;其中,所述第一预设特定内容可以包括与所述用户当前阅读的电子书的作者相关的内容。
举例来说,用户当前阅读的电子书可以为《凭海临风》,当确定识别所述音频数据得到的文本内容中包含作者的名字杨澜、作者撰写过的书籍《幸福要回答》、作者参加过的访谈节目《杨澜访谈录》、作者的家人名字吴征、作者的好友名字李艾等等时,可以确定所述音频数据对应的文本内容为针对所述用户眼球注视的电子书内容的评论。
在一实施例中,所述判断监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论,包括:根据识别所述音频数据得到的内容中是否包含第二预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;其中,所述第二预设特定内容包括所述用户当前阅读的电子书的内容。
举例来说,当确定识别所述音频数据得到的文本内容中包含《凭海临风》中的人比如姜昆、物品比如摄像机、场景比如中央电视台、专有名词比如主持人等等时,可以确定所述音频数据对应的文本内容为针对所述用户眼球注视的电子书内容的评论。
在一实施例中,所述判断监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论,包括:根据识别所述音频数据得到的内容中是否包含第三预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;其中,所述第三预设特定内容包括与特定字词相关的内容;所述特定字词为用于对电子书进行评论的字词。
举例来说,当识别所述音频数据得到的文本内容为“杨澜真是写的越来越好了”,则确定识别所述音频数据得到的文本内容中包含特定字词比如“写”、“段”、“读”、“作者姓名”等等,进而可以确定所述音频数据对应的文本内容为针对所述用户眼球注视的电子书内容的评论。
在一实施例中,确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容,如文本内容,之间的内容相似度,并基于确定的内容相似度,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。其中,在确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度时,可以先确定基于所述音频数据得到的识别内容包含的指定关联词的个数,指定关联词可以为与所述电子书对应的已发表评论中的词有关联关系,如同义关系、近义关系,以及反义关系等的词,在确定基于所述音频数据得到的识别内容包含的指定关联词的个数后,可以基于该确定的指定关联词的个数来确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度。
实际应用时,可以先确定所述音频数据对应的文本内容与其他用户已经发表的评论之间是不是相关;当确定所述音频数据对应的文本内容与其他用户已经发表的评论之间相关时,确定所述音频数据对应的文本内容为针对所述用户眼球注视的电子书内容的评论。
在上述示例中,在确定所述音频数据对应的文本内容与其他用户已经发表的评论之间是不是相关时,可以根据所述用户的音频数据或对应的文本内容,与其他用户已经发表的评论内容的相似度来确定,其中,相似度是根据两者包含的关联词的数量来确定的。
在一个实施例中,为了实现在电子书内容中准确添加用户评论,可以在获取所述用户的音频数据后,确定所述音频数据对应的文本内容是否为针对所述用户眼球注视的电子书内容的评论;当确定所述音频数据对应的文本内容为针对所述用户眼球注视的电子书内容的评论时,基于所述音频数据,生成对所述用户眼球注视的电子数据内容的评论。如此,可以提高添加评论的准确性。
这里,在判断监控到的音频数据为针对所述用户当前阅读的电子书内容的评论之后,需要基于所述音频数据,生成评论。具体如下:
在一实施例中,在判断监控到的音频数据为针对所述用户当前阅读的电子书内容的评论之后,可以基于所述音频数据,生成语音评论,并在当前阅读的电子书内容中进行显示。
举例来说,可以利用音频压缩技术对所述音频数据进行压缩处理得到语音评论,以批注或评论形式显示;语音评论的格式可以为MP3、WAV格式等等。
在一实施例中,在判断监控到的音频数据为针对所述用户当前阅读的电子书内容的评论之后,可以基于所述文本内容,生成文本评论,并在当前阅读的电子书内容中进行显示。
举例来说,可以基于所述文本内容,生成至少一个文本评论,以批注或评论形式显示;其中,每个文本评论中的文字类型不同;所述文字类型至少包括:文言文、白话文等等。
这里,在显示评论后,可以根据用户需求对显示的评论进行相应处理。具体如下:
在一实施例中,当用户在当前阅读的电子书内容中点击所述语音评论时,可以生成提示信息;所述提示信息用于指示用户确定是否将语音评论转换为文本评论;接收针对提示信息的用户操作;当所述用户操作表征所述用户确定进行转换时,将语音评论转换为文本评论进行显示。
在一实施例中,当用户在当前阅读的电子书内容中点击所述文本评论时,可以生成提示信息;所述提示信息用于指示用户确定是否对文本评论对应的语言类型或文字类型进行转换;所述语言类型至少包括:汉语、英语、韩语;所述文字类型至少包括文言子、繁体字;接收针对提示信息的用户操作;当所述用户操作表征所述用户确定进行转换语言类型时,将文本评论中的语言转换为相应语种的语言。
在一实施例中,在生成评论之后,生成提示信息;所述提示信息用于提示用户是否想发表该评论,若确定用户不想发表,则不对这个评论进行发表,若确定用户想发表,则确定能观看所述评论的对象,其中,能看所述评论的对象可以包括用户指定的对象,以及观看该电子书内容的全部用户,在一个示例中,用户指定的对象可以包括用户本身。
采用本发明实施例的技术方案,当用户对当前阅读的电子书内容的注视时长大于或等于所述目标时长阈值时,监控用户的音频数据,如此,能够基于所述音频数据对所述电子书内容进行评论。显然,用户无需动手就可以对当前阅读的电子书内容进行评论,如此,可以快速实现对电子书内容进行评论,因而有助于提高在电子图书中添加评论的效率,进而提高用户体验。
基于本申请各实施例提供的电子书的评论方法,本申请还提供一种电子书的评论装置,如图2所示,所述装置包括:
获取模块21,用于获取用户对当前阅读的电子书内容的注视时长;
确定模块22,用于确定所述注视时长是否大于或等于目标时长阈值;
监控模块23,用于当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;
评论模块24,用于基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
所述获取模块21,具体用于利用现有技术,如眼球追踪技术,通过图像捕捉或扫描提取方式,获取用户眼球的运动信息;基于所述运动信息,确定所述用户对当前阅读的电子书内容的注视位置;并获取所述用户对所述注视位置的注视时长。所述运动信息可以包括:眼球的位置变化信息、眼球的运动方向信息等等。
所述评论模块24,具体用于确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
所述评论模块24,具体用于根据识别所述音频数据得到的内容中是否包含预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。其中,所述预设特定内容至少包括所述用户当前阅读的电子书的内容、与所述用户当前阅读的电子书的作者相关的内容,以及与特定字词相关的内容;所述特定字词为用于对电子书进行评论的字词。
所述评论模块24,具体用于根据所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度;以及基于确定的内容相似度,判断监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。
所述内容相似度是基于监控到的音频数据的内容和针对所述用户当前阅读的电子书已发表的评论的关联词的个数来确定的,所述关联词至少包括:同义词、近义词、反义词。
所述监控模块23,还用于当确定所述注视时长大于或等于所述目标时长阈值时,生成提示消息;所述提示消息用于提示用户确定是否开启语音监控;接收所述用户针对所述提示消息的操作;所述操作是针对所述提示消息的响应操作;当所述操作表征所述用户确定开启语音监控时,开启语音监控。
所述确定模块22,具体用于确定当前阅读的电子书内容的阅读难度;基于确定的阅读难度,确定所述目标时长阈值。
所述确定模块22,具体用于根据当前阅读的电子书内容中句子的长度,确定当前阅读的电子书内容的阅读难度。
所述确定模块22,具体用于根据预设专业词库,确定当前阅读的电子书内容中专业词的数量,确定当前阅读的电子书内容的阅读难度。
所述确定模块22,具体用于根据用户的行为记录,确定用户擅长的专业领域;确定所述用户当前阅读的电子书内容中涉及的专业词是否为所述用户擅长的专业领域内的专业词;若是,则对应的当前阅读的电子书内容的阅读难度较低,若不是,则对应的当前阅读的电子书内容的阅读难度较高。
所述确定模块22,具体用于根据当前阅读的电子书内容的标签,确定所述电子书内容的文字类别;基于所述电子书内容的文字类别,确定当前阅读的电子书内容的阅读难度。
所述确定模块22,具体用于基于当前阅读的电子书的作者所属的年代,确定当前阅读的电子书内容的阅读难度。
所述确定模块22,具体用于基于获取用户的母语信息,以及所述用户当前阅读的电子书的文字类别,确定当前阅读的电子书内容的阅读难度。
所述确定模块22,具体用于基于用户当前阅读的电子书的内容所包括的文字数量,来确定当前阅读的电子书内容的阅读难度。
需要说明的是:上述实施例提供的电子书的评论装置在进行评论时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的电子书的评论装置与电子书的评论方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在实际应用中,获取模块21由位于电子书的评论装置上的网络接口实现;确定模块22、监控模块23、评论模块24可由位于电子书的评论装置上的处理器比如中央处理器(CPU,Central Processing Unit)、微处理器(MPU,Micro Processor Unit)、数字信号处理器(DSP,Digital Signal Processor)、或现场可编程门阵列(FPGA,Field ProgrammableGate Array)等实现。
图3是本发明电子书的评论装置的结构示意图,图3所示的电子书的评论装置300设置在终端上,包括:至少一个处理器301、存储器302、用户接口303、至少一个网络接口304。电子书的评论装置300中的各个组件通过总线***305耦合在一起。可理解,总线***305用于实现这些组件之间的连接通信。总线***305除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线***305。
其中,用户接口303可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
本发明实施例中的存储器302用于存储各种类型的数据以支持电子书的评论装置300的操作。这些数据的示例包括:用于在电子书的评论装置300上操作的任何计算机程序,如操作***3021和应用程序3022;其中,操作***3021包含各种***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序3022可以包含各种应用程序,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序3022中。
上述本发明实施例揭示的方法可以应用于处理器301中,或者由处理器301实现。处理器301可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器301中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器301可以是通用处理器、数字信号处理器,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器301可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器302,处理器301读取存储器302中的信息,结合其硬件完成前述方法的步骤。
可以理解,存储器302可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random AccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器302旨在包括但不限于这些和任意其它适合类型的存储器。
基于本申请各实施例提供的电子书的评论方法,本申请还提供一种计算机可读存储介质,参照图3所示,所述计算机可读存储介质可以包括:用于存储计算机程序的存储器302,上述计算机程序可由电子书的评论装置300的处理器301执行,以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种电子书的评论方法,其特征在于,所述方法包括:
获取用户对当前阅读的电子书内容的注视时长;
确定所述注视时长是否大于或等于目标时长阈值;
当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;
基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
2.根据权利要求1所述的方法,其特征在于,在所述确定所述注视时长是否大于或等于目标时长阈值之前,所述方法还包括:
确定所述用户当前阅读的电子书内容的阅读难度;
基于确定的阅读难度,确定目标时长阈值。
3.根据权利要求2所述的方法,其特征在于,所述确定所述用户当前阅读的电子书内容的阅读难度,包括:
根据所述用户当前阅读的电子书内容中句子的长度,确定所述用户当前阅读的电子书内容的阅读难度;
和/或,根据所述用户当前阅读的电子书内容中专业词的数量,确定所述用户当前阅读的电子书内容的阅读难度;
和/或,根据所述用户当前阅读的电子书内容的标签,确定所述用户当前阅读的电子书内容的文字类别,以及基于确定的文字类别,确定所述用户当前阅读的电子书内容的阅读难度。
4.根据权利要求1所述的方法,其特征在于,所述基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论,包括:
确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
5.根据权利要求4所述的方法,其特征在于,所述确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论,包括:
根据所述音频数据中是否包含预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
和/或,确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度,以及基于确定的内容相似度,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。
6.一种电子书的评论装置,其特征在于,所述装置包括:
获取模块,用于获取用户对当前阅读的电子书内容的注视时长;
确定模块,用于确定所述注视时长是否大于或等于目标时长阈值;
监控模块,用于当确定所述注视时长大于或等于所述目标时长阈值时,对所述用户进行语音监控;
评论模块,用于基于监控到的音频数据,对所述用户当前阅读的电子书内容进行评论。
7.根据权利要求6所述的装置,其特征在于,
所述评论模块,具体用于确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;
当确定所述监控到的音频数据为针对所述用户当前阅读的电子书内容的评论时,根据所述音频数据,对所述用户当前阅读的电子书内容进行评论。
8.根据权利要求6所述的装置,其特征在于,
所述评论模块,具体用于根据所述音频数据中是否包含预设特定内容,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论;和/或,确定所述电子书对应的已发表评论,和基于所述音频数据得到的识别内容之间的内容相似度,以及基于确定的内容相似度,确定监控到的音频数据是否为针对所述用户当前阅读的电子书内容的评论。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
10.一种电子书的评论装置,其特征在于,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序;
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至5任一项所述方法的步骤。
CN201810955566.8A 2018-08-21 2018-08-21 一种电子书的评论方法、装置及计算机可读存储介质 Active CN109343696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810955566.8A CN109343696B (zh) 2018-08-21 2018-08-21 一种电子书的评论方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810955566.8A CN109343696B (zh) 2018-08-21 2018-08-21 一种电子书的评论方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109343696A true CN109343696A (zh) 2019-02-15
CN109343696B CN109343696B (zh) 2022-03-25

Family

ID=65291845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810955566.8A Active CN109343696B (zh) 2018-08-21 2018-08-21 一种电子书的评论方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109343696B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110244848A (zh) * 2019-06-17 2019-09-17 Oppo广东移动通信有限公司 阅读控制方法及相关设备
CN110267113A (zh) * 2019-06-14 2019-09-20 北京字节跳动网络技术有限公司 视频文件加工方法、***、介质和电子设备
CN110377191A (zh) * 2019-06-14 2019-10-25 北京字节跳动网络技术有限公司 语音评论交互方法、***、介质和电子设备
CN110430127A (zh) * 2019-09-03 2019-11-08 深圳市沃特沃德股份有限公司 基于绘本阅读的语音处理方法、装置及存储介质
CN111046639A (zh) * 2019-11-06 2020-04-21 上海擎感智能科技有限公司 一种文件审阅方法、***及移动终端
CN111694434A (zh) * 2020-06-15 2020-09-22 掌阅科技股份有限公司 电子书评论信息的交互展示方法、电子设备及存储介质
CN113515210A (zh) * 2021-06-30 2021-10-19 北京百度网讯科技有限公司 一种显示方法、装置、电子设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469363A (zh) * 2010-11-11 2012-05-23 Tcl集团股份有限公司 带有语音评论功能的电视***及语音评论方法
CN103631782A (zh) * 2012-08-21 2014-03-12 腾讯科技(深圳)有限公司 一种处理电子书评论的方法、装置与***
US20160357253A1 (en) * 2015-06-05 2016-12-08 International Business Machines Corporation Initiating actions responsive to user expressions of a user while reading media content
CN106951093A (zh) * 2017-03-31 2017-07-14 联想(北京)有限公司 一种数据处理方法及装置
CN107621882A (zh) * 2017-09-30 2018-01-23 咪咕互动娱乐有限公司 一种控制模式的切换方法、装置及存储介质
CN107918653A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 一种基于喜好反馈的智能播放方法和装置
CN107967104A (zh) * 2017-12-20 2018-04-27 北京时代脉搏信息技术有限公司 对信息实体进行语音评论的方法和电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469363A (zh) * 2010-11-11 2012-05-23 Tcl集团股份有限公司 带有语音评论功能的电视***及语音评论方法
CN103631782A (zh) * 2012-08-21 2014-03-12 腾讯科技(深圳)有限公司 一种处理电子书评论的方法、装置与***
US20160357253A1 (en) * 2015-06-05 2016-12-08 International Business Machines Corporation Initiating actions responsive to user expressions of a user while reading media content
CN106951093A (zh) * 2017-03-31 2017-07-14 联想(北京)有限公司 一种数据处理方法及装置
CN107621882A (zh) * 2017-09-30 2018-01-23 咪咕互动娱乐有限公司 一种控制模式的切换方法、装置及存储介质
CN107918653A (zh) * 2017-11-16 2018-04-17 百度在线网络技术(北京)有限公司 一种基于喜好反馈的智能播放方法和装置
CN107967104A (zh) * 2017-12-20 2018-04-27 北京时代脉搏信息技术有限公司 对信息实体进行语音评论的方法和电子设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110267113A (zh) * 2019-06-14 2019-09-20 北京字节跳动网络技术有限公司 视频文件加工方法、***、介质和电子设备
CN110377191A (zh) * 2019-06-14 2019-10-25 北京字节跳动网络技术有限公司 语音评论交互方法、***、介质和电子设备
CN110267113B (zh) * 2019-06-14 2021-10-15 北京字节跳动网络技术有限公司 视频文件加工方法、***、介质和电子设备
CN110244848A (zh) * 2019-06-17 2019-09-17 Oppo广东移动通信有限公司 阅读控制方法及相关设备
CN110244848B (zh) * 2019-06-17 2021-10-19 Oppo广东移动通信有限公司 阅读控制方法及相关设备
CN110430127A (zh) * 2019-09-03 2019-11-08 深圳市沃特沃德股份有限公司 基于绘本阅读的语音处理方法、装置及存储介质
CN110430127B (zh) * 2019-09-03 2021-11-09 深圳市沃特沃德软件技术有限公司 基于绘本阅读的语音处理方法、装置及存储介质
CN111046639A (zh) * 2019-11-06 2020-04-21 上海擎感智能科技有限公司 一种文件审阅方法、***及移动终端
CN111694434A (zh) * 2020-06-15 2020-09-22 掌阅科技股份有限公司 电子书评论信息的交互展示方法、电子设备及存储介质
CN113515210A (zh) * 2021-06-30 2021-10-19 北京百度网讯科技有限公司 一种显示方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
CN109343696B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN109343696A (zh) 一种电子书的评论方法、装置及计算机可读存储介质
US10114809B2 (en) Method and apparatus for phonetically annotating text
US10353943B2 (en) Computerized system and method for automatically associating metadata with media objects
JP6419858B2 (ja) マルチメディアコンテンツにおける文脈探索
CN109213932A (zh) 一种信息推送方法及装置
US20140013192A1 (en) Techniques for touch-based digital document audio and user interface enhancement
Sonderegger Phonetic and phonological dynamics on reality television
US20220121712A1 (en) Interactive representation of content for relevance detection and review
EP3292480A1 (en) Techniques to automatically generate bookmarks for media files
WO2022206198A1 (zh) 一种音频和文本的同步方法、装置、设备以及介质
Yang et al. Multimodal indicators of humor in videos
CN111310421B (zh) 一种文本批量标记方法、终端及计算机存储介质
CN112802454B (zh) 一种唤醒词的推荐方法、装置、终端设备及存储介质
CN111160001B (zh) 一种数据处理方法及装置
CN108959163B (zh) 有声电子书的字幕显示方法、电子设备及计算机存储介质
Nyhan et al. Oral history, audio-visual materials and digital humanities: a new ‘grand challenge’
Tyagi et al. Video Summarization using Speech Recognition and Text Summarization
Trullemans et al. Designing prosthetic memory: audio or transcript, that is the question
Cherubini et al. Text versus speech: a comparison of tagging input modalities for camera phones
Kaiser et al. Multimodal redundancy across handwriting and speech during computer mediated human-human interactions
KR102251513B1 (ko) 기계학습을 이용한 셀럽의 소셜미디어 정보 기반 학습용 콘텐츠 생성 방법 및 장치
TW201227360A (en) Word recognition system ,word recognition method, computer readable storage media and computer program product
Koster Automatic LIP-SYNC: direct translation of speech sound to mouth animation
Pavel Navigating Video Using Structured Text
Mao Towards Training a Robust Segment-based Model for Speech Emotion Recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant