CN109189879A - 电子书籍显示方法及装置 - Google Patents

电子书籍显示方法及装置 Download PDF

Info

Publication number
CN109189879A
CN109189879A CN201811075405.6A CN201811075405A CN109189879A CN 109189879 A CN109189879 A CN 109189879A CN 201811075405 A CN201811075405 A CN 201811075405A CN 109189879 A CN109189879 A CN 109189879A
Authority
CN
China
Prior art keywords
book
image
page
text
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811075405.6A
Other languages
English (en)
Other versions
CN109189879B (zh
Inventor
姚健
李学朝
张从周
袁世培
史景慧
雷璐
王艺婷
曾晶
方芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201811075405.6A priority Critical patent/CN109189879B/zh
Publication of CN109189879A publication Critical patent/CN109189879A/zh
Application granted granted Critical
Publication of CN109189879B publication Critical patent/CN109189879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种电子书籍显示方法及装置,属于计算机技术领域。该方法包括:显示电子书籍管理应用的内容输入界面;获取通过内容输入界面输入的书籍内容,书籍内容为待查询的电子书籍中的部分书籍内容;在数据库中,查询书籍内容所属的电子书籍,数据库中包括至少一个电子书籍中的书籍内容;显示电子书籍管理应用的书籍展示界面,书籍展示界面包括电子书籍的书籍内容。本发明实施例提供了根据书籍内容查询电子书籍的功能,扩展了应用范围,用户无需获知电子书籍的描述信息即可根据部分书籍内容查询到完整的电子书籍,操作方便快捷,对用户的信息储备要求较低。

Description

电子书籍显示方法及装置
技术领域
本发明实施例涉及计算机技术领域,特别涉及一种电子书籍显示方法及装置。
背景技术
阅读书籍是人们获取信息、学习知识和认识世界的重要途径,也是人们丰富精神生活的一种常用方式。随着互联网数据规模的逐渐扩大和电子设备的广泛应用,当前已进入电子化阅读时代,越来越多的人开始从阅读纸质书籍转变为阅读电子书籍。
为了方便阅读电子书籍,一些电子书籍网站应运而生。电子书籍网站的管理人员会将纸质书籍转换为电子书籍,将电子书籍和电子书籍的描述信息上传到电子书籍网站,该描述信息包括名称、简介、作者、出版日期等。用户可以通过电子设备访问电子书籍网站,当要查询某一电子书籍时,可以输入该电子书籍的名称、作者等描述信息,从而在电子书籍网站中查询到该描述信息对应的电子书籍,用户即可在电子设备上阅读该电子书籍,无需随身携带纸质书籍即可随时随地进行阅读,操作非常方便。
上述方案需要用户预先获知电子书籍的描述信息,当用户看到一部分感兴趣的书籍内容但不知道该书籍内容所属电子书籍的描述信息时,将无法查询到该电子书籍。因此,上述方案对用户的信息储备要求较高,具有局限性,应用范围狭窄。
发明内容
本发明实施例提供了一种电子书籍显示方法及装置,可以解决相关技术存在的问题。所述技术方案如下:
一方面,提供了一种电子书籍显示方法,所述方法包括:
显示电子书籍管理应用的内容输入界面;
获取通过所述内容输入界面输入的书籍内容,所述书籍内容为待查询的电子书籍中的部分书籍内容;
在数据库中,查询所述书籍内容所属的电子书籍,所述数据库中包括至少一个电子书籍中的书籍内容;
显示所述电子书籍管理应用的书籍展示界面,所述书籍展示界面包括所述电子书籍的书籍内容。
另一方面,提供了一种电子书籍显示装置,所述装置包括:
第一显示模块,用于显示电子书籍管理应用的内容输入界面;
获取模块,用于获取通过所述内容输入界面输入的书籍内容,所述书籍内容为待查询的电子书籍中的部分书籍内容;
查询模块,用于在数据库中,查询所述书籍内容所属的电子书籍,所述数据库中包括至少一个电子书籍中的书籍内容;
第二显示模块,用于显示所述电子书籍管理应用的书籍展示界面,所述书籍展示界面包括所述电子书籍的书籍内容。
另一方面,提供了一种电子书籍显示装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如所述电子书籍显示方法中所执行的操作。
再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并具有以实现如所述电子书籍显示方法中所执行的操作。
本发明实施例提供的方法及装置,通过显示电子书籍管理应用的内容输入界面,获取通过内容输入界面输入的书籍内容,在数据库中查询书籍内容所属的电子书籍,并显示电子书籍管理应用的书籍展示界面,在书籍展示界面中显示电子书籍的书籍内容。本发明实施例提供了根据书籍内容查询电子书籍的功能,扩展了应用范围,用户无需获知电子书籍的描述信息即可根据部分书籍内容查询到完整的电子书籍,操作方便快捷,对用户的信息储备要求较低。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种实施环境的示意图;
图2是本发明实施例提供的一种实施环境的示意图;
图3是本发明实施例提供的一种创建数据库的方法流程图;
图4是本发明实施例提供的一种创建数据库的方法流程图;
图5是是本发明实施例提供的创建数据库的操作流程示意图;
图6是本发明实施例提供的一种电子书籍显示方法的流程图;
图7是本发明实施例提供的电子书籍管理应用的主界面示意图;
图8是本发明实施例提供的内容输入界面示意图;
图9是本发明实施例提供的书籍展示界面示意图;
图10是本发明实施例提供的书籍展示界面示意图;
图11是本发明实施例提供的书籍展示界面示意图;
图12是本发明实施例提供的跟读界面示意图;
图13是本发明实施例提供的显示电子书籍的操作流程示意图。
图14是本发明实施例提供的一种电子书籍显示装置的结构示意图;
图15是本发明实施例提供的一种电子设备的结构示意图;
图16是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细说明之前,首先对涉及到的概念进行如下解释:
1、电子书籍:是指将文字、图片、声音、影像等内容以数字化形式呈现的数字化资源,可以利用存储介质来存储书籍内容,是一种新型的书籍记载形式。电子书籍可以在有线或无线网络中进行传播,通过电子设备显示给读者进行阅读。
从格式上来说,电子书籍可以通过DOC(Document,文档)格式、txt(文本文档)格式、PDF(Portable Document Format,便携式文档格式)、EXE(executable program,可执行程序)或者其他形式进行展示。从书籍内容上来说,电子书籍可以为供学习使用的学习课本、供扩展阅读内容的课外书籍或供绘画教学使用的绘画书籍等。从来源上来说,电子书籍可以为由纸质书籍转换得到的电子书籍,则该电子书籍具有对应的原始书籍,原始书籍的书籍内容与电子书籍的书籍内容相同。或者电子书籍也可以为根据数字化形式的内容直接生成的电子书籍,如根据用户输入的文本内容生成的文本文档,或者根据用户上传的信息生成的词条等。
电子书籍除内部的书籍内容之外,还具有描述信息,该描述信息用于对电子书籍进行描述,可以包括电子书籍的名称、简介、作者、出版日期等的多项信息。
并且,电子书籍可以按照页面进行划分,为每个页面设置对应的索引标识,将电子书籍采用页面上的书籍内容和该书籍内容所在页面的索引标识来表示,实现电子书籍的结构化。
2、封面:纸质书籍的封面是指书籍的最外面一层,可以作为保护层对书籍进行保护。则对于电子书籍来说,电子书籍的封面是指电子书籍的首页,通常只有一页。
电子书籍的封面中包括书籍的名称、简介、作者、出版者、出版日期等信息,该信息可以为文字信息,也可以为图像信息。
3、目录:是指书籍正文前所记载的目次,将各部分书籍内容的标题按照一定的次序编排而成,可以表示各部分书籍内容在书籍中所处的位置,为读者阅读书籍提供指导。
4、正文:是指书籍中除了封面、前言、目录、后记、注释以外的内容,是书籍内容的主要部分,书籍的封面、前言、目录、后记、注释等均为正文提供指导、解释和说明。
5、词汇:是指一种语言中能够独立运用的最小单位,一个或多个词汇可以组成语句,一条或多条语句可以组成段落。词汇可以是由一个或多个汉字组成的词语,还可以是一个英文单词。
6、分词:是指将一段文本内容根据语义划分为最小单位的词汇的过程,如将一句话拆分成多个词语。其中词汇是文本内容中的最小单位。
7、索引标识:是指表示页面在电子书籍中顺序的标识,电子书籍中的每个页面具有一个索引标识。
索引标识可以为页码,页码是指每个页面上用于表示页面顺序的号码、数字或其他类型的标记,可以位于页面的正上方、右下角等位置,用户在阅读任一页面时可以看到页码,了解页面在书籍中的位置。
8、电子书籍管理应用:是指用于管理电子书籍的应用,具备查询电子书籍、展示电子书籍的书籍内容以及基于书籍内容进行学习等功能。
电子书籍管理应用可以为电子设备上独立运行的应用,如操作***中运行的***应用、浏览器中运行的插件应用或者电子设备上安装的第三方应用等,或者,也可以为在互联网应用中运行的应用。
其中,该互联网应用可以为电子支付应用、网络购物应用或者即时通信应用等。当电子书籍管理应用在互联网应用中运行时,开发者可以在互联网应用中为电子书籍管理应用注册公共标识,以公共标识来识别该电子书籍管理应用。根据开发者的不同,公共标识可以称为公众号、服务号或者企业号等。在互联网应用中运行电子书籍管理应用后,互联网应用中的普通用户便可关注该电子书籍管理应用的公共标识,或者与该公共标识建立好友关系。之后,互联网应用可以互联网应用中运行的电子书籍管理应用为媒介,为普通用户实现管理电子书籍的功能。
图1是本发明实施例提供的一种实施环境的示意图,该实施环境包括:电子设备101和服务器102,电子设备101和服务器102之间通过网络连接。
其中,电子设备101可以为手机、计算机、平板电脑、点读机、电子书阅读器、小型电视等多种类型的设备,服务器102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
电子设备101上运行电子书籍管理应用,通过该电子书籍管理应用与服务器102进行交互,共同实现管理电子书籍的功能。
在第一种场景下,该电子书籍管理应用为电子设备101上独立运行的应用,该电子书籍管理应用为与服务器102关联的前端应用,服务器102可以称为电子书籍管理服务器。
在第二种场景下,该电子书籍管理应用为在互联网应用中运行的应用,参见图2,该服务器102可以包括互联网应用服务器1021和电子书籍管理服务器1022,互联网应用是与互联网应用服务器1021关联的前端应用,电子书籍管理应用为电子书籍管理服务器1022关联的前端应用。
电子设备101和互联网应用服务器1021之间通过网络连接,互联网应用服务器1021和电子书籍管理服务器1022之间通过网络连接。互联网应用服务器1021用于向电子书籍管理服务器1022(第三方服务器)提供接口,电子书籍管理服务器1022接入互联网应用服务器1021后,电子书籍管理应用可在互联网应用服务器1021上注册公共标识,从而基于该公共标识与该互联网应用服务器1021进行交互,并与该互联网应用服务器1021共享数据资源。
相关技术中,通常在查询电子书籍时,需要用户输入该电子书籍的名称、作者等描述信息,从而查询到该描述信息对应的电子书籍。因此需要用户预先获知电子书籍的描述信息,当用户看到一部分感兴趣的书籍内容但不知道该书籍内容所属电子书籍的描述信息时,将无法查询到该电子书籍,对用户的信息储备要求较高,具有局限性,应用范围狭窄。
而本发明实施例提供了一种电子书籍显示方法,通过显示电子书籍管理应用的内容输入界面,获取通过该内容输入界面输入的书籍内容,在数据库中查询该书籍内容所属的电子书籍以及该电子书籍中上述书籍内容所在的索引标识,将该索引标识对应的书籍内容显示在书籍展示界面中。
本发明实施例提供的方法中,由于数据库中不仅包含电子书籍对应的描述信息,还包括电子书籍中的书籍内容以及书籍内容所在页面的索引标识,当获取到某一书籍内容时,即可在数据库中查询该书籍内容所属的电子书籍以及在该电子书籍中的索引标识,在电子书籍管理应用的书籍展示页面中为用户显示该索引标识对应的书籍内容,便于用户对该书籍内容进行操作,而且为用户查询到整个电子书籍,便于用户对电子书籍中的其他书籍内容进行操作。
本发明实施例可以应用于根据书籍内容查询电子书籍的任意场景下,其中,该书籍内容可以包括文本内容、语音内容、图像内容中的至少一种。
例如,用户看到一本感兴趣的书籍时,可以对书籍的某一页进行拍摄,根据拍摄到的书籍内容,采用本发明实施例提供的方法查询该书籍对应的电子书籍,并显示展示电子书籍中相应的页面。之后,用户还可以学习该电子书籍中的书籍内容,进行跟读、默写词汇等操作。
又如,用户听到某本名著中的经典语句时,可以录制包含该经典语句的语音内容,根据录制的语音内容,采用本发明实施例提供的方法查询该名著的电子书籍,并显示该经典语句所在的页面,以便用户查看该经典语句所在的页面,或者阅读完整的名著。
又如,用户在浏览网络信息时看到一个感兴趣的段落,可以对该段落进行截图,根据截取的图像,采用本发明实施例提供的方法查询该段落所在的电子书籍,并显示电子书籍中该段落所在的页面。
图3是本发明实施例提供的一种创建数据库的方法流程图。本发明实施例的执行主体为管理装置,该管理装置可以为图1或图2所示实施例中的电子设备或服务器,参见图3,该方法包括:
301、管理装置收集至少一个电子书籍中每个页面的文本内容和索引标识。
管理装置收集一个或多个电子书籍,每个电子书籍可以包括多个页面,每个页面上具有书籍内容,且每个页面在所属电子书籍中具有唯一的索引标识,该索引标识用于确定该页面在电子书籍中的顺序。
因此,对电子书籍进行结构化处理,以页面上的书籍内容和对应的索引标识来表示电子书籍,并创建电子书籍的结构信息,该结构信息包括每个页面上的书籍内容与对应索引标识的映射关系,而且还能表示各个页面之间的关系,从而获取到结构化的电子书籍。之后,在数据库中存储的电子书籍不仅包括书籍内容,还包括电子书籍的结构信息,则根据该电子书籍不仅可以获取到电子书籍内的书籍内容,还可以了解各部分书籍内容之间的关系。
其中,该书籍内容可以包括文本内容、图像内容等多种格式的内容。
而本发明实施例以书籍内容包括文本内容为例,对存储文本内容的过程进行说明,因此管理装置收集至少一个电子书籍中每个页面的文本内容和索引标识。
其中,索引标识用于表示页面在电子书籍中的顺序,每个页面的索引标识根据每个页面在电子书籍中的顺序确定,可以采用页面的序号或者页码来表示。电子书籍中每个页面的索引标识可以由上传电子书籍的用户设置,或者,也可以由管理装置在获取到电子书籍后,根据电子书籍中的书籍内容的前后文关系进行分页,得到多个页面,并确定每个页面的索引标识。或者,管理装置在获取到电子书籍后,对电子书籍中包含的页码进行识别,得到每个页面的页码。
可选地,对于任一电子书籍的任一页面来说,当该页面上的书籍内容仅包括文本内容时,获取该文本内容,而当该页面上的书籍内容包括文本内容和图像内容时,可以提取该文本内容,过滤该图像内容。
每个电子书籍中的页面可以包括封面、目录页面和正文页面。封面是指电子书籍的首页,通常只有一页,目录页面是指电子书籍的目录所在的页面,可以包括一个或多个页面,具体根据目录的长短确定,正文页面是指电子书籍的正文内容所在的页面,通常位于封面和目录页面之后,通常包括多个正文页面。
为了便于区分多种不同类型的页面,在电子书籍中不仅可以包括每个页面上的书籍内容,还可以为每个页面设置页面标记,该页面标记用于表示页面的类型。例如,为封面设置第一标记,为目录页面设置第二标记,为正文页面设置第三标记,以不同的标记来进行区分。
其中,每个页面的页面标记可以由上传电子书籍的用户手动设置,或者也可以由管理装置预先设置好不同类型的页面应符合的规则,在获取到电子书籍后,自动根据页面上的书籍内容所符合的规则,确定每个页面的类型,并相应设置每个页面的页面标记。例如,包含有书籍名称、作者和出版日期的页面可以确定为封面,包含有“第一章节”、“第二章节”等标题,且标题右方设置有对应页码的页面可以确定为目录页面。
目录页面中包括多个标题,该多个标题之间具有层级关系,从而构成多级标题,每个最后一级标题对应至少一个正文页面。目标页面中还包括每个标题对应的第一个正文页面的索引标识,则根据该目标页面可以确定任一标题对应的索引标识范围。
另外,除封面、目录页面和正文页面之外,电子书籍中还可以包括其他页面,例如序言页面、用于展示电子书籍相关资料的资料页面、作者简介页面等。
302、管理装置根据每个电子书籍中每个页面的文本内容和索引标识,在数据库中建立第一对应关系。
管理装置在收集到至少一个电子书籍中每个页面的文本内容和索引标识后,根据每个电子书籍中每个页面的文本内容和索引标识,建立电子书籍、索引标识、索引标识对应页面中的文本内容之间的对应关系,该对应关系称为第一对应关系,根据该第一对应关系可以确定某个电子书籍上某一页的文本内容。
例如,所建立的第一对应关系可以如下表1所示。
表1
通过建立该第一对应关系,可以实现电子书籍的结构化处理,将电子书籍采用文本内容及其索引标识来表示,并且便于根据某一文本内容查询所属的电子书籍和在电子书籍中的索引标识,加快查询速度。
在一种可能实现方式中,该数据库中存储电子书籍时,可以为每个电子书籍分配唯一的书籍标识,该书籍标识可以为电子书籍的名称、编号或存储地址等。为了减少该第一对应关系的数据量,该第一对应关系中的电子书籍可以以书籍标识的形式来表示,根据该第一对应关系可以先查询到书籍标识,再根据书籍标识获取对应的电子书籍。
303、管理装置对每个电子书籍中每个页面的文本内容进行分词,得到每个页面的至少一个词汇。
304、管理装置根据每个电子书籍中每个页面的至少一个词汇和索引标识,在数据库中建立第二对应关系。
对于每个电子书籍的每个页面,该页面的文本内容由词汇组成,可以对该文本内容进行分词,得到该页面的至少一个词汇,包含该至少一个词汇的文本内容所属的电子书籍即为该词汇所属的电子书籍,包含该至少一个词汇的文本内容所在页面的索引标识即为该至少一个词汇所在页面的索引标识。因此,通过分词可以获取到至少一个电子书籍的多个词汇。根据电子书籍、索引标识、索引标识对应页面中的至少一个词汇可以建立倒排索引,从而能够针对每个词汇,建立词汇、词汇所属的电子书籍、电子书籍中词汇所在页面的索引标识之间的对应关系,该对应关系称为第二对应关系,根据该第二对应关系可以确定某个词汇位于哪个电子书籍的哪一页。
例如,所建立的第二对应关系可以如下表2所示。
表2
通过建立第二对应关系,能够对大量的词汇进行整理,以词汇为索引建立对应关系,便于根据词汇查询对应的电子书籍和文本内容,实现有针对性地词汇查询,加快查询速度。
在一种可能实现方式中,为了减少该第二对应关系的数据量,该第二对应关系中的电子书籍可以以书籍标识的形式来表示,根据该第二对应关系可以先查询到书籍标识,再根据书籍标识获取对应的电子书籍。
本发明实施例提供的方法,通过管理装置收集至少一个电子书籍中每个页面的文本内容和索引标识,根据每个电子书籍中每个页面的文本内容和索引标识,在数据库中建立第一对应关系,并对每个电子书籍中每个页面的文本内容进行分词,得到每个页面的至少一个词汇,根据每个电子书籍中每个页面的至少一个词汇和索引标识,在数据库中建立第二对应关系,通过对电子书籍的文本内容进行结构化处理,可以提供结构清晰、富有条理的书籍内容,用户只需在电子书籍中选择感兴趣的部分书籍内容,即可直接根据该部分书籍内容查询到电子书籍,操作方便快捷。
图4是本发明实施例提供的一种创建数据库的方法流程图。本发明实施例的执行主体为管理装置,该管理装置可以为图1或图2所示实施例中的电子设备或服务器,参见图4,该方法包括:
401、管理装置收集至少一个电子书籍中每个页面的图像和索引标识,对每个页面的图像进行特征提取,得到图像特征。
管理装置收集一个或多个电子书籍,每个电子书籍可以包括多个页面,每个页面上具有书籍内容,且每个页面在所属电子书籍中具有唯一的索引标识,该索引标识用于确定该页面在电子书籍中的顺序。
因此,对电子书籍进行结构化处理,以页面上的书籍内容和对应的索引标识来表示电子书籍,并创建电子书籍的结构信息,该结构信息包括每个页面上的书籍内容与对应索引标识的映射关系,而且还能表示各个页面之间的关系,从而获取到结构化的电子书籍。之后,在数据库中存储的电子书籍不仅包括书籍内容,还包括电子书籍的结构信息,则根据该电子书籍不仅可以获取到电子书籍内的书籍内容,还可以了解各部分书籍内容之间的关系。
并且,对于每个页面,获取该页面的图像,对该图像进行特征提取,得到该页面的图像特征,进而可以得到多个页面的图像特征。
在一种可能实现方式中,对于每个页面的图像,可以采用预设特征提取算法进行特征提取,得到图像特征。该预设特征提取算法可以为FAST(Features from AcceleratedSegment Test,加速分割测试特征)或者Harris(一种角点检测算法)等特征提取算法。
或者,为了提高图像特征的准确率,还可以训练特征提取模型,该特征提取模型用于对图像进行特征提取。电子设备可以应用该特征提取模型,对每个页面的图像进行特征提取,得到图像特征。对于该特征提取模型的训练过程,可以获取多个样本图像以及每个样本图像的图像特征,根据多个样本图像以及每个样本图像的图像特征,采用预设训练算法进行训练,得到该特征提取模型。其中,该预设训练算法可以为深度学习算法、卷积神经网络算法或者循环神经网络算法等,采用不同的预设训练算法可以训练得到不同形式的模型,如深度学习模型、卷积神经网络模型或者循环神经网络模型等。
例如,还可以采用Attention(关键区域划分)算法对每个页面的图像进行区域级别的特征提取,通过对图像进行关键区域划分,得到图像中的多个关键区域,再分别针对每个关键区域采用预设特征提取算法进行特征提取,得到每个关键区域的图像特征,将多个关键区域的图像特征组成页面图像的图像特征。
实际生活中在拍摄某个书籍的图像时,可能出现远距离拍摄、倾斜拍摄、颠倒拍摄、局部拍摄、高曝光拍摄、暗处拍摄、模糊拍摄等情况,则对图像的图像特征进行匹配时,很容易出现匹配错误的情况,因此需要获取到足够准确的图像特征。而本发明实施例中,根据样本图像进行训练的方式,可以得到鲁棒性更强的特征提取模型,可以提高图像特征的准确率,进而提高查询结果的准确率。
402、管理装置根据每个电子书籍中每个页面的图像特征和索引标识,在数据库中建立第三对应关系。
管理装置在收集到至少一个电子书籍中每个页面的图像特征和索引标识后,根据每个电子书籍中每个页面的图像特征和索引标识,建立该图像特征、图像特征对应页面所属的电子书籍、电子书籍中页面的索引标识之间的对应关系,该对应关系称为第三对应关系。
例如,该第三对应关系可以如下表3所示。
表3
通过建立该第三对应关系,可以实现电子书籍的结构化处理,将电子书籍采用图像特征及其索引标识来表示,便于根据某个图像的图像特征进行查询,而不仅是根据电子书籍中的文本内容进行查询,加快查询速度,扩展了应用范围。
在一种可能实现方式中,为了减少该第三对应关系的数据量,该第三对应关系中的电子书籍可以以书籍标识的形式来表示,根据该第三对应关系可以先查询到书籍标识,再根据书籍标识获取对应的电子书籍。
403、管理装置对收集到的多个页面的图像特征进行聚类,得到多个类别以及每个类别的中心图像特征。
404、管理装置根据每个类别的中心图像特征与每个类别内的图像特征,在数据库中建立第四对应关系。
由于数据库中存储有大量的电子书籍,每个电子书籍中又包括多个页面,因此通过执行上述步骤401-402可以收集到多个页面的图像特征,后续可以将某一图像的图像特征与数据库中的图像特征进行匹配,以查询到该图像所属的电子书籍。而当电子书籍的数量较多时,图像特征的数量过于庞大,会导致匹配时间过长,查询速度过慢。
因此,可以对收集到的多个图像特征进行聚类,将该多个图像特征划分成多个类别,每个类别中包括至少一个图像特征,且同一个类别内的图像特征对应的页面可以为包含同类书籍内容的页面。另外,进行聚类后可以确定每个类别的中心图像特征,该中心图像特征可以作为相应类别的视觉词汇,对相应类别内的书籍内容进行描述。
之后,根据得到的多个类别、每个类别的中心图像特征以及每个类别包含的图像特征,建立该中心图像特征与中心图像特征所属类别内的图像特征之间的对应关系,该对应关系称为第四对应关系,根据该第四对应关系可以确定每个中心图像特征所属类别内的图像特征。
其中,对多个图像特征进行聚类是指,将多个图像特征进行对比,根据各个图像特征之间是否相似,将该多个图像特征划分成多个类别的过程,并且聚类完成后还会确定每个类别的中心图像特征,该中心图像特征可以为所属类别内的多个图像特征的平均值或其他统计值。聚类过程中所采用的聚类算法可以为K-means聚类算法、DBSCAN(Density-BasedSpatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)、OPTICS(Ordering Points To Identify the Clustering Structure,通过点排序识别聚类结构的密度聚类算法)等。
例如,该第四对应关系可以如下表4所示。
表4
中心图像特征 图像特征
类别1:中心图像特征1 图像特征1、图像特征3、图像特征4
类别2:中心图像特征2 图像特征2、图像特征3、图像特征6
类别3:中心图像特征3 图像特征3、图像特征4、图像特征7
数据库中存在着大量的电子书籍,且每个电子书籍的页面中可能会包含文本、人物、动物、植物等多种类型的书籍内容。本发明实施例中,通过将页面进行图像化,并提取图像特征,并对图像特征进行聚类,能够抛开电子书籍的限制,针对多个页面,将包含同一类型书籍内容的页面归为同一类别。如将包含人物的页面归为一类,将包含小狗的页面归为一类,将包含小猪的页面归为一类。
后续过程中在查询某一图像所属的电子书籍时,无需将该图像的目标图像特征与数据库中的所有图像特征进行匹配,仅需根据每个类别的中心图像特征,确定与该目标图像特征相似的类别,将该目标图像特征与相似类别内的图像特征进行匹配即可,减小了需匹配的图像特征数量,节省了计算时间,加快了查询速度。
需要说明的是,上述图3和图4所示实施例中的管理装置可以包括电子设备和服务器。
在一种场景下,该管理装置为服务器。服务器创建数据库,并收集各个电子设备上传的电子书籍,对电子书籍进行结构化处理后存储于数据库中,该数据库可供多个电子设备访问。
在另一种场景下,管理装置包括电子设备和服务器。服务器创建数据库,每个电子设备获取到任一电子书籍时,可以执行本发明实施例提供的方法对电子书籍进行结构化处理,建立对应关系,并上传至服务器,由服务器将每个电子设备上传的对应关系存储于数据库中,供其他的电子设备访问。
综合上述图3和图4所示的实施例,本发明实施例的操作流程可以如图5所示,通过该操作流程,创建了电子书籍的数据库,后续可以在该数据库中查询电子书籍。
本发明实施例提供的方法,通过管理装置收集至少一个电子书籍中每个页面的图像和索引标识,对每个页面的图像进行特征提取,得到图像特征,根据每个电子书籍中每个页面的图像特征和索引标识,在数据库中建立第三对应关系,并对收集到的多个页面的图像特征进行聚类,得到多个类别以及每个类别的中心图像特征,并根据每个类别的中心图像特征与每个类别内的图像特征,在数据库中建立第四对应关系。通过将电子书籍的索引标识进行图像化,对电子书籍页面的图像进行结构化处理,建立图像特征的对应关系,用户只需在电子书籍中选择感兴趣的部分书籍内容,即可根据该部分书籍内容的书籍图像查询到电子书籍,操作方便快捷。
图6是本发明实施例提供的一种电子书籍显示方法的流程图。本发明实施例的执行主体为管理装置,参见图6,该方法包括:
601、管理装置显示电子书籍管理应用的内容输入界面。
管理装置运行电子书籍管理应用时,可以显示电子书籍管理应用的管理界面,根据所实现功能的不同,该管理界面可以包括多种界面。
其中,该内容输入界面是指用于输入待查询书籍内容的界面,通过内容输入界面可以输入待查询的书籍内容,从而根据该书籍内容进行查询。该内容输入界面可以为电子书籍管理应用的主界面,或者也可以为从该主界面切换后得到的界面。
在一种可能实现方式中,当检测到用户对该电子书籍管理应用的触发操作时,管理装置显示该电子书籍管理应用的主界面,该主界面中包括用于获取书籍内容的获取选项,当检测到对获取选项的选择操作时,管理装置显示该电子书籍管理应用的内容输入界面。
其中,对该电子书籍管理应用的触发操作可以为对该电子书籍管理应用的应用图标的点击操作,或者可以为在互联网应用的标识列表中,对该电子书籍管理应用的公共标识的点击操作等。
602、管理装置获取通过内容输入界面输入的书籍内容。
管理装置显示内容输入界面后,用户可以在该内容输入界面输入书籍内容,该书籍内容为待查询的电子书籍中的部分书籍内容,管理装置获取该书籍内容。
考虑到用户可以通过多种途径获得书籍内容,因此所输入的书籍内容可能会包括图像、文本、语音等多种类型,因此该内容输入界面可以包括拍摄选项、图像选择选项、文本输入栏或语音输入选项中的至少一个,从而为用户提供不同类型的选项,供用户输入不同类型的书籍内容。
相应地,步骤602可以包括以下步骤6021-6024中的至少一项:
6021、当内容输入界面包括拍摄选项时,当检测到对拍摄选项的触发操作时,对原始书籍的书籍内容进行拍摄,得到书籍图像;将该书籍图像作为书籍内容,和/或,从书籍图像中提取文本内容,作为书籍内容。
其中,从书籍图像中提取文本内容时,对该书籍图像进行文本区域检测,并对检测到的文本区域进行文本识别,从书籍图像中提取文本内容,作为书籍内容,后续根据该书籍内容查询电子书籍。
在一种可能实现方式中,可以获取文本区域检测模型和文本识别模型。其中,文本区域检测模型用于对图像的文本区域进行检测,得到文本区域。文本识别模型用于对图像区域进行文本识别,得到文本内容。
则管理装置获取到书籍图像后,基于文本区域检测模型,对该书籍图像中的文本区域进行检测,得到文本区域。并基于文本识别模型,对该文本区域进行文本识别,得到文本内容。
关于该文本区域检测模型的训练过程,可以获取多个样本图像以及每个样本图像中的文本区域标识,根据该多个样本图像以及每个样本图像中的文本区域标识,采用预设训练算法进行训练,得到文本区域检测模型。其中,该预设训练算法可以为FCN(全卷积网络)算法、深度学习算法、卷积神经网络算法或者循环神经网络算法等,采用不同的预设训练算法可以训练得到不同形式的模型,如FCN检测模型、深度学习模型、卷积神经网络模型或者循环神经网络模型等。
关于该文本识别模型的训练过程,可以获取多个样本文本区域,采用预设训练算法进行训练,得到文本识别模型。其中,该预设训练算法可以为深度学习算法、卷积神经网络算法或者循环神经网络算法等,采用不同的预设训练算法可以训练得到不同形式的模型,如深度学习模型、卷积神经网络模型或者循环神经网络模型等。
用户在阅读某一原始书籍的过程中,当看到感兴趣的书籍内容时,可以通过管理装置对书籍内容进行拍摄,得到包含该书籍内容的书籍图像,后续可以根据该书籍图像查询电子书籍,实现了从原始书籍到电子书籍的转化。
6022、当内容输入界面包括图像选择选项时,当检测到对图像选择选项的触发操作时,获取用户在图像库中选择的书籍图像;将该书籍图像作为书籍内容,和/或,从书籍图像中提取文本内容,作为书籍内容。
与上述步骤6021的区别在于,触发图像选择选项时,可以直接调用图像库,为用户显示图像库中存储的图像,用户可以从图像库中选择待查询的书籍图像,而无需进行拍摄。
其中,从书籍图像中提取文本内容的过程与上述步骤6021类似,在此不再赘述。
当用户拍摄了一张书籍图像,或者其他用户向用户分享了一张书籍图像时,可以先将该书籍图像存储于图像库中。之后用户进入电子书籍管理应用的内容输入界面中,通过触发图像选择选项可以导入该书籍图像,后续可以根据该书籍图像查询电子书籍,以获取完整的电子书籍。
6023、当内容输入界面包括文本输入栏时,获取用户在文本输入栏中输入的文本内容,作为书籍内容。
在一种可能实现方式中,该内容输入界面可以包括文本输入栏和确认选项,用户在该文本输入栏中输入文本内容,并在输入完成后点击确认选项,管理装置检测到对该确认选项的点击操作时,获取文本输入栏中输入的文本内容,作为书籍内容。
当用户看到一段感兴趣的语句时,可以在内容输入界面中输入该语句,查询该语句所属的电子书籍。
6024、当内容输入界面包括语音输入选项时,当检测到对语音输入选项的触发操作时,录制语音内容,并将语音内容转换为文本内容,作为书籍内容。
在另一种可能实现方式中,该触发操作可以为对语音输入选项的长按操作,当检测到用户对语音输入选项的长按操作时,开始录制用户说出的语音内容,直至用户停止该长按操作时,获取录制到的语音内容,并进行语音识别,将语音内容转换为文本内容,作为书籍内容。
例如,电子书籍管理应用的主界面如图7所示,该主界面中包含书籍内容获取选项“拍课本自学”,当检测到对该书籍内容获取选项的点击操作后,显示如图8所示的内容输入界面,该内容输入界面包含下方的拍摄选项和左下角的图像选择选项。用户可以点击拍摄选项对原始书籍的书籍内容进行拍摄,将拍摄的书籍图像作为书籍内容,或者,用户可以点击图像选择选项,将在图像库中选择的书籍图像作为书籍内容。
603、管理装置在数据库中查询书籍内容所属的电子书籍以及电子书籍中书籍内容所在页面的索引标识。
数据库中包括至少一个电子书籍中的书籍内容以及在该至少一个电子书籍中该书籍内容所在页面的索引标识。当管理装置获取到待查询的书籍内容时,可以在数据库中,将该书籍内容与每个电子书籍在每个页面上的书籍内容进行匹配,从而确定该书籍内容所属的电子书籍,以及该电子书籍中该书籍内容所在页面的索引标识。
在一种可能实现方式中,数据库中可以对每个电子书籍进行结构化处理,存储每个电子书籍的多种对应关系,供用户查询。且,根据书籍内容的类型不同,查询过程也不同。
第一种情况下,当书籍内容为文本内容时,该书籍内容中包括至少一个词汇,此时可以基于词汇进行查询。相应地,步骤603可以包括以下步骤6031-6033:
6031、管理装置根据第一对应关系和第二对应关系,查询该至少一个词汇对应的文本内容。
为了便于查询到该书籍内容所在的电子书籍,可以根据书籍内容中的至少一个词汇,查询第一对应关系和第二对应关系,得到包含任一词汇的文本内容,也即是,在众多的电子书籍中,筛选出与书籍内容包含相同词汇的文本内容,这些文本内容中可能存在该书籍内容。
可选地,该步骤6031包括:
(1)对于该至少一个词汇中的每个词汇,管理装置根据第二对应关系,查询该词汇所属的电子书籍以及在电子书籍中该词汇所在页面的索引标识。
(2)根据第一对应关系,在数据库中查询该词汇所属的电子书籍和在电子书籍中该词汇所在页面的索引标识对应的文本内容,该文本内容即为包含该词汇的文本内容。
6032、从查询到的文本内容中,确定与书籍内容匹配的文本内容、文本内容所属的电子书籍以及电子书籍中文本内容所在页面的索引标识。
6033、将确定的电子书籍作为书籍内容所属的电子书籍,将确定的索引标识作为电子书籍中书籍内容所在页面的索引标识。
查询到与书籍内容包含相同词汇的文本内容之后,将书籍内容与查询到的文本内容分别进行匹配,确定与书籍内容匹配的文本内容,该文本内容即为与书籍内容相同的内容,该文本内容所属的电子书籍即为该书籍内容所属的电子书籍,该电子书籍中文本内容所在页面的索引标识即为该电子书籍中该书籍内容所在页面的索引标识。
在一种可能实现方式中,在进行内容匹配时,可以分别计算该至少一个文本内容中每个文本内容与书籍内容之间的相似度,将计算得到的相似度按照从大到小的顺序进行排序,从该多个文本内容中,确定与该书籍内容之间的相似度最大的文本内容,作为与书籍内容匹配的文本内容,并根据第一对应关系,确定该文本内容所属的电子书籍以及电子书籍中该文本内容所在页面的索引标识,分别作为该书籍内容所属的电子书籍,以及电子书籍中该书籍内容所在页面的索引标识。
第二种情况下,当书籍内容为书籍图像时,可以基于书籍图像的图像特征进行查询。相应地,步骤603可以包括以下步骤6034-6036:
6034、管理装置对书籍图像进行特征提取,得到该书籍图像的目标图像特征。
其中,进行特征提取的具体过程与上述步骤401类似,在此不再赘述。
6035、根据第三对应关系和第四对应关系,查询与目标图像特征匹配的图像特征、图像特征对应页面所属的电子书籍、电子书籍中图像特征对应页面的索引标识。
为了便于查询到该书籍内容所在的电子书籍,可以根据书籍内容的目标图像特征,查询第三对应关系和第四对应关系,得到匹配的图像特征,也即是,在众多的电子书籍中,筛选出与书籍图像相似的页面,这些页面中可能存在该书籍图像对应的页面。
可选地,该步骤6035包括:
(1)根据第四对应关系,确定与目标图像特征相似的中心图像特征,以及该中心图像特征对应的图像特征。
该第四对应关系中包括多个类别的中心图像特征,且每个中心图像特征与至少一个图像特征对应。为了减小计算量,先不将目标图像特征与每个图像特征进行匹配,而是先将目标图像特征与第四对应关系中的每个中心图像特征进行匹配,从多个类别的中心图像特征中确定与目标图像特征相似的中心图像特征,也即是确定了目标图像特征所属的类别,该中心图像特征对应的图像特征即为与目标图像特征属于同一类别的图像特征。此时,可以在该目标图像特征所属类别内查找与该目标图像特征相同的图像特征,将其他类别内的图像特征过滤。
在一种可能实现方式中,在将目标图像特征与第四对应关系中的每个中心图像特征进行匹配时,可以分别计算每个中心图像特征与目标图像特征之间的相似度,将计算的相似度按照从大到小的顺序进行排列,从多个中心图像特征中确定与目标图像特征之间的相似度最大的中心图像特征,作为与目标图像特征相似的中心图像特征。
(2)从该中心图像特征对应的图像特征中,确定与目标图像特征匹配的图像特征。
(3)根据第三对应关系,查询与目标图像特征匹配的图像特征对应的电子书籍和索引标识。
当该中心图像特征仅对应一个图像特征时,将该图像特征作为与目标图像特征匹配的图像特征。或者,当该中心图像特征对应多个图像特征时,表示在目标图像特征所属的类别内包括多个图像特征,则计算每个图像特征与目标图像特征之间的相似度,将计算的相似度按照从大到小的顺序进行排列,从该多个图像特征中,确定与目标图像特征之间的相似度最大的图像特征,作为与目标图像特征匹配的图像特征。之后,根据第三对应关系,确定与目标图像特征匹配的图像特征对应的电子书籍和索引标识。
6036、将确定的电子书籍作为书籍内容所属的电子书籍,并将确定的索引标识作为电子书籍中该书籍内容所在页面的索引标识。
上述两种情况分别采用了文本内容和图像特征查询电子书籍,在另一实施例中,也可以采用文本内容与图像特征相结合的方式,针对待查询的书籍内容,同时执行上述步骤6031-6036来查询该书籍内容所属的电子书籍以及在电子书籍中所在页面的索引标识,查询结果更为准确。
604、管理装置显示电子书籍管理应用的书籍展示界面。
电子书籍管理应用的管理界面还可以包括书籍展示界面,该书籍展示界面用于展示所查询到的电子书籍中的书籍内容。本发明实施例中,在查询到电子书籍以及电子书籍中书籍内容所在页面的索引标识时,管理装置从内容输入界面切换为显示书籍展示界面,该书籍展示界面包括该索引标识对应的书籍内容,也即是该索引标识对应页面上的书籍内容。
电子书籍中的页面可以包括封面、目录页面和正文页面等多种类型的页面,用户待查询的书籍内容所在页面的类型不同时,希望查看的书籍内容也不同。因此,管理装置在显示书籍展示界面时,不会直接显示待查询的书籍内容所在的页面,而是会根据书籍内容所在页面的类型进行显示。
在一种可能实现方式中,当书籍内容所在页面的索引标识为封面的索引标识或目录页面的索引标识时,表示该书籍内容位于封面或目录页面上,即该书籍内容不是电子书籍的正文内容。因此可以确定用户根据该书籍内容进行查询,目的是为了获得完整的电子书籍,了解该电子书籍中的大致内容。为此,管理装置可以在书籍展示界面中显示目录页面,供用户查看。
电子书籍可能会包括一个目标页面或多个目录页面,当电子书籍仅包括一个目录页面时,管理装置在书籍展示界面中显示该目录页面。而当电子书籍包括多个目录页面时,无论该书籍内容位于第一个目录页面还是其他的目录页面中,为了便于用户从头开始查看目录,可以在书籍展示界面中显示第一个目录页面。
在书籍展示界面中显示目录页面之后,当管理装置检测到用户的滑动操作时,可以根据该滑动操作,显示其他的目录页面,以便用户查看到完整的目录。或者,当管理装置检测到对目录页面中任一标题的选择操作时,判断所选择的标题是否为最后一级标题,若选择的标题为最后一级标题,则在书籍展示界面中,显示最后一级标题对应的第一个正文页面,以便用户从头开始阅读该最后一级标题对应的正文内容。若选择的标题不是最后一级标题,则在该书籍展示界面中,显示选择的标题的至少一个下一级标题,以便用户了解各个标题之间的层级关系,并选择希望阅读正文内容的最后一级标题。
例如,书籍展示界面可以如图9所示,在书籍展示界面中显示目录页面,每个非最后一级标题对应一个展开选项,通过点击展开选项,可以在书籍展示界面上显示非最后一级标题的下一级标题,直到书籍展示界面显示最后一级标题为止,用户可以手动点击任一个最后一级标题,选择要阅读的正文内容。并且,显示最后一级标题后,非最后一级标题的展开选项转换为隐藏选项,用户通过点击该隐藏选项,可以将非最后一级标题的下一级标题隐藏。
在另一种可能实现方式中,当书籍内容所在页面的索引标识为正文页面的索引标识时,表示该书籍内容为电子书籍的正文内容,此时可以确定用户根据该书籍内容进行查询,不仅是为了获得完整的电子书籍,还希望了解该书籍内容的前后文中的内容。为此,管理装置确定正文页面所属的最后一级标题,该最后一级标题下的正文内容可以认为是该书籍内容的前后文内容,则为了便于用户从头开始阅读,管理装置在书籍展示界面中,显示最后一级标题对应的第一个正文页面。
电子书籍的目录页面中,每个最后一级标题对应一个索引标识范围,该索引标识范围包括至少一个索引标识,用于表示最后一级标题对应的至少一个正文页面的索引标识。因此,当书籍内容所在页面的索引标识为正文页面的索引标识时,确定该索引标识对应的最后一级标题,该最后一级标题对应的索引标识范围中第一个索引标识对应的正文页面即为该最后一级标题对应的第一个正文页面。
需要说明的是,管理装置在书籍展示界面中显示书籍内容时,虽然从前台界面上来看,所显示的书籍内容与管理装置之前获取到的书籍内容可能是相同的内容,但是,书籍显示界面中显示的书籍内容是管理装置在获取到完整的电子书籍后,从该电子书籍中提取的书籍内容。因此,基于所显示的书籍内容,还可以对电子书籍的其他书籍内容进行显示。
则在上述步骤604之后,该方法还可以包括以下步骤605或606:
605、在书籍展示界面中显示书籍内容时,当检测到用户的滑动操作时,根据该滑动操作,显示电子书籍中的其他书籍内容。
例如,当滑动操作为向上滑动操作时,可以根据滑动操作的滑动距离,确定当前显示的书籍内容之后的、该滑动距离对应范围内的书籍内容,显示重新确定的书籍内容。或者,当滑动操作为向下滑动操作时,可以根据滑动操作的滑动距离,确定当前显示的书籍内容之前的、该滑动距离对应范围内的书籍内容,显示重新确定的书籍内容。
或者,当滑动操作为向上滑动操作时,显示当前页面的上一个页面中的书籍内容,或者当滑动操作为向下滑动操作时,显示当前页面的下一个页面中的书籍内容。
这样,用户不仅可以查看希望查询的书籍内容,还可以通过上下滑动的操作,查看电子书籍中的其他书籍内容。
606、书籍展示界面中包括退出选项,当检测到对退出选项的确认操作时,显示书籍管理应用的主界面,且该主界面中包括该电子书籍的书籍标识。且当检测到对该书籍标识的选择操作时,可以在书籍展示界面中,继续显示上一次在退出该书籍展示界面时所显示的书籍内容。
另外,在书籍展示界面中显示书籍内容时,用户可以基于该书籍内容进行学习。也即是,在上述步骤604之后,该方法还可以包括以下步骤607或608:
607、书籍展示界面还包括学习选项,当管理装置检测到对学习选项的确认操作时,基于书籍展示界面中显示的书籍内容,执行与学习选项对应的操作。
该学习选项用于触发对书籍内容的学习操作。根据可执行的学习操作的不同,可以提供不同的学习选项。例如,针对一篇英语课文,可执行的学习操作包括跟读、默写单词等,相应地,在该书籍展示界面中可以显示跟读选项、默写单词选项等。
用户在阅读该书籍内容后,若想基于该书籍内容进行学习时,可以触发相应的学习选项,此时管理装置可以通过与用户进行交互,帮助用户进行学习。
608、书籍展示界面还包括学习选项和该书籍内容中多个段落的选择选项,当检测到对任一选择选项的确认操作时,将确认的选择选项对应的段落确定为待学习的书籍内容,当检测到对学习选项的确认操作时,基于待学习的书籍内容,执行与学习选项对应的操作。
该书籍内容中可以包括多个段落,为了便于用户基于某些段落进行学习,在书籍展示界面显示书籍内容时,可以为每个段落显示一个选择选项,用户希望学习任一段落时,可以触发对选择选项的确认操作,之后触发对学习选项的确认操作。管理装置当检测到对任一选择选项的确认操作时,将确认的选择选项对应的段落确定为待学习的书籍内容,当检测到对学习选项的确认操作时,即可基于待学习的书籍内容,执行与学习选项对应的操作,在此学习过程中无需再考虑其他段落。
例如,书籍展示界面中显示的书籍内容有单词和课文,并且还显示了学习选项和每个段落的选择选项,如图10和图11所示。当还未检测到对任一选择选项的确认操作时,学习选项“开始学习”处于无法选中的状态。当检测到对课文第一段的选择选项的确认操作时,将该段落确定为用户要学习的段落,此时学习选项“开始学习”处于可选中的状态。当检测到对学习选项“开始学习”的确认操作时,显示跟读界面,用户可以基于上述选择的段落,进行跟读学习。
并且,如图12所示,该跟读界面中不会直接显示完整的段落,而是每次仅显示一条语句,并且还会显示发音按钮和跟读选项“点击开始跟读”,用户点击该发音按钮时,管理装置可以发出该语句对应的语音,用户收听该语音后,点击跟读选项“点击开始跟读”,即可执行跟读操作,重复该语句对应的语音。
需要说明的是,上述图6所示实施例中的管理装置可以包括电子设备和服务器。
在一种场景下,服务器存储数据库,电子设备显示电子书籍管理应用的管理界面,用户可以在电子设备上输入待查询的书籍内容,并向服务器发送携带该书籍内容的查询请求,服务器在接收到查询请求后,在数据库中查询该书籍内容所属的电子书籍以及该电子书籍内容所在的页面的索引标识,获取该索引标识对应的书籍内容后返回该电子设备,由该电子设备展示给用户,用户即可基于该电子书籍进行学习。
在另一种场景下,服务器根据收集的电子书籍创建数据库,将数据库下发给多个电子设备。用户在电子设备上输入待查询的书籍内容时,电子设备可以在数据库中查询该书籍内容所属的电子书籍以及该电子书籍内容所在的页面的索引标识,获取该索引标识对应的书籍内容,展示给用户,用户即可基于该电子书籍进行学习。
综合上述图6所示的实施例,本发明实施例的操作流程可以如图13所示,通过该操作流程,可以根据在电子书籍管理应用的内容输入界面中获取的书籍内容,显示该书籍内容所属的电子书籍以及在该电子书籍中书籍内容所在页面上的书籍内容。
本发明实施例提供的方法,通过显示电子书籍管理应用的内容输入界面,获取通过内容输入界面输入的书籍内容,在数据库中查询书籍内容所属的电子书籍,并显示电子书籍管理应用的书籍展示界面,在书籍展示界面显示电子书籍的书籍内容。本发明实施例提供了根据书籍内容查询电子书籍的功能,扩展了应用范围,用户无需获知电子书籍的描述信息即可根据部分书籍内容查询到完整的电子书籍,操作方便快捷,对用户的信息储备要求较低。
在上述图3、图4和图6所示实施例的基础上,本发明实施例还提供了一种示例性操作流程,该操作流程包括:
1、管理人员将电子书籍上传至服务器的数据库,在数据库中存储电子书籍的书籍内容。该电子书籍中的书籍内容按照页面进行划分,并包括有每个页面的索引标识。
2、用户看到一段感兴趣的书籍内容时,通过电子设备拍摄该书籍内容,得到包含该书籍内容的照片,发送给服务器。
3、服务器根据照片中的文本内容和图像特征,在数据库中进行查询,得到包含该书籍内容的电子书籍和该书籍内容所在页面的索引标识。
4、服务器将该电子书籍和该索引标识发送给电子设备,电子设备显示该索引标识对应页面上的书籍内容。
用户还可查看这些书籍内容,并且还可以通过滑动操作显示当前书籍内容之前或之后的其他书籍内容,并根据显示的书籍内容进行阅读、跟读或背诵等学习过程。
图14是本发明实施例提供的一种电子书籍显示装置的结构示意图,参见图14,该装置包括:
第一显示模块1401,用于执行上述实施例中显示电子书籍管理应用的内容输入界面的步骤;
获取模块1402,用于执行上述实施例中获取通过内容输入界面输入的书籍内容的步骤;
查询模块1403,用于执行上述实施例中在数据库中,查询书籍内容所属的电子书籍的步骤;
第二显示模块1404,用于执行上述实施例中显示电子书籍管理应用的书籍展示界面的步骤。
可选地,查询模块1403,用于执行上述实施例中查询电子书籍以及索引标识的步骤;
可选地,第二显示模块1404包括:
显示单元,用于执行上述实施例中当索引标识为封面的索引标识或目录页面的索引标识时,在书籍展示界面中显示目录页面;或者,当索引标识为正文页面的索引标识时,确定正文页面所属的最后一级标题,在书籍展示界面中,显示最后一级标题对应的第一个正文页面的步骤。
可选地,装置还包括:
第三显示模块,用于执行上述实施例中当检测到对目录页面中任一标题的选择操作时,若选择的标题为最后一级标题,则在书籍展示界面中,显示最后一级标题对应的第一个正文页面的步骤;
第四显示模块,用于执行上述实施例中若选择的标题不是最后一级标题,则在书籍展示界面中,显示选择的标题的下一级标题的步骤。
可选地,装置还包括:
执行模块,用于执行上述实施例中执行与学习选项对应的操作的步骤。
可选地,获取模块1402包括以下至少一项:
拍摄单元,用于执行上述实施例中当检测到对拍摄选项的触发操作时,对原始书籍的书籍内容进行拍摄,得到书籍图像的步骤;
选择单元,用于执行上述实施例中当检测到对图像选择选项的触发操作时,获取用户在图像库中选择的书籍图像的步骤;
文本输入单元,用于执行上述实施例中获取用户在文本输入栏中输入的文本内容的步骤;
语音输入单元,用于执行上述实施例中当检测到对语音输入选项的触发操作时,录制语音内容,并将语音内容转换为文本内容的步骤。
可选地,装置还包括:
第一收集模块,用于执行上述实施例中收集至少一个电子书籍中每个页面的文本内容和索引标识的步骤;
第一建立模块,用于执行上述实施例中根据每个电子书籍中每个页面的文本内容和索引标识,在数据库中建立第一对应关系的步骤;
分词模块,用于执行上述实施例中对每个电子书籍中每个页面的文本内容进行分词,得到每个页面的至少一个词汇的步骤;
第二建立模块,用于执行上述实施例中根据每个电子书籍中每个页面的至少一个词汇和索引标识,在数据库中建立第二对应关系的步骤。
可选地,查询模块1403还包括:
查询单元,用于执行上述实施例中当书籍内容包括至少一个词汇时,根据第一对应关系和第二对应关系,查询至少一个词汇对应的文本内容的步骤;
第一确定单元,用于执行上述实施例中从查询到的文本内容中,确定与书籍内容匹配的文本内容、文本内容所属的电子书籍以及电子书籍中文本内容所在页面的索引标识的步骤;
第二确定单元,用于执行上述实施例中将确定的电子书籍作为书籍内容所属的电子书籍,将确定的索引标识作为电子书籍中书籍内容所在页面的索引标识的步骤。
可选地,查询单元还用于执行上述实施例中根据第二对应关系,查询词汇所属的电子书籍以及电子书籍中词汇所在页面的索引标识;根据第一对应关系,查询电子书籍和索引标识对应的文本内容的步骤。
可选地,第一确定单元还用于执行上述实施例中当查询到多个文本内容时,计算每个文本内容与书籍内容之间的相似度;从多个文本内容中,确定与书籍内容之间的相似度最大的文本内容,作为与书籍内容匹配的文本内容,并确定文本内容所属的电子书籍以及电子书籍中文本内容所在页面的索引标识的步骤。
可选地,装置还包括:
第二收集模块,用于执行上述实施例中收集至少一个电子书籍中每个页面的图像和索引标识,对每个页面的图像进行特征提取,得到图像特征的步骤;
第三建立模块,用于执行上述实施例中根据每个电子书籍中每个页面的图像特征和索引标识,在数据库中建立第三对应关系的步骤;
聚类模块,用于执行上述实施例中对收集到的多个页面的图像特征进行聚类,得到多个类别以及每个类别的中心图像特征的步骤;
第四建立模块,用于执行上述实施例中根据每个类别的中心图像特征与每个类别内的图像特征,在数据库中建立第四对应关系的步骤。
可选地,查询模块1403还包括:
特征提取单元,用于执行上述实施例中当书籍内容包括书籍图像时,对书籍图像进行特征提取,得到书籍图像的目标图像特征的步骤;
查询单元,用于执行上述实施例中根据第三对应关系和第四对应关系,查询与目标图像特征匹配的图像特征、图像特征对应页面所属的电子书籍、电子书籍中图像特征对应页面的索引标识的步骤;
确定单元,用于执行上述实施例中将确定的电子书籍作为书籍内容所属的电子书籍,将确定的索引标识作为电子书籍中书籍内容所在页面的索引标识的步骤。
可选地,第二查询单元还用于执行上述实施例中根据第四对应关系,确定与目标图像特征相似的中心图像特征,以及中心图像特征对应的图像特征;从中心图像特征对应的图像特征中,确定与目标图像特征匹配的图像特征;根据第三对应关系,查询图像特征对应的电子书籍和索引标识的步骤。
可选地,第二查询单元还用于执行上述实施例中当获取到多个图像特征时,计算每个图像特征与目标图像特征之间的相似度;从多个图像特征中,确定与目标图像特征之间的相似度最大的图像特征,作为与目标图像特征匹配的图像特征的步骤。
需要说明的是:上述实施例提供的电子书籍显示装置在显示电子书籍时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将管理装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的电子书籍显示装置与电子书籍显示方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图15示出了本发明一个示例性实施例提供的电子设备1500的结构框图。该电子设备1500可以是便携式移动电子设备,比如:智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑、台式电脑、头戴式设备,或其他任意智能电子设备。电子设备1500还可能被称为用户设备、便携式电子设备、膝上型电子设备、台式电子设备等其他名称。
通常,电子设备1500包括有:处理器1501和存储器1502。
处理器1501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1501所具有以实现本申请中方法实施例提供的电子书籍显示方法。
在一些实施例中,电子设备1500还可选包括有:***设备接口1503和至少一个***设备。处理器1501、存储器1502和***设备接口1503之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1503相连。具体地,***设备包括:射频电路1504、显示屏1505、摄像头组件1506、音频电路1507、定位组件1508和电源1509中的至少一种。
***设备接口1503可被用于将I/O(Input/Output,输入/输出)相关的至少一个***设备连接到处理器1501和存储器1502。在一些实施例中,处理器1501、存储器1502和***设备接口1503被集成在同一芯片或电路板上;在一些其他实施例中,处理器1501、存储器1502和***设备接口1503中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1504包括:天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1504可以通过至少一种无线通信协议来与其它电子设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及8G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1504还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1505用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时,显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1501进行处理。此时,显示屏1505还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1505可以为一个,设置电子设备1500的前面板;在另一些实施例中,显示屏1505可以为至少两个,分别设置在电子设备1500的不同表面或呈折叠设计;在再一些实施例中,显示屏1505可以是柔性显示屏,设置在电子设备1500的弯曲表面上或折叠面上。甚至,显示屏1505还可以设置成非矩形的不规则图形,也即异形屏。显示屏1505可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1506用于采集图像或视频。可选地,摄像头组件1506包括前置摄像头和后置摄像头。通常,前置摄像头设置在电子设备的前面板,后置摄像头设置在电子设备的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1506还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1507可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1501进行处理,或者输入至射频电路1504以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备1500的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1507还可以包括耳机插孔。
定位组件1508用于定位电子设备1500的当前地理位置,以实现导航或LBS(Location Based Service,基于位置的服务)。定位组件1508可以是基于美国的GPS(Global Positioning System,全球定位***)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。
电源1509用于为电子设备1500中的各个组件进行供电。电源1509可以是交流电、直流电、一次性电池或可充电电池。当电源1509包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备1500还包括有一个或多个传感器1510。该一个或多个传感器1510包括但不限于:加速度传感器1511、陀螺仪传感器1512、压力传感器1513、指纹传感器1514、光学传感器1515以及接近传感器1516。
加速度传感器1511可以检测以电子设备1500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1511可以用于检测重力加速度在三个坐标轴上的分量。处理器1501可以根据加速度传感器1511采集的重力加速度信号,控制显示屏1505以横向视图或纵向视图进行用户界面的显示。加速度传感器1511还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1512可以检测电子设备1500的机体方向及转动角度,陀螺仪传感器1512可以与加速度传感器1511协同采集用户对电子设备1500的3D动作。处理器1501根据陀螺仪传感器1512采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1513可以设置在电子设备1500的侧边框和/或显示屏1505的下层。当压力传感器1513设置在电子设备1500的侧边框时,可以检测用户对电子设备1500的握持信号,由处理器1501根据压力传感器1513采集的握持信号进行左右手识别或快捷操作。当压力传感器1513设置在显示屏1505的下层时,由处理器1501根据用户对显示屏1505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1514用于采集用户的指纹,由处理器1501根据指纹传感器1514采集到的指纹识别用户的身份,或者,由指纹传感器1514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1501授权该用户具有相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1514可以被设置电子设备1500的正面、背面或侧面。当电子设备1500上设置有物理按键或厂商Logo时,指纹传感器1514可以与物理按键或厂商标志集成在一起。
光学传感器1515用于采集环境光强度。在一个实施例中,处理器1501可以根据光学传感器1515采集的环境光强度,控制显示屏1505的显示亮度。具体地,当环境光强度较高时,调高显示屏1505的显示亮度;当环境光强度较低时,调低显示屏1505的显示亮度。在另一个实施例中,处理器1501还可以根据光学传感器1515采集的环境光强度,动态调整摄像头组件1506的拍摄参数。
接近传感器1516,也称距离传感器,通常设置在电子设备1500的前面板。接近传感器1516用于采集用户与电子设备1500的正面之间的距离。在一个实施例中,当接近传感器1516检测到用户与电子设备1500的正面之间的距离逐渐变小时,由处理器1501控制显示屏1505从亮屏状态切换为息屏状态;当接近传感器1516检测到用户与电子设备1500的正面之间的距离逐渐变大时,由处理器1501控制显示屏1505从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图15中示出的结构并不构成对电子设备1500的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图16是本发明实施例提供的一种服务器的结构示意图,该服务器1600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)1601和一个或一个以上的存储器1602,其中,所述存储器1602中存储有至少一条指令,所述至少一条指令由所述处理器1601加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器1600可以用于执行上述电子书籍显示方法中管理装置所执行的步骤。
本发明实施例还提供了一种电子书籍显示装置,该装置包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,指令、程序、代码集或指令集由处理器加载并具有以实现上述实施例的电子书籍显示方法中所执行的操作。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并具有以实现上述实施例的电子书籍显示方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明实施例的较佳实施例,并不用以限制本发明实施例,凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种电子书籍显示方法,其特征在于,所述方法包括:
显示电子书籍管理应用的内容输入界面;
获取通过所述内容输入界面输入的书籍内容,所述书籍内容为待查询的电子书籍中的部分书籍内容;
在数据库中,查询所述书籍内容所属的电子书籍,所述数据库中包括至少一个电子书籍中的书籍内容;
显示所述电子书籍管理应用的书籍展示界面,所述书籍展示界面包括所述电子书籍的书籍内容。
2.根据权利要求1所述的方法,其特征在于,所述在数据库中,查询所述书籍内容所属的电子书籍,包括:
在所述数据库中,查询所述书籍内容所属的电子书籍以及所述电子书籍中所述书籍内容所在页面的索引标识;所述书籍展示界面包括所述电子书籍中所述索引标识对应的书籍内容。
3.根据权利要求2所述的方法,其特征在于,所述电子书籍包括封面、目录页面和正文页面,所述目录页面包括多级标题,且每个最后一级标题对应至少一个正文页面;
所述显示所述电子书籍管理应用的书籍展示界面,包括:
当所述索引标识为所述封面的索引标识或所述目录页面的索引标识时,在所述书籍展示界面中显示所述目录页面;或者,
当所述索引标识为所述正文页面的索引标识时,确定所述正文页面所属的最后一级标题,在所述书籍展示界面中,显示所述最后一级标题对应的第一个正文页面。
4.根据权利要求3所述的方法,其特征在于,所述在所述书籍展示界面中显示所述目录页面之后,所述方法还包括:
当检测到对所述目录页面中任一标题的选择操作时,若选择的标题为最后一级标题,则在所述书籍展示界面中,显示所述最后一级标题对应的第一个正文页面;
若选择的标题不是最后一级标题,则在所述书籍展示界面中,显示所述选择的标题的下一级标题。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述书籍展示界面还包括学习选项,当检测到对所述学习选项的确认操作时,基于所述书籍内容,执行与所述学习选项对应的操作;或者,
所述书籍展示界面还包括学习选项和所述书籍内容中多个段落的选择选项,当检测到对任一选择选项的确认操作时,将确认的选择选项对应的段落确定为待学习的书籍内容,当检测到对所述学习选项的确认操作时,基于所述待学习的书籍内容,执行与所述学习选项对应的操作。
6.根据权利要求1所述的方法,其特征在于,所述获取通过所述内容输入界面输入的书籍内容,包括以下至少一项:
所述内容输入界面包括拍摄选项,当检测到对所述拍摄选项的触发操作时,对原始书籍的书籍内容进行拍摄,得到书籍图像;将所述书籍图像作为所述书籍内容,和/或,从所述书籍图像中提取文本内容,作为所述书籍内容;
所述内容输入界面包括图像选择选项,当检测到对所述图像选择选项的触发操作时,获取用户在图像库中选择的书籍图像;将所述书籍图像作为所述书籍内容,和/或,从所述书籍图像中提取文本内容,作为所述书籍内容;
所述内容输入界面包括文本输入栏,获取用户在所述文本输入栏中输入的文本内容,作为所述书籍内容;
所述内容输入界面包括语音输入选项,当检测到对所述语音输入选项的触发操作时,录制语音内容,并将所述语音内容转换为文本内容,作为所述书籍内容。
7.根据权利要求2或6所述的方法,其特征在于,所述在数据库中,查询所述书籍内容所属的电子书籍以及所述电子书籍中所述书籍内容所在页面的索引标识之前,所述方法还包括:
收集所述至少一个电子书籍中每个页面的文本内容和索引标识;
根据每个电子书籍中每个页面的文本内容和索引标识,在所述数据库中建立第一对应关系,所述第一对应关系为电子书籍、索引标识与所述索引标识对应页面中的文本内容之间的对应关系;
对所述每个电子书籍中每个页面的文本内容进行分词,得到所述每个页面的至少一个词汇;
根据所述每个电子书籍中每个页面的至少一个词汇和索引标识,在所述数据库中建立第二对应关系,所述第二对应关系为词汇、所述词汇所属的电子书籍、所述电子书籍中所述词汇所在页面的索引标识之间的对应关系。
8.根据权利要求7所述的方法,其特征在于,所述在数据库中,查询所述书籍内容所属的电子书籍以及所述电子书籍中所述书籍内容所在页面的索引标识,包括:
当所述书籍内容包括至少一个词汇时,根据所述第一对应关系和所述第二对应关系,查询所述至少一个词汇对应的文本内容;
从查询到的文本内容中,确定与所述书籍内容匹配的文本内容、所述文本内容所属的电子书籍以及所述电子书籍中所述文本内容所在页面的索引标识;
将确定的电子书籍作为所述书籍内容所属的电子书籍,将确定的索引标识作为所述电子书籍中所述书籍内容所在页面的索引标识。
9.根据权利要求8所述的方法,其特征在于,所述根据所述第一对应关系和所述第二对应关系,查询所述至少一个词汇对应的文本内容,包括:
对于所述至少一个词汇中的每个词汇,根据所述第二对应关系,查询所述词汇所属的电子书籍以及所述电子书籍中所述词汇所在页面的索引标识;
根据所述第一对应关系,查询所述电子书籍和所述索引标识对应的文本内容。
10.根据权利要求8所述的方法,其特征在于,所述从查询到的文本内容中,确定与所述书籍内容匹配的文本内容、所述文本内容所属的电子书籍以及所述电子书籍中所述文本内容所在页面的索引标识,包括:
当查询到多个文本内容时,计算每个文本内容与所述书籍内容之间的相似度;
从所述多个文本内容中,确定与所述书籍内容之间的相似度最大的文本内容,作为与所述书籍内容匹配的文本内容,并确定所述文本内容所属的电子书籍以及所述电子书籍中所述文本内容所在页面的索引标识。
11.根据权利要求2或6所述的方法,其特征在于,所述在数据库中,查询所述书籍内容所属的电子书籍以及所述电子书籍中所述书籍内容所在页面的索引标识之前,所述方法还包括:
收集所述至少一个电子书籍中每个页面的图像和索引标识,对每个页面的图像进行特征提取,得到图像特征;
根据每个电子书籍中每个页面的图像特征和索引标识,在所述数据库中建立第三对应关系,所述第三对应关系为图像特征、所述图像特征对应页面所属的电子书籍、所述电子书籍中所述页面的索引标识之间的对应关系;
对收集到的多个页面的图像特征进行聚类,得到多个类别以及每个类别的中心图像特征,所述每个类别包括至少一个页面的图像特征;
根据所述每个类别的中心图像特征与所述每个类别内的图像特征,在所述数据库中建立第四对应关系,所述第四对应关系为中心图像特征与所述中心图像特征所属类别内的图像特征之间的对应关系。
12.根据权利要求11所述的方法,其特征在于,所述在数据库中,查询所述书籍内容所属的电子书籍以及所述电子书籍中所述书籍内容所在页面的索引标识,包括:
当所述书籍内容包括书籍图像时,对所述书籍图像进行特征提取,得到所述书籍图像的目标图像特征;
根据所述第三对应关系和所述第四对应关系,查询与所述目标图像特征匹配的图像特征、所述图像特征对应页面所属的电子书籍、所述电子书籍中所述图像特征对应页面的索引标识;
将确定的电子书籍作为所述书籍内容所属的电子书籍,将确定的索引标识作为所述电子书籍中所述书籍内容所在页面的索引标识。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第三对应关系和所述第四对应关系,查询与所述目标图像特征匹配的图像特征、所述图像特征对应页面所属的电子书籍、所述电子书籍中所述图像特征对应页面的索引标识,包括:
根据所述第四对应关系,确定与所述目标图像特征相似的中心图像特征,以及所述中心图像特征对应的图像特征;
从所述中心图像特征对应的图像特征中,确定与所述目标图像特征匹配的图像特征;
根据所述第三对应关系,查询所述图像特征对应的电子书籍和索引标识。
14.根据权利要求13所述的方法,其特征在于,所述从所述中心图像特征对应的图像特征中,确定与所述目标图像特征匹配的图像特征,包括:
当获取到多个图像特征时,计算每个图像特征与所述目标图像特征之间的相似度;
从所述多个图像特征中,确定与所述目标图像特征之间的相似度最大的图像特征,作为与所述目标图像特征匹配的图像特征。
15.一种电子书籍显示装置,其特征在于,所述装置包括:
第一显示模块,用于显示电子书籍管理应用的内容输入界面;
获取模块,用于获取通过所述内容输入界面输入的书籍内容,所述书籍内容为待查询的电子书籍中的部分书籍内容;
查询模块,用于在数据库中,查询所述书籍内容所属的电子书籍,所述数据库中包括至少一个电子书籍中的书籍内容;
第二显示模块,用于显示所述电子书籍管理应用的书籍展示界面,所述书籍展示界面包括所述索引标识对应的书籍内容。
CN201811075405.6A 2018-09-14 2018-09-14 电子书籍显示方法及装置 Active CN109189879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811075405.6A CN109189879B (zh) 2018-09-14 2018-09-14 电子书籍显示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811075405.6A CN109189879B (zh) 2018-09-14 2018-09-14 电子书籍显示方法及装置

Publications (2)

Publication Number Publication Date
CN109189879A true CN109189879A (zh) 2019-01-11
CN109189879B CN109189879B (zh) 2020-11-06

Family

ID=64911380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811075405.6A Active CN109189879B (zh) 2018-09-14 2018-09-14 电子书籍显示方法及装置

Country Status (1)

Country Link
CN (1) CN109189879B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795916A (zh) * 2019-09-27 2020-02-14 北京浪潮数据技术有限公司 一种文档***的侧边栏展示方法及***
CN110909155A (zh) * 2019-11-25 2020-03-24 掌阅科技股份有限公司 书单生成方法、计算设备及计算机存储介质
CN111027533A (zh) * 2019-12-12 2020-04-17 广东小天才科技有限公司 一种点读坐标的变换方法、***、终端设备及存储介质
CN111125314A (zh) * 2019-12-25 2020-05-08 掌阅科技股份有限公司 书籍查询页面的展示方法、电子设备及计算机存储介质
CN111563153A (zh) * 2020-04-26 2020-08-21 掌阅科技股份有限公司 基于剪切板信息共享实现的推荐方法以及终端
CN111611038A (zh) * 2020-05-09 2020-09-01 掌阅科技股份有限公司 电子书阅读页面中视图对象的***方法及计算设备
CN112015877A (zh) * 2020-09-01 2020-12-01 陈小河 一种常用书籍精细化速查引擎***
CN112825088A (zh) * 2019-11-21 2021-05-21 阿里巴巴集团控股有限公司 信息展示方法、装置、设备及存储介质
CN112948719A (zh) * 2021-03-30 2021-06-11 北京环境特性研究所 一种目标特性文本浏览交互方法和装置
CN114003319A (zh) * 2020-07-28 2022-02-01 华为技术有限公司 一种灭屏显示的方法和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130268826A1 (en) * 2012-04-06 2013-10-10 Google Inc. Synchronizing progress in audio and text versions of electronic books
CN104035993A (zh) * 2014-06-10 2014-09-10 江苏凤凰优阅信息科技有限公司 电子书的存储检索方法、电子书管理***、阅读***
CN105243885A (zh) * 2015-10-26 2016-01-13 广东佳学信息科技有限公司 一种基于智能设备的点读方法、***
CN106021307A (zh) * 2016-05-05 2016-10-12 广州阿里巴巴文学信息技术有限公司 一种针对电子文档进行定位的***、设备、装置及方法
US20180203830A1 (en) * 2012-02-13 2018-07-19 Google Llc Synchronized consumption modes for e-books
CN108304401A (zh) * 2017-01-11 2018-07-20 北大方正集团有限公司 电子图书搜索方法及***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180203830A1 (en) * 2012-02-13 2018-07-19 Google Llc Synchronized consumption modes for e-books
US20130268826A1 (en) * 2012-04-06 2013-10-10 Google Inc. Synchronizing progress in audio and text versions of electronic books
CN104035993A (zh) * 2014-06-10 2014-09-10 江苏凤凰优阅信息科技有限公司 电子书的存储检索方法、电子书管理***、阅读***
CN105243885A (zh) * 2015-10-26 2016-01-13 广东佳学信息科技有限公司 一种基于智能设备的点读方法、***
CN106021307A (zh) * 2016-05-05 2016-10-12 广州阿里巴巴文学信息技术有限公司 一种针对电子文档进行定位的***、设备、装置及方法
CN108304401A (zh) * 2017-01-11 2018-07-20 北大方正集团有限公司 电子图书搜索方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何艳: "基于本体的电子书web信息检索研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110795916A (zh) * 2019-09-27 2020-02-14 北京浪潮数据技术有限公司 一种文档***的侧边栏展示方法及***
CN112825088A (zh) * 2019-11-21 2021-05-21 阿里巴巴集团控股有限公司 信息展示方法、装置、设备及存储介质
CN110909155A (zh) * 2019-11-25 2020-03-24 掌阅科技股份有限公司 书单生成方法、计算设备及计算机存储介质
CN111027533A (zh) * 2019-12-12 2020-04-17 广东小天才科技有限公司 一种点读坐标的变换方法、***、终端设备及存储介质
CN111027533B (zh) * 2019-12-12 2024-02-23 广东小天才科技有限公司 一种点读坐标的变换方法、***、终端设备及存储介质
CN111125314A (zh) * 2019-12-25 2020-05-08 掌阅科技股份有限公司 书籍查询页面的展示方法、电子设备及计算机存储介质
CN111125314B (zh) * 2019-12-25 2020-11-10 掌阅科技股份有限公司 书籍查询页面的展示方法、电子设备及计算机存储介质
CN111563153A (zh) * 2020-04-26 2020-08-21 掌阅科技股份有限公司 基于剪切板信息共享实现的推荐方法以及终端
CN111563153B (zh) * 2020-04-26 2023-07-25 掌阅科技股份有限公司 基于剪切板信息共享实现的推荐方法以及终端
CN111611038B (zh) * 2020-05-09 2023-06-30 掌阅科技股份有限公司 电子书阅读页面中视图对象的***方法及计算设备
CN111611038A (zh) * 2020-05-09 2020-09-01 掌阅科技股份有限公司 电子书阅读页面中视图对象的***方法及计算设备
CN114003319A (zh) * 2020-07-28 2022-02-01 华为技术有限公司 一种灭屏显示的方法和电子设备
WO2022022406A1 (zh) * 2020-07-28 2022-02-03 华为技术有限公司 一种灭屏显示的方法和电子设备
US20230274075A1 (en) * 2020-07-28 2023-08-31 Huawei Technologies Co., Ltd. Always on display method and electronic device
US11934766B2 (en) * 2020-07-28 2024-03-19 Huawei Technologies Co., Ltd. Always on display method and electronic device
CN114003319B (zh) * 2020-07-28 2024-04-23 华为技术有限公司 一种灭屏显示的方法和电子设备
CN112015877A (zh) * 2020-09-01 2020-12-01 陈小河 一种常用书籍精细化速查引擎***
CN112948719A (zh) * 2021-03-30 2021-06-11 北京环境特性研究所 一种目标特性文本浏览交互方法和装置
CN112948719B (zh) * 2021-03-30 2023-12-22 北京环境特性研究所 一种目标特性文本浏览交互方法和装置

Also Published As

Publication number Publication date
CN109189879B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN109189879A (zh) 电子书籍显示方法及装置
US11822600B2 (en) Content tagging
CN111652678B (zh) 物品信息显示方法、装置、终端、服务器及可读存储介质
WO2020253657A1 (zh) 视频片段定位方法、装置、计算机设备及存储介质
CN110852100B (zh) 关键词提取方法、装置、电子设备及介质
US11386625B2 (en) 3D graphic interaction based on scan
CN110020140A (zh) 推荐内容显示方法、装置及***
CN110059685A (zh) 文字区域检测方法、装置及存储介质
CN112269853B (zh) 检索处理方法、装置及存储介质
CN109918669A (zh) 实体确定方法、装置及存储介质
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
US11620829B2 (en) Visual matching with a messaging application
US11341728B2 (en) Online transaction based on currency scan
CN111930964B (zh) 内容处理方法、装置、设备及存储介质
CN111897996A (zh) 话题标签推荐方法、装置、设备及存储介质
CN108304506A (zh) 检索方法、装置及设备
CN111611490A (zh) 资源搜索方法、装置、设备及存储介质
CN111428522B (zh) 翻译语料生成方法、装置、计算机设备及存储介质
CN110555102A (zh) 媒体标题识别方法、装置及存储介质
CN110290426A (zh) 展示资源的方法、装置、设备及存储介质
CN114511864B (zh) 文本信息提取方法、目标模型的获取方法、装置及设备
CN108416026A (zh) 索引生成方法、内容搜索方法、装置及设备
CN116580707A (zh) 基于语音生成动作视频的方法和装置
CN113486260B (zh) 互动信息的生成方法、装置、计算机设备及存储介质
CN111597823B (zh) 中心词提取方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20190108

Address after: Room 1601-1608, Floor 16, Yinke Building, 38 Haidian Street, Haidian District, Beijing

Applicant after: Tencent Technology (Beijing) Co., Ltd

Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant