CN108304401A - 电子图书搜索方法及*** - Google Patents

电子图书搜索方法及*** Download PDF

Info

Publication number
CN108304401A
CN108304401A CN201710021327.0A CN201710021327A CN108304401A CN 108304401 A CN108304401 A CN 108304401A CN 201710021327 A CN201710021327 A CN 201710021327A CN 108304401 A CN108304401 A CN 108304401A
Authority
CN
China
Prior art keywords
book
characteristic information
picture
search
search condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710021327.0A
Other languages
English (en)
Inventor
朱强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201710021327.0A priority Critical patent/CN108304401A/zh
Publication of CN108304401A publication Critical patent/CN108304401A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种电子图书搜索方法及***,涉及计算机应用技术。电子图书搜索方法包括:接收终端上传的、含有电子图书的部分内容的图片;对图片进行解析,并根据解析结果确定搜索条件;根据搜索条件进行搜索。电子图书搜索***包括:接收单元,用于接收终端上传的、含有电子图书的部分内容的图片;解析单元,用于对图片进行解析,并根据解析结果确定搜索条件;搜索单元,用于根据搜索条件进行搜索。通过接收终端上传的、含有电子图书的部分内容的图片,对图片进行解析,根据解析结果确定搜索条件,从而自动根据确定的搜索条件进行搜索,减少了用户手动输入关键字的操作,克服了现有技术中当关键字较多或者较复杂时,用户操作起来十分繁琐的问题。

Description

电子图书搜索方法及***
技术领域
本发明涉及计算机应用技术,尤其涉及一种电子图书搜索方法及***。
背景技术
传统的图书是用文字或者其它信息符号记录在一定材料上的著作物,是一种知识传播工具。电子图书作为一种新形式的书籍,不再依赖于纸张,而是将文字或者其它信息符号存储在磁性存储介质中,大大减少了木材的消耗和空间的占用。
用于存储电子图书的数据库或者资源库中,通常存储有大量的电子图书。目前,对电子图书的搜索方式通常是由用户手动输入关键字,根据关键字在数据库或者资源库中进行搜索,并将搜索出来的电子图书进行显示,由用户进行进一步筛选直至查找到自己需要的电子图书。当关键字较多或者较复杂时,用户手动输入关键字,操作起来十分繁琐。
发明内容
针对现有技术中的上述缺陷,本发明提供一种电子图书搜索方法及***,能够简化用户操作。
本发明的第一个方面是提供一种电子图书搜索方法,包括:
接收终端上传的图片;所述图片含有电子图书的部分内容;
对所述图片进行解析,并根据解析结果确定搜索条件;
根据所述搜索条件进行搜索。
进一步地,所述对所述图片进行解析,并根据解析结果确定搜索条件,包括:
提取所述图片的特征信息;
对所述特征信息进行处理;
将处理后的特征信息与预存的关键信息进行匹配;
若处理后的特征信息与所述关键信息匹配,则将与处理后的特征信息匹配的关键信息确定为搜索条件。
进一步地,在所述将处理后的特征信息与预存的关键信息进行匹配之后,包括:
若处理后的特征信息与所述关键信息匹配,则获取匹配的所述关键词的出现频率;
将出现频率大于第一阈值的关键词确定为搜索条件。
进一步地,在所述对所述特征信息进行处理之后,还包括:将处理后的特征信息进行存储。
进一步地,在所述根据所述搜索条件进行搜索之后,包括:
将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
本发明的另一个方面是提供一种电子图书搜索***,包括:
接收单元,用于接收终端上传的图片,其中,所述图片含有电子图书的部分内容;
解析单元,用于对所述图片进行解析,并根据解析结果确定搜索条件;
搜索单元,用于根据所述搜索条件进行搜索。
进一步地,所述解析单元包括:
提取模块,用于提取所述图片的特征信息;
处理模块,用于对所述特征信息进行处理;
匹配模块,用于将处理后的特征信息与预存的关键信息进行匹配;
确定模块,用于将与处理后的特征信息匹配的关键信息确定为搜索条件。
进一步地,所述解析单元还包括:
筛选模块,用于获取与处理后的特征信息匹配的关键词的出现频率,将出现频率大于第一阈值的关键词确定为搜索条件。
进一步地,所述电子图书搜索***还包括:存储单元,用于将处理后的特征信息进行存储。
进一步地,所述电子图书搜索***还包括:发送单元,用于将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
本发明提供的电子图书搜索方法及***,通过接收终端上传的、含有电子图书的部分内容的图片,对图片进行解析,根据解析结果确定搜索条件,从而自动根据确定的搜索条件进行搜索,减少了用户手动输入关键字的操作,克服了现有技术中当关键字较多或者较复杂时,用户手动输入关键字,操作起来十分繁琐的问题。
附图说明
图1为本发明电子图书搜索方法一实施例的流程示意图;
图2为本发明电子图书搜索方法另一实施例的流程示意图;
图3为本发明电子图书搜索***一实施例的结构示意图;
图4为本发明电子图书搜索***另一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
需要说明的是,在本发明的描述中,术语“第一”、“第二”仅用于方便描述不同的部件,而不能理解为指示或暗示顺序关系、相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
图1为本发明电子图书搜索方法一实施例的流程示意图。
请参照图1,本实施例提供一种电子图书搜索方法,包括:
S101、接收终端上传的图片,所述图片含有电子图书的部分内容;
具体地,图片可以为用户通过终端拍摄或者截取屏幕所得,也可以为从其它终端接收的,只要图片中含有电子图书的部分内容即可。较佳地,图片中可以包含电子图书的封面、文本等内容。
本实施例中,与该电子图书搜索方法对应的电子图书搜索***可以为后台服务器;终端上可以安装有与后台服务器通信的应用软件,用户打开终端上的应用软件之后,即可向后台服务器发送图片;或者,用户可以通过终端打开相应的网站,通过网站向后台服务器发送图片。
在接收终端上传的图片之前,还可以接收用户的注册请求,以为用户建立账号,用户再次使用时,可以根据该账号以及相应的密码登录相应的应用软件或者网站。此外,还可以根据该账号建立书架,以存储用户搜索过的、浏览过或者收藏过的电子图书。
S102、对所述图片进行解析,并根据解析结果确定搜索条件;
具体地,对接收到的图片进行解析,以获取图片中包含的信息,例如文本文字,图书名称、作者名称以及出版社等,可以将解析出来的一个信息或者多个信息确定为搜索条件。
S103、根据所述搜索条件进行搜索。
具体地,确定搜索条件之后,自动根据确定的搜索条件在电子图书资源库中进行搜索。
本实施例提供的电子图书搜索方法,通过接收终端上传的、含有电子图书的部分内容的图片,对图片进行解析,根据解析结果确定搜索条件,从而自动根据确定的搜索条件进行搜索,减少了用户手动输入关键字的操作,克服了现有技术中当关键字较多或者较复杂时,用户手动输入关键字,操作起来十分繁琐的问题。
图2为本发明电子图书搜索方法另一实施例的流程示意图。
请参照图2,进一步地,所述的电子图书搜索方法,包括:
S201、接收终端上传的图片,所述图片含有电子图书的部分内容;该步骤与前述步骤S101相同,此处不再赘述。
S202、提取所述图片的特征信息;
本实施例中,较佳地,提取图片中的文字特征信息和数字特征信息等。
S203、对所述特征信息进行处理;
图片中的特征信息,例如文字信息除文字本身之外,还有加粗、倾斜、下划、字体、字号等特征,本实施例对提取的特征信息进行处理,以得到可识别的信息,例如得到统一的文字形式。较佳地,可以对提取的特征信息进行编码,从而得到与该特征信息对应的编码值,编码值可以用于与关键信息数据库中预先存储的字体等进行匹配。
较佳地,在所述对所述特征信息进行处理之后,还可以包括:将处理后的特征信息进行存储,以丰富关键信息数据库中的关键信息,有助于提高搜索效率及准确性。
S204、将处理后的特征信息与预存的关键信息进行匹配;
本实施例中,关键信息数据库中可以预先存储有关键信息及与关键信息相对应的编码值,将图片的特征信息的编码值与关键信息数据库中关键信息的编码值进行匹配。
或者,关键信息数据库中,预先存储关键信息,并将关键信息与编码值建立关联关系,此时,将处理后的特征信息与预存的关键信息进行匹配即为根据编码值与关联关系查找相匹配的关键信息。
其中,关键信息可以包括:关键词、logo(商标)、文本以及封面等。可以理解的是:关键词可以为词语,logo可以指logo中包含的文字、数字等,文本可以为一个或者多个句子,封面可以指封面中的文字、数字等。
S205、若处理后的特征信息与所述关键信息匹配,则将与处理后的特征信息匹配的关键信息确定为搜索条件;
本实施例中,若图片的特征信息的编码值与关键信息数据库中关键信息的编码值相匹配,则将该关键信息确定为搜索条件。或者根据编码值以及对应关系能够在关键信息数据中查找到相应的关键信息,则将该关键信息确定为搜索条件。通过对包含电子图书的部分内容的图片进行解析,以确定搜索条件,还能够有效避免现有技术中用于手动输入错误以及用户确定的关键字错误等问题,有助于提高搜索效率。
由于图片中可以包含较多的特征信息,根据图片的特征信息可以匹配出较多的搜索条件,可以自动将匹配出的关键信息都作为搜索条件。
较佳地,为了提高搜索速度,在所述将处理后的特征信息与预存的关键信息进行匹配之后,包括:若处理后的特征信息与所述关键信息匹配,则获取匹配的所述关键词的出现频率;将出现频率大于第一阈值的关键词确定为搜索条件。
其中,出现频率可以为关键词与特征信息匹配的频率,也可以为关键词作为搜索条件的频率。第一阈值,可以由本领域技术人员进行设置,例如50%等;较佳地,第一阈值可以由用户自主设置。
S206、根据所述搜索条件进行搜索;该步骤与前述步骤S103相同,此处不再赘述。
S207、将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
本实施例中,可以将搜索结果与列表的形式发送给终端,通过终端向用户展示搜索结果,以供用户进行进一步筛选。用户筛选出目标电子图书之后,还可以通过终端发送下载请求、借阅请求、购书请求等请求。
上述各实施例中,电子图书资源库和关键信息数据可以为相同的数据库,也可以为不同的数据库。
本实施例还提供一种电子图书搜索***,用于执行前述电子图书搜索方法中的相应步骤,其各单元、模块的实现过程以及功能可以与前述实施例相同,此处不再赘述。
图3为本发明电子图书搜索***一实施例的结构示意图。
请参照图3,电子图书搜索***,可以包括:
接收单元100,用于接收终端上传的图片,其中,所述图片含有电子图书的部分内容;
解析单元200,用于对所述图片进行解析,并根据解析结果确定搜索条件;
搜索单元300,用于根据所述搜索条件进行搜索。
此外,电子图书搜索***还包括关键信息数据库以及电子图书资源库,关键信息数据库用于存储关键信息,电子图书资源库用于存储电子图书,关键信息数据库与电子图书资源库可以为相同的数据库,也可以为不同的数据库。
本实施例提供的电子图书搜索***,通过接收终端上传的、含有电子图书的部分内容的图片,对图片进行解析,根据解析结果确定搜索条件,从而自动根据确定的搜索条件进行搜索,减少了用户手动输入关键字的操作,克服了现有技术中当关键字较多或者较复杂时,用户手动输入关键字,操作起来十分繁琐的问题。
图4为本发明电子图书搜索***另一实施例的结构示意图。
请参照图4,进一步地,所述解析单元200包括:
提取模块201,用于提取所述图片的特征信息;
处理模块202,用于对所述特征信息进行处理;
匹配模块203,用于将处理后的特征信息与预存的关键信息进行匹配;
确定模块204,用于将与处理后的特征信息匹配的关键信息确定为搜索条件。
进一步地,所述解析单元200还包括:
筛选模块,用于获取与处理后的特征信息匹配的关键词的出现频率,将出现频率大于第一阈值的关键词确定为搜索条件。
所述电子图书搜索***还可以包括:存储单元,用于将处理后的特征信息进行存储。
所述电子图书搜索***,还可以包括:发送单元400,用于将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种电子图书搜索方法,其特征在于,包括:
接收终端上传的图片;所述图片含有电子图书的部分内容;
对所述图片进行解析,并根据解析结果确定搜索条件;
根据所述搜索条件进行搜索。
2.根据权利要求1所述的电子图书搜索方法,其特征在于,所述对所述图片进行解析,并根据解析结果确定搜索条件,包括:
提取所述图片的特征信息;
对所述特征信息进行处理;
将处理后的特征信息与预存的关键信息进行匹配;
若处理后的特征信息与所述关键信息匹配,则将与处理后的特征信息匹配的关键信息确定为搜索条件。
3.根据权利要求2所述的电子图书搜索方法,其特征在于,在所述将处理后的特征信息与预存的关键信息进行匹配之后,包括:
若处理后的特征信息与所述关键信息匹配,则获取匹配的所述关键词的出现频率;
将出现频率大于第一阈值的关键词确定为搜索条件。
4.根据权利要求2所述的电子图书搜索方法,其特征在于,在所述对所述特征信息进行处理之后,还包括:将处理后的特征信息进行存储。
5.根据权利要求1-4任一项所述的电子图书搜索方法,其特征在于,在所述根据所述搜索条件进行搜索之后,包括:
将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
6.一种电子图书搜索***,其特征在于,包括:
接收单元,用于接收终端上传的图片,其中,所述图片含有电子图书的部分内容;
解析单元,用于对所述图片进行解析,并根据解析结果确定搜索条件;
搜索单元,用于根据所述搜索条件进行搜索。
7.根据权利要求6所述的电子图书搜索***,其特征在于,所述解析单元包括:
提取模块,用于提取所述图片的特征信息;
处理模块,用于对所述特征信息进行处理;
匹配模块,用于将处理后的特征信息与预存的关键信息进行匹配;
确定模块,用于将与处理后的特征信息匹配的关键信息确定为搜索条件。
8.根据权利要求7所述的电子图书搜索***,其特征在于,所述解析单元还包括:
筛选模块,用于获取与处理后的特征信息匹配的关键词的出现频率,将出现频率大于第一阈值的关键词确定为搜索条件。
9.根据权利要求7所述的电子图书搜索***,其特征在于,还包括:存储单元,用于将处理后的特征信息进行存储。
10.根据权利要求6-9任一项所述的电子图书搜索***,其特征在于,还包括:
发送单元,用于将搜索结果发送给所述终端,以通过终端向用户显示搜索结果。
CN201710021327.0A 2017-01-11 2017-01-11 电子图书搜索方法及*** Pending CN108304401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710021327.0A CN108304401A (zh) 2017-01-11 2017-01-11 电子图书搜索方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710021327.0A CN108304401A (zh) 2017-01-11 2017-01-11 电子图书搜索方法及***

Publications (1)

Publication Number Publication Date
CN108304401A true CN108304401A (zh) 2018-07-20

Family

ID=62872262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710021327.0A Pending CN108304401A (zh) 2017-01-11 2017-01-11 电子图书搜索方法及***

Country Status (1)

Country Link
CN (1) CN108304401A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189879A (zh) * 2018-09-14 2019-01-11 腾讯科技(深圳)有限公司 电子书籍显示方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090248633A1 (en) * 2008-03-31 2009-10-01 Erik Ojakaar System and method for direct display of coupons within search result sets
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置
CN103336836A (zh) * 2013-07-12 2013-10-02 贝壳网际(北京)安全技术有限公司 一种页面搜索方法和页面搜索装置
CN106156262A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种搜索信息处理方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090248633A1 (en) * 2008-03-31 2009-10-01 Erik Ojakaar System and method for direct display of coupons within search result sets
CN102567418A (zh) * 2010-12-23 2012-07-11 北大方正集团有限公司 一种数据整合、搜索的方法及装置
CN103336836A (zh) * 2013-07-12 2013-10-02 贝壳网际(北京)安全技术有限公司 一种页面搜索方法和页面搜索装置
CN106156262A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种搜索信息处理方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189879A (zh) * 2018-09-14 2019-01-11 腾讯科技(深圳)有限公司 电子书籍显示方法及装置

Similar Documents

Publication Publication Date Title
CN110083805B (zh) 一种将Word文件转换为EPUB文件的方法及***
CN101416179B (zh) 用来向每个用户提供调整推荐字的***和方法
CN101930524B (zh) 文档信息创建装置、文档登记***和文档信息创建方法
US20080028333A1 (en) Method and system for portable data aggregation
CN110866091A (zh) 一种数据检索方法及装置
CN108900554B (zh) Http协议资产检测方法、***、设备及计算机介质
CN105843800A (zh) 一种基于doi的语言信息展示方法及装置
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
JP2007058380A (ja) 電子文書マスキングシステム
CN101008940A (zh) 自动处理字体缺失的方法与装置
CN109933803A (zh) 一种成语信息展示方法、展示装置、电子设备及存储介质
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
US9298694B2 (en) Generating a regular expression for entity extraction
KR20220168062A (ko) 인공지능을 활용한 기사 작성 솔루션 및 장치
US9317499B2 (en) Optimizing generation of a regular expression
CN108304401A (zh) 电子图书搜索方法及***
CN104182479A (zh) 一种处理信息的方法及装置
CN105740374A (zh) 基于分布式内存的三维平台数据模糊查询方法
CN111401047A (zh) 法律文书的争议焦点生成方法、装置及计算机设备
US20200065332A1 (en) Method and System for Retrieving Data from Different Sources that Relates to a Single Entity
CN111401005A (zh) 文本转换方法、装置及可读存储介质
CN112379891B (zh) 一种数据处理方法和装置
CN113627129B (zh) 一种文字复制方法、装置、电子设备及可读存储介质
CN103019665A (zh) 一种单据打开方法及装置
Gavrilă et al. A New Challenge in the Data Processing of Non-Standard Texts Containing Accents/Diacritics: A Case Study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180720

RJ01 Rejection of invention patent application after publication