CN109657095A - 一种智能听书方法及智能听书设备 - Google Patents

一种智能听书方法及智能听书设备 Download PDF

Info

Publication number
CN109657095A
CN109657095A CN201811555361.7A CN201811555361A CN109657095A CN 109657095 A CN109657095 A CN 109657095A CN 201811555361 A CN201811555361 A CN 201811555361A CN 109657095 A CN109657095 A CN 109657095A
Authority
CN
China
Prior art keywords
books
information
storytelling
intelligence
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811555361.7A
Other languages
English (en)
Inventor
陈子恬
陈新准
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Green Birch Environmental Protection Technology Co Ltd
Original Assignee
Guangzhou Green Birch Environmental Protection Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Green Birch Environmental Protection Technology Co Ltd filed Critical Guangzhou Green Birch Environmental Protection Technology Co Ltd
Priority to CN201811555361.7A priority Critical patent/CN109657095A/zh
Publication of CN109657095A publication Critical patent/CN109657095A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/02Electrically-operated educational appliances with visual presentation of the material to be studied, e.g. using film strip

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Toys (AREA)

Abstract

本发明提供一种智能听书方法及智能听书设备,本发明提供的智能听书方法,包括如下步骤:a)获取书本影像;b)根据所述书本影像的特定信息识别书本信息;c)匹配与识别得到的书本信息相关的音频和/或视频;d)播放所述音频和/或视频。本发明提供的智能听书方法及智能听书设备能够根据纸质书籍封面快速播放与其相关音频信息。

Description

一种智能听书方法及智能听书设备
技术领域
本发明听书设备领域,具体涉及一种智能听书控制方法,智能听书设备及***。
背景技术
随着科技进步和电子设备的兴起,对于书本知识的吸取方式越来越多样化,例如电子书和听书等。但是即使电子书的兴起仍然不能取代庞大的纸质书本市场,大多数书本还是以纸质书本作为主要的销售量。并且即使电子书阅读起来更加方便快捷,其阅读的体验依然没有纸质书本的阅读感觉要好,所以纸质书本依然是大多数人吸取知识的渠道,是生活中不可缺少的一部分。
现有的电子设备的听书都是以电子设备为载体,书本的内容以及音频信息都在电子设备中,用户输入书本信息去查找相关的音频信息。对于一些拿到纸质书本,又想听其中音频信息的用户并不那么方便智能。因此,需要提供一种设备能够根据用户拿到的纸质书本快速播放与其相关的音频信息的设备。这对于公共场合如书店等对纸质书本的推销具有较大的推进作用。
发明内容
针对现有技术的不足,本发明提供一种能够根据纸质书籍封面快速播放与其相关音频信息的智能听书方法及智能听书设备。
本发明提供一种智能听书方法,包括如下步骤:
a)获取书本影像;
b)根据所述书本影像的特定信息识别书本信息;
c)匹配与识别得到的书本信息相关的音频和/或视频;
d)播放所述音频和/或视频。
优选地,所述书本影像的特定信息包括书名、作者、出版商的一个或多个。
优选地,过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息相匹配的音频和/或视频发送至所述设备终端。
优选地,通过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息发送至所述设备终端,设备终端匹配与书本信息相关的音频和/或视频并进行播放。
优选地,通过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息发送至所述设备终端,设备终端本地匹配与书本信息相关的音频和/或视频,
当匹配值大于或等于预设值时,播放匹配的音频和/或视频;
当匹配值小于预设值时,远端服务器将识别得到的书本信息在线匹配相关的音频和/或视频,并将相匹配的音频和/或视频发送至所述设备终端
本发明还提供一种智能听书设备,包括:
影像单元,用于获取书本影像;
识别单元或通讯单元,所述识别单元用于根据所述书本影像的特定信息识别书本信息;所述通讯单元用于将所述书本影像传送至远端服务器进行识别以得到书本信息,以及获取远端服务器识别得到的书本信息。
播放单元,用于播放与识别的书本信息相匹配的音频和/或视频。
优选地,所述通讯单元还用于从所述远端服务器获得与识别得到的书本信息相匹配的音频和/或视频
优选地,还包括用于放置书本放置平台,所述放置平台设置于所述影像单元的下方。
优选地,还包括存储单元,所述存储单元用于存储与书本相关联的音频和/或视频。
优选地,所述远端服务器包括EasyDL平台。
本发明提供的智能听书方法及智能听书设备能够根据纸质书籍封面快速播放与其相关音频信息。
附图说明
通过附图中所示的本发明优选实施例更具体说明,本发明上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分,且并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本的主旨。
图1为本发明实施例提供的智能听书***的流程示意图。
图2为本发明实施例提供的智能听书设备的控制方法流程图。
具体实施方式
下面结合具体实施例对本发明技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参考图1-2,本发明实施例本发明提供一种智能听书方法,包括如下步骤:
101、获取书本影像;通过拍照等方式获取书本影像,书本影像可以是外封、内封、书脊、封底或者扉页的照片。
102、根据书本影像的特定信息识别书本信息;例如根据书本影像中包含的出书本名称信息、出版社信息、作者信息和版本信息,判断是哪一本书,得到书本信息。
103、匹配与识别得到的书本信息相关的音频和/或视频;在数据库中匹配与书本信息相关的音频和/或视频,本实施例中所指的数据库可以是是存储单元15也可以是在线数据库22。
104、播放音频和/或视频。
本发明实施例提供的智能听书控制方法能够根据书本影像快速识别出书本信息,并且播放与书本信息匹配的音频/或视频。例如在书店等场所,常常会有一些需要出售的纸质书本陈列,用户可能拿到纸质书本后比较喜欢其的封面以及书本的质感,想要进一步了解书本内容却又没有时间翻阅的时候,可以采用本实施例的智能听书控制方法快速播放相关的音频信息。使得用户能够不翻阅书本便可了解与书本相关的内容。
在优选实施例中,书本影像的特定信息包括书名、作者、出版商的一个或多个。
在优选实施例中,通过设备终端获取书本影像,设备终端上设有用于拍照的摄像头。拍摄得到书本影像后,设备终端的控制中心将书本影像传输至远端服务器2进行识别,本实施例中的远端服务器2采用EasyDL平台21进行识别。EasyDL平台21在对书本影像识别之前先进行识别训练。具体训练方法为:
采集本书本的封面图片,每本书采集20-100张不同角度和光照下的封面图片,上传到EasyDL平台21做图像分类训练。
训练完成模型,对模型进行测试,调整数据和模型。
对模型进行反复的训练和测试达到一定的准确率,然后将设备终端接入训练完成的API接口。
本实施例中,匹配相关音频和/或视频的步骤可由设备终端执行或是远端服务器2执行,设备终端设有存储单元15,用于储存相关储音频和/或视频。远端服务器2识别得到的书本信息发送回设备终端,然后设备终端将书本信息与存储单元15中预存的相关的音频和/或视频进行匹配。匹配到合适的音频和/或视频则设备终端直接播放。
或者,可以不设置存储单元15,远端服务器2中还设有在线数据库22,识别平台将识别得到的书本信息与在线数据库22中的音频和/或视频进行匹配,匹配的音频和/或视频再发送至设备终端进行播放。
或者,远端服务器2识别得到书本信息后,先反馈回设备终端,设备终端将书本信息与存储单元15中预存的音频和/或视频进行匹配,当匹配值大于预设值时,则直接播放;当匹配值小于预设值时,向远端服务器2发送匹配指示,则远端服务器2在线匹配与书本信息相关的音频和/或视频,然后将匹配的音频和/或视频发送回设备终端进行播放。
本实施例中设备终端播放后的音频和/或视频将会存储到本地数据中,直接在存储单元15中匹配音频和/或视频,能够实现更加快速的播放。同时,设备终端上还设置有用于外部的将音频和/或视频储存于存储单元15中的USB接口。本实施例的智能听书设备1可用于放置在机场、高铁站等公共场所。因为这些场所的一些书籍可能针对性较强,或者没有广泛的公开,可能在线数据很难搜索到较为相关的音频信息,此时需要用户先通过USB接口将音频信息预存到存储单元15中。实现更加精准快速的匹配和播放。
另一方面,由于存储单元15的数据有限,不能提供更大数据的匹配,因此,当存储单元15中无法实现较好的匹配时,由在线数据库22进行匹配。能够使得书本信息的匹配更加全面。
本发明还提供一种智能听书设备1,包括:
影像单元11,用于获取书本影像;如摄像装置等可获取影像的摄像设备,摄像设备的摄像头朝向台面,用于拍摄书本封面的书本影像。例如8百万像素摄像头。
识别单元和/或通讯单元13。识别单元用于根据书本影像的特定信息识别书本信息;通讯单元13用于将所述书本影像传送至远端服务器2进行识别以得到书本信息,以及获取远端服务器2识别得到的书本信息。本实施例的智能听书设备1可以通过识别单元进行识别也可以通过远端服务器2进行识别。或者是当识别单元识别的准确率小于预设值时,再有远端服务器2进行二次识别,保证识别更加准确。
播放单元14,用于播放与识别的书本信息相匹配的音频和/或视频。播放单元14可以是音响、扬声器、耳机或者显示屏播放。
处理器12,用于向各个单元发送指令,指示各个单元的工作。
在优选实施例中,还包括用于放置书本放置平台,放置平台设置于影像单元11的下方。用户将书本放置在放置平台上,影像单便可获取书本影像。
在优选实施例中,还包括存储单元15,存储单元15用于存储与书本相关联的音频和/或视频。智能听书设备1播放过后的音频和/或视频均可以存储于存储单元15中,便于下一次能够快速播放该音频信息。同时,本实施例的智能听书设备1可用于放置在机场、高铁站等公共场所。因为这些场所的一些书籍可能针对性较强,或者没有广泛的公开,可能在线数据很难搜索到较为相关的音频信息,此时需要用户先将与书本相关联的音频和/或视频预存到存储单元15中。实现更加精准快速的匹配和播放。
在优选实施例中,通讯单元13还用于从所述远端服务器2获得与识别得到的书本信息相匹配的音频和/或视频。为书本信息提供更多的匹配数据,实现智能听书设备1可用于多种不同的领域。
在优选实施例中,通讯单元13接收远端服务器2识别得到的书本信息,然后将书本信息与存储单元15中预存的音频和/或视频进行匹配,当匹配值大于或等于预设值时,则直接播放。当匹配值小于预设值时,则远端服务器2在线进行匹配,通讯单元13接受远端服务器2匹配得到的音频和/或视频。
在优选实施例中,远端服务器2包括EasyDL平台21。EasyDL平台21在对书本影像识别之前先进行识别训练。具体训练方法为:
采集本书本的封面图片,每本书采集20-100张不同角度和光照下的封面图片,上传到EasyDL平台21做图像分类训练。
训练完成模型,对模型进行测试,调整数据和模型。
对模型进行反复的训练和测试达到一定的准确率,然后将设备终端接入训练完成的API接口。
在优选实施例中,播放单元14还包括显示屏,显示屏为触摸屏,可用于控制音频和/或视频的播放/暂停,和音量大小等。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种智能听书方法,其特征在于,包括如下步骤:
a)获取书本影像;
b)根据所述书本影像的特定信息识别书本信息;
c)匹配与识别得到的书本信息相关的音频和/或视频;
d)播放所述音频和/或视频。
2.如权利要求1所述的智能听书方法,其特征在于,所述书本影像的特定信息包括书名、作者、出版商的一个或多个。
3.如权利要求1所述的智能听书方法,其特征在于,通过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息相匹配的音频和/或视频发送至所述设备终端。
4.如权利要求1所述的智能听书方法,其特征在于,通过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息发送至所述设备终端,设备终端匹配与书本信息相关的音频和/或视频并进行播放。
5.如权利要求1所述的智能听书方法,其特征在于,通过设备终端获取书本影像,所述设备终端将所述书本影像传输至远端服务器,所述远端服务器根据所述书本影像的特定信息识别书本信息,并将与识别得到的书本信息发送至所述设备终端,设备终端本地匹配与书本信息相关的音频和/或视频,
当匹配值大于或等于预设值时,播放匹配的音频和/或视频;
当匹配值小于预设值时,远端服务器将识别得到的书本信息在线匹配相关的音频和/或视频,并将相匹配的音频和/或视频发送至所述设备终端。
6.一种智能听书设备,其特征在于,包括:
影像单元,用于获取书本影像;
识别单元和/或通讯单元,所述识别单元用于根据所述书本影像的特定信息识别书本信息;所述通讯单元用于将所述书本影像传送至远端服务器进行识别以得到书本信息,以及获取远端服务器识别得到的书本信息。
播放单元,用于播放与识别的书本信息相匹配的音频和/或视频。
7.如权利要求6所述的智能听书设备,其特征在于,所述通讯单元还用于从所述远端服务器获得与识别得到的书本信息相匹配的音频和/或视频。
8.如权利要求6所述的智能听书设备,其特征在于,还包括用于放置书本放置平台,所述放置平台设置于所述影像单元的下方。
9.如权利要求6所述的智能听书设备,其特征在于,还包括存储单元,所述存储单元用于存储与书本相关联的音频和/或视频。
10.如权利要求6所述的智能听书设备,其特征在于,所述远端服务器包括EasyDL平台。
CN201811555361.7A 2018-12-19 2018-12-19 一种智能听书方法及智能听书设备 Pending CN109657095A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811555361.7A CN109657095A (zh) 2018-12-19 2018-12-19 一种智能听书方法及智能听书设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811555361.7A CN109657095A (zh) 2018-12-19 2018-12-19 一种智能听书方法及智能听书设备

Publications (1)

Publication Number Publication Date
CN109657095A true CN109657095A (zh) 2019-04-19

Family

ID=66115726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811555361.7A Pending CN109657095A (zh) 2018-12-19 2018-12-19 一种智能听书方法及智能听书设备

Country Status (1)

Country Link
CN (1) CN109657095A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727629A (zh) * 2019-10-10 2020-01-24 掌阅科技股份有限公司 有声电子书的播放方法、电子设备及计算机存储介质
CN111358145A (zh) * 2020-02-28 2020-07-03 苏州承儒信息科技有限公司 一种用于行走教育的智能书包及其工作方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101063919A (zh) * 2006-04-25 2007-10-31 杭州草莓资讯有限公司 以三点定位为基础的点读机
KR101355414B1 (ko) * 2006-01-26 2014-01-24 소니 주식회사 오디오 신호 처리 장치, 오디오 신호 처리 방법 및 오디오신호 처리 프로그램
CN106294657A (zh) * 2016-08-04 2017-01-04 深圳市奇米教育科技有限公司 基于绘本页面的图书识别方法及装置
CN107393356A (zh) * 2017-04-07 2017-11-24 深圳市友悦机器人科技有限公司 控制方法、控制装置和早教机

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101355414B1 (ko) * 2006-01-26 2014-01-24 소니 주식회사 오디오 신호 처리 장치, 오디오 신호 처리 방법 및 오디오신호 처리 프로그램
CN101063919A (zh) * 2006-04-25 2007-10-31 杭州草莓资讯有限公司 以三点定位为基础的点读机
CN106294657A (zh) * 2016-08-04 2017-01-04 深圳市奇米教育科技有限公司 基于绘本页面的图书识别方法及装置
CN107393356A (zh) * 2017-04-07 2017-11-24 深圳市友悦机器人科技有限公司 控制方法、控制装置和早教机

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727629A (zh) * 2019-10-10 2020-01-24 掌阅科技股份有限公司 有声电子书的播放方法、电子设备及计算机存储介质
CN110727629B (zh) * 2019-10-10 2024-01-23 掌阅科技股份有限公司 有声电子书的播放方法、电子设备及计算机存储介质
CN111358145A (zh) * 2020-02-28 2020-07-03 苏州承儒信息科技有限公司 一种用于行走教育的智能书包及其工作方法

Similar Documents

Publication Publication Date Title
CN110139062B (zh) 一种视频会议记录的创建方法、装置及终端设备
CN108337532A (zh) 演出片段的标注方法、视频播放方法、装置及***
JP6060155B2 (ja) 受信データの比較を実行しその比較に基づいて後続サービスを提供する方法及びシステム
US10333876B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US20210011594A1 (en) Content service method
CN104205209B (zh) 回放控制设备、回放控制方法
US10560410B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
TW520604B (en) Systems and methods for providing promotions with recorded programs
US7733214B2 (en) System and methods for the remote measurement of a person's biometric data in a controlled state by way of synchronized music, video and lyrics
US10200323B2 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
US20050147256A1 (en) Automated presentation of entertainment content in response to received ambient audio
CN112653902B (zh) 说话人识别方法、装置及电子设备
CN107924416A (zh) 在其他媒体内容中引用的媒体内容的提醒
US20200137011A1 (en) Method and system for communicating between a sender and a recipient via a personalized message including an audio clip extracted from a pre-existing recording
CN109286821A (zh) 一种直播间推荐方法、装置、服务器及存储介质
CN103338345A (zh) 演唱时拍摄图像或视频的方法与装置
CN110446104A (zh) 视频处理方法、装置及存储介质
CN109657095A (zh) 一种智能听书方法及智能听书设备
CN105243093A (zh) 一种演唱者推荐方法及装置
CN110324653A (zh) 游戏互动交互方法及***、电子设备及具有存储功能的装置
CN107205095A (zh) 语音信息的播放方法、装置及终端
US20140082467A1 (en) Method for content coordination, and system, apparatus and terminal supporting the same
CN109688430A (zh) 一种法院庭审文件回放方法、***及存储介质
CN110248207A (zh) 图像现实感展示服务器、展示方法和记录介质及展示***
KR101211641B1 (ko) 이미지코드를 이용한 문제해설 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190419