CN104537901A - 基于音视频的英语口语学习机 - Google Patents

基于音视频的英语口语学习机 Download PDF

Info

Publication number
CN104537901A
CN104537901A CN201410720093.5A CN201410720093A CN104537901A CN 104537901 A CN104537901 A CN 104537901A CN 201410720093 A CN201410720093 A CN 201410720093A CN 104537901 A CN104537901 A CN 104537901A
Authority
CN
China
Prior art keywords
processing unit
file
audio
central processing
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410720093.5A
Other languages
English (en)
Inventor
孙娜
李锋华
曲巍巍
项睿
顾艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bohai University
Original Assignee
Bohai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bohai University filed Critical Bohai University
Priority to CN201410720093.5A priority Critical patent/CN104537901A/zh
Publication of CN104537901A publication Critical patent/CN104537901A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/065Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种基于音视频的英语口语学习机,包括中央处理器,以及与中央处理器连接的数据库、触摸屏、扬声器,以及体感摄像头和音频采集单元,所述体感摄像头还通过视频处理单元与中央处理器连接,音频采集单元还通过音频处理单元与中央处理器连接;使用本学习机,用户可以很方便并且有效地进行英语口语学习,矫正口型和发音。

Description

基于音视频的英语口语学习机
技术领域
本发明涉及一种学习机,具体是一种基于音视频的英语口语学习机。
背景技术
英语学习己经成为很多国家的教育的基础部分。根据以英语作为母语的人数计算,英语可能是世界上第三大语言,但它是世界上最广泛的第二语言。世界上60%以上的信件是用英语书写的,上两个世纪英国和美国在文化、经济、军事、政治和科学上的领先地位使得英语成为一种准国际语言。
英语学习中其实对学习者困扰最大的就是听力、单词记忆、写作、口语四个专项。这四个专项紧密联系,缺一不可。具体地说,例如,听力不好,口语就很差,英语语感就好不到哪去,单词也就很难记住。
目前市场上的英语学习工具包括复读机等,但是,对于复读机等英语学习工具,由于学习者仅仅能够根据原始的音频数据和自己朗读的英语的录制音频数据进行对比来进行判断,存在学习者自身无法通过自己的听力识别出自己发音问题的缺陷。
而且,复读机等英语学习工具操作麻烦,需要不断地按不同的按钮来进行录音、播放等等操作。
实际上,目前市场上的英语学习工具还不能使得用户可以很方便并且有效地进行英语口语的学习。
发明内容
本发明的目的在于提供一种准确方便的基于音视频的英语口语学习机,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于音视频的英语口语学习机,包括中央处理器,以及与中央处理器连接的数据库、触摸屏、扬声器,以及体感摄像头和音频采集单元,所述体感摄像头还通过视频处理单元与中央处理器连接,音频采集单元还通过音频处理单元与中央处理器连接;其中,所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件;所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件;所述触摸屏显示数据库中存储的英语文字文件;所述扬声器播放数据库中存储的音频文件;所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据,并且将采集到的音频数据传递给音频处理单元;音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示;所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据,并且将采集到的视频数据传递给视频处理单元;视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示;所述触摸屏用于输入操作指令和显示反馈信息;还能用于更新和/或修改数据库中的数据。
作为本发明进一步的方案:所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。
作为本发明再进一步的方案:所述音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。
作为本发明进一步的方案:所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。
作为本发明再进一步的方案:所述体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。
与现有技术相比,本发明的有益效果是:使用本学习机,用户可以很方便并且有效地进行英语口语学习,矫正口型和发音。
附图说明
图1为基于音视频的英语口语学习机的结构框图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
请参阅图1,一种基于音视频的英语口语学习机,包括中央处理器,以及与中央处理器连接的数据库、触摸屏、扬声器,以及体感摄像头和音频采集单元,所述体感摄像头还通过视频处理单元与中央处理器连接,音频采集单元还通过音频处理单元与中央处理器连接。
其中,所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件;所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件;所述触摸屏显示数据库中存储的英语文字文件;所述扬声器播放数据库中存储的音频文件。
所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据,并且将采集到的音频数据传递给音频处理单元;音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示。
优选地,所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。
所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据,并且将采集到的视频数据传递给视频处理单元;视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示。
优选地,所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。
所述触摸屏用于输入操作指令和显示反馈信息;还能用于更新和/或修改数据库中的数据。
本发明进行口语学习时,中央处理器从数据库获取成对的音频文件、视频文件和英语文字文件进行处理,并且使得触摸屏显示其中的英语文字文件以及显示提示用户进行朗读的提示信息,但是不使扬声器播放其中的音频文件;中央处理器向音频采集单元发送音频获取指令以启动音频采集单元来获取音频数据,同时,央处理器向体感摄像头发送音频获取指令以启动体感摄像头来获取视频数据;其中,触摸屏显示提示信息的时长等于音频采集单元此次获取音频数据的时长;音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据,并且将采集到的音频数据传递给音频处理单元;音频处理单元将从音频采集单元传递过来的音频数据进行语音识别,从而生成文本数据,并且将文本数据传递给中央处理器;同时,体感摄像头用于在从中央处理器接收到视频获取指令时开始采集视频数据,并且将采集到的视频数据传递给视频处理单元;视频处理单元将从体感摄像头传递过来的视频数据进行口形识别,从而也生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将所有文本数据与当前处理的成对的音频文件、视频文件和英语文字文件中的英语文字文件进行对比,并且在触摸屏上同时显示英语文字文件以及文本数据,并且将文本数据中与英语文字文件不同的部分突出显示。当中央处理器通过将文本数据与当前处理的成对的音频文件、视频文件和英语文字文件中的英语文字文件进行对比发现两者不一致时,中央处理器将当前处理的成对的音频文件、视频文件和英语文字文件存储在数据库的特定区域中,并且在下一次启动英语学习设备时使中央处理器首先处理所述特定区域中的成对的音频文件、视频文件和英语文字文件。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下做出各种变化。

Claims (5)

1.一种基于音视频的英语口语学习机,其特征在于,包括中央处理器,以及与中央处理器连接的数据库、触摸屏、扬声器,以及体感摄像头和音频采集单元,所述体感摄像头还通过视频处理单元与中央处理器连接,音频采集单元还通过音频处理单元与中央处理器连接;其中,所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件;所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件;所述触摸屏显示数据库中存储的英语文字文件;所述扬声器播放数据库中存储的音频文件;所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据,并且将采集到的音频数据传递给音频处理单元;音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示;所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据,并且将采集到的视频数据传递给视频处理单元;视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别,从而生成文本数据,并且将文本数据传递给中央处理器;中央处理器在从中央处理器接收到文本数据时,将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比,并且根据对比结果控制触摸屏的显示;所述触摸屏用于输入操作指令和显示反馈信息;还能用于更新和/或修改数据库中的数据。
2.根据权利要求1所述的基于音视频的英语口语学习机,其特征在于,所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。
3.根据权利要求1或2所述的基于音视频的英语口语学习机,其特征在于,所述音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。
4.根据权利要求1或2所述的基于音视频的英语口语学习机,其特征在于,所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。
5.根据权利要求4所述的基于音视频的英语口语学习机,其特征在于,所述体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。
CN201410720093.5A 2014-12-02 2014-12-02 基于音视频的英语口语学习机 Pending CN104537901A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410720093.5A CN104537901A (zh) 2014-12-02 2014-12-02 基于音视频的英语口语学习机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410720093.5A CN104537901A (zh) 2014-12-02 2014-12-02 基于音视频的英语口语学习机

Publications (1)

Publication Number Publication Date
CN104537901A true CN104537901A (zh) 2015-04-22

Family

ID=52853420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410720093.5A Pending CN104537901A (zh) 2014-12-02 2014-12-02 基于音视频的英语口语学习机

Country Status (1)

Country Link
CN (1) CN104537901A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105070118A (zh) * 2015-07-30 2015-11-18 广东小天才科技有限公司 一种针对语言类学习的纠正发音的方法及装置
CN106407289A (zh) * 2016-08-29 2017-02-15 乐视控股(北京)有限公司 外语音频信息的处理方法及装置
CN106940939A (zh) * 2017-03-16 2017-07-11 牡丹江师范学院 英语口语教学辅助装置及其方法
CN108091182A (zh) * 2016-11-22 2018-05-29 罗敬业 智能设备的英文教学装置
CN110136504A (zh) * 2019-05-17 2019-08-16 哈尔滨学院 人工智能发音训练设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070212670A1 (en) * 2004-03-19 2007-09-13 Paech Robert J Method for Teaching a Language
CN101510256A (zh) * 2009-03-20 2009-08-19 深圳华为通信技术有限公司 一种口型语言的转换方法及装置
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师***
CN201986001U (zh) * 2010-12-31 2011-09-21 上海华勤通讯技术有限公司 口型识别输入移动终端
CN201985992U (zh) * 2010-12-29 2011-09-21 上海华勤通讯技术有限公司 带有唇语识别功能的手机
US20120060093A1 (en) * 2009-05-13 2012-03-08 Doohan Lee Multimedia file playing method and multimedia player
CN103092329A (zh) * 2011-10-31 2013-05-08 南开大学 一种基于唇读技术的唇语输入方法
CN103198726A (zh) * 2013-04-23 2013-07-10 李华 英语学习设备
CN103218924A (zh) * 2013-03-29 2013-07-24 上海众实科技发展有限公司 一种基于音视频双模态的口语学习监测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070212670A1 (en) * 2004-03-19 2007-09-13 Paech Robert J Method for Teaching a Language
CN101510256A (zh) * 2009-03-20 2009-08-19 深圳华为通信技术有限公司 一种口型语言的转换方法及装置
US20120060093A1 (en) * 2009-05-13 2012-03-08 Doohan Lee Multimedia file playing method and multimedia player
CN201985992U (zh) * 2010-12-29 2011-09-21 上海华勤通讯技术有限公司 带有唇语识别功能的手机
CN201986001U (zh) * 2010-12-31 2011-09-21 上海华勤通讯技术有限公司 口型识别输入移动终端
CN102169642A (zh) * 2011-04-06 2011-08-31 李一波 具有智能纠错功能的交互式虚拟教师***
CN103092329A (zh) * 2011-10-31 2013-05-08 南开大学 一种基于唇读技术的唇语输入方法
CN103218924A (zh) * 2013-03-29 2013-07-24 上海众实科技发展有限公司 一种基于音视频双模态的口语学习监测方法
CN103198726A (zh) * 2013-04-23 2013-07-10 李华 英语学习设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105070118A (zh) * 2015-07-30 2015-11-18 广东小天才科技有限公司 一种针对语言类学习的纠正发音的方法及装置
CN106407289A (zh) * 2016-08-29 2017-02-15 乐视控股(北京)有限公司 外语音频信息的处理方法及装置
CN108091182A (zh) * 2016-11-22 2018-05-29 罗敬业 智能设备的英文教学装置
CN106940939A (zh) * 2017-03-16 2017-07-11 牡丹江师范学院 英语口语教学辅助装置及其方法
CN110136504A (zh) * 2019-05-17 2019-08-16 哈尔滨学院 人工智能发音训练设备

Similar Documents

Publication Publication Date Title
CN103198726A (zh) 英语学习设备
CN104537901A (zh) 基于音视频的英语口语学习机
JP5756555B1 (ja) 発話評価装置、発話評価方法及びプログラム
CN109493652A (zh) 基于vr技术的实践教学***
CN105009151A (zh) 理解辅助***、理解辅助服务器、理解辅助方法和计算机可读记录介质
Coskun Causes of the" I Can Understand English but I Can't Speak" Syndrome in Turkey.
CN203232684U (zh) 一种具有纠错功能的学习钢琴
Dosia et al. Production of English diphthongs: A speech study
Gholami Willingness to communicate and its relationship with emotional intelligence and gender differences
Ganek et al. The Language ENvironment Analysis (LENA) system: a literature review
WO2017028272A1 (zh) 早教***
CN106257565A (zh) 离线授课***
CN101409022A (zh) 具口型比对的语言学习***及方法
Altalmas et al. Lips tracking identification of a correct Quranic letters pronunciation for Tajweed teaching and learning
JP7427906B2 (ja) 情報処理装置、制御方法及びプログラム
CN104933911A (zh) 一种人机交互的教学辅助***
Cho et al. The relation of maternal literate mediation strategies and socioemotional comments to Korean children's Hangul reading
KR101385548B1 (ko) 문답식 단어 연상기억 방법
CN110706358A (zh) Ai互动3d化课件生成***
CN109360589A (zh) 一种体育赛事数据统计方法及***
Pawlak The effect of proficiency, gender, and learning style on the occurrence of negotiated interaction in communicative task performance
Padmakar et al. LearnEasy-android application as a technological intervention for children with dyslexia
Najib An Error Analysis in Pronunciation of English Vowels of The Third Semester Students of English Department at UNISMA
Thomson L2 English vowel learning by Mandarin speakers: Does perception precede production?
Papadopoulos et al. Improving the accessibility of the traditional lecture: an automated tool for supporting transcription

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150422