CN104537901A

CN104537901A - 基于音视频的英语口语学习机

Info

Publication number: CN104537901A
Application number: CN201410720093.5A
Authority: CN
Inventors: 孙娜; 李锋华; 曲巍巍; 项睿; 顾艳
Original assignee: Bohai University
Current assignee: Bohai University
Priority date: 2014-12-02
Filing date: 2014-12-02
Publication date: 2015-04-22

Abstract

本发明公开了一种基于音视频的英语口语学习机，包括中央处理器，以及与中央处理器连接的数据库、触摸屏、扬声器，以及体感摄像头和音频采集单元，所述体感摄像头还通过视频处理单元与中央处理器连接，音频采集单元还通过音频处理单元与中央处理器连接；使用本学习机，用户可以很方便并且有效地进行英语口语学习，矫正口型和发音。

Description

基于音视频的英语口语学习机

技术领域

本发明涉及一种学习机，具体是一种基于音视频的英语口语学习机。

背景技术

英语学习己经成为很多国家的教育的基础部分。根据以英语作为母语的人数计算，英语可能是世界上第三大语言，但它是世界上最广泛的第二语言。世界上60％以上的信件是用英语书写的，上两个世纪英国和美国在文化、经济、军事、政治和科学上的领先地位使得英语成为一种准国际语言。

英语学习中其实对学习者困扰最大的就是听力、单词记忆、写作、口语四个专项。这四个专项紧密联系，缺一不可。具体地说，例如，听力不好，口语就很差，英语语感就好不到哪去，单词也就很难记住。

目前市场上的英语学习工具包括复读机等，但是，对于复读机等英语学习工具，由于学习者仅仅能够根据原始的音频数据和自己朗读的英语的录制音频数据进行对比来进行判断，存在学习者自身无法通过自己的听力识别出自己发音问题的缺陷。

而且，复读机等英语学习工具操作麻烦，需要不断地按不同的按钮来进行录音、播放等等操作。

实际上，目前市场上的英语学习工具还不能使得用户可以很方便并且有效地进行英语口语的学习。

发明内容

本发明的目的在于提供一种准确方便的基于音视频的英语口语学习机，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于音视频的英语口语学习机，包括中央处理器，以及与中央处理器连接的数据库、触摸屏、扬声器，以及体感摄像头和音频采集单元，所述体感摄像头还通过视频处理单元与中央处理器连接，音频采集单元还通过音频处理单元与中央处理器连接；其中，所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件；所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件；所述触摸屏显示数据库中存储的英语文字文件；所述扬声器播放数据库中存储的音频文件；所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据，并且将采集到的音频数据传递给音频处理单元；音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示；所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据，并且将采集到的视频数据传递给视频处理单元；视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示；所述触摸屏用于输入操作指令和显示反馈信息；还能用于更新和/或修改数据库中的数据。

作为本发明进一步的方案：所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。

作为本发明再进一步的方案：所述音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。

作为本发明进一步的方案：所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。

作为本发明再进一步的方案：所述体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。

与现有技术相比，本发明的有益效果是：使用本学习机，用户可以很方便并且有效地进行英语口语学习，矫正口型和发音。

附图说明

图1为基于音视频的英语口语学习机的结构框图。

具体实施方式

下面结合具体实施方式对本专利的技术方案作进一步详细地说明。

请参阅图1，一种基于音视频的英语口语学习机，包括中央处理器，以及与中央处理器连接的数据库、触摸屏、扬声器，以及体感摄像头和音频采集单元，所述体感摄像头还通过视频处理单元与中央处理器连接，音频采集单元还通过音频处理单元与中央处理器连接。

其中，所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件；所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件；所述触摸屏显示数据库中存储的英语文字文件；所述扬声器播放数据库中存储的音频文件。

所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据，并且将采集到的音频数据传递给音频处理单元；音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示。

优选地，所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。

所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据，并且将采集到的视频数据传递给视频处理单元；视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示。

优选地，所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。

所述触摸屏用于输入操作指令和显示反馈信息；还能用于更新和/或修改数据库中的数据。

本发明进行口语学习时，中央处理器从数据库获取成对的音频文件、视频文件和英语文字文件进行处理，并且使得触摸屏显示其中的英语文字文件以及显示提示用户进行朗读的提示信息，但是不使扬声器播放其中的音频文件；中央处理器向音频采集单元发送音频获取指令以启动音频采集单元来获取音频数据，同时，央处理器向体感摄像头发送音频获取指令以启动体感摄像头来获取视频数据；其中，触摸屏显示提示信息的时长等于音频采集单元此次获取音频数据的时长；音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据，并且将采集到的音频数据传递给音频处理单元；音频处理单元将从音频采集单元传递过来的音频数据进行语音识别，从而生成文本数据，并且将文本数据传递给中央处理器；同时，体感摄像头用于在从中央处理器接收到视频获取指令时开始采集视频数据，并且将采集到的视频数据传递给视频处理单元；视频处理单元将从体感摄像头传递过来的视频数据进行口形识别，从而也生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将所有文本数据与当前处理的成对的音频文件、视频文件和英语文字文件中的英语文字文件进行对比，并且在触摸屏上同时显示英语文字文件以及文本数据，并且将文本数据中与英语文字文件不同的部分突出显示。当中央处理器通过将文本数据与当前处理的成对的音频文件、视频文件和英语文字文件中的英语文字文件进行对比发现两者不一致时，中央处理器将当前处理的成对的音频文件、视频文件和英语文字文件存储在数据库的特定区域中，并且在下一次启动英语学习设备时使中央处理器首先处理所述特定区域中的成对的音频文件、视频文件和英语文字文件。

上面对本专利的较佳实施方式作了详细说明，但是本专利并不限于上述实施方式，在本领域的普通技术人员所具备的知识范围内，还可以在不脱离本专利宗旨的前提下做出各种变化。

Claims

1.一种基于音视频的英语口语学习机，其特征在于，包括中央处理器，以及与中央处理器连接的数据库、触摸屏、扬声器，以及体感摄像头和音频采集单元，所述体感摄像头还通过视频处理单元与中央处理器连接，音频采集单元还通过音频处理单元与中央处理器连接；其中，所述数据库中存储了一一对应的多个音频文件、多个视频文件和多个英语文字文件；所述中央处理器用于处理数据库中存储的音频文件、视频文件和英语文字文件；所述触摸屏显示数据库中存储的英语文字文件；所述扬声器播放数据库中存储的音频文件；所述音频采集单元用于在从中央处理器接收到音频获取指令时开始采集音频数据，并且将采集到的音频数据传递给音频处理单元；音频处理单元用于将从音频采集单元传递过来的音频数据进行语音识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的音频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示；所述体感摄像头用于在从中央处理器接收到视频获取指令时开始采集口形的视频数据，并且将采集到的视频数据传递给视频处理单元；视频处理单元用于将从体感摄像头传递过来的视频数据进行口形识别，从而生成文本数据，并且将文本数据传递给中央处理器；中央处理器在从中央处理器接收到文本数据时，将文本数据与当前处理的成对的视频文件和英语文字文件中的英语文字文件进行对比，并且根据对比结果控制触摸屏的显示；所述触摸屏用于输入操作指令和显示反馈信息；还能用于更新和/或修改数据库中的数据。

2.根据权利要求1所述的基于音视频的英语口语学习机，其特征在于，所述音频采集单元采集音频数据的时长大于中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长。

3.根据权利要求1或2所述的基于音视频的英语口语学习机，其特征在于，所述音频采集单元采集音频数据的时长是中央处理器当前处理的成对的音频文件和英语文字文件中的音频文件的时长的1.5倍至2倍。

4.根据权利要求1或2所述的基于音视频的英语口语学习机，其特征在于，所述体感摄像头采集视频数据的时长大于中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长。

5.根据权利要求4所述的基于音视频的英语口语学习机，其特征在于，所述体感摄像头采集视频数据的时长是中央处理器当前处理的成对的视频文件和英语文字文件中的视频文件的时长的1.5倍至2倍。