CN109600424A - 一种集成微主机、网络接入和音频采集的教室智慧终端 - Google Patents

一种集成微主机、网络接入和音频采集的教室智慧终端 Download PDF

Info

Publication number
CN109600424A
CN109600424A CN201811393665.8A CN201811393665A CN109600424A CN 109600424 A CN109600424 A CN 109600424A CN 201811393665 A CN201811393665 A CN 201811393665A CN 109600424 A CN109600424 A CN 109600424A
Authority
CN
China
Prior art keywords
voice signal
classroom
mainframe micro
audio
audio collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811393665.8A
Other languages
English (en)
Other versions
CN109600424B (zh
Inventor
高杰欣
张淼
安中印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South Central Minzu University
Original Assignee
South Central University for Nationalities
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South Central University for Nationalities filed Critical South Central University for Nationalities
Priority to CN201811393665.8A priority Critical patent/CN109600424B/zh
Publication of CN109600424A publication Critical patent/CN109600424A/zh
Application granted granted Critical
Publication of CN109600424B publication Critical patent/CN109600424B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/08Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种集成微主机、网络接入和音频采集的教室智慧终端,所述教室智慧终端上集成有微主机,音频采集模块和网络接入模块,其中,所述微主机分别与所述音频采集模块和网络接入模块连接;所述音频采集模块用于采集教室内的音频信号,并将采集的音频信号发送到微主机;所述微主机用于对所述音频信号进行处理并保存;以及通过所述网络接入模块与设备终端进行数据交互;所述网络接入模块,用于与设备终端通过有线网络和/或无线网络建立连接,实现所述教室智慧终端与所述电子设备的数据交互。本发明集成度高,结构简单,扩展性强,能够准确地获取课堂上的音频信息。

Description

一种集成微主机、网络接入和音频采集的教室智慧终端
技术领域
本发明涉及教学设备领域,特别是一种集成微主机、网络接入和音频采集的教室智慧终端。
背景技术
随着时代进步和科学技术的发展,在实体场景课堂中,越来越多的电子设备被应用于其中,但是电子设备种类和数量的繁多,多媒体主机的稳定和各种软件的安装变得管理困难,使得运维人员需要进行的操作十分复杂;目前,教室都分别设置有PC终端和中控终端对教室内设备进行控制,而中控终端仅仅是对外界设备开关状态的集成控制,扩展性不强;当教室需要部署网络时,需要专门的网络接入设施,在布线管理、电源管理和接入复杂性管理上存在严重的分散性,难以有效的对其进行安全和规范的接入;当需要对教室的音频信息进行采集时,需要采用专门的音频信息采集设备对音频信息进行采集,并且需要在采集后将采集设备采集到的音频信息导入到专门的储存设备中做进一步的加工处理,一方面加剧了教室设备的分散和管理复杂度,另一方面也不利于音频使用上和AI语音引擎等其他***的对接,因此为符合智慧教室的发展,发明一种集成微主机、网络接入和音频采集的教室智慧终端亟具需要。
发明内容
针对上述问题,本发明旨在提供一种集成微主机、网络接入和音频采集的教室智慧终端。
本发明的目的采用以下技术方案来实现:
一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,
所述教室智慧终端上集成有微主机,音频采集模块和网络接入模块,其中,
所述微主机分别与所述音频采集模块和网络接入模块连接;
所述音频采集模块用于采集教室内的音频信号,并将采集的音频信号发送到微主机;
所述微主机用于对所述音频信号进行处理并保存;以及通过所述网络接入模块与设备终端进行数据交互;
所述网络接入模块,用于与设备终端通过有线网络和/或无线网络建立连接,实现所述教室智慧终端与所述电子设备的数据交互。
在一种实施方式中,所述音频采集模块包括AUX接口,所述AUX接口用于连接用户设备,采集所述用户设备的音频输出信号;和/或
所述音频采集模块包括麦克风,用于采集用户语音信号。
在一种实施方式中,所述网络接入模块上包括HDMI接口,所述HDMI接口与所述微主机连接,用于将所述微主机的操作界面输出至显示设备或投影设备。
在一种实施方式中,所述网络接入模块包括无线AP天线,以便所述教室智慧终端作为教室AP接入点,实现与接入设备的连接及数据交互;和/或
所述网络接入模块包括路由功能子模块,所述路由功能子模块支持IPv4/IPv6双栈接入、IPv4到IPv6的转换、纯IPv6接入、IPv6转换功能。
在一种实施方式中,所述微主机还通过所述网络接入模块与管理设备连接,所述管理设备用于对所述微主机进行远程管理和/或控制;和/或
所述微主机还通过所述网络接入模块与用户设备连接,用户通过所述微主机对所述用户设备进行远程管理和/控制。
在一种实施方式中,所述微主机还用于对接收的音频信号进行编码处理,生成相应的音频文件并保存,其中,微主机生成音频文件后,将音频文件通过网络接入模块传输到储存设备,实现数显数据保存,其中,所述储存设备包括移动硬盘,U盘,网络云盘,云端服务器。
本发明的有益效果为:本发明教室智慧终端中集成了微主机、音频采集模块和网络接入模块,集成度高,结构简单,能够代替现代教室中采用PC终端和中控终端,有效地节省空间及降低教室内设备布局、布线的复杂度;通过音频采集模块采集教室内的音频信信号,并传输到微主机对音频信号进行进一步处理或保存,能够准确地获取课堂上的音频信息,为后续对该音频信息作进一步处理奠定了基础;同时微主机通过网络接入模块与其他设备终端实现数据交互,能够整合教室内的所有设备终端,扩展性强。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1为本发明一种实施方式的框架结构图;
图2为本发明另一种实施方式的框架结构图;
图3为本发明语音控制模块的框架结构图。
附图标记:
教室智慧终端0、音频采集模块1、微主机2、网络接入模块3、AUX接口11、语音控制模块20、语音增强单元21、端点检测单元22、特征提取单元23、指令识别单元24、指令库25、HDMI接口31、USB接口32、路由功能子模块33、无线AP天线34、有线网络接口35
具体实施方式
结合以下应用场景对本发明作进一步描述。
参见图1,其示出一种集成微主机2、网络接入和音频采集的教室智慧终端,所述教室智慧终端0上集成有音频采集模块1,微主机2和网络接入模块3;
所述微主机2分别与所述音频采集模块1和网络接入模块3连接;
所述音频采集模块1用于采集教室内的音频信号,并将采集的音频信号发送到微主机2;
所述微主机2用于对所述音频信号进行处理并保存;以及通过所述网络接入模块3与设备终端进行数据交互。
所述网络接入模块3,用于与设备终端通过有线网络和/或无线网络建立连接,实现所述教室智慧终端与所述电子设备的数据交互。
本发明上述实施方式,教室智慧终端中集成了微主机2、音频采集模块1和网络接入模块3,集成度高,结构简单,能够代替现代教室中采用PC终端和中控终端,有效地节省空间及降低教室内设备布局、布线的复杂度;通过音频采集模块1采集教室内的音频信信号,并传输到微主机2对音频信号进行进一步处理或保存,能够准确地获取课堂上的音频信息,为后续对该音频信息作进一步处理奠定了基础;同时微主机2通过网络接入模块3与其他设备终端实现数据交互,能够整合教室内的所有设备终端,扩展性强。
在一种实施方式中,所述网络接入模块3上包括HDMI接口31,所述HDMI接口31与所述微主机2连接,用于将所述微主机2的操作界面输出至显示设备或投影设备。
在一种场景中,微主机2通过网络接入模块3与投影仪连接,将其上的操作界面传输到投影仪中实现投屏功能。
在一种实施方式中,所述网络接入模块3上包括USB接口32,所述USB接口32用与外置操作设备连接,供用户通过所述外置操作设备对所述微主机2进行操作,其中所述外置操作设备包括键盘,鼠标,控制笔等。
在一种实施方式中,所述网络接入模块3包括路由功能子模块33,所述路由功能子模块33支持IPv4/IPv6双栈接入、IPv4到IPv6的转换、纯IPv6接入、IPv6转换等功能。
在一种场景中,用户终端通过WIFI接口接入教室智慧终端,由教室智慧终端的路由功能子模块33接入Internet实现上网。
在一种场景中,用户终端通过其上的WIFI接口接入教室智慧终端,实现用户终端和教室智慧终端的数据交互。
在一种场景中,网络接入模块通过IPv6接入到上联网络中。
在一种实施方式中,所述网络接入模块3包括有线网络接口35,具体包括RJ-45接口。
在一种场景中,学生终端(如设置在教室内的台式电脑,学生自带的手提电脑、平板电脑、手机等)通过WIFI接口连接到教室智慧终端,微主机2通过网络接入模块3与该学生终端实现数据交互,包括将微主机2的操作界面或音频信号传输到学生终端,或者向学生终端传输文件等。
在一种实施方式中,所述网络接入模块3包括无线AP天线34,以便所述教室智慧终端作为教室AP接入点,实现与接入设备的连接及数据交互。
在一种场景中,该AP同时作为无线投屏的接入点,实现与接入设备的连接及屏幕、音频的交互。
在一种场景中,教室智慧终端内设有AP接入点,所述AP接入点与无线控制器连接,通过无线控制器接入Internet;教室内的用户终端通过无线网络连接到教室智慧终端便能通过教室智慧终端的AP接入点连接到Internet;同时,管理员也能通过操作微主机2对接入的用户终端进行“一键断网”等控制。
在一种场景中,用户终端也能通过无线网络接入教室智慧终端的AP接入点,实现用户终端与微主机2的数据交互,其中用户终端包括投影仪,手提电脑,手机,平板电脑等。
在一种场景中,每个教室的教室智慧终端都设有无线AP天线34,能够通过多天线实现教学楼的AP网络覆盖,提高网络性能。
本发明上述实施方式,教室智慧终端能够同时支持无线路由,无线AP网络及有线接入功能,提高了智慧终端应用场景的适配性,同时提高了智慧终端实现教室组网和功能扩展能力。
在一种实施方式中,所述音频采集模块1包括AUX接口11,所述AUX接口11用于连接用户设备,采集所述用户设备的音频输出信号。
在一种场景中,所述音频采集模块1通过AUX接口11与用户设备连接,将用户设备的音频输出信号直接输入到所述教室智慧终端中,由所述微主机2对输入的音频信号进行增强处理,并通过所述网络接入模块3将所述音频信号传输到扩音设备中,实现外接设备的扩音功能。
在一种实施方式中,所述音频采集模块1包括麦克风,用于采集用户语音信号;
在一种场景中,用户通过麦克风输入语音信号,微主机2对所述语音信号进行增强处理,并通过网络接入模块3将该语音信号传输到扩音设备中,实现用户语音输入的扩音功能。
本发明上述实施方式,音频采集模块1支持用户语音信号输入和其他设备输出音频作为输入等方式,能够灵活适应不同教学场景的需要。
在一种实施方式中,所述教室智慧终端还包括电源模块,所述电源模块与所述微主机2、音频采集模块1和网络接入模块3连接,用于给上述模块供电。
在一种实施方式中,所述微主机2包括显示屏,所述显示屏用于显示所述微主机2的操作界面和操作内容。
在一种实施方式中,所述显示屏为触摸显示屏,通过所述触摸显示屏对所述微主机2进行操作。
在一种实施方式中,所述微主机2包括采用ARM处理器,及采用Linux操作***,支持用户根据实际需要在所述微主机2中安装及运行OFFICE、浏览器、云客户端等软件。
在一种场景中,用户通过微主机2运行PPT,并且将PPT展示画面通过网络接入模块3的HDMI接口31传输到投影仪上,实现教学内容的投屏。
本发明上述实施方式,微主机2上装设有Linux操作***,支持各种应用程序的运行,并且通过触摸屏或者外部操作设备进行操作指令的输入。
在一种实施方式中,所述微主机2还通过所述网络接入模块3与云服务器建立连接,实现微主机2和云服务器的数据交互;
在一种场景中,所述微主机2上设有云桌面客户端,用于接入云桌面,用户通过所述云桌面对虚拟应用和虚拟***进行操作,进一步对微主机上运行多种软件的能力进行补足。
本发明上述实施方式,微主机2通过网络接入模块3与云端服务器连接,并且微主机2上装设有云桌面客户端,供用户通过云桌面客户端对虚拟***或程序进行操作,通过云桌面的应用,能够有效地减少本地储存空间的压力,同时提高应用程序的多样性。
在一种实施方式中,所述微主机2内置agent模块,通过所述网络接入模块3与管理设备连接,所述管理设备用于对所述微主机2进行远程管理和/或控制。
在一种场景中,所述微主机2还能通过网络接入模块3与管理设备连接,通过IP电话实现对管理中心的呼叫。
在一种实施方式中,所述微主机2还通过所述网络接入模块3与用户设备连接,用户通过所述微主机2对所述用户设备进行远程管理和/控制。
在一种实施方式中,所述微主机2还能够获取其接入设备在线状态、运行负载等状态信息。
本发明上述实施方式,教室智慧终端能够被远程操控,或者远程操控其他接入设备,灵活性强。
在一种实施方式中,所述微主机2还用于对接收的音频信号进行编码处理,生成相应的音频文件并保存。
在一种实施方式中,微主机2生成音频文件后,将音频文件通过网络接入模块3传输到储存设备,实现数显数据保存,其中,所述储存设备包括移动硬盘,U盘,网络云盘,云端服务器等。
在一种场景中,网络接入模块3支持iSCSI、cifs、nfs多种协议,通过网络接口将微主机2中的音频信号保存至云服务器中。
在一种场景中,音频采集模块采集课堂上的音频信号,并发送到微主机进行处理,生成课堂音频文件,并由微主机通过网络接入模块将课堂音频文件上传到管理服务器中,以便管理服务器对该音频文件进行分类保存,供后续调用;以及对其进行进一步分析,包括识别音频内容、语义分析和舆情分析等。
在一种场景中,生成的课堂音频文件还由微主机通过网络接入模块传输到AI语音引擎中,由AI语音引擎作进一步处理。
在一种实施方式中,微主机2通过网络接入模块3与外置摄像头连接,微主机2通过所述摄像头获取教师内的视频画面并储存到指定位置。
在一种场景中,微主机2通过网络接入模块3上的USB接口32连接有摄像头,通过该摄像头获取教师内的视频图像,并由微主机2通过云端接口将该视频图像上传到云端服务器,对该视频图像进行进一步的处理,分析该视频图像中的人脸信息,实现课堂的智慧点名功能。
在一种场景中,所述摄像头集成与所述教室智慧终端中,与微主机2连接。
本发明上述实施方式,教室智慧终端还集成或外部连接有摄像头,功能拓展性强。
在一种实施方式中,参见图2,所述教室智慧终端还具有语音控制的功能;音频采集模块1还用于采集用户语音信号,将采集的用户语音信号传输到所述微主机2;
所述微主机2还包括语音控制模块20,所述语音控制模块20用于对音频采集模块1中采集的用户语音信号进行识别处理,输出与该用户语音信号相应的操作指令,供微主机2执行该操作指令。
在一种实施方式中,参见图3,所述语音控制模块20包括语音增强单元21,端点检测单元22,特征提取单元23和指令识别单元24;
所述语音增强单元21用于对接收的用户语音信号进行增强处理,输出增强后的语音信号;
所述端点检测单元22用于对所述增强后的语音信号进行端点检测处理,标识所述增强后的语音信号中的语音端点及语音段;
所述特征提取单元23,用于对所述增强后的语音信号中的语音段进行特征提取处理,输出语音特征参数;
所述指令识别单元24,用于根据所述语音特征参数在指令库25中预存的操作指令对应的特征参数进行匹配,当所述语音特征参数和预存的特征参数相似度大于设定的阈值时,输出预存的特征参数对应的操作指令;当所述语音特征参数与预存的特征参数均小于设定的阈值时,输出识别失败消息,由微主机2显示该识别失败消息。
本发明上述实施方式,微主机2通过单元化设计对接收的用户语音信号进行处理,首先对用户语音信号进行增强处理,输出增强后的语音信号,有助于将增强后的语音信号进一步上传到云服务器、播音设备或进一步对语音信号进行识别处理;然后对增强后的语音信号进行端点检测处理,识别该信号的语音端点和语音段,为后续语音指令识别奠定基础;然后对语音信号终端额语音段进行特征提取处理,获取语音信号中有内容的语音段的特征参数,然后获将获取的语音特征参数和预存的指令库25中的特征参数进行比对,匹配响应的操作指令并输出。通过单元化设计,能够提高用户语音信号识别处理的效率,符合实时性的需要。
在一种场景中,用户通过特定的语音指令唤醒教室智慧终端的语音控制功能,当用户发出“开启语音控制”的语音指令后,由音频采集模块1采集用户的语音指令,并由微主机2对该语音指令进行识别,当识别成功后,微主机2开启语音指令控制功能,采集用户接下来发出的语音指令并进行识别,执行相应的操作,避免的误操作的情况。
本发明上述实施方式,用户能够通过语音指令控制教室智慧终端执行相应的操作,实现对外接设备如投影仪仪亮度,扩音器音量等控制,灵活性强,符合现代智能教学的需要。
在一种实施方式中,所述语音增强单元21用于对接收的用户语音信号进行增强处理,输出增强后的语音信号,具体包括:
(1)对接收的用户语音信号进行分帧加窗处理;
(2)对每一帧的语音信号进行快速傅里叶变换,获取语音信号的幅度谱;
(3)分别对每一帧语音信号进行噪声估计处理,获取语音信号的噪声幅度谱估计;
(4)对每一帧语音信号,将语音信号的幅度谱中减去噪声幅度谱估计,获取纯净语音信号幅度谱;
(5)通过对纯净语音信号幅度谱进行逆快速傅里叶变换,获取该帧语音信号增强后的语音信号,并将各帧增强后的语音信号组合输出增强后的语音信号。
在一种实施方式中,所述语音增强单元21中分别对每一帧语音信号进行噪声估计处理,获取语音信号的噪声幅度谱估计,具体包括:
其中,采用的噪声幅度谱估计函数为:
式中,表示第i帧语音信号中第n频点处的噪声幅度谱估计,|R(i,n)|表示第i帧用户语音信号中第n频点处的幅度谱,T表示判断因子,BGc(i-1,n)表示噪声谱的波动估计,u表示波动估计调节参数,v表示波动平滑参数,α、β和γ分别表示平滑调节因子。
本发明上述实施方式,由于传统的VAD算法在不平稳噪声环境下对噪声幅度谱的估计效果较差,因此本发明采用上述的方式语音信号进行噪声幅度谱估计,加入了平滑因子,能够自适应地对语音信号的噪声幅度谱进行估计,提高了语音增强的效果和文字语音信息可懂度,为后续语音信号的指令识别奠定了基础。
在一种实施方式中,所述语音增强单元21中对每一帧语音信号,将语音信号的幅度谱中减去噪声幅度谱估计,获取纯净语音信号幅度谱,具体包括:
对于每一帧语音信号,采用下列谱减函数获取其纯净语音信号幅度谱:
其中,
式中,表示该帧语音信号中第m频点的纯净语音信号幅度谱,R(m)表示该帧用户语音信号中的第k频点处的幅度谱,表示该帧语音信号中第m频点处的噪声幅度谱估计,表示该帧语音信号中第m频点的先验信噪比,表示设定的信噪比最小值,sN(m)表示该帧语音信号中第m频点的后验信噪比,ω表示影响因子,表示该帧语音信号前一帧获取的纯净语音信号幅度谱。
本发明上述实施方式,采用上述自定义谱减函数获取纯净语音信号的幅度谱,能够有效地去除用户语音信号中的噪声干扰,明显提高处理后获取的纯净语音信号的语音质量,间接提高了后续对语音信号进行指令识别的准确性。
在一种实施方式中,所述端点检测单元22用于对所述增强后的语音信号进行端点检测处理,标识所述增强后的语音信号中的语音端点及语音段,具体包括:
对增强后的语音信号进行分帧、加窗处理;
对每一帧该语音信号进行傅里叶变换,获每一帧该语音信号的功率谱;
分别获取每一帧所述语音信号的端点检测因子,其中采用的端点检测因子函数为:
其中,
式中,Sc(i)表示第i帧该语音信号的端点检测因子,Gc(i表示第i帧该语音信号设定的子带总数,表示判断因子,W表示语音帧的总数,X(f,i表示第i帧该语音信号的第f个功率谱幅度,U表示一帧该语音信号中的样本数,H表示设定的子带划分因子,Yc(d,i)表示第i帧该语音信号第d个子带频谱能量,
依次将每一帧该语音信号的端点检测因子和设定的阈值进行比较,如果从X帧开始有连续5帧语音信号的端点检测因子大于设定的阈值,就以该第X帧的帧号作为该语音信号的语音起始端点;并将后续每一帧该语音信号的端点检测因子和设定的阈值进行比较,如果从y帧开始有连续5帧语音信号的端点检测因子小于设定的阈值,就以该第y帧的帧号作为该语音信号的语音结束端点;并将所述语音起始端点和语音结束端点之间的语音信号标记为语音段。
本发明上述实施方式,采用上述的方式对增强后的语音信号进行处理,获取该信号的的语音段,首先对增强后的语音信号进行分帧处理,然后对每一帧的语音信号进行傅里叶变换获取该语音信号的功率谱,然后采用上述自定义函数计算每一帧语音信号的端点检测因子,并根据端点检测因子对语音信号是否为语音段进行识别,能够自适应的根据语音信号特质对功率谱进行子带划分,从而降低计算的端点检测因子对噪声的敏感度,提高语音端点检测的准确性,为后续准确获取用户语音信号的特征参数奠定了基础。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当分析,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (10)

1.一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,
所述教室智慧终端上集成有微主机,音频采集模块和网络接入模块,其中,
所述微主机分别与所述音频采集模块和网络接入模块连接;
所述音频采集模块用于采集教室内的音频信号,并将采集的音频信号发送到微主机;
所述微主机用于对所述音频信号进行处理并保存;以及通过所述网络接入模块与设备终端进行数据交互;
所述网络接入模块,用于与设备终端通过有线网络和/或无线网络建立连接,实现所述教室智慧终端与所述电子设备的数据交互。
2.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述音频采集模块包括AUX接口,所述AUX接口用于连接用户设备,采集所述用户设备的音频输出;和/或
所述音频采集模块包括麦克风,用于采集用户语音信号。
3.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述网络接入模块上包括HDMI接口,所述HDMI接口与所述微主机连接,用于将所述微主机的操作界面输出至显示设备或投影设备。
4.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述网络接入模块包括无线AP天线,以便所述教室智慧终端作为教室AP接入点,实现与接入设备的连接及数据交互;和/或
所述网络接入模块包括路由功能子模块,所述路由功能子模块支持IPv4/IPv6双栈接入、IPv4到IPv6的转换、纯IPv6接入、IPv6转换功能。
5.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述微主机还通过所述网络接入模块与管理设备连接,所述管理设备用于对所述微主机进行远程管理和/或控制;和/或
所述微主机还通过所述网络接入模块与用户设备连接,用户通过所述微主机对所述用户设备进行远程管理和/控制。
6.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述微主机还用于对接收的音频信号进行编码处理,生成相应的音频文件并保存,其中,微主机生成音频文件后,将音频文件通过网络接入模块传输到储存设备,实现数显数据保存,其中,所述储存设备包括移动硬盘,U盘,网络云盘,云端服务器。
7.根据权利要求1所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述音频采集模块还用于采集用户语音信号,将采集的用户语音信号传输到所述微主机;
所述微主机还包括语音控制模块,所述语音控制模块用于对音频采集模块中采集的用户语音信号进行识别处理,输出与该用户语音信号相应的操作指令,供微主机执行该操作指令。
8.根据权利要求7所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述语音控制模块包括语音增强单元,端点检测单元,特征提取单元和指令识别单元;
所述语音增强单元用于对接收的用户语音信号进行增强处理,输出增强后的语音信号;
所述端点检测单元用于对所述增强后的语音信号进行端点检测处理,标识所述增强后的语音信号中的语音端点及语音段;
所述特征提取单元,用于对所述增强后的语音信号中的语音段进行特征提取处理,输出语音特征参数;
所述指令识别单元,用于根据所述语音特征参数在指令库中预存的操作指令对应的特征参数进行匹配,当所述语音特征参数和预存的特征参数相似度大于设定的阈值时,输出预存的特征参数对应的操作指令;当所述语音特征参数与预存的特征参数均小于设定的阈值时,输出识别失败消息,由微主机显示该识别失败消息。
9.根据权利要求8所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述语音增强单元用于对接收的用户语音信号进行增强处理,输出增强后的语音信号,具体包括:
(1)对接收的用户语音信号进行分帧加窗处理;
(2)对每一帧的语音信号进行快速傅里叶变换,获取语音信号的幅度谱;
(3)分别对每一帧语音信号进行噪声估计处理,获取语音信号的噪声幅度谱估计;
(4)对每一帧语音信号,将语音信号的幅度谱中减去噪声幅度谱估计,获取纯净语音信号幅度谱;
(5)通过对纯净语音信号幅度谱进行逆快速傅里叶变换,获取该帧语音信号增强后的语音信号,并将各帧增强后的语音信号组合输出增强后的语音信号。
10.根据权利要求9所述的一种集成微主机、网络接入和音频采集的教室智慧终端,其特征在于,所述语音增强单元中分别对每一帧语音信号进行噪声估计处理,获取语音信号的噪声幅度谱估计,具体包括:
其中,采用的噪声幅度谱估计函数为:
式中,表示第i帧语音信号中第n频点处的噪声幅度谱估计,|R(i,n)|表示第i帧用户语音信号中第n频点处的幅度谱,T表示判断因子,BGc(i-1,n)表示噪声谱的波动估计,u表示波动估计调节参数,v表示波动平滑参数,α、β和γ分别表示平滑调节因子。
CN201811393665.8A 2018-11-21 2018-11-21 一种集成微主机、网络接入和音频采集的教室智慧终端 Expired - Fee Related CN109600424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811393665.8A CN109600424B (zh) 2018-11-21 2018-11-21 一种集成微主机、网络接入和音频采集的教室智慧终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811393665.8A CN109600424B (zh) 2018-11-21 2018-11-21 一种集成微主机、网络接入和音频采集的教室智慧终端

Publications (2)

Publication Number Publication Date
CN109600424A true CN109600424A (zh) 2019-04-09
CN109600424B CN109600424B (zh) 2019-08-20

Family

ID=65959156

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811393665.8A Expired - Fee Related CN109600424B (zh) 2018-11-21 2018-11-21 一种集成微主机、网络接入和音频采集的教室智慧终端

Country Status (1)

Country Link
CN (1) CN109600424B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111208725A (zh) * 2020-02-26 2020-05-29 无锡职业技术学院 一种教室用多功能闹钟***
CN111294681A (zh) * 2020-02-28 2020-06-16 联想(北京)有限公司 教室终端***及其控制方法、控制器与主控设备
CN112863544A (zh) * 2021-01-11 2021-05-28 新疆品宣生物科技有限责任公司 基于声波分析的预警设备及预警方法
CN116567483A (zh) * 2023-04-18 2023-08-08 北京万讯博通科技发展有限公司 一种红外无线教学扩声的智能管理方法及***
WO2024078359A1 (zh) * 2022-10-10 2024-04-18 北京师范大学 一种多模态的智慧教室边缘计算控制***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103428441A (zh) * 2013-05-27 2013-12-04 王�锋 一种用于在线教学的课程记录方法和装置
CN103440790A (zh) * 2013-09-14 2013-12-11 大连联达科技有限公司 教学互动学习***及方法
CN205230416U (zh) * 2015-09-23 2016-05-11 成都往来教育科技有限公司 智能教室***
CN105931510A (zh) * 2016-06-16 2016-09-07 北京数智源科技股份有限公司 同步评录课堂平台及其方法
JP2017138509A (ja) * 2016-02-04 2017-08-10 カシオ計算機株式会社 感情推定器の個人適応方法、感情推定装置及びプログラム
CN108230795A (zh) * 2018-01-25 2018-06-29 黄淮学院 一种大学应用数学课堂教学***
CN108389441A (zh) * 2018-03-06 2018-08-10 东莞职业技术学院 一种智慧教室***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103428441A (zh) * 2013-05-27 2013-12-04 王�锋 一种用于在线教学的课程记录方法和装置
CN103440790A (zh) * 2013-09-14 2013-12-11 大连联达科技有限公司 教学互动学习***及方法
CN205230416U (zh) * 2015-09-23 2016-05-11 成都往来教育科技有限公司 智能教室***
JP2017138509A (ja) * 2016-02-04 2017-08-10 カシオ計算機株式会社 感情推定器の個人適応方法、感情推定装置及びプログラム
CN105931510A (zh) * 2016-06-16 2016-09-07 北京数智源科技股份有限公司 同步评录课堂平台及其方法
CN108230795A (zh) * 2018-01-25 2018-06-29 黄淮学院 一种大学应用数学课堂教学***
CN108389441A (zh) * 2018-03-06 2018-08-10 东莞职业技术学院 一种智慧教室***

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111208725A (zh) * 2020-02-26 2020-05-29 无锡职业技术学院 一种教室用多功能闹钟***
CN111208725B (zh) * 2020-02-26 2021-12-28 无锡职业技术学院 一种教室用多功能闹钟***
CN111294681A (zh) * 2020-02-28 2020-06-16 联想(北京)有限公司 教室终端***及其控制方法、控制器与主控设备
CN112863544A (zh) * 2021-01-11 2021-05-28 新疆品宣生物科技有限责任公司 基于声波分析的预警设备及预警方法
WO2024078359A1 (zh) * 2022-10-10 2024-04-18 北京师范大学 一种多模态的智慧教室边缘计算控制***
CN116567483A (zh) * 2023-04-18 2023-08-08 北京万讯博通科技发展有限公司 一种红外无线教学扩声的智能管理方法及***
CN116567483B (zh) * 2023-04-18 2024-02-09 北京万讯博通科技发展有限公司 一种红外无线教学扩声的智能管理方法及***

Also Published As

Publication number Publication date
CN109600424B (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN109600424B (zh) 一种集成微主机、网络接入和音频采集的教室智慧终端
WO2018036149A1 (zh) 一种多媒体交互教学***及方法
CN105681920B (zh) 一种具有语音识别功能的网络教学方法及***
CN105578115A (zh) 一种具有语音评估功能的网络教学方法及***
US20050002535A1 (en) Remote audio device management system
JP2016524724A (ja) 家庭環境内で音声コマンドに関連付けられた位置を特定して家庭用電気機器を制御する方法およびシステム
KR20220027187A (ko) 장면 인터랙션 방법 및 장치, 전자 장치 및 컴퓨터 저장 매체
CN112860572B (zh) 移动终端的云测试方法、装置、***、介质、电子设备
CN111179962A (zh) 语音分离模型的训练方法、语音分离方法及装置
JP2018195276A (ja) 両面表示の同時通訳装置、方法、デバイス及び電子装置
CN110096611A (zh) 一种歌曲推荐方法、移动终端及计算机可读存储介质
CN111405416B (zh) 立体声录制方法、电子设备及存储介质
CN111405301B (zh) 终端的录屏交互方法、装置、计算机设备及存储介质
WO2018212470A1 (ko) 음성요청에 대응하는 정보 제공을 위한 미디어 선택
CN105430494A (zh) 在播放视频的设备中识别视频中音频的方法和装置
CN106997695A (zh) 一种新型的云教育智能***
CN111863020A (zh) 语音信号处理方法、装置、设备及存储介质
WO2021147157A1 (zh) 游戏特效生成方法及装置、存储介质、电子设备
CN109857321A (zh) 基于屏幕投影的操作方法、移动终端、可读存储介质
CN109616119A (zh) 一种基于IPv6协议的多功能网关设备
EP2724496A1 (en) User terminal device, server device, system and method for assessing quality of media data
JP2021012303A (ja) 情報処理装置、情報処理方法、情報処理プログラム
TWM574267U (zh) 即時語音自動同步轉譯字幕直播系統
CN111416955B (zh) 一种视频通话方法及电子设备
CN107729315A (zh) 音频文件的显示方法、终端和计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190820

Termination date: 20211121