CN110989965A - 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质 - Google Patents

一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质 Download PDF

Info

Publication number
CN110989965A
CN110989965A CN201911200276.3A CN201911200276A CN110989965A CN 110989965 A CN110989965 A CN 110989965A CN 201911200276 A CN201911200276 A CN 201911200276A CN 110989965 A CN110989965 A CN 110989965A
Authority
CN
China
Prior art keywords
recording
voice
audio
mouse
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911200276.3A
Other languages
English (en)
Inventor
冯海洪
毛德平
许成亮
王行健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Mimouse Technology Co ltd
Original Assignee
Anhui Mimouse Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Mimouse Technology Co ltd filed Critical Anhui Mimouse Technology Co ltd
Priority to CN201911200276.3A priority Critical patent/CN110989965A/zh
Publication of CN110989965A publication Critical patent/CN110989965A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Position Input By Displaying (AREA)

Abstract

本发明涉及语音信号处理技术领域,尤其为一种基于语音鼠标的录音线路切换方法,该方法包括:在语音鼠标端实现音频信号的采集,并将音频通过USB端口传输至电脑。电脑通过声卡驱动将模拟音频信号转化为数字信号并通过录音线路输出。软件采集鼠标的录音线路并在语音鼠标拾音装置失效的情况下提示用户,用户通过切换至电脑的其他录音线路来接收音频信息。本发明利用语音信号的处理技术结合硬件设备,实现在语音鼠标无法拾音的情况下,可以将拾音线路切换为其他麦克风设备,保证了语音鼠标的语音功能正常使用。本发明还公开了一种基于语音鼠标的录音线路切换***、装置及计算机可读存储介质,与上述方法具有相同的有益效果。

Description

一种基于语音鼠标的录音线路切换方法、***、装置及可读存 储介质
技术领域
本发明涉及语音信号处理技术领域,具体为一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质。
背景技术
目前市面上的语音鼠标都只是在鼠标主板上安装了咪头(微型麦克风),并结合计算机上的软件,实现语音打字,语音上网,语音翻译的功能。
但现有的语音鼠标存在鼠标咪头(麦克风)拾音效果很差,并且容易损坏的问题,特别是鼠标容易从电脑桌上摔下,很容易让鼠标咪头损坏。如果语音鼠标的咪头损坏,语音鼠标的拾音装置就无法进行拾音,传给电脑的音频信息也就都是噪音或者静音。
发明内容
本发明的目的在于提供一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质,以解决上述背景技术中提出的问题。所述基于语音鼠标的录音线路切换方法,当语音鼠标出现咪头损坏或者拾音装置不工作的情况后,可以使用电脑中的其他录音线路进行录音。这样人们使用语音鼠标时发现咪头拾音效果不好或者鼠标咪头损坏的问题,就可以采取切换音频线路的方法避免功能无法使用。
为实现上述目的,本发明提供如下技术方案:
一种基于语音鼠标的录音线路切换方法,包括以下步骤:
步骤1:语音鼠标的咪头接收用户录音后,使用USB音频传输将音频信号传入电脑的录音线路中;
步骤2:软件启动后,首先软件会判断默认录音线路是否被修改,如果被修改,软件会监听修改后的录音线路,通过修改后的录音线路采集音频信息,否则沿用以前的录音线路;
步骤3:用户按下语音键后,软件会获取指定录音线路的音频信息,并进行音频的VID检测,检测是否有声音。如果声音为“0”,将会提示用户“录音过小,请说大点声”;如果有声音,则进行语音识别。
步骤4:用户发现鼠标总是提示录音异常,在软件中手动修改软件中的录音设置项,将录音线路修改成笔记本自带的麦克风线路或者其他的录音线路。并重启软件。
优选的,步骤1所述的语音鼠标的USB音频传输包括以下步骤:
步骤11:鼠标咪头接收音频信号,并将录音数据通过鼠标内部电路传输至USB端口;
步骤21:通过有线连接或者无线接收器的方式通过USB端口将音频数据传输至操作***的声卡音频驱动;
步骤31:操作***的声卡音频驱动将模拟音频信号转化为数字信号,并通过声音控制器输出至操作***的录音线路中;
步骤41:软件找到对应的鼠标录音线路,并读取输出的音频信息。
优选的,步骤2所述的语音鼠标的采集音频信息包括以下步骤:
步骤21:软件开启后检测录音线路是否被修改,并不断检测用户语音键的按下键值,来决定软件是否开启录音;
步骤22:如果软件开启录音后,会不断从音频线路读取音频数组,并按字节流的形式将音频数组写入pcm文件中,实现音频从录音线路的采集,软件同时会不断将音频数组通过接口传给云端的语音识别接口进行语音识别;
步骤23:如果检测到用户抬起语音键,将剩余的音频读取完成后,结束录音。
为解决上述技术问题,本发明还提供基一种于语音鼠标的录音线路切换***,包括:语音鼠标,其通过咪头接收用户录音,并将音频数据传输至电脑的录音线路中,所述录音线路通过内置软件找到对应的鼠标录音线路,并读取输出的音频信息。
优选的,电脑的录音线路包括声卡音频驱动,咪头通过有线连接或者无线接收器的方式通过USB端口将音频数据传输至操作***的声卡音频驱动。
优选的,操作***的声卡音频驱动将模拟音频信号转化为数字信号,并通过声音控制器输出至操作***的录音线路中。
为解决上述技术问题,本发明还提供基一种基于语音鼠标的录音线路切换装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一项所述的基于语音鼠标的录音线路切换方法的步骤。
为解决上述技术问题,本发明还提供基一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的基于语音鼠标的录音线路切换方法的步骤。
与现有技术相比,本发明的有益效果是:
本发明提供一种基于语音鼠标的录音线路修改方法,该方法可以应用于计算机端软件,配以相应的硬件设备。当语音鼠标的咪头无法工作后,可以切换到其他的录音线路,并配合语音鼠标的语音键进行使用。当存在拾音效果更好的麦克风时,选用更好的录音线路进行拾音可以让语音鼠标的效果更好。
附图说明
图1为本发明基于语音鼠标的录音线路切换方法流程图。
图2为本发明实施例1基于语音鼠标的USB音频传输的具体流程图。
图3为本发明实施例2基于语音鼠标的采集音频信息的具体流程图。
图4为本发明实施例3基于语音鼠标的录音线路修改的具体流程图。
图5为本发明基于语音鼠标的录音线路切换***结构示意图。
图6为本发明基于语音鼠标的录音线路切换装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1~6,本发明提供一种技术方案:
一种基于语音鼠标的录音线路切换方法,该方法包括:在语音鼠标端实现音频信号的采集,并将音频通过USB端口传输至电脑。电脑通过声卡驱动将模拟音频信号转化为数字信号并通过录音线路输出。软件采集鼠标的录音线路并在语音鼠标拾音装置失效的情况下提示用户,用户通过切换至电脑的其他录音线路来接收音频信息。电脑端软件将采集后的音频信息进行语音识别并通过语义理解实现智能操控。
本发明利用语音信号的处理技术结合硬件设备,实现在语音鼠标无法拾音的情况下,可以将拾音线路切换为其他麦克风设备,保证了语音鼠标的语音功能正常使用。
实施例1
图1-2为本发明基于语音鼠标的USB音频传输提供的具体实施例1的整体流程图。如图2所示,一种语音鼠标的USB音频传输,包括以下步骤:
步骤1:鼠标咪头接收音频信号,并将录音数据通过鼠标内部电路传输至USB端口。
步骤2:通过有线连接或者无线接收器的方式通过USB端口将音频数据传输至操作***的声卡音频驱动。
步骤3:操作***的声卡音频驱动将模拟音频信号转化为数字信号,并通过声音控制器输出至操作***的录音线路中。
步骤4:软件找到对应的鼠标录音线路,并读取输出的音频信息。
实施例2
图3为本发明基于语音鼠标的采集音频信息的具体实施例2的整体流程图。如图3所示,一种基于语音鼠标的采集音频信息流程,包括以下步骤:
步骤1:软件开启后检测录音线路是否被修改,并不断检测用户语音键的按下键值,来决定软件是否开启录音。
步骤2:如果软件开启录音后,会不断从音频线路读取音频数组,并按字节流的形式将音频数组写入pcm文件中,实现音频从录音线路的采集。软件同时会不断将音频数组通过接口传给云端的语音识别接口进行语音识别。
步骤3:如果检测到用户抬起语音键,将剩余的音频读取完成后,结束录音。
实施例3
图4为本发明基于语音鼠标的录音线路修改提供的具体实施例3的整体流程图。如图4所示,一种基于语音鼠标的录音线路修改方法,包括以下步骤:
步骤1:语音鼠标的咪头接收用户录音后,使用USB音频传输将音频信号传入电脑的录音线路中;
步骤2:软件启动后,首先软件会判断默认录音线路是否被修改,如果被修改,软件会监听修改后的录音线路,通过修改后的录音线路采集音频信息,否则沿用以前的录音线路;
步骤3:用户按下语音键后,软件会获取指定录音线路的音频信息,并进行音频的VID检测,检测是否有声音。如果声音为“0”,将会提示用户“录音过小,请说大点声”;如果有声音,则进行语音识别。
步骤4:用户发现鼠标总是提示录音异常,在软件中手动修改软件中的录音设置项,将录音线路修改成笔记本自带的麦克风线路或者其他的录音线路。并重启软件。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于语音鼠标的录音线路切换方法,其特征在于,包括以下步骤:
步骤1:语音鼠标的咪头接收用户录音后,使用USB音频传输将音频信号传入电脑的录音线路中;
步骤2:软件启动后,首先软件会判断默认录音线路是否被修改,如果被修改,软件会监听修改后的录音线路,通过修改后的录音线路采集音频信息,否则沿用以前的录音线路;
步骤3:用户按下语音键后,软件会获取指定录音线路的音频信息,并进行音频的VID检测,检测是否有声音,如果声音为“0”,将会提示用户“录音过小,请说大点声”;如果有声音,则进行语音识别;
步骤4:用户发现鼠标总是提示录音异常,在软件中手动修改软件中的录音设置项,将录音线路修改成笔记本自带的麦克风线路或者其他的录音线路,并重启软件。
2.根据权利要求1所述的一种基于语音鼠标的录音线路切换方法,其特征在于,步骤1所述的语音鼠标的USB音频传输包括以下步骤:
步骤11:鼠标咪头接收音频信号,并将录音数据通过鼠标内部电路传输至USB端口;
步骤21:通过有线连接或者无线接收器的方式通过USB端口将音频数据传输至操作***的声卡音频驱动;
步骤31:操作***的声卡音频驱动将模拟音频信号转化为数字信号,并通过声音控制器输出至操作***的录音线路中;
步骤41:软件找到对应的鼠标录音线路,并读取输出的音频信息。
3.根据权利要求1所述的一种基于语音鼠标的录音线路切换方法,其特征在于,步骤2所述的语音鼠标的采集音频信息包括以下步骤:
步骤21:软件开启后检测录音线路是否被修改,并不断检测用户语音键的按下键值,来决定软件是否开启录音;
步骤22:如果软件开启录音后,会不断从音频线路读取音频数组,并按字节流的形式将音频数组写入pcm文件中,实现音频从录音线路的采集,软件同时会不断将音频数组通过接口传给云端的语音识别接口进行语音识别;
步骤23:如果检测到用户抬起语音键,将剩余的音频读取完成后,结束录音。
4.一种基于语音鼠标的录音线路切换***,其特征在于,包括:语音鼠标,其通过咪头接收用户录音,并将音频数据传输至电脑的录音线路中,所述录音线路通过内置软件找到对应的鼠标录音线路,并读取输出的音频信息。
5.根据权利要求4所述的一种基于语音鼠标的录音线路切换***,其特征在于,电脑的录音线路包括声卡音频驱动,咪头通过有线连接或者无线接收器的方式通过USB端口将音频数据传输至操作***的声卡音频驱动。
6.根据权利要求5所述的一种基于语音鼠标的录音线路切换***,其特征在于,操作***的声卡音频驱动将模拟音频信号转化为数字信号,并通过声音控制器输出至操作***的录音线路中。
7.一种基于语音鼠标的录音线路切换装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1~3任一项所述的基于语音鼠标的录音线路切换方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~3任一项所述的基于语音鼠标的录音线路切换方法的步骤。
CN201911200276.3A 2019-11-29 2019-11-29 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质 Pending CN110989965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911200276.3A CN110989965A (zh) 2019-11-29 2019-11-29 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911200276.3A CN110989965A (zh) 2019-11-29 2019-11-29 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质

Publications (1)

Publication Number Publication Date
CN110989965A true CN110989965A (zh) 2020-04-10

Family

ID=70088370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911200276.3A Pending CN110989965A (zh) 2019-11-29 2019-11-29 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN110989965A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111899768A (zh) * 2020-07-16 2020-11-06 合肥原点信息技术有限公司 一种音频档案数字转化***及方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013055545A (ja) * 2011-09-05 2013-03-21 Honda Motor Co Ltd ハンズフリー通話装置
CN104658536A (zh) * 2015-03-09 2015-05-27 深圳酷派技术有限公司 录音方式切换方法、录音方式切换***和终端
CN104754463A (zh) * 2013-12-31 2015-07-01 环达电脑(上海)有限公司 内外置麦克风信号切换的方法
CN105898028A (zh) * 2015-12-30 2016-08-24 乐视致新电子科技(天津)有限公司 智能手机录音源切换***及方法
CN107018465A (zh) * 2016-01-27 2017-08-04 环旭电子股份有限公司 适用于安卓***的无间隙录音方法
CN107360495A (zh) * 2016-05-10 2017-11-17 环旭电子股份有限公司 适用于安卓***的减少外接麦克风插拔噪音的方法
CN206672078U (zh) * 2017-04-19 2017-11-24 上海魅声电子科技有限公司 一种具备语音控制功能的声卡
JP2018007053A (ja) * 2016-07-04 2018-01-11 アルパイン株式会社 車載機器及び車載機器における処理方法
CN206907001U (zh) * 2017-06-19 2018-01-19 深圳市相位科技有限公司 一种可实时传输录音文件的多功能鼠标
CN206977676U (zh) * 2017-07-14 2018-02-06 德州学院 电脑音频高保真录制***
CN109599110A (zh) * 2018-12-29 2019-04-09 安徽咪鼠科技有限公司 一种智能语音鼠标语音键控制方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013055545A (ja) * 2011-09-05 2013-03-21 Honda Motor Co Ltd ハンズフリー通話装置
CN104754463A (zh) * 2013-12-31 2015-07-01 环达电脑(上海)有限公司 内外置麦克风信号切换的方法
CN104658536A (zh) * 2015-03-09 2015-05-27 深圳酷派技术有限公司 录音方式切换方法、录音方式切换***和终端
CN105898028A (zh) * 2015-12-30 2016-08-24 乐视致新电子科技(天津)有限公司 智能手机录音源切换***及方法
CN107018465A (zh) * 2016-01-27 2017-08-04 环旭电子股份有限公司 适用于安卓***的无间隙录音方法
CN107360495A (zh) * 2016-05-10 2017-11-17 环旭电子股份有限公司 适用于安卓***的减少外接麦克风插拔噪音的方法
JP2018007053A (ja) * 2016-07-04 2018-01-11 アルパイン株式会社 車載機器及び車載機器における処理方法
CN206672078U (zh) * 2017-04-19 2017-11-24 上海魅声电子科技有限公司 一种具备语音控制功能的声卡
CN206907001U (zh) * 2017-06-19 2018-01-19 深圳市相位科技有限公司 一种可实时传输录音文件的多功能鼠标
CN206977676U (zh) * 2017-07-14 2018-02-06 德州学院 电脑音频高保真录制***
CN109599110A (zh) * 2018-12-29 2019-04-09 安徽咪鼠科技有限公司 一种智能语音鼠标语音键控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111899768A (zh) * 2020-07-16 2020-11-06 合肥原点信息技术有限公司 一种音频档案数字转化***及方法

Similar Documents

Publication Publication Date Title
CN107591151B (zh) 远场语音唤醒方法、装置和终端设备
US11024332B2 (en) Cloud-based speech processing method and apparatus
US10601599B2 (en) Voice command processing in low power devices
JP6683234B2 (ja) 音声データ処理方法、装置、設備及びプログラム
JP7324313B2 (ja) 音声対話方法及び装置、端末、並びに記憶媒体
US9613626B2 (en) Audio device for recognizing key phrases and method thereof
US11502859B2 (en) Method and apparatus for waking up via speech
JP2019185011A (ja) アプリケーションプログラムをウェイクアップする処理方法、装置及び記憶媒体
CN108962240A (zh) 一种基于耳机的语音控制方法及***
CN107886944B (zh) 一种语音识别方法、装置、设备及存储介质
JP2019117623A (ja) 音声対話方法、装置、デバイス及び記憶媒体
CN109240107B (zh) 一种电器设备的控制方法、装置、电器设备和介质
JP2020112778A (ja) 音声対話設備のウェイクアップ方法、装置、設備及び記憶媒体
US11587560B2 (en) Voice interaction method, device, apparatus and server
JP2020016875A (ja) 音声インタラクション方法、装置、設備、コンピュータ記憶媒体及びコンピュータプログラム
JP2019159305A (ja) ファーフィールド音声機能の実現方法、設備、システム及び記憶媒体
CN110780741B (zh) 模型训练方法、应用运行方法、装置、介质及电子设备
CN108681440A (zh) 一种智能设备音量控制方法及***
CN104247280A (zh) 话音控制的通信连接
CN109412544B (zh) 一种智能穿戴设备的语音采集方法、装置及相关组件
CN110968353A (zh) 中央处理器的唤醒方法、装置、语音处理器以及用户设备
CA3103595A1 (en) Systems and methods for avoiding inadvertently triggering a voice assistant
CN110989965A (zh) 一种基于语音鼠标的录音线路切换方法、***、装置及可读存储介质
CN114596853A (zh) 控制装置及音频处理方法
WO2023143544A1 (zh) 语音控制方法、装置、设备、介质及智能语音采集***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200410

RJ01 Rejection of invention patent application after publication