CN103327156A - 一种语音文件输出方法及装置 - Google Patents

一种语音文件输出方法及装置 Download PDF

Info

Publication number
CN103327156A
CN103327156A CN2013102562564A CN201310256256A CN103327156A CN 103327156 A CN103327156 A CN 103327156A CN 2013102562564 A CN2013102562564 A CN 2013102562564A CN 201310256256 A CN201310256256 A CN 201310256256A CN 103327156 A CN103327156 A CN 103327156A
Authority
CN
China
Prior art keywords
currency
voice document
parameter
parameters
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013102562564A
Other languages
English (en)
Inventor
高舜东
管静娴
谢鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN2013102562564A priority Critical patent/CN103327156A/zh
Publication of CN103327156A publication Critical patent/CN103327156A/zh
Priority to PCT/CN2014/080620 priority patent/WO2014206275A1/en
Priority to US14/786,172 priority patent/US9756439B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72442User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for playing music files
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种语音文件输出方法,包括:获取语音文件;检测预先指定的参数的当前值;将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,所述目标文件包括所述语音文件或者所述语音文件转换后的文本文件。相应地,本发明实施例还公开了相关的装置。本发明实施例可以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。

Description

一种语音文件输出方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种语音文件输出方法及装置。
背景技术
目前的通信终端都可以支持语音听写应用,即可以接收语音文件,并播放该语音文件以向用户展现该语音文件的内容,或者还有些终端可以将语音文件转换为文本文件以向用户展现该语音文件的内容。但目前这些技术都是很单一的,即都需要预先设置好是播放语音文件,还是将语音文件转换为文本文件,例如,当通信终端的外部噪音很大时,通信终端可能也是播放语音文件,这样用户可能听不清楚该语音文件。即现有技术中,无法根据特定参数(例如:噪音参数)的当前值调整语音文件的内容的输出方式,即无法实现灵活地以不同的方式向用户展现该语音文件的内容,用户读取语音文件的内容比较难。
发明内容
本发明实施例提供了一种语音文件输出方法及装置,可以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
第一方面,本发明实施例提供的一种语音文件输出方法,包括:
获取语音文件;
检测预先指定的参数的当前值;
将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
第二方面,本发明实施例提供一种语音文件输出装置,包括:获取单元、检测单元和输出单元,其中:
所述获取单元,用于获取待处理的语音文件;
所述检测单元,用于检测预先指定的参数的当前值;
所述输出单元,用于将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
上述技术方案中,获取语音文件;检测预先指定的参数的当前值;将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。这样可以实现根据预先指定的参数的当前值输出述语音文件或者所述语音文件转换后的文本文件,以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种语音文件输出方法的流程示意图;
图2是本发明实施例提供的另一种语音文件输出方法的流程示意图;
图3是本发明实施例一个可选的举例示意图;
图4是本发明实施例提供的一种语音文件输出装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种语音文件输出方法的流程示意图,如图1所示,包括以下步骤:
S101、获取语音文件。
具体可以是通过网络获取到语音文件,例如:通过即时通信客户端获取到通信平台发送的语音文件;或者通过录音装置获取的语音文件,例如:距离相近的两终端之间传递语音文件,或者从存储设备中获取的语音文件。其中,本实施例对上述语音文件不作限定,例如:可以是一段对话,或者一段音乐等。
S102、检测预先指定的参数的当前值。
其中,上述预先指定的参数可以是通过接收用户输入的操作而指定的参数,或者通过接收到网络传输的指令而指定的参数等。上述参数具体可以是可能会影响用户读取上述语音文件的参数。具体可以是实现所述方法的通信终端的参数,例如,该通信终端的设置参数;或者实现所述方法的通信终端的外部环境的参数,例如:该通信终端的外部噪音。
S103、将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,所述目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
其中,与所述当前值对应的目标文件可以是指预设的映射关系所指示的与所述当前值对应的目标文件;所述映射关系是指所述参数的值与输出语音文件的映射关系,和/或所述映射关系是指所述参数的值与输出文本文件的映射关系。
当与所述当前值对应的目标文件为上述语音文件时,步骤S103就是直接播放上述语音文件;当与所述当前值对应的目标文件为所述语音文件转换后的文本文件,步骤S103就可以是将上述语音文件转换为文本文件,而输出该文本文件。
所述方法可以应用于任何支持语音听写功能的通信终端,例如:板电脑、手机、电子阅读器、遥控器、个人计算机(Personal Computer,PC)、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。
上述技术方案中,获取语音文件;检测预先指定的参数的当前值;将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。这样可以实现根据预先指定的参数的当前值输出述语音文件或者所述语音文件转换后的文本文件,以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
图2是本发明实施例提供的另一种语音文件输出方法的流程示意图,如图2所示,包括以下步骤:
S201、获取语音文件。
具体可以是通过网络获取到语音文件,例如:通过即时通信客户端获取到通信平台发送的语音文件;或者通过录音装置获取的语音文件,例如:距离相近的两终端之间传递语音文件,或者从存储设备中获取的语音文件。其中,本实施例对上述语音文件不作限定,例如:可以是一段对话,或者一段音乐等。
S202、检测预先指定的参数的当前值。
其中,上述预先指定的参数可以是通过接收用户输入的操作而指定的参数,或者通过接收到网络传输的指令而指定的参数等。上述参数具体可以是可能会影响用户读取上述语音文件的参数。具体可以是实现所述方法的通信终端的参数,例如,该通信终端的设置参数;或者实现所述方法的通信终端的外部环境的参数,例如:该通信终端的外部噪音。
S203、将所述当前值与一个预设条件进行比较,并根据比较结果输出预设的映射关系指示的与所述当前值对应的目标文件;其中,所述目标文件包括所述语音文件或者所述语音文件转换后的文本文件,所述映射关系是指所述参数的值与输出语音文件的映射关系,和/或所述映射关系是指所述参数的值与输出文本文件的映射关系。
当与所述当前值对应的目标文件为上述语音文件时,步骤S203就是直接播放上述语音文件;当与所述当前值对应的目标文件为所述语音文件转换后的文本文件,步骤S203就可以是将上述语音文件转换为文本文件,而输出该文本文件。
作为一种可选的实施方式,上述参数可以包括如下至少一项:
环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数。
当上述参数包括环境噪音参数;
步骤S202可以包括:
检测环境噪音参数的噪音值。
可以通过麦克风(Microphone,MIC)获取当前环境的声响,即当前环境的噪声。
步骤S203可以包括:
当所述噪音值大于第一阈值时,输出所述文本文件;当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。具体可以是在所述噪音值大于第一阈值时,输出所述文本文件将上述语音文件转换为文本文件,并显示该文本文件,当所述噪音值小于或者等于所述第一阈值时,直接播放所述语音文件。
这样步骤S203就可以实现在噪音值大的环境输出文本文件,这样用户就在读取该文本文件时,就可以忽略当前环境的噪音。例如:当用户携带用户通信终端处于闹市等场景时,就可以将语音文件转换为文本文件,并输出该文本文件。步骤S203就可以实现在噪音值小的环境播放语音文件,例如:当用户携带用户通信终端处于安静的场景时,就可以直接播放语音文件。
当上述参数包括禁音设置参数;
步骤S202可以包括:
检测禁音设置参数的当前值。
步骤S203可以包括:
当所述禁音设置参数的当前值满足禁音状态下的预设条件时,输出所述文本文件;当所述禁音设置参数的当前值满足非禁音状态下的预设条件时,输出所述语音文件。
当禁音设置参数的当前值表示为禁音状态时,就可以理解为用户当前所有的环境需要避免生产声音或者需要防止打扰别人,例如:用户携带通信终端处于会议室等一些其它的需要禁音的环境时,就可以将语音文件转换为文本文件,这样在不发出声音的情况下用户就可以读取到上述语音文件的内容。
当上述参数包括铃声设置参数;
步骤S202可以包括:
检测铃声设置参数的铃声音量值。
步骤S203可以包括:
当所述铃声音量值小于或者等于第二阈值时,输出所述文本文件;当所述铃声音量值大于所述第二阈值时,输出所述语音文件。
当铃声音量值小于或者等于第二阈值时,即用户将通信终端的铃声音量设置得很小时,就说明用户当前所处的环境可能是不充许发生较大的声音。这样步骤S203就可以将上述语音文件转换为文本文件,并显示该文本文件。当铃声音量值大于第二阈值时,即用户将通信终端的铃声音量设置得比较大时,即用户当前所处的环境不需要考虑声音的大小,步骤S203就可以直接播放上述语音文件。
当上述参数包括音视频播放参数;
步骤S202可以包括:
检测音视频播放参数的当前值。
步骤S203可以包括:
当所述音视频播放参数的当前值满足当前正在播放音视频的预设条件时,输出所述文本文件;当所述音视频播放参数的当前值满足当前未播放音视频的预设条件时,输出所述语音文件。其中,上述音视频播放具体可以是音频播放或者视频播放。
当所述音视频播放参数的当前值表示当前正在播放音视频时,即实现所述方法的通信终端正在播放音频或者视频,这样用户可能就不方便收听其它语音,步骤S203就可以将上述语音文件转换为文本文件,并显示该文本文件,这样用户在收听或者观看音频视时,还可以读取上述语音文件的内容。
当上述参数包括获取所述语音文件客户端的设置参数;
步骤S202可以包括:
检测获取所述语音文件的客户端的参数的当前值。
步骤S203可以包括:
当所述客户端的设置参数的当前值满足所述客户端不适合输出语音文件的预设条件时,输出所述文本文件;当所述客户端的设置参数的当前值满足所述客户端适合输出语音文件的预设条件时,输出所述语音文件。
所述客户端不适合输出语音文件具体可以是该客户端设置为禁音状态,或者该客户端的提醒消息设置为禁音状态,即该客户端当前状态可能是适合输出语音文件,这样步骤S203就可以将上述语音文件转换为文本文件,并显示该文本文件。所述客户端适合输出语音文件具体可以是该客户端登录的通信账号为在线状态,或者该客户端的提醒消息设置语音提醒,这样步骤S203就可以直接播放上述语音文件。
上述仅详细介绍了上述参数包括一种预先指定的参数时,步骤S202和步骤S203的实现方式。本实施例中,上述参数可以包括:环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数中的一种或者多种。例如:上述参数包括环境噪音参数、禁音设置参数时,步骤S202可以包括:
检测环境噪音参数的噪音量和禁音设置参数的当前值。
步骤S203可以包括:
判断所述噪音值是否大于上述第一阈值,若否,则输出所述语音文件;若是,则判断所述禁音设置参数的当前值是否表示为禁音状态;
当判断所述禁音设置参数的当前值表示为禁音状态,则输出所述文本文件;当判断所述禁音设置参数的当前值表示为非禁音状态,则输出所述语音文件。
例如:上述参数包括铃声设置参数、禁音设置参数时,步骤S202可以包括:
检测铃声设置参数的铃声音量值和环境噪音参数。
步骤S203可以包括:
判断所述铃声音量值是否大于所述第二阈值,若是,则输出所述语音文件;若否,则判断所述噪音值是否大于第一阈值;
当所述噪音值大于第一阈值时,输出所述文本文件;当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。
当然,本实施例中上述参数包括但不限于上述环境噪音参数、禁音设置参数的组合,上述铃声设置参数、禁音设置参数的结合,例如上述参数还可以包括铃声设置参数和音视频播放参数组合,或者铃声设置参数和和获取所述语音文件的客户端的设置参数的组合等。
所述方法可以应用于任何支持语音听写功能的通信终端,例如:板电脑、手机、电子阅读器、遥控器、PC、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。
上述技术方案中,在上述实施例的基础上实现了多种可选的实施方式,且都可以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
下面以一个具体的实例进行举例说明,请参考图3:
S301、获取语音文件。
S302、检查应用状态设置。该应用状态具体可以是获取上述语音文件客户端的状态或者实现该方法的通信终端的状态。
S303、判断应用状态设置是否为禁音状态,若是,则执行步骤S304;若否,则执行步骤S305。
S305、检测铃声设置和提醒设置。
S306、判断设置的铃声是否小于某个阈值,若是,则执行步骤S304,若否,则执行步骤S307。
S307、检测外界噪音。
S308、判断外界噪音是否达到某个阈值,若是,则执行步骤S304,若否,则执行步骤S309。
S304、输出文本。具体可以将上述语音文件转换为文本文件,并输出该文本文件。
S309、播放上述语音文件。
这样可以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例一至二实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例一和实施例二。
图4是本发明实施例提供的一种语音文件输出装置的结构示意图,如图4所示,包括:获取单元41、检测单元42和输出单元43,其中:
获取单元41,用于获取待处理的语音文件。
具体可以是通过网络获取到语音文件,例如:通过即时通信客户端获取到通信平台发送的语音文件;或者通过录音装置获取的语音文件,例如:距离相近的两终端之间传递语音文件。其中,本实施例对上述语音文件不作限定,例如:可以是一段对话,或者一段音乐等。
检测单元42,用于检测预先指定的参数的当前值。
其中,上述预先指定的参数可以是通过接收用户输入的操作而指定的参数,或者通过接收到网络传输的指令而指定的参数等。上述参数具体可以是可能会影响用户读取上述语音文件的参数。具体可以是实现所述装置的参数,例如,该装置的设置参数;或者实现所述装置的外部环境的参数,例如:该装置的外部噪音。
输出单元43,用于将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,所述目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
其中,与所述当前值对应的目标文件可以是指预设的映射关系所指示的与所述当前值对应的目标文件;所述映射关系是指所述参数的值与输出语音文件的映射关系,和/或所述映射关系是指所述参数的值与输出文本文件的映射关系。
当与所述当前值对应的目标文件为上述语音文件时,输出单元43就是直接播放上述语音文件;当与所述当前值对应的目标文件为所述语音文件转换后的文本文件,输出单元43就可以是将上述语音文件转换为文本文件,而输出该文本文件。
作为一种可选的实施方式,上述参数可以包括如下至少一项:
环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数。
当上述参数包括环境噪音参数;
检测单元42还可以用于检测环境噪音参数的噪音值。
输出单元43还可以用于当所述噪音值大于第一阈值时,输出所述文本文件;以及用于当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。具体可以是在所述噪音值大于第一阈值时,输出所述文本文件将上述语音文件转换为文本文件,并显示该文本文件,当所述噪音值小于或者等于所述第一阈值时,直接播放所述语音文件。
这样输出单元43就可以实现在噪音值大的环境输出文本文件,这样用户就在读取该文本文件时,就可以忽略当前环境的噪音。例如:当用户携带用户通信终端处于闹市等场景时,就可以将语音文件转换为文本文件,并输出该文本文件。输出单元43就可以实现在噪音值小的环境播放语音文件,例如:当用户携带用户通信终端处于安静的场景时,就可以直接播放语音文件。
当上述参数包括禁音设置参数;
检测单元42还可以用于检测禁音设置参数的当前值。
输出单元43还可以用于当所述禁音设置参数的当前值满足禁音状态下的预设条件时,输出所述文本文件;以及用于当所述禁音设置参数的当前值满足非禁音状态下的预设条件时,输出所述语音文件。
当禁音设置参数的当前值表示为禁音状态时,就可以理解为用户当前所有的环境需要避免生产声音或者需要防止打扰别人,例如:用户携带通信终端处于会议室等一些其它的需要禁音的环境时,就可以将语音文件转换为文本文件,这样在不发出声音的情况下用户就可以读取到上述语音文件的内容。
当上述参数包括铃声设置参数;
检测单元42还可以用于检测铃声设置参数的铃声音量值;
输出单元43还可以用于当所述铃声音量值小于或者等于第二阈值时,输出所述文本文件;以及用于当所述铃声音量值大于所述第二阈值时,输出所述语音文件。
当铃声音量值小于或者等于第二阈值时,即用户将通信终端的铃声音量设置得很小时,就说明用户当前所处的环境可能是不充许发生较大的声音。这样输出单元43就可以将上述语音文件转换为文本文件,并显示该文本文件。当铃声音量值大于第二阈值时,即用户将通信终端的铃声音量设置得比较大时,即用户当前所处的环境不需要考虑声音的大小,输出单元43就可以直接播放上述语音文件。
当上述参数包括音视频播放参数;
检测单元42还可以用于检测音视频播放参数的当前值;
输出单元43还可以用于当所述音视频播放参数的当前值满足当前正在播放音视频的预设条件时,输出所述文本文件;以及用于当所述音视频播放参数的当前值满足当前未播放音视频的预设条件时,输出所述语音文件。
当所述音视频播放参数的当前值表示当前正在播放音视频时,即实现所述方法的通信终端正在播放音频或者视频,这样用户可能就不方便收听其它语音,输出单元43就可以将上述语音文件转换为文本文件,并显示该文本文件,这样用户在收听或者观看音频视时,还可以读取上述语音文件的内容。
当上述参数包括获取所述语音文件客户端的设置参数;
检测单元42还可以用于检测获取所述语音文件的客户端的参数的当前值;
输出单元43还可以用于当所述客户端的设置参数的当前值满足所述客户端不适合输出语音文件的预设条件时,输出所述文本文件;以及用于当所述客户端的设置参数的当前值满足所述客户端适合输出语音文件的预设条件时,输出所述语音文件。
所述客户端不适合输出语音文件具体可以是该客户端设置为禁音状态,或者该客户端的提醒消息设置为禁音状态,即该客户端当前状态可能是适合输出语音文件,这样输出单元43就可以将上述语音文件转换为文本文件,并显示该文本文件。所述客户端适合输出语音文件具体可以是该客户端登录的通信账号为在线状态,或者该客户端的提醒消息设置语音提醒,这样步骤S203就可以直接播放上述语音文件。
上述仅详细介绍了上述参数包括一种预先指定的参数时,检测单元42和步骤输出单元43的实现方式。本实施例中,上述参数可以包括:环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数中的一种或者多种。例如:上述参数包括环境噪音参数、禁音设置参数时,检测单元还可以用于检测环境噪音参数的噪音量和禁音设置参数的当前值。
输出单元43还可以用于判断所述噪音值是否大于上述第一阈值,若否,则输出所述语音文件;若是,则判断所述禁音设置参数的当前值是否表示为禁音状态;当判断所述禁音设置参数的当前值表示为禁音状态,则输出所述文本文件;当判断所述禁音设置参数的当前值表示为非禁音状态,则输出所述语音文件。
例如:上述参数包括铃声设置参数、禁音设置参数时,检测单元42还可以用于检测铃声设置参数的铃声音量值和环境噪音参数。
输出单元43还可以用于判断所述铃声音量值是否大于所述第二阈值,若是,则输出所述语音文件;若否,则判断所述噪音值是否大于第一阈值;当所述噪音值大于第一阈值时,输出所述文本文件;当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。
当然,本实施例中上述参数包括但不限于上述环境噪音参数、禁音设置参数的组合,上述铃声设置参数、禁音设置参数的结合,例如上述参数还可以包括铃声设置参数和音视频播放参数组合,或者铃声设置参数和和获取所述语音文件的客户端的设置参数的组合等。
所述装置可以是任何支持语音听写功能的通信终端,例如:板电脑、手机、电子阅读器、遥控器、PC、笔记本电脑、车载设备、网络电视、可穿戴设备等具有网络功能的智能设备。
上述技术方案中,获取语音文件;检测预先指定的参数的当前值;将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。这样可以实现根据预先指定的参数的当前值输出述语音文件或者所述语音文件转换后的文本文件,以根据特定参数的当前值调整语音文件的内容的输出方式,从而实现灵活地以不同的方式向用户展现语音文件的内容,方便用户读取语音文件的内容。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序指令控制相关硬件来完成,其中,完成图1或图2或图3所示的实施例的方法的程序可存储于一计算机可读取存储介质中,如终端的存储介质中,该程序可被终端中的至少一个处理器执行,以实现包括如图1或图2或图3所示的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (20)

1.一种语音文件输出方法,其特征在于,包括:
获取语音文件;
检测预先指定的参数的当前值;
将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
2.如权利要求1所述的方法,其特征在于,所述参数包括如下至少一项:
环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数。
3.如权利要求2所述的方法,其特征在于,所述参数包括环境噪音参数;
所述检测预先指定的参数的当前值,包括:
检测环境噪音参数的噪音值。
4.如权利要求3所述的方法,其特征在于,所述将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,包括:
当所述噪音值大于第一阈值时,输出所述文本文件;
当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。
5.如权利要求2所述的方法,其特征在于,所述参数包括禁音设置参数;
所述检测预先指定的参数的当前值,包括:
检测禁音设置参数的当前值。
6.如权利要求5所述的方法,其特征在于,所述将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,包括:
当所述禁音设置参数的当前值满足禁音状态下的预设条件时,输出所述文本文件;
当所述禁音设置参数的当前值满足非禁音状态下的预设条件时,输出所述语音文件。
7.如权利要求2所述的方法,其特征在于,所述参数包括铃声设置参数;
所述检测预先指定的参数的当前值,包括:
检测铃声设置参数的铃声音量值。
8.如权利要求7所述的方法,其特征在于,所述将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,包括:
当所述铃声音量值小于或者等于第二阈值时,输出所述文本文件;
当所述铃声音量值大于所述第二阈值时,输出所述语音文件。
9.如权利要求2所述的方法,其特征在于,所述参数包括音视频播放参数;
所述检测预先指定的参数的当前值,包括:
检测音视频播放参数的当前值。
10.如权利要求9所述的方法,其特征在于,所述将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,包括:
当所述音视频播放参数的当前值满足当前正在播放音视频的预设条件时,输出所述文本文件;
当所述音视频播放参数的当前值满足当前未播放音视频的预设条件时,输出所述语音文件。
11.如权利要求2所述的方法,其特征在于,所述参数包括获取所述语音文件客户端的设置参数;
所述检测预先指定的参数的当前值,包括:
检测获取所述语音文件的客户端的参数的当前值。
12.如权利要求11所述的方法,其特征在于,所述将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件,包括:
当所述客户端的设置参数的当前值满足所述客户端不适合输出语音文件的预设条件时,输出所述文本文件;
当所述客户端的设置参数的当前值满足所述客户端适合输出语音文件的预设条件时,输出所述语音文件。
13.一种语音文件输出装置,其特征在于,包括:获取单元、检测单元和输出单元,其中:
所述获取单元,用于获取待处理的语音文件;
所述检测单元,用于检测预先指定的参数的当前值;
所述输出单元,用于将所述当前值与一个预设条件进行比较,并根据比较结果输出与所述当前值对应的目标文件;其中,该目标文件包括所述语音文件或者所述语音文件转换后的文本文件。
14.如权利要求13所述的装置,其特征在于,所述参数包括如下至少一项:
环境噪音参数、禁音设置参数、铃声设置参数、音视频播放参数和获取所述语音文件的客户端的设置参数。
15.如权利要求14所述的装置,其特征在于,所述参数包括环境噪音参数;
所述检测单元还用于检测环境噪音参数的噪音值;
所述输出单元还用于当所述噪音值大于第一阈值时,输出所述文本文件;以及用于当所述噪音值小于或者等于所述第一阈值时,输出所述语音文件。
16.如权利要求14所述的装置,其特征在于,所述参数包括禁音设置参数;
所述检测单元还用于检测禁音设置参数的当前值;
所述输出单元还用于当所述禁音设置参数的当前值满足禁音状态下的预设条件时,输出所述文本文件;以及用于当所述禁音设置参数的当前值满足非禁音状态下的预设条件时,输出所述语音文件。
17.如权利要求14所述的装置,其特征在于,所述参数包括铃声设置参数;
所述检测单元还用于检测铃声设置参数的铃声音量值;
所述输出单元还用于当所述铃声音量值小于或者等于第二阈值时,输出所述文本文件;以及用于当所述铃声音量值大于所述第二阈值时,输出所述语音文件。
18.如权利要求14所述的装置,其特征在于,所述参数包括音视频播放参数;
所述检测单元还用于检测音视频播放参数的当前值;
所述输出单元还用于当所述音视频播放参数的当前值满足当前正在播放音视频的预设条件时,输出所述文本文件;以及用于当所述音视频播放参数的当前值满足当前未播放音视频的预设条件时,输出所述语音文件。
19.如权利要求14所述的装置,其特征在于,所述参数包括获取所述语音文件客户端的设置参数;
所述检测单元还用于检测获取所述语音文件的客户端的参数的当前值;
所述输出单元还用于当所述客户端的设置参数的当前值满足所述客户端不适合输出语音文件的预设条件时,输出所述文本文件;以及用于当所述客户端的设置参数的当前值满足所述客户端适合输出语音文件的预设条件时,输出所述语音文件。
20.一种计算机存储介质,其特征在于,
所述计算机存储介质存储有程序,所述程序执行时包括如权利要求1-12中任一项所述的步骤。
CN2013102562564A 2013-06-25 2013-06-25 一种语音文件输出方法及装置 Pending CN103327156A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2013102562564A CN103327156A (zh) 2013-06-25 2013-06-25 一种语音文件输出方法及装置
PCT/CN2014/080620 WO2014206275A1 (en) 2013-06-25 2014-06-24 Method and devices for outputting an audio file
US14/786,172 US9756439B2 (en) 2013-06-25 2014-06-24 Method and devices for outputting an audio file

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013102562564A CN103327156A (zh) 2013-06-25 2013-06-25 一种语音文件输出方法及装置

Publications (1)

Publication Number Publication Date
CN103327156A true CN103327156A (zh) 2013-09-25

Family

ID=49195675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013102562564A Pending CN103327156A (zh) 2013-06-25 2013-06-25 一种语音文件输出方法及装置

Country Status (3)

Country Link
US (1) US9756439B2 (zh)
CN (1) CN103327156A (zh)
WO (1) WO2014206275A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014206275A1 (en) * 2013-06-25 2014-12-31 Tencent Technology (Shenzhen) Company Limited Method and devices for outputting an audio file
CN104333649A (zh) * 2014-03-12 2015-02-04 广州三星通信技术研究有限公司 在通信终端呈现语音消息的方法及设备
CN104700836A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 一种语音识别方法和***
CN105516457A (zh) * 2015-11-24 2016-04-20 小米科技有限责任公司 通讯消息的处理方法及装置
CN105933117A (zh) * 2016-06-30 2016-09-07 浪潮集团有限公司 一种基于tpm秘钥安全存储的数据加解密装置和方法
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端
CN108173740A (zh) * 2017-11-30 2018-06-15 维沃移动通信有限公司 一种语音通信的方法和装置
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备
CN108307043A (zh) * 2017-12-28 2018-07-20 努比亚技术有限公司 语音消息转换方法、移动终端及计算机可读存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106231108B (zh) * 2016-08-10 2019-10-29 Tcl移动通信科技(宁波)有限公司 一种移动终端音量控制方法及***
US11109095B2 (en) * 2016-12-21 2021-08-31 Arris Enterprises Llc Automatic activation of closed captioning for low volume periods
CN108600526A (zh) * 2018-04-04 2018-09-28 Oppo广东移动通信有限公司 闹钟控制方法及相关产品
CN109640165B (zh) * 2018-12-20 2022-03-01 深圳Tcl新技术有限公司 音轨切换的多媒体播放方法、终端设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040017863A (ko) * 2002-08-22 2004-03-02 주식회사 팬택 이동통신단말기의 링 신호 출력 전환 장치 및 방법
CN101180673A (zh) * 2005-03-22 2008-05-14 索尼爱立信移动通讯股份有限公司 具有话音到文本转换的无线通信设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003174680A (ja) * 2001-12-06 2003-06-20 Matsushita Electric Ind Co Ltd 無線通信装置及び移動体通信システム
KR100688178B1 (ko) * 2004-12-31 2007-03-02 엘지전자 주식회사 소음인식 통화방법변경 기능이 구비된 이동통신 단말기 및통화방법 변경방법
CN1968320A (zh) * 2006-04-27 2007-05-23 华为技术有限公司 实现语音播放业务的方法
US7912187B1 (en) * 2006-06-01 2011-03-22 At&T Mobility Ii Llc Transcoding voice to/from text based on location of a communication device
CN103327156A (zh) * 2013-06-25 2013-09-25 腾讯科技(深圳)有限公司 一种语音文件输出方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040017863A (ko) * 2002-08-22 2004-03-02 주식회사 팬택 이동통신단말기의 링 신호 출력 전환 장치 및 방법
CN101180673A (zh) * 2005-03-22 2008-05-14 索尼爱立信移动通讯股份有限公司 具有话音到文本转换的无线通信设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014206275A1 (en) * 2013-06-25 2014-12-31 Tencent Technology (Shenzhen) Company Limited Method and devices for outputting an audio file
CN104700836A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 一种语音识别方法和***
CN104700836B (zh) * 2013-12-10 2019-01-29 阿里巴巴集团控股有限公司 一种语音识别方法和***
CN104333649A (zh) * 2014-03-12 2015-02-04 广州三星通信技术研究有限公司 在通信终端呈现语音消息的方法及设备
CN105516457A (zh) * 2015-11-24 2016-04-20 小米科技有限责任公司 通讯消息的处理方法及装置
CN105933117A (zh) * 2016-06-30 2016-09-07 浪潮集团有限公司 一种基于tpm秘钥安全存储的数据加解密装置和方法
CN107104887A (zh) * 2017-06-01 2017-08-29 珠海格力电器股份有限公司 一种即时消息提醒方法、装置及其用户终端
CN108173740A (zh) * 2017-11-30 2018-06-15 维沃移动通信有限公司 一种语音通信的方法和装置
CN108307043A (zh) * 2017-12-28 2018-07-20 努比亚技术有限公司 语音消息转换方法、移动终端及计算机可读存储介质
CN108281145A (zh) * 2018-01-29 2018-07-13 南京地平线机器人技术有限公司 语音处理方法、语音处理装置和电子设备

Also Published As

Publication number Publication date
US9756439B2 (en) 2017-09-05
WO2014206275A1 (en) 2014-12-31
US20160100267A1 (en) 2016-04-07

Similar Documents

Publication Publication Date Title
CN103327156A (zh) 一种语音文件输出方法及装置
US11527243B1 (en) Signal processing based on audio context
CN105630586B (zh) 一种信息处理方法及电子设备
CN106302997B (zh) 一种输出控制方法、电子设备及***
CN104811777A (zh) 智能电视的语音处理方法、处理***及智能电视
CN109982231B (zh) 一种信息处理方法、设备及存储介质
CN105204761B (zh) 一种音量调节方法及用户终端
CN107566618A (zh) 音量调节方法、装置、终端设备及存储介质
CN103324459A (zh) 一种实现usb耳麦设备的方法及***
CN103929692B (zh) 一种音频信息处理方法及电子设备
CN107145327A (zh) 一种音频播放方法、装置及智能设备
CN104660197A (zh) 一种音量控制方法及播放设备
CN115022773A (zh) 蓝牙设备音频控制方法、装置、设备及存储介质
CN113793625B (zh) 音频播放方法、装置
CN106454519A (zh) 智能电视装置的音量调节方法及其装置
CN103327173B (zh) 一种移动终端的声音控制方法及装置
CN107483734A (zh) 音量调节方法、装置、终端设备及存储介质
CN104349244A (zh) 一种信息处理方法及电子设备
CN104754099A (zh) 一种通话音量的调节方法
US9214914B2 (en) Audio device control program, mobile telephone, recording medium, and control method
CN107506168A (zh) 音量调节方法、装置、终端设备及存储介质
CN104104997A (zh) 一种电视机静音启动控制方法、装置及***
CN109600470B (zh) 一种移动终端及其发声控制方法
CN105472128A (zh) 一种通话控制方法及装置
CN106293607B (zh) 自动切换音频输出模式的方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130925