CN110691300B

CN110691300B - 音频播放设备及用于提供信息的方法

Info

Publication number: CN110691300B
Application number: CN201910865114.5A
Authority: CN
Inventors: 梁文昭
Original assignee: Lianshang Xinchang Network Technology Co Ltd
Current assignee: Lianshang Xinchang Network Technology Co Ltd
Priority date: 2019-09-12
Filing date: 2019-09-12
Publication date: 2022-07-19
Anticipated expiration: 2039-09-12
Also published as: CN110691300A

Abstract

本申请的目的是提供一种音频播放设备及用于提供信息的方法；音频播放设备基于第一输出电平播放当前音频，并采集环境声音信息；音频设备响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息或者向用户提供所述环境声音信息。本申请方便用户在周围有人提及自己感兴趣的话题时及时反应并取得之前的对话内容，从而提高团队沟通效率和用户的使用体验。

Description

音频播放设备及用于提供信息的方法

技术领域

本申请涉及通信领域，尤其涉及一种用于提供信息的技术。

背景技术

随着生活水平的提高，人们对音乐播放设备的要求也越来越高，例如人们会通过佩戴耳机、耳塞等听音设备来获得沉浸式的听音体验；在某些情况下，人们为了隔绝外界噪音，也会佩戴耳机、耳塞。此外，听音设备的生产商也会尽可能提高听音设备对环境声音的阻隔性能(被动降噪)、甚至为听音设备增加针对环境声音的有源主动降噪功能，以提升用户体验。

发明内容

本申请的一个目的是提供一种音频播放设备及用于播放音频的方法。

根据本申请的一个方面，本申请提供了一种用于提供信息的方法，应用于音频播放设备。其中，该方法包括以下步骤：

基于第一输出电平播放当前音频；

采集环境声音信息；以及

响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息；或者，

响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息。

相应地，根据本申请的另一方面，本申请提供了一种音频播放设备，其中，该设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行上述方法的操作。

本申请还提供了一种存储指令的计算机可读介质，所述指令在被计算机执行时使得所述计算机执行上述方法的操作。

根据本申请的又一方面，本申请还提供了一种音频播放设备。其中，该设备包括：

第一模块，用于基于第一输出电平播放当前音频；

第二模块，用于采集环境声音信息；以及

第三一模块，响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息；或者，

第三二模块，响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息。

随着耳机/耳塞等对外界声音的阻隔性能的提升，用户在欣赏音乐时很可能听不到周围的人跟自己说话，从而错过自己感兴趣的话题，因而体验不佳、少了诸多乐趣。鉴于此，本申请提供音频播放设备及用于播放音频的方法，采集环境声音、并基于环境声音检测特定的控制触发事件，并在检测到控制触发事件时向用户提供一段时间内的环境声音或环境声音所对应的文本，以便用户在周围有人提及自己感兴趣的话题时及时反应并取得之前的对话内容，从而提高团队沟通效率和用户的使用体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1a、图1b分别是本申请一实施例中用于播放音频的方法流程图；

图2a～图2c分别示出本申请一实施例的实施场景；

图3示出一种包含控制触发事件对应时刻的采集时间的情况；

图4a、图4b分别示出本申请一实施例中的音频播放设备的功能模块；

图5示出一种用于本申请各实施例的示例性***的功能模块。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本申请作进一步详细描述。

在本申请一个典型的配置中，终端、服务网络的设备和可信方均包括一个或多个处理器(例如，中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式，如只读存储器(Read Only Memory,ROM)或闪存(Flash Memory)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(Phase-Change Memory,PCM)、可编程随机存取存储器(Programmable Random Access Memory,PRAM)、静态随机存取存储器(Static Random-Access Memory,SRAM)、动态随机存取存储器(Dynamic Random AccessMemory,DRAM)、其他类型的随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、电可擦除可编程只读存储器(Electrically-ErasableProgrammable Read-Only Memory,EEPROM)、快闪记忆体(Flash Memory)或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

本申请所指设备包括但不限于用户设备、网络设备、或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品，例如智能手机、平板电脑等，所述移动电子产品可以采用任意操作***，如Android操作***、iOS操作***等。其中，所述网络设备包括一种能够按照事先设定或存储的指令，自动进行数值计算和信息处理的电子设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程逻辑器件(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云；在此，云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc Network)等。优选地，所述设备还可以是运行于所述用户设备、网络设备、或用户设备与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。

当然，本领域技术人员应能理解上述设备仅为举例，其他现有的或今后可能出现的设备如可适用于本申请，也应包含在本申请保护范围以内，并在此以引用方式包含于此。

在本申请的描述中，“多个”的含义是两个或者更多，除非另有明确具体的限定。

随着耳机/耳塞等对外界声音的阻隔性能的提升，用户在欣赏音乐时很可能听不到周围的人跟自己说话，从而错过自己感兴趣的话题，因而体验不佳、少了诸多乐趣。鉴于此，本申请提供一种音频播放设备及用于提供信息的方法，下面将结合附图对此进行详细介绍。

以下基于一种音频播放设备详细描述本申请的具体实施方式。其中，该音频播放设备在一些实施例中为移动电话、平板电脑、个人计算机或其他电子产品，并在一些实施例中包含用于进行数据处理的主体部分、用于采集周围环境声音的声音采集单元(例如该部分含麦克风及相应的***电路)并可选地含音频输出单元(例如耳机、耳塞、扬声器等)；其中在一些实施例中声音采集单元依附于音频输出单元，例如声音采集单元含设置在音频输出单元上的一个或若干个麦克风。本领域技术人员应能理解，现有的及今后可能出现的音频播放设备如能适用于本申请，均包含在本申请的保护范围内，并以引用的方式包含于此。例如，非限制性地，上述音频输出单元和/或声音采集单元可以内置地安排于上述主体部分，也可以通过线缆连接至上述主体部分，还可以基于蓝牙、Wi-Fi等通信协议与上述主体部分通信。

根据本申请的一个方面，本申请提供了一种用于提供信息的方法，该方法应用于音频播放设备。其中，该方法包括步骤S100、步骤S200和步骤S310，参考图1a；或者该方法包括步骤S100、步骤S200和步骤S320，参考图1b。其中，该方法在一些实施例中基于图2a示出的场景实施，其中音频播放设备10通过一副耳机输出音频，并通过麦克风(例如图2a中的第一麦克风201)采集用户所处位置的环境声音。

具体而言，在步骤S100中，音频播放设备基于第一输出电平播放当前音频(例如一段音乐)。例如，该第一输出电平对应于音频输出单元的一输出音量，例如60dB。

在步骤S200中，音频播放设备通过麦克风采集环境声音信息。其中，在一些实施例中该麦克风内置于音频播放设备，在另一些实施例中该麦克风以有线或无线方式耦接至音频播放设备。特别地，在一些实施例中，该麦克风依附于外置的音频输出单元(例如上述耳机)，例如该麦克风固定于上述耳机。本领域技术人员应能理解，上述麦克风的设置方式仅为举例而非对本申请具体实施方式的限定，其他现有的或今后可能出现的麦克风的设置方式如能适用于本申请，也包含在本申请的保护范围内，并以引用的方式包含于此。

在步骤S310中，音频播放设备响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息。其中，环境声音信息所对应的文本信息由音频播放设备在本地执行语音识别操作而取得，或者由音频播放设备将环境声音信息发送至相应的网络设备(例如云端服务器)、由网络设备执行语音识别操作而获得。而在步骤S320中，音频播放设备响应于检测到关于所述环境声音信息的控制触发事件，向用户提供已被保存的环境声音信息，例如通过用户当前使用的音频输出单元(例如上述耳机)输出被保存的环境声音信息。

其中，为降低环境噪音对识别精度带来的影响而提升语音识别的准确度，音频播放设备在一些实施例中基于低通滤波器采集环境声音信息。其中，低通滤波器可滤除环境中的部分白噪音。

在一些实施例中，上述方法还包括步骤S400(未示出)。在步骤S400中，音频播放设备在采集环境声音信息后，保存该环境声音信息以便后续处理；在一些实施例中音频播放设备所采集的环境声音信息被保存于该音频播放设备的缓存(例如存储器中划出的某个区域)中。相应地，响应于检测到上述控制触发事件，音频播放设备向用户提供已被保存的环境声音信息所对应的文本信息，或者向用户提供已被保存的环境声音信息。

其中，为节省存储空间和提高用户听取已经保存的环境声音信息的效率，可选地在步骤S400中，音频播放设备基于预设的时间窗口保存环境声音信息，例如音频播放设备对环境声音循环录音。具体而言，在一些实施例中，音频播放设备持续地按顺序录制若干条相同长度(例如5s)的音频，在这些音频的总时长超过预设的时间窗口长度(例如20s)后删除最早的音频(将最早的音频移出时间窗口)；之后，音频播放设备基于当前被保存的所有音频片段向用户提供环境声音信息所对应的文本信息，或者向用户提供环境声音信息。

在一些实施例中，上述方法还包括步骤S500(未示出)。在步骤S500中，响应于检测到上述控制触发事件，音频播放设备基于第二输出电平播放上述当前音频，或者暂停播放上述当前音频，减少播放当前音频带来的干扰，以便用户将注意力集中到音频播放设备所提供的信息上。其中，基于第二输出电平播放当前音频的音量与基于第一输出电平播放当前音频的音量不同，在一些典型实施例中第二输出电平对应的音频输出音量相较于第一输出电平对应的音频输出音量要低，例如第二输出电平对应的输出音量为30dB(或其他较小的值)。特别地，在一些实施例中，基于第二输出电平，音频输出单元的输出音量被降至0dB。

在以第二输出电平播放当前音频的情况下，为便于用户在对话或讨论结束后恢复聆听音频、从而提升用户的使用体验，在一些实施例中，上述方法还包括步骤S600(未示出)。在步骤S600中，音频播放设备响应于检测到恢复触发事件，基于所述第一输出电平播放所述当前音频。对于音频播放设备在检测到上述控制触发事件后以第二输出电平播放当前音频的情况而言，音频播放设备恢复以第一输出电平播放当前音频，例如将调整输出电平后音频输出单元的输出音量由30dB(或其他较小的值)恢复至60dB。而对于音频播放设备在检测到上述控制触发事件后暂停播放当前音频的情况而言，音频播放设备从当前音频的播放断点位置或断点位置附近，以第一输出电平继续播放该当前音频，例如音频输出单元以60dB的输出音量输出该当前音频。

其中为便于用户操作，在一些实施例中上述恢复触发事件包括以下任一项：

-用户执行电平恢复操作，例如用户按下音频播放设备上的物理/虚拟按键、发出语音指令、进行体感输入(例如音频播放设备通过摄像头检测用户的手势或摇头动作以检测该输入；或者音频播放设备基于内建的陀螺仪检测用户对音频播放设备的摇动或翻转以检测该输入；或者音频播放设备通过其外设检测该操作，例如上述音频输出单元检测用户的摇头等体感操作或者用户对物理/虚拟按键的操作，并将检测结果发送至音频播放设备的主体部分)，以执行该电平恢复操作；

-用户在预设时长内无应答，例如用户在预设的时长(如，10秒)内并未讲话，或者没有对任何物理/虚拟按键等进行操作，或者用户并未执行任何体感操作。

在一些实施例中，在上述步骤S310中，音频播放设备响应于检测到关于所述环境声音信息的控制触发事件，提供文本查看提示信息，并向用户提供所述环境声音信息所对应的文本信息。例如，上述文本查看提示信息在一些实施例中以声音(包括语音及预设铃声等)、文字推送等方式提供，以通知用户关注以文字形式提供的对话或讨论内容，使用户能够更快地将注意力集中到对话或讨论中，从而提升用户体验。

在一些实施例中，以上所述的控制触发事件包括以下至少任一项：

-所述环境声音信息的音量大于预设的音量阈值；

-所述环境声音信息的音量随时间增加，例如讲话者逐渐接近用户或者讲话者提高音量；

-所述环境声音信息的声音属性满足预设属性条件，例如由该环境声音信息中检测到人声，或者由该环境声音信息中检测到符合预设频率或声纹的声音(例如特定人的声音)。

在一些实施例中，参考图2b，上述音频播放设备10通过第一麦克风201和第二麦克风202采集环境声音，并基于第一麦克风201和第二麦克风202分别采集到的声音信息检测上述控制触发事件，以减少误判，并适于在一些实施例中实现特定的逻辑功能。具体而言，音频播放设备基于第一麦克风201采集第一环境声音信息，并基于第二麦克风202采集第二环境声音信息。相应地，对于音频播放设备在检测到上述控制触发事件后向用户提供所述环境声音信息所对应的文本信息的情况而言，在步骤S310中，音频播放设备响应于检测到关于所述第一环境声音信息和第二环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息。而对于音频播放设备在检测到上述控制触发事件后向用户提供所述环境声音信息的情况而言，在步骤S320中，音频播放设备响应于检测到关于所述第一环境声音信息和第二环境声音信息的控制触发事件，向用户提供所述环境声音信息。

其中，在一些实施例中，在音频播放设备10通过第一麦克风201和第二麦克风202采集环境声音的情况下，上述方法还包括步骤S700、步骤S800(均未示出)。其中在步骤S700中，音频播放设备基于所述第一环境声音信息及所述第二环境声音信息确定音源方位信息；随后在步骤S800中，音频播放设备基于所述音源方位信息向用户指示音源方位。其中，音源方位以基于音频输出单元的语音播报、呈现于音频播放设备的屏幕上的指示符号/指示文字等形式而被提供至用户，以便用户迅速定位音源和更快地将注意力集中到对话或讨论中，从而提升用户体验。

具体而言，上述音源方位信息在一些实施例中基于第一麦克风201和第二麦克风202分别采集到的同一环境声音(例如第一麦克风201和第二麦克风202分别采集到的声音的频率相同或相近，则判定二者采集的是同一环境声音)的音量，或者第一麦克风201和第二麦克风202分别接收到同一环境声音的时间差，来确定音源方位。以第一麦克风201和第二麦克风202分设于用户头部两侧(例如分设于用户所佩戴耳机的两侧耳机单元上)、音频播放设备基于前述时间差来判定音源方位为例，参考图2c，在讲话者与第一麦克风201、第二麦克风202的距离之差为d的情况下，环境声音到达第一麦克风201和第二麦克风202的时刻将存在一时间差(该时间差可用于推算前述距离之差d)；基于该时间差，即可判定音源大致位于用户的左侧还是右侧。以图2c所示方位为例，若环境音首先到达第一麦克风201、之后再到达第二麦克风202，则大致判定音源位于用户左侧，用户即可由左侧空间目视搜寻讲话者，而无需在整个空间搜寻讲话者，从而用户得以迅速将注意力集中到对话或讨论中。进一步地，理论上，就第一麦克风201和第二麦克风202所在平面而言，在空间中满足该特性的点的集合，应为以第一麦克风201和第二麦克风202所在位置为焦点的双曲线的一支，从而音源的方位可以进一步判定为前述双曲线的渐近线所夹范围之内，因此基于由第一麦克风201和第二麦克风202的位置及上述距离之差d所确定的双曲线，将使得用户搜索讲话者的效率进一步提高。

须知，上述基于时间差判定音源方位的实施方式仅为举例而非对本申请的任何限定。在其他实施例中，还可基于其他方式来判定音源方位。例如，虽然两耳距离较近，但是用户的头部对声音的阻隔作用将使得第一麦克风201和第二麦克风202所接收到同一环境声音存在声级差，而音源应当位于声级较大的一侧。又例如，由于声波在空间中不同位置相位亦不同，因此声波震动的相位差也可用于辨别音源位置。又例如，从用户一侧传来的声波要绕过用户才能到达另一侧，而声波的绕射能力，与其波长和障碍物尺寸之间的比例有关，对于同一障碍物，声音频率越高、相应分量的衰减越大，从而不同侧麦克风所接收到的声音的音色亦不同。另外，在一些实施例中，组合上述各参数可获得更精确的音源方位。本领域技术人员应能理解，这些用于判定音源方位的方式仅为举例而非对本申请的任何限定，其他现有的、基于第一环境声音信息及第二环境声音信息判定音源方位的方式如能适用于本申请，也包含在本申请的保护范围内，并以引用的方式包含于此。

在一些实施例中，为了提高对音源方位的定位精度，在上述步骤S700中，音频播放设备跟踪第一环境声音信息及第二环境声音信息以确定音源方位信息。例如，音频播放设备首先以第一麦克风201和第二麦克风202采集第一环境声音信息和第二环境声音信息，并基于上述任一方式确定音源的第一方位信息；在用户基于该第一方位信息转动头部的同时，音频播放设备持续地以第一麦克风201和第二麦克风202采集第一环境声音信息和第二环境声音信息，并继续基于上述任一方式确定音源的第二方位信息；之后音频播放设备基于前述第一方位信息及该第二方位信息确定音源的方位信息，例如以前述第一方位信息及该第二方位信息各自所覆盖的空间范围的交集确定音源的方位信息，以提升音源方位的测量精度。

在一些实施例中，上述方法还包括步骤S900(未示出)。在步骤S900中，音频播放设备获取所述音频播放设备的姿态信息，该姿态信息用于表征包括(但不限于)该音频播放设备在空间中的俯仰、滚动等的角度状态(姿态)，例如该姿态信息包括该音频播放设备处于横屏/竖屏状态。其中，该姿态信息在一些实施例中基于音频播放设备内置的陀螺仪或重力传感器等传感器件获取。随后在步骤S800中，音频播放设备基于所述姿态信息及所述音源方位信息，呈现音源相对于所述音频播放设备的方位，从而向用户指示音源方位，例如在音频播放设备横屏/竖屏状态下以相应的角度可视化地指示音源方位，参考图2c。

其中，在基于第一环境声音信息及第二环境声音信息确定音源方位信息的情况下，为避免不必要的打扰，而仅在用户所关心的空间方位上检测是否有人跟用户说话、或者谈论用户所感兴趣的话题，在一些实施例中，上述控制触发事件包括：音频播放设备所检测到的音源方位满足预设方位条件。例如，音频播放设备所检测到的音源方位被包含于用户事先指定的空间范围内，或者音频播放设备所检测到的音源方位的大致范围与用户事先指定的空间范围存在交集。在此基础上，该控制触发事件还可选地包括以下任一项，以避免***过于灵敏而产生误操作：

-所述第一环境声音信息的音量大于预设的第一音量阈值；

-所述第二环境声音信息的音量大于预设的第二音量阈值；

-所述第一环境声音信息的音量随时间增加；

-所述第二环境声音信息的音量随时间增加；

-所述第一环境声音信息和所述第二环境声音信息的音量之差随时间减少，例如音源逐渐变得正对用户。

当然，音源方位满足预设方位条件并不必然是上述各项控制触发事件的前提；相应地在一些实施例中，在以第一麦克风201和第二麦克风202采集第一环境声音信息和第二环境声音信息的情况下，所述控制触发事件包括以下任一项：

-所述第一环境声音信息的音量大于预设的第一音量阈值；

-所述第二环境声音信息的音量大于预设的第二音量阈值；

-所述第一环境声音信息的音量随时间增加；

-所述第二环境声音信息的音量随时间增加；

在一些实施例中，上述控制触发事件包括：环境声音信息包括预定关键词信息，从而在周围有人提及相应关键词(例如有人提起用户所感兴趣的话题)时及时通知用户注意倾听或加入讨论；相应地，音频播放设备响应于检测到所述环境声音信息包括所述预定关键词信息，向用户提供环境声音信息或者环境声音信息对应的文本。特别地，若预定关键词包含交通工具报站词汇，还可提醒用户到站、及时下车。例如，关键词包含用户的姓名时，用户可在别人呼叫自己或谈论自己时快速反应；关键词包含用户的预设站点名称(例如地铁站)时，用户可在自己乘坐交通工具时及时下车；关键词包含站点预告(例如报站时的“下一站”提示)时，用户可在自己乘坐交通工具并即将到站时及早准备下车；……等。在一些实施例中，音频播放设备首先获取环境声音信息对应的文本信息(例如音频播放设备在本地将环境声音信息中的语音转为文字，或者音频播放设备将环境声音信息发送至云端、并接收云端将相应语音转换后返回的文字)，并检测其中是否含有预设的关键词；当然，音频播放设备亦可将环境声音信息发送至云端，并由云端检测该环境声音信息是否含有预设的关键词，并将判断结果返回至音频播放设备。其中，在一些实施例中预定关键词信息由用户在音频播放设备本地事先录入，在另一些实施例中预定关键词信息由云端服务器发送至音频播放设备本地(例如音频播放设备发起同步操作，或者云端服务器向音频播放设备推送预定关键词信息)。

为了使用户能尽快加入正在进行的对话或者使用户能仔细听取已录制的环境声音中的细节，在一些实施例中，在步骤S320中音频播放设备基于一音频播放速率向用户提供所述环境声音信息，例如音频播放设备加快播放(例如以“2倍速”播放)环境声音信息以节省用户的听音时间、以便用户尽快加入讨论，或者减速播放(例如以“0.5倍速”播放)环境声音信息以提供更多的声音细节、避免用户错过重要信息。其中，参考图3，音频播放设备持续录制周围的环境声音，而上述控制触发事件所对应的时刻t₀包含于相应的环境声音信息的采集时间T内。换句话说，在上述控制触发事件发生于时刻t₀以前，音频播放设备已录制一部分环境声音信息；而在时刻t₀以后，音频播放设备继续录制一段时间的环境声音信息。从而向用户提供的内容不仅覆盖控制触发事件前一段时间的环境声音信息，同时也覆盖控制触发事件后的一段时间的环境声音信息，从而避免用户在听取之前的录音或读取文字的时候错过后续发生的对话。在此基础上若结合上述改变音频播放速率向用户提供环境声音信息的实现方式，可实现向用户提供连续的对话体验，从而用户可以顺利加入讨论，而无需担心错过某些细节。

本领域技术人员应能理解，上述各种具体实施方式仅为举例而非对本申请的任何限定，其他现有的或者今后可能出现的相应的实施方式如能适用于本申请，也包含在本申请的保护范围内，并以引用的方式包含于此。

其中，本申请所指的麦克风(Microphone,或称为“传声器”“话筒”或“微音器”等)，在不同的实施例中可能具有不同的指向性。例如，用于实施本申请的麦克风，既可以是全向式(Omnidirectional)麦克风，也可以为了实现对音源更精确的定位而选用单一指向式麦克风、双指向式(Bi-directional)麦克风或麦克风阵列(Microphone Array)，其中常见的单一指向式包括心型指向(Cardioid)麦克风和超心型指向(Hypercardioid)麦克风。

与上述方法相对应，根据本申请的另一方面，本申请还提供了一种音频播放设备。其中，该音频播放设备包括第一模块100、第二模块200和第三一模块310，参考图4a，其中，第一模块100、第二模块200和第三一模块310分别用于执行图1a所对应实施例中的步骤S100、步骤S200和步骤S310的操作，具体实施方式请参考上述相关实施例，在此不予赘述；或者，该音频播放设备包括第一模块100、第二模块200和第三二模块320，参考图4b，其中，第一模块100、第二模块200和第三二模块320分别用于执行图1b所对应实施例中的步骤S100、步骤S200和步骤S320的操作，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第四模块400(未示出)，其中第四模块400用于执行上述实施例中的步骤S400，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第五模块500(未示出)，其中第五模块500用于执行上述实施例中的步骤S500，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第六模块600(未示出)，其中第六模块600用于执行上述实施例中的步骤S600，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第七模块700(未示出)，其中第七模块700用于执行上述实施例中的步骤S700，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第八模块800(未示出)，其中第八模块800用于执行上述实施例中的步骤S800，具体实施方式请参考上述相关实施例，在此不予赘述。

在一些实施例中，该音频播放设备还包括第九模块900(未示出)，其中第九模块900用于执行上述实施例中的步骤S900，具体实施方式请参考上述相关实施例，在此不予赘述。

以上详述了本申请的一些具体实施方式。须知，上述各实施方式仅为举例而非对本申请具体实施方式的限定。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机代码，当所述计算机代码被执行时，如前任一项所述的方法被执行。

本申请还提供了一种计算机程序产品，当所述计算机程序产品被计算机设备执行时，如前任一项所述的方法被执行。

本申请还提供了一种计算机设备，所述计算机设备包括：

一个或多个处理器；

存储器，用于存储一个或多个计算机程序；

当所述一个或多个计算机程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如前任一项所述的方法。

图5示出了可被用于实施本申请中所述的各个实施例的示例性***。

如图5所示，在一些实施例中，***1000能够作为各所述实施例中的任意一个音频播放设备。在一些实施例中，***1000可包括具有指令的一个或多个计算机可读介质(例如，***存储器或NVM/存储设备1020)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本申请中所述的动作的一个或多个处理器(例如，(一个或多个)处理器1005)。

对于一个实施例，***控制模块1010可包括任意适当的接口控制器，以向(一个或多个)处理器1005中的至少一个和/或与***控制模块1010通信的任意适当的设备或组件提供任意适当的接口。

***控制模块1010可包括存储器控制器模块1030，以向***存储器1015提供接口。存储器控制器模块1030可以是硬件模块、软件模块和/或固件模块。

***存储器1015可被用于例如为***1000加载和存储数据和/或指令。对于一个实施例，***存储器1015可包括任意适当的易失性存储器，例如，适当的DRAM。在一些实施例中，***存储器1015可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。

对于一个实施例，***控制模块1010可包括一个或多个输入/输出(I/O)控制器，以向NVM/存储设备1020及(一个或多个)通信接口1025提供接口。

例如，NVM/存储设备1020可被用于存储数据和/或指令。NVM/存储设备1020可包括任意适当的非易失性存储器(例如，闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如，一个或多个硬盘驱动器(Hard Disk,HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。

NVM/存储设备1020可包括在物理上作为***1000被安装在其上的设备的一部分的存储资源，或者其可被该设备访问而不必作为该设备的一部分。例如，NVM/存储设备1020可通过网络经由(一个或多个)通信接口1025进行访问。

(一个或多个)通信接口1025可为***1000提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。***1000可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。

对于一个实施例，(一个或多个)处理器1005中的至少一个可与***控制模块1010的一个或多个控制器(例如，存储器控制器模块1030)的逻辑封装在一起。对于一个实施例，(一个或多个)处理器1005中的至少一个可与***控制模块1010的一个或多个控制器的逻辑封装在一起以形成***级封装(SiP)。对于一个实施例，(一个或多个)处理器1005中的至少一个可与***控制模块1010的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例，(一个或多个)处理器1005中的至少一个可与***控制模块1010的一个或多个控制器的逻辑集成在同一模具上以形成片上***(SoC)。

在各个实施例中，***1000可以但不限于是：服务器、工作站、台式计算设备或移动计算设备(例如，膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中，***1000可具有更多或更少的组件和/或不同的架构。例如，在一些实施例中，***1000包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。

需要注意的是，本申请可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本申请的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本申请的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。本领域技术人员应能理解，计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等，相应地，计算机程序指令被计算机执行的方式包括但不限于：该计算机直接执行该指令，或者该计算机编译该指令后再执行对应的编译后程序，或者该计算机读取并执行该指令，或者该计算机读取并安装该指令后再执行对应的安装后程序。在此，计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。

通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个***传送到另一***的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如，光纤、同轴等))和能传播能量波的无线(未有导的传输)介质，诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。

作为示例而非限制，计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如，计算机可读存储介质包括，但不限于，易失性存储器，诸如随机存储器(RAM,DRAM,SRAM)；以及非易失性存储器，诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM)；以及磁性和光学存储设备(硬盘、磁带、CD、DVD)；或其它现在已知的介质或今后开发的能够存储供计算机***使用的计算机可读信息/数据。

在此，根据本申请的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于提供信息的方法，应用于音频播放设备，其中，所述方法包括：

基于第一输出电平播放当前音频；

采集环境声音信息，其中所述环境声音信息包括第一环境声音信息和第二环境声音信息，基于第一麦克风采集所述第一环境声音信息，基于第二麦克风采集所述第二环境声音信息，所述第一麦克风与所述第二麦克风分设于用户所佩戴耳机的两侧耳机单元上；

基于所述第一环境声音信息和所述第二环境声音信息检测是否存在关于所述第一环境声音信息和所述第二环境声音信息的控制触发事件，其中所述控制触发事件包括所述第一环境声音信息和所述第二环境声音信息的音量之差随时间减少，所述第一环境声音信息和所述第二环境声音信息的音量之差随时间减少用于确定音源变得正对用户，所述控制触发事件用于确定是否向所述用户提供一段时间内的环境声音或环境声音所对应的文本信息；

响应于检测到关于所述第一环境声音信息和所述第二环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息，或者向用户提供所述环境声音信息。

2.根据权利要求1所述的方法，其中，所述方法还包括：

保存所述环境声音信息；

所述响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息的步骤，包括：

响应于检测到关于所述环境声音信息的控制触发事件，向用户提供已被保存的环境声音信息所对应的文本信息；

所述响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息的步骤，包括：

响应于检测到关于所述环境声音信息的控制触发事件，向用户提供已被保存的环境声音信息。

3.根据权利要求2所述的方法，其中，所述保存所述环境声音信息的步骤，包括：

基于预设的时间窗口保存所述环境声音信息。

4.根据权利要求1所述的方法，其中，所述方法还包括：

基于第二输出电平播放所述当前音频，其中，基于所述第二电平播放所述当前音频的音量与基于所述第一输出电平播放所述当前音频的音量不同；或者，

暂停播放所述当前音频。

5.根据权利要求4所述的方法，其中，所述方法还包括：

响应于检测到恢复触发事件，基于所述第一输出电平播放所述当前音频。

6.根据权利要求5所述的方法，其中，所述恢复触发事件包括以下任一项：

用户执行电平恢复操作；

用户在预设时长内无应答。

7.根据权利要求1至6中任一项所述的方法，其中，所述响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息所对应的文本信息的步骤，包括：

响应于检测到关于所述环境声音信息的控制触发事件，提供文本查看提示信息，并向用户提供所述环境声音信息所对应的文本信息。

8.根据权利要求1至6中任一项所述的方法，其中，所述控制触发事件包括以下至少任一项：

所述环境声音信息的音量大于预设的音量阈值；

所述环境声音信息的音量随时间增加；

所述环境声音信息的声音属性满足预设属性条件。

9.根据权利要求1所述的方法，其中，所述方法还包括：

基于所述第一环境声音信息及所述第二环境声音信息确定音源方位信息；

基于所述音源方位信息向用户指示音源方位。

10.根据权利要求9所述的方法，其中，所述基于所述第一环境声音信息及所述第二环境声音信息确定音源方位信息的步骤，包括：

跟踪所述第一环境声音信息及所述第二环境声音信息以确定音源方位信息。

11.根据权利要求9所述的方法，其中，所述基于所述音源方位信息向用户指示音源方位的步骤之前还包括：

获取所述音频播放设备的姿态信息；

所述基于所述音源方位信息向用户指示音源方位的步骤，包括：

基于所述姿态信息及所述音源方位信息，呈现音源相对于所述音频播放设备的方位，从而向用户指示音源方位。

12.根据权利要求9所述的方法，其中，所述控制触发事件包括：

所述音源方位信息满足预设方位条件。

13.根据权利要求12所述的方法，其中，所述控制触发事件还包括以下任一项：

所述第一环境声音信息的音量大于预设的第一音量阈值；

所述第二环境声音信息的音量大于预设的第二音量阈值；

所述第一环境声音信息的音量随时间增加；

所述第二环境声音信息的音量随时间增加；

所述第一环境声音信息和所述第二环境声音信息的音量之差随时间减少。

14.根据权利要求1所述的方法，其中，所述控制触发事件还包括以下任一项：

所述第一环境声音信息的音量大于预设的第一音量阈值；

所述第二环境声音信息的音量大于预设的第二音量阈值。

15.根据权利要求1所述的方法，其中，所述控制触发事件包括：

所述环境声音信息包括预定关键词信息。

16.根据权利要求1所述的方法，其中，所述响应于检测到关于所述环境声音信息的控制触发事件，向用户提供所述环境声音信息的步骤，包括：

响应于检测到关于所述环境声音信息的控制触发事件，基于一音频播放速率向用户提供所述环境声音信息。

17.根据权利要求16所述的方法，其中，所述控制触发事件所对应的时刻包含于所述环境声音信息的采集时间内。

18.一种音频播放设备，其中，该设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行根据权利要求1至17中任一项所述方法的操作。

19.一种存储指令的计算机可读介质，所述指令在被计算机执行时使得所述计算机执行根据权利要求1至17中任一项所述方法的操作。