CN104078044B - 移动终端及其录音搜索的方法和装置 - Google Patents
移动终端及其录音搜索的方法和装置 Download PDFInfo
- Publication number
- CN104078044B CN104078044B CN201410312543.7A CN201410312543A CN104078044B CN 104078044 B CN104078044 B CN 104078044B CN 201410312543 A CN201410312543 A CN 201410312543A CN 104078044 B CN104078044 B CN 104078044B
- Authority
- CN
- China
- Prior art keywords
- content
- text
- voice
- recording
- key word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了移动终端及其录音搜索的方法和装置,属于移动终端技术领域。该录音搜索的方法包括:将带有时间属性的语音文件分成若干段带有时间属性的语音内容;分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;存储语音内容和文本文件;当接收到输入的关键字时,在文本文件中搜索关键字所在的文本内容的标识;播放与标识相关联的时间属性所在的语音内容。本发明使得文本内容与语音内容对应的更加精确,在后续的搜索中,能有效提高录音搜所定位的效率。
Description
技术领域
本发明涉及移动终端技术领域,具体涉及移动终端及其录音搜索的方法和装置。
背景技术
在会议、学习培训等场合,人们喜欢通过录音记录会场的语音内容,以方便日后记忆和学习。由于现场录音时,为了怕漏掉某段语音,一般采用全程录音的方式,这样就会导致录音文件比较大,且录音时间很长,在日后又只想听取录音文件中某段录音内容时,用户往往需要听很多无关的语音内容后才找到自己想要的信息,而且要注意力要集中,不然很容易就错过。
为了容易找到录音内容的信息,现有技术中普遍采用将录音内容转换成文本,然后通过对文本进行关键字搜索匹配,从而对想要听取的录音内容进行大致定位。然而这种方式的弊病在于语音转换文本时会出现误差,即录音包含的意义并非文本可以完全体现出来,例如说话的语气,不同的语境,同一句话,用不同的语气或在不同的语境中说,表达的意思可能就完全不一样,从而导致录音搜索定位的效果比较差。
发明内容
本发明提供一种移动终端及其录音搜索的方法和装置,以达到精确定位到想要听的录音时间的目的,克服上述由于语音转换文本时会出现误差导致录音定位效果较差的缺陷。
本发明解决上述技术问题的技术方案如下。
根据本发明的一个方面,提供的一种录音搜索方法,该方法应用于移动终端,该方法包括:
将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
存储语音内容和文本文件;
当接收到输入的关键字时,在文本文件中搜索关键字所在的文本内容的标识;
播放与标识相关联的时间属性所在的语音内容。
优选地,在上述将带有时间属性的语音文件分成若干段带有时间属性的语音文件之前,该方法还包括:录制带有时间属性的语音文件;
优选地,针对上述将带有时间属性的语音文件分成若干段带有时间属性的语音内容,该方法还包括:以预设的时间间隔为分段依据或以语音文件中的语音停顿为分段依据;
优选地,针对上述接收到输入的关键字,关键字的输入方式包括语音输入;
优选地,上述标识包括与对应语音内容的时间属性相关联的的时间索引;
优选地,针对在文本文件中搜索关键字所在的文本内容的标识,并播放与标识相关联的时间属性所在的语音内容,该方法还包括:获取关键字所在文本内容中的时间索引;获取与时间索引相关联的时间属性所在的语音内容。
根据本发明的另一个方面,提供的一种录音搜索装置,该装置包括:
录音分段模块,用于将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
语音转换模块,用于分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
存储模块,用于存储语音内容和文本文件;
搜索模块,用于当接收到输入的关键字时,在文本文件中搜索关键字所在的文本内容的标识;
播放模块,用于播放与标识相关联的时间属性所在的语音内容。
优选地,上述该装置还包括用于录制带有时间属性的语音文件的录音模块;
优选地,上述播放模块还包括:
时间索引获取模块,用于获取关键字所在文本内容中的时间索引;
语音内容获取模块,用于获取与时间索引相关联的时间属性所在的语音内容。
根据本发明的再一个方面,提供的一种移动终端,该移动终端包含上述录音搜索装置。
本发明提供了一种移动终端及其防盗方法和装置,通过将带有时间属性的语音文件以预设的时间间隔为分段依据,或以语音文件中的语音停顿为分段依据分成多段语音内容,再将多段语音内容分别转换为对应的文本内容,使得文本内容与语音内容对应的更加精确,从而在后续的搜索中,不会出现一个关键词的对应文本内容段搜索出多个语音内容段,提高录音搜索定位准确率,进而提高录音搜索定位的效率,本发明在搜索关键字时,不仅可以通过传统的键盘或手写输入方式,还可通过语音输入,提升了本发明的使用体验,通过设置文本内容的时间索引,此时间索引与语音内容的时间属性相对应,进一步提高后续搜索定位准确率。
附图说明
图1为根据本发明的第一实施例的录音搜索方法的流程图;
图2为根据本发明的第二个实施例的录音搜索方法的流程图;
图3为根据本发明的第三个实施例的录音搜索方法的流程图;
图4为根据本发明的一个实施例的录音搜索装置示范性结构框图;
图5为根据本发明的一个实施例的播放模块的示范性结构框图;
图6为根据本发明的一个实施例的移动终端的示范性结构框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为根据本发明的第一实施例的录音搜索方法的流程图,下面结合图1来描述本发明中的录音搜索方法,该方法应用于移动终端,如图1所示,该方法包括以下步骤:
S01,将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
S02,分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
S03,存储所述语音内容和文本文件;
S04,当接收到输入的关键字时,在文本文件中搜索关键字所在的文本内容的标识;
S05,播放与标识相关联的时间属性所在的语音内容。
其中,在所述将带有时间属性的语音文件分成若干段带有时间属性的语音文件的步骤之前,还包括录制带有时间属性的语音文件,如通过手机录制一段时间较长的语音文件。
其中,所述分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件的步骤,包括两种类型,其一为:分别将每段语音内容转换成对应的文本内容,并将所有文本内容组合成文本文件;另一为:分别将每段语音内容转换成对应的文本内容,并将每段语音内容对应的文本内容分别保存,形成每段语音内容对应的文本文件。
其中,针对上述接收到输入的关键字,关键字的输入方式包括但不限于语音输入、文字输入。当输入的关键字为语音时,现将语音关键字转换为文字关键字,再在文本文件中匹配该关键字。
针对上述将带有时间属性的语音文件分成若干段带有时间属性的语音内容,可以以预设的时间间隔为分段依据分段,也可以以语音文件中的语音停顿为分段依据分段。该预设的时间间隔可根据实际需求灵活设置,如设置为1分钟,在对语音文件进行分段时,第一段语音内容的时间属性为0-1分钟,第二段语音内容的时间属性为1-2分钟,依次类推,直至分段完成;还可以以语音文件中的语音停顿来进行分段,在会议或学习培训过程中,演讲者在说话时,会出现停顿,如每说完一句话会进行一次停顿,此时将停顿点作为分段点,对语音文件进行分段,每一段语音内容的时间属性为两个相邻停顿之间的时间;不论以哪一种方式进行分段,在分段后分别进行语音转换,使语音内容转换成与语音内容对应的文本内容,并为每一段文本内容配上与时间属性相对应的时间索引。
其中,上述标识包括与对应语音内容的时间属性相关联的时间索引。
其中,针对上述在文本文件中搜索关键字所在的文本内容的标识,并播放与标识相关联的时间属性所在的语音内容,该方法还包括:
获取关键字所在文本内容中的时间索引;
获取与时间索引相关联的时间属性所在的语音内容。
图2为根据本发明的第二个实施例的录音搜索方法的流程图,在图1的第一个实施例的基础上,在步骤S01之前添加步骤S00、录制带有时间属性的语音文件;以步骤S021替换步骤S02,步骤S021、以预设的时间间隔为分段依据分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,文本内容具有与时间属性相关联的标识;最后以步骤S041替换步骤S04,步骤S041、通过键盘或手写输入关键字,根据关键字在文本文件中搜索关键字所在的文本内容的标识。
图3为根据本发明的第三个实施例的录音搜索方法的流程图,在图1的第一个实施例的基础上,在步骤S01之前添加步骤S00,录制带有时间属性的语音文件;以步骤S022替换步骤S02,步骤S022、以语音文件中的语音停顿为分段依据分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,文本内容具有与时间属性相关联的标识;最后以步骤S042替换步骤S04,步骤S042、通过语音输入关键字,并根据关键字在文本文件中搜索关键字所在的文本内容的标识,其中语音输入的关键字内容先通过现有语音识别软件转换成相应的文字。
图4为根据本发明的录音搜索装置示范性结构框图;下面根据图4来描述本发明中的录音搜索装置100,如图4所示,该装置包括:
录音分段模块01,用于将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
语音转换模块02,用于分别将每段语音内容转换成对应的文本内容,并将所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
存储模块03,用于存储语音内容和文本文件;
搜索模块04,用于当接收到输入的关键字时,在文本文件中搜索关键字所在的文本内容的标识;
播放模块05,用于播放与标识相关联的时间属性所在的语音内容。
其中,上述语音转换模块02还用于使所述文本内容带有对应语音内容的时间属性的时间索引。
如图1所示,上述录音搜索装置100还可以包括:
录音模块00,用于录制带有时间属性的语音文件。
上述录音模块00可用一个麦克风作为音频信号录入的设备。在搜索关键字时,可在关键字输入界面使用麦克风输入音频信号,再由现有的语音识别软件将此音频信号中的内容转换为播放模块能识别的关键字,再进行后续搜索,在不便于发声的环境中,也可通过触摸屏手写或写字板输入关键字,或者通过触摸屏虚拟键盘或是实体键盘输入关键字。
图5为根据本发明的播放模块的示范性结构框图,如图5所示,上述录音搜索装置100还可以包括:
时间索引获取模块14,用于获取关键字所在文本内容中的时间索引;
语音内容获取模块24,用于获取与时间索引相关联的时间属性所在的语音内容。
图6为根据本发明的一个实施例的移动终端的示范性结构框图,如图6所示的一种移动终端11,该移动终端包含上述录音搜索装置。
本发明通过将带有时间属性的语音文件以预设的时间间隔为分段依据,或以语音文件中的语音停顿为分段依据分成多段语音内容,再将多段语音内容分别转换为对应的文本内容,使得文本内容与语音内容对应的更加精确,从而在后续的搜索中,不会出现一个关键词的对应文本内容段搜索出多个语音内容段,提高录音搜索定位准确率,进而提高录音搜索定位的效率,本发明在搜索关键字时,不仅可以通过传统的键盘或手写输入方式,还可通过语音输入,提升了本发明的使用体验,通过设置文本内容的时间索引,此时间索引与语音内容的时间属性相对应,进一步提高后续搜索定位的准确率。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种录音搜索方法,该方法应用于移动终端,其特征在于,该方法包括:
以预设的时间间隔或以语音文件中的一句话的语音停顿为分段依据,将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
分别将每段语音内容转换成对应的文本内容,并将所述所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
存储所述语音内容和所述文本文件;
当接收到输入的关键字时,在所述文本文件中匹配所述关键字;
获取所述关键字所在的文本内容的标识;
播放与所述标识相关联的时间属性所在的语音内容。
2.根据权利要求1所述的一种录音搜索方法,其特征在于,该方法还包括:
录制带有时间属性的语音文件。
3.根据权利要求1所述的一种录音搜索方法,其特征在于,针对所述接收到输入的关键字,所述关键字的输入方式包括语音输入。
4.根据权利要求1至3任一项所述的一种录音搜索方法,其特征在于,所述标识包括与对应语音内容的时间属性相关联的时间索引。
5.根据权利要求4所述的一种录音搜索方法,其特征在于,该方法还包括:
获取所述关键字所在文本内容中的时间索引;
获取与所述时间索引相关联的时间属性所在的语音内容。
6.一种录音搜索装置,其特征在于,该装置包括:
录音分段模块,用于以预设的时间间隔或以语音文件中的一句话的语音停顿为分段依据,将带有时间属性的语音文件分成若干段带有时间属性的语音内容;
语音转换模块,用于分别将每段语音内容转换成对应的文本内容,并将所述所有文本内容保存于文本文件,所述文本内容具有与所述时间属性相关联的标识;
存储模块,用于存储所述语音内容和所述文本文件;
搜索模块,用于当接收到输入的关键字时,在所述文本文件中匹配所述关键字,并获取所述关键字所在的文本内容的标识;
播放模块,用于播放与所述标识相关联的时间属性所在的语音内容。
7.根据权利要求6所述的一种录音搜索装置,其特征在于,该装置还包括:
录音模块,用于录制带有时间属性的语音文件。
8.根据权利要求6所述的一种录音搜索装置,其特征在于,该装置还包括:
时间索引获取模块,用于获取所述关键字所在文本内容中的时间索引;
语音内容获取模块,用于获取与所述时间索引相关联的时间属性所在的语音内容。
9.一种移动终端,其特征在于:包含上述权利要求6至8中任一项所述的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410312543.7A CN104078044B (zh) | 2014-07-02 | 2014-07-02 | 移动终端及其录音搜索的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410312543.7A CN104078044B (zh) | 2014-07-02 | 2014-07-02 | 移动终端及其录音搜索的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104078044A CN104078044A (zh) | 2014-10-01 |
CN104078044B true CN104078044B (zh) | 2016-03-30 |
Family
ID=51599267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410312543.7A Active CN104078044B (zh) | 2014-07-02 | 2014-07-02 | 移动终端及其录音搜索的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104078044B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408162B (zh) * | 2014-12-05 | 2017-10-31 | 国家电网公司 | 一种用于形成文字索引的多媒体***及处理方法 |
CN105787496A (zh) * | 2014-12-23 | 2016-07-20 | 联想(北京)有限公司 | 一种数据的归集方法和电子设备 |
US20160379641A1 (en) * | 2015-06-29 | 2016-12-29 | Microsoft Technology Licensing, Llc | Auto-Generation of Notes and Tasks From Passive Recording |
CN106558311B (zh) * | 2015-09-30 | 2020-11-27 | 北京奇虎科技有限公司 | 语音内容提示方法和装置 |
CN105653729B (zh) * | 2016-01-28 | 2019-10-08 | 努比亚技术有限公司 | 一种录音文件索引的装置及方法 |
CN106057193A (zh) * | 2016-07-13 | 2016-10-26 | 深圳市沃特沃德股份有限公司 | 基于电话会议的会议记录生成方法和装置 |
CN106128460A (zh) * | 2016-08-04 | 2016-11-16 | 周奇 | 一种录音标记方法及装置 |
CN106504773B (zh) * | 2016-11-08 | 2023-08-01 | 上海贝生医疗设备有限公司 | 一种可穿戴装置及语音与活动监测*** |
CN106357929A (zh) * | 2016-11-10 | 2017-01-25 | 努比亚技术有限公司 | 一种基于语音文件的预览方法和移动终端 |
CN108874815A (zh) * | 2017-05-10 | 2018-11-23 | 北京国双科技有限公司 | 音视频的检索方法及装置 |
CN107291676B (zh) * | 2017-06-20 | 2021-11-19 | 广东小天才科技有限公司 | 截断语音文件的方法、终端设备及计算机存储介质 |
CN110019923A (zh) * | 2017-07-18 | 2019-07-16 | 北京国双科技有限公司 | 语音消息的查找方法及装置 |
CN109559764A (zh) * | 2017-09-27 | 2019-04-02 | 北京国双科技有限公司 | 音频文件的处理方法和装置 |
CN108287930A (zh) * | 2018-03-08 | 2018-07-17 | 珠海格力电器股份有限公司 | 一种录音搜索方法、装置及电子设备 |
CN110489589A (zh) * | 2018-05-11 | 2019-11-22 | 深圳市诚壹科技有限公司 | 一种录音文件保存方法、装置及终端设备 |
CN108874904B (zh) * | 2018-05-24 | 2022-04-29 | 平安科技(深圳)有限公司 | 语音消息搜索方法、装置、计算机设备及存储介质 |
CN109274586A (zh) * | 2018-11-14 | 2019-01-25 | 深圳市云歌人工智能技术有限公司 | 聊天信息的存储方法、装置及存储介质 |
CN110287364B (zh) * | 2019-06-28 | 2021-10-08 | 合肥讯飞读写科技有限公司 | 语音搜索方法、***、设备及计算机可读存储介质 |
CN110636369A (zh) * | 2019-09-27 | 2019-12-31 | 维沃移动通信有限公司 | 一种多媒体文件的播放方法、移动终端 |
CN111092996A (zh) * | 2019-10-31 | 2020-05-01 | 国网山东省电力公司信息通信公司 | 一种集中式调度录音***及控制方法 |
CN113724735A (zh) * | 2021-09-01 | 2021-11-30 | 广州博冠信息科技有限公司 | 语音流处理方法及装置、计算机可读存储介质、电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
CN1783073A (zh) * | 2004-09-01 | 2006-06-07 | 创新科技有限公司 | 搜索*** |
CN101351838A (zh) * | 2005-12-30 | 2009-01-21 | 坦德伯格电信公司 | 可搜索多媒体流 |
CN103065659A (zh) * | 2012-12-06 | 2013-04-24 | 广东欧珀移动通信有限公司 | 一种多媒体记录方法 |
-
2014
- 2014-07-02 CN CN201410312543.7A patent/CN104078044B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7039585B2 (en) * | 2001-04-10 | 2006-05-02 | International Business Machines Corporation | Method and system for searching recorded speech and retrieving relevant segments |
CN1783073A (zh) * | 2004-09-01 | 2006-06-07 | 创新科技有限公司 | 搜索*** |
CN101351838A (zh) * | 2005-12-30 | 2009-01-21 | 坦德伯格电信公司 | 可搜索多媒体流 |
CN103065659A (zh) * | 2012-12-06 | 2013-04-24 | 广东欧珀移动通信有限公司 | 一种多媒体记录方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104078044A (zh) | 2014-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104078044B (zh) | 移动终端及其录音搜索的方法和装置 | |
CN109493850B (zh) | 成长型对话装置 | |
CN107016994B (zh) | 语音识别的方法及装置 | |
CN108074576B (zh) | 审讯场景下的说话人角色分离方法及*** | |
WO2020043123A1 (zh) | 命名实体识别方法、命名实体识别装置、设备及介质 | |
US8209171B2 (en) | Methods and apparatus relating to searching of spoken audio data | |
US10489451B2 (en) | Voice search system, voice search method, and computer-readable storage medium | |
WO2019148586A1 (zh) | 多人发言中发言人识别方法以及装置 | |
US8909525B2 (en) | Interactive voice recognition electronic device and method | |
CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
CN109256152A (zh) | 语音评分方法及装置、电子设备、存储介质 | |
US20120271631A1 (en) | Speech recognition using multiple language models | |
CN105975569A (zh) | 一种语音处理的方法及终端 | |
CN101593519B (zh) | 检测语音关键词的方法和设备及检索方法和*** | |
JPWO2008114811A1 (ja) | 情報検索システム、情報検索方法及び情報検索用プログラム | |
US20130253932A1 (en) | Conversation supporting device, conversation supporting method and conversation supporting program | |
Moore | Automated transcription and conversation analysis | |
CN104598644A (zh) | 用户喜好标签挖掘方法和装置 | |
US20120035919A1 (en) | Voice recording device and method thereof | |
CN103123644A (zh) | 声音数据检索***及用于该***的程序 | |
KR20140123369A (ko) | 음성인식 질의응답 시스템 및 그것의 운용방법 | |
CN116186258A (zh) | 基于多模态知识图谱的文本分类方法、设备及存储介质 | |
CN113782026A (zh) | 一种信息处理方法、装置、介质和设备 | |
KR102536944B1 (ko) | 음성 신호 처리 방법 및 장치 | |
CN108364655A (zh) | 语音处理方法、介质、装置和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10 Applicant after: Nubian Technologies Ltd. Address before: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10 Applicant before: Shenzhen ZTE Mobile Tech Co., Ltd. |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |