CN108172212A - 一种基于置信度的语音语种识别方法及*** - Google Patents

一种基于置信度的语音语种识别方法及*** Download PDF

Info

Publication number
CN108172212A
CN108172212A CN201711425644.5A CN201711425644A CN108172212A CN 108172212 A CN108172212 A CN 108172212A CN 201711425644 A CN201711425644 A CN 201711425644A CN 108172212 A CN108172212 A CN 108172212A
Authority
CN
China
Prior art keywords
languages
sound bite
confidence level
default
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711425644.5A
Other languages
English (en)
Other versions
CN108172212B (zh
Inventor
季节
徐爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HENGQIN INTERNATIONAL INTELLECTUAL PROPERTY EXCHANGE CO.,LTD.
Original Assignee
International Intellectual Property Trading Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Intellectual Property Trading Center Co Ltd filed Critical International Intellectual Property Trading Center Co Ltd
Priority to CN201711425644.5A priority Critical patent/CN108172212B/zh
Publication of CN108172212A publication Critical patent/CN108172212A/zh
Application granted granted Critical
Publication of CN108172212B publication Critical patent/CN108172212B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种基于置信度的语音语种识别方法及***,用以解决现有语音识别中,语种识别效率较低的问题。该方法包括:S1:从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;S2:根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;S3:若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至步骤S1。采用本发明,提高了语音识别效率,同时还提高了多语种语音信息的识别精确度。

Description

一种基于置信度的语音语种识别方法及***
技术领域
本发明涉及语音识别领域,尤其涉及一种基于置信度的语音语种识别方法及***。
背景技术
语音识别技术,也被称为自动语音识别,其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
现有技术中,在进行语音识别之前需要先进行语种识别,现有技术中,客户端将用户输入的语音信号分成若干语音片段后,依次将语音片段发送到服务器进行语种识别的,服务器在接收到属于同一语音的所有语音片段之后,才开始进行语种识别,语种识别的效率很低,而且当用户输入的语音信息包含多种语种时,还会存在语种的错误识别,导致语音识别伴随着出现错误。
发明内容
本发明要解决的技术问题目的在于提供一种基于置信度的语音识别方法及***,用以解决现有的语音识别效率低,对于包含多语种的语音信息,会出现错误识别的问题。
为了实现上述目的,本发明采用的技术方案为:
一种基于置信度的语音语种识别方法,包括步骤:
S1:从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;
S2:根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;
S3:若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至步骤S1。
进一步的,所述步骤S1之前还包括步骤:
接收输入的语音信息;
根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
进一步的,所述步骤S1还包括步骤:
获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
提取所述输入时间最早的语音片段作为预设语音片段。
进一步的,所述步骤S2还包括步骤:
将所述预设语音片段的语种信息作为预设语种;
通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
进一步的,所述步骤S3还包括:
获取各个语音片段的当前语种置信度;
将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
一种基于置信度的语音语种识别***,包括:
语种匹配模块:用于从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;
语种识别模块:用于根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;
筛选模块:用于若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至所述语种匹配模块。
进一步的,还包括:
语音输入模块:用于接收输入的语音信息;
语音分段模块:用于根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
进一步的,所述语种匹配模块还包括:
标记单元:用于获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
提取单元:用于提取所述输入时间最早的语音片段作为预设语音片段。
进一步的,所述语种识别模块还包括:
预设语种单元:用于将所述预设语音片段的语种信息作为预设语种;
语种对比单元:用于通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
进一步的,所述筛选模块还包括:
置信度获取单元:用于获取各个语音片段的当前语种置信度;
语音片段筛选单元:用于将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
采用本发明,通过对语音片段的置信度进行筛选,将不同语种的语音片段进行区分,提高了对于包含多语种的语音信息识别的准确性,将语音信息分成不同片段进行识别,同时提高了语音识别效率。
附图说明
图1是本实施例提供的一种基于置信度的语音语种识别方法流程图;
图2是本实施例提供的一种基于置信度的语音语种识别***结构图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
置信度,又称为置信水平、置信系数、可靠度,在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”,这个概率被称为置信水平。
实施例一
本实施例提供了一种基于置信度的语音语种识别方法,如图1所示,包括步骤:
S11:从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;
S12:根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;
S13:若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至步骤S11。
本实施例中,在步骤S11之前还包括:
步骤S101:接收输入的语音信息;
步骤S102:根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
具体地,
对于用户输入的语音信息,服务器对语音信息进行识别之前,先将其按照预设分段时长分成各个语音片段单元,例如,以100ms为一个语音片段单元,将当前接收到的语音信息分割成以100ms长的多个语音片段单元。
本实施例中,步骤S11为从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息。
具体地,
先从各个语音片段中提取一个语音片段,该语音片段应为时间顺序最靠前的语音片段即用户输入的语音信息中最开始输入的语音片段,先确定该语音片段的语种信息,再将后续的语音片段与该语种进行对比,得到各个语音片段的语种置信度。
其中,步骤S11还包括:
步骤S111:获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
步骤S112:提取所述输入时间最早的语音片段作为预设语音片段。
用户输入的语音信息必定存在一个时间先后顺序,在将语音信息分成各个语音片段时,也会有不同的时间先后顺序,将其中时间顺序最靠前的语音片段提取出来作为预设语音片段。
本实施例中,步骤S12为根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种。
具体地,
在各个语音片段与预设语种进行对比后,可以得到语种置信度,计算各个语音片段的语种置信度总和并得到置信度均值,若置信度均值大于预设置信度阈值,表示后续的各个语音片段的语种与预设语种相同,则将预设语种作为此段语音信息的默认语种。
本实施例中,步骤S12还包括:
步骤121:将所述预设语音片段的语种信息作为预设语种;
步骤122:通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
其中,从各个语音片段中提取出一个语音片段,识别该语音片段的语种信息,直接作为各个语音片段的预设语种,减少了需要对后续语音片段的语种进行识别的步骤。
本实施例中,步骤S13为若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至步骤S11。
具体地,
将当前各个语音片段的语种置信度均值与预设置信度阈值对比后,若发现语种置信度均值小于预设置信度阈值,表示各个语音片段中的存在有语音片段对预设语种的语种置信度不高,该语音片段可能是其它的语种,筛选出置信度较低的语音片段,然后转至步骤S11,直到识别完所有的语音片段语种。
本实施例中,步骤S13还包括:
S131:获取各个语音片段的当前语种置信度;
S132:将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
其中,对于与预设语种置信度不高的语音片段,该语音片段可能是其它的语种,将其筛选出来,同时满足筛选后的语音片段语种置信度均值大于预设语种置信度阈值。对筛选出来的语音片段进行整合,转到步骤S12。
通过对语音片段的语种置信度进行筛选,对于包含多语种的语音信息,能够根据语种置信度进行区分,提高了语音识别的效率及保证了语种识别的准确度。
实施例二
本实施例提供了一种基于置信度的语音语种识别***,如图2所示,包括:
语种匹配模块22:用于从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息。
语种识别模块23:用于根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种,
筛选模块24:用于若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至语种匹配模块。
本实施例中,还包括:
语音输入模块20:用于接收输入的语音信息;
语音分段模块21:用于根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
本实施例中,语种匹配模块22还包括:
标记单元221:用于获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
提取单元222:用于提取所述输入时间最早的语音片段作为预设语音片段。
本实施例中,语种识别模块23还包括:
预设语种单元231:用于将所述预设语音片段的语种信息作为预设语种;
语种对比单元232:用于通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
本实施例中,筛选模块24还包括:
置信度获取单元241:用于获取各个语音片段的当前语种置信度;
语音片段筛选单元242:用于将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
对于用户输入的语音信息,设置预设分段时长,对语音信息进行分段,多个分段可以同时进行语音语种的识别,进一步提高了语音识别效率。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (10)

1.一种基于置信度的语音语种识别方法,其特征在于,包括步骤:
S1:从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;
S2:根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;
S3:若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至步骤S1。
2.根据权利要求1所述的一种基于置信度的语音语种识别方法,其特征在于,所述步骤S1之前还包括步骤:
接收输入的语音信息;
根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
3.根据权利要求1所述的一种基于置信度的语音语种识别方法,其特征在于,所述步骤S1还包括步骤:
获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
提取所述输入时间最早的语音片段作为预设语音片段。
4.根据权利要求1所述的一种基于置信度的语音语种识别方法,其特征在于,所述步骤S2还包括步骤:
将所述预设语音片段的语种信息作为预设语种;
通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
5.根据权利要求1所述的一种基于置信度的语音语种识别方法,其特征在于,所述步骤S3还包括:
获取各个语音片段的当前语种置信度;
将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
6.一种基于置信度的语音语种识别***,其特征在于,包括:
语种匹配模块:用于从各个语音片段中提取一个语音片段作为预设语音片段,与预设语种数据库进行对比,获取与所述预设语音片段匹配的语种信息;
语种识别模块:用于根据所述语种信息,获取各个语音片段的语种置信度及置信度均值,判断所述置信度均值是否大于预设置信度阈值,若是,则将当前语种作为所述语音信息默认语种;
筛选模块:用于若否,则通过预设筛选条件,对所述各个语音片段进行筛选,直到所述语种置信度均值大于所述预设阈值,并获取所述筛选得到的语音片段,转至所述语种匹配模块。
7.根据权利要求6所述的一种基于置信度的语音语种识别***,其特征在于,还包括:
语音输入模块:用于接收输入的语音信息;
语音分段模块:用于根据预设分段时长,将所述语音信息按预设分段时长分为各个语音片段。
8.根据权利要求6所述的一种基于置信度的语音语种识别***,其特征在于,所述语种匹配模块还包括:
标记单元:用于获取各个语音片段的输入时间信息,通过输入时间先后顺序标记所述各个语音片段;
提取单元:用于提取所述输入时间最早的语音片段作为预设语音片段。
9.根据权利要求6所述的一种基于置信度的语音语种识别***,其特征在于,所述语种识别模块还包括:
预设语种单元:用于将所述预设语音片段的语种信息作为预设语种;
语种对比单元:用于通过所述各个语音片段与所述预设语种进行对比,获取各个语音片段的语种置信度。
10.根据权利要求6所述的一种基于置信度的语音语种识别***,其特征在于,所述筛选模块还包括:
置信度获取单元:用于获取各个语音片段的当前语种置信度;语音片段筛选单元:用于将所述各个语种置信度进行对比,将所述语种置信度最小的语音片段进行筛除。
CN201711425644.5A 2017-12-25 2017-12-25 一种基于置信度的语音语种识别方法及*** Active CN108172212B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711425644.5A CN108172212B (zh) 2017-12-25 2017-12-25 一种基于置信度的语音语种识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711425644.5A CN108172212B (zh) 2017-12-25 2017-12-25 一种基于置信度的语音语种识别方法及***

Publications (2)

Publication Number Publication Date
CN108172212A true CN108172212A (zh) 2018-06-15
CN108172212B CN108172212B (zh) 2020-09-11

Family

ID=62520743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711425644.5A Active CN108172212B (zh) 2017-12-25 2017-12-25 一种基于置信度的语音语种识别方法及***

Country Status (1)

Country Link
CN (1) CN108172212B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003600A (zh) * 2018-08-02 2018-12-14 科大讯飞股份有限公司 消息处理方法及装置
CN111369973A (zh) * 2020-02-28 2020-07-03 广州三星通信技术研究有限公司 用于在电子终端中选择翻译工具的方法和设备
CN111613208A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 一种语种识别方法和设备
CN112017630A (zh) * 2020-08-19 2020-12-01 北京字节跳动网络技术有限公司 一种语种识别方法、装置、电子设备及存储介质
CN113380226A (zh) * 2021-07-02 2021-09-10 因诺微科技(天津)有限公司 一种极短语音语种识别特征提取方法
CN113597641A (zh) * 2021-06-22 2021-11-02 华为技术有限公司 语音处理方法、装置及***
WO2021223232A1 (zh) * 2020-05-08 2021-11-11 赣州市牧士电子有限公司 一种基于Gaia AI语音控制的智能电视多语种识别***

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014277A1 (en) * 1998-12-22 2000-06-28 Nortel Networks Corporation Communication system and method employing automatic language identification
US20070233488A1 (en) * 2006-03-29 2007-10-04 Dictaphone Corporation System and method for applying dynamic contextual grammars and language models to improve automatic speech recognition accuracy
US20090157383A1 (en) * 2007-12-18 2009-06-18 Samsung Electronics Co., Ltd. Voice query extension method and system
US20100076747A1 (en) * 2008-09-25 2010-03-25 International Business Machines Corporation Mass electronic question filtering and enhancement system for audio broadcasts and voice conferences
CN101996631A (zh) * 2009-08-28 2011-03-30 国际商业机器公司 用于对齐文本的方法和装置
US20110106527A1 (en) * 2001-07-03 2011-05-05 Apptera, Inc. Method and Apparatus for Adapting a Voice Extensible Markup Language-enabled Voice System for Natural Speech Recognition and System Response
US8311824B2 (en) * 2008-10-27 2012-11-13 Nice-Systems Ltd Methods and apparatus for language identification
CN103853703A (zh) * 2014-02-19 2014-06-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104601834A (zh) * 2014-12-19 2015-05-06 国家电网公司 多语种自动语音呼叫应答装置及其使用方法
US20150134320A1 (en) * 2013-11-14 2015-05-14 At&T Intellectual Property I, L.P. System and method for translating real-time speech using segmentation based on conjunction locations
CN104766607A (zh) * 2015-03-05 2015-07-08 广州视源电子科技股份有限公司 一种电视节目推荐方法与***
CN104916283A (zh) * 2015-06-11 2015-09-16 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105336324A (zh) * 2015-11-17 2016-02-17 百度在线网络技术(北京)有限公司 一种语种识别方法及装置
CN106598937A (zh) * 2015-10-16 2017-04-26 阿里巴巴集团控股有限公司 用于文本的语种识别方法、装置和电子设备
CN106683662A (zh) * 2015-11-10 2017-05-17 中国电信股份有限公司 一种语音识别方法和装置
CN106897379A (zh) * 2017-01-20 2017-06-27 广东小天才科技有限公司 语音文件的lrc时间轴文件自动生成方法及相关设备
CN107256378A (zh) * 2017-04-24 2017-10-17 北京航空航天大学 语种识别方法及装置

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1014277A1 (en) * 1998-12-22 2000-06-28 Nortel Networks Corporation Communication system and method employing automatic language identification
US20110106527A1 (en) * 2001-07-03 2011-05-05 Apptera, Inc. Method and Apparatus for Adapting a Voice Extensible Markup Language-enabled Voice System for Natural Speech Recognition and System Response
US20070233488A1 (en) * 2006-03-29 2007-10-04 Dictaphone Corporation System and method for applying dynamic contextual grammars and language models to improve automatic speech recognition accuracy
US20090157383A1 (en) * 2007-12-18 2009-06-18 Samsung Electronics Co., Ltd. Voice query extension method and system
US20100076747A1 (en) * 2008-09-25 2010-03-25 International Business Machines Corporation Mass electronic question filtering and enhancement system for audio broadcasts and voice conferences
US8311824B2 (en) * 2008-10-27 2012-11-13 Nice-Systems Ltd Methods and apparatus for language identification
CN101996631A (zh) * 2009-08-28 2011-03-30 国际商业机器公司 用于对齐文本的方法和装置
US20150134320A1 (en) * 2013-11-14 2015-05-14 At&T Intellectual Property I, L.P. System and method for translating real-time speech using segmentation based on conjunction locations
CN103853703A (zh) * 2014-02-19 2014-06-11 联想(北京)有限公司 一种信息处理方法及电子设备
CN104601834A (zh) * 2014-12-19 2015-05-06 国家电网公司 多语种自动语音呼叫应答装置及其使用方法
CN104766607A (zh) * 2015-03-05 2015-07-08 广州视源电子科技股份有限公司 一种电视节目推荐方法与***
CN104916283A (zh) * 2015-06-11 2015-09-16 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN106598937A (zh) * 2015-10-16 2017-04-26 阿里巴巴集团控股有限公司 用于文本的语种识别方法、装置和电子设备
CN106683662A (zh) * 2015-11-10 2017-05-17 中国电信股份有限公司 一种语音识别方法和装置
CN105336324A (zh) * 2015-11-17 2016-02-17 百度在线网络技术(北京)有限公司 一种语种识别方法及装置
CN106897379A (zh) * 2017-01-20 2017-06-27 广东小天才科技有限公司 语音文件的lrc时间轴文件自动生成方法及相关设备
CN107256378A (zh) * 2017-04-24 2017-10-17 北京航空航天大学 语种识别方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
F.METZE ET AL: ""CONFIDENCE MEASURE BASED LANGUAGE IDENTIFICATION"", 《2000 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》 *
徐颖: ""语种识别声学建模方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
杜鑫: ""电话语音语种识别算法研究"", 《北京邮电大学硕士研究生学位论文》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003600A (zh) * 2018-08-02 2018-12-14 科大讯飞股份有限公司 消息处理方法及装置
CN111369973A (zh) * 2020-02-28 2020-07-03 广州三星通信技术研究有限公司 用于在电子终端中选择翻译工具的方法和设备
WO2021223232A1 (zh) * 2020-05-08 2021-11-11 赣州市牧士电子有限公司 一种基于Gaia AI语音控制的智能电视多语种识别***
CN111613208A (zh) * 2020-05-22 2020-09-01 云知声智能科技股份有限公司 一种语种识别方法和设备
CN111613208B (zh) * 2020-05-22 2023-08-25 云知声智能科技股份有限公司 一种语种识别方法和设备
CN112017630A (zh) * 2020-08-19 2020-12-01 北京字节跳动网络技术有限公司 一种语种识别方法、装置、电子设备及存储介质
CN112017630B (zh) * 2020-08-19 2022-04-01 北京字节跳动网络技术有限公司 一种语种识别方法、装置、电子设备及存储介质
CN113597641A (zh) * 2021-06-22 2021-11-02 华为技术有限公司 语音处理方法、装置及***
CN113380226A (zh) * 2021-07-02 2021-09-10 因诺微科技(天津)有限公司 一种极短语音语种识别特征提取方法

Also Published As

Publication number Publication date
CN108172212B (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN108172212A (zh) 一种基于置信度的语音语种识别方法及***
WO2015090215A1 (zh) 区分地域性口音的语音数据识别方法、装置和服务器
CN107067006B (zh) 一种服务于数据采集的验证码识别方法及***
CN110909205B (zh) 一种视频封面确定方法、装置、电子设备及可读存储介质
CN105448303B (zh) 语音信号的处理方法和装置
CN104347068B (zh) 音频信号处理装置和方法以及监控***
CN112633384A (zh) 基于图像识别模型的对象识别方法、装置和电子设备
CN113382279B (zh) 直播推荐方法、装置、设备、存储介质以及计算机程序产品
CN110970018B (zh) 语音识别方法和装置
CN109036386B (zh) 一种语音处理方法及装置
CN108171243B (zh) 一种基于深度神经网络的医疗图像信息识别方法及***
CN110856037A (zh) 一种视频封面确定方法、装置、电子设备及可读存储介质
CN108388553B (zh) 对话消除歧义的方法、电子设备及面向厨房的对话***
CN111797820B (zh) 一种视频数据处理方法、装置、电子设备及存储介质
CN111739539A (zh) 确定说话人数量的方法、装置及存储介质
CN112765324B (zh) 一种概念漂移检测方法及装置
CN112232206B (zh) 基于大数据和人工智能的人脸识别方法和人脸识别平台
CN113723157B (zh) 一种农作物病害识别方法、装置、电子设备及存储介质
CN112800919A (zh) 一种检测目标类型视频方法、装置、设备以及存储介质
US20160283582A1 (en) Device and method for detecting similar text, and application
CN110458094A (zh) 基于指纹相似度的设备分类方法
CN108347421B (zh) 一种基于内容的恶意邮件检测方法及***
CN105956550B (zh) 一种视频鉴别的方法和装置
CN111128227B (zh) 声音检测方法及装置
CN113076932B (zh) 训练音频语种识别模型的方法、视频检测方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201217

Address after: 264006 4th floor, building 2, energy saving science and Technology Park, Gaoxiong Road, Yantai Economic and Technological Development Zone, Shandong Province

Patentee after: Yantai HUAFA qixianqin Intellectual Property Operation Co.,Ltd.

Address before: 519031 Building 2-I, No. 5, Hengqin Financial Industry Service Base, Zhuhai City, Guangdong Province

Patentee before: HENGQIN INTERNATIONAL INTELLECTUAL PROPERTY EXCHANGE Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220314

Address after: 519031 Building No. 12-3, Hengqin Financial Industry Development Base, Zhuhai City, Guangdong Province (Centralized Office District)

Patentee after: HENGQIN INTERNATIONAL INTELLECTUAL PROPERTY EXCHANGE CO.,LTD.

Address before: 264006 4th floor, building 2, energy saving science and Technology Park, Gaoxiong Road, Yantai Economic and Technological Development Zone, Shandong Province

Patentee before: Yantai HUAFA qixianqin Intellectual Property Operation Co.,Ltd.

TR01 Transfer of patent right