CN109065031A - 语音标注方法、装置及设备 - Google Patents
语音标注方法、装置及设备 Download PDFInfo
- Publication number
- CN109065031A CN109065031A CN201810873608.3A CN201810873608A CN109065031A CN 109065031 A CN109065031 A CN 109065031A CN 201810873608 A CN201810873608 A CN 201810873608A CN 109065031 A CN109065031 A CN 109065031A
- Authority
- CN
- China
- Prior art keywords
- sentence
- phonetic
- identification
- information
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012216 screening Methods 0.000 claims description 32
- 238000012795 verification Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 abstract description 10
- 230000008569 process Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 206010002953 Aphonia Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (13)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810873608.3A CN109065031B (zh) | 2018-08-02 | 2018-08-02 | 语音标注方法、装置及设备 |
PCT/CN2019/089176 WO2020024690A1 (zh) | 2018-08-02 | 2019-05-30 | 语音标注方法、装置及设备 |
TW108119299A TW202008349A (zh) | 2018-08-02 | 2019-06-04 | 語音標註方法、裝置及設備 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810873608.3A CN109065031B (zh) | 2018-08-02 | 2018-08-02 | 语音标注方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109065031A true CN109065031A (zh) | 2018-12-21 |
CN109065031B CN109065031B (zh) | 2020-05-12 |
Family
ID=64832878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810873608.3A Active CN109065031B (zh) | 2018-08-02 | 2018-08-02 | 语音标注方法、装置及设备 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN109065031B (zh) |
TW (1) | TW202008349A (zh) |
WO (1) | WO2020024690A1 (zh) |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109493869A (zh) * | 2018-12-25 | 2019-03-19 | 苏州思必驰信息科技有限公司 | 音频数据的采集方法及*** |
CN109830229A (zh) * | 2018-12-11 | 2019-05-31 | 平安科技(深圳)有限公司 | 音频语料智能清洗方法、装置、存储介质和计算机设备 |
CN109948124A (zh) * | 2019-03-15 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 语音文件切分方法、装置及计算机设备 |
CN110310626A (zh) * | 2019-05-23 | 2019-10-08 | 平安科技(深圳)有限公司 | 语音训练数据生成方法、装置、设备及可读存储介质 |
CN110400580A (zh) * | 2019-08-30 | 2019-11-01 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备和介质 |
CN110503958A (zh) * | 2019-08-30 | 2019-11-26 | 厦门快商通科技股份有限公司 | 语音识别方法、***、移动终端及存储介质 |
CN110534100A (zh) * | 2019-08-27 | 2019-12-03 | 北京海天瑞声科技股份有限公司 | 一种基于语音识别的中文语音校对方法和装置 |
CN110610698A (zh) * | 2019-09-12 | 2019-12-24 | 上海依图信息技术有限公司 | 一种语音标注方法及装置 |
CN110718226A (zh) * | 2019-09-19 | 2020-01-21 | 厦门快商通科技股份有限公司 | 语音识别结果处理方法、装置、电子设备及介质 |
WO2020024690A1 (zh) * | 2018-08-02 | 2020-02-06 | 阿里巴巴集团控股有限公司 | 语音标注方法、装置及设备 |
CN110827827A (zh) * | 2019-11-27 | 2020-02-21 | 维沃移动通信有限公司 | 一种语音播报方法及电子设备 |
CN111429880A (zh) * | 2020-03-04 | 2020-07-17 | 苏州驰声信息科技有限公司 | 一种切割段落音频的方法、***、装置、介质 |
CN111710332A (zh) * | 2020-06-30 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 语音处理方法、装置、电子设备及存储介质 |
CN111883110A (zh) * | 2020-07-30 | 2020-11-03 | 上海携旅信息技术有限公司 | 语音识别的声学模型训练方法、***、设备及介质 |
CN111986654A (zh) * | 2020-08-04 | 2020-11-24 | 云知声智能科技股份有限公司 | 降低语音识别***延时的方法及*** |
CN112069805A (zh) * | 2019-12-20 | 2020-12-11 | 北京来也网络科技有限公司 | 结合rpa与ai的文本标注方法、装置、设备及存储介质 |
CN112133309A (zh) * | 2020-09-22 | 2020-12-25 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
CN112185390A (zh) * | 2020-09-27 | 2021-01-05 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 机上信息辅助方法及装置 |
CN112307748A (zh) * | 2020-03-02 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN112863490A (zh) * | 2021-01-07 | 2021-05-28 | 广州欢城文化传媒有限公司 | 一种语料获取方法及装置 |
CN113112997A (zh) * | 2019-12-25 | 2021-07-13 | 华为技术有限公司 | 数据采集的方法及装置 |
CN113205814A (zh) * | 2021-04-28 | 2021-08-03 | 平安科技(深圳)有限公司 | 语音数据标注方法、装置、电子设备及存储介质 |
CN113535017A (zh) * | 2020-09-28 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 一种绘本文件的处理、同步显示方法、装置及存储介质 |
CN113672760A (zh) * | 2021-08-19 | 2021-11-19 | 北京字跳网络技术有限公司 | 一种文本对应关系构建方法及其相关设备 |
CN113723086A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 一种文本处理方法、***、设备及介质 |
CN113923479A (zh) * | 2021-11-12 | 2022-01-11 | 北京百度网讯科技有限公司 | 音视频剪辑方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013149133A1 (en) * | 2012-03-30 | 2013-10-03 | Src, Inc. | Automated voice and speech labeling |
CN105632484A (zh) * | 2016-02-19 | 2016-06-01 | 上海语知义信息技术有限公司 | 语音合成数据库停顿信息自动标注方法及*** |
CN107516509A (zh) * | 2017-08-29 | 2017-12-26 | 苏州奇梦者网络科技有限公司 | 用于新闻播报语音合成的语音库构建方法及*** |
CN107578769A (zh) * | 2016-07-04 | 2018-01-12 | 科大讯飞股份有限公司 | 语音数据标注方法和装置 |
CN107657947A (zh) * | 2017-09-20 | 2018-02-02 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音处理方法及其装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0965176A (ja) * | 1995-08-21 | 1997-03-07 | Fujitsu General Ltd | プロンプタ装置 |
US20110153316A1 (en) * | 2009-12-21 | 2011-06-23 | Jonathan Pearl | Acoustic Perceptual Analysis and Synthesis System |
CN109065031B (zh) * | 2018-08-02 | 2020-05-12 | 阿里巴巴集团控股有限公司 | 语音标注方法、装置及设备 |
-
2018
- 2018-08-02 CN CN201810873608.3A patent/CN109065031B/zh active Active
-
2019
- 2019-05-30 WO PCT/CN2019/089176 patent/WO2020024690A1/zh active Application Filing
- 2019-06-04 TW TW108119299A patent/TW202008349A/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013149133A1 (en) * | 2012-03-30 | 2013-10-03 | Src, Inc. | Automated voice and speech labeling |
CN105632484A (zh) * | 2016-02-19 | 2016-06-01 | 上海语知义信息技术有限公司 | 语音合成数据库停顿信息自动标注方法及*** |
CN107578769A (zh) * | 2016-07-04 | 2018-01-12 | 科大讯飞股份有限公司 | 语音数据标注方法和装置 |
CN107516509A (zh) * | 2017-08-29 | 2017-12-26 | 苏州奇梦者网络科技有限公司 | 用于新闻播报语音合成的语音库构建方法及*** |
CN107657947A (zh) * | 2017-09-20 | 2018-02-02 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音处理方法及其装置 |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020024690A1 (zh) * | 2018-08-02 | 2020-02-06 | 阿里巴巴集团控股有限公司 | 语音标注方法、装置及设备 |
CN109830229A (zh) * | 2018-12-11 | 2019-05-31 | 平安科技(深圳)有限公司 | 音频语料智能清洗方法、装置、存储介质和计算机设备 |
CN109493869A (zh) * | 2018-12-25 | 2019-03-19 | 苏州思必驰信息科技有限公司 | 音频数据的采集方法及*** |
CN109948124A (zh) * | 2019-03-15 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 语音文件切分方法、装置及计算机设备 |
CN109948124B (zh) * | 2019-03-15 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 语音文件切分方法、装置及计算机设备 |
CN110310626A (zh) * | 2019-05-23 | 2019-10-08 | 平安科技(深圳)有限公司 | 语音训练数据生成方法、装置、设备及可读存储介质 |
CN110534100A (zh) * | 2019-08-27 | 2019-12-03 | 北京海天瑞声科技股份有限公司 | 一种基于语音识别的中文语音校对方法和装置 |
CN110400580B (zh) * | 2019-08-30 | 2022-06-17 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备和介质 |
CN110400580A (zh) * | 2019-08-30 | 2019-11-01 | 北京百度网讯科技有限公司 | 音频处理方法、装置、设备和介质 |
CN110503958A (zh) * | 2019-08-30 | 2019-11-26 | 厦门快商通科技股份有限公司 | 语音识别方法、***、移动终端及存储介质 |
CN110610698A (zh) * | 2019-09-12 | 2019-12-24 | 上海依图信息技术有限公司 | 一种语音标注方法及装置 |
CN110610698B (zh) * | 2019-09-12 | 2022-09-27 | 上海依图信息技术有限公司 | 一种语音标注方法及装置 |
CN110718226A (zh) * | 2019-09-19 | 2020-01-21 | 厦门快商通科技股份有限公司 | 语音识别结果处理方法、装置、电子设备及介质 |
CN110718226B (zh) * | 2019-09-19 | 2023-05-05 | 厦门快商通科技股份有限公司 | 语音识别结果处理方法、装置、电子设备及介质 |
CN110827827A (zh) * | 2019-11-27 | 2020-02-21 | 维沃移动通信有限公司 | 一种语音播报方法及电子设备 |
CN112069805A (zh) * | 2019-12-20 | 2020-12-11 | 北京来也网络科技有限公司 | 结合rpa与ai的文本标注方法、装置、设备及存储介质 |
CN113112997A (zh) * | 2019-12-25 | 2021-07-13 | 华为技术有限公司 | 数据采集的方法及装置 |
CN112307748A (zh) * | 2020-03-02 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 用于处理文本的方法和装置 |
CN111429880A (zh) * | 2020-03-04 | 2020-07-17 | 苏州驰声信息科技有限公司 | 一种切割段落音频的方法、***、装置、介质 |
CN111710332A (zh) * | 2020-06-30 | 2020-09-25 | 北京达佳互联信息技术有限公司 | 语音处理方法、装置、电子设备及存储介质 |
CN111883110A (zh) * | 2020-07-30 | 2020-11-03 | 上海携旅信息技术有限公司 | 语音识别的声学模型训练方法、***、设备及介质 |
CN111883110B (zh) * | 2020-07-30 | 2024-02-06 | 上海携旅信息技术有限公司 | 语音识别的声学模型训练方法、***、设备及介质 |
CN111986654A (zh) * | 2020-08-04 | 2020-11-24 | 云知声智能科技股份有限公司 | 降低语音识别***延时的方法及*** |
CN111986654B (zh) * | 2020-08-04 | 2024-01-19 | 云知声智能科技股份有限公司 | 降低语音识别***延时的方法及*** |
CN112133309B (zh) * | 2020-09-22 | 2021-08-24 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
CN112133309A (zh) * | 2020-09-22 | 2020-12-25 | 掌阅科技股份有限公司 | 音频和文本的同步方法、计算设备及存储介质 |
CN112185390A (zh) * | 2020-09-27 | 2021-01-05 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 机上信息辅助方法及装置 |
CN112185390B (zh) * | 2020-09-27 | 2023-10-03 | 中国商用飞机有限责任公司北京民用飞机技术研究中心 | 机上信息辅助方法及装置 |
CN113535017B (zh) * | 2020-09-28 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 一种绘本文件的处理、同步显示方法、装置及存储介质 |
CN113535017A (zh) * | 2020-09-28 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 一种绘本文件的处理、同步显示方法、装置及存储介质 |
CN112863490A (zh) * | 2021-01-07 | 2021-05-28 | 广州欢城文化传媒有限公司 | 一种语料获取方法及装置 |
CN112863490B (zh) * | 2021-01-07 | 2024-04-30 | 广州欢城文化传媒有限公司 | 一种语料获取方法及装置 |
CN113205814B (zh) * | 2021-04-28 | 2024-03-12 | 平安科技(深圳)有限公司 | 语音数据标注方法、装置、电子设备及存储介质 |
CN113205814A (zh) * | 2021-04-28 | 2021-08-03 | 平安科技(深圳)有限公司 | 语音数据标注方法、装置、电子设备及存储介质 |
CN113672760A (zh) * | 2021-08-19 | 2021-11-19 | 北京字跳网络技术有限公司 | 一种文本对应关系构建方法及其相关设备 |
CN113723086B (zh) * | 2021-08-31 | 2023-09-05 | 平安科技(深圳)有限公司 | 一种文本处理方法、***、设备及介质 |
CN113723086A (zh) * | 2021-08-31 | 2021-11-30 | 平安科技(深圳)有限公司 | 一种文本处理方法、***、设备及介质 |
CN113923479A (zh) * | 2021-11-12 | 2022-01-11 | 北京百度网讯科技有限公司 | 音视频剪辑方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
TW202008349A (zh) | 2020-02-16 |
CN109065031B (zh) | 2020-05-12 |
WO2020024690A1 (zh) | 2020-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109065031A (zh) | 语音标注方法、装置及设备 | |
CN107305541B (zh) | 语音识别文本分段方法及装置 | |
CN101710490B (zh) | 语音评测的噪声补偿方法及装置 | |
CN110263322A (zh) | 用于语音识别的音频语料筛选方法、装置及计算机设备 | |
CN106570180B (zh) | 基于人工智能的语音搜索方法及装置 | |
US10140976B2 (en) | Discriminative training of automatic speech recognition models with natural language processing dictionary for spoken language processing | |
CN104903954A (zh) | 使用基于人工神经网络的亚语音单位区分的说话人验证及识别 | |
CN111552777B (zh) | 一种音频识别方法、装置、电子设备及存储介质 | |
CN111785275A (zh) | 语音识别方法及装置 | |
CN109858038A (zh) | 一种文本标点确定方法及装置 | |
CN109657228A (zh) | 一种敏感文本确定方法及装置 | |
CN112259083A (zh) | 音频处理方法及装置 | |
CN109800309A (zh) | 课堂话语类型分类方法及装置 | |
CN110853627B (zh) | 用于语音标注的方法及*** | |
CN110503941B (zh) | 语言能力评测方法、装置、***、计算机设备及存储介质 | |
CN117217315A (zh) | 一种利用大语言模型生成高质量问答数据的方法及装置 | |
CN116150651A (zh) | 基于ai的深度合成检测方法和*** | |
CN113782026A (zh) | 一种信息处理方法、装置、介质和设备 | |
CN111966839B (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
CN112699671B (zh) | 一种语言标注方法、装置、计算机设备和存储介质 | |
CN114691907B (zh) | 一种跨模态检索的方法、设备及介质 | |
KR20190108472A (ko) | 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템 | |
CN113689860A (zh) | 语音识别模型的训练、语音识别方法、装置及设备 | |
CN114155841A (zh) | 语音识别方法、装置、设备及存储介质 | |
CN114141235A (zh) | 语音语料库生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40002006 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200930 Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands Patentee after: Innovative advanced technology Co.,Ltd. Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands Patentee before: Advanced innovation technology Co.,Ltd. Effective date of registration: 20200930 Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands Patentee after: Advanced innovation technology Co.,Ltd. Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands Patentee before: Alibaba Group Holding Ltd. |