CN107729321A - 一种语音识别结果纠错方法 - Google Patents

一种语音识别结果纠错方法 Download PDF

Info

Publication number
CN107729321A
CN107729321A CN201710994082.XA CN201710994082A CN107729321A CN 107729321 A CN107729321 A CN 107729321A CN 201710994082 A CN201710994082 A CN 201710994082A CN 107729321 A CN107729321 A CN 107729321A
Authority
CN
China
Prior art keywords
text
identification result
voice identification
candidate
phonetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710994082.XA
Other languages
English (en)
Inventor
叶伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Century Network Technology Co., Ltd.
Original Assignee
Shanghai Century Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Century Network Technology Co Ltd filed Critical Shanghai Century Network Technology Co Ltd
Priority to CN201710994082.XA priority Critical patent/CN107729321A/zh
Publication of CN107729321A publication Critical patent/CN107729321A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

一种语音识别结果纠错方法,包括对语音识别结果进行预处理;找出语音识别结果中容易出错的词句,或对文本语义解析重要的待纠正词、字;对待纠正词、字进行注音,包括全拼和各拼音首字母两种拼音方式,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调;根据所述拼音全拼方式,利用编辑距离确算法,确定最优候选文本及次优候选文本;根据所述拼音首字母,利用编辑距离算法,确定最优候选文本及次优候选文本;将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个;分别将准候选文本替换待纠错文本,利用n‑grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果。

Description

一种语音识别结果纠错方法
技术领域
本发明属于人工智能技术领域,特别涉及一种语音识别结果纠错方法。
背景技术
随着语音识别技术的日臻成熟,语音交互使用范围越来越广。相比其他交互方式,语音交互所实现的交互方式更符合人们的日常习惯,也更为高效。目前,语音交互方式在智能家居、工业控制、驾驶辅助等各个领域,都得到了广泛应用。
在实际应用中,由于周围噪音、方言等因素的影响,语音交互过程中语音识别的结果往往与用户的表达不一致。尤其在日常口语场景下,语音识别的错误率较高。而现有技术中,都集中在提升语音识别准确率上,却缺乏对识别错误的纠错手段,因而影响了语音识别技术的进一步推广。
发明内容
本发明提供一种语音识别结果纠错方法,用以对语音识别的结果文本进行准确的纠错。
一种语音识别结果纠错方法,包括以下步骤:
S11,对语音识别结果进行预处理;
S12,找出语音识别结果中容易出错的词句,或对文本语义解析重要的待纠正词、字;
S13,对待纠正词、字进行注音,包括全拼和各拼音首字母两种拼音方式,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调;
S14,根据所述拼音全拼方式,利用编辑距离确算法,确定最优候选文本及次优候选文本;
S15,根据所述拼音首字母,再次利用编辑距离算法,确定最优候选文本及次优候选文本;
S16,将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个;
S17,分别将准候选文本替换待纠错文本,利用n-grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果。
步骤S11中的预处理包括分词、词性标注、去停用词及进行语法分析文本操作。
本发明通过对语音识别结果进行分词、词性标注、去除停用词及进行语法分析。将结果中动宾结构短语、动词、名词及未在词典库中出现的词作为待纠正文本,同时注意保持各词在原语音文本中的顺序;将待纠正文本结果进行分词,并得到各分词所对应的拼音;根据各分词所述拼音从词典库中获取候选词,并在候选词中确定最优候选词;判断所述最优候选词是否满足预设条件;如果满足预设条件,用所述最优候选词替换原文本待纠正词。将所有纠正结果合并,得出最终语音识别纠正结果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1本发明实施例中的语音识别结果纠错方法的流程示意图。
具体实施方式
参见图1,本实施例的方法包括:
S11:对语音识别结果进行分词、词性标注、去停用词及进行语法分析等文本操作
S12:根据已有或将来出现的技术,找出容易出错或对文本语义解析重要的待纠正词、字。尤其注意语音识别结果中动宾结构短语、动词、名词及未在词典库中出现的词。
S13:对待纠正词、字进行注音,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调。
此种情况又分多种情况,详细阐述如下:
同音别字,取全拼:
例如,待纠正的语音识别结果是“看三声三是”,分完词后对应的拼音是:kan sansheng san shi
发音不标准,取各字首字母:
例如,待纠正的语音识别结果是“看山山山是”,分完词后对应的拼音是:kan shanshan shan shi,可对其只取各词首字母k s s s s
S14:首先根据所述拼音全拼,利用编辑距离确算法,确定最优候选文本及次优候选文本;
S15:其次根据所述拼音首字母,再次利用编辑距离算法,确定最优候选文本及次优候选文本。
S16:将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个,所有统称为准候选文本。
S17:分别将准候选文本替换待纠错文本,利用n-grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (2)

1.一种语音识别结果纠错方法,其特征在于,包括以下步骤:
S11,对语音识别结果进行预处理;
S12,找出语音识别结果中容易出错的词句,或对文本语义解析重要的待纠正词、字;
S13,对待纠正词、字进行注音,包括全拼和各拼音首字母两种拼音方式,得到待纠正语音识别结果对应的拼音,对应的拼音是指无音调;
S14,根据所述拼音全拼方式,利用编辑距离确算法,确定最优候选文本及次优候选文本;
S15,根据所述拼音首字母,再次利用编辑距离算法,确定最优候选文本及次优候选文本;
S16,将所有最优候选文本及次优候选文本合并,重复的候选项只保留一个;
S17,分别将准候选文本替换待纠错文本,利用n-grama语言模型分别计算出各替换后的各自语句概率,选取概率最高的作为最终所述待纠正的语音识别结果。
2.如权利要求1所述的语音识别结果纠错方法,其特征在于,步骤S11中的预处理包括分词、词性标注、去停用词及进行语法分析文本操作。
CN201710994082.XA 2017-10-23 2017-10-23 一种语音识别结果纠错方法 Pending CN107729321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710994082.XA CN107729321A (zh) 2017-10-23 2017-10-23 一种语音识别结果纠错方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710994082.XA CN107729321A (zh) 2017-10-23 2017-10-23 一种语音识别结果纠错方法

Publications (1)

Publication Number Publication Date
CN107729321A true CN107729321A (zh) 2018-02-23

Family

ID=61212500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710994082.XA Pending CN107729321A (zh) 2017-10-23 2017-10-23 一种语音识别结果纠错方法

Country Status (1)

Country Link
CN (1) CN107729321A (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质
CN108595419A (zh) * 2018-04-11 2018-09-28 广州视源电子科技股份有限公司 候选词评估方法、候选词排序方法及装置
CN108694166A (zh) * 2018-04-11 2018-10-23 广州视源电子科技股份有限公司 候选词评估方法、装置、计算机设备和存储介质
CN108804414A (zh) * 2018-05-04 2018-11-13 科沃斯商用机器人有限公司 文本修正方法、装置、智能设备及可读存储介质
CN108959250A (zh) * 2018-06-27 2018-12-07 众安信息技术服务有限公司 一种基于语言模型和词特征的纠错方法及其***
CN109522550A (zh) * 2018-11-08 2019-03-26 和美(深圳)信息技术股份有限公司 文本信息纠错方法、装置、计算机设备和存储介质
CN109684643A (zh) * 2018-12-26 2019-04-26 湖北亿咖通科技有限公司 基于句向量的文本识别方法、电子设备及计算机可读介质
CN109710929A (zh) * 2018-12-18 2019-05-03 金蝶软件(中国)有限公司 一种语音识别文本的校正方法、装置、计算机设备和存储介质
CN109918485A (zh) * 2019-01-07 2019-06-21 口碑(上海)信息技术有限公司 语音识别菜品的方法及装置、存储介质、电子装置
CN109977412A (zh) * 2019-03-29 2019-07-05 北京林业大学 一种字段值纠错方法、装置、可读介质及存储控制器
CN110176237A (zh) * 2019-07-09 2019-08-27 北京金山数字娱乐科技有限公司 一种语音识别方法及装置
CN110210029A (zh) * 2019-05-30 2019-09-06 浙江远传信息技术股份有限公司 基于垂直领域的语音文本纠错方法、***、设备及介质
CN110265019A (zh) * 2019-07-03 2019-09-20 中通智新(武汉)技术研发有限公司 一种语音识别的方法及语音机器人***
CN110600005A (zh) * 2018-06-13 2019-12-20 蔚来汽车有限公司 语音识别纠错方法及装置、计算机设备和记录介质
CN110765763A (zh) * 2019-09-24 2020-02-07 金蝶软件(中国)有限公司 语音识别文本的纠错方法、装置、计算机设备和存储介质
CN111274785A (zh) * 2020-01-21 2020-06-12 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111326144A (zh) * 2020-02-28 2020-06-23 网易(杭州)网络有限公司 语音数据处理方法、装置、介质和计算设备
CN111339757A (zh) * 2020-02-13 2020-06-26 上海凯岸信息科技有限公司 一种催收场景下语音识别结果的纠错方法
CN111350249A (zh) * 2020-04-13 2020-06-30 于巧宇 一种基于语音识别的智能马桶装置
CN111613214A (zh) * 2020-05-21 2020-09-01 重庆农村商业银行股份有限公司 一种用于提升语音识别能力的语言模型纠错方法
CN112084775A (zh) * 2020-09-10 2020-12-15 中航华东光电(上海)有限公司 一种语音转换后文本纠错方法
CN112560493A (zh) * 2020-12-17 2021-03-26 金蝶软件(中国)有限公司 命名实体纠错方法、装置、计算机设备和存储介质
CN112560842A (zh) * 2020-12-07 2021-03-26 马上消费金融股份有限公司 一种信息识别方法、装置、设备和可读存储介质
WO2021218329A1 (zh) * 2020-04-28 2021-11-04 深圳壹账通智能科技有限公司 平行语料生成方法、装置、设备及存储介质
CN113763961A (zh) * 2020-06-02 2021-12-07 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN114091408A (zh) * 2020-08-04 2022-02-25 科沃斯商用机器人有限公司 文本纠正、模型训练方法、纠正模型、设备及机器人

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104464736A (zh) * 2014-12-15 2015-03-25 北京百度网讯科技有限公司 语音识别文本的纠错方法和装置
CN105869642A (zh) * 2016-03-25 2016-08-17 海信集团有限公司 一种语音文本的纠错方法及装置
CN106297797A (zh) * 2016-07-26 2017-01-04 百度在线网络技术(北京)有限公司 语音识别结果纠错方法和装置
EP3113176A1 (en) * 2015-06-30 2017-01-04 Samsung Electronics Co., Ltd. Speech recognition apparatus, speech recognition method, and electronic device
CN106847288A (zh) * 2017-02-17 2017-06-13 上海创米科技有限公司 语音识别文本的纠错方法与装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104464736A (zh) * 2014-12-15 2015-03-25 北京百度网讯科技有限公司 语音识别文本的纠错方法和装置
EP3113176A1 (en) * 2015-06-30 2017-01-04 Samsung Electronics Co., Ltd. Speech recognition apparatus, speech recognition method, and electronic device
CN105869642A (zh) * 2016-03-25 2016-08-17 海信集团有限公司 一种语音文本的纠错方法及装置
CN106297797A (zh) * 2016-07-26 2017-01-04 百度在线网络技术(北京)有限公司 语音识别结果纠错方法和装置
CN106847288A (zh) * 2017-02-17 2017-06-13 上海创米科技有限公司 语音识别文本的纠错方法与装置

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595419A (zh) * 2018-04-11 2018-09-28 广州视源电子科技股份有限公司 候选词评估方法、候选词排序方法及装置
CN108694166A (zh) * 2018-04-11 2018-10-23 广州视源电子科技股份有限公司 候选词评估方法、装置、计算机设备和存储介质
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质
CN108804414A (zh) * 2018-05-04 2018-11-13 科沃斯商用机器人有限公司 文本修正方法、装置、智能设备及可读存储介质
CN110600005A (zh) * 2018-06-13 2019-12-20 蔚来汽车有限公司 语音识别纠错方法及装置、计算机设备和记录介质
CN110600005B (zh) * 2018-06-13 2023-09-19 蔚来(安徽)控股有限公司 语音识别纠错方法及装置、计算机设备和记录介质
CN108959250A (zh) * 2018-06-27 2018-12-07 众安信息技术服务有限公司 一种基于语言模型和词特征的纠错方法及其***
CN109522550A (zh) * 2018-11-08 2019-03-26 和美(深圳)信息技术股份有限公司 文本信息纠错方法、装置、计算机设备和存储介质
CN109710929A (zh) * 2018-12-18 2019-05-03 金蝶软件(中国)有限公司 一种语音识别文本的校正方法、装置、计算机设备和存储介质
CN109684643A (zh) * 2018-12-26 2019-04-26 湖北亿咖通科技有限公司 基于句向量的文本识别方法、电子设备及计算机可读介质
CN109684643B (zh) * 2018-12-26 2021-03-12 湖北亿咖通科技有限公司 基于句向量的文本识别方法、电子设备及计算机可读介质
CN109918485A (zh) * 2019-01-07 2019-06-21 口碑(上海)信息技术有限公司 语音识别菜品的方法及装置、存储介质、电子装置
CN109977412B (zh) * 2019-03-29 2022-12-27 北京林业大学 语音识别文本的字段值纠错方法、装置及存储控制器
CN109977412A (zh) * 2019-03-29 2019-07-05 北京林业大学 一种字段值纠错方法、装置、可读介质及存储控制器
CN110210029A (zh) * 2019-05-30 2019-09-06 浙江远传信息技术股份有限公司 基于垂直领域的语音文本纠错方法、***、设备及介质
CN110265019A (zh) * 2019-07-03 2019-09-20 中通智新(武汉)技术研发有限公司 一种语音识别的方法及语音机器人***
CN110176237A (zh) * 2019-07-09 2019-08-27 北京金山数字娱乐科技有限公司 一种语音识别方法及装置
CN110765763B (zh) * 2019-09-24 2023-12-12 金蝶软件(中国)有限公司 语音识别文本的纠错方法、装置、计算机设备和存储介质
CN110765763A (zh) * 2019-09-24 2020-02-07 金蝶软件(中国)有限公司 语音识别文本的纠错方法、装置、计算机设备和存储介质
CN111274785A (zh) * 2020-01-21 2020-06-12 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111274785B (zh) * 2020-01-21 2023-06-20 北京字节跳动网络技术有限公司 一种文本纠错方法、装置、设备及介质
CN111339757A (zh) * 2020-02-13 2020-06-26 上海凯岸信息科技有限公司 一种催收场景下语音识别结果的纠错方法
CN111326144A (zh) * 2020-02-28 2020-06-23 网易(杭州)网络有限公司 语音数据处理方法、装置、介质和计算设备
CN111326144B (zh) * 2020-02-28 2023-03-03 网易(杭州)网络有限公司 语音数据处理方法、装置、介质和计算设备
CN111350249A (zh) * 2020-04-13 2020-06-30 于巧宇 一种基于语音识别的智能马桶装置
WO2021218329A1 (zh) * 2020-04-28 2021-11-04 深圳壹账通智能科技有限公司 平行语料生成方法、装置、设备及存储介质
CN111613214A (zh) * 2020-05-21 2020-09-01 重庆农村商业银行股份有限公司 一种用于提升语音识别能力的语言模型纠错方法
CN113763961A (zh) * 2020-06-02 2021-12-07 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN113763961B (zh) * 2020-06-02 2024-04-09 阿里巴巴集团控股有限公司 一种文本处理方法及装置
CN114091408A (zh) * 2020-08-04 2022-02-25 科沃斯商用机器人有限公司 文本纠正、模型训练方法、纠正模型、设备及机器人
CN112084775B (zh) * 2020-09-10 2021-09-07 中航华东光电(上海)有限公司 一种语音转换后文本纠错方法
CN112084775A (zh) * 2020-09-10 2020-12-15 中航华东光电(上海)有限公司 一种语音转换后文本纠错方法
CN112560842A (zh) * 2020-12-07 2021-03-26 马上消费金融股份有限公司 一种信息识别方法、装置、设备和可读存储介质
CN112560493A (zh) * 2020-12-17 2021-03-26 金蝶软件(中国)有限公司 命名实体纠错方法、装置、计算机设备和存储介质
CN112560493B (zh) * 2020-12-17 2024-04-30 金蝶软件(中国)有限公司 命名实体纠错方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN107729321A (zh) 一种语音识别结果纠错方法
US8719021B2 (en) Speech recognition dictionary compilation assisting system, speech recognition dictionary compilation assisting method and speech recognition dictionary compilation assisting program
CN104166462B (zh) 一种文字的输入方法和***
US8126714B2 (en) Voice search device
US7412387B2 (en) Automatic improvement of spoken language
US8073677B2 (en) Speech translation apparatus, method and computer readable medium for receiving a spoken language and translating to an equivalent target language
CN105404621B (zh) 一种用于盲人读取汉字的方法及***
CN109637537B (zh) 一种自动获取标注数据优化自定义唤醒模型的方法
KR100825690B1 (ko) 음성 인식 시스템에서의 인식 오류 수정 방법
Smith Limits on the application of frequency-based language models to OCR
JPWO2016067418A1 (ja) 対話制御装置および対話制御方法
JP2009140503A (ja) 音声翻訳方法及び装置
CN110942767B (zh) 一种asr语言模型识别标注与优化方法及其装置
CN111613214A (zh) 一种用于提升语音识别能力的语言模型纠错方法
CN111985234B (zh) 语音文本纠错方法
CN111883137A (zh) 基于语音识别的文本处理方法及装置
Abandah et al. Investigating hybrid approaches for Arabic text diacritization with recurrent neural networks
US8335681B2 (en) Machine-translation apparatus using multi-stage verbal-phrase patterns, methods for applying and extracting multi-stage verbal-phrase patterns
CN112489655A (zh) 一种特定领域的语音识别文本纠错方法、***和存储介质
Rasooli et al. Unsupervised morphology-based vocabulary expansion
Ostrogonac et al. Morphology-based vs unsupervised word clustering for training language models for Serbian
Christodoulides et al. Automatic detection and annotation of disfluencies in spoken French corpora
CN111898342A (zh) 一种基于编辑距离的中文发音校验方法
Neubig et al. Improved statistical models for SMT-based speaking style transformation
Adams et al. Learning a Translation Model from Word Lattices.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180604

Address after: 200126 Yaohua Road, Pudong New Area, Shanghai, Room 204, room 560

Applicant after: Ye Wei

Address before: 200050 West Yan'an Road, Changning District, Changning District, Shanghai, 4

Applicant before: Shanghai Century Network Technology Co., Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190404

Address after: Room 1287, 1/1, 8 Block 33 Guangshun Road, Changning District, Shanghai, 2003

Applicant after: Shanghai Century Network Technology Co., Ltd.

Address before: 200126 Yaohua Road, Pudong New Area, Shanghai, Room 204, room 560

Applicant before: Ye Wei

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180223

RJ01 Rejection of invention patent application after publication