CN102799579A - 具有错误自诊断和自纠错功能的统计机器翻译方法 - Google Patents
具有错误自诊断和自纠错功能的统计机器翻译方法 Download PDFInfo
- Publication number
- CN102799579A CN102799579A CN2012102492232A CN201210249223A CN102799579A CN 102799579 A CN102799579 A CN 102799579A CN 2012102492232 A CN2012102492232 A CN 2012102492232A CN 201210249223 A CN201210249223 A CN 201210249223A CN 102799579 A CN102799579 A CN 102799579A
- Authority
- CN
- China
- Prior art keywords
- translation
- speech
- error
- network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
*** | BLEU4 | TER |
现有的基线*** | 23.60 | 63.56 |
本发明方法 | 24.80 | 62.00 |
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210249223.2A CN102799579B (zh) | 2012-07-18 | 2012-07-18 | 具有错误自诊断和自纠错功能的统计机器翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210249223.2A CN102799579B (zh) | 2012-07-18 | 2012-07-18 | 具有错误自诊断和自纠错功能的统计机器翻译方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102799579A true CN102799579A (zh) | 2012-11-28 |
CN102799579B CN102799579B (zh) | 2015-01-21 |
Family
ID=47198691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210249223.2A Active CN102799579B (zh) | 2012-07-18 | 2012-07-18 | 具有错误自诊断和自纠错功能的统计机器翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102799579B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092831A (zh) * | 2013-01-25 | 2013-05-08 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
CN105550174A (zh) * | 2015-12-30 | 2016-05-04 | 哈尔滨工业大学 | 基于样本重要性的自动机器翻译领域自适应方法 |
CN105701089A (zh) * | 2015-12-31 | 2016-06-22 | 成都数联铭品科技有限公司 | 一种机器翻译错词修正的后编辑处理方法 |
CN103871407B (zh) * | 2012-12-07 | 2017-04-19 | 浦项工科大学校产学协力团 | 语音识别错误的纠正方法及装置 |
CN107168950A (zh) * | 2017-05-02 | 2017-09-15 | 苏州大学 | 一种基于双语语义映射的事件短语学习方法及装置 |
CN107977454A (zh) * | 2017-12-15 | 2018-05-01 | 传神语联网网络科技股份有限公司 | 双语语料清洗的方法、装置及计算机可读存储介质 |
CN108491388A (zh) * | 2018-03-22 | 2018-09-04 | 平安科技(深圳)有限公司 | 数据集获取方法、分类方法、装置、设备及存储介质 |
CN109062908A (zh) * | 2018-07-20 | 2018-12-21 | 北京雅信诚医学信息科技有限公司 | 一种专用翻译器 |
CN109145300A (zh) * | 2018-08-17 | 2019-01-04 | 武汉斗鱼网络科技有限公司 | 一种搜索文本的纠正方法、装置及终端 |
CN110462730A (zh) * | 2018-03-07 | 2019-11-15 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
CN110472251A (zh) * | 2018-05-10 | 2019-11-19 | 腾讯科技(深圳)有限公司 | 翻译模型训练的方法、语句翻译的方法、设备及存储介质 |
CN110546634A (zh) * | 2017-04-27 | 2019-12-06 | 松下知识产权经营株式会社 | 翻译装置 |
CN110705318A (zh) * | 2019-09-04 | 2020-01-17 | 南京题麦壳斯信息科技有限公司 | 一种机器翻译引擎测评优选方法及*** |
CN110929504A (zh) * | 2018-09-20 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 语句诊断方法、装置和*** |
CN111160046A (zh) * | 2018-11-07 | 2020-05-15 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN111539231A (zh) * | 2020-04-29 | 2020-08-14 | 北京金山安全软件有限公司 | 一种翻译方法、装置、服务器及计算机可读存储介质 |
CN112215018A (zh) * | 2020-08-28 | 2021-01-12 | 北京中科凡语科技有限公司 | 校正术语对的自动定位方法、装置、电子设备及存储介质 |
CN112528683A (zh) * | 2020-12-23 | 2021-03-19 | 深圳市爱科云通科技有限公司 | 文本翻译校正方法、装置、***、服务器及可读存储介质 |
CN114049528A (zh) * | 2022-01-12 | 2022-02-15 | 上海蜜度信息技术有限公司 | 一种品牌名称识别的方法及设备 |
US11354521B2 (en) | 2018-03-07 | 2022-06-07 | Google Llc | Facilitating communications with automated assistants in multiple languages |
CN117828007A (zh) * | 2024-01-02 | 2024-04-05 | 长江勘测规划设计研究有限责任公司 | 基于自然语言处理的建设征地移民档案管理方法及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221576A (zh) * | 2008-01-23 | 2008-07-16 | 腾讯科技(深圳)有限公司 | 一种能够实现自动翻译的输入方法及装置 |
-
2012
- 2012-07-18 CN CN201210249223.2A patent/CN102799579B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101221576A (zh) * | 2008-01-23 | 2008-07-16 | 腾讯科技(深圳)有限公司 | 一种能够实现自动翻译的输入方法及装置 |
Non-Patent Citations (3)
Title |
---|
NICOLA UEFFING , KLAUS MACHEREY , HERMANN NEY: "Confidence Measures for Statistical Machine Translation", 《PROC. MT SUMMIT IX》 * |
NICOLA UEFFING,HERMANN NEY: "Word-Level Confidence Estimation for Machine Translation", 《2007 ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》 * |
SIMONA GANDRABUR,GEORGE FOSTER: "Confidence estimation for translation prediction", 《CONLL 03 PROCEEDINGS OF THE SEVENTH CONFERENCE ON NATURAL LANGUAGE LEARNING》 * |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871407B (zh) * | 2012-12-07 | 2017-04-19 | 浦项工科大学校产学协力团 | 语音识别错误的纠正方法及装置 |
CN103092831A (zh) * | 2013-01-25 | 2013-05-08 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
WO2014114140A1 (zh) * | 2013-01-25 | 2014-07-31 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
CN105550174A (zh) * | 2015-12-30 | 2016-05-04 | 哈尔滨工业大学 | 基于样本重要性的自动机器翻译领域自适应方法 |
CN105701089A (zh) * | 2015-12-31 | 2016-06-22 | 成都数联铭品科技有限公司 | 一种机器翻译错词修正的后编辑处理方法 |
CN110546634A (zh) * | 2017-04-27 | 2019-12-06 | 松下知识产权经营株式会社 | 翻译装置 |
CN107168950A (zh) * | 2017-05-02 | 2017-09-15 | 苏州大学 | 一种基于双语语义映射的事件短语学习方法及装置 |
CN107977454A (zh) * | 2017-12-15 | 2018-05-01 | 传神语联网网络科技股份有限公司 | 双语语料清洗的方法、装置及计算机可读存储介质 |
CN110462730A (zh) * | 2018-03-07 | 2019-11-15 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
US11942082B2 (en) | 2018-03-07 | 2024-03-26 | Google Llc | Facilitating communications with automated assistants in multiple languages |
US11915692B2 (en) | 2018-03-07 | 2024-02-27 | Google Llc | Facilitating end-to-end communications with automated assistants in multiple languages |
US11354521B2 (en) | 2018-03-07 | 2022-06-07 | Google Llc | Facilitating communications with automated assistants in multiple languages |
US10984784B2 (en) | 2018-03-07 | 2021-04-20 | Google Llc | Facilitating end-to-end communications with automated assistants in multiple languages |
CN110462730B (zh) * | 2018-03-07 | 2021-03-30 | 谷歌有限责任公司 | 促进以多种语言与自动化助理的端到端沟通 |
CN108491388A (zh) * | 2018-03-22 | 2018-09-04 | 平安科技(深圳)有限公司 | 数据集获取方法、分类方法、装置、设备及存储介质 |
CN108491388B (zh) * | 2018-03-22 | 2021-02-23 | 平安科技(深圳)有限公司 | 数据集获取方法、分类方法、装置、设备及存储介质 |
CN110472251A (zh) * | 2018-05-10 | 2019-11-19 | 腾讯科技(深圳)有限公司 | 翻译模型训练的方法、语句翻译的方法、设备及存储介质 |
CN110472251B (zh) * | 2018-05-10 | 2023-05-30 | 腾讯科技(深圳)有限公司 | 翻译模型训练的方法、语句翻译的方法、设备及存储介质 |
CN109062908A (zh) * | 2018-07-20 | 2018-12-21 | 北京雅信诚医学信息科技有限公司 | 一种专用翻译器 |
CN109062908B (zh) * | 2018-07-20 | 2023-07-14 | 北京雅信诚医学信息科技有限公司 | 一种专用翻译器 |
CN109145300B (zh) * | 2018-08-17 | 2022-08-16 | 武汉斗鱼网络科技有限公司 | 一种搜索文本的纠正方法、装置及终端 |
CN109145300A (zh) * | 2018-08-17 | 2019-01-04 | 武汉斗鱼网络科技有限公司 | 一种搜索文本的纠正方法、装置及终端 |
CN110929504B (zh) * | 2018-09-20 | 2023-05-30 | 阿里巴巴集团控股有限公司 | 语句诊断方法、装置和*** |
CN110929504A (zh) * | 2018-09-20 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 语句诊断方法、装置和*** |
CN111160046A (zh) * | 2018-11-07 | 2020-05-15 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
CN110705318B (zh) * | 2019-09-04 | 2023-06-30 | 南京题麦壳斯信息科技有限公司 | 一种机器翻译引擎测评优选方法及*** |
CN110705318A (zh) * | 2019-09-04 | 2020-01-17 | 南京题麦壳斯信息科技有限公司 | 一种机器翻译引擎测评优选方法及*** |
CN111539231A (zh) * | 2020-04-29 | 2020-08-14 | 北京金山安全软件有限公司 | 一种翻译方法、装置、服务器及计算机可读存储介质 |
CN112215018B (zh) * | 2020-08-28 | 2021-08-13 | 北京中科凡语科技有限公司 | 校正术语对的自动定位方法、装置、电子设备及存储介质 |
CN112215018A (zh) * | 2020-08-28 | 2021-01-12 | 北京中科凡语科技有限公司 | 校正术语对的自动定位方法、装置、电子设备及存储介质 |
CN112528683A (zh) * | 2020-12-23 | 2021-03-19 | 深圳市爱科云通科技有限公司 | 文本翻译校正方法、装置、***、服务器及可读存储介质 |
CN114049528A (zh) * | 2022-01-12 | 2022-02-15 | 上海蜜度信息技术有限公司 | 一种品牌名称识别的方法及设备 |
CN117828007A (zh) * | 2024-01-02 | 2024-04-05 | 长江勘测规划设计研究有限责任公司 | 基于自然语言处理的建设征地移民档案管理方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN102799579B (zh) | 2015-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102799579B (zh) | 具有错误自诊断和自纠错功能的统计机器翻译方法 | |
CN107330011B (zh) | 多策略融合的命名实体的识别方法及装置 | |
CN103154936B (zh) | 用于自动化文本校正的方法和*** | |
CN101908042B (zh) | 一种双语联合语义角色的标注方法 | |
CN113436698B (zh) | 融合自监督和主动学习的医学术语自动标准化***及方法 | |
CN101866337B (zh) | 词性标注***、用于训练词性标注模型的装置及其方法 | |
CN103593352B (zh) | 一种海量数据清洗方法及装置 | |
US8229728B2 (en) | Methods for using manual phrase alignment data to generate translation models for statistical machine translation | |
CN110297913A (zh) | 一种电子公文实体抽取方法 | |
CN103500160B (zh) | 一种基于滑动语义串匹配的句法分析方法 | |
CN105988990A (zh) | 用于汉语中的零指代消解的装置和方法以及模型训练方法 | |
CN104915337B (zh) | 基于双语篇章结构信息的译文篇章完整性评估方法 | |
CN105279252A (zh) | 挖掘相关词的方法、搜索方法、搜索*** | |
CN108959258A (zh) | 一种基于表示学习的特定领域集成实体链接方法 | |
CN108664269A (zh) | 一种基于深度学习的特征依恋代码异味检测方法 | |
CN103678271B (zh) | 一种文本校正方法及用户设备 | |
Maru et al. | Nibbling at the hard core of Word Sense Disambiguation | |
CN109492106A (zh) | 一种文本代码相结合的缺陷原因自动分类方法 | |
CN108491459B (zh) | 一种软件代码摘要自动生成模型的优化方法 | |
CN110287482A (zh) | 半自动化分词语料标注训练装置 | |
CN104731774A (zh) | 面向通用机译引擎的个性化翻译方法及装置 | |
CN103186658B (zh) | 用于英语口语考试自动评分的参考语法生成方法和设备 | |
CN102760121B (zh) | 依存映射方法及*** | |
CN108470026A (zh) | 新闻标题的句子主干内容提取方法及装置 | |
CN108363700A (zh) | 新闻标题的质量评估方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20151029 Address after: 300450 Tanggu street, Binhai New Area, Haining, Tianjin Patentee after: Liu Zhikuan Address before: 710048 Shaanxi city of Xi'an Province Jinhua Road No. 5 Patentee before: Xi'an University of Technology |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160214 Address after: The 300457 Tianjin economic and Technological Development Zone, Third Street No. 8 Building 2 Room 101 Howell Patentee after: Tianjin Development Zone China Translation Co., Ltd. Address before: 300450 Tanggu street, Binhai New Area, Haining, Tianjin Patentee before: Liu Zhikuan |
|
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: The 300457 Tianjin economic and Technological Development Zone, Third Street No. 8 Building 2 Room 101 Howell Patentee after: Tianjin Chinese Translation Association Polytron Technologies Inc Address before: The 300457 Tianjin economic and Technological Development Zone, Third Street No. 8 Building 2 Room 101 Howell Patentee before: Tianjin Development Zone China Translation Co., Ltd. |