CN108763228A - 一种自然语言辅助处理*** - Google Patents

一种自然语言辅助处理*** Download PDF

Info

Publication number
CN108763228A
CN108763228A CN201810490347.7A CN201810490347A CN108763228A CN 108763228 A CN108763228 A CN 108763228A CN 201810490347 A CN201810490347 A CN 201810490347A CN 108763228 A CN108763228 A CN 108763228A
Authority
CN
China
Prior art keywords
language
module
target
mark
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810490347.7A
Other languages
English (en)
Inventor
王伟宙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810490347.7A priority Critical patent/CN108763228A/zh
Publication of CN108763228A publication Critical patent/CN108763228A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种自然语言辅助处理***,包括语言输入模块、语言处理模块、人机交互模块和显示模块。语言输入模块,用于输入待处理的原始语言。语言处理模块,用于对原始语言生成数个目标,并根据数据库对目标进行标识,且对同一个目标的标识为数个。人机交互模块,包括语言选定模块和语言生成模块,所述语言选定模块用于选定目标,并将一种或多种标识应用到选定的目标上,所述语言生成模块用于根据标识和数据库,将选定的目标处理为标注语言。显示模块,用于显示所述标注语言和所述原始语言。本发明,可对输入的原始语言进行多种处理,对原始语言的处理功能强大,可对语言进行多方位的处理,给使用者带来便利。

Description

一种自然语言辅助处理***
技术领域
本发明涉及计算机辅助翻译领域,具体涉及一种自然语言辅助处理***。
背景技术
随着社会发展和科技进步,计算机辅助翻译越来越普遍。
在自然语言处理方面,人需要进行重复复杂的查询、检索、比较、统一、组织和校验。
计算机辅助翻译则需要大量数据,且翻译的风格、内容单一,不够灵活。
下面以《查拉图斯特拉如是说》的一段德文翻译说明:
原文:Als Zarathustra aber allein war,sprach er also zu seinemHerzen:"Sol lte es dennsein!Dieser alte Hei l ige hat in seinemWalde noch Nichts davondass Gott todt ist!"-
在自然语言处理方面对目标的标识:Als当的时候作为比Zarathustra查拉图斯特拉aber但是allein独自一人war是,Sprach说道er他Also如是zu向对seinem他的Herzen心:"Sollte应该es它这denn因为吧吗可能的sein是自己的!Dieser这个alte老heilige圣人hat有in在里seinem他的Walde树林noch还Nichts别没davon从那听到听说,dass那Gott神todt死了ist是!"-
译文:但是当查拉图斯特拉独自一人的时候,他如是对他的心说:“这应该是可能的!这个老圣人在他的树林里还没听说,神死了!”——
以上,可见在翻译过程中,在自然语言处理方面对目标的标识,目标具体为单词,标识具体为词义,以及译文的对应部分不一定是完全唯一对应的。相同的单词可以对应不同的翻译,例如:Als的翻译根据位置和上下文可以是“当的时候”、“作为”、“比”;不同的单词也可以是相同的翻译;一个翻译还可以是对应包含多个单词的词组等。
由此可见,人需要辅助显示在自然语言处理方面对目标的标识减轻重复复杂的查询、检索、比较、统一、组织和校验,计算机辅助翻译则需要大量在自然语言处理方面的目标和标识数据,此外,计算机辅助翻译对于翻译的风格难以把握,还存在翻译的内容单一,不够灵活的问题。
有鉴于此,急需一种自然语言辅助处理***,解决以下问题:
(1)在自然语言处理方面,需要对目标和标识进行重复复杂的查询、检索、比较、统一、组织和校验;
(2)在计算机辅助翻译及自然语言处理方面,需要大量的目标和标识数据,且翻译的风格,内容单一,不够灵活。
发明内容
本发明所要解决的技术问题是现有的自然语言辅助处理***存在的,在自然语言处理方面,需要对目标和标识进行重复复杂的查询、检索、比较、统一、组织和校验;在计算机辅助翻译及自然语言处理方面,需要大量的目标和标识数据,且翻译的风格,内容单一,不够灵活,以上两方面的问题。
为了解决上述技术问题,本发明所采用的技术方案是提供一种自然语言辅助处理***,包括:
语言输入模块,用于输入待处理的原始语言;
语言处理模块,用于对所述原始语言生成数个目标,并根据数据库对目标进行标识,且对同一个目标的标识为数个;
人机交互模块,包括语言选定模块和语言生成模块,所述语言选定模块用于选定目标,并将一种或多种标识应用到选定的目标上,所述语言生成模块用于根据标识和数据库,将选定的目标处理为标注语言;
显示模块,用于显示所述标注语言和所述原始语言。
在上述方案中,所述目标包括单词、短语、句子、段落、载体和指定目标,所述标识包括词义、规则、音标、发音、词组、语素、句子、成分、语序、回译、词性、单复数、时态、变位、屈折、语源、解析、教学、来源、授权、语法、载体、办公协同、提示建议、搜索结果、摘要、指定标识、辅助听说和读写。
在上述方案中,所述数据库包括Excel数据库、Access数据库和SQL数据库。
在上述方案中,还包括用户***,所述用户***包括存储模块,用于存储用户已经掌握的目标和标识,所述用户***用于识别所述原始语言中的目标,并通过所述语言处理模块对所述原始语言中与所述存储模块中相同的目标和标识不做标识。
在上述方案中,还包括风格迁移模块,用于选定目标和标识,并根据目标和标识的选定生成指定的特定目标和特定标识并存储,所述风格迁移模块用于根据所述特定目标和所述特定标识将所述原始语言处理为所述标注语言。
在上述方案中,所述语言选定模块包括输入设备和输出设备,所述输入设备用于选定目标,所述输出设备用于显示所述原始语言和所述标注语言。
在上述方案中,所述输入设备包括鼠标、键盘和触摸屏,所述输出设备包括显示屏。
与现有技术相比,本发明,可对输入的原始语言进行多种处理,对原始语言的处理功能强大,可对语言进行多方位的处理,给使用者带来便利。
具体实施方式
本发明提供了一种自然语言辅助处理***,可以有效解决人处理自然语言时辅助的问题。在自然语言处理方面,通过对原始语言生成数个目标,并对目标进行标识,并根据标识将目标生成标注语言,有效减轻了重复复杂的查询、检索、比较、统一、组织和校验。此外,相较于现有的计算机辅助翻译,本发明,还有效解决了其在自然语言处理方面需要大量的目标和标识数据,且翻译的风格难以控制,翻译的内容单一,不够灵活等问题。下面结合具体实施方式对本发明做出详细说明。
本发明提供了一种自然语言辅助处理***,包括语言输入模块、语言处理模块、人机交互模块和显示模块。语言输入模块,用于输入待处理的语言,该语言记作原始语言。语言处理模块,用于对原始语言生成数个目标,并根据数据库对目标进行标识,且对同一个目标的标识可以为数个。人机交互模块,包括语言选定模块和语言生成模块,语言选定模块用于选定目标,并对该选定的目标选择对其的标识,由此,可将一种或多种标识应用到选定的目标上,语言生成模块根据该目标的标识和数据库,将该目标对应的标识显示出来,将选定的目标处理为标注语言,辅助生成译文。显示模块,用于即时显示标注语言、原始语言和译文。由此,使用者通过语言输入模块输入原始语言,再通过语言处理模块和人机交互模块对输入的原始语言中的目标和标识进行选定,可获得标注语言和译文,通过显示模块可实现原始语言和标注语言及译文的同时显示,由此,便于使用者校核、修改,直观便捷。
具体地,上述目标包括单词、短语、句子、段落、载体和指定目标,标识包括词义、规则、音标、发音、词组、语素、句子、成分、语序、回译、词性、单复数、时态、变位、屈折、语源、解析、教学、来源、授权、语法、载体、办公协同、提示建议、搜索结果、摘要、指定标识、辅助听说和读写。
优选地,通过人机交互模块,可以在选定目标后,以下拉菜单的形式,选定对该目标的标识及应用范围。选定标识后,通过语言生成模块,即可根据选定的目标和标识,生成与该目标和标识对应的标注语言,便于使用者多角度理解原文。如对某个单词、短语、句子、段落、载体或指定目标的辅助翻译,可通过标识成分、语源、解析等方式,以便使用者对原文进行深度理解。
本发明,还包括同步模块,该同步模块用于下载和上传离线数据,并将其生成目标和标识,并将生成的目标和标识存储到数据库中,由此更新数据库。数据库包括Excel数据库、Access数据库和SQL数据库。
本发明还包括用户***,用户***包括存储模块,用于存储用户已经掌握的原始语言,用户***可对输入的用户已经掌握的原始语言进行识别,并控制语言处理模块对原始语言中与存储模块中存储的用户已经掌握的原始语言重复的内容不做标识,并且控制语言生成模块不对该目标进行辅助翻译,由此,有利于提升使用者对原文的阅读能力,避免标识影响使用者的思路。具体地,用户***包括存储模块,用于存储用户已经掌握的目标和标识,用户***用于识别原始语言中的目标,并通过语言处理模块对原始语言中与储模块中相同的目标和标识不做标识,由此,实现上述功能。
本发明,还包括风格迁移模块,用于按照指定方式将原始语言处理为标注语言。具体地,风格迁移模块用于对原始语言生成的目标和标识进行选定,通过选定,生成指定的特定目标和特定标识,风格迁移模块存储该特定目标和特定标识,风格迁移模块根据其存储的特定目标和特定标识将原始语言处理为标注语言,由此获得指定的标注语言。如选定目标“他们”,选定该目标的标识“复数”,由此,存储指定的目标和标识,且该指定的目标和标识可以为数个,也即,风格迁移模块可指定对数个目标的标识,使用时,自动根据其预先指定的特定目标和特定标识生成标注语言。具体地,风格迁移模块识别原始语言中生成的目标,并与存储的特定目标进行比较,将原始语言中与特定目标相同的目标按照特定目标和特定标识,将原始语言中选定的目标处理为标注语言,此标注语言由于根据特定目标和特定标识生成,具有特定风格,由此实现风格迁移。本发明,无需选定所有的目标和标识,可对原始语言进行多方位的处理,给使用者带来便利。
本发明还包括识别模块,用于显示标识对应的目标,便于使用者对选定的目标和标识进行比对,修改和校核。
本发明中,语言选定模块包括输入设备和输出设备,输入设备用于选定目标,输出设备用于显示原始语言和标注语言。优选地,输入设备包括鼠标、键盘和触摸屏,输出设备包括显示屏。
与现有技术相比,本发明,可对输入的原始语言进行多种处理,对原始语言的处理功能强大,可对语言进行多方位的处理,给使用者带来便利。
本发明并不局限于上述最佳实施方式,任何人应该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。

Claims (7)

1.一种自然语言辅助处理***,其特征在于,包括:
语言输入模块,用于输入待处理的原始语言;
语言处理模块,用于对所述原始语言生成数个目标,并根据数据库对目标进行标识,且对同一个目标的标识为数个;
人机交互模块,包括语言选定模块和语言生成模块,所述语言选定模块用于选定目标,并将一种或多种标识应用到选定的目标上,所述语言生成模块用于根据标识和数据库,将选定的目标处理为标注语言;
显示模块,用于显示所述标注语言和所述原始语言。
2.根据权利要求1所述的一种自然语言辅助处理***,其特征在于,所述目标包括单词、短语、句子、段落、载体和指定目标,所述标识包括词义、规则、音标、发音、词组、语素、句子、成分、语序、回译、词性、单复数、时态、变位、屈折、语源、解析、教学、来源、授权、语法、载体、办公协同、提示建议、搜索结果、摘要、指定标识、辅助听说和读写。
3.根据权利要求1所述的一种自然语言辅助处理***,其特征在于,所述数据库包括Excel数据库、Access数据库和SQL数据库。
4.根据权利要求1所述的一种自然语言辅助处理***,其特征在于,还包括用户***,所述用户***包括存储模块,用于存储用户已经掌握的目标和标识,所述用户***用于识别所述原始语言中的目标,并通过所述语言处理模块对所述原始语言中与所述存储模块中相同的目标和标识不做标识。
5.根据权利要求1所述的一种自然语言辅助处理***,其特征在于,还包括风格迁移模块,用于选定目标和标识,并根据目标和标识的选定生成指定的特定目标和特定标识并存储,所述风格迁移模块用于根据所述特定目标和所述特定标识将所述原始语言处理为所述标注语言。
6.根据权利要求1所述的一种自然语言辅助处理***,其特征在于,所述语言选定模块包括输入设备和输出设备,所述输入设备用于选定目标,所述输出设备用于显示所述原始语言和所述标注语言。
7.根据权利要求6所述的一种自然语言辅助处理***,其特征在于,所述输入设备包括鼠标、键盘和触摸屏,所述输出设备包括显示屏。
CN201810490347.7A 2018-05-21 2018-05-21 一种自然语言辅助处理*** Pending CN108763228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810490347.7A CN108763228A (zh) 2018-05-21 2018-05-21 一种自然语言辅助处理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810490347.7A CN108763228A (zh) 2018-05-21 2018-05-21 一种自然语言辅助处理***

Publications (1)

Publication Number Publication Date
CN108763228A true CN108763228A (zh) 2018-11-06

Family

ID=64007651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810490347.7A Pending CN108763228A (zh) 2018-05-21 2018-05-21 一种自然语言辅助处理***

Country Status (1)

Country Link
CN (1) CN108763228A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5826219A (en) * 1995-01-12 1998-10-20 Sharp Kabushiki Kaisha Machine translation apparatus
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CN1487449A (zh) * 2002-08-22 2004-04-07 ��ʽ���綫֥ 机器翻译装置和方法
US20100223047A1 (en) * 2009-03-02 2010-09-02 Sdl Plc Computer-assisted natural language translation
CN102541843A (zh) * 2010-12-22 2012-07-04 陈本东 一种用于提高机器翻译质量的装置和方法
CN102708097A (zh) * 2012-04-27 2012-10-03 曾立人 一种计算机在线翻译方法及其翻译***
CN104679735A (zh) * 2013-11-30 2015-06-03 赵会军 语用机器翻译方法
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5826219A (en) * 1995-01-12 1998-10-20 Sharp Kabushiki Kaisha Machine translation apparatus
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CN1487449A (zh) * 2002-08-22 2004-04-07 ��ʽ���綫֥ 机器翻译装置和方法
US20100223047A1 (en) * 2009-03-02 2010-09-02 Sdl Plc Computer-assisted natural language translation
CN101826072A (zh) * 2009-03-02 2010-09-08 Sdl有限公司 计算机辅助自然语言翻译
CN102541843A (zh) * 2010-12-22 2012-07-04 陈本东 一种用于提高机器翻译质量的装置和方法
CN102708097A (zh) * 2012-04-27 2012-10-03 曾立人 一种计算机在线翻译方法及其翻译***
CN104679735A (zh) * 2013-11-30 2015-06-03 赵会军 语用机器翻译方法
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈旷: "计算机辅助翻译的核心模块和技术论析", 《江汉大学学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置

Similar Documents

Publication Publication Date Title
McCarthy A prosodic theory of nonconcatenative morphology
Bethard et al. Semeval-2015 task 6: Clinical tempeval
US4502128A (en) Translation between natural languages
Boudelaa et al. Aralex: A lexical database for modern standard Arabic
KR101726667B1 (ko) 어법컴파일방법, 어의해석방법, 디바이스, 컴퓨터 저장매체 및 장치
Jelinek The case split and pronominal arguments in Choctaw
US5640575A (en) Method and apparatus of translation based on patterns
CN107025217A (zh) 同义转换文生成方法、装置、程序以及机器翻译***
Mirković et al. Rules versus statistics: Insights from a highly inflected language
KR20160060821A (ko) 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
Chetail et al. The internal structure of chaos: Letter category determines visual word perceptual units
CN104239289B (zh) 音节划分方法和音节划分设备
CN108763228A (zh) 一种自然语言辅助处理***
Wang et al. Deep Context Model for Grammatical Error Correction.
Ross et al. EYEBALL: a computer program for description of style
Gibbon et al. A computational model of arm gestures in conversation.
Wankerl et al. An Analysis of Perplexity to Reveal the Effects of Alzheimer's Disease on Language
Mishra Simulating the pāṇinian system of sanskrit grammar
Al-Thubaity et al. Caraner: the Covid-19 Arabic named entity corpus
CN107301172A (zh) 数据处理方法和存储介质
Singh Multilingualism, sociolinguistics and theories of linguistic form: Some unfinished reflections
Saliimi Lokman et al. Enhancement algorithms for SQL-based chatbot
Carter et al. Anatomic Pathology Information Laboratory Information Systems and Natural Language Processing: Early History
Edwards Using sounds to convey complex information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106