KR20000056245A - 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법 - Google Patents

예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법 Download PDF

Info

Publication number
KR20000056245A
KR20000056245A KR1019990005383A KR19990005383A KR20000056245A KR 20000056245 A KR20000056245 A KR 20000056245A KR 1019990005383 A KR1019990005383 A KR 1019990005383A KR 19990005383 A KR19990005383 A KR 19990005383A KR 20000056245 A KR20000056245 A KR 20000056245A
Authority
KR
South Korea
Prior art keywords
translation
word
similarity
sentence
translation example
Prior art date
Application number
KR1019990005383A
Other languages
English (en)
Inventor
이재원
권철중
Original Assignee
윤종용
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자 주식회사 filed Critical 윤종용
Priority to KR1019990005383A priority Critical patent/KR20000056245A/ko
Publication of KR20000056245A publication Critical patent/KR20000056245A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 예문기반 기계번역에서 입력문장과 가장 유사한 번역예문을 선정하기 위하여 단어가 가지는 분별력을 반영하는 유사도를 이용한 번역예문 선정방법에 관한 것으로, 이러한 번역예문 선정방법은 (a)입력문장 중 어휘선택의 모호성을 가지는 단어를 구문관계를 반영한 번역예문 표현 방법으로 변환하는 입력문장 변환 단계; (b)번역예문 표현 방법으로 구축된 번역예문 데이터베이스에서 (a)단계로부터 변환된 입력문장과 관련된 번역예문들을 선택하는 단계; (c)(b)단계로부터 선택된 번역예문들 각각에 대해 입력문장과의 유사도를 계산하는 단계; 및 (d)(c)단계로부터 계산된 유사도가 가장 큰 번역예문을 선정하여 선정된 번역예문의 목표단어(TARGET_WORD)를 원시언어 단어에 해당하는 목적언어 단어로 선정하는 단계를 포함함을 특징으로 한다.
본 발명에 의하면, 번역예문에 나타나는 단어의 의미가 목적언어 선정에 대해 가지는 분별력을 유사도 계산에 가중치로 반영함으로써 기존의 방법에 비해 적합한 번역예문을 선정할 가능성이 향상된다. 즉, 기계번역에서 원시언어 단어에 적합한 목적언어 단어를 선정함에 있어 정확률이 높아진다.

Description

예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법{Translation example selection method using similarity reflecting discriminitive value in example-based machine translation}
본 발명은 영한번역에 관한 것으로, 특히 예문기반 기계번역에서 입력문장과 가장 유사한 번역예문을 선정하기 위하여 단어가 가지는 분별력을 반영하는 유사도를 이용한 번역예문 선정방법에 관한 것이다.
예문에 기반한 기계번역(EBMT ; Example-Based Machine Translation)은 유사한 번역예문를 흉내내어 번역을 수행하려고 하는 아이디어에 기반하고 있다. 이러한 번역 시스템에 있어서 주된 요소는 대량의 번역예문 데이타베이스를 구축하고, 번역하고자 하는 입력 문장과 가장 유사한 번역예문을 데이타베이스에서 탐색하는 일이다.
기존의 연구는 주로 번역예문에 나타나는 단어와 입력문장에 나타나는 단어 간의 의미거리를 계산함으로써 유사도를 평가한다. 영어 단어 CASE는 '경우', '상자', '환자'등으로 번역될 수 있으며, 이에 대해 다음과 같은 번역예문들이 가능하다.
[경우] It was a case of bad judgment.
[상자] The porter will carry your cases up to your room.
[환자] He is a new case of influenza.
입력문장이 “He is a new case of cholera.”일 경우, 'CASE'의 문맥에 나타나는 'CHOLERA'는 병명으로 'INFLUENZA'와 의미적으로 매우 가까우며, 따라서 이때의 'CASE'는 '환자'로 번역되어야 함을 알 수 있다. 그러나, 번역예문에서 해당 단어의 문맥에 나타나는 단어들은 각기 대역어를 결정하는 데 기여하는 정도가 다를 수 있다. '환자'에 대한 번역예문에서 'HE'는 다른 목적언어 단어에 대한 번역예문에서도 또한 나타날 수 있으므로 목적언어 단어를 선정하는데 기여하는 정도가 매우 작다. 따라서 단순히 문맥에 나타나는 단어들의 의미거리 계산만으로는 적합한 번역예문을 선정하기는 어렵다.
다음은 'AREA'에 대한 번역예문에 대해 문맥에 나타나는 단어와 그의 의미코드만으로 간략하게 보인 것이다.
[지역] residential:Dd65, city:Ce80, England:Ce78, no-smoking:Ed88
[분야] education:Gb35, mathematics:Jb30, economy:Jf141
[면적] circle:Jb44, land:Ce78, square-mile:Jc66, square-kilometer:Jc66
위의 예에서 알 수 있는 바와 같이 번역예문에 나타나는 어떤 단어는 대역어를 결정함에 있어 그 영향력이 약하다. Ce80(city, land)의 의미를 가지는 단어는 목적언어 단어 '지역'과 '면적' 두 경우에 사용될 수 있으며, Jb30(mathematics, circle)의 의미를 가지는 단어는 목적언어 단어 '분야’와 '면적’으로 번역될 수 있다. 그러므로, 이러한 의미의 단어들은 단어 'AREA'의 목적언어 단어를 선정함에 있어 분별력이 약하다고 할 수 있다.
반면, Gb35(education)의미의 단어는‘분야’이외의 목적언어에 대한 번역예문에 나타나지 않으므로‘분야’로 번역되어야 할 가능성이 높다는 것을 알 수 있다. 이와 같이 어떤 단어는 특정 목적언어 단어에 대한 번역예문에 편중적으로 나타남으로써 목적언어 단어를 선정함에 있어 결정적인 단서를 제공하기도 한다. 즉, 분별력이 높은 단어인 것이다. 그러므로, 번역에 사용할 번역예문를 선정함에 있어 입력문장과 번역예문과의 의미적인 유사성만을 계산할 것이 아니라, 번역예문에 나타나는 단어의 의미가 가지는 분별력을 반영하는 것이 효과적이다.
기존의 방법은 일반적으로 입력문장의 문맥에 나타나는 단어와 번역예문에 나타나는 단어 간의 의미거리를 계산함으로써 유사도를 평가한다. 입력문장에서 번역하고자 하는 단어의 문맥에 나타나는 단어가 I1, I2, ..., Im이고, 번역예문에 나타나는 단어가 Eij1, Eij2, ..., Eijm라고 하면 입력문장과 번역예문과의 유사도는 수학식 1과 같이 각각의 의미거리의 합으로 계산될 수 있다.
Input : I = (I1, I2, ..., Im)
Example : Eij= (Eij1, Eij2, ..., Eijm)
Dist(I, Eij) = d((I1, I2, ..., Im)(Eij1, Eij2, ..., Eijm))
그러므로, 기존의 방법은 단어간의 의미거리, 즉 d(Ik, Eijk) 함수를 구하는데 중점을 두었다. 그러나, 앞서 살펴본 바와 같이 같은 의미거리를 가지더라도 목적언어 단어를 선정하는데 기여하는 분별력이 다르므로 의미거리는 가깝지만 적합하지 않은 대역어가 선정될 수 도 있다.
수미타와 리다(Sumita and Lida)는 문맥에 나타나는 단어가 목적언어 단어를 결정하는데 영향을 미치는 정도를 가중치로 이용한 바 있다("Experiments and Prospects of Example-based Machine Translation"; ACL91). 그러나, 문맥에 나타나는 단어에 대해 고정된 가중치를 적용함으로써 그 단어가 목적언어 단어 후보자 각각에 대해 가지는 분별력을 반영하지 못하고 있다. 즉, 목적언어 단어 후보자의 문맥에 나타나는 개개의 분포를 모델링하지 못하고 있다.
본 발명이 이루고자하는 기술적 과제는 데이타베이스로 구축되어 있는 번역예문들 중에서 입력문장과 가장 유사한 번역예문을 선정하기 위하여 문맥에 함께 나타나는 단어의 의미가 가지는 분별력을 의미거리계산 방법에 가중치로 반영한 유사도를 계산하여 번역예문을 표현하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법을 제공함에 있다.
도 1은 본 발명에 의한 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법을 도시한 순서도이다.
도 2는 본 발명에 사용된 유사도 계산 방법을 도시한 순서도이다.
상기 기술적 과제를 해결하기 위한 본 발명에 의한 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법은 (a)(a)입력문장 중 어휘선택의 모호성을 가지는 단어를 구문관계를 반영한 번역예문 표현방법으로 변환하는 입력문장 변환단계; (b)상기 번역예문 표현방법으로 구축된 번역예문 데이터베이스에서 상기 (a)단계로부터 변환된 입력문장과 관련된 번역예문들을 선택하는 단계; (c)상기 (b)단계로부터 선택된 번역예문들 각각에 대해 입력문장과의 유사도를 계산하는 단계; 및 (d)상기 (c)단계로부터 계산된 유사도가 가장 큰 번역예문을 선정하여 선정된 번역예문의 목표단어(TARGET_WORD)를 원시언어 단어에 해당하는 목적언어 단어로 선정하는 단계를 포함함을 특징으로 한다.
이하 도면을 참조하여 본 발명을 상세히 설명하기로 한다.
도 1은 본 발명에 의한 예제기반 기계번역에서 분별성을 반영한 유사도를 이용한 번역예문 선정방법을 도시한 순서도로서, 입력문장 변환단계(110), 번역예문 선택단계(120), 유사도 계산단계(130) 및 목적언어 선정단계(140)로 이루어진다.
입력문장 변환단계(110)는 입력문장 중 어휘선택 모호성을 가지는 단어를 번역예문 표현으로 변환하는 단계이다.
번역예문 선택단계(120)는 입력문장에서 모호성을 가지는 단어에 관련된 번역예문들을 기 구축된 번역예문 데이터베이스에서 선택하는 단계이다.
유사도 계산단계(130)는 번역예문 선택단계(120)로부터 선택된 번역예문들 각각에 대해 유사도 계산방법을 이용하여 입력문장과의 유사도를 계산하는 단계이다.
목적언어 선정단계(140)는 가장 유사한 번역예문를 선정하여 선정된 번역예문의 TARGET_WORD를 원시언어 단어에 해당하는 목적언어 단어로 선정하는 단계이다.
상술한 단계에 의거하여 본 발명을 상세히 설명하기로 한다.
번역예문은 어휘, 의미정보 외에도 형태-구문 정보와 트리 구조를 반영할 수 있도록 다양한 지식을 포함하도록 기술한다. 이는 형태-구문 정보와 구문관계를 반영하는 트리 구조를 기술함으로써 형태-구문적으로 적합하지 않은 목적언어 단어가 선정되는 것을 배제하기 위한 것이다.
번역예문에 포함되는 지식의 종류는 다음과 같다.
a. 트리구조(Parent, Child, Sibling) : 문장의 구문구조 트리상에서의 위치를 기술.
b. 형태-구문 정보(Constraints) : 관사, 수 정보, 가산성 등 형태통사적 제약조건을 기술.
c. 어휘 : 문맥에 나타나는 단어 어휘 자체를 기술
d. 의미 정보 : 문맥에 나타나는 단어 어휘의 의미코드를 기술
번역예문 표현 방법(구문관계를 반영한 번역예문 표현)은 다음과 같은 형태로 표현된다(110단계).
% SOURCE_WORD 〈Source_Language_Word〉
% TARGET_WORD 〈Target_Language_Word〉
% PARENT 〈Lexical_Item:Semantic_Code:Constraints〉
% CHILD 〈Lexical_Item:Semantic_Code:Constraints〉
% SIBLING 〈Lexical_Item:Semantic_Code:Constraints〉
'CASE'에 대한 번역예문 "He is a new case of influenza"는 다음과 같은 형태로 기술된다. 이때 '[ ]' 안에 기술된 'PREP:OF'는 'case'와 'influenza'가 전치사 'of'로 연결되어 있다는 형태-구문 정보를 의미하며, N1, B140, ... 은 각각 어휘 'be', 'influenza'의 의미 코드를 나타낸다.
% SOURCE_WORD 〈CASE〉
% TARGET_WORD 〈환자〉
% PARENT 〈BE:N1〉
% CHILD 〈INFLUENZA:B140[PREP:OF], NEW:L241〉
% SIBLING 〈HE:G280〉
상술한 번역예문 표현방법에 의해 구축된 번역예문 데이터베이스에서 입력문장과 관련된 번역예문들을 선택한다(120단계).
번역예문 선택단계(120)로부터 선택된 번역예문들 각각에 대해 유사도 계산방법을 이용하여 입력문장과의 유사도를 계산한다(130단계).
유사도는 의미거리, 제약조건, 분별성의 세가지 정보에 기반하여 계산된다. 이에 대한 유사도 계산 방법은 수학식 2와 같다.
Input : I = (I1, I2, ..., Im)
Example : Eij= (Eij1, Eij2, ..., Eijm)
Dist(I, Eij) = d((I1, I2, ..., Im)(Eij1, Eij2, ..., Eijm))
의미거리는 두 단어의 의미가 계층적인 시소러스 상에서 떨어져 있는 정도에 따라 계산된다. 일반적인 의미거리 계산 방법은 수학식 3과 같이 표현된다.
d((Ik, Eijk) = 0 if (L e x i c a l _ I t e m (Ik) == L e x i c a l _ I t e m (Eijk))
= 0.125 if(Semantic_Code(Ik)와 Semantic_Code(Eijk)가
시소러스의 동일 레벨에 존재)
= 0.25 if(Semantic_Code(Ik)와 Semantic_Code(Eijk)가
시소러스에서 1레벨의 차이를 가짐)
= 0.5 if(Semantic_Code(Ik)와 Semantic_Code(Eijk)가
시소러스에서 2레벨의 차이를 가짐)
= 1.0 그외
계층구조에서 가까울수록 두 단어의 의미거리는 작은 수치를 부여받는다. 즉, 두 단어의 의미거리가 작다는 것은 역으로 두 단어의 유사도가 높다는 것을 의미한다.
제약조건은 형태-구문 정보에 대한 것으로, 수학식 4와 같이 표현된다.
Penalty(Ik, Eijk) = 1 if Constraint(Eijk)를 Ik가 만족
= 2 otherwise
입력문장에 있는 해당 단어가 번역예문에 기술되어 있는 형태-구문 조건을 만족하는지를 검사하여 만족하지 않은 경우에는 위에서 계산된 의미거리에 2를 곱하여 유사도 계산에 감점을 부여하는 효과를 가진다. 2를 곱한다는 것은 의미거리 계산에서 일치하는 레벨을 한단계 낮추는 역할을 한다.
분별성은 특정 목적언어에 대한 번역예문들에 편중적으로 나타날 때 높다고 할 수 있다. 수학식 5는 목적언어 단어 선정에 대한 분별력을 계산하는 식이다. 이 값은 분별력이 높을 수록 낮은 값을 가지도록 계산된다. 분별력은 거리계산 값에 곱해지는 항목으로 거리가 가까울 수록 유사도가 높음을 의미하기 때문이다.
Wk= disc_value(semantic(Eijk))
여기서, freq(SM) in Eijkfor all i,j 는 모호성을 가지는 원시언어 단어에 대한 번역예문에서 특정 의미코드(SM)가 나타나는 모든 빈도수를 의미하며, freq(SM) in Eijkfor all j 는 원시언어 단어에 대한 번역예문들 중 특정 목적언어 단어 i 에 대한 번역예문에서 나타나는 특정 의미코드(SM)의 빈도수를 의미한다. 그러므로, freq(SM) in Eijkfor all j 값의 비중이 클수록 분별력은 높다고 할 수 있다.
도 2는 상술한 입력문장과 번역예문간의 유사도 계산과정을 순서도로 도시한 것이다.
먼저, 변수 Distance에 최대값인 "0"을 부여하고, 처리할 번역예문의 개수를 의미하는 변수 K에 "0"을 입력한다(210단계). 처리할 번역예문이 있는지 검사하고, 더이상 처리할 번역예문이 없으면 종료한다(220단계). 상기 번역예문의 단어와 입력문장의 단어 사이의 의미거리를 계산한다(230단계). 상기 입력문장의 단어가 제약조건을 만족하는지 검사하여 Penalty를 계산하여 의미거리와 곱한다(240단계). 상기 번역예문의 단어 의미가 가지는 분별력을 계산하고, 상기 240단계에서 계산된 값과 상기 분별력을 곱하여 유사도를 계산한다(250단계). 상기 250단계에서 계산된 유사도를 변수 Distance와 합하고(260단계), 처리할 번역예문을 220단계내지 260단계를 반복하여 입력문장과 번역예문들간의 유사도를 계산한다(130단계).
상술한 유사도 계산단계(130)로부터 유사도가 가장 큰 번역예문을 선정하여 선정된 번역예문의 목표단어(TARGET_WORD)를 원시언어 단어에 해당하는 목적언어 단어로 선정한다(140단계).
단 어 테스트 문장 모델 A 모델 B
명 사 42 27(64.3%) 27(64.3%)
동 사 46 33(71.7%) 30(65.2%)
형용사 15 11(73.3%) 9(60.0%)
부 사 6 4(66.6%) 2(33.3%)
합 계 109 75(68.8%) 68(62.4%)
표 1은 본 발명에 의한 일실시예로 33단어에 대해 720여개의 번역예문를 구축하여 분별력을 이용한 모델(A)과 그렇지 않은 모델(B)을 비교 평가하여 보았다. 테스트 문장은 109 문장을 임의로 추출하여 사용하였다. 결과적으로 62.4%에서 68.8%의 성능향상을 보였다. 이러한 결과는 분별력이 어휘선택에 있어 유용하게 사용될 수 있음을 보여주고 있다.
본 발명에 의하면, 번역예문에 나타나는 단어의 의미가 목적언어 선정에 대해 가지는 분별력을 유사도 계산에 가중치로 반영함으로써 기존의 방법에 비해 적합한 번역예문을 선정할 가능성이 향상된다. 즉, 기계번역에서 원시언어 단어에 적합한 목적언어 단어를 선정함에 있어 정확률이 높아진다.
또한, 번역예문에 나타나는 단어의 의미 외에도 분별력을 반영함으로써 번역예문 구축이 좀 더 용이해 진다.

Claims (6)

  1. (a)입력문장 중 어휘선택의 모호성을 가지는 단어를 구문관계를 반영한 번역예문 표현 방법으로 변환하는 입력문장 변환단계;
    (b)상기 번역예문 표현 방법으로 구축된 번역예문 데이터베이스에서 상기 (a)단계로부터 변환된 입력문장과 관련된 번역예문들을 선택하는 단계;
    (c)상기 (b)단계로부터 선택된 번역예문들 각각에 대해 입력문장과의 유사도를 계산하는 단계; 및
    (d)상기 (c)단계로부터 계산된 유사도가 가장 큰 번역예문을 선정하여 선정된 번역예문의 목표단어(TARGET_WORD)를 원시언어 단어에 해당하는 목적언어 단어로 선정하는 단계를 포함함을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
  2. 제1항에 있어서, 상기 (a)단계에서 번역예문 표현 방법은
    문맥에 나타나는 단어 어휘와 문맥에 나타나는 단어의 의미코드이외에 형태-구문정보와 구문관계를 반영하는 트리구조를 기술함을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
  3. 제1항에 있어서, 상기 (c)단계는
    (c1)상기 번역예문의 단어와 상기 입력문장의 단어와의 의미거리를 계산하는 단계;
    (c2)상기 입력문장 단어가 제약조건을 만족하는지 검사하여 페널티를 계산하는 단계;
    (c3)상기 번역예문의 단어 의미가 가지는 분별력을 계산하는 단계; 및
    (c4)상기 의미거리와 상기 페널티와 상기 분별력을 곱하는 단계를 포함함을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
  4. 제3항에 있어서, 상기 (c1)단계는
    상기 번역예문의 단어와 상기 입력문장의 단어 의미가 계층적인 시소러스 상에서 떨어져 있는 정도에 따라 계산됨을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
  5. 제3항에 있어서, 상기 (c2)단계는
    입력문장 단어에 해당하는 단어가 번역예문에 기술되어 있는 형태-구문 조건을 만족하는지를 검사하여 만족하지 않은 경우에는 의미거리계산에서 일치하는 레벨을 한단계 낮추어 유사도 계산에 감점을 부여하여 계산함을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
  6. 제3항에 있어서, 상기 (c3)단계는
    모호성을 가지는 원시언어 단어에 대한 번역예문에 있어서,
    특정 의미코드가 나타나는 모든 빈도수를 특정 목적언어 단어에 대한 특정 의미코드의 빈도수로 나눈값을 이용하여 계산함을 특징으로 하는 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법.
KR1019990005383A 1999-02-18 1999-02-18 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법 KR20000056245A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990005383A KR20000056245A (ko) 1999-02-18 1999-02-18 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990005383A KR20000056245A (ko) 1999-02-18 1999-02-18 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법

Publications (1)

Publication Number Publication Date
KR20000056245A true KR20000056245A (ko) 2000-09-15

Family

ID=19574494

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990005383A KR20000056245A (ko) 1999-02-18 1999-02-18 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법

Country Status (1)

Country Link
KR (1) KR20000056245A (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020036059A (ko) * 2000-11-07 2002-05-16 옥철영 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
KR100398344B1 (ko) * 2000-05-13 2003-09-19 주식회사 전유시스템 분해적 표현에 의한 순차 통역식 영한번역 시스템
KR100685023B1 (ko) * 2001-11-13 2007-02-20 주식회사 포스코 유사성 판단을 위한 예제기반 검색 방법 및 검색 시스템
US7333927B2 (en) 2001-12-28 2008-02-19 Electronics And Telecommunications Research Institute Method for retrieving similar sentence in translation aid system
US7921018B2 (en) 2006-10-19 2011-04-05 Electronics And Telecommunications Research Institute Translation system and method of providing translation service
KR101031970B1 (ko) * 2002-11-20 2011-04-29 마이크로소프트 코포레이션 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법
WO2012026667A2 (ko) * 2010-08-23 2012-03-01 에스케이텔레콤 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100398344B1 (ko) * 2000-05-13 2003-09-19 주식회사 전유시스템 분해적 표현에 의한 순차 통역식 영한번역 시스템
KR20020036059A (ko) * 2000-11-07 2002-05-16 옥철영 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
KR100685023B1 (ko) * 2001-11-13 2007-02-20 주식회사 포스코 유사성 판단을 위한 예제기반 검색 방법 및 검색 시스템
US7333927B2 (en) 2001-12-28 2008-02-19 Electronics And Telecommunications Research Institute Method for retrieving similar sentence in translation aid system
KR101031970B1 (ko) * 2002-11-20 2011-04-29 마이크로소프트 코포레이션 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법
US7921018B2 (en) 2006-10-19 2011-04-05 Electronics And Telecommunications Research Institute Translation system and method of providing translation service
WO2012026667A2 (ko) * 2010-08-23 2012-03-01 에스케이텔레콤 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
KR20120018687A (ko) * 2010-08-23 2012-03-05 에스케이플래닛 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
WO2012026667A3 (ko) * 2010-08-23 2012-04-19 에스케이텔레콤 주식회사 토큰 분리 및 번역 과정을 통합한 통합 디코딩 장치 및 그 방법
US8543376B2 (en) 2010-08-23 2013-09-24 SK Planet Co., Ltd Apparatus and method for decoding using joint tokenization and translation

Similar Documents

Publication Publication Date Title
RU2665239C2 (ru) Автоматическое извлечение именованных сущностей из текста
US8185377B2 (en) Diagnostic evaluation of machine translators
RU2584457C1 (ru) Система и способ создания и использования пользовательских семантических словарей для обработки пользовательского текста на естественном языке
KR20040044176A (ko) 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법 및장치
JPH06314294A (ja) 機械翻訳方法及び機械翻訳装置
Batsuren et al. A large and evolving cognate database
Bikel Automatic WordNet mapping using word sense disambiguation
Vij et al. Fuzzy logic for inculcating significance of semantic relations in word sense disambiguation using a WordNet graph
Naser-Karajah et al. Current trends and approaches in synonyms extraction: Potential adaptation to arabic
Kim et al. A lexical semantic approach to interpreting and bracketing English noun compounds
KR20000056245A (ko) 예제기반 기계번역에서 분별성이 반영된 유사도를 이용한 번역예문 선정방법
Lapata The automatic interpretation of nominalizations
Gerber et al. Systran MT dictionary development
KR20020036059A (ko) 사전 뜻풀이말에서 추출된 의미정보를 기반으로하는 의미중의성 해결 방법
JP2005327107A (ja) 固有名カテゴリ推定装置及びプログラム
Yu et al. Machine translation evaluation metric based on dependency parsing model
Habash et al. Hybrid natural language generation from lexical conceptual structures
Thurmair Hybrid architectures for machine translation systems
Daelemans et al. Part-of-speech tagging for Dutch with MBT, a memory-based tagger generator
Specia A hybrid model for word sense disambiguation in English-Portuguese machine translation
Óladóttir et al. Developing a spell and grammar checker for Icelandic using an error corpus
Leveling et al. University of Hagen at CLEF 2004: Indexing and translating concepts for the GIRT task
Wimalasuriya Automatic text summarization for sinhala
Mille et al. Multilingual Natural Language Generation within Abstractive Summarization.
Gdaniec et al. Derivational morphology to the rescue: how it can help resolve unfound words in MT

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination