KR102562920B1 - 기계번역을 위한 장치 및 방법 - Google Patents

기계번역을 위한 장치 및 방법 Download PDF

Info

Publication number
KR102562920B1
KR102562920B1 KR1020200185665A KR20200185665A KR102562920B1 KR 102562920 B1 KR102562920 B1 KR 102562920B1 KR 1020200185665 A KR1020200185665 A KR 1020200185665A KR 20200185665 A KR20200185665 A KR 20200185665A KR 102562920 B1 KR102562920 B1 KR 102562920B1
Authority
KR
South Korea
Prior art keywords
machine translation
translation
result
machine
translation result
Prior art date
Application number
KR1020200185665A
Other languages
English (en)
Other versions
KR20220094444A (ko
Inventor
김강
박진형
정영훈
Original Assignee
엑스엘에이트 아이앤씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엑스엘에이트 아이앤씨 filed Critical 엑스엘에이트 아이앤씨
Priority to KR1020200185665A priority Critical patent/KR102562920B1/ko
Priority to US17/211,014 priority patent/US11790186B2/en
Publication of KR20220094444A publication Critical patent/KR20220094444A/ko
Application granted granted Critical
Publication of KR102562920B1 publication Critical patent/KR102562920B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

사용자 인터페이스부를 통해 번역 결과를 표시하는 본 발명의 적어도 일 실시예에 따른 기계번역 장치 및 방법은, 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하는 최초 표시 단계; 상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라, 상기 최초의 기계번역 결과를 수정하고, 수정된 기계번역 결과를 표시하는 수정 표시 단계; 및 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간 차이를 분석하고 그 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 수행하는 반영 단계를 포함하는 기계번역 방법 및 그 방법을 수행하기 위한 장치이며, 이에 의하면, 기계번역 결과에 투입되는 사용자의 시간, 비용 및 노력을 최소한으로 하면서도 고품질의 번역물을 효율적으로 짧은 시간 안에 얻을 수 있다.

Description

기계번역을 위한 장치 및 방법 {APPARATUS AND METHOD FOR MACHINE TRANSLATION}
본 발명은 번역에 관한 것으로서, 보다 상세하게는 효율적인 기계번역을 위한 장치 및 방법에 관한 것이다.
가장 고전적인 번역 방법은 번역가가 번역문 초안을 만들고 감수자가 이를 감수하며 수정하는 방법이다. 이와 같은 번역 방법에 따른 번역은 많은 시간, 비용 및 인력을 필요로 하는 문제점을 가진다.
이를 개선하기 위하여 등장한 기술이 바로 ‘기계번역’ 기술이다. 구글(Google)이 제공하는 구글 번역기(Google Translator), 네이버(NAVER)가 제공하는 파파고 번역기 등이 그러한 기계번역 기술이 채용된 번역기의 예시이다.
이러한 기계번역 내지 자동번역의 품질을 개선하기 위한 방안이 제안된 바 있으며, 특허 제10-0911621호(발명의 명칭: 한영 자동번역 방법 및 장치)는 패턴기반 방식의 자동번역 결과와 통계기반 방식의 자동번역 결과를 평가하고 이중 보다 우수한 자동번역 결과를 최종적인 자동번역 결과로 선정 및 제시하는 방안을 개시하고 있다.
그런데 아직은 아무리 최신의 기계번역 기술(또는 자동번역 기술)이라 하더라도 기계번역을 통해 고품질의 번역을 기대하기 어려운 것이 현실이다. 따라서, 기계번역의 도움을 받으면서도 고품질의 번역을 하기 위해서는 기계번역물에 대하여 감수자가 감수 및 수정을 하여야 한다. 이처럼 기계번역의 도움을 받으면서도 높은 품질의 번역물을 얻기 위해서는 여전히 번역에 많은 시간, 비용 및 인력을 투입해야 하는 문제가 있다.
특허등록번호 제10-0911621호
없음
본 발명의 적어도 일 실시예는, 기계번역 결과에 투입되는 사용자의 시간, 비용 및 노력을 최소한으로 하면서도 고품질의 번역물을 효율적으로 짧은 시간 안에 얻을 수 있도록 하는 기계번역 장치 및 방법을 제공하는 것을 목적으로 한다.
위 목적을 달성하기 위해, 본 발명의 적어도 일 실시예에 따른 기계번역 장치는 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하고, 사용자의 조작 결과에 상응하는 수정지시 신호를 생성한 후, 수정된 기계번역 결과를 입력받아 표시하는 사용자 인터페이스부; 및 상기 최초의 기계번역 결과를 생성한 후 상기 사용자 인터페이스부로부터 상기 수정지시 신호를 입력받고, 상기 수정지시 신호에 따라 상기 최초의 기계번역 결과를 수정하여 상기 수정된 기계번역 결과를 생성하고 이를 상기 사용자 인터페이스부에 제공하며, 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간 차이를 분석하고 그 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 하는 기계번역부를 포함할 수 있다.
여기에서 상기 제2 번역 대상 문장은, 상기 제1 번역 대상 문장을 포함하는 문서에서 상기 제1 번역 대상 문장을 제외한 나머지 문장들 중 적어도 일부일 수 있다.
상기 기계번역부는 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과를 대비하여, 상기 최초의 기계번역 결과와 차별화되는 상기 수정된 기계번역 결과의 고유한 특징을 찾으며, 상기 찾아진 고유한 특징을 반영하여 상기 제2 번역 대상 문장을 기계번역할 수 있다.
상기 사용자 인터페이스부는 상기 최초의 기계번역 결과의 후보들인 복수의 기계번역 결과들 중 미리 설정된 기준에 따라 자동으로 선택된 하나의 후보를 상기 최초의 기계번역 결과로서 표시하고, 상기 사용자의 조작에 상응하는 선택 신호를 생성하며 상기 선택 신호에 상응하는 상기 수정된 기계번역 결과를 표시하고, 상기 기계번역부는 상기 복수의 기계번역 결과들을 생성하여 상기 사용자 인터페이스부에 제공하고, 상기 선택 신호에 따라 상기 복수의 기계번역 결과들 중 하나를 상기 수정된 기계번역 결과로서 결정하며 이를 상기 사용자 인터페이스부에게 제공할 수 있다.
상기 기계번역부는 상기 제1 번역 대상 문장이 포함된 문서의 제목, 상기 문서 내용이 속하는 분야와 장르, 상기 사용자가 희망하는 문체, 상기 문서에 등장하는 화자별 성별과 나이, 상기 화자 간 관계 중 적어도 일부에 관한 정보인 번역 방향 정보를 반영해 동작할 수 있다.
위 목적을 달성하기 위하여, 사용자 인터페이스부를 통해 번역 결과를 표시하는 본 발명의 적어도 일 실시예에 따른 기계번역 방법은, 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하는 최초 표시 단계; 상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라, 상기 최초의 기계번역 결과를 수정하고, 수정된 기계번역 결과를 표시하는 수정 표시 단계 및 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간의 차이를 분석하고 그 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 수행하는 반영 단계를 포함할 수 있다.
여기에서 상기 제2 번역 대상 문장은 상기 제1 번역 대상 문장을 포함하는 문서에서 상기 제1 번역 대상 문장을 제외한 나머지 문장들 중 적어도 일부일 수 있다.
또한 상기 반영 단계는, 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과를 대비하여, 상기 최초의 기계번역 결과와 차별화되는 상기 수정된 기계번역 결과의 고유한 특징을 찾고, 상기 찾아진 고유한 특징을 반영하여 상기 제2 번역 대상 문장에 대한 기계번역을 할 수 있다.
한편, 상기 수정 표시 단계는, 상기 최초의 기계번역 결과의 후보들인 복수의 기계번역 결과들을 표시하는 단계; 상기 복수의 기계번역 결과들 중 상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라 선택된 것을 상기 수정된 기계번역 결과로서 결정하는 단계; 및 상기 결정된 수정된 기계번역 결과를 표시하는 단계를 포함할 수 있다.
상기 최초 표시 단계는, 상기 제1 번역 대상 문장이 포함된 문서의 제목, 상기 문서 내용이 속하는 분야 및 장르, 상기 사용자가 희망하는 문체, 상기 문서에 등장하는 화자별 성별과 나이, 상기 화자 간 관계 중 적어도 일부에 관한 정보인 번역 방향 정보를 반영하여 수행될 수 있다.
위 목적을 달성하기 위하여, 사용자 인터페이스부를 통해 번역 결과를 표시하기 위한 본 발명의 적어도 일 실시예에 따른 컴퓨터로 읽을 수 있는 기록매체는, 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하는 최초 표시 단계; 상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라, 상기 최초의 기계번역 결과를 수정하고, 수정된 기계번역 결과를 표시하는 수정 표시 단계 및 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간 차이를 분석하고 그 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 수행하는 반영 단계를 포함한 기계번역 방법을 컴퓨터를 통해 실행시키기 위한 컴퓨터 프로그램을 저장할 수 있다.
본 발명의 적어도 일 실시예에 따른 기계번역 장치 및 방법에 의하면, 기계번역 결과에 투입되는 사용자의 시간, 비용 및 노력을 최소한으로 하면서도 고품질의 번역물을 효율적으로 짧은 시간 안에 얻을 수 있다.
도 1은 본 발명의 적어도 일 실시예에 따른 기계번역 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 적어도 일 실시예에 따른 기계번역 방법을 설명하기 위한 플로우챠트이다.
도 1을 이용하여 본 발명의 적어도 일 실시예에 따른 ‘기계번역 장치(100)’를 설명하면 다음과 같다.
번역 대상물은 기계번역 장치(100)에 ‘문서(document)’의 형태로 주어지는데, 번역 대상물에는 한 개 이상의 문장(sentense)들이 포함되어 있을 수 있다.
본 명세서에서 ‘문서’라 함은 종이와 같은 유형물로 작성된 문서를 뜻할 수도 있고, 워드 프로세서(word processor)로 작성된 전자 파일과 같이 무형물로 작성된 문서를 의미할 수도 있다. 유형물로 작성된 문서의 경우에 본 발명의 적어도 일 실시예에 따른 기계번역 장치(100)는 그 유형물 형태의 문서를 스캔(scan) 등의 방식을 통해 인식할 수 있는데, 유형물 형태의 문서를 인식하는 방법에는 제한이 없다.
그리고, 문서에는 반드시 문법적으로 완성된 형태의 문장만 존재하는 것이 아니고, ‘문법적으로 완성되지 않은 문장’ 또는 ‘문법적으로는 문장이라고 부르기 어려운 형태에 머물러 있는 단어 그 자체’도 존재할 수 있지만, 본 명세서에서 특히 본 청구범위에서 ‘문장’이라 함은 이러한 모든 형태의 단어 내지 문장 전부를 통칭한다.
또한 문서에는 문장과 같은 텍스트(text)뿐만 아니라 그림 등 이미지(image)도 포함될 수 있으므로, 문장들로만 구성되어야 본 명세서에서 말하는 ‘문서’가 아님은 물론이다.
본 발명의 적어도 일 실시예에 따른 기계번역 장치(100)는 문서 속에 존재하는 문장들을 기계번역함에 있어 처음부터 순서대로 끝까지 번역할 수도 있고, 사용자가 정한 특정 위치의 문장들만 번역할 수도 있다.
기계번역 장치(100)는 사용자 인터페이스부(110)와 기계번역부(120)를 포함할 수가 있다. 여기서, 기계번역부(120)는 번역 모델(130), 번역 문장 선택부(140), 컨텐츠 정보 처리부(150), 번역 문장 전처리부(160), 및 번역 문장 후처리부(170)를 포함할 수 있다.
사용자 인터페이스부(110)는 PC(Personal Computer)의 화면처럼 단순히 보여주는 기능만을 가진 구성요소와 키보드나 마우스와 같이 입력 기능만을 가진 구성요소가 결합되어 구현될 수도 있고, 터치 스크린(touch screen)과 같이 보여주는 기능과 입력 기능 모두를 구비한 하나의 구성요소로 구현될 수도 있다. 본 청구범위를 구현할 수 있는 이상 사용자 인터페이스부(110)의 구체적인 구현 예시 내지 실시예는 매우 다양할 수 있다.
지금부터 사용자 인터페이스부(110) 및 기계번역부(120)가 본 발명의 적어도 일 실시예에 따라 기계번역을 수행하는 과정을 시간 순으로 설명하여, 본 발명의 이해를 돕고자 한다. 기계번역부(120) 및 그에 포함되어 있는 번역 모델(130), 번역 문장 선택부(140) 등 개별 구성요소들의 구체적인 역할 내지 동작은 아래의 설명 과정에서 살펴보기로 한다.
본 발명의 적어도 일 실시예에 따른 기계번역 장치(100)가 문서 속에 있는 문장들을 기계번역함에 있어, 사용자 인터페이스부(110)는 일단 사용자에게 어느 일부 문장들(이 문장은 한 문장일 수도 있으며, 복수의 문장들일 수도 있는데, 본 명세서에서는 이를 ‘제1 번역 대상 문장’이라 통칭한다)에 대한 최초의 기계번역 결과를 보여준다. 최초의 기계번역 결과는 기계번역부(120)가 생성하여 사용자 인터페이스부(110)에게 제공한 것이고, 사용자 인터페이스부(110)는 기계번역부(120)로부터 제공받은 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’를 표시할 수 있다. 본 명세서에서 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’라 함은 제1 번역 대상 문장에 대해 처음으로 기계번역된 결과물이자 오직 기계번역에만 의존하여 번역되어 사용자 인터페이스부(110)에 처음으로 표시된 제1 번역 대상 문장에 대한 번역 결과물을 의미한다.
이러한 ‘최초의 기계번역 결과’를 표시하는 과정에 대하여 부연하여 설명하면 다음과 같다. 동일한 내용에 대하여도 그 표현 방식은 다양할 수 있으므로, 기계번역부(120)의 번역 모델(130)은 제1 번역 대상 문장에 대한 기계번역을 다양한 표현 방식으로 수행하여 복수의 기계번역 결과들을 최초의 기계번역 결과의 ‘후보’들로서 생성할 수 있다. 이 때 각 후보마다 그 번역이 사용자가 원하는 의도에 맞는 번역일 가능성을 추산하여 해당 점수(번역 성공률)가 자동으로 계산될 수 있다.
이 경우에 사용자 인터페이스부(110)는 그 복수의 기계번역 결과들 중 미리 설정된 기준에 따라 자동으로 선택된 하나의 후보를 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’로서 표시할 수 있다. 예를 들어, 사용자 인터페이스부(110)는 제1 번역 대상 문장에 대한 복수의 기계번역 결과들 중 가장 점수(번역 성공률)가 높은 후보를 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’로서 표시할 수 있다.
지금부터는 사용자 인터페이스부(110)에 표시된 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’가 만족스럽지 않을 경우, 기계번역의 품질을 높이기 위해 본 발명의 적어도 일 실시예가 어떠한 역할을 하는지 살펴본다.
사용자는 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하고 있는 사용자 인터페이스부(110)를 조작하여, 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 수정할 수 있고, 이 경우 사용자 인터페이스부(110)는 그 조작 결과에 상응하는 수정지시 신호를 생성한다.
기계번역부(120)의 번역 모델(130)은 기계번역부(120)가 사용자 인터페이스부(110)로부터 받은 수정지시 신호에 따라 최초의 기계번역 결과를 수정하고, 수정된 기계번역 결과를 사용자 인터페이스부(110)에게 제공하며, 사용자 인터페이스부(110)는 제1 번역 대상 문장에 대한 ‘수정된 기계번역 결과’를 표시한다.
이와 같이 ‘최초의 기계번역 결과’가 ‘수정된 기계번역 결과’로 변경 표시되는 과정을 구체적인 예를 들어 부연 설명하면 아래와 같다.
일 례로, 기계번역 장치(100)가 사용자에게 ‘최초의 기계번역 결과’를 대체할 수 있는 또 다른 기계번역 결과들[=기계번역부(120)의 번역 모델(130)이 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’의 ‘후보’로서 생성한 복수의 기계번역 결과들 중 사용자 인터페이스부(110)에 표시된 ‘최초의 기계번역 결과’를 제외한 하나 이상의 후보들]을 보여주고 나서, 이 중에서 사용자로 하여금 사용자가 더 마음에 들어 하는 보기(option)를 선택하도록 할 수 있다. 예를 들어, 도 1에 도시된 바와 같이, 도 1의 식별번호 110 박스에 표시되어 있는 ‘그는 의장이었다’라는 뜻의 프랑스어 문장인 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과(프랑스어를 영어로 번역함)’가 “He was the president”라고 가정하자. 이 경우 사용자가 그 ‘최초의 기계번역 결과’를 대체할 수 있는 또 다른 기계번역 결과들을 보고자 하면, 사용자 인터페이스부(110)는 기계번역부(120)로부터 그 ‘최초의 기계번역 결과’를 대체할 수 있는 또 다른 기계번역 결과인 “He was the chairman”를 제공받아 보여줄 수 있고, 만일 사용자가 그 또 다른 기계번역 결과를 마음에 들어하여 선택하면 그 최초의 기계번역 결과는 그 또 다른 기계번역 결과로 변경되고, 그 또 다른 기계번역 결과가 바로 제1 번역 대상 문장의 ‘수정된 기계번역 결과’가 된다.
이와 같은 방식으로 사용자가 사용자 인터페이스부(110)를 조작하여 사용자 인터페이스부(110)가 제1 번역 대상 후보에 대한 ‘최초의 기계번역 결과’를 대체할 수 있는 보기 내지 선택지로서 보여주는 또 다른 (하나 이상의) 기계번역 결과들 중 어느 하나의 기계번역 결과를 선택한다면, 사용자 인터페이스부(110)는 그 조작 결과에 상응하는 선택 신호를 생성한다. 이 경우 기계번역부(120)의 번역 문장 선택부(140)는 선택 신호에 따라 그 복수의 기계번역 결과들 중 하나를 ‘수정된 기계번역 결과’로 결정하고 이를 사용자 인터페이스부(110)에게 제공하며, 사용자 인터페이스부(110)는 이를 제1 번역 대상 문장에 대한 수정된 기계번역 결과로서 표시한다.
한편 다른 례로, 사용자가 사용자 인터페이스부(110)에 표시된 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’를 대체할 수 있는 또 다른 기계번역 결과들의 보기나 선택지를 보지 아니한 채, 사용자의 개성을 반영하여 사용자 인터페이스부(110)를 조작해 그 ‘최초의 기계번역 결과’를 수정하고, 사용자의 그 조작에 따라 기계번역부(120)가 제1 번역 대상 문장에 대한 ‘수정된 기계번역 결과’를 생성할 수도 있다.
이와 같이 제1 번역 대상 문장에 대한 ‘수정된 기계번역 결과’가 생성된 이후에 본 발명의 적어도 일 실시예는 다음과 같이 기계번역을 수행할 수 있다.
기계번역부(120) 특히 그 내부의 번역 모델(130)은 제2 번역 대상 문장에 대한 기계번역을 수행하되, 제1 번역 대상 문장에 대한 ‘수정된 기계번역 결과’를 반영하여 수행할 수 있다. 구체적으로, 번역 모델(130)은 제1 번역 대상 문장에 대한 최초의 기계번역 결과가 사용자의 수정에 따라 어떻게 수정되었는지를 파악 및 분석하고, 다시 말해 ‘최초의 기계번역 결과’와 ‘수정된 기계번역 결과’ 간 차이를 분석하고, 그 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 수행할 수 있다. 보다 구체적으로는 기계번역부(120)의 번역 모델(130)은 ‘수정된 기계번역 결과’와 ‘최초의 기계번역 결과’를 대비하여, 최초의 기계번역 결과와 차별화되는 수정된 기계번역 결과의 고유한 특징을 찾고, 그 찾아진 고유한 특징을 반영하여 제2 번역 대상 문장을 기계번역할 수 있다.
본 명세서에서, 제2 번역 대상 문장은 제1 번역 대상 문장이 포함된 문서에서 제1 번역 대상 문장을 제외한 나머지 문장들 중 적어도 일부를 의미한다. 설명의 편의상 예를 들어 살펴보면, 기계번역 장치(100)는 주어진 문서 속의 모든 문장들을 처음부터 끝까지 순서대로 한 문장씩 기계번역하는데, 앞서 본 바와 같이 어떤 문장(이것이 앞서 본 ‘제1 번역 대상 문장’임)이 사용자에 의해 수정된 경우, 번역 모델(130)은 제1 번역 대상 문장에 대한 최초의 기계번역 결과와 수정된 기계번역 결과 간 차이를 분석하고, 제1 번역 대상 문장 바로 뒤 문장(이것이 앞서 본 ‘제2 번역 대상 문장’임)을 기계번역 함에 있어 그 분석된 결과를 반영함으로써, 사용자로 하여금 더 이상 동일한 패턴의 수정을 하지 않도록 할 수 있다. 이 예시에서는 제2 번역 대상 문장이 제1 번역 대상 문장 바로 뒤 문장이나, 이는 설명의 편의를 위한 것뿐이다. 다른 예시에서는 제2 번역 대상 문장이 제1 번역 대상 문장 뒤의 모든 문장들을 지칭할 수도 있고, 제1 번역 대상 문장 앞의 모든 문장들을 지칭할 수도 있으며, 제1 번역 대상 문장을 제외하고 그 앞, 뒤를 가릴 것 없이 모든 문장들을 지칭할 수도 있다.
이러한 본 발명의 적어도 일 실시예에 의하여, 기계번역 결과에 투입되는 사용자의 시간, 비용 및 노력을 최소한으로 하면서도 고품질의 번역물을 효율적으로 단시간 안에 얻을 수 있다.
한편 본 발명의 적어도 일 실시예에 따른 기계번역 장치(100)는 기계번역을 수행하기 전에 미리 ‘사용자가 원하는 번역의 방향 내지 기호에 관한 정보(이하 ‘번역 방향 정보’라 한다)’를 입력받고, 그에 맞추어 기계번역을 수행할 수도 있다. 보다 구체적으로 기계번역부(120)의 컨텐츠 정보 처리부(150)는 사용자 인터페이스부(110)를 통하여 사용자로부터 번역 방향 정보를 입력받을 수 있고, 이 경우 번역 모델(130)은 번역 방향 정보에 따라 기계번역을 할 수 있다.
번역 방향 정보의 예시로는, 번역하고자 하는 문서 즉, 제1 번역 대상 문장이 포함된 문서의 제목, 문서 내용이 속하는 분야(예를 들어, 출판 분야, 방송 분야, 의료 분야, 법률 분야 등), 문서 내용이 속하는 장르(예를 들어, 스포츠, 로맨스, 코미디, 예능 등), 사용자가 희망하는 번역 결과물의 문체(예를 들어, 존칭을 사용한 문체인지 여부, “~해요”, “~합니다” 중 어느 문체를 선호하는지 등), 문서에 등장하는 화자들이 여러 명일 경우 각 화자의 성별과 나이, 그 화자들 간의 관계 등에 관한 정보를 들 수 있다.
마지막으로, 본 발명의 적어도 일 실시예에 따른 기계번역 장치(100)의 기계번역부(120)에 포함될 수 있는 번역 문장 전처리부(160)와 번역 문장 후처리부(170)를 설명한다. 일반적으로 (종래의) 기계번역 장치는 기계‘번역’만 하므로, 제1 번역 대상 문장에 특수 기호나 외래어 등 기계번역이 잘 안 되는 표현(이하 ‘특수 기호 등’이라 한다)이 포함되어 있는 경우, 앞서 본 바와 같이 본격적으로 기계번역을 수행하기에 앞서, 번역 문장 전처리부(160)는 제1 번역 대상 문장에서 특수 기호 등을 제거하거나 기계번역할 수 있는 다른 기호 등으로 대체하여 기계번역이 효과적으로 이루어질 수 있도록 처리하고 이를 번역 모델(130)에게 제공하며, 번역 문장 후처리부(170)는 번역 모델(130)과 번역 문장 선택부(140)에 의하여 생성된 (제1 번역 대상 문장에 대한) 최초의 기계번역 결과 또는 수정된 기계번역 결과를 번역 문장 전처리부(160)에 의해 수행된 처리 방식의 역 처리 방식으로 처리하여 사용자 인터페이스부(110)에게 제공한다.
도 2는 본 발명의 적어도 일 실시예에 따른 기계번역 방법을 설명하기 위한 플로우챠트인데, 이하에서는 이를 도 1을 참조하여 설명한다.
우선, 사용자 인터페이스부(110)는 사용자로부터 번역 방향 정보를 입력받고(제210 단계), 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’를 표시한다(제220 단계).
제220 단계 후에 기계번역 장치(100)는 사용자가 제1 번역 대상 문장에 대한 최초의 기계번역 결과에 관해 수정을 원하는지 여부를 판단한다(제230 단계). 예를 들어, 만일 사용자가 수정을 원하여 사용자 인터페이스부(110)를 조작해 그 수정 의사를 밝힌다면, 기계번역 장치(100)는 제230 단계에서 사용자가 수정을 희망한다고 판단하게 된다.
만일 제230 단계에서 사용자가 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’에 대해 수정을 원한다고 판단되면, 사용자 인터페이스부(110)는 사용자에게 그 수정을 할 수 있는 작업환경을 제공하고, 사용자는 사용자 인터페이스부(110)를 조작하여 기계번역부(120)로 하여금 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’를 사용자의 수정 지시에 따라 수정하도록 하며, 이 같은 원리로 기계번역부(120)가 ‘수정된 기계번역 결과’를 생성하면, 사용자 인터페이스부(110)는 제1 번역 대상 문장에 대한 ‘수정된 기계번역 결과’를 표시한다(제240 단계).
제240 단계 후, 기계번역부(120)는 제240 단계에서 표시된 ‘수정된 기계번역 결과’와 제210 단계에서 표시된 ‘최초의 기계번역 결과’ 간 차이를 분석하고, 분석 결과를 반영하여 제2 번역 대상 문장에 대한 기계번역을 수행한다(제250 단계). 이로써 제2 번역 대상 문장의 경우에, 사용자가 제2 번역 대상 문장에 대한 최초의 기계번역 결과를 마음에 들어 할 가능성을 높일 수 있고, 제230 단계 및 제240 단계와 같은 수정 작업을 진행하지 않으면서도 고품질의 번역결과를 얻을 가능성을 높일 수 있다.
한편 만일 제230 단계에서 사용자가 제1 번역 대상 문장에 대한 ‘최초의 기계번역 결과’에 대하여 수정을 원하지 않는다고 판단되면, 기계번역부(120)는 제230 단계 내지 제250 단계를 수행하지 아니하고 제2 번역 대상 문장을 기계번역할 수 있다.
한편 본 발명의 적어도 일 실시예에 따른 컴퓨터로 판독 가능한 기록매체는, 위 기계번역 방법(도 2 참조)을 수행하기 위한 컴퓨터 프로그램을 저장할 수 있다.
위에서 본 발명의 설명은 일부 실시예에 대한 설명에 지나지 않고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 청구범위의 기재 범위 내에서 위 일부 실시예를 다양하게 변형하여 실시할 수 있으므로, 위 일부 실시예의 내용으로 청구범위를 제한해석하여서는 아니 된다.
본 발명의 적어도 일 실시예에 따른 기계번역 장치 및 방법은 기계번역에 이용 가능하다.
110: 사용자 인터페이스부 120: 기계번역부
130: 번역 모델 140: 번역 문장 선택부
150: 컨텐츠 정보 처리부 160: 번역 문장 전처리부
170: 번역 문장 후처리부

Claims (11)

  1. 문서에 포함된 하나 이상의 문장들로 이루어지고 문장 단위로 구성되는 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하고, 사용자의 조작 결과에 상응하는 수정지시 신호를 생성한 후, 수정된 기계번역 결과를 입력받아 표시하는 사용자 인터페이스부; 및
    상기 최초의 기계번역 결과를 생성한 후, 상기 사용자 인터페이스부로부터 상기 수정지시 신호를 입력받고, 상기 수정지시 신호에 따라 상기 최초의 기계번역 결과를 수정하여 상기 수정된 기계번역 결과를 생성하고 이를 상기 사용자 인터페이스부에 제공하며, 상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간 차이를 분석하고 그 분석 결과를 반영하여 상기 문서에 포함된 상기 제1 번역 대상 문장 이외의 하나 이상의 문장들로 이루어지고 문장 단위로 구성되는 제2 번역 대상 문장에 대한 기계번역을 하는 기계번역부를 포함하고,
    상기 기계번역부는, 상기 문서와 관련된 정보 및 상기 사용자가 희망하는 문체에 대한 정보를 포함하는 번역 방향 정보를 반영하여 상기 최초의 기계번역 결과를 생성하고, 상기 제2 번역 대상 문장에 대한 기계번역을 하고,
    상기 문서와 관련된 정보는, 상기 문서의 제목, 상기 문서 내용이 속하는 분야 및 장르, 상기 문서에 등장하는 화자별 성별과 나이, 상기 화자 간 관계 중 적어도 하나를 포함하는 것을 특징으로 하는 기계번역 장치.
  2. 제1항에 있어서, 상기 제2 번역 대상 문장은,
    상기 문서에서 상기 제1 번역 대상 문장을 제외한 나머지 문장들 중 적어도 일부인 것을 특징으로 하는 기계번역 장치.
  3. 제1항에 있어서, 상기 기계번역부는
    상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과를 대비하여, 상기 최초의 기계번역 결과와 차별화되는 상기 수정된 기계번역 결과의 고유한 특징을 찾고, 상기 찾아진 고유한 특징을 반영하여 상기 제2 번역 대상 문장을 기계번역하는 것을 특징으로 하는 기계번역 장치.
  4. 제1항에 있어서,
    상기 사용자 인터페이스부는 상기 최초의 기계번역 결과의 후보들인 복수의 기계번역 결과들 중 미리 설정된 기준에 따라 자동으로 선택된 하나의 후보를 상기 최초의 기계번역 결과로서 표시하고, 상기 사용자의 조작에 상응하는 선택 신호를 생성하며 상기 선택 신호에 상응하는 상기 수정된 기계번역 결과를 표시하고,
    상기 기계번역부는 상기 복수의 기계번역 결과들을 생성하여 상기 사용자 인터페이스부에 제공하고, 상기 선택 신호에 따라 상기 복수의 기계번역 결과들 중 하나를 상기 수정된 기계번역 결과로서 결정하며 이를 상기 사용자 인터페이스부에게 제공하는 것을 특징으로 하는 기계번역 장치.
  5. 삭제
  6. 사용자 인터페이스부를 통해 번역 결과를 표시하는 기계번역 방법에 있어서,
    번역 방향 정보를 반영하여 문서에 포함된 하나 이상의 문장들로 이루어지고 문장 단위로 구성되는 제1 번역 대상 문장에 대한 최초의 기계번역 결과를 표시하는 최초 표시 단계;
    상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라, 상기 최초의 기계번역 결과를 수정하고, 수정된 기계번역 결과를 표시하는 수정 표시 단계; 및
    상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과 간 차이를 분석하고 그 분석 결과 및 상기 번역 방향 정보를 반영하여 상기 문서에 포함된 상기 제1 번역 대상 문장 이외의 하나 이상의 문장들로 이루어지고 문장 단위로 구성되는 제2 번역 대상 문장에 대한 기계번역을 수행하는 반영 단계를 포함하고,
    상기 번역 방향 정보는 상기 문서와 관련된 정보 및 상기 사용자가 희망하는 문체에 대한 정보를 포함하고,
    상기 문서와 관련된 정보는, 상기 문서의 제목, 상기 문서 내용이 속하는 분야 및 장르, 상기 문서에 등장하는 화자별 성별과 나이, 상기 화자 간 관계 중 적어도 하나를 포함하는 것을 특징으로 하는 기계번역 방법.
  7. 제6항에 있어서, 상기 제2 번역 대상 문장은
    상기 문서에서 상기 제1 번역 대상 문장을 제외한 나머지 문장들 중 적어도 일부인 것을 특징으로 하는 기계번역 방법.
  8. 제6항에 있어서, 상기 반영 단계는,
    상기 수정된 기계번역 결과와 상기 최초의 기계번역 결과를 대비하여, 상기 최초의 기계번역 결과와 차별화되는 상기 수정된 기계번역 결과의 고유한 특징을 찾고, 상기 찾아진 고유한 특징을 반영하여 상기 제2 번역 대상 문장을 기계번역하는 것을 특징으로 하는 기계번역 방법.
  9. 제6항에 있어서, 상기 수정 표시 단계는,
    상기 최초의 기계번역 결과의 후보들인 복수의 기계번역 결과들을 표시하는 단계;
    상기 복수의 기계번역 결과들 중 상기 사용자 인터페이스부에 대한 사용자의 조작 결과에 따라 선택된 것을 상기 수정된 기계번역 결과로서 결정하는 단계; 및
    상기 결정된 수정된 기계번역 결과를 표시하는 단계를 포함하는 것을 특징으로 하는 기계번역 방법.
  10. 삭제
  11. 제6항 내지 제9항 중 한 항의 방법을 컴퓨터에서 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020200185665A 2020-12-29 2020-12-29 기계번역을 위한 장치 및 방법 KR102562920B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200185665A KR102562920B1 (ko) 2020-12-29 2020-12-29 기계번역을 위한 장치 및 방법
US17/211,014 US11790186B2 (en) 2020-12-29 2021-03-24 Machine translation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200185665A KR102562920B1 (ko) 2020-12-29 2020-12-29 기계번역을 위한 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20220094444A KR20220094444A (ko) 2022-07-06
KR102562920B1 true KR102562920B1 (ko) 2023-08-02

Family

ID=82119208

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200185665A KR102562920B1 (ko) 2020-12-29 2020-12-29 기계번역을 위한 장치 및 방법

Country Status (2)

Country Link
US (1) US11790186B2 (ko)
KR (1) KR102562920B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11900073B2 (en) * 2021-09-07 2024-02-13 Lilt, Inc. Partial execution of translation in browser

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004501429A (ja) 2000-05-11 2004-01-15 ユニバーシティ・オブ・サザン・カリフォルニア 機械翻訳技法
JP2007042133A (ja) 2006-10-12 2007-02-15 Fujitsu Ltd 翻訳システム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US7865358B2 (en) * 2000-06-26 2011-01-04 Oracle International Corporation Multi-user functionality for converting data from a first form to a second form
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム
KR100911621B1 (ko) 2007-12-18 2009-08-12 한국전자통신연구원 한영 자동번역 방법 및 장치
KR20140049150A (ko) * 2012-10-16 2014-04-25 한국전자통신연구원 사용자 참여 기반의 자동 번역 생성 후처리 시스템
US8996352B2 (en) * 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US10248653B2 (en) * 2014-11-25 2019-04-02 Lionbridge Technologies, Inc. Information technology platform for language translation and task management
KR101916781B1 (ko) * 2016-04-26 2018-11-08 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
GB2558062A (en) * 2016-11-18 2018-07-04 Lionbridge Tech Inc Collection strategies that facilitate arranging portions of documents into content collections
US11093110B1 (en) * 2017-07-17 2021-08-17 Amazon Technologies, Inc. Messaging feedback mechanism
US10769387B2 (en) * 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
US10657332B2 (en) * 2017-12-21 2020-05-19 Facebook, Inc. Language-agnostic understanding
KR102516363B1 (ko) * 2018-01-26 2023-03-31 삼성전자주식회사 기계 번역 방법 및 장치
KR20200032441A (ko) * 2018-09-18 2020-03-26 한국전자통신연구원 사용자 적응형 자동번역 모델 선택 강화 장치 및 방법
CN110263349A (zh) * 2019-03-08 2019-09-20 腾讯科技(深圳)有限公司 语料评估模型训练方法、装置、存储介质和计算机设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004501429A (ja) 2000-05-11 2004-01-15 ユニバーシティ・オブ・サザン・カリフォルニア 機械翻訳技法
JP2007042133A (ja) 2006-10-12 2007-02-15 Fujitsu Ltd 翻訳システム

Also Published As

Publication number Publication date
US20220207245A1 (en) 2022-06-30
US11790186B2 (en) 2023-10-17
KR20220094444A (ko) 2022-07-06

Similar Documents

Publication Publication Date Title
US11842251B2 (en) Automated comprehension and interest-based optimization of content
GB2558400A (en) Generating presentation slides with distilled content
US20110201387A1 (en) Real-time typing assistance
US20090204399A1 (en) Speech data summarizing and reproducing apparatus, speech data summarizing and reproducing method, and speech data summarizing and reproducing program
JP5211193B2 (ja) 翻訳表示装置
US11222171B2 (en) Enhanced pivot table creation and interaction
JP2011182125A (ja) 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム
US10803236B2 (en) Information processing to generate screen based on acquired editing information
KR102351408B1 (ko) 동영상 번역자막제공 서비스 방법
JP4093241B2 (ja) 書類作成支援装置、書類作成支援プログラムおよび記憶媒体、並びに書類作成支援方法
KR102351400B1 (ko) 동영상 자막제공 서비스 방법
JP6865701B2 (ja) 音声認識誤り修正支援装置およびそのプログラム
KR102562920B1 (ko) 기계번역을 위한 장치 및 방법
US11119727B1 (en) Digital tutorial generation system
US11606629B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2019197210A (ja) 音声認識誤り修正支援装置およびそのプログラム
CN114245193A (zh) 显示控制方法、装置和电子设备
KR20120086037A (ko) 자동 번역 서비스 시스템 및 자동 번역 제공 방법
US11765428B2 (en) System and method to adapting video size
CN110955401B (zh) 声音回放区间控制方法、计算机可读存储介质和信息处理装置
JP5628485B2 (ja) 翻訳支援システム及びその方法及びそのプログラム
KR102379911B1 (ko) 맞춤형 템플릿을 제공하는 화상회의 시스템
JP2008269085A (ja) 情報推薦装置及び情報推薦システム
JP4249585B2 (ja) 字幕データ作成システム
WO2011004607A1 (ja) コンピュータシステム,コンピュータ,及びプログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant