KR100681989B1 - 자연 언어 처리 장치 및 방법 - Google Patents

자연 언어 처리 장치 및 방법 Download PDF

Info

Publication number
KR100681989B1
KR100681989B1 KR1020007004712A KR20007004712A KR100681989B1 KR 100681989 B1 KR100681989 B1 KR 100681989B1 KR 1020007004712 A KR1020007004712 A KR 1020007004712A KR 20007004712 A KR20007004712 A KR 20007004712A KR 100681989 B1 KR100681989 B1 KR 100681989B1
Authority
KR
South Korea
Prior art keywords
input
language
processing
expression
conversion
Prior art date
Application number
KR1020007004712A
Other languages
English (en)
Other versions
KR20010031659A (ko
Inventor
아사노야스하루
히로에아쯔오
시마까와마사또
가가미데쯔야
고바야시에리까
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20010031659A publication Critical patent/KR20010031659A/ko
Application granted granted Critical
Publication of KR100681989B1 publication Critical patent/KR100681989B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

자연 언어 처리 장치는, 자연 언어를 입력하는 입력부와, 자연 언어의 표현을 변환하는 표현 변환부와, 표현 변환부에서 변환된 문장을 확인을 위해 표시하는 표시부와, 확인을 받은 상기 문장을 기계 번역하는 기계 번역부와, 이들 각 부를 제어하는 제어부를 포함하여, 사용자의 확인 동작을 줄인 자연 언어 처리를 제공한다.
자연 언어 처리, 표현 변환부, 기계 번역부, 번역 결과 확인 수단, 음성 인식

Description

자연 언어 처리 장치 및 방법{NATURAL LANGUAGE PROCESSING DEVICE AND METHOD}
본 발명은, 자연 언어를 처리하는 자연 언어 처리 장치 및 방법에 관한 것으로, 자세하게는, 처리의 과정에서의 사용자에 의한 선택·확인을 간략화, 간소화하는 자연 언어 처리 장치 및 방법에 관한 것이다.
종래, 자동 번역, 음성 인식, 문서 검색, 문서 처리 등 자연 언어 처리를 이용한 여러가지 시스템이 실용화되고 있다.
종래의 시스템의 일례로서, 도 1에 종래 기술에 따른 음성 번역 장치의 처리 순서의 개요의 플로우차트를 나타낸다.
이 음성 번역 장치의 처리 순서에서, 스텝 S101의 음성 입력은, 스텝 S102에서 음성 인식되고, 이 음성 인식의 결과는 스텝 S103에서 사용자에 의해 확인된다. 사용자에 의해 음성 인식의 결과가 승낙되면 스텝 S104에서 인식 결과가 기계 번역되지만, 그렇지 않은 경우에는 스텝 S101로 복귀하여 음성 인식을 다시 실행한다.
스텝 S104의 기계 번역의 결과는 스텝 S105에서 사용자에 의한 확인을 받아, 필요한 경우에는 스텝 S106에서 편집이 실시되고, 마지막 스텝107에서 합성 음성이 생성되어, 이 처리 순서를 종료한다.
이와 같이, 스텝 S101에서 사용자는 우선 음성으로 자신이 의도하는 발화를 음성 번역 장치에 입력한다. 음성 번역 장치는, 스텝 S102에서 입력된 음성의 인식을 행하고, 그 결과를 표시한다. 음성 인식 처리에서는 오인식을 발생시킬 수 있기 때문에, 인식 결과를 사용자가 확인하는 처리가 잘 행해진다.
스텝 S103에서의 인식 결과의 확인 방법으로는, 인식 처리에서 스코어가 높았던 상위의 후보를 여러개 표시하여, 그 중에서 사용자가 선택하는 방법 등이 자주 이용된다. 그리고, 만약 표시되어 있는 문장 중에 자기가 바라는 문장이 포함되지 않은 경우에는, 또 한번 음성 입력을 행한다. 사용자의 확인에 따라 사용자가 음성 입력한 문장이 확정되면, 이번에는 그 문장을, 스텝 S104에서 목적 언어로 번역한다.
일반적으로, 번역 처리도 또 오류를 포함하는 결과가 출력될 가능성이 있으므로, 번역 정확도를 유지하기 위해, 스텝 S105에서 번역 결과를 사용자가 확인한다고 하는 작업이 행해진다. 그리고, 만약 번역 결과가 적당하지 않은 경우에는, 스텝 S106에서 적절한 목적 언어의 표현으로 편집한다.
그리고, 스텝 S106에서 번역 결과로부터 합성 음성을 생성하여 출력하고, 이 음성 인식의 처리 순서를 종료한다.
그러나, 종래의 자연 언어 처리를 이용한 시스템에서는, 이용자에게 적합한 인터페이스가 정비되어 있다고는 할 수 없다. 예를 들면, 상기된 구성의 음성 번역 장치의 경우에는, 이하와 같은 2개의 문제점이 있다.
첫번째는, 취급하는 자연 언어의 다양성과, 처리 정확도의 문제이다. 현재의 기계 번역으로는, 다양한 입력문에 대해 높은 정확도로 번역하는 것은 매우 곤란하다. 일반적으로 기계 번역은 원어의 입력문으로서 다양한 문체를 취급하고자 할수록, 번역의 정확도가 저하한다는 문제가 있다. 한편, 입력문의 문형이나 어휘 등에 제약을 가함으로써 번역의 정확도를 올리는 것은 가능하지만, 그와 같은 제약된 입력을 하게 하는 것은 사용자에게는 부담이 된다. 또한, 입력문에 의미나 관련성 등의 다의성이나 상황 의존성 등이 있는 경우, 그것을 번역한 결과는 일반적으로 복수 개 존재한다.
이것을 하나의 뜻으로 특정하기 위해서는, 적절한 후보를 번역 장치측에서 자동적으로 선택하든지 사용자가 선택해 주든지 둘 중 하나이지만, 전자는 틀린 후보를 선택할 가능성이 있고, 후자는 사용자가 목적 언어를 잘 모르면 곤란하다. 또, 후자의 응용으로서, 번역 결과를 원어로 다시 번역하고, 사용자는 그 재번역 결과를 제시함으로써 선택·확인을 하는 방법으로는 재번역 과정에서 오류가 생길 수 있다. 또한, 번역 결과를 제시하는 대신에 구문 트리 등의 내부 표현이나 번역 처리의 과정의 로그 등을 나타내는 방법으로는 사용자가 그 견해를 알아야 한다. 따라서, 사용자에 의한 선택·확인은 곤란하다.
상기 문제는, 기계 번역 처리뿐 아니라, 자연 언어에 의한 데이터 베이스 검색, 표현 지원 등 자연 언어 처리를 이용하는 장치 전반에서 말할 수 있는 것이다.
두번째는 사용자의 확인 작업의 문제이다. 사용자의 확인 작업이라는 점에서 상기 처리 순서를 보면, 사용자는 음성 인식의 결과, 기계 번역의 결과와 2번에 걸쳐 확인 작업을 행할 필요가 있어, 확인 횟수가 많아 번거롭다.
이것은, 자연 언어 처리를 이용한 복수의 모듈을 조합한 시스템 일반으로 말할 수 있는 것으로, 예를 들면 가나·한자 변환을 이용하여 일본어를 입력하고, 그것을 기계 번역을 이용하여 영어로 번역하는 경우를 생각해보자. 사용자는 가나로 일본어 문장을 입력하여, 변환된 한자를 확인하고, 우선 옳은 가나와 한자가 섞인 일본어 문장을 만든다. 그리고, 그것을 입력하여 일영 번역을 행하고, 그 결과를 다시 사용자가 확인하게 된다.
또한, 기계 번역의 경우, 사용자가 목적 언어에 익숙하지 않은 경우에는, 그 번역된 결과를 확인하는 것이 매우 곤란하다는 문제도 있다.
<발명의 개시>
본 발명은, 상술된 실정에 감안하여 이루어진 것으로써, 처리 정확도를 유지함과 함께 확인 작업을 제언하는 자연 언어 처리 장치 및 방법을 제공하는 것을 목적으로 한다.
본 발명에 따른 자연 언어 처리 장치는, 자연 언어를 입력하는 입력 수단과, 상기 입력 수단에서 입력한 자연 언어를 변환하는 변환 수단과, 상기 변환 수단으로 변환한 자연 언어를 확인하는 확인 수단과, 상기 확인 수단으로 확인한 자연 언어에 처리를 실시하는 처리 수단과, 상기 처리 수단으로 처리한 자연 언어를 출력하는 출력 수단을 갖는 것이다.
또한, 본 발명에 따른 자연 언어 처리 장치는, 자연 언어를 입력하는 입력 수단과, 자연 언어에 처리를 실시하는 1 또는 2 이상의 처리 수단과, 자연 언어에 대한 처리의 결과를 확인하는 1 또는 2 이상의 확인 수단과, 처리된 자연 언어를 출력하는 출력 수단을 지니고, 제1 처리 수단 및 그 결과를 확인하는 제1 확인 수단의 순서로 처리된 결과를 이용하는 것으로써, 상기 제1 처리 수단의 전단에, 상기 입력 수단에 입력된 자연 언어를 정확도 좋게 처리할 수 있는 형식으로 변환하는 제2 처리 수단과, 상기 제2 처리 수단의 결과를 확인하는 상기 제2 확인 수단을 설치함으로써, 제1 처리 수단의 결과의 확인을 생략하는 확인을 앞당겨 행하는 것이다.
또한, 본 발명에 따른 자연 언어 처리 장치는, 자연 언어를 입력하는 입력 수단과, 상기 입력 수단에 입력된 제1 언어를, 제2 언어에 따른 표현 및 제3 언어에 의한 표현으로 상기 제2 언어의 표현에 1 대 1로 대응하는 표현으로 변환하는 변환 수단과, 상기 변환 수단으로써 변환한 상기 제3 언어의 표현을 확인하는 확인 수단과, 상기 확인 수단에서의 확인의 결과에 따라, 상기 입력 수단에 입력된 자연 언어로 처리를 실시하는 처리 수단과, 상기 처리 수단으로써 처리를 실시된 자연 언어를 출력하는 출력 수단을 갖는 것이다.
본 발명에 따른 자연 언어 처리 방법은, 자연 언어를 입력하는 입력 공정과, 상기 입력 공정에서 입력한 자연 언어를 변환하는 변환 공정과, 상기 변환 공정에서 변환한 자연 언어를 확인하는 확인 공정과, 상기 확인 공정에서 확인한 자연 언어로 처리를 실시하는 처리 공정과, 상기 자연 언어 처리 공정에서 처리한 자연 언어를 출력하는 출력 공정을 갖는 것이다.
또한, 본 발명에 따른 자연 언어 처리 방법은, 자연 언어를 입력하는 입력 공정과, 자연 언어에 처리를 실시하는 1 또는 2 이상의 처리 공정과, 자연 언어에 대한 처리의 결과를 확인하는 1 또는 2 이상의 확인 공정과, 처리된 자연 언어를 출력하는 출력 공정을 지니고, 제1 처리 공정 및 그 결과를 확인하는 제1 확인 공정의 순서로 처리된 결과를 이용하는 것으로써, 제1 처리 공정의 전단에, 상기 입력 공정에 입력된 자연 언어를 정확도 좋게 처리할 수 있는 형식으로 변환하는 제2 처리 공정과, 제2 처리 공정의 결과를 확인하는 제2 확인 공정을 설치함으로써, 제1 처리 공정의 결과의 확인을 생략하는 확인을 앞당겨 행하는 것이다.
또한, 본 발명에 따른 자연 언어 처리 방법은, 자연 언어를 입력하는 입력 공정과, 기입력 공정에 입력된 제1 언어를, 제2 언어에 의한 표현 및 제3 언어에 의한 표현으로 상기 제2 언어에 의한 표현에 1 대 1로 대응하는 표현으로 변환하는 변환 공정과 상기 변환 공정에서 변환한 상기 제3 언어의 표현을 확인하는 확인 공정과, 상기 확인 공정에서의 확인의 결과에 따라, 상기 입력 수단에 입력된 자연 언어에 처리를 실시하는 처리 공정과, 상기 처리 수단으로써 처리를 실시된 자연 언어를 출력하는 출력 공정을 갖는 것이다.
이와 같이, 본 발명에서는, 사용자가 입력한 문장(문장 외에 구나 절도 포함함. 이하도 마찬가지임)을 자연 언어 처리에 직접 적용하는 것은 아니고, 사이에 「표현 변환 처리」와 「확인·선택 대기」를 추가한다. 또는, 상기된 자연 언어 처리를 표현 변환 처리를 동시에 행하고, 그렇게 함으로써 생성된 「자연 언어 처리 결과와 표현 변환 처리 결과의 쌍」에 대해 확인·선택을 행한다. 즉, 입력문을, 사용자의 의도에 가깝도록, 후속된 자연 언어 처리를 정확도 좋게 실행할 수 있는 문장으로 변환하는 표현 변환 처리를 행한다. 표현 변환 처리는, 기계 번역 처리 전에 행하는 것대신에, 기계 번역 처리를 동시에 행하는 것도 가능하다.
「확인·선택 대기」와「기계 번역」사이에, 「재변환 처리」를 추가하는 것도 가능하다. 이 처리는 「표현 변환」 중에서, 문장의 의미나 뉘앙스를 바꾸지 않는다고 하는, 일부의 어순을 교체하는 등의 변환만을 행한다. 이렇게 함으로써, 사용자에게 제시하는 것은 입력문에 비교적 가까운 문장, 번역 처리에 적합한 문장이라는 것이 가능해진다.
또한, 표현 번역 변환 처리는, 기계 번역 처리 전에 행하는 대신에 기계 번역 처리와 동시에 행하는 것도 가능하다. 이 경우, 번역 처리마다, 대응한 표현 변환 처리를 준비해 두고, 어느 한 문장에 어느 한 번역 처리가 적용되었을 때는 대응하는 표현 변환 처리도 적용하도록 한다. 이렇게 하면, 번역 결과와 표현 변환 처리는 쌍을 이루어 생성된다. 그리고 「확인·선택」은 그 쌍, 또는 표현 변환 결과만을 제시함으로써 행한다.
또한, 본 발명은, 정확도를 보증할 수 있는 처리와, 보증할 수 없는 처리로 분류하고, 복수의 기능 모듈에 걸치는 처리라도, 정확도를 보증할 수 없는 부분의 처리를 일괄해서 처리를 행하고, 그 후에 사용자의 확인 작업을 행함에 따라, 사용자의 확인 횟수를 경감시킨다. 즉, 상기된 처리 순서에서는, 음성 인식의 결과를 한번 확정하고나서 기계 번역을 행하는 것은 아니고, 음성 인식의 결과로서 복수의 가능성을 유지한 상태에서 기계 번역 처리를 행하여, 그 결과만을 사용자가 확인한다.
도 1은, 종래 기술에 의한 음성 번역 장치의 처리 순서의 개요의 플로우차트.
도 2는, 번역 장치의 개략적인 구성을 나타내는 블록도.
도 3은 템플릿의 예를 나타내는 도면.
도 4는 대역어 사서의 예를 나타내는 도면.
도 5는 표현 변환 규칙의 예를 나타내는 도면.
도 6은, 「가방을 사고 싶은데, 보여주실 수 없겠습니까?」에 대한 변환 결과를 설명하는 도면.
도 7은, 번역 장치의 처리 공정을 나타내는 플로우차트.
도 8은, 번역 장치의 처리 공정으로서, 재변환 처리를 하는 플로우차트.
도 9는, 음성 번역 장치의 개략적인 구성을 나타내는 블록도.
도 10은, 음성 음역 장치의 외관을 도시하는 사시도.
도 11은, 음성 번역 장치의 처리의 공정을 나타내는 플로우차트.
도 12는, 음성 번역 장치에서의 처리의 예를 설명하는 도면.
도 13은, 대역 템플릿의 예를 나타내는 도면.
도 14는, 입력과 출력의 예를 나타내는 도면.
도 15는, 입력과 출력의 예를 나타내는 도면.
도 16은, 주석을 추가한 템플릿의 예를 나타내는 도면.
도 17은, 입력 「죄송합니다」에 대한 출력의 예를 나타내는 도면.
도 18은, 입력 「∼가, ∼」에 대한 출력의 예를 나타내는 도면.
도 19a는, 확인을 앞당겨 적용 전을 나타낸 도면.
도 19b는, 확인을 앞당겨 적용 후를 나타낸 도면.
도 20a는, 확인의 연기의 적용 전을 나타낸 도면.
도 20b는, 확인의 연기의 적용 후를 나타낸 도면.
도 21a는, 앞당김과 연기의 적용 전을 나타낸 도면.
도 21b는, 앞당김의 적용 후를 나타낸 도면.
도 21c는, 앞당김과 연기의 적용 후를 나타낸 도면.
도 22a는, 음성 번역을 나타낸 도면.
도 22b는, 도 22a로 앞당김을 적용한 도면.
도 22c는, 도 22b로 연기를 적용한 도면.
도 22d는, 도 22c로 연기와 통합을 적용한 도면.
<발명을 실시하기 위한 최량의 형태>
이하, 본 발명의 바람직한 구성 예에 대해, 도면을 참조하면서 설명한다.
우선, 본 발명의 제1 실시의 형태로서, 자연 언어 처리를 이용하여 기계 번역을 행하는 번역 장치에 대해 설명한다.
번역 장치는, 도 2에 도시된 바와 같이, 표현 변환·기계 번역 등의 결과를 표시하는 표시부(1)와, 입력을 접수하는 입력부(2)와, 표현의 형식을 변환하는 표현 변환부(3)와, 타언어로의 변환을 행하는 기계 번역부(4)와, 이 번역 장치의 각 부를 제어하는 제어부(5)로 구성되어 있다.
표시부(1)는, 예를 들면 액정 디스플레이 등으로 구성되고, 제어부의 지령에 기초하여, 표현 변환·기계 번역 등을 표시한다.
입력부(2)는, 예를 들면 복수의 버튼이나 터치 패널 등으로 구성된다. 사용자는 이들을 이용함으로써, 표시부(1)에 표시되어 있는 정보로부터의 선택이나 시스템의 동작에 대한 메뉴 선택 등을 행한다. 또한, 입력부(2)는, 번역 대상문의 입력도 접수한다. 그리고, 입력부(2)는, 사용자에 의한 입력의 결과를 제어부(5)로 전한다.
표현 변환부(3)는, 예를 들면 CPU, ROM, RAM 등으로 구성된다. 표현 변환부(3)는, 사용자에 의한 입력부(2)에 이루어진 입력의 결과를 제어부(5)를 통해 수취한다. 그리고, 제어부(5)로부터 수취한 입력의 결과를 기계 번역부(4)에서 다룰 수 있는 형식으로 변환한다. 표현 변환부(3)는, 변환한 결과를 제어부(5)로 전한다.
기계 번역부(4)도 표현 변환부(3)와 마찬가지로, 예를 들면 CPU, ROM, RAM 등으로 구성된다. 기계 번역부(4)는, 표현 변환부(3)에 의한 변환의 결과를 제어부(5)를 통해 수취한다. 기계 번역부(4)는, 제어부(5)로부터 수취한 변환 결과를 타언어로 번역한다. 그리고, 기계 번역부(4)는, 타언어로 번역한 결과를 제어부(5)로 전한다.
제어부(5)도, 표현 변환부(3) 및 기계 번역부(4)와 마찬가지로, 예를 들면 CPU, ROM, RAM 등으로 구성된다. 제어부(5)는, 예를 들면 입력부(2)에 입력된 데이터를 표현 변환부(3)로 이송하고, 표현 변환부(3)로부터의 변환 결과를 기계 번역부(4)로 이송하는 데이터를 이송하는 제어를 행한다. 또한, 제어부(5)는, 이 번 역 장치의 각 부에 대해 제어 신호에 의해 제어를 행한다.
또, 표현 변환부(3), 기계 번역부(4) 및 제어부(5)는, 상술된 바와 같이 독립하여 구성하는 것 외에, 동일한 CPU, ROM, RAM에 의해 구성된 제어 블록 내의 기능 블록으로서 구성할 수도 있다.
계속해서, 이 번역 장치에서의, 자연 언어를 이용한 기계 번역에 대해 설명한다.
이 번역 장치에서는, 번역 방법이나 번역 전의 언어인 원어나 번역 후의 언어인 목적 언어에 대한 제약은 특별히 가하지는 않는다. 그러나, 이하의 설명에서는, 번역 방식으로는, 대역 템플릿을 이용하는 것으로서, 템플릿 상의 어구를 교체함으로써 번역 결과를 생성하는 방식을 채용한다. 또한, 원어에는 일본어를, 목적 언어에는 영어를 채용하는 것으로 한다.
대역 템플릿은, 일본어 부분과 그것을 영역한 부분으로 이루어진다. 도 3에 도시된 대역 템플릿의 예에서는, 「X [물건]를 주십시오.」에는 「X please.」가, 「나는 X [장소]에 가고 싶다.」에는「I want to go to X.」가, 「X[물건]을 Y[사람]에게 보여주세요.」에는 「Would you show Y X?」가, 「S1 [문장] 그러나 S2[문장]」에는 「S1, but S2.」가, 「S1[문장] 그리고 S2[문장]」에는「S1, and S2.」가, 「S1 [문장] 그래서 S2[문장]」에는 「S1. So S2.」가, 「죄송합니다(=감사하다)」에는「Thank you.」가, 「죄송합니다(=사과하다)」에는 「I'm sorry.」가, 「죄송합니다(=말 걸때)」에는 「Excuse me.」가, 「X[사람]이 Y[탈것을] 사용한다(=X가 Y를 탄다)」에는「X go by Y.」가, 「X[사람]이 Y를 사용한다(=X가 Y를 소비한다)」에는「X consume Y.」가, 각각 대응하고 있다.
대역 템플릿에서, 일본어 부분은 일본어의 문·구·절·단어 등이다. 또, 이하에서는, 간단하게 하기 위해 문·구·절·단어를 합하여 문장이라고 한다. 일본어 부분의 일부를 변수로 나타낼 수도 있고, 더욱 그 변수가 만족되어지는 속성을 지정할 수도 있다. 예를 들면, 도 3의 1의「X[물건]를 주십시오」에서는, 「X[물건]」의 X가 변수이고, 여기에는 [물건]이라는 속성을 갖는 어구가 대입 가능하다. 각 어구의 속성은, 후술된 대역어 사전으로 기술해 둔다.
대역 템플릿의 영역 부분은, 일본어 부분의 대역으로 되어 있다. 일본어 부분에 변수가 포함되는 경우, 영어 부분도 대응하는 부분에 변수를 포함한다. 예를 들면, 도 3의 1의 일본어 부분의「X[물건]를 주십시오」는 변수를 포함하고 있으므로, 그 영어 부분“X please."도 대응하는 부분에 변수를 포함한다.
대역 사전은, 일본어의 어구와, 그것에 대응하는 영어의 어구와, 만족해야 하는 속성을 기술한 것이다. 대역 사전의 예로는, 도 4에 도시된 바와 같이, 일본어「나」에 영어 「I」 및 속성 「사람」이, 일본어 「사과」에 영어 「apple」및 속성「물건」이, 일본어 「런던」에 영어 「London」및 속성 「장소」가, 일본어 「가방」에 영어「bag」및 속성「물건」과 같이 대응하는 것을 들 수 있다.
이어서, 표현 변환부(3)에서의 표현 변환의 처리에 대해 설명한다.
표현 변환부(3)는, 입력부(2)에 사용자가 입력한 문장을 제어부(5)를 통해 수취한다. 그리고, 이 문장의 표현을 정확도 있게 번역할 수 있도록 변환한다. 본 실시의 형태에서는, 표현 변환부(3)는, 일본어를 대역 템플릿의 일본어 부분에 매치하도록, 사용자가 일본어로 입력한 문장을 일본어 내에서의 변환을 행한다.
표현 변환부(3)에서의 변환으로는, 1:1 변환 외에, m:1 변환이나 1:n 변환, 흔히 이들의 조합인 n:m 변환 등도 생각할 수 있다.
여기서, 1:1 변환이란 입력문 1개에 대해 변환 결과가 1개의 변환이다. m:1 변환이란 m 개의 입력문에 대해 변환 결과가 1개의 변환이다. 1:n 변환이란 입력문 1개에 대해 변환 결과가 n 개의 변환이다.
또한 표현의 변환은 일반적으로, 융합, 분할, 삽입, 삭제, 치환, 순서 교체를 생각할 수 있다.
이와 같이, 표현 변환 규칙은, 변환 후에 사용자가 선택·확인해 주는 것을 전제로 하고 있으므로, 변환 후의 후보가 복수 개 있어도 되고, 또한 다소 뉘앙스가 변하는 변환도 가능하다.
이어서, 주된 변환 규칙으로서, 문말용 변환 규칙, 중문 분해용 규칙, 다의적 말표현용 규칙, 부족 요소 보충 규칙, 및 순서 교환 규칙에 대해 설명한다.
문말용 변환 규칙은, 1개의 의도에 대해 복수의 표현이 존재하는, 주로 문말 표현이 다른 경우에, 이들 복수의 표현을 단일 표현으로 대응시키는 규칙이다.
문말용 변환 규칙으로는, 예를 들면 일본어로 의뢰를 나타내는 경우, 「해 주세요」 「해 주실 수 없겠습니까」 「해 주실 수 없겠습니까」「해 주셨으면 좋겠습니다만」이라는 복수의 표현을 「해 주세요」라는 단일의 표현으로 치환한다. 이것은, 상술된 m:1의 변환으로, 치환을 행하고 있는 예이다.
도 5의 변환 규칙에 따르면, 문말용 변환 규칙으로는, 「∼해 주실 수 없겠 습니까」에는 「∼해 주십시오」가, 「∼해 주실 수 있겠습니까」에는 「∼해 주십시오」가, 「∼싶습니다」에는 「∼싶다」가, 「∼싶습니다만」에는 「∼싶다」가, 각각 대응하고 있다.
중문 분해용 규칙은, 접속 조사나 접속사에 의해서는 다의적인 것도 있는 것이므로, 그러한 경우에는 일의적인 접속사로 치환한 것을 복수 개 생성한다. 중문 분해 규칙은, 상술한 1:n의 변환으로, 분할을 행하는 예이다. 다의적인 중문으로서는, 예를 들면 「∼이지만, ∼」은 순접, 역접, 모두 된다.
도 5의 변환 규칙에 따르면, 중문용 변환 규칙으로서, 「∼이지만[접속 조사]∼」에는 「∼. 그러나, ∼」가, 「∼이지만[접속 조사]∼」에는 「∼. 그리고, ∼」가, 「∼이지만[접속 조사]∼」에는 「∼. 그러므로, ∼」가, 「∼해서∼」에는 「∼. 그러므로∼」가, 「∼해서∼」에는 「∼. 그리고∼」가, 「∼해서∼」에는 「∼. 그러나∼」가, 각각 대응하고 있다.
다의적인 말의 표현용 규칙은, 다의적 말의 표현은, 일의적인 말의 표현으로 치환한 후보를 복수 개 생성한다. 이것은 1:n의 변환으로 치환을 행하는 예이다. 다의적 말의 표현으로는, 예를 들면「죄송합니다」는, 감사를 표시할 때에도, 타인을 불러 세울 때에도, 사과할 때에도 이용한다.
도 5의 변환 규칙에 따르면, 다의적 말표현용 규칙으로서, 「죄송합니다」에는 「죄송합니다(=감사하다)」가, 「죄송합니다」에는 「죄송합니다(=사과하다)」가, 「죄송합니다」에는 「죄송합니다(=말을 걸때)」가, 「X를 사용한다」에는「X를 사용한다(=X를 타다)」가, 「X를 사용한다」에는「X를 사용한다(=X를 소비한다) 」가, 각각 대응하고 있다.
부족 요소 보충 규칙은, 영역할 때에 부족한 요소가 입력문에는 적용되는 경우에, 그 요소를 보충하기 위한 규칙이다. 예를 들면, 「이것을 보여 주십시오」를 번역할 때에 「나에게」를 보충한다는 규칙. 보충하는 어구의 디폴트는, 예를 들면 대역 템플릿에 기술해 둔다. 이것은 삽입을 행하는 예이다.
도 5의 변환 규칙에 따르면, 부족 요소 보충 규칙으로서, 「보여주세요」에는「(이것을) 보여주세요」가, 「보여주세요」에는「(저것을) 보여주세요」가, 「보여 주세요」에는「(그것을) 보여주세요」가, 각각 대응하고 있다.
순서 교환 규칙은, 의미를 바꾸지 않은 범위에서 어순을 교체하기 위한 규칙이다. 예를 들면 입력문이 「그것을 나에게 주십시오」로 템플릿에「X를 Y에 주십시오」라는 경우, 입력문의「그것을」과 「나에게」를 교체하여 「나에게 그것을 주세요」로 변환하고, 템플릿과 매치할 수 있도록 한다. 이것은 순서 교체를 행하는 예이다.
도 5의 변환 규칙에 따르면, 순서 교환 규칙으로서, 「Y를 X가」에는 「X가 Y를」이, 「Y에게 X가」에는 「X가 Y에게」가, 「X가 Z를 Y에게」에는 「X가 Y에게 Z를」이, 「Y에게 X가 Z를」에는 「X가 Y에게 Z를」이, 「Y에게 Z를 X가」에는 「X가 Y에게 Z를」이, 「Z를 X가 Y에게」에는 「X가 Y에게 Z를」이, 「Z를 Y에게 X가」에는 「X가 Y에게 Z를」이, 각각 대응하고 있다.
입력된 문장이나 어구에 이들 변환을 실시해도 대역 템플릿의 일본어 부분에 매치하지 않은 어구는, 어떤 적절한 척도를 이용하여 베스트 매치를 행하고, 그 결과 얻어진 N위까지의 후보에 대해 사용자가 선택해 주든지, 또는 「이 입력은 취급할 수 없습니다」의 메시지를 표시한다.
표현 변환부(3)에서 입력된 문장의 표현이 변환되면, 그 결과가 사용자에게 제시되어 확인·선택을 행한다.
즉, 표현 변환부(3)의 변환 결과가, 그것이 사용자의 의도와 맞는지의 여부를 확인해 준다. 변환 결과가 복수 생성되는 경우에는, 이들을 제시하고, 사용자의 의도와 맞는 것을 선택한다.
확인·선택은, 상기된 변환 규칙을 적용할 때마다 행하는 방법과, 전부 적용한 후에 1회만 행하는 방법, 몇번이고 적용할 때마다 행하는 방법 등이 있다.
표현 변환 규칙 중에는, 예를 들면 순서 교환 규칙과 같이, 문장의 의미를 거의 바꾸지 않고 행할 수 있는 것이 있다. 이러한 규칙은, 사용자에 의한 확인·선택을 행한 후에 적용하여, 재변환을 행하는 것도 가능하다. 즉, 문장의 의미가 거의 변하지 않은 경우에는, 확인·선택 후의 변환 후보에 대해 다시 변환을 행하는 재변환이 가능하다.
이러한 재변환의 처리를 추가함으로써, 확인·선택 시에는 입력문과 동일 어순의 문장으로 행할 수 있고, 번역 처리에는 처리에 적합한 문장을 건네는 것이 가능하다.
계속해서, 표현 변환부(3)에서 행하는 표현 변환의 처리에 대해 예를 들어 설명한다.
여기서의 처리의 예로서는, 「가방을 사고 싶은데, 보여 주실 수 없겠습니 까?」를 입력했을 때의 변환 과정을, 도 6을 참조하여 나타내는 것으로 한다. 또, 이 예에서는, 변환 규칙을 1개 적용할 때마다 확인·선택하는 것을 상정하는 것이지만, 그 밖의 타이밍으로 확인·선택하는 것도 가능하다.
우선, 스텝 S1에서, 표현 변환부(3)에는, 제어부(5)로부터 「가방을 사고싶은데, 보여 주실 수 없겠습니까?」라는 입력문이, 이송된다.
스텝 S2에서, 표현 변환부(3)는, 중문 분해용의 「∼이지만∼」의 항목을 이용하여, 입력문을 2개의 문장으로 분해하고, 또한 일의적인 접속사를 보충한다. 접속 조사 「이지만」은, 순접도 역접도 이유도 될 수 있으므로, 접속사는 「그러나」, 「그리고」 및 「그러므로」의 3가지를 보충할 수 있다.
이에 따라, 상기 입력문은, 「가방을 사고 싶습니다. 그러나, 보여 주실 수 없겠습니까?」, 「가방을 사고 싶습니다. 그리고, 보여 주실 수 없겠습니까?」 및 「가방을 사고 싶습니다. 그러므로, 보여 주실 수 없겠습니까?」의 3가지로 변환된다. 그리고, 이들 3가지의 문장은, 표시부(1)에 제시된다.
표시부(1)에 제시된 이들 3가지의 문장으로부터, 사용자에 의해 3번째의 문장 「가방을 사고 싶은 것입니다. 그러므로, 보여 주실 수 없겠습니까?」가 선택되었다.
스텝 S3에서는, 표현 변환부(3)는, 선택된 3번째의 문장에 대해 문말 변환용 규칙을 적용하여, 간단하게 그것도 사용자의 의도에 맞는 표현으로 변환한다. 문말 변환용 규칙의 적용에 의해, 「∼싶습니다」는 「∼싶다」가 되고, 「∼해 주실 수 없겠습니까?」는 「∼해 주세요」가 된다. 즉, 상기 3번째의 문장은, 「가방을 사고 싶다. 그러므로, 보여주세요.」로 변환된다.
스텝 S4에서는, 표현 변환부(3)는, 이 문장에 대해, 부족 요소 보충 규칙을 이용하여, 영역시에 부족한 요소를 보충한다. 도 5에 도시된 변환 규칙을 이용하여, 「가방을 사고 싶다」에 대해서는「나는」을 보충하고, 「보여 주세요」에 대해서는 「그것을」과 「나에게」를 보충한다.
스텝 S5에서, 표현 변환부(3)는, 입력문은 최종적으로 「(나는) 가방을 사고 싶다. 그러므로, (그것을) (나에게) 보여주세요.」로 변환한다. 이 문장은 대역 템플릿의 일본어 부분으로 매치하기 때문에, 처음의 입력문에 비해 높은 정확도로 번역할 수 있다.
또, 상기된 예에서는, 표현 변환을 번역에서의 원어 내에서 행하고 있으므로, 사용자는 용이하게 확인·선택을 행할 수 있다.
한편, 일본어로부터 독일어의 번역을 생각한 경우, 일반적으로 기계에 의한 자동 번역으로는 일독 번역보다도 영독 번역이 정확도가 높다. 따라서, 사용자가 일본어 외에 영어도 숙지하는 경우에는, 우선 처음에 일본어로부터 영어로 번역함으로써 표현의 변환을 행하고, 그 결과를 사용자가 확인한 후에 독일어로 번역한다는 시스템 구성도 실현하는 것이 가능하다.
이어서, 번역 장치에서의 기계 번역의 처리 공정을, 도 7에 도시된 플로우차트를 참조하여 설명한다.
최초의 스텝 S11에서는, 입력부(2)에의 사용자에 의한 문장의 입력을 대기하는 입력 대기를 행한다. 입력부(2)에 문장이 입력되면, 입력된 문장은 제어부(5) 에 의해 표현 변환부(3)로 이송된다.
스텝 S12에서는, 표현 변환부(3)는, 입력된 문장을 원어 내에서 변환한다. 다음 스텝 S13에서는, 스텝 S12에서 변환된 문장을 표시부(1)에 표시하고, 사용자에 의한 확인·선택의 입력을 대기한다.
스텝 S14에서는, 스텝 S13에서 확인·선택된 문장에 대해, 기계 번역부(4)로 번역 처리를 행한다. 스텝 S14에서는, 번역 결과를 표시부(1)에 표시하고, 이 처리 순서를 종료한다.
이와 같이, 사용자가 입력한 문장을 자연 언어 처리, 상기된 어떤 경우에는 기계 번역 처리에 직접 거는 것이 아니고, 사이에 「표현 변환 처리」와 「확인·선택 대기」를 더한다.
표현 변환 처리는, 입력문을, 사용자의 의도와 가까운 문장으로 변환함과 함께, 후속하는 자연 언어 처리를 정확도 좋게 실행할 수 있는 문장으로 변환하는 것이다. 표현 변환후에 사용자가 확인·선택하는 것을 전제로 하고 있으므로, 변환의 정확도는 반드시 높지 않아도 되고, 또한 변환 결과가 복수 개 생성되어도 상관없다.
또, 상술된 처리 공정에서는, 도 8에 도시된 바와 같이, 스텝 S12의 원어 내 변환 처리로 계속되는 스텝 S13의 확인·선택 대기 다음에, 스텝 S21의 재변환 처리를 행할 수도 있다. 또, 다른 공정에 대해서는, 도 7에 도시된 처리 순서와 동일하므로 동일한 부호를 부여하기로 한다.
이와 같이, 「확인·선택 대기」와 「기계 번역」 사이에, 「재변환 처리」를 추가하는 것도 가능하다. 이 처리는 「표현 변환」 내에서, 문장의 의미나 뉘앙스를 바꾸지 않는, 예를 들면 일부의 어순을 교체하는 등의 변환만을 행한다. 이렇게 함으로써, 사용자에게 제시하는 것은 입력문에 비교적 가까운 문장, 번역 처리에 건네는 것은 처리에 적합한 문장이 가능해진다.
계속해서, 본 발명의 제2 실시의 형태로서, 자연 언어 처리를 이용하여 음성을 번역하는 음성 번역 장치에 대해 설명한다.
우선, 음성 번역 장치의 구성에 대해 설명한다. 또, 간단하게 하기 위해, 음성 번역 장치에서 상술된 번역 장치와 공통되는 부분에 대해서는, 동일한 부호를 부여하기로 한다.
음성 번역 장치는, 도 9에 도시된 바와 같이, 각종 정보를 표시하는 표시부(1)와, 입력을 접수하는 입력부(2)와, 문장의 표현을 변환하는 표현 변환부(3)와, 문장을 번역하는 기계 번역부(4)와, 음성의 인식 처리를 행하는 음성 인식부(7)와, 합성 음성을 생성하는 음성 합성부(8)와, 이 음성 번역 장치의 각 부를 제어하는 제어부(5)로 구성된다.
표시부(1)는, 예를 들면 액정 디스플레이 등으로 구성된다. 표시부(1)는, 제어부(5)의 지령에 기초하여, 각종 정보의 표시를 행한다.
입력부(2)는, 예를 들면 복수의 버튼이나, 터치 패널 등으로 구성된다. 사용자는 이것을 이용함으로써, 표시부(1)에 표시되어 있는 정보로부터의 선택이나 시스템의 동작에 관한 메뉴의 선택 등을 행한다. 입력부(2)는, 사용자에 의한 입력의 결과를 제어부(5)로 전한다.
음성 인식부(7)는, 예를 들면 마이크로폰, AD 변환기, 연산부, 기억부 등으로 구성되고, 사용자가 발성한 음성을 마이크로폰으로 입력하고, 입력된 음성을 AD 변환하여 디지탈화하고, 인식 처리를 행한다. 즉, 음성 인식부(7)는, 사용자가 발성 내용을 인식하여, 발성 내용에 따른 인식 결과를 제어부에 대해 출력한다.
음성 합성부(8)는, 예를 들면 연산부, 기억부, DA 변환기, 스피커 등으로 구성된다. 음성 합성부(8)는, 기계 번역부(3)에서 번역된 문장을 제어부(5)로부터 수취하고, 합성 음성을 생성하여, 스피커로부터 출력한다.
음성 합성 장치의 외관의 일례는, 도 10에 도시된 바와 같이, 약간 평탄한 직방체형의 하우징(20)의 주요면의 1개에, 표시부(1)가 되는 대개 구형의 액정 디스플레이(21)와, 입력부(2)가 되는 각종 버튼(22)과, 음성 인식부(7)에 음성을 입력하는 마이크로폰(24)과, 음성 합성부(8)로부터의 합성 음성을 출력하는 스피커(25)를 구비하고 있다.
이어서, 음성 합성 장치에서의 처리 공정을, 도 11에 도시된 플로우차트를 참조하여 설명한다.
음성 번역 장치에서의 처리 순서는, 원어로서 일본어를 음성으로 입력하고, 목적 언어로서 영어로 번역하여, 영어의 합성 음성으로 출력하는 것으로 한다.
최초의 스텝 S31에서는 사용자는 일본어의 문장을 음성으로 입력하고, 다음의 스텝 S32에서는 음성 인식부(7)에서 인식 처리가 행해진다.
스텝 S33에서는 음성 인식부(7)로부터의 음성 인식 결과에 대해, 표현 변환부(3)에서 일본어의 다른 표현으로 변환한다. 그리고, 스텝 S34에서 변환한 결과 를 표시부(1)에 표시하고, 사용자에 의한 확인·선택이 행해진다. 이 때, 표시부(1)에는 음성 인식 결과 그 자체가 표시되는 것은 아니고, 동일 의미 내용, 의도를 나타내는 다른 문장이 표시된다.
이 처리는, 상술된 번역 장치에서의 원어 내 변환에 해당하는 처리이다. 차이로서는, 번역 장치에서는 1개의 입력문에 대해 처리를 실시하는데 비해, 이 음성 번역 장치에서는, 음성 인식 결과로서 얻어지는 복수의 후보에 대해 변환 처리를 실시한다는 점이다.
스텝 S35에서는, 스텝 S34에서의 사용자에 의한 확인·선택의 결과, 재입력을 선택한 경우에는 "YES"로 하여 스텝 S31로 복귀한다. 재입력을 선택하지 않은 경우에는 “NO"로 하여 스텝 S36으로 진행한다.
스텝 S36에서는, 사용자가 확인한 문장을 대상으로 하여, 기계 번역부(4)에 있어서 기계 번역 변환이 행해져, 영어의 문장이 출력된다. 또, 이 때 사용자가 재입력을 선택한 경우에는, 다시 음성 입력을 행한다. 그리고, 마지막으로, 스텝 S37에서, 기계 번역부(4)로부터 출력된 영어의 번역 결과를 바탕으로, 음성 구성부(8)에 있어서 음성 합성이 행해져, 영어의 합성 음성이 출력된다. 그리고, 이 처리 순서를 종료한다.
본 실시의 형태에서는, 기계 번역이 취급하는 문체의 번역 정확도를 확보할 수 있는 범위로 한정한다. 그리고, 음성 인식 결과로부터 얻어지는 다양한 문체의 입력을, 상기 범위 내의 문체에 의한 표현으로 변환한다. 그리고, 그 내용을 사용자가 확인하고, 사용자가 입력한 문장과 표현은 다르지만, 의미 내용, 의도가 동일하다는 것을 확인해 준다. 그리고 그것을 입력으로 하여 확보할 수 있다.
또한, 본 실시의 형태에 따라, 정확도가 좋은 음성 번역 결과를 유지하면서, 사용자의 확인 작업을 1회로 할 수 있다.
계속해서, 음성 번역 장치에서의 처리의 구체예에 대해, 도 12를 참조하여 설명한다.
우선, 음성 번역 장치에 사용자로부터 「대영 박물관에 가고 싶은데.」라는 발화가 입력된다. 그 입력은 음성 인식부(7)에서 음성 인식 처리되어, 인식 결과로서, 예를 들면 인식 스코어가 좋은 여러개의 문장 후보라고 하는 형태로 출력된다. 구체적으로는, 가나정도의 입력에 대해, 「대영 박물관에 가고 싶은데.」 「대영 박물관에 가보고 싶다.」 「대영 박물관에 간 것이지만.」이라는 3개의 문장 후보를 출력한다.
이어서, 얻어진 음성 인식 결과에 대해, 표현 변환부(3)에서 표현 변환 처리를 행한다. 이 예의 경우에는, 「대영 박물관에 가고 싶지만.」과 「대영 박물관에 가보고 싶다.」는 의미적으로 매우 가까우므로, 「대영 박물관에 가고 싶다.」의 1개의 표현으로 변환된다. 그리고「대영 박물관에 간 것이지만.」은 「대영 박물관에 갔다.」로 변환되고, 이 2개의 문장이 표시부(1)의 액정 디스플레이 상에 표시된다.
사용자는, 표시된 문장 중에서, 자신이 발성한 의미 내용, 의도에 가까운 것으로서「대영 박물관에 가고 싶다.」라는 문장을 입력부(2)에서 선택한다. 그리고, 선택된 문장을 기계 번역부(4)로 기계 번역함으로써, "I want to go to the British museum."이라는 영문을 생성하여, 이것을 음성 합성부(8)로 음성 합성하여 영어의 음성을 출력한다.
또, 이 실시의 형태에서, 스코어를 이용한 처리를 더 추가하는 것도 가능하다.
즉, 음성 인식 처리에서는, 일반적으로 히든 마르코브 모델(hidden markov model) 등을 이용하여 인식 처리를 행하는 과정에서, 인식 결과의 후보에게 스코어를 부여하고, 그 값을 비교함으로써, 가장 확실할 것 같은 후보를 1개 또는 여러개의 인식 결과로서 출력한다. 또한, 도 5에서 도시된 표현 변환 규칙은, 코퍼스 데이터를 바탕으로 하여, 규칙의 적용 횟수의 통계를 취하는 등의 수법에 따라, 규칙마다의 적용 빈도의 스코어를 부여하는 것이 가능하다.
따라서, 표현 변환 결과를 생성하는데 있어서, 이들 2개의 스코어를 각각 적절한 가중치를 행하여 적산함으로써, 이들을 이용하는 것이 가능하다.
이 실시의 형태에서는, 음성 인식과 기계 번역을 조합한 음성 번역 장치에서, 음성 인식에서의 확인을 뒤로 미루고, 표현 변환 처리의 변환 결과의 확인과 통합하여, 확인 횟수를 줄이고 있다. 그러나 본 발명은 이 조합에 한한 것이 아니다.
예를 들면, 가나·한자 변환과 자연 언어에 의한 정보 검색을 조합한 경우, 가나 입력에 대한 한자 변환의 결과를 확인하지 않고 뒤로 미루고, 몇 개의 한자 변환 후보로부터 직접 키워드를 추출하여 행한 표현 변환을 행하고, 그 결과를 사용자에게 제시하여, 확인, 선택한다는 구성도 가능하다. 또한, 후단의 처리로서는, 표현 지원 등에 적용하는 것도 가능하다.
계속해서, 본 발명의 제3 실시의 형태에 대해 설명한다.
이 실시의 형태는, 상술된 번역 장치를 이용하지만, 표현 변환부(3)는 문말 표현의 치환·단순화 등의 간단한 처리만을 행하고, 기계 번역부(4)에서는 원어로부터 목적 언어로의 변환 외에, 원어 내에서의 다른 표현으로의 변환도 행하는 것이다.
본 실시의 형태는, 번역 방법에는 상관없지만, 이하의 설명에서는 대역 템플릿 레이트로 이용한 방식으로 설명한다. 또한, 원어는 일본어로 하고, 목적 언어는 영어로 한다.
대역 템플릿의 예를 도 13에 도시한다. 대역 템플릿은, 원어인 일본어의 부분과 그것을 목적 언어인 영어로 번역한 목적 언어의 부분에 더해 「원어 내에서의 환언」이라는, 원어의 다른 표현으로 바꿔 말하는 것을 기술하는 부분도 갖는다.
도 13의 대역 템플릿에서는, 다의적 환언으로서, 「죄송합니다」에는 「Thank you.」 및 「죄송합니다 (=감사하다)」가, 「죄송합니다」에는「I'm sorry.」 및 「죄송합니다(=사과하다)」가, 「죄송합니다」에는 「Excuse me.」 및 「죄송합니다(=말 걸때)」이, 「X가 Y를 사용한다」에는「X use Y.」 및 (환언 없음)이, 「X가 Y를 사용한다」에는 「X go by Y.」 및 「X가 Y로 간다」가, 「X가 Y를 사용한다」에는 「X consume Y.」 및 「X가 Y를 소비한다」가, 각각 대응하고 있다.
또한, 도 13의 대역 템플릿에서는, 부족 요소 보충으로서, 「X를 사용한다」 에는 「X use Y.」 및 「나는 X를 사용한다.」가, 「X를 사용한다」에는「X go by Y.」 및 「나는 X로 간다.」가, 「X를 사용한다」에는 「X consume Y.」 및 「나는 X를 소비한다.」가, 각각 대응하고 있다.
그리고, 도 13에 도시된 대역 템플릿에서는, 전문 전개로서, 「S1이, S2」에는 「S1, but S2.」 및 「S1, 그러나 S2」가, 「S1이, S2」에는 「S1, but S2.」 및 「S1, 그리고 S2」가, 「S1이, S2」에는 「S1, but S2.」 및 「S1. S2」가, 각각 대응하고 있다.
도 13의 대역 템플릿 중에서, 일본어 부분과 영어 부분은, 상술된 대역 템플릿의 예와 동일하다.
이 대역 템플릿에서, 「원어 내에서의 환언」부분은, 영어 부분과 1 대 1로 대응하는 표현을 일본어로 쓴 것이다. 「1 대 1로 대응하는 표현」이라는 것은, 일본어 부분이 다의적인 경우에는 환언이나 주석 등에 따라 다의성을 없앤 표현이나, 일본어 부분에 부족한 요소가 있는 경우에는 그것을 보충한 표현 등이다.
예를 들면, 도 13에서는, 일본어 부분의 「죄송합니다」는 3가지로 다의적이기 때문에, 그 영역은 3가지지만, 「원어 내에서의 환언」부분에는 각각에 대응한, 다의성이 없는 표현을 일본어로 써 둔다. 예를 들면, “I'm sorry"에는 「죄송합니다(=사과하다)」를, "Thank you"에는 「죄송합니다(=감사하다)」를, "Excuse me."에는 「죄송합니다(=말 걸때)」를 써 둔다.
또한, 예를 들면 일본어 부분의 「X를 보여주세요」를 영역하기 위해서는, 「누구에게」에 해당하는 어구, 즉 부족 요소를 보충해야 한다. 만약 「나에게」를 보충하여 영어 부분을 "Please show me X."로 하면, 「원어 내에서의 환언」부분에는 「X를 나에게 보여주세요」라고 쓰고, 「나를」을 보충하도록 해둔다.
계속해서, 기계 번역·환언 처리에 대해서는, 사용자로부터의 입력이 있으면, 입력과 대역 템플릿의 일본어 부분 사이에서 매칭을 취한다. 또한, 매칭 전에 입력에 대해 문말 표현 등의 환언을 하는 것이 가능하고, 이렇게 함으로써 템플릿의 수를 줄일 수 있다. 문말 표현의 변환으로는, 예를 들면 「∼합니다」라는 입력을 「∼한다」로 변환하는 것을 들 수 있다.
템플릿의 매칭이 떨어지면, 그에 따라 영역을 작성하고, 또한 그와 함께 일본어로의 환언도 작성한다. 예를 들면 도 14에 도시된 바와 같이, 입력이 「이것을 보여 주세요」인 경우, 도 13의 템플릿의 참조 번호(10)에 매치하고, 그에 따라 영역과 환언을 작성한다. 단, 여기서는 「이것을 그에게 보여주세요」라는 의도로 행한 것으로 한다.
그리고, 입력의 환언 결과 「이것을 나에게 보여주세요」 및 영역 결과「Please show me this.」다음에 영역과 환언과의 쌍을 제시하고, 사용자에게 확인을 받는다. 또, 환언의 결과만을 제시할 수도 있다. 사용자는 환언 부분을 보고, 영역이 정확하게 행해졌는지의 여부를 확인한다.
이 환언 결과를 보는 것에 의해, 사용자는 자신의 의도와 다른 번역이 행해진 것을 알 수 있어, 이 변환 결과를 기각한다.
또한, 도 15에 도시된 바와 같이 입력이 「철도를 사용한다」인 경우, 도 13의 대역 템플릿에서, 입력에 매치하는 템플릿은 3종류 있다. 이들 각각에 대해 영역과 환언이 생성된다. 이들을 제시함으로써, 최적의 환언·영역을 사용자가 선택한다.
구체적으로는, 환언 결과 「나는 철도를 사용한다」 및 영역 결과「I use the train.」, 환언 결과 「나는 철도로 간다」 및 영역 결과 「I go by train.」, 환언 결과 「나는 전차를 소비한다」 및 「I consume the train.」이 생성된다.
사용자는, 환언 결과를 단서로, 2번째의 환언 결과 「나는 철도로 간다」 및 영역 결과 「I go by train.」을 선택할 수 있다.
또, 템플릿 방식으로는, 의미 속성에 따른 제약 등을 설치함으로써, 매치하는 템플릿의 수를 줄이는 것이 가능하지만, 제약이 불충분했기 때문에 템플릿이 복수 개 매치하는 경우가 있다. 본 실시의 형태에서는, 그와 같은 경우라도 적절한 번역 결과를 사용자가 선택 확인할 수 있다.
흔히, 이 「표현 변환과 기계 번역을 동시에 행한다」라는 방법은, 표현 변환을 위한 데이터와 기계 번역을 위한 데이터가 동일한 곳에 있기 때문에, 데이터의 량이 증가한 경우라도 매치를 찾기 쉽다는 이점을 가지고 있다.
또, 이 제3 실시의 형태는, 제1 실시의 형태에 이하의 변형을 실시하는 것으로도 실현할 수 있다.
제1 실시의 형태의 번역 장치의 표현 변환부(3)에서는 N 베스트 후보가 생성되지만, 이 단계에서는 선택·확인을 행하지 않고 이들을 번역부(4)로 건네짐으로써, 확인을 뒤로 미룬다. 그렇게 함으로써, 번역 결과와 표현 변환 결과의 쌍으로 이루어지는 후보를 N개 생성한다. 이들 후보에 대해, 사용자는 선택·확인을 행한다.
「표현 변환과 동시에 행하는 기계 번역」에 대해, 흔히 이하와 같은 변형예를 나타내면서 설명한다.
도 13의 변환·번역용 템플릿의 「원어 내에서의 환언」의 부분을 보면, 환언을 하는 것과, 단순히 주석을 추가하는 것이 있다.
도 16에 도시된 바와 같이, 이들을 분리하고, 「원어 내에서의 환언」과 「주석」을 각각 다른 란에 기술하도록 하면, 처리 상에서도 템플릿 작성 상에서도 이점이 있다.
즉, 처리 상의 이점으로는, 「환언」과 주석을 분리할 수 있으면, 환언은 행하지 않고 주석을 추가만 하는 경우에는 용이하게 판별할 수 있는 경우가 있다. 주석을 추가만 하는 경우에는 환언을 필요로 하는 경우보다도 간단한 처리로 끝난다.
템플릿 작성 상의 이점으로는, 주석을 추가만 하는 경우에는, 기술에 필요한 수고가 감소하는 경우가 있다.
또한, 작업중에, 적절한 환언은 생각나지 않지만 주석은 붙일 수 없는 상황이 발생하는 경우가 있다. 환언과 주석을 분리해두면, 이러한 경우에, 우선 주석만은 기술해 두고, 환언은 나중에 생각난 시점에서 기술하는 것이 용이해진다.
표현 상의 이점으로는, 주석과 환언 결과가 분리되어 있기 때문에, 원어 내 변환의 결과로서 주석과 환언 결과가 따로따로 생성되는 경우가 있다. 따라서, 양자를 따로따로 표시할 수 있어, 표현의 자유도가 향상된다.
도 16에 도시된 바와 같이, 「환언」과 주석을 분리하여 기술한 템플릿의 예에서는, 「원어 내에서의 환언」과 「주석」의 란에는 공란이 있지만, 이것은 각각 환언을 하지 않은 것과 주석을 추가하지 않은 것을 나타내고 있다.
예를 들면, 「죄송합니다」가 환언에 대해 도 13과 비교하면, 도 13에서는「죄송합니다(=사과하다)」와 같이 변환하는데 비해, 도 16에서는 변환을 행하지 않고, 대신에 「사과할 때의 표현」이라는 주석을 추가하고 있다.
즉, 도 13에서의 원어 「죄송합니다」의 다의어용 환언인 「죄송합니다(=사과하다)」, 「죄송합니다(=감사하다)」, 「죄송합니다(=말 걸때)」에 대해서는, 도 16에서는 주석으로서 「사과할 때의 표현」, 「감사의 표현」, 「말 걸때의 표현」이 각각 대응하여, 원어 내의 환언은 공백이 된다.
도 13에서의 원어 「X가 Y를 사용한다」, 원어 「X를 사용한다」에 대해서는, 도 16에서의 원어 내의 환언은 마찬가지지만, 주석은 공백이다.
도 13에서의 원어 「S1이, S2」의 중문 전개인 「S1. 그러나 S2」, 「S1. 그리고 S2」, 「S1. S2.」에 대해, 도 16에서의 원어 내의 환언은 마찬가지지만, 주석으로서 「역접을 나타낸다」, 「순접을 나타낸다」, 「병렬을 나타낸다」가 각각 대응하고 있다.
원어 내에서의 처리시에, 「환언」과 주석은 따로따로 생성되어 간다. 그리고, 변환 결과·번역 결과를 표시하는 단계에서, 양자를 표시한다.
입력에 대한 출력의 일례를 도 17에 도시한다. 입력이 「죄송합니다」이므로, 도 16의 템플릿의 참조 번호(1, 2, 3)로 매치하여 출력된다.
즉, 도 16의 참조 번호(1)에 대해서는, 환언 「죄송합니다」, 주석 「사과할 때의 표현」, 영역「I' m sorry.」가 된다. 도 16의 참조 번호(2)에 대해서는, 환언 「죄송합니다」, 주석 「감사의 표현」, 영역「Thank you.」가 된다. 도 16의 참조 번호(3)에 대해서는, 환언 「죄송합니다」, 주석 「말 걸때의 표현」, 영역「Excuse me.」가 된다.
입력에 대한 출력의 다른 예를 도 18에 도시한다. 입력이 「∼가, ∼」이므로, 도 16의 템플릿의 참조 번호(11, 12, 13)에 매치한다. 여기서, 「∼」는, 무엇인가 적당한 차분을 나타내고 있다.
즉, 도 16의 참조 번호(11)에 대해서는, 환언 「∼. 그러나∼. 」, 주석 「역접을 나타낸다」, 영역 「∼, but∼.」이 된다. 도 16의 참조 번호(12)에 대해서는, 환언 「∼. 그리고∼.」, 주석 「순접을 나타낸다」, 주석 「∼, and∼.」이 된다. 도 16의 참조 번호(13)에 대해서는, 환언 「∼. 그리고∼. 」, 주석 「병렬을 나타낸다」, 주석「∼. ∼.」이 된다.
여기서, 영역의 「∼」는, 상기 차분을 나타내는 「∼」를 영역한 것이다.
이들 도 17과 도 18에서는, 「환언」과 주석을 다른 항목으로 표시하고 있지만, 이것을「환언(주석)」(예를 들면 「죄송합니다(사과할 때의 표현)」)과 같이 표시하는 것도 가능하다.
계속해서, 확인의 앞당김과 연기에 의한 확인 횟수의 저감에 대해 설명한다.
이 확인 횟수를 줄이기 위한 수법은, 음성 번역 장치에 한하지 않고, 「처리→결과 확인」이라는 과정을 복수 개 갖는 임의의 자연 언어 처리 시스템에 적용 가능하다.
확인 횟수를 줄이기 위한 조작으로서, 이하와 같은 「확인의 앞당김」「확인의 연기」를 정의한다.
확인의 앞당김은, 제1 처리 P1 전에, 입력을 제1 처리 P1에서 정확도 좋게 처리할 수 있는 형식으로 변환하는 제2 처리 P2와 제2 처리 P2의 결과의 제2 확인 C2를 추가함으로써, 제1 처리 P1 후의 제1 확인 C1을 생략하는 것이다.
확인의 연기는, 제1 처리 P1의 직후의 제1 확인 C1을 그것보다도 후단의 제i 처리 P1 후로 이동한다. 또는, 후단의 제j 확인 Pj와 통합함으로써, 확인의 횟수를 줄이는 것이다.
또, 여기서 말하는 확인은, 처리 결과가 복수 개 존재하는 경우, 즉 선택지가 복수 개 존재하는 경우에는, 그 중에서 적당한 것을 사용자가 선택하는 것이다. 선택지가 모두 적당하지 않으면 사용자는 「정답 없음」을 선택한다.
또한, 처리 결과가 1개인 경우, 그것이 정답인지의 여부를 사용자가 확인한다는 것을 의미하고 있다. 이하에서도, 확인은 동일한 의미로 이용하기로 한다.
우선, 「확인의 앞당김」에 대해 설명한다. 확인의 앞당김은, 처리와 확인을 적어도 1세트 갖는 시스템에 대해 적용된다.
예를 들면, 도 19a에 도시된 확인의 앞당김의 적용 전의 상태에서는, 제1 처리 P1과 이에 대한 제1 확인 C1이 나타내어져 있다.
이에 대해 확인의 앞당김을 적용하기 위해서는, 도 19b의 적용 후의 상태에서 도시된 바와 같이, 제1 처리 P1 전에 제2 처리 P2와 그 결과를 확인하는 제2 확인 C2를 추가하고, 대신에 제1 처리 P1의 결과를 확인하는 제1 확인 C1을 삭제한다. 또, 도면 내의 빈 칸은, 삭제된 제1 확인 C1을 나타내고 있다.
제2 처리 P2는, 입력을 제1 처리 P1에서 정확도 좋게 처리할 수 있는 형식으로 변환하는 처리이고, 그 처리 내용은 제1 처리 P1에 의존한다.
예를 들면, 확인의 앞당김을 「적용 전」의 시스템에서, 입력에 다의성이 포함되기 때문에, 처리 후에 확인이 필요해지는 (또는 처리 정확도 저하함) 경우가 있다. 이 경우에는, 확인을 앞당기는데 필요한 제2 처리 P2는, 입력을 다의성의 수만큼 전개한다는 처리가 된다.
예를 들면 도 5에 도시된 「다의성 말의 표현 규칙」이나 「중문 분해 규칙」 등과 같은 처리에 대해서는, 제2 처리 P2는, 입력을 다의성의 수만큼 전개하는 처리를 행하게 된다.
이 앞당김에 의해, 결과를 사용자가 확인하는 것이 곤란한 처리(예를 들면 기계 번역)라도, 처리전에 확인하는 것이 가능해지고, 처리 후의 확인이 불필요해진다.
이어서, 「확인의 연기」에 대해 설명한다. 확인의 연기는, 처리와 확인을 적어도 2세트이상 갖는 시스템에 대해 적용된다.
예를 들면, 도 20a에 도시된 확인 연기의 적용 전의 상태에서는, 전단의 제1 처리 P1과 제1 확인 C1, 후단의 제2 처리 P2와 제2 확인 C2가 나타내어져 있다.
이에 대해 확인의 연기를 적용하기 위해서는, 도 20b의 적용 뒤의 상태에서 도시된 바와 같이, 전단의 제1 처리 P1의 결과를 확인하는 제1 확인 C1을 후단의 제2 처리 P2 후로 이동하거나, 후단의 처리의 제2 확인 C2를 통합하여 1회의 확인으로 한다. 또, 도면 내의 빈 칸은, 삭제된 제1 확인 C1을 나타내고 있다.
제1 처리 P1의 출력 결과가 복수 개 있는 경우에는, 이들의 결과를 전부 제2 처리 P2로 건내고, 제2 처리 P2에서는 제1 처리 P1로부터 받은 결과 1개씩에 대해 처리한다. 그리고, 그 결과를 사용자가 확인한다.
이어서, 확인의 앞당김과 연기의 조합에 대해 설명한다. 앞당김과 연기의 조합은, 처리와 그 결과의 확인을 2세트이상 갖는 시스템에 대해 적용된다.
예를 들면, 도 21a의 확인의 앞당김과 연기의 조합의 적용 전의 상태에서는, 제1 처리 P1, 제1 확인 C1, 제2 처리 P2, 제2 확인 C2가 나타내어져 있다.
제2 확인 C2에 앞당김을 적용하면, 도 21b와 같은 형태가 된다. 즉, 「입력을 제2 처리 P2에서 정확도 좋게 처리할 수 있는 형식으로 변환하는 처리」로서 제3 처리 P3이 제2 처리전에 추가되고, 그리고 제3 처리 P3의 결과를 확인하는 제3 확인 C3도 추가되고, 또한 제2 확인, C2는 삭제된다. 도면 내의 빈 칸은, 삭제된 제2 확인 C2를 나타내고 있다.
이어서, 도 21b에 도시된 제2 확인 C2로 앞당김을 적용한 상태에서, 제1 확인 C1에 연기를 적용하면, 도 21c에 도시된 바와 같이, 제1 확인 C1은 제3 처리 P3 후의 제3 확인, C3과 통합된다. 이렇게 해서, 확인 횟수는 2회부터 1회로 삭감된다. 도면 내의 빈 칸은, 이동된 제1 확인 C1의 위치를 나타내고 있다.
또한, 이 형태에서는 「→제1 처리 P1→제3 처리 P3」과 같이 처리가 연속하기 때문에, 2개의 처리를 통합한 처리에 이들을 치환하는 것도 가능하다.
제2 처리 P2의 내용에 따라서는, 처리 결과를 사용자가 확인하는 것이 곤란한 것도 있다. 여기 것에는, 예를 들면 제2 처리 P2가 번역 처리인 경우가 있다.
그와 같은 시스템에 대해 단순히 연기를 적용하여 확인을 통합해도, 확인은 여전히 곤란하기 때문에 통합은 무의미하다. 그러나, 본 실시의 형태와 같이 확인의 앞당김과 연기를 조합하면, 제2 처리 P2 앞에 확인을 하기 때문에, 확인은 용이해져, 통합을 하는 의의가 있다.
이어서, 확인의 「앞당김」과 「연기」를 음성 번역에 적용한 구체예에 대해 설명한다.
종래의 음성 번역 시스템은, 도 22a에 도시된 바와 같은 형태를 이루고 있다. 즉, 음성 번역 R1, 인식 결과 확인 C4, 기계 번역 T1, 번역 결과 확인, C5의 순서로 처리가 행해진다.
도 22a에 도시된 종래의 음성 번역 시스템에 있어서, 「번역 결과 확인 C5」로 앞당김을 적용한다. 즉, 도 22b에 도시된 바와 같이, 「입력을 기계 번역으로 정확도 좋게 처리할 수 있는 형식으로 변환하는 처리」로서 표현 변환 처리 T2와 그 결과를 확인하는 변환 결과 확인 C6을 기계 번역 처리 T1 전에 추가하고, 대신에 번역 결과 확인 C5를 삭제한다.
여기서, 도 21b와 대조하면, 표현 변환 T2는 제2 처리 C2에, 변환 결과 확인 C6은 제3 확인 C3에 해당한다. 또한, 도면 내의 빈 칸은, 삭제된 번역 결과 확인 C5를 나타내고 있다.
도 22b에 도시된 인식 결과 확인 C4로 앞당김을 적용한 상태에서, 도 22c에 도시된 바와 같이, 「인식 결과 확인 C4」로 연기를 적용한다. 즉, 「인식 결과 확인 C4」를 「표현 변환 T2」후로 이동하고, 「변환 결과 확인 C6」으로 통합하여 1회의 확인으로 한다. 이것은, 실시예의 제2 형태에 해당한다.
여기서, 음성 인식 R1로 계속되는 빈 칸은, 이동된 인식 결과 확인 C4가 있는 위치를 나타내고 있다.
이것에 더욱 연기를 적용함으로써, 도 22d에 도시된 바와 같이, 표현 변환과 기계 번역을 동시에 행할 수도 있다. 즉, 도 22c에 있는 「인식 결과 확인 C4 + 변환 결과 확인 C6」에 연기를 적용하여 기계 번역 처리 T1 후로 이동한다. 그렇게 하면, 「→표현 변환 T2→기계 번역 T1→」와 같이 2개의 처리가 연속하기 때문에, 양자를 통합한 처리(표현 변환과 기계 번역을 동시에 행하는 처리)로 치환할 수 있다.
「표현 변환 T2 + 기계 번역 T1」이라는 처리의 출력은, 원어로의 변환 결과와 목적 언어로의 번역 결과의 양방을 포함하고 있다. 그 때문에, 사용자가 처리 결과를 확인하는 것은, 종래법에서 번역 결과를 확인하는 것과는 달리 용이하다.
이상 설명된 바와 같이, 상술된 실시의 형태는, 입력된 자연 언어를 다른 표현으로 변환하고, 그것을 사용자가 선택·확인한 후에 처리를 행하는 것이다. 또한 복수의 자연 언어 처리와 결과의 확인을 가질 때에, 확인의 앞당김, 연기를 행함에 따라, 사용자의 확인 횟수를 감소시키는 것이다. 즉, 어떤 처리 전에, 입력을 상기 처리로 정확도 좋게 처리할 수 있는 형식으로 변환하고, 그 변환 결과의 확인을 추가함으로써, 상기 처리의 확인을 생략하는 확인의 앞당김과, 어떤 처리 직후의 확인을, 그것보다도 후단에 도입된 확인의 앞당김을 위한 처리의 확인과 병합하여, 확인의 횟수를 줄이는 확인의 연기를 행하는 것이다.
이상 설명된 바와 같이, 본 발명은, 입력된 1회별 표현으로 변환하고, 그것을 사용자에게 제시하여 선택·확인을 행하고 있다. 따라서, 사용자에 의한 확인 동작을 가능한 한 적고, 게다가 정확도가 높은 자연 언어 처리를 제공할 수 있다.
본 발명에 따라, 가능한 한 적은 확인 동작으로, 원하는 출력에 될 수 있는 한 가까운 형태로, 정확도가 보증되는 출력 결과를 얻을 수 있는 자연 언어 처리 장치를 제공할 수 있다.
또한, 종래의 번역에서는, 번역어의 선택·확인이 실질적으로 불가능하기 때문에, 번역의 정확도를 높이지 않으면, 즉 정답을 단 하나만 출력하도록 하지 않으면 실용적이지 않았지만, 본 발명의 번역에서는, 번역 결과의 선택·확인에 해당하는 것이 가능해지기 때문에, 번역부의 정확도가 그만큼 높지 않아도 실용적이다.

Claims (33)

  1. 자연 언어를 입력하는 입력 수단과,
    상기 입력 수단에서 입력한 자연 언어를 변환하는 변환 수단과,
    상기 변환 수단에 의해 변환한 자연 언어를 확인하는 확인 수단과,
    상기 확인 수단에 의해 확인한 자연 언어에 처리를 실시하는 처리 수단과,
    상기 처리 수단에서 처리한 자연 언어를 출력하는 출력 수단을 포함하고,
    상기 입력 수단에는 제1 언어가 입력되고, 상기 처리 수단은 제1 언어를 제2 언어로 번역하고, 상기 출력 수단은 상기 처리 수단에서 번역된 상기 제2 언어를 출력하고, 상기 변환 수단은, 상기 입력 수단에 입력된 상기 제1 언어를, 제1 언어의 다른 표현으로 변환하는 것을 특징으로 하는 자연 언어 처리 장치.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 제1항에 있어서,
    상기 변환 수단은, 상기 입력 수단에 입력한 자연 언어의 표현에 대해, 다의적인 표현을 복수의 일의적인 표현으로 변환하는 것을 특징으로 하는 자연 언어 처리 장치.
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 자연 언어를 입력하는 입력 수단과,
    상기 입력 수단에 입력된 제1 언어를, 제2 언어에 의한 표현 및 제3 언어에의한 표현으로 상기 제2 언어의 표현에 1 대 1로 대응하는 표현으로 변환하는 변환 수단과,
    상기 변환 수단에서 변환한 상기 제3 언어의 표현을 확인하는 확인 수단과,
    상기 확인 수단에 있어서의 확인의 결과에 따라, 상기 입력 수단에 입력된 자연 언어에 처리를 실시하는 처리 수단과,
    상기 처리 수단에서 처리를 실시된 자연 언어를 출력하는 출력 수단을 갖는 것을 특징으로 하는 자연 언어 처리 장치.
  26. 제25항에 있어서,
    상기 변환 수단에 있어서, 상기 제2 언어는 번역의 목적으로 하는 언어이고, 상기 제3 언어에 의한 표현은 상기 제1 언어에 의한 표현의 변환에 따라 얻어진 것을 특징으로 하는 자연 언어 처리 장치.
  27. 자연 언어를 입력하는 입력 공정과,
    상기 입력 공정에서 입력한 자연 언어를 변환하는 변환 공정과,
    상기 변환 공정에서 변환한 자연 언어를 확인하는 확인 공정과,
    상기 확인 공정에서 확인한 자연 언어에 처리를 실시하는 처리 공정과,
    상기 자연 언어 처리 공정에서 처리한 자연 언어를 출력하는 출력 공정을 포함하고,
    상기 입력 공정에는 제1 언어가 입력되고, 상기 변환 공정은, 상기 입력 공정에 입력된 제1 언어를 제2 언어의 제2 표현으로 변환함과 함께, 상기 제2 표현에 1 대 1로 대응하는 제1 언어의 제1 표현으로 변환하고, 상기 확인 공정은, 상기 제1 표현을 이용하여 확인하고, 상기 처리 공정은, 상기 변환 공정에서의 변환 및 상기 확인 공정에서의 확인에 기초하여, 상기 제1 언어를 상기 제2 언어로 번역하고, 상기 출력 공정은 상기 처리 공정에서 번역된 상기 제2 언어를 출력하는 것을 특징으로 하는 자연 언어 처리 방법.
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
KR1020007004712A 1998-08-31 1999-08-31 자연 언어 처리 장치 및 방법 KR100681989B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP1998-246400 1998-08-31
JP24640098 1998-08-31
PCT/JP1999/004726 WO2000013102A1 (fr) 1998-08-31 1999-08-31 Dispositif et procede pour le traitement du langage naturel

Publications (2)

Publication Number Publication Date
KR20010031659A KR20010031659A (ko) 2001-04-16
KR100681989B1 true KR100681989B1 (ko) 2007-02-15

Family

ID=17147955

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007004712A KR100681989B1 (ko) 1998-08-31 1999-08-31 자연 언어 처리 장치 및 방법

Country Status (4)

Country Link
US (1) US7912696B1 (ko)
KR (1) KR100681989B1 (ko)
CN (1) CN1119760C (ko)
WO (1) WO2000013102A1 (ko)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023389A1 (en) 2000-09-15 2002-03-21 Robert Fish Systems and methods for translating an item of information using a distal computer
WO2005038777A1 (en) * 2003-10-21 2005-04-28 Philips Intellectual Property & Standards Gmbh Intelligent speech recognition with user interfaces
US7613719B2 (en) * 2004-03-18 2009-11-03 Microsoft Corporation Rendering tables with natural language commands
JP4064413B2 (ja) 2005-06-27 2008-03-19 株式会社東芝 コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP4550708B2 (ja) * 2005-09-29 2010-09-22 株式会社東芝 音声翻訳装置及び音声翻訳方法
JP4256891B2 (ja) * 2006-10-27 2009-04-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳の精度を向上させる技術
KR100904365B1 (ko) * 2007-06-11 2009-06-22 안문학 단어 변환 및 음성 출력 기능을 갖는 휴대폰 및 그 방법
CN101960451A (zh) * 2008-02-29 2011-01-26 夏普株式会社 信息处理装置、方法、以及程序
US8374881B2 (en) 2008-11-26 2013-02-12 At&T Intellectual Property I, L.P. System and method for enriching spoken language translation with dialog acts
AU2010249153B2 (en) * 2010-01-07 2015-08-20 D2L Corporation Systems and methods for guided instructional design in electronic learning systems
CN103902248B (zh) * 2013-09-06 2017-01-18 王柳 基于自然语言自动调度程序的智能微信银行***及自然语言对计算机***的智能调度方法
US9734142B2 (en) * 2015-09-22 2017-08-15 Facebook, Inc. Universal translation
JP6706810B2 (ja) * 2016-12-13 2020-06-10 パナソニックIpマネジメント株式会社 翻訳装置および翻訳方法
CN107679032A (zh) * 2017-09-04 2018-02-09 百度在线网络技术(北京)有限公司 语音转换纠错方法和装置
CN109166594A (zh) * 2018-07-24 2019-01-08 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
KR20210037307A (ko) 2019-09-27 2021-04-06 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
CN111339766A (zh) * 2020-02-19 2020-06-26 云南电网有限责任公司昆明供电局 一种操作票合规性检查方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0136425B1 (ko) * 1995-01-26 1998-05-15 조백제 의존문법을 후향 언어모델로 사용하는 한국어 연속음성 인식장치 및 방법과 그를 이용한 자동통역시스템

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984177A (en) * 1988-02-05 1991-01-08 Advanced Products And Technologies, Inc. Voice language translator
JP2758952B2 (ja) * 1989-12-28 1998-05-28 富士通株式会社 日本語文書読取翻訳システムの修正時における表示方式
JP2814634B2 (ja) * 1989-12-29 1998-10-27 松下電器産業株式会社 機械翻訳装置
JPH03282776A (ja) 1990-03-30 1991-12-12 Nec Corp 文書処理方式
JPH04153878A (ja) 1990-10-18 1992-05-27 Fujitsu Ltd 機械翻訳装置における前編集支援処理装置
JP3176059B2 (ja) * 1990-11-15 2001-06-11 キヤノン株式会社 翻訳装置
JPH04205464A (ja) 1990-11-30 1992-07-27 Hitachi Ltd 自然言語文の意味解析問い合わせ方法
US5477451A (en) * 1991-07-25 1995-12-19 International Business Machines Corp. Method and system for natural language translation
JPH05197744A (ja) 1992-01-17 1993-08-06 Nippon Hoso Kyokai <Nhk> 外国語ワードプロセッサ
JPH0652219A (ja) 1992-08-03 1994-02-25 Hitachi Ltd 機械翻訳方法および例文検索方法
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
JP3385146B2 (ja) * 1995-06-13 2003-03-10 シャープ株式会社 会話文翻訳装置
JPH0916602A (ja) * 1995-06-27 1997-01-17 Sony Corp 翻訳装置および翻訳方法
JPH09269945A (ja) 1996-03-29 1997-10-14 Toshiba Corp メディア変換方法およびメディア変換装置
US6085162A (en) * 1996-10-18 2000-07-04 Gedanken Corporation Translation system and method in which words are translated by a specialized dictionary and then a general dictionary
JP2000516749A (ja) * 1997-06-26 2000-12-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 語構成源テキストを語構成目標テキストに翻訳する機械構成の方法及び装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0136425B1 (ko) * 1995-01-26 1998-05-15 조백제 의존문법을 후향 언어모델로 사용하는 한국어 연속음성 인식장치 및 방법과 그를 이용한 자동통역시스템

Also Published As

Publication number Publication date
KR20010031659A (ko) 2001-04-16
CN1275223A (zh) 2000-11-29
CN1119760C (zh) 2003-08-27
WO2000013102A1 (fr) 2000-03-09
US7912696B1 (en) 2011-03-22

Similar Documents

Publication Publication Date Title
KR100681989B1 (ko) 자연 언어 처리 장치 및 방법
US6917920B1 (en) Speech translation device and computer readable medium
JP5121252B2 (ja) 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
Rayner The spoken language translator
EP1089193A2 (en) Translating apparatus and method, and recording medium used therewith
JPH05120324A (ja) 言語処理方式
JPS6318458A (ja) 感情情報抽出装置
Gao et al. MARS: A statistical semantic parsing and generation-based multilingual automatic translation system
JP2000305930A (ja) 言語変換規則作成装置、言語変換装置及びプログラム記録媒体
JP4986549B2 (ja) 電子機器、その制御方法、および、翻訳文出力用プログラム
JP2000242642A (ja) 翻訳処理方法及び翻訳処理装置
JP3136038B2 (ja) 通訳装置
JP3280729B2 (ja) 発音記号作成装置
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH03164975A (ja) 機械翻訳方法及び機械翻訳装置
JP3019447B2 (ja) 外国語カタカナ表記変換方式
Inagaki et al. Incremental Spoken Language Translation Utilizing Grammatically Ill-formed Expressions
JPH07141382A (ja) 外国語文書作成支援装置
JPS6244875A (ja) 機械翻訳装置
JP2003345797A (ja) 言語変換装置及びプログラム記録媒体
JPS62271065A (ja) 機械翻訳システム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120130

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130131

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee