KR100265548B1 - 기계번역방법및장치 - Google Patents

기계번역방법및장치 Download PDF

Info

Publication number
KR100265548B1
KR100265548B1 KR1019970040395A KR19970040395A KR100265548B1 KR 100265548 B1 KR100265548 B1 KR 100265548B1 KR 1019970040395 A KR1019970040395 A KR 1019970040395A KR 19970040395 A KR19970040395 A KR 19970040395A KR 100265548 B1 KR100265548 B1 KR 100265548B1
Authority
KR
South Korea
Prior art keywords
translation
url
web page
www
environment
Prior art date
Application number
KR1019970040395A
Other languages
English (en)
Other versions
KR19980032309A (ko
Inventor
다께시 고바야까와
에이이찌 다조에
쥰 이시꾸라
Original Assignee
포만 제프리 엘
인터내셔널 비지네스 머신즈 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포만 제프리 엘, 인터내셔널 비지네스 머신즈 코포레이션 filed Critical 포만 제프리 엘
Publication of KR19980032309A publication Critical patent/KR19980032309A/ko
Application granted granted Critical
Publication of KR100265548B1 publication Critical patent/KR100265548B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Machine Translation (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명은 복수의 번역 환경을 구비한 기계 번역 시스템 상에서 인터넷 상의 WWW 서버로부터 다운 로드한 WWW 페이지 중의 원문 텍스트를 역문 텍스트로 적절하게 번역하는 것을 목적으로 한다.
본 발명을 실현하는 컴퓨터·프로세스는 외국어 텍스트를 모국어 텍스트로 번역 처리하기 위한 번역 엔진 외에, 복수의 번역 환경이나 URL(Universal Resource Locator) 문자열과 번역 환경에 관한 데이타 베이스를 구비하고 있다. WWW 브라우저 화면 상에서 사용자가 URL 문자열을 입력하면, 지정된 WWW 페이지가 인터넷을 경유하여 다운 로드된다. 이 때, 입력된 URL 문자열에 유사한 (즉 가장 유사한) URL 문자열을 데이타 베이스상에서 검색한다. 예를 들면 입력된 URL 문자열이 데이타 베이스 상에 기존의 "www. ibm. com/" 이면 이에 해당하는 번역 환경 A (인터넷 사전)이 자동 선택된다. 또한, 입력된 URL 문자열이 데이타 베이스에 미등록의 "www. yahoo/com/Arts/Architecture/"이면, 파셜(partial) URL 문자열의 일치도가 가장 높은 "www. yahoo. com/Arts/"에 해당하는 번역 환경 B (예술사전(arts dictionary))가 자동 선택된다. 이어서 번역 엔진은 선택된 번역 환경을 기초로 다운 로드된 WWW 페이지 중 의 외국어 텍스트를 모국어 텍스트로 번역 처리한다. 번역 처리 결과인 모국어 텍스트는, WWW 브라우저에 전달되어 브라우저 화면 상에 표시된다.

Description

기계 번역 방법 및 장치{AUTOMATIC TRANSLATING METHOD AND MACHINE}
본 발명은, 예를 들면 영어 등의 외국어 텍스트를 일본어 (혹은 한국어나 중국어 등)의 모국어 텍스트로 번역하기 위한 기계 번역 방법 및 장치에 관한 것으로, 특히 복수의 번역 환경을 구비한 기계 번역 방법 및 장치에 관한 것이다. 더욱 자세하게는 본 발명은 인터넷 상의 WWW 서버에 의해서 제공된 WWW 페이지 중의 외국어 텍스트를 모국어 텍스트로 번역하기 위한 기계 번역 방법에 관한 것으로, 특히 처리 대상의 외국어 텍스트에 최적의 번역 환경을 자동 선택하여 번역 처리하는 기계 번역 방법 및 장치에 관한 것이다. 또, 여기서 말하는「번역 환경」이란, 번역 처리에 이용되는 사전 데이타 베이스나 문법 처리 알고리즘 (예를 들면 문절의 설정이나 조동사 번역의 설정, 문체의 지정 등) 등의 것을 가리킨다.
인터넷(Internet):
종래부터, 일반 공중 회선 등의 통신 회선을 이용하여 원격지의 컴퓨터끼리를 연결하는 「원격 컴퓨팅·시스템」의 연구 개발이 행해지고 있다. 예를 들면 일본국 내에서는, 1985년의 전기 통신 사업법의 시행을 발단으로 퍼스널 컴퓨터 통신이 활발하게 진행되고 있다.
최근의 원격 컴퓨팅의 주요한 동향으로서 인터넷(Internet)의 이용을 예로 든다. 여기서, 인터넷은 1970년대에 미국의 전미국 과학 재단(NSF)가 출자하여 설립된 네트워크 "NSFnet"를 모체로서 상호 접속된 전 세계의 네트워크의 총칭이다. 인터넷은, 당시에는 학술 연구의 정보 교환을 초기 목적으로서 세계 54개국의 대학이나 연구 기관 등을 연결하기 위한 국제적인 네트워크이지만 각 대학·연구 기관에 설치된 서버 (주로 UNlX 워크스테이션)가 자주적으로 상호 접속을 반복한 결과, 전 세계를 망라하는 거대한 네트워크로 성장하였다 (현재의 인터넷은 전세계에 산재하는 수십만을 넘는 서버로 구성된다!). 원격지간의 각 서버·머신은, "TCP/IP (Transmission Control Protocol/Internet Protocol)" 이라고 불리우는 통신 프로토콜에 따라서 상호 접속되어 있고, 각 머신간에서 데이타 전송이나 BBS(Bulletin Board System: 전자 게시판) 상에서의 커뮤니케이션 등이 가능하다.
종래의 (즉 원초적인) 인터넷은, UNIX 베이스의 컴퓨터끼리의 접속이라는 이미지가 강하지만, 1994년에 와서 일반 공개되고, 인터넷 접속 서비스를 제공하는 프로바이더가 출현함에 이르러서, 일반 기업이나 개인에게도 보급이 가속되어 졌다. 예를 들면 일본의 주요 퍼스널 컴퓨터 통신 서비스("PC - VAN"이나 "Nifty Serve" 등)로도 인터넷 접속 서비스가 제공되고 있다.
인터넷은, 운영 모체나 운영 체계가 다른 네트워크의 집합체이고, 개개의 네트워크를 총괄하는 기관은 있더라도 인터넷 전체를 포괄적으로 관리하는 기관은 존재하지 않는다. 즉, 전 세계에 산재하는 각 서버(예를 들면 데이타 베이스·서버나 파일·서버)는, 네트워크 내의 사용자에 의해서 국소적으로 관리되어 있는 것에 불과하다. 따라서, 인터넷의 각 사용자는 인터넷에 접속된 서버를 통함으로써 누구나 정보 제공자가 될 수 있고 또한, 인터넷 상의 모든 정보를 끊임없이 억세스할 수 있다. 이점은, 특정한 호스트(즉 정보 서버)로 밖에 억세스할 수 없는 퍼스널 컴퓨터 통신 서비스와는 크게 다르다. 또, 특정 기업의 네트워크끼리를 접속하여 와이드 영역으로 확대한 인터넷 워킹과 구별하기 위해서 영어에서는 "the lnternet"이라고 고유 명사화하여 표기하는 것이 일반적으로 되어 있다.
월드·와이드·웹(World Wide Web: WWW):
오늘날의 인터넷의 보급을 가속시킨 것은 「월드·와이드·웹(WWW)」라고 해도 과언은 아닐 것이다. WWW는, 네트워크(특히 인터넷) 상에 하이퍼 텍스트/*/를 구축하고, 모든 정보를 끊임없이 억세스하는 것을 목적으로 한 광역 정보 시스템(인터넷·어플리케이션)이고, 본래는 1989년에 구주 소립자 물리학 연구소(통칭 CERN)에서 개발되었다. WWW에 의하면 사용자(즉 WWW 클라이언트)는 화면 상에서 강조 표시된 단어, 문구, 화상 등을 마우스로 클릭함으로써 서버로부터 서버로(혹은 데이타 베이스로부터 데이타 베이스로), 목적의 정보에 이르는 것이 가능하다.
「전 세계로 넓어진 거미집」이라는 이름과 같이 현재는 매우 많은 수의 WWW 서버가 인터넷 상에 존재하고 있다. 각 WWW 서버의 로컬·디스크에는 HTML(Hyper text markup Language)로 불리워지는 언어로 기술된 화일로부터 이루어지는 WWW 페이지가 다수 축적되어 있다.
HTML 파일은, 텍스트·파일 외에 화상, 음성, 비디오 등의 각종 형식의 파일을 포함하고 있다. HTML는 SGML (Standard Generalized Markup Language)를 기초로 책정되어 있고, 현재의 버젼은 WWW의 표준화 단체 "W3 Consortium"이 1996년에 릴리스한 "HTML3. x"이다. HTML에 준거한 파일은 기본적으로는 텍스트 형식의 파일로 구성되어 있고, "<" 와 ">"로 구획지어진「 예약어(태그) 」를 사용하여 텍스트의 정형이나 화상 파일·음성 파일이 있는 곳, 링크처(先)등이 기술되어 있다.
WWW 사용자(WWW 클라이언트)는 WWW 서버의 WWW 페이지에 저장된 파일을, HTTP(Hypertext Transfer Protocol)라도 하는 통신 프로토콜에 따라서 판독할 수 있다(HTTP는, TCP/IP의 상위 프로토콜에 해당한다). 소위「WWW 브라우저」는, HTML 파일의 내용을 해석하여 사용자·머신의 화면 상에 표시하는, 즉 인터넷· 여행·가이드로서 작용하는 컴퓨터·프로그램이다. WWW 브라우저의 대표예는, 미국 IBM사의 "Web Explorer"는 미국 IBM사의 상표), 미국 Netscape Communications사의 "Netscape Navigator"이나 미국 Microsoft사의 "Internet Explorer" 등이다.
HTML 파일 중에 지정된 화상 파일 등이 있는 부분, HTML 파일 그 자체를 보존하고 있는 WWW 서버와 별도의 WWW 서버만으로도 상관 없다. WWW 브라우저는, HTML 파일의 해석을 행하는 외에, 화상 파일 등의 판독도 행하여 텍스트 중에 화상 등이 저장된 복합 텍스트를 WWW 클라이언트·머신의 디스플레이화면 상에 표시하도록 되어 있다. 또한, HTML 파일 중에는「이 텍스트(혹은 화상)가 마우스로 클릭되면, 어떤 서버의 어떤 파일을 판독한다」 와 같은 커맨드가 저장되어 있고, 사용자는 표시 화면 상의 텍스트나 화면의 일부분을 마우스로 클릭 조작하는 것만으로 다른 HTML 파일을 판독할 수 있다. 클릭 조작에 의해 새롭게 판독되는 HTML 파일은, 원래의 HTML 파일과 동일한 WWW 서버에 있어서도 별도의 WWW 서버에 있어서도 상관없다.
HTML 파일 중에 다음의 HTML 파일의 판독을 지시한 커맨드를 저장하는 것을, 당업계에서는 「링크 형성」이라고도 한다. 링크처의 지정에는, URL(Uniform Resource Locator)라고 부르는 표기 방법이 이용된다. URL은, 인터넷 상의 정보 자원(즉 인터넷 상의 서버가 축적하고 있는 파일)을 식별하기 위한 표준 어드레싱 기술이고, IETF (Internet Engeneering Task Force) /**/가 마련된 공식 문서군 RFC(Request for Comments)의 하나인 RFC1738로 그 사양이 규정되어 있다.
URL은 정보 자원에 억세스하기 위한 프로토콜명 (스킴명(Scheme name)), 정보 자원을 저장하는 서버명, 및 서버 내의 파일명이라고 하는 3요소를 기술한 문자열로 구성된다. 지정할 수 있는 프로토콜에는, HTTP(http) 외에, NNTP (news), FTP (ftp: file transfer protocol), Telnet(telnet), 로컬·디스크로의 억세스(file) 등을 들 수 있다. 또한, 주된 서버명에는, "www. ibm. com"이나 "www. yahoo. com" 등을 예로 들 수 있다. 예를 들면, "www. yahoo. com"라고 하는 서버의 WWW 서비스로 제공하는 파일 "Arts"의 URL은, "http: // www. yahoo. com/Arts/"로 표기된다. URL의 각 구성 요소의 사이는, 통상, "/"로 구획짓고 있다. 바꾸어 말하면, URL은WWW 페이지의 어드레스인 것이다. (또, 여기서 말하는「WWW 페이지」란, WWW 서버가 제공하는 화면의 총칭의 것이고, 「 홈·페이지」라고도 한다.)
또, URL을 구성하는 문자열 중, "/"로 구획지어진 각 문자열의 것을, 본 명세서 내에서는 이하「파셜 URL 문자열」이라고 부르기로 한다.
WWW 페이지를 위한 번역 프로그램:
상술한 바와 같이, WWW에 의하면, 인터넷·사용자는 데스크에 있으면서도 전 세계의 WWW 서버에 억세스하고, 취득한 WWW 페이지를 브라우저 화면 상에서 바라볼 수 있다.
WWW 페이지 중의 텍스트의 대부분은 영어로 기술되어 있고, 영어권 이외(예를 들면 일본, 중국, 한국 등)의 인터넷·사용자(혹은 영어에 정통하지 않는 사용자)에 있어서는 해독이 불편하고, 모처럼의 광역 정보 시스템을 충분히 활용할 수 없다. 이 때문에, 최근에는 기계 번역 소프트(혹은 번역 지원 소프트)의 개발·보급화가 재연되고 있다. 이들 기계 번역 소프트 중에는, 인터넷 상의 텍스트 즉 WWW 페이지의 번역에 특화한 제품도 있다. 예를 들면, 인터넷 경유로 취득한 데이타를, WWW 브라우저의 프록시(Proxy) 기능/***/을 이용하여 기계 번역 소프트가 중계되고, 번역문이 다시 WWW 브라우저로 전달되어 브라우저 화면에 표시된다고 하는 것이다. 이와 같은 인터넷과의 융화성을 중시한 기계 번역 소프트의 일례는, 일본 IBM사가 시판하는「인터넷 번역의 황제 Ver1. x」이다.
기계 번역이란, 요컨대 컴퓨터·시스템의 처리 능력을 활용하여, 예를 들면 영어 등의 외국어 텍스트를 일본어 등의 모국어 텍스트로 번역하는(혹은 그 역방향으로 번역하는) 기술의 것이고, 애당초, 인간이 갖는(혹은 갖는다고 추정되는) 언어에 대한 막대한 지식을 모델화한 데이타 베이스를 구축하여, 번역 엔진이 이 데이타베이스를 참조하면서 행하는 것이다.
그런데, 원문 텍스트의 의도를 충실히 반영시키면서 정도 좋게 기계 번역하는 것은, 대체로 곤란하다. 이것은, 자연 언어가 갖는 애매함에도 크게 의존한다. 애매함의 가장 큰 요인의 하나로서, 다의어(多義語) 즉 2 이상의 의미를 갖는 단어가 존재하고, 또한 원문 텍스트 중에 빈번하게 나타나는 것을 예로 들어 본다. 다의어가 출현될 때마다 번역 엔진은 역어를 선택하지 않으면 안되고, 역어 선택에는 어느 정도의 오차 즉 오역을 수반하는 것은 물론일 것이다. 또한, 애매함의 다른 요인으로서, 문법상의 바리에이션을 예로 들어보기로 하자. 예를 들면 영문의 경우, 주어·술어등의 관계로부터 SVO, SVOO, SVOC 등 몇개인가의 기본 구문형으로 분류되지만, 관계사("that"이나 "which", "why" 등)을 생략하는 등에 의해, 문형이나 문법의 파악이 곤란해지는 경우가 많다.
기계 번역에서의 번역 정도를 향상시키기 위해서, 복수의 번역 환경을 구비한다고 하는 수법이 종래부터 널리 채용하여 받아들여지고 있다. 여기서 말하는「번역 환경」이란, 번역 처리에 이용되는 사전 데이타 베이스나 문법 처리 알고리즘(예를 들면 문절의 설정이나 조동사 번역의 설정, 문체의 지정 등) 등의 것을 지시하는 것으로서 이해되어야 한다. 원문 텍스트의 내용이 속하는 쟝르, 분야, 용도 등과 번역 환경과의 사이에 상관 관계가 있는 것은 이미 일반적으로 인정되어 있다. 예를 들면 예술, 스포츠, 교육, 과학 기술 등, 각 분야에 따라 빈번하게 나타나는 단어, 단어의 의미, 독특한 표현 등은 상호 다르고, 인터넷 사전, 예술 사전, 스포츠 사전 등 쟝르별로 전용의 번역 환경이 이미 이용 가능하게 되어 있다. 즉, 원문 텍스트의 내용에 최적의 번역 환경을 이용함에 따라, 기계 번역시에서의 불필요한 해석 처리가 경감되어, 번역 정도가 향상된다고 하는 것이다.
복수의 번역 환경 내에서 알맞는 것을 선택하기 위한 가장 간단하고 원시적인 수법은, 사용자 자신이 원문 텍스트의 내용으로 판단하여 메뉴얼 선택한다고 하는 것일 것이다. 이 경우, 사용자는 기계 번역의 개시 전에 원문 텍스트의 내용을 어느 정도는 이해해 둘 필요가 있다. 그러나, 사용자가 모국어가 아닌 원문 텍스트의 내용을 한눈에 이해하는 것은 쉽지 않아 많은 시간을 써버릴 수 밖에 없다. 이 결과, 번역 시스템의 존재 자체가 의미를 갖지 않게 된다. 특히 인터넷·사용자의 대부분은, 막대한 WWW 페이지 중에 의미가 있는 정보를 한눈으로 취사 선택하기위해서 기계 번역의 도움을 받기 때문에, 원문 텍스트를 바라 보는 시간을 필요로 한다면 기계 번역의 의미 그 자체가 없어진다.
이에 대해, 기계 번역 시스템에 번역 환경의 선택 처리를 맡긴다고 하는 선행 기술도 있다. 예를 들면 특개평7-191999호 공보, 특개평6-332946호 공보, 특개평6-318229호 공보, 특개평6-60117호 공보, 및 특개소61-173060호 등에는, 번역 시스템이 번역 환경을 자동 선택하는 타입의 번역 시스템에 대해 개시되어 있다. 이 종류의 번역 시스템은, 사용자 자신이 번역 환경을 선택한다고 하는 번잡한 수속을 없애서 작업 효율을 향상시켜 줄 것이다. 그러나, 이들 기존 기술의 대부분은 원문 텍스트의 의도에 적합한 번역 환경을 선택하기 위해서 번역 시스템이 원문 텍스트의 내용의 해석을 미리 행하게 되어 있다. 원문 텍스트의 해석이라고 하는 프리프로세스를 포함한다고 하는 것은, 처리에 상당한 시간을 요하고, 더구나 번역 시스템을 복잡하게 한다. 바꿔 말하면, 이들 기존 기술은 구축·활용의 양면에서 복잡한 시스템이라는 뜻이다.
《주석》
*: 하이퍼 텍스트란, 문자나 그림, 표 등을 오브젝트로서 취급하고, 또한 각 오브젝트사이에서 여러가지로 관계지어 억세스할 수 있도록 한 소프트 웨어이다.
**: IETF란, 인터넷 상의 기술, 서비스의 의론, 제안 등을 행하는 기관이다.
***: 프록시 기능이란, 인터넷으로부터의 통신 데이타를 대리로 수취하여, 직접 외부에 억세스할 수 없는 호스트에 중계하는 기능이다.
본 발명의 목적은, 복수의 번역 환경을 구비한 번역 시스템을 이용하여 외국어 텍스트(예를 들면 영어 텍스트)를 모국어 텍스트(예를 들면 일본어, 혹은 한국어나 중국어 등)로 번역하기 위한, 우수한 기계 번역 방법 및 장치를 제공하는 것이다.
본 발명의 또 다른 목적은, 외국어 텍스트를 모국어 텍스트로 번역할 때에 처리 대상의 외국어 텍스트에 최적의 번역 환경을 자동 선택하여 번역 처리하는, 우수한 기계 번역 방법 및 장치를 제공하는 것이다.
본 발명의 또 다른 목적은, 복수의 번역 환경을 구비한 번역 시스템을 이용하여, 인터넷 상의 WWW 서버에 의해 제공된 WWW 페이지 중의 외국어 텍스트를 모국어 텍스트로 적절하게 번역할 수 있는, 우수한 기계 번역 방법 및 장치를 제공하는 것이다.
본 발명은, 상기 과제를 참작하여 이루어진 것으로, 그 제1 측면은, 복수의 번역 환경을 갖는 번역 시스템을 이용하여 사용자가 지정한 정보 자원에 저장된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열을 해석하는 단계와,
(b) 해석 결과에 따라 상기 복수의 번역 환경 중에서 1개를 선택하는 단계와,
(c) 상기 조합 문자열이 나타낸 정보 자원에 저장된 파일 중의 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제2 측면은 복수의 번역 환경을 갖는 번역 시스템을 이용하여, 사용자가 지정한 정보 자원에 저장된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열을 사용자가 입력하는 단계와,
(b) 상기 조합 문자열이 지정하는 정보 자원에 저장된 파일을, 상기 조합 문자열이 지정하는 억세스 수단에 따라 다운 로드하는 단계와,
(c) 상기 조합 문자열을 해석하는 단계와,
(d) 해석 결과에 따라 상기 복수의 번역 환경 중에서 1개를 선택하는 단계와,
(e) 상기 다운 로드된 파일 중의 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제3 측면은, 복수의 번역 환경을 갖는 번역 시스템을 이용하여 사용자가 지정한 정보 자원에 저장된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열을 사용자가 입력하는 단계와,
(b) 상기 조합 문자열이 지정하는 정보 자원에 저장된 파일을, 상기 조합 문자열이 지정하는 억세스 수단에 따라 다운 로드하는 단계와,
(c) 다운 로드된 파일을 파일 중의 원문 텍스트와 함께 디스플레이 상에 표시하는 단계와,
(d) 상기 조합 문자열을 해석하는 단계와,
(e) 해석 결과에 따라 상기 복수의 번역 환경 중에서 1개를 선택하는 단계와,
(f) 상기 원(原) 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 단계와,
(g) 번역 처리 후의 역문 텍스트를 상기 원문 텍스트와 함께 디스플레이 상에 표시하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제4 측면은, 복수의 번역 환경을 갖는 번역 시스템을 이용하여, 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열의 입력에 따라지정된 정보 자원에 저장된 파일을 다운 로드함과 동시에 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에 관한 조합 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 조합 문자열에 가장 유사한 조합 문자열을 검색하는 단계와,
(c) 정보 자원으로부터 다운 로드된 파일 중의 텍스트를, 상기 검색된 조합 문자열에 해당하는 번역 환경을 이용하여 번역하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제5 측면은, 복수의 번역 환경을 갖는 번역 시스템을 이용하여 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열의 입력에 따라 지정된 정보 자원에 저장된 파일을 다운 로드함과 동시에 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에 관한 조합 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 조합 문자열에 가장 유사한 조합 문자열을 검색하는 단계와,
(c) 정보 자원으로부터 다운 로드된 파일 중의 텍스트를, 상기 검색된 조합 문자열에 관한 번역 환경을 이용하여 번역하는 단계와,
(d) 번역 결과가 적절하지 않으면 다른 번역 환경을 이용하여 상기 텍스트를 재번역 처리하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제6 측면은, 복수의 번역 환경을 갖는 번역 시스템을 이용하여, 정보 자원에의 억세스 수단과 정보 자원명을 기술한 조합 문자열의 입력에 따라 지정된 정보 자원에 저장된 파일을 다운 로드함과 동시에 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 정보 자원에 관한 조합 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 조합 문자열에 가장 유사한 조합 문자열을 검색하는 단계와,
(c) 정보 자원으로부터 다운 로드된 파일 중의 텍스트를, 상기 검색된 조합 문자열에 관한 번역 환경을 이용하여 번역하는 단계와,
(d) 번역 결과가 적절하지 않으면 다른 번역 환경을 이용하여 상기 텍스트를 재번역 처리하는 단계와,
(e) 번역 결과가 적절한 경우에는, 새로운 조합 문자열과 번역 환경과의 관계를 상기 데이타 베이스 중에 추가 기록하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제7 측면은, 정보 자원에 억세스하기 위한 프로토콜명, 정보 자원을 저장하는 서버명(및 서버 내의 파일명)의 조합으로 이루어지는 URL (Uniform Resource Locator) 문자열의 입력에 따라, 지정된 서버 내의 파일을 지정된 프로토콜에 따라 인터넷 경유로 다운 로드하고, 복수의 번역 환경을 이용하여 다운 로드된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 입력된 URL 문자열을 해석하는 단계와,
(b) 해석 결과에 따라 상기 복수의 번역 환경 중에서 1개를 선택하는 단계와,
(c) 다운 로드된 파일 중의 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제8 측면은, 정보 자원에 억세스하기 위한 프로토콜명, 정보 자원을 저장하는 서버 명(및 서버내의 파일명)의 조합으로 이루어지는 URL (Uuiform Resource Locator) 문자열의 입력에 따라서, 지정된 서버 내의 파일을 지정된 프로토콜에 따라 인터넷 경유로 다운 로드하여, 복수의 번역 환경을 이용하여 다운 로드된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) 다운 로드된 파일을 파일 중의 원문 텍스트와 함께 디스플레이 상에 표시하는 단계와,
(b) 상기 입력된 URL 문자열을 해석하는 단계와,
(c) 해석 결과에 따라 상기 복수의 번역 환경 중에서 1개를 선택하는 단계와,
(d) 상기 원문 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 단계와,
(e) 번역 처리 후의 역문 텍스트를 상기 원문 텍스트와 함께 디스플레이 상에 표시하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제9 측면은, 정보 자원에 억세스하기 위한 프로토콜명, 정보 자원을 저장하는 서버명(및 서버내의 파일명)의 조합으로 이루어지는 URL (Uniform Resource Locator) 문자열의 입력에 따라서, 지정된 서버 내의 파일을 지정된 프로토콜에 따라 인터넷 경유로 다운 로드하고, 복수의 번역 환경을 이용하여 다운 로드된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) URL 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 URL 문자열에 가장 유사한URL 문자열을 검색하는 단계와,
(c) 다운 로드된 파일 중의 텍스트를, 상기 검색된 URL 문자열에 해당하는 번역 환경을 이용하여 번역하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제10 측면은, 정보 자원에 억세스하기 위한 프로토콜명, 정보 자원을 저장하는 서버명(및 서버내의 파일명)의 조합으로 이루어지는 URL (Uniform Resoufce Locator) 문자열의 입력에 따라서, 지정된 서버내의 파일을 지정된 프로토콜에 따라서 인터넷 경유로 다운 로드하여, 복수의 번역 환경을 이용하여 다운 로드된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) URL 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 URL 문자열에 가장 유사한 URL 문자열을 검색하는 단계와,
(c) 다운 로드된 파일 중의 텍스트를, 상기 검색된 URL 문자열에 해당하는 번역 환경을 이용하여 번역하는 단계와,
(d) 번역 결과가 적절하지 않으면 다른 번역 환경을 이용하여 상기 텍스트를 재번역 처리하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제11 측면은, 정보 자원에 억세스하기 위한 프로토콜명, 정보 자원을 저장하는 서버명(및 서버내의 파일명)의 조합으로 이루어지는 URL (Uniform Resource Locator) 문자열의 입력에 따라서, 지정된 서버 내의 파일을 지정된 프로토콜에 따라 인터넷 경유로 다운 로드하고, 복수의 번역 환경을 이용하여 다운 로드된 파일 중의 텍스트를 번역하기 위한 기계 번역 방법에 있어서,
(a) URL 문자열과 번역 환경과의 조합을 데이타 베이스로서 기록하는 단계와,
(b) 상기 데이타 베이스 내에서, 새롭게 입력된 URL 문자열에 가장 유사한URL 문자열을 검색하는 단계와,
(c) 다운 로드된 파일 중의 텍스트를, 상기 검색된 URL 문자열에 관한 번역환경을 이용하여 번역하는 단계와,
(d) 번역 결과가 적절하지 않으면 다른 번역 환경을 이용하여 상기 텍스트를 재번역 처리하는 단계와,
(e) 번역 결과가 적절한 경우에는, 새로운 URL 문자열과 번역 환경과의 관계를 상기 데이타 베이스 중에 추가 기록하는 단계를 구비하는 것을 특징으로 하는 기계 번역 방법이다.
또한, 본 발명의 제12 측면은, 인터넷 경유로 WWW 서버로부터 다운 로드된 파일 중의 텍스트를, 복수의 번역 환경을 이용하여 번역하기 위한 기계 번역 장치에 있어서,
(a) URL 문자열과 번역 환경과의 조합을 기술한 데이타 베이스를 기록하는 제1 수단과,
(b) 사용자가 URL을 입력하기 위한 제2 수단과,
(c) 입력된 URL로 지정된 WWW 서버의 파일을 다운 로드하기 위한 제3 수단과,
(d) 입력된 URL 문자열에 가장 유사한 URL 문자열을 상기 제1 수단 중에서 검색하기 위한 제4 수단과,
(e) 검색된 URL 문자열에 관한 번역 환경을 최적의 것으로 선택하기 위한 제5 수단과,
(f) 다운 로드한 WWW 서버의 파일 중의 텍스트를, 상기 선택된 번역 환경을 이용하여 번역하는 제6 수단과,
(g) 번역 결과를 화면 표시하기 위한 제7 수단을 구비하는 것을 특징으로 하는 기계 번역 장치이다.
또, 여기서 말하는「번역 환경」이란, 번역 처리에 이용되는 사전 데이타 베이스나 문법 처리 알고리즘(예를 들면 문절의 설정이나 조동사 번역의 설정, 문체의 지정 등) 등의 것을 지시하는 것으로서 이해되어야 한다.
(작용)
본 발명은, 주로 WWW 페이지의 기계 번역용으로서, WWW 페이지의 어드레스인 URL이 프로토콜명, 서버명, 파일명이라는 각 요소를 기술한 문자열(즉 「파셜 URL 문자열」)의 조합으로 구성된다고 하는 점에 착안하여 이루어진 것이다.
본 발명에 관한 기계 번역 방법 및 장치는, 컴퓨터·프로세스라는 형태로 실장 가능하고, 예를 들면 WWW 서버로부터 WWW 페이지를 수신하고 브라우저 화면에 표시한다고 하는 일련의 브라우징 동작에 연동하여 실행된다.
상기 컴퓨터·프로세스는, 외국어 텍스트를 모국어 텍스트로 번역 처리(또는 그 역방향으로 번역 처리)하기 위한 번역 엔진 외에, 번역 환경 A(인터넷 사전), 번역 환경 B(예술 사전), 번역 환경 C(스포츠 사전) 등과 같은 복수의 번역 환경을 구비하고 있다. 또한, 본 발명에 관한 기계 번역 방법은, 미리 URL 문자열에 관한 데이타 베이스를 저장하고 있다. 이 데이타 베이스는, 하기의 표 1에 나타낸 바와 같은, 비교적 빈번히 억세스되는 WWW 페이지에 관한 URL 문자열과 번역 환경과의 대응 테이블이라는 형태라도 좋다. 동일 테이블에서 각 URL 문자열과 대응지어진 번역 환경은, 과거의 번역 처리 결과 등에 의해 알맞는 환경으로 간주된 것이다.
URL문자예 번역 환경
www. ibm. com/www. yahoo. com/www. yahoo. com/Arts/www. yahoo. com/Arts/Recreation/Sports/ 번역 환경 A(인터넷 사전)번역 환경 A(인터넷 사전)번역 환경 B(예술 사전)번역 환경 C(스포츠 사전)
표 1에서는, URL명 "www. ibm. com/" 및 "www. yahoo. com/" 에 대해서는 번역 환경 A(인터넷 사전)이, "www. yahoo. com/Arts/" 에 대해서는 번역 환경 B(예술 사전)이, "www. yahoo/com/Arts/Recreation/Sports/"에 대해서는 번역 환경 C(스포츠 사전)가, 각각 최적의 번역 환경으로서 기록되어 있다. 상기 데이타 베이스는, 시스템의 설계자가 사용자의 일반적 경향을 기초로 미리 작성해 놓아도 좋다. 또한, 각 사용자의 억세스 상황을 학습하여 데이타 베이스를 더욱 축적하도록 하여도 좋다.
WWW 브라우저 화면 상에서 사용자가 URL 문자열을 입력하면, WWW 브라우저(혹은 WWW 브라우저의 프록시)는, 인터넷 경유로 URL 문자열로 지정된 WWW 페이지로부터 파일을 다운 로드한다. 한편, 본 발명에 관한 컴퓨터·프로세스는, 입력된 URL 문자열을 해석한다. 여기서 말하는 URL 문자열의 해석이란, 입력된 URL 문자열에 가장 유사한 URL 문자열을 데이타 베이스상에서 검색하는 것을 의미한다. 보다 구체적으로는, URL 문자열을 파셜 URL 문자열의 조합으로서 간주하여, 파셜 URL 문자열의 조합이 가장 일치하는 URL 문자열을 데이타 베이스 상에서 찾아 내는 것을 의미한다. 예를 들면 URL 입력이 데이타 베이스에 기존의 "www. ibm. com/"이면, 이에 해당하는 번역 환경 A(인터넷 사전)가 자동 선택된다. 또한, URL 입력이 데이타 베이스에 미등록의 "www. yahoo/com/Arts/Architecture/"이면, 파셜 URL 문자열의 일치도가 가장 높은 "www. yahoo.com/Arts/"에 해당하는 번역 환경 B(예술 사전)가 자동선택된다. 또, 본 발명에 관한 컴퓨터·프로세스는, WWW 페이지의 다운 로드 작업의 완료 후, 혹은 다운 로드 작업에 병행하여 URL 문자열의 해석을 행하여도 좋다. 또는, 본 발명에 관한 컴퓨터·프로세스는, WWW 브라우저의 프록시 기능을 포함하여, WWW 페이지의 다운 로드 작업을 대행한다고 하는 실장 형태여도 좋다.
이어서, 번역 엔진은 선택된 번역 환경을 기초로, 다운 로드된 파일 중 외국어 텍스트를 모국어 텍스트로 번역 처리한다. 번역 처리 결과인 모국어 텍스트는, 예를 들면 WWW 브라우저에 전달되어 브라우저 화면 상에 표시된다. 이 때, 원래의 외국어 텍스트로 이루어지는 원문 윈도우와, 모국어 텍스트로 이루어지는 역문 윈도우를 한 화면 상에 동시 표시(대역 표시)하도록 하여도 좋다.
번역 결과가 브라우저 화면에 표시된 시점에서, 사용자는 역문 내용이 적당하지 않다고 판단하면, 다른 번역 환경으로 전환하여 다시 기계 번역하도록 하여도좋다. 또한, 데이타 베이스에 미등록의 URL 문자열에 대해 최적의 번역 환경이 발견될 때에, 데이타 베이스에 추가 등록하도록 하여도 좋다.
요컨대, 본 발명은, 인터넷 상의 WWW 서버에 의해서 제공된 WWW 페이지를 기계 번역할 때에, WWW 페이지의 어드레스인 URL의 문자열을 기초하여 번역 환경을 자동적으로 전환한다고 하는 기계 번역 방법 및 장치이다. 본 발명에 따르면 최적의 번역 환경을 선택하기 때문에, 번역 정밀도는 자연히 향상된다. 또한, 번역 환경의 전환·데이타 베이스의 등록 등의 처리를, URL 문자열이라고 하는 비교적 소용량의 데이타에만 기초하여 행하기 때문에 처리가 복잡하지 않고, 또한 시스템의 구축도 용이하다.
또, 기계 번역시에 복수의 번역 환경 중에서 원문 텍스트의 의도에 적합한 번역 환경을 선택한다고 하는 유형의 기술 자체는 본 출원 전에 이미 존재하고 있다(상술한 공개 특허 공보 참조). 단, 이들 기존 기술의 거의 대부분은, URL 문자열이 아니라, 원 텍스트의 내용을 해석한 결과를 참조하여 번역 환경을 선택하도록 되어 있다. 바꿔 말하면, 이들 기존 기술은 원문 텍스트를 해석한다고 하는 처리를 포함하고 있고, 구축·활용의 양면에서 복잡한 시스템이고, 본 발명과는 본질적으로 상위하다. 또한, 이들 기존 기술은 원래, WWW 페이지의 번역용으로 되어 있지 않다. 다른 견해를 보면, 본 발명과 이들 구성이 상위한 기존 기술을 공존시키는 것도 가능하다.
본 발명의 또 다른 목적, 특징이나 이점은, 후술하는 본 발명의 실시예나 첨부하는 도면에 기초하는 보다 상세한 설명에 의해서 명백히 될 것이다.
도 1은 본 발명을 실현하는데 알맞는 전형적인 컴퓨터·시스템(10)의 하드웨어 구성을 모식적으로 도시한 도면.
도 2는 본 발명에 의해서 제공되는 기계 번역 시스템의 시스템 구성을 모식적으로 도시한 도면.
도 3은 번역 환경 전환부(130)의 구성을 모식적으로 도시한 도면.
도 4는 URL 데이타 베이스(133)를 WWW 브라우저 화면 상에 표시한 모습을 도시한 도면.
도 5는 URL 데이타 베이스(133)를 WWW 브라우저 화면 상에 표시한 모습을 도시한 도면 (단, 도 4의 화면의 계속).
도 6은 URL 조합부(134)가 행하는 번역 환경의 선택 처리 루틴을 플로우차트화하여 도시한 도면.
도 7은 본 실시예에 따른 기계 번역 시스템(100)을 실장한 WWW 브라우저(150)의 화면을 예시한 도면.
도 8은 URL 데이타 베이스(133)의 추기(追記) 등록 수속 루틴을 플로우차트화하여도시한 도면.
<도면의 주요 부분에 대한 부호의 설명>
10 : 컴퓨터·시스템
11 : CPU
12 : 프로세서·버스
13, 19 : 브릿지 회로
14 : 메인·메모리
15 : L2-캐쉬
16 : PCI 버스
17 : ROM
18 : ISA 버스
20 : 비디오·컨트롤러
21 : VRAM
22 : 디스플레이
23 : HDD
24 : CD-ROM 드라이브
25 : 키 보드/마우스·컨트롤러
26 : 키 보드
27 : 마우스
28 : I/O 컨트롤러
29 : FDD
30 : 병렬·포트
31 : 프린터
32 : 직렬·포트
33 : 모뎀
34 : 오디오·컨트롤러
35 : 마이크
36 : 스피커
50 : 공중 회선
60 : 서버·머신(프로바이더)
70 : 인터넷
100 : 기계 번역 시스템
110 : 번역 프록시
120 : 번역 엔진
130 : 번역 환경 전환부
131 : URL 입력부
132 : 번역 환경 출력부
133 : URL 데이타 베이스
134 : URL 조합부
135 : 기본 조작부
150 : WWW 브라우저
이하, 도면을 참조하면서 본 발명의 실시예를 상세히 설명한다.
A. 하드웨어 환경
도 1에는, 본 발명을 실현하는데 알맞는 컴퓨터·시스템(10)의 하드웨어 구성을 모식적으로 도시하고 있다. 이하, 각부에 대해 설명한다.
메인·컨트롤러인 CPU(11)는, 오퍼레이팅·시스템(OS)의 제어하에서 각종 프로그램을 실행하도록 되어 있다. CPU(11)는, 예를 들면 미국 Intel사 제조의 "Pentium/1xxMHz"로 좋다. 또한, OS는 예를 들면 미국 IBM사의 "OS/2" ("OS/2"는 미국 IBM사의 상표)나 미국 MicroSoft사의 "Windows95"로 좋다.
CPU(11)는, 자신의 외부 핀에 직접연결된 프로세서·버스(12), 로컬·버스로서의 PCI(Peripheral Component lnterconnect)버스(16), 및 입출력 버스로서의 ISA (Industry Standard Architecture)버스(18)라고 하는 3계층의 버스를 통해 각 하드웨어·블럭과 상호 접속하고 있다.
프로세서·버스(12)와 PCI버스(16)와는, 브릿지 회로(호스트-PCI 브릿지: 13)에의해서 연락되어 있다. 본 실시예의 브릿지 회로(13)는, 메인·메모리(14)에의 억세스 동작을 제어하는 메모리·컨트롤러나, 양 버스(12, 16) 간의 속도차를 흡수하기 위한 데이타·버퍼 등을 포함한 구성으로 되어 있다.
메인·메모리(14)는, 실행 프로그램의 판독 영역으로서, 혹은 실행 프로그램의 작업 영역으로서 이용되며, 일반적으로는 복수의 DRAM(다이내믹 RAM) 칩으로 구성된다. 또한, L2-캐쉬(15)는, 빈번히 억세스되는 코드/데이타를 일시 저장하여, CPU(11)가 메인·메모리(14)에 억세스하는 시간을 흡수하기 위해서 설치된 고속 메모리이고, 일반적으로는 SRAM(스태틱 RAM)칩이 이용된다. 또한, ROM(17)은, 전원 투입시의 테스트·프로그램(POST)이나, 시스템(10) 내의 각 하드웨어를 조작하기위한 코드군을 항구적으로 저장하기 위한 불휘발성 메모리이다.
PCI 버스(16)는, 비교적 고속 데이타 전송이 가능한 버스(버스폭 32비트, 동작 주파수 33MHz, 최대 데이타 전송 속도 132KBps)이고, 비디오·컨트롤러(20)나 카드 버스·컨트롤러(도시하지 않음)와 같은 비교적 고속으로 동작하는 주변 디바이스류가 접속된다.
비디오·컨트롤러(20)는, CPU(11)로부터의 묘화 명령을 실제로 처리하기 위한 전용 컨트롤러이고, 처리한 묘화 정보를 화면 버퍼(VRAM: 21)에 일단 기록함과 동시에, VRAM(21)으로부터 묘화 정보를 판독하여 디스플레이(22)에 비디오 출력하도록 되어 있다.
PCI 버스(16)와 ISA 버스(18)와는, 브릿지 회로(PCI-ISA 브릿지: 19)에 의해 상호 접속되어 있다. 본 실시예의 브릿지 회로(19)는, DMA 컨트롤러나 프로그래머블 인터럽트 컨트롤러(PIC), 프로그래머블·인터벌·타이머(PIT)를 포함한 구성으로 되어 있다. 또한, 본 실시예의 브릿지 회로(19)는, IDE(Integrated Drive Electronics)에 준거한 외부 기억 장치류를 접속하기 위한 IDE 커넥터도 구비하고 있다. IDE 커넥터에는, 예를 들면 IDE 하드·디스크·드라이브(HDD: 23)나 IDE CD-ROM 드라이브(24)가 접속된다.
또, 상술한 2개의 브릿지 회로(13, 19)는 PCI에 의해서 작성된 사양에 준거하는 것으로, 일반적으로는 단일 칩셋트의 형태로 제공된다.
칩셋트의 일례는, 미국 Intel사가 시판하는 "Triton"이다.
ISA 버스(18)는, PCI 버스에 비해 데이타 전송 속도가 낮아서 (버스폭 16비트, 최대 데이타 전송 속도 4MBps), 키 보드/마우스·컨트롤러(KMC: 25)나 I/O 컨트롤러(25), 오디오·컨트롤러(34)와 같은 비교적 저속 구동하는 타입의 주변 디바이스류를 접속하는데 이용된다.
KMC(25)는, 키 보드(26)로부터의 입력 코드나, 마우스(27)로부터의 지시 좌표치를, 컴퓨터·데이타로서 버스(18) 상에 페치(fetch)하기 위한 전용 컨트롤러이다.
I/O 컨트롤러(28)는, 플로피·디스크·드라이브(FDD: 29)의 구동이나, 병렬·포트(30) 또는 직렬·포트(32)를 통한 병렬 혹은 직렬 데이타 전송 동작을 제어하기 위한 전용 컨트롤러이다. 일반적으로, 병렬·포트(30)에는 프린터(31)가, 직렬·포트(32)에는 모뎀(33)이, 각각 접속된다.
모뎀(33)은, 아날로그적인 일반 공중 회선(50)을 통해 데이타 교환을 행하기위한 기기이고, 컴퓨터·시스템(10) 내의 디지탈 신호를 아날로그 신호로 변조하여 회선(50) 상에 전송하거나, 반대로 회선(50) 경유로 수신한 아날로그 신호를 디지탈신호로 복조하여 컴퓨터·시스템(10) 내에 페치 기능을 가지고 있다. 본 실시예의 컴퓨터·시스템(10)은, 공중 회선(50) 경유로 서버·머신[(60): 보다 엄밀하게는 서버·머신(60)의 모뎀(도시하지 않음)]에 다이얼-업 접속하는 것이 가능하다. 여기서 말하는「 서버·머신」이란, 인터넷 접속 서비스를 제공하는「서비스·프로바이더」가 소유하는 서버·머신의 하나[예를 들면 시스템(10)의 사용자 측에 가장 가까운 서버·머신]이다. 서버·머신(60)은, 일반적으로는, 인터넷(70)에 상설되어 있고, 자신에게 다이얼-업한 컴퓨터·시스템(10)을 인터넷(70)에 IP 접속한다. 또, 서비스·프로바이더의 예는, 일본 IBM사의 「IBM 인터넷 접속 서비스」나, 벡고아메·인터넷의 「BEKKOAME/INTERNET」 등이다.
오디오·컨트롤러(34)는, 오디오 신호의 입출력 처리를 행하기 위한 전용 컨트롤러이고, 마이크(35)로부터 입력된 오디오 신호를 컴퓨터·데이타로서 페치하거나, 오디오·데이타를 DA 변환하여 스피커(36)로부터 오디오 출력하도록 되어 있다.
또, 현재 시판되고 있는 소위 퍼스널·컴퓨터는, 도 1에 도시한 컴퓨터·시스템(10)으로서 충분히 기능을 발휘할 것이다. 또, 컴퓨터·시스템(10)을 구성하기 위해서는, 도 1에 도시한 이외에도 많은 전기 회로 등이 필요하다. 단, 이들은 당업자에게 잘 알려져 있듯이, 본 발명의 요지를 구성하는 것은 아니므로, 본 명세서내에는 생략하고 있다.
B. 기계 번역 시스템
도 2에는, 본 발명에 의해 제공되는 기계 번역 시스템(100)의 시스템 구성을 모식적으로 도시하고 있다. 상기 기계 번역 시스템은, 실제로는 도 1에 도시한 바와 같은 컴퓨터·시스템(10) 상에서 실행되는 어플리케이션·프로그램 중 1개의 형태로 실현된다.
상기 기계 번역 시스템(100)은, 번역 프록시(110)와, 번역 엔진(120)과, 번역 환경 전환부(130)로 구성되며, 이들 각부와 WWW 브라우저(150)와의 협동적 동작에 의해, 기계 번역 프로세스가 적절하게 실현되도록 되어 있다.
WWW 브라우저(150)는, 인터넷·여행·가이드로서 작용하는 컴퓨터·프로그램이고, 컴퓨터·시스템(10)의 사용자에 대해 URL(Uniform Resource Locator) 즉 원하는 WWW 페이지의 어드레스를 입력하기 위한 사용자·인터페이스를 제공함과 동시에, WWW 페이지에 저장된 HTML 파일의 내용을 해석하여, 디스플레이(22) 상에 표시하도록 되어 있다. 본 실시예의 WWW 브라우저(150)는, 프록시 기능을 구비한 타입이다. 즉, WWW 브라우저(150)는, WWW 페이지 상의 파일의 다운 로드를 번역 프록시(110)에 의뢰함과 동시에, 번역 후의 텍스트·파일을 번역 프록시(110)로부터 수신하여, 화상 파일(예를 들면 GIF 파일) 등과 함께 디스플레이(22) 상에 표시하도록 되어 있다. WWW 브라우저(150)의 표시 형태로서, 예를 들면「원문만」, 「역문만」, 「대역 표시」 등의 각 표시 모드를 서포트하고 있다. 브라우저 화면 상에서 전환 가능하다. 또한, 브라우저 화면은 멀티 윈도우 중 1개의 윈도우라도 좋다(후술).
번역 프록시(110)는, WWW 브라우저(150)로부터의 요구에 따라서, URL로 지정된 WWW 페이지로부터 파일을 인터넷(70) 경유로 다운 로드함과 동시에, 다운 로드한 파일 중의 텍스트를 번역 엔진(120)으로 전달하고, 또한, 번역 엔진(120)으로부터 전달된 번역 처리 후의 역문 텍스트를 WWW 브라우저(150)로 전달하도록 되어 있다. 또, 「프록시」란, 직접 외부에 억세스할 수 없는 호스트의 대리(an agent for a host)이며 인터넷으로부터의 통신 데이타를 수신하는 등의 중계 기능의 총칭이다.
번역 엔진(120)은, 기계 번역 처리, 즉 원문(예를 들면 영어 등의 외국어 텍스트)을 역문(예를 들면 일본어 등의 모국어 텍스트)으로 번역하는 본체이고, 번역 프록시(110)로부터 수신한 원문 텍스트를 자신이 구비한 번역 환경을 이용하면서 번역처리하여, 처리 결과인 역문 텍스트를 번역 프록시(110)에 전달하도록 되어 있다. 본 실시예의 번역 엔진(120)은, 번역 환경 A, 번역 환경 B, 번역 환경 C … 등 복수의 번역 환경을 구비하고 있다. 여기서 말하는「번역 환경」이란, 번역 처리에 이용되는 사전 데이타 베이스나 문법 처리 알고리즘(예를 들면 문절의 설정이나 조동사 번역의 설정, 문체의 지정 등) 등의 것을 가리킨다. 원문 텍스트의 내용이 속하는 쟝르, 분야, 용도 등과 번역 환경과의 사이에 상관 관계가 있는 것은, 이미 일반적으로 인정되고 있는 바와 같다. 본 실시예에서는, 예를 들면, 인터넷 사전, 비즈니스 사전, 정치 사전, 오락 사전, 예술 사전, 스포츠 사전 등과 같이, 쟝르마다 전용의 사전데이타 베이스를 갖고 있다.
번역 환경 전환부(130)는, 번역 엔진(120)이 사용해야 할 번역 환경을 적절하게 전환하기 위한 것이다. 본 실시예에 관한 번역 환경 전환부(130)는, WWW 페이지의 어드레스인 URL이 프로토콜명, 서버명, 파일명이라고 하는 각 요소를 기술한 문자열(즉 「파셜 URL 문자열」)의 조합으로 구성된다고 하는 점에 착안하여 디자인된 것으로, WWW 브라우저(150)에 대해 입력된 URL 문자열에 기초하여 최적의 번역 환경을 자동 선택하도록 되어 있다.
도 3에는, 번역 환경 전환부(130)의 구성을 모식적으로 도시하고 있다. 동도에 도시한 바와 같이, 본 실시예의 번역 환경 전환부(130)는, URL 입력부(131)와, 번역 환경 출력부(132)와, URL 데이타 베이스(133)와, URL 조합부(134)와, 기본 조작부(135)로 세분화된다.
URL 데이타 베이스(133)는, 비교적 빈번하게 억세스되는 WWW 페이지의 URL 문자열과, 그 각각에 대해 알맞다고 간주되어 있는 번역 환경과의 대응 관계를 기술한 테이블이다.
도 4 및 도 5에는, URL 데이타 베이스(133)를 WWW 브라우저 화면 상에 표시한 모습을 도시하고 있다(단, 도 5는 도 4의 화면의 계속). 양 도면에 도시한 바와 같이, 비교적 빈번하게 억세스되는 각 WWW 서버/WWW 페이지의 URL 문자열은, 각각 최적의 번역 환경과 관련지어 데이타 베이스(133) 상에 등록되어 있다. 예를 들면, "www. ibm. com/"이나 "www. yahoo. com/"는 「인터넷 일반」이, 또한, "cnn. com/"은 「비즈니스」가, 각각 최적의 번역 환경으로서 등록되어 있다. 본 실시예의 URL 데이타 베이스(133)에는, 각 URL 문자열이 불규칙적으로 (즉 등록순 등에 따른 것 뿐이고, 알파벳이나 파셜 URL 문자열의 배열이나 갯수 등 어느 한쪽의 질서에도 따르지 않고)기술되어 있다.
URL 문자열과 최적의 번역 환경의 대응 관계로서 특징적인 점의 하나는, URL 문자열이 나타내는 WWW 서버명이 동일하더라도 지정된 파일이 다르면 최적의 번역 환경도 상위한 경우가 많이 있다고 하는 점이다. 예를 들면, 도 4 및 도 5에 도시한 바와 같이, "www. yahoo. com/"는 「인터넷 일반」이 최적 환경으로서 등록되어 있지만, 동일 WWW 서버 내에 있는 파일 "www. yahoo. com/ Government/"나 "www. yahoo. com/Recreation/Sports/", "www. yahoo. com/Arts/는 각각「정치」 및「스포츠」가 최적 환경으로서 등록되어 있다. 또한, 본 발명자등의 경험에 의하면, 동일 WWW 서버 내의 파일이라도, 「파셜 URL 문자열」 (즉 URL을 구성하는 문자열 중 "/"로 구획지어진 각 문자열)의 조합이 가장 유사한 파일끼리가 동일한 최적 환경을 공유하는 경향이 있다는 것은 이미 알 수 있다. 예를 들면 "www. yahoo. com/Arts/Architecture"라고 하는 URL 문자열로 지정되는 파일은, "www. yahoo. com/"보다도 파셜 URL 문자열의 일치도가 높은 "www. yahoo. com/Arts/"와 동일한「예술」을 알맞는 환경으로 하고 있다.
URL 데이타 베이스(133)에의 URL 문자열의 등록은, 예를 들면 기계 번역 시스템(100)의 설계자가 미리 행해도 좋다. 또한, 시스템(100)의 사용자가 기본 조작부(135)를 통해 추기(追記) 등록하도록 하여도 좋다(후술).
URL 입력부(131)는, WWW 브라우저 화면 상에서 입력된 URL 문자열을, 번역 프록시(110) 경유로 수신하여, URL 조합부(134)로 전달하도록 되어 있다. 또한, URL 조합부(134)는, 입력된 URL 문자열을 URL 데이타 베이스(133) 상에서 조합하여, 최적의 번역 환경을 발견해 내어 이것을 번역 환경 출력부(132) 경유로 번역 엔진(120)에 통지하도록 되어 있다.
C. 번역 환경의 선택 처리
URL 조합부(134)가 행하는 처리는, 요컨대, 입력된 URL 문자열에 가장 유사한 URL 문자열을 URL 데이타 베이스(133) 내에서 검색하고, 찾아 낸 URL 문자열에 대응하는 번역 환경을 번역 엔진(120)에 출력하는 것이다. 도 6에는, URL 조합부(134)가 행하는 번역 환경의 선택 처리 루틴을 플로우차트화하여도시하고 있다. 또, 상기 처리 루틴에 있어서, S는 WWW 브라우저 상에서 입력된 URL 문자열, i는 URL 데이타 베이스(133) 상의 인덱스, m은 검색 과정에서 지금까지의 가장 유사한 URL 문자열의 인덱스를 가리킨다. 예를 들면 배열 S(i)는 URL 데이타 베이스(133) 상의 i번째의 레코드에 등록된 URL 문자열을 나타낸다. 또한, 데이타 베이스 검색의 최종 결과가 m=M이면, URL 데이타 베이스(133) 상의 M번째의 URL 문자열 S(M)에 대응하는 번역 환경이 최적인 것을 나타낸다. 또한, 배열 E(m)은, URL 데이타 베이스(133) 상의 m번째의 레코드에 등록된 URL 문자열의 번역 환경을 도시한다.
상기 처리 루틴에서는, 우선, 각 인덱스에 초기치를 대입한다(스텝 S10). 인덱스 i의 초기치는, URL 데이타 베이스의 선두 레코드를 도시하는 1이고, 인덱스 m의 초기치는, 블랭크, 즉 유사한 URL 문자열이 아직 발견되지 않는 상태를 도시하는 0이다.
계속해서 스텝 S20에서는, 현재의 인덱스 i가 URL 데이타 베이스(133)의 최후의 레코드를 초과하고 있는지의 여부를 판단한다.
판단 블럭 S20의 결과가 부정적, 즉 미조합의 레코드가 URL 데이타 베이스(133)에 남아 있으면, 다음 스텝 S30에 있어서, 현재 입력 중의 URL 문자열 S가 i번째의 레코드에 관한 URL 문자열 S(i)를 파셜 URL 문자열로서 포함하는지의 여부를 판단한다(스텝 S30).
판단 블럭 S30의 결과가 부정적, 즉 URL 문자열 S(i)가 현재 입력 중의 URL 문자열 S에 유사하지 않다고 판단된 경우, 스텝 S70으로 점프한다. 스텝 S70에서는, URL 데이타 베이스(133)의 다음 레코드를 조합하도록, i를 1만큼 인크리멘트하여 스텝 S20으로 복귀한다.
한편, 판단 블럭 S30의 결과가 긍정적이고, 즉 URL 문자열 S(i)가 현재 입력중의 URL 문자열 S와 유사하다고 판단된 경우, 다음 스텝 S40으로 진행하여, m=0 즉 아직 유사한 URL 문자열이 발견되지 않는 상태인지의 여부를 판단한다. m=0이면, 이번에 조합된 URL 문자열을 일시 기억하도록, m에 i를 대입한다.
또한, 판단 블럭 S40에 있어서 m이 0이 아닌, 즉 유사한 URL 문자열이 이미 일시 기억되어 있는 상태이면, 다음 스텝 S50으로 진행하여, 이번 조합된 URL 문자열 S(i)와 이미 기억되어 있는 URL 문자열 S(m) 중 어느 하나가 현재 입력중인 URL 문자열 S와 유사한지를 비교한다. 상기 비교는, 문자열 S(i)와 S(m) 중 어느 한쪽이 연속된 보다 많은 파셜 URL 문자열을 포함하는지를 비교함으로써 행해진다. 예를 들면, "www. yahoo. com/"와 "www. yahoo. com/Arts/"이면, 전자는 1개, 후자는 2개의 파셜 URL 문자열로 구성되기 때문에, 후자쪽이 우수하다. 또, 「연속된 보다 많은 파셜 URL 문자열」이란, 보다 많은 파셜 URL 문자열이 일치하고 있더라도 파셜 URL 문자열의 배열이 일치하지 않으면, URL 조합 결과는 유사성이 낮은 것을 의미한다. 예를 들면 현재 입력 중의 URL 문자열이 "www. yahoo. com/Recreation/Sports/"이고, URL 데이타 베이스(133)에 이미 등록된 URL 문자열로서 "www. yahoo. com/Sports/" 및 "www. yahoo. com/Recreation/"의 2개가 있었다고 하면, 후자는 연속하는 2개의 파셜 URL 문자열이 일치하지만, 전자는 1개의 파셜 URL 문자열 밖에 일치하지 않는다("Sports"는 입력 URL 문자열 중에도 있지만, 배열이 일치하지 않으므로 카운트되지 않는다). 따라서, 후자의 URL 문자열 쪽이 우수하다고 하게 된다.
판단 블럭 S50에 있어서, 새롭게 조합된 URL 문자열 S(i)의 쪽이 우수하다고 판단되면, 다음 스텝 S60으로 진행하고, 가장 유사한 URL 문자열을 치환하도록, m에 i가 대입된다. 그러한 후, 다음 스텝 S70으로 진행한다. 또한, 판단 블럭 S50에 있어서, 이미 기억되어 있는 URL 문자열 S(m)의 쪽이 우수하다고 판단되면, 현재 m의 값을 유지하도록, 다음 스텝 S60을 스킵하여 스텝 S70으로 향한다.
스텝 S70에서는, URL 데이타 베이스(133)의 다음 레코드를 조합하도록, i를 1만큼 인크리멘트하여, 스텝 S20으로 복귀한다. 그리고, 스텝 S20에 있어서, 미조합의 레코드가 URL 데이타 베이스(133)에 남아 있으면, 상술한 스텝 S30 내지 S70의 처리를 반복한다. 한편, 스텝 S20에서, 현재의 인덱스 i가 URL 데이타 베이스(133)의 최후의 레코드를 초과하고 있다고 판단되면, 분기 "Yes"로 진행하여 스텝 S80으로 향한다.
스텝 S80에서는, 우선, m이 0인지의 여부를 조사한다. m=0은 상기 루프 S20 내지 S70에 있어서 현재 입력 중인 URL 문자열 S와 유사한 URL 문자열이 URL 데이타 베이스(133) 내에서 전혀 발견되지 않는 것을 의미한다. 이 경우에는, 디폴트 번역 환경을 번역 엔진(120)으로 출력하고(스텝 S90), 번역 환경의 선택처리 루틴을 종료한다.
한편, m≠0이면, 상기 루프 S20 내지 S70에 있어서 가장 유사하다고 판단된 URL 문자열에 관한 번역 환경 E(m)을 번역 엔진(120)으로 출력하고(스텝 S100), 번역 환경의 선택 처리 루틴을 종료한다. 번역 엔진(120)은 선택된 번역 환경 E(m)을 이용하여 다운 로드·파일을 번역 처리한다.
D. URL 데이타 베이스의 갱신
URL 데이타 베이스(133)의 내용이 기본 조작부(135)를 통해 추기 등록된다고 하는 점은 이미 설명하였다. 이 항에서는, URL 데이타 베이스(133)의 추기 등록 수속에 대해 간단히 설명한다.
도8에는, URL 데이타 베이스(133)의 추기 등록 수속 루틴을 플로우차트화하여 도시하고 있다. 우선, WWW 브라우저 화면 상에 역문 텍스트를 표시하여, 이것을 보고 번역 내용에 만족하는지, 즉 최적의 번역 환경이 선택되어 있는지의 여부를, 사용자에게 판단을 요청한다(스텝 S200).
판단 블럭 S200의 결과가 부정적이면, 추가 등록의 필요가 없기 때문에, 후속의 스텝을 전부 스킵하여, 처리 루틴을 종료한다.
한편, 판단 블럭 S200의 결과가 긍정적이면, 새롭게 입력된 URL 문자열 S와 최적의 번역 환경 E(m)과의 관계를 URL 데이타 베이스(133)에 추가 등록해야 하는지의 여부를, 사용자의 판단을 요청한다(스텝 S210). 여기서, 사용자는, 새롭게 입력된 URL 문자열 S의 금후의 사용 빈도 등을 바탕으로 등록의 시비를 판단한다.
판단 블럭 S210의 결과가 긍정적이면, URL 데이타 베이스(133)에 신규 등록하여(스텝 S220), 처리 루틴을 종료한다. 또한, 판단 블럭 S210의 결과가 부정적이면, 다음 스텝 S220을 스킵하여, 처리 루틴을 종료한다.
E. 브라우저 화면
여기서, 본 실시예에 관한 기계 번역 시스템(100)을 실장한 WWW 브라우저(150)의 화면을, 도 7에 예시하여 놓는다. 동도의 화면은, 원문 텍스트의 바로 아래 행에 역문 텍스트를 열기한「대역 표시」 모드이지만, WWW 브라우저 화면 상에서 「원문만」 또는「역문만」 등의 다른 표시 모드로 전환 가능하다. 또한, WWW 브라우저 화면은 디스플레이(22) 상의 멀티 윈도우의 1개의 윈도우라도 좋다.
WWW 브라우저 화면에는, 최상단에서부터, 「타이틀·바」, 「메뉴·바」, 「툴·바」가 설치된다. 타이틀·바는 기동 화면의 어플리케이션명을 표시한 영역이고, 메뉴·바는 선택 가능한 처리 커맨드를 일람표 도시한 영역이다(주지). 또한, 툴·바는, 빈번하게 이용하는 기능을 신속하게 기동하기 위한 버튼을 배열한 메뉴·바의 일종이고, 「스마트·아이콘」이라고도 한다 (주지).
툴·바의 바로 아래에는, URL 입력부가 설치된다. 사용자는, URL 문자열을 URL 입력부에 입력함으로써 원하는 억세스처의 WWW 페이지를 지정할 수 있다. 동도에서는, URL명 "www. yahoo. com/"가 입력되어 있다.
입력된 URL 문자열은, 번역 프록시(110)로 전달된다. 번역 프록시(110)는, WWW 브라우저(150)의 대리이며, 지정된 WWW 페이지로부터 파일을 다운 로드함과 동시에, 파일 중의 원문 텍스트를 번역 엔진(120)에 일단 인도한다. 또한, 입력된 URL 문자열은, 번역 프록시(110) 경유로 번역 환경 전환부(130)로 전돨된다. 번역환경 전환부(130)는, 수신한 URL 문자열을 해석하여 최적의 번역 환경을 선택하고, 이것을 번역 엔진(120)에 통지한다. 또한, 번역 엔진(120)은, 선택된 번역 환경을 이용하여 원문 텍스트를 번역 처리하고, 원문 텍스트와 역문 텍스트를 번역 프록시(110) 경유로 WWW 브라우저(150)로 전달한다. 이들 일련의 처리는 데스크탑의 배경에서 행해진다.
URL 입력부의 하측의, 브라우저 화면의 대부분을 차지하는 구형 영역은, WWW 브라우저 화면 본체이고, 다운 로드된 WWW 페이지의 내용이 표시되어 있다. 동도에서는, URL명에 의해서 지정된 "www. yahoo. com/" 페이지의 화면이 표시되어 있다.
WWW 브라우저 화면 본체의 최상단에는, 현재의 표시 모드나 선택된 번역환경을 표시하기 위한 인디케이터부가 설치된다. 동도에서는, 표시 모드로서 설정된 「대역」 모드가 강조 표시되어 있고, 따라서, 브라우저 화면 내에서는 원문 텍스트의 바로 아래 행에 역문 텍스트가 열기되어 있다. 또한, 도 4에 도시한 바와 같이, URL 데이타 베이스(133)에는 "www. yahoo. com/"의 최적 환경은 「인터넷 일반」이라고 등록되어 있기 때문에, 인디케이터부에는 그 취지가 표시되어 있다. 또, 사용자는, 인디케이터부를 마우스(27)로 클릭 조작함으로써, 표시 모드나 사용된 번역 환경을 동적으로 전환하는 것도 가능하다.
F. 추보(追補)
이상, 특정한 실시예를 참조하면서 본 발명에 대해 상세히 설명해 왔다. 그러나, 본 발명의 요지를 일탈하지 않는 범위에서 당업자가 상기 실시예의 수정이나 대용을 할 수 있는 것은 자명하다. 예를 들면 기계 번역 시스템은, WWW 브라우저의 프록시 기능을 이용한 타입일 필요는 없고, WWW 브라우저 화면 상의 원문을 클립보드 경유로 수신하여 번역 처리하는 타입으로 해도 좋다. 즉, 예시라는 형태로 본 발명을 개시하여 온 것이므로, 한정적으로 해석되어야 할 것은 아니다. 본 발명의 요지를 판단하기 위해서는, 특허 청구의 범위란을 참작해야 한다.
이상 상술한 바와 같이, 본 발명에 의하면 복수의 번역 환경을 구비한 번역시스템을 이용하여, 외국어 텍스트 (예를 들면 영어 텍스트)를 모국어 텍스트 (예를 들면 일본어, 혹은 한국어나 중국어 등)로 번역할 수 있는, 우수한 기계 번역 방법 및 장치를 제공할 수 있다.
또한, 본 발명에 의하면, 외국어 텍스트를 모국어 텍스트로 번역할 때에, 처리 대상의 외국어 텍스트에 최적의 번역 환경을 선택하여 번역 처리하는, 우수한 기계 번역 방법 및 장치를 제공할 수 있다.
또한, 본 발명에 의하면, 복수의 번역 환경을 구비한 번역 시스템을 이용하여, 인터넷 상의 WWW 서버에 의해 제공된 WWW 페이지 중의 외국어 텍스트를 모국어 텍스트로 적절하게 번역할 수 있는, 우수한 기계 번역 방법 및 장치를 제공할 수 있다.

Claims (10)

  1. 요청된 웹 페이지(Web page) - 상기 요청된 웹 페이지는 상기 웹 페이지를 요청하는 클라이언트로부터 원격지에 위치된 서버 내에 저장되어 있고, 상기 요청된 웹 페이지는 상기 요청하는 클라이언트에 의해 제1 랭귀지로 표시되도록 구성됨- 를 상기 제1 랭귀지에서 제2 랭귀지로 자동 번역하는 방법에 있어서,
    상기 웹 페이지에 대한 요청- 상기 웹 페이지 요청은 상기 서버 상의 상기 웹 페이지에 대한 경로를 식별하는 범용 자원 로케이터(Universal Resource Locator; 이하 URL이라 함)를 포함하고, 상기 URL의 적어도 일부는 번역 환경 환경과 연관됨-을 통신 네트워크를 통해 상기 클라이언트로부터 상기 서버에 전송하는 단계,
    상기 전송된 URL과 연관된 번역 환경을 식별하는 단계,
    복수의 번역 환경으로부터 상기 식별된 번역 환경을 선택하는 단계, 및
    상기 요청하는 클라이언트에 상기 요청된 웹 페이지를 서빙하기 전에, 상기 요청된 웹 페이지를 상기 선택된 번역 환경을 사용하여 상기 제1 랭귀지에서 상기 제2 랭귀지로 번역하는 단계
    를 포함하는 자동 번역 방법.
  2. 제1항에 있어서, 상기 번역 환경과 연관된 상기 URL의 상기 적어도 일부는 적어도 하나의 문자열(character string)을 포함하는 자동 번역 방법.
  3. 제1항에 있어서, 상기 요청된 웹 페이지를 클라이언트 표시 화면 상에 상기 제2 랭귀지로 표시하는 단계를 더 포함하는 자동 번역 방법.
  4. 제3항에 있어서, 상기 요청된 웹 페이지를 상기 클라이언트 표시 화면 상에 상기 제1 랭귀지 및 제2 랭귀지 둘다로 표시하는 단계를 더 포함하는 자동 번역 방법.
  5. 제1항에 있어서, 상기 URL을 식별하는 단계는 번역 환경과 연관된 상기 URL의 상기 적어도 일부와 유사한 저장된 문자열을 위치지정하는 단계를 포함하는 자동 번역 방법.
  6. 제5항에 있어서, 상기 식별된 번역 환경을 선택하는 단계는 상기 저장된 문자열에 링크된 번역 환경을 선택하는 단계를 포함하는 자동 번역 방법.
  7. 제1항에 있어서,
    제2 번역 환경을 선택하는 단계,
    상기 요청된 웹 페이지를 상기 제2 번역 환경을 사용하여 상기 제2 랭귀지에서 제3 랭귀지로 번역하는 단계, 및
    상기 요청된 웹 페이지를 상기 클라이언트 표시 화면 상에 상기 제3 랭귀지로 표시하는 단계
    를 더 포함하는 자동 번역 방법.
  8. 제7항에 있어서, 상기 전송된 URL과 상기 선택된 제3 번역 환경과의 사이에 링크를 설치하는 단계를 더 포함하는 자동 번역 방법.
  9. 요청된 웹 페이지 - 상기 요청된 웹 페이지는 상기 웹 페이지를 요청하는 클라이언트로부터 원격지에 위치된 서버 내에 저장되어 있고, 상기 요청된 웹 페이지는 상기 요청하는 클라이언트에 의해 제1 랭귀지로 표시되도록 구성됨- 를 상기 제1 랭귀지에서 제2 랭귀지로 자동 번역하는 데이타 처리 시스템에 있어서,
    상기 웹 페이지에 대한 요청- 상기 웹 페이지 요청은 상기 서버 상의 상기 웹 페이지에 대한 경로를 식별하는 URL을 포함하고, 상기 URL의 적어도 일부는 번역 환경 환경과 연관됨 -을 통신 네트워크를 통해 상기 클라이언트로부터 상기 서버에 전송하는 수단,
    상기 전송된 URL과 연관된 번역 환경을 식별하는 수단,
    복수의 번역 환경으로부터 상기 식별된 번역 환경을 선택하는 수단, 및
    상기 요청하는 클라이언트에 상기 요청된 웹 페이지를 서빙하기 전에, 상기 요청된 웹 페이지를 상기 요청된 웹 페이지를 상기 선택된 번역 환경을 사용하여 상기 제1 랭귀지에서 상기 제2 랭귀지로 번역하는 수단
    을 포함하는 데이타 처리 시스템.
  10. 제9항에 있어서,
    제2 번역 환경을 선택하는 수단,
    상기 선택 수단에 응답하여, 상기 요청된 웹 페이지를 상기 제2 번역 환경을 사용하여 상기 제2 랭귀지에서 제3 랭귀지로 번역하는 수단, 및
    상기 요청된 웹 페이지를 상기 클라이언트 표시 화면 상에 상기 제3 랭귀지로 표시하는 수단
    을 더 포함하는 데이타 처리 시스템.
KR1019970040395A 1996-10-15 1997-08-23 기계번역방법및장치 KR100265548B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP08272755A JP3121548B2 (ja) 1996-10-15 1996-10-15 機械翻訳方法及び装置
JP96-272755 1996-10-15

Publications (2)

Publication Number Publication Date
KR19980032309A KR19980032309A (ko) 1998-07-25
KR100265548B1 true KR100265548B1 (ko) 2000-09-15

Family

ID=17518307

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970040395A KR100265548B1 (ko) 1996-10-15 1997-08-23 기계번역방법및장치

Country Status (7)

Country Link
US (1) US6119078A (ko)
JP (1) JP3121548B2 (ko)
KR (1) KR100265548B1 (ko)
CN (1) CN1148685C (ko)
GB (1) GB2320773A (ko)
SG (1) SG54551A1 (ko)
TW (1) TW315437B (ko)

Families Citing this family (158)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6044205A (en) * 1996-02-29 2000-03-28 Intermind Corporation Communications system for transferring information between memories according to processes transferred with the information
US6122666A (en) * 1998-02-23 2000-09-19 International Business Machines Corporation Method for collaborative transformation and caching of web objects in a proxy network
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US10541974B2 (en) * 1998-02-23 2020-01-21 Transperfect Global, Inc. Intercepting web server requests and localizing content
US6272531B1 (en) * 1998-03-31 2001-08-07 International Business Machines Corporation Method and system for recognizing and acting upon dynamic data on the internet
GB2337611A (en) 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
US7191393B1 (en) * 1998-09-25 2007-03-13 International Business Machines Corporation Interface for providing different-language versions of markup-language resources
US6738827B1 (en) 1998-09-29 2004-05-18 Eli Abir Method and system for alternate internet resource identifiers and addresses
US6370532B1 (en) * 1998-11-09 2002-04-09 Unisys Corporation Cool ICE batch interface
US6374247B1 (en) * 1998-11-09 2002-04-16 Unisys Corporation Cool ice service templates
US6490550B1 (en) * 1998-11-30 2002-12-03 Ericsson Inc. System and method for IP-based communication transmitting speech and speech-generated text
US6347316B1 (en) * 1998-12-14 2002-02-12 International Business Machines Corporation National language proxy file save and incremental cache translation option for world wide web documents
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
JP2000276431A (ja) * 1999-03-25 2000-10-06 Nec Corp 翻訳機能付きプロキシキャッシュサーバ及びそれを有する翻訳機能付きブラウジング・システム
US6654741B1 (en) * 1999-05-03 2003-11-25 Microsoft Corporation URL mapping methods and systems
US7607085B1 (en) * 1999-05-11 2009-10-20 Microsoft Corporation Client side localizations on the world wide web
JP3664917B2 (ja) * 1999-08-06 2005-06-29 シャープ株式会社 ネットワーク情報の表示方法およびその方法をプログラムとして格納した記憶媒体ならびにそのプログラムを実行するコンピュータ
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
US6957247B1 (en) * 1999-09-22 2005-10-18 Ates Gorkem I Internet system
US7478035B1 (en) * 1999-11-02 2009-01-13 Eclarity, Inc. Verbal classification system for the efficient sending and receiving of information
US6950881B1 (en) * 1999-11-02 2005-09-27 Mshift, Inc. System for converting wireless communications for a mobile device
US7039722B1 (en) * 1999-11-12 2006-05-02 Fuisz Richard C Method and apparatus for translating web addresses and using numerically entered web addresses
US7107325B1 (en) 1999-11-15 2006-09-12 Insweb Corporation System and method for optimizing and processing electronic pages in multiple languages
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system
US7225181B2 (en) * 2000-02-04 2007-05-29 Fujitsu Limited Document searching apparatus, method thereof, and record medium thereof
US9614934B2 (en) 2000-02-29 2017-04-04 Paypal, Inc. Methods and systems for harvesting comments regarding users on a network-based facility
US7216072B2 (en) * 2000-02-29 2007-05-08 Fujitsu Limited Relay device, server device, terminal device, and translation server system utilizing these devices
KR20010085157A (ko) * 2000-02-29 2001-09-07 박종득 인터넷에서 단어,철자를 조합하여 일기,편지등의문장,글을 한글로 쓰면 외국어로 실시간 번역을 하고,외국어를 한글로 혹은 외국어를 다른 외국어로 실시간통,번역해주는 시스템
US6415249B1 (en) * 2000-03-01 2002-07-02 International Business Machines Corporation Method and system for using machine translation with content language specification
AU2001245481A1 (en) * 2000-03-07 2001-09-17 Hotlens.Com Inc. Server-side web browsing and multiple lens system, method and apparatus
KR20000036408A (ko) * 2000-03-07 2000-07-05 손상범 일대일 대응 방식을 이용한 인터넷 브라우저상의자국어/기준어 도메인 문자 전환 알고리즘.
AU2001247591A1 (en) * 2000-03-20 2001-10-03 Hotlens.Com Inc. Transparent user and session management for web applications
WO2001075662A2 (en) * 2000-03-31 2001-10-11 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
US6604101B1 (en) 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
US20040006560A1 (en) * 2000-05-01 2004-01-08 Ning-Ping Chan Method and system for translingual translation of query and search and retrieval of multilingual information on the web
AU2001261636A1 (en) * 2000-05-16 2001-11-26 Mshift, Inc. System for providing network content to wireless devices
US7013340B1 (en) 2000-05-18 2006-03-14 Microsoft Corporation Postback input handling by server-side control objects
KR100373899B1 (ko) * 2000-05-23 2003-02-26 주식회사 시스메타 암호화된 데이터 처리 방법 및 시스템
WO2001093089A1 (en) * 2000-05-26 2001-12-06 Theone.Com System and method for providing interactive translation of information in a communication network
US20010054011A1 (en) * 2000-06-15 2001-12-20 Nec Corporation Contents conversion fee charging system, contents conversion fee charging method and storage medium storing program for controlling same
US6704776B1 (en) * 2000-06-30 2004-03-09 Webtv Networks, Inc. Selecting attribute based content for server applications
JP3982736B2 (ja) * 2000-06-30 2007-09-26 沖電気工業株式会社 翻訳システム
WO2002003270A1 (fr) * 2000-07-04 2002-01-10 Aai Inc. Dispositif et procede commerciaux, systeme, et support enregistre
US7389221B1 (en) * 2000-07-17 2008-06-17 Globalenglish Corporation System and method for interactive translation
US7266512B2 (en) 2000-07-18 2007-09-04 Cnet Networks, Inc. System and method for establishing business to business connections via the internet
JP2002041432A (ja) * 2000-07-25 2002-02-08 Oki Electric Ind Co Ltd チャットシステム,端末装置,サーバ装置及び媒体
US7571217B1 (en) 2000-08-16 2009-08-04 Parallel Networks, Llc Method and system for uniform resource locator transformation
US20020049831A1 (en) * 2000-09-01 2002-04-25 Lifefiles.Com,Inc. System for generating a web document
US8806326B1 (en) * 2000-09-25 2014-08-12 Nokia Inc. User preference based content linking
US20020161928A1 (en) * 2000-10-10 2002-10-31 Awele Ndili Smart agent for providing network content to wireless devices
EP1202188A3 (en) * 2000-10-31 2003-09-10 Mishou Co., Ltd. Server devices for displaying web pages
US20020087302A1 (en) * 2000-11-10 2002-07-04 Miyuki Tomaru Processing system, processing method and recording medium
US20020078152A1 (en) * 2000-12-19 2002-06-20 Barry Boone Method and apparatus for providing predefined feedback
US20030115040A1 (en) * 2001-02-09 2003-06-19 Yue Xing International (multiple language/non-english) domain name and email user account ID services system
US20020123879A1 (en) * 2001-03-01 2002-09-05 Donald Spector Translation system & method
JP3379090B2 (ja) * 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US7380250B2 (en) 2001-03-16 2008-05-27 Microsoft Corporation Method and system for interacting with devices having different capabilities
US8298160B2 (en) * 2001-03-16 2012-10-30 Ev3 Inc. Wire convertible from over-the-wire length to rapid exchange length
US20060288212A1 (en) * 2001-03-20 2006-12-21 Gutenberg Printing Llc Transparent user and session management for web applications
US6993474B2 (en) 2001-05-17 2006-01-31 Curry David G Interactive conversational speech communicator method and system
US20020174150A1 (en) * 2001-05-18 2002-11-21 Xerox Corporation Systems and methods for dynamic national language service
US7493397B1 (en) 2001-06-06 2009-02-17 Microsoft Corporation Providing remote processing services over a distributed communications network
US6915454B1 (en) 2001-06-12 2005-07-05 Microsoft Corporation Web controls validation
US20030036976A1 (en) * 2001-08-14 2003-02-20 Kurt De Ruwe System and method for providing business transaction information in multiple languages
US7146358B1 (en) 2001-08-28 2006-12-05 Google Inc. Systems and methods for using anchor text as parallel corpora for cross-language information retrieval
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP4283466B2 (ja) * 2001-10-12 2009-06-24 富士通株式会社 リンク関係に基づく文書整理方法
US20030084143A1 (en) * 2001-10-31 2003-05-01 Herbert Knoesel Resource locator management system and method
US7428725B2 (en) 2001-11-20 2008-09-23 Microsoft Corporation Inserting devices specific content
US6915341B2 (en) * 2002-01-08 2005-07-05 International Business Machines Corporation System for sending messages to all users in a web hosting environment
US20030144912A1 (en) * 2002-01-29 2003-07-31 Mcgee Todd Multilingual messaging system and method for e-commerce
US7987421B1 (en) * 2002-01-30 2011-07-26 Boyd H Timothy Method and apparatus to dynamically provide web content resources in a portal
US7890639B1 (en) 2002-01-30 2011-02-15 Novell, Inc. Method and apparatus for controlling access to portal content from outside the portal
JP3809863B2 (ja) * 2002-02-28 2006-08-16 インターナショナル・ビジネス・マシーンズ・コーポレーション サーバ
US7548847B2 (en) * 2002-05-10 2009-06-16 Microsoft Corporation System for automatically annotating training data for a natural language understanding system
US7490167B2 (en) * 2002-05-22 2009-02-10 Sony Corporation System and method for platform and language-independent development and delivery of page-based content
US20040003022A1 (en) * 2002-06-27 2004-01-01 International Business Machines Corporation Method and system for using modulo arithmetic to distribute processing over multiple processors
US7113960B2 (en) * 2002-08-22 2006-09-26 International Business Machines Corporation Search on and search for functions in applications with varying data types
US20040049374A1 (en) * 2002-09-05 2004-03-11 International Business Machines Corporation Translation aid for multilingual Web sites
US7236977B1 (en) 2002-09-20 2007-06-26 Novell, Inc. Method for dynamically distributing items for changes based on group membership
US7574653B2 (en) * 2002-10-11 2009-08-11 Microsoft Corporation Adaptive image formatting control
GB2395029A (en) * 2002-11-06 2004-05-12 Alan Wilkinson Translation of electronically transmitted messages
US7660843B1 (en) 2003-01-21 2010-02-09 Novell, Inc. Method and apparatus for dynamically delivering a gadget
FR2850473A1 (fr) * 2003-01-28 2004-07-30 France Telecom Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
US7627479B2 (en) 2003-02-21 2009-12-01 Motionpoint Corporation Automation tool for web site content language translation
CN104735195A (zh) * 2003-03-08 2015-06-24 任文林 多功能通讯装置
CN104836902A (zh) * 2003-03-08 2015-08-12 任文林 一种多功能通讯装置
US8170863B2 (en) * 2003-04-01 2012-05-01 International Business Machines Corporation System, method and program product for portlet-based translation of web content
US7313587B1 (en) 2003-07-14 2007-12-25 Microsoft Corporation Method and apparatus for localizing Web applications
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US7496497B2 (en) * 2003-12-18 2009-02-24 Taiwan Semiconductor Manufacturing Co., Ltd. Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
US7543270B1 (en) * 2004-01-23 2009-06-02 The Math Works, Inc. Tracing output descriptions generated from corresponding input descriptions
US20050198573A1 (en) * 2004-02-24 2005-09-08 Ncr Corporation System and method for translating web pages into selected languages
US7890604B2 (en) 2004-05-07 2011-02-15 Microsoft Corproation Client-side callbacks to server events
US9026578B2 (en) 2004-05-14 2015-05-05 Microsoft Corporation Systems and methods for persisting data between web pages
US7464386B2 (en) 2004-05-17 2008-12-09 Microsoft Corporation Data controls architecture
US7562008B2 (en) * 2004-06-23 2009-07-14 Ning-Ping Chan Machine translation method and system that decomposes complex sentences into two or more sentences
US7853473B2 (en) 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
US7509318B2 (en) * 2005-01-28 2009-03-24 Microsoft Corporation Automatic resource translation
US8219907B2 (en) * 2005-03-08 2012-07-10 Microsoft Corporation Resource authoring with re-usability score and suggested re-usable data
US20060206797A1 (en) * 2005-03-08 2006-09-14 Microsoft Corporation Authorizing implementing application localization rules
WO2006098019A1 (ja) * 2005-03-16 2006-09-21 Visionarts, Inc. メニューバープログラム
US8249854B2 (en) * 2005-05-26 2012-08-21 Microsoft Corporation Integrated native language translation
US7543189B2 (en) * 2005-06-29 2009-06-02 International Business Machines Corporation Automated multilingual software testing method and apparatus
US20070088732A1 (en) * 2005-10-13 2007-04-19 Yen-Fu Chen Dynamic string length checking for off-line processing using client-side caching of database catalog
US7603365B2 (en) * 2005-10-13 2009-10-13 International Business Machines Corporation System and method for capture and processing of overflow characters from user input
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US7822596B2 (en) * 2005-12-05 2010-10-26 Microsoft Corporation Flexible display translation
WO2007124109A2 (en) * 2006-04-21 2007-11-01 Scomm, Inc. Interactive conversational speech communicator method and system
US7801721B2 (en) * 2006-10-02 2010-09-21 Google Inc. Displaying original text in a user interface with translated text
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US20080178081A1 (en) * 2007-01-22 2008-07-24 Eran Reshef System and method for guiding non-technical people in using web services
US20090287514A1 (en) * 2007-03-16 2009-11-19 Alliance Of Professionals & Consultants, Inc. Rapid candidate opt-in confirmation system
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
US9201870B2 (en) * 2008-01-25 2015-12-01 First Data Corporation Method and system for providing translated dynamic web page content
US7698688B2 (en) * 2008-03-28 2010-04-13 International Business Machines Corporation Method for automating an internationalization test in a multilingual web application
CN101615181B (zh) * 2008-06-27 2012-05-16 国际商业机器公司 创建国际化网络应用的***和方法
EP2150008B1 (en) * 2008-08-01 2012-02-01 Research In Motion Limited Electronic mail system providing message character set formatting features and related methods
CN101661480B (zh) * 2008-08-29 2012-08-08 国际商业机器公司 确定组织在不同语言中的名称的方法和***
KR101579978B1 (ko) * 2009-03-10 2015-12-24 엘지전자 주식회사 웹페이지 표시방법 및 이를 적용한 이동 통신 단말기
AU2009342361A1 (en) * 2009-03-18 2011-10-06 Google Inc. Web translation with display replacement
US10671698B2 (en) 2009-05-26 2020-06-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US9405745B2 (en) * 2009-06-01 2016-08-02 Microsoft Technology Licensing, Llc Language translation using embeddable component
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
RU2009144948A (ru) * 2009-12-03 2011-06-10 Виталий Евгеньевич Пилкин (RU) Система улучшения автоматизированного перевода информации
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8280954B2 (en) 2010-03-25 2012-10-02 Scomm, Inc. Method and system for providing live real-time communication via text between mobile user devices
US9356991B2 (en) * 2010-05-10 2016-05-31 Litera Technology Llc Systems and methods for a bidirectional multi-function communication module
US8635205B1 (en) * 2010-06-18 2014-01-21 Google Inc. Displaying local site name information with search results
US9864809B2 (en) 2010-07-13 2018-01-09 Motionpoint Corporation Dynamic language translation of web site content
US20120072831A1 (en) * 2010-09-16 2012-03-22 Gemtek Technology Co., Ltd Method for creating a multi-lingual web page
JP5908213B2 (ja) * 2011-02-28 2016-04-26 ブラザー工業株式会社 通信装置
US8843360B1 (en) * 2011-03-04 2014-09-23 Amazon Technologies, Inc. Client-side localization of network pages
CN102722479B (zh) * 2011-03-30 2015-11-04 腾讯科技(深圳)有限公司 一种实现语言翻译的方法及装置
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
KR101732515B1 (ko) 2011-05-05 2017-05-24 야픈 코포레이션 근접한 모바일 디바이스 간의 교차언어 통신
CN102811140B (zh) 2011-05-31 2015-04-08 国际商业机器公司 测试基于浏览器的应用的方法和***
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
WO2013086666A1 (en) * 2011-12-12 2013-06-20 Google Inc. Techniques for assisting a human translator in translating a document including at least one tag
US8942973B2 (en) * 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
CN102662935A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种交互式的机器翻译方法和机器翻译***
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
JP2014059766A (ja) * 2012-09-18 2014-04-03 Sharp Corp 画像処理装置、画像形成装置、プログラム、記録媒体
JP5708608B2 (ja) * 2012-10-04 2015-04-30 コニカミノルタ株式会社 ブラウザプログラム
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9342503B1 (en) * 2013-03-12 2016-05-17 Amazon Technologies, Inc. Correlation across languages
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9639526B2 (en) * 2014-01-10 2017-05-02 Microsoft Technology Licensing, Llc Mobile language translation of web content
US20160004697A1 (en) * 2014-07-05 2016-01-07 Maurice H.P.M. van Putten Bilingual Search Engine for Mobile Devices
WO2016018004A1 (en) 2014-07-31 2016-02-04 Samsung Electronics Co., Ltd. Method, apparatus, and system for providing translated content
US10380656B2 (en) 2015-02-27 2019-08-13 Ebay Inc. Dynamic predefined product reviews
CN105760542B (zh) * 2016-03-15 2022-07-29 腾讯科技(深圳)有限公司 一种显示控制方法、终端及服务器
EP3441887B1 (en) * 2016-04-04 2023-06-07 Wovn Technologies, Inc. Translation system
CN108345589A (zh) * 2017-11-22 2018-07-31 语联网(武汉)信息技术有限公司 一种全原文参考的在线翻译方法
CN107943797A (zh) * 2017-11-22 2018-04-20 语联网(武汉)信息技术有限公司 一种全原文参考的在线翻译***
US11258872B1 (en) * 2020-12-10 2022-02-22 Amazon Technologie, Inc. Techniques for accelerating page rendering

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03268062A (ja) * 1990-03-19 1991-11-28 Fujitsu Ltd 機械翻訳電子メール装置における私用単語の登録装置
US5175684A (en) * 1990-12-31 1992-12-29 Trans-Link International Corp. Automatic text translation and routing system
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
JPH0668144A (ja) * 1992-08-14 1994-03-11 Fujitsu Ltd 電子ニュース翻訳配送装置
US5568383A (en) * 1992-11-30 1996-10-22 International Business Machines Corporation Natural language translation system and document transmission network with translation loss information and restrictions
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
JPH0981569A (ja) * 1995-09-12 1997-03-28 Hitachi Ltd 多カ国対応サービス提供システム
US5764906A (en) * 1995-11-07 1998-06-09 Netword Llc Universal electronic resource denotation, request and delivery system
US5987401A (en) * 1995-12-08 1999-11-16 Apple Computer, Inc. Language translation for real-time text-based conversations
US5944790A (en) * 1996-07-19 1999-08-31 Lucent Technologies Inc. Method and apparatus for providing a web site having a home page that automatically adapts to user language and customs
US5884246A (en) * 1996-12-04 1999-03-16 Transgate Intellectual Properties Ltd. System and method for transparent translation of electronically transmitted messages

Also Published As

Publication number Publication date
GB2320773A (en) 1998-07-01
JPH10134052A (ja) 1998-05-22
US6119078A (en) 2000-09-12
SG54551A1 (en) 1998-11-16
CN1179576A (zh) 1998-04-22
TW315437B (en) 1997-09-11
JP3121548B2 (ja) 2001-01-09
GB9721481D0 (en) 1997-12-10
CN1148685C (zh) 2004-05-05
KR19980032309A (ko) 1998-07-25

Similar Documents

Publication Publication Date Title
KR100265548B1 (ko) 기계번역방법및장치
US5745360A (en) Dynamic hypertext link converter system and process
US6381593B1 (en) Document information management system
US7058626B1 (en) Method and system for providing native language query service
US6564254B1 (en) System and a process for specifying a location on a network
KR100815215B1 (ko) 웹사이트 통합 검색 장치 및 방법
US6338059B1 (en) Hyperlinked search interface for distributed database
US20010021934A1 (en) Processing device for searching information in one language using search query in another language, and recording medium and method thereof
US20100017464A1 (en) Web page content translator
US20030029911A1 (en) System and method for converting digital content
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
US20020111788A1 (en) Translation server, translation method and program therefor
US20020069296A1 (en) Internet content reformatting apparatus and method
KR19990087913A (ko) 유알엘의병렬선택방법
US7272792B2 (en) Kana-to-kanji conversion method, apparatus and storage medium
US6615168B1 (en) Multilingual agent for use in computer systems
US20040205587A1 (en) System and method for enumerating arbitrary hyperlinked structures in which links may be dynamically calculable
JP2002116983A (ja) ウェブコンテンツの変換方法およびシステム
US20050114545A1 (en) Method and apparatus for marking of web pages
KR20000049928A (ko) 다국어 검색엔진의 운영 장치 및 방법
JP2002091963A (ja) 機械翻訳システム
US20050060291A1 (en) Method and apparatus for searching universal resource identifiers
KR19990078876A (ko) 일괄된 자원 위치기 입력을 통한 정보 검색 방법
KR100491254B1 (ko) 웹사이트 디렉토리나 웹페이지에 대해 설명하는 단어들에하이퍼링크를 적용하는 검색 시스템 및 방법
US20020124056A1 (en) Method and apparatus for modifying a web page

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20060522

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee