JP2003022265A - 言語自動翻訳システム - Google Patents

言語自動翻訳システム

Info

Publication number
JP2003022265A
JP2003022265A JP2001205640A JP2001205640A JP2003022265A JP 2003022265 A JP2003022265 A JP 2003022265A JP 2001205640 A JP2001205640 A JP 2001205640A JP 2001205640 A JP2001205640 A JP 2001205640A JP 2003022265 A JP2003022265 A JP 2003022265A
Authority
JP
Japan
Prior art keywords
translation
sentence
language
automatic
translated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001205640A
Other languages
English (en)
Inventor
Toshio Furuta
利夫 古田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001205640A priority Critical patent/JP2003022265A/ja
Priority to US10/188,979 priority patent/US20030009320A1/en
Publication of JP2003022265A publication Critical patent/JP2003022265A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

(57)【要約】 【課題】 インターネット上の原語文発信サーバから得
た原語文を自動翻訳するシステムを構築する場合に、従
来の手法に比較し、より容易にシステム構築を可能にし
た言語自動翻訳システムを提供する。 【解決手段】 利用者は、利用者端末10を介して原語
文情報発信サーバ40から入手した原語文情報を、言語
自動翻訳手段(言語自動翻訳サーバ)20に自動翻訳さ
せる。利用者は、この翻訳文を自身で評価し、該翻訳文
の翻訳レベルが低いと判断した場合には、翻訳家端末3
0を介して翻訳家に同一原語文情報を再度翻訳させ、こ
の再度の翻訳結果を、言語自動翻訳手段に備えた自動翻
訳辞書手段に登録し、次回の翻訳には、該自動翻訳辞書
手段に登録した再度翻訳後の翻訳文を反映させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、言語自動翻訳シス
テムに関し、特にインターネット上の原語文発信サーバ
から得た原語文を自動翻訳するシステムを構築する場合
に、従来の手法に比較し、より容易にシステム構築を可
能にした言語自動翻訳システムに関する。
【0002】
【従来の技術】近年、インターネット等の通信ネットワ
ークの利用が普及し、該通信ネットワーク上には母国語
以外の各種の原語文の情報が、原語文発信サーバから提
供されている。この母国語以外の原語文情報の翻訳に
は、言語自動翻訳装置が使用される場合がある。従来の
言語自動翻訳装置は、写真等を多用する、カタログ等の
原語文情報の量が少ないコンテンツに対しては、自動翻
訳した内容で意味が十分に通じ、実用に供することがで
きる。しかし、従来の言語自動翻訳装置は、原語文情報
量の多い解説記事,論説,批評,意見等に代表されるコ
ンテンツを自動翻訳した場合に、該自動翻訳文を利用者
が読んでも意味が通じなかったり、自動翻訳文に違和感
を持つことがある。即ち、利用者の期待する自動翻訳レ
ベルと従来システムによる自動翻訳レベルとの差異(ギ
ャップ)が大きく、言語自動翻訳装置の普及困難な主因
となっている。
【0003】特に、英語を使う人々は全世界で約8億人
と推定され、その数は増加する一方である。国際的取引
や知的職務に携わる人々の大多数が英語を必要としてお
り、インターネットの普及が英語の必要性を後押しして
いる。英語を自然な日本語に近いレベルに自動翻訳する
ことが可能になれば、日本語に翻訳された英語を職務上
使う人々にとっては、その恩恵は計り知れない。かかる
自然語に近い自動翻訳レベルを実現すべく、各種の研究
機関等が日夜努力を重ねている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
研究機関等は自然語に近い自動翻訳レベルを実現するた
めに、一般的に全てを自動翻訳装置のソフトウェア及び
ハードウエアで解決しようとする手法(正攻法)を採っ
ているため、自然語に近い自動翻訳レベルの自動翻訳装
置の実用化・商品化が遅れているのが実情である。一
方、言語自動翻訳装置はインターネット上に無料あるい
は有料で開設されており、様々な分野の専門家・翻訳専
門家が前記言語自動翻訳装置を利用している。
【0005】そこで本発明の課題は、インターネット上
の原語文発信サーバから得た原語文を自動翻訳するシス
テムを構築する場合に、従来の手法に比較し、より容易
にシステム構築を可能にした言語自動翻訳システムを提
供することにある。
【0006】
【課題を解決するための手段】前記課題を解決するため
に本発明は、通信ネットワークを介して入手した原語文
情報を、原語文自動翻訳装置に自動翻訳させ、該自動翻
訳した自動翻訳文を人間が修正し、該人間が修正後の修
正後翻訳文を、前記原語文自動翻訳装置に反映させるこ
とを特徴とする。また、本発明は、前記人間は、前記原
語文情報の属する分野の専門家であることを特徴とす
る。
【0007】このようにすれば、自動翻訳した翻訳文
を、例えばその原語文の属する分野の翻訳専門家に修正
させて自然語に近い修正翻訳文にした後に、該修正翻訳
文を言語自動翻訳装置に反映させるので、言語自動翻訳
装置の翻訳レベルアップのためにソフトウェア及びハー
ドウエアの改良のみで対処する手法(従来手法,正攻
法)に比較し、より容易に言語自動翻訳装置の翻訳レベ
ルの向上を実現することができる。
【0008】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1は、本実施の形
態の言語自動翻訳システムTJのシステム構成図、図2
は同言語自動翻訳システムTJを構成する言語自動翻訳
サーバ20のブロック図である。図1に示すように、言
語自動翻訳システムTJは、複数の利用者端末10(1
0a〜10n)と、複数種類の言語の翻訳が可能な「原
語文自動翻訳手段」である言語自動翻訳サーバ20と、
複数の「専門家端末」である翻訳家端末30(30a〜
30n)と、「原語文情報発信サーバ」である原語情報
発信サーバ40と、それらを相互に接続するインターネ
ット等の通信ネットワークNWとから構成されている。
【0009】図2に示すように、言語自動翻訳サーバ2
0は、原語文(例えば、英語文)を利用者が指定した言
語文(例えば、日本語文)に自動翻訳する自動翻訳手段
21と、単語,フレーズ(慣用句),原語の構文(例え
ば、英語の構文)に対応した翻訳語の構文(例えば、日
本語の構文)を格納した翻訳辞書手段22と、次にそれ
ぞれ説明する、翻訳アクセス情報記録手段23と、統計
集計手段24と、自然語パターン認識手段25と、自動
送信手段26とを備えている。ここに、自動翻訳手段2
1の翻訳手法としては、トランスファー(構文変換)方
式,PIVOT(中間言語)方式,トランスメモリ(事
例データベース)方式等の一般的な自動翻訳手法があ
る。
【0010】翻訳アクセス情報記録手段23は、各利用
者端末10a〜10nが言語自動翻訳サーバ20の同一
の原語文情報へのアクセス頻度(例えば、英語の記事
A,記事B…に夫々何回アクセスしたか)と、翻訳する
原語文の原語情報発信サーバ40における位置情報(ペ
ージ指定またはURL指定)、アクセス日時、および利
用者自身が自動翻訳の結果(自動翻訳文)のレベルを評
価した自動翻訳評価レベルとを、登録する機能を有す
る。レベル評価には、例えば3段階法を用いる。
【0011】統計集計手段24は、24時間おきに翻訳
アクセス情報記録手段23に登録された記録を統計的に
処理し、原語文情報へのアクセス頻度が高く、自動翻訳
の評価レベルの低い順番に配列処理し、さらにその原語
文の前記位置情報を付加した二次情報を生成する機能を
有する。自然語パターン認識手段25は、翻訳家の専門
性を生かした自然言語に近い翻訳レベルに修正した結果
を、翻訳辞書手段22に反映させるために、自然語のパ
ターンを認識する機能を有する(後述)。自動送信手段
26は、予め一定の資格試験等を行い所定のレベルに達
していると判定した翻訳能力を持つ登録済みの翻訳家が
それぞれ持つ翻訳家端末30a〜30nに、翻訳アクセ
ス情報記録手段23に蓄積された前記統計集計情報を、
自動的に送信する機能を有する。
【0012】翻訳家端末30a〜30nを所有する各翻
訳家は、24時間毎に自動送信される統計集計情報を利
用して、翻訳家自身が得意な分野の自動翻訳文を選択
し、アクセス頻度が高く、自動翻訳レベルの低い原語文
から順に、自動翻訳文を自然語に近い文に修正する。こ
の場合、翻訳家は送信された原語文の位置情報に基づ
き、言語自動翻訳サーバ20から原語文をダウンロード
し、原語文と自動翻訳文の双方を参照しながら修正する
のが望ましい。そして、修正後の修正翻訳文を言語自動
翻訳サーバ20へ送信すると、自然語パターン認識手段
25が修正後の翻訳文を認識し、翻訳家辞書手段22に
格納して反映させる。このようにすれば、次回の自動翻
訳のアクセスがあった場合には、この修正後翻訳文を反
映した自動翻訳を行うことができ、自然語に近いレベル
の自動翻訳文を作成することができる。
【0013】翻訳家端末30は、例えば電気,通信の分
野であれば、強電分野,弱電(通信)分野,ソフトウェ
ア分野というように、翻訳の得意な分野をそれぞれ持っ
た翻訳専門家が、使用する。なお、例えば弱電分野であ
れば、放送機器分野,磁気記録分野,デジタル回路分
野,アナログ回路分野等のように、更に専門性を持った
翻訳専門家が翻訳家端末を持つようにするのが好まし
い。原語情報発信サーバ40は、言語情報量の多い解説
記事,論説,批評,意見等を、それぞれの国の母国語で
原語文情報としてネットワークNW上に提供しているサ
ーバである。
【0014】ここで、原語文を自動翻訳する際の例を、
図3(A),(B)、図4に基づいて説明する。図3
(A)は英語の原語文、図3(B)は該英語の原語文を
従来の自動翻訳装置で翻訳した日本語文(一次翻訳
文)、図4は本実施の形態の自動翻訳装置(言語自動翻
訳システム)に適用する専門家が翻訳した修正翻訳文
(二次翻訳文)である。図3(A)の英語の原語文は、
1995年のオクラホマシティー事件(連邦ビル***事件=
テロ行為により168名の死者と数百名の負傷者を出した
事件)の犯人(McVeigh)が、刑の執行の延期を求めた
という、Associated Pressの記者(CATHERINE TSAI)
の署名入りの記事である。
【0015】例えば、図3(A)の符号で示した記事
のタイトル「McVeigh Seeks Delay of Execution」
を、従来の自動翻訳装置は図3(B)に符号’で示す
ように、「McVeighは実行の遅延を求めます」と自動翻
訳(一次翻訳文)している。この一次翻訳文は、記事全
体の主旨を無視すれば、文法的に正しい翻訳の一例と言
える。しかし、新聞等の記事の場合には、記事全体の主
旨から判断して、記事のタイトルとしては違和感のある
日本語であり、自然な日本語とは言えない。そこで、翻
訳専門家が前記符号と’の文章を比較し、図4の
’’に示す「McVeighが刑執行延期を求める」とい
う、記事のタイトルに相応しい日本語に修正する(二次
翻訳文,修正翻訳文)。
【0016】具体的には、翻訳専門家が原語文の全体に
亘って、原語文と一次翻訳文を参照し、日本語記事とし
て適切な・違和感のないものに修正して、図4に示した
日本語文を作成する(二次翻訳文)。そして、言語自動
翻訳サーバ20の自然語パターン認識手段25は、「記
事のタイトル」という条件の下に、「McVeigh Seeks
Delay of Execution」の自然な日本語は「McVeighが
刑執行延期を求める」であるという二次翻訳文を、自然
語パターン認識手段25によりパターン認識し、修正し
た自然な日本語として翻訳辞書手段22に登録する。こ
こに、パターン認識の具体的手段としては、パターンマ
ッチング(表層)方式,変換ツール(ツリー変換)方式
等の一般的な慣用句処理手法がある。
【0017】このような翻訳専門家による翻訳文の修正
と修正後の文(構文)のパターン認識とを、英語の原語
文(図3(A))の全文に亘って実施し、修正後の構文
を翻訳辞書手段22に登録する。そして、次回の日本語
への翻訳アクセスがあった場合には、「記事タイトル」
の条件が一致すれば、「McVeigh Seeks Delay of E
xecution」の自然な日本語の翻訳文として「McVeighが
刑執行延期を求める」を採用する。このように、原語の
構文(McVeigh Seeks Delay of Execution)に対応
させて日本語の翻訳構文(McVeighが刑執行延期を求め
る)を多数、翻訳辞書手段に登録させておけば、自然な
日本語の構文を組み合わせて、自然な日本語の文章を自
動的に作成することが可能となる。
【0018】次に本実施の形態の動作を説明する。図5
は、本実施の形態の動作を説明するためのフローチャー
トである。以下の処理(ステップ)の内、人間が行う処
理(例えば、ステップS19の翻訳家による翻訳文の修
正作業)を除き、その他の処理はプログラムにより実行
する。図5に示すように、利用者が利用者端末10を介
して原語情報発信サーバ40にアクセスし、原語情報発
信サーバ40から取り寄せたい原語文を指定すると(ス
テップS1)、原語情報発信サーバ40は指定の原語文
を利用者端末10へ送信する(ステップS2)。
【0019】利用者端末10は原語文を読み込んで所望
の原語文情報であることを確認し(ステップS3)、利
用者が利用者端末10を介して言語自動翻訳サーバ20
にアクセスすると(ステップS4)、言語自動翻訳サー
バ20は自己が翻訳可能な原語の種類(例えば、英語,
独逸語、ロシア語等)を利用者端末10へ送信する(ス
テップS5)。すると、利用者端末10の表示部に、言
語自動翻訳サーバ20が翻訳可能な原語の種類が表示さ
れる(ステップS6)。利用者は利用者端末10の表示
部に対し、原語文情報が存在する原語情報発信サーバ4
0の位置情報(ページ指定またはURL指定)と、自動
翻訳したい言語の種類(例えば、英語)を選択して書き
込み(ステップS7)、言語自動翻訳サーバ20に、前
記位置情報と言語の種類を送信する(ステップS8)。
【0020】言語自動翻訳サーバ20は受信した前記位
置情報(ページ指定またはURL指定)に基づいて、原
語情報発信サーバ40に対し原語文情報の送信要求を行
うと(ステップS9)、原語情報発信サーバ40は要求
された原語文情報を言語自動翻訳サーバ20に送信する
(ステップS10)。言語自動翻訳サーバ20はこの原
語文情報を取得し(ステップS11)、利用者の指定言
語への自動翻訳を行い(ステップS12)、その翻訳結
果を、利用者端末10に送信する(ステップS13)。
【0021】利用者は利用者端末10に表示された翻訳
文(一次翻訳文)を読み、自動翻訳結果に対し利用者自
身が自動翻訳のレベルを例えば3段階法で評価し(ステ
ップS14)、評価した自動翻訳レベルの情報と、原語
文情報が存在する原語情報発信サーバ40の位置情報
(ページ指定またはURL指定)と、アクセス日時等の
情報を、言語自動翻訳サーバ20に送信する(ステップ
S15)と共に、利用者端末10にこれら自動翻訳レベ
ル情報,位置情報,アクセス日時情報等を記録する(ス
テップS16)。翻訳アクセス記録手段21は前記自動
翻訳レベル情報,位置情報,アクセス日時情報等を書き
込むと共に、統計集計手段24により翻訳に伴う情報
(自動翻訳レベル情報,位置情報,アクセス日時情報
等)を統計的に処理し(統計処理した結果を翻訳アクセ
ス統計情報と呼ぶ)(ステップS17)、24時間おき
に、統計処理結果を翻訳家端末30に自動送信する(ス
テップS18)。
【0022】翻訳家は、翻訳家端末30で受信した前記
翻訳アクセス統計情報の結果を見ながら、翻訳家自身の
専門分野において、アクセス頻度が高く、自動翻訳レベ
ルが低いと利用者が評価した情報に基づき、翻訳すべき
原語文情報を選択する。そして、翻訳家自身が前記位置
情報に基づいて言語自動翻訳サーバ20から原語文情報
を取り寄せ、翻訳家端末30に表示させた後、その取り
寄せた原語文情報を自然語レベルの翻訳文に修正する
(ステップS19)。翻訳家による修正翻訳文の確定後
(ステップS20)、翻訳家端末30は修正翻訳文を言
語自動翻訳サーバ20に送信する(ステップS21)。
【0023】言語自動翻訳サーバ20は、翻訳家が修正
した翻訳結果(修正翻訳文)を、自然語パターン認識手
段25を使い、構文毎にパターン認識を行って自然語パ
ターンを生成し(ステップS22)、翻訳辞書手段22
に追加登録する(ステップS23)。このような操作を
原語文情報の全文(図3(A))に亘って繰り返す。こ
のような繰り返しにより、言語自動翻訳サーバ20は修
正済みの翻訳辞書手段22を持つことになる。従って、
修正後の言語自動翻訳サーバ20にアクセスして原語文
情報を自動翻訳させた利用者は、自然語に近いレベルの
自動翻訳文を入手することが可能となる。
【0024】なお、前記ステップS19では、翻訳家
が、自身の専門分野において、アクセス頻度が高く、自
動翻訳レベルが低いと利用者が評価した情報に基づき、
翻訳すべき原語文情報を選択していた。これに対し、翻
訳家に修正させる原語文情報を言語自動翻訳サーバ20
に選択させることも可能である。即ち、翻訳家の専門分
野を予め言語自動翻訳サーバ20に登録しておくと共
に、原語文情報のアクセス頻度については、例えば5
回、自動翻訳レベルについては、「優れている、普通、
劣る」の3段階法であれば、例えば「劣る」という値
を、全翻訳家に共通の閾値として予め定めておく。一
方、統計集計手段24は、原語文情報へのアクセス頻
度、自動翻訳の評価レベルを統計処理した情報(翻訳ア
クセス統計情報)を記録している。
【0025】この統計集計手段24の翻訳アクセス統計
情報に基づき、或る原語文情報が前記閾値を越えた場合
には、その原語文情報の分野が専門分野として登録され
た翻訳家に前記翻訳アクセス統計情報を送信し、該翻訳
家に翻訳させるようにすることも可能である。また、前
述の如く全翻訳家に共通の閾値を定めるのではなく、あ
る翻訳家については、前述のような閾値を、別の翻訳家
については、例えばアクセス頻度が3回以上、自動翻訳
レベルは「普通または劣る」といった別の閾値を定めて
おくようにしてもよい。
【0026】また、前記実施例では原語文情報発信サー
バから入手した原語文を翻訳する場合を説明したが、音
声の自動翻訳装置にも、本発明を適用可能であるのは勿
論である。更に、前記実施例では原語文(例えば、英
語)を日本語に翻訳する場合を説明したが、日本語を別
の言語(例えば、英語)に翻訳する場合にも、本発明を
適用可能であるのは勿論である。
【0027】
【発明の効果】以上説明したように本発明によれば、通
信ネットワーク(インターネット)上の原語文情報を言
語自動翻訳装置により自動翻訳する場合に、利用者が翻
訳文の翻訳レベルを評価し、評価の低いレベルの翻訳文
に対しては、原語文情報の分野に詳しい翻訳専門家が修
正し、修正後の翻訳結果を前記言語自動翻訳装置に反映
させるので、次回の原語文情報の翻訳には、自然語に近
いレベルの翻訳文を入手することが可能となる。また、
翻訳専門家の知識を、ネットワークを介して言語自動翻
訳装置に反映させることができるので、従来の言語自動
翻訳装置の翻訳能力のアップ手法に比較し、容易に翻訳
能力を向上させることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態のシステム構成図である。
【図2】同実施の形態における言語自動翻訳サーバのブ
ロック図である。
【図3】(A)は原語文情報の一例、(B)は従来の言
語自動翻訳装置による翻訳文(一次翻訳文)の一例であ
る。
【図4】本発明の実施の形態に適用する、専門家が翻訳
した修正翻訳文(二次翻訳文)の一例である。
【図5】同実施の形態のフローチャートである。
【符号の説明】
NW 通信ネットワーク TJ 言語自動翻訳システム 10(10a〜10n) 利用者端末 20 言語自動翻訳サーバ 30(30a〜30n) 翻訳家端末 40 原語文情報発信サーバ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成14年9月9日(2002.9.9)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0006
【補正方法】変更
【補正内容】
【0006】
【課題を解決するための手段】前記課題を解決するため
に本発明は、原語文からなる情報を通信ネットワーク上
に発信する原語情報発信サーバと、該原語情報発信サー
バが発信した原語文情報を、指定された言語に自動翻訳
する言語自動翻訳サーバと、該言語自動翻訳サーバに対
し、利用者が選択した原語文情報を、指定言語への翻訳
を指示する利用者端末と、該利用者端末が指示して自動
翻訳させた前記原語文情報の自動翻訳文を、修正する翻
訳家が使用する翻訳家端末と、前記原語情報発信サーバ
と言語自動翻訳サーバと利用者端末と翻訳家端末とを相
互に接続する通信ネットワークとを備えてなり、前記言
語自動翻訳サーバは、自動翻訳された前記自動翻訳文
を、対応する原語文情報への前記利用者端末からのアク
セス頻度の情報を参照させながら、前記翻訳家に修正さ
せ、この修正後の翻訳文を受信することを特徴とする。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0011
【補正方法】変更
【補正内容】
【0011】統計集計手段24は、24時間おきに翻訳
アクセス情報記録手段23に登録された記録を統計的に
処理し、原語文情報へのアクセス頻度が高く、自動翻訳
の評価レベルの低い順番に配列処理し、さらにその原語
文の前記位置情報を付加した二次情報を生成する機能を
有する。自然語パターン認識手段25は、翻訳家の専門
性を生かした自然言語に近い翻訳レベルに修正した結果
を、翻訳辞書手段22に反映させるために、自然語のパ
ターンを認識する機能を有する(後述)。自動送信手段
26は、予め一定の資格試験等を行い所定のレベルに達
していると判定した翻訳能力を持つ登録済みの翻訳家が
それぞれ持つ翻訳家端末30a〜30nに、翻訳アクセ
ス情報記録手段23に蓄積された前記二次情報(統計集
計情報)を、自動的に送信する機能を有する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正内容】
【0012】翻訳家端末30a〜30nを所有する各翻
訳家は、24時間毎に自動送信される統計集計情報を利
用して、翻訳家自身が得意な分野の自動翻訳文を選択
し、アクセス頻度が高く、自動翻訳レベルの低い原語文
から順に、自動翻訳文を自然語に近い文に修正する。こ
の場合、翻訳家は送信された原語文の位置情報に基づ
き、言語自動翻訳サーバ20から原語文をダウンロード
し、原語文と自動翻訳文の双方を参照しながら修正する
のが望ましい。そして、修正後の修正翻訳文を言語自動
翻訳サーバ20へ送信すると、自然語パターン認識手段
25が修正後の翻訳文を認識し、翻訳辞書手段22に格
納して反映させる。このようにすれば、次回の自動翻訳
のアクセスがあった場合には、この修正後翻訳文を反映
した自動翻訳を行うことができ、自然語に近いレベルの
自動翻訳文を作成することができる。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0021
【補正方法】変更
【補正内容】
【0021】利用者は利用者端末10に表示された翻訳
文(一次翻訳文)を読み、自動翻訳結果に対し利用者自
身が自動翻訳のレベルを例えば3段階法で評価し(ステ
ップS14)、評価した自動翻訳レベルの情報と、原語
文情報が存在する原語情報発信サーバ40の位置情報
(ページ指定またはURL指定)と、アクセス日時等の
情報を、言語自動翻訳サーバ20に送信する(ステップ
S15)と共に、利用者端末10にこれら自動翻訳レベ
ル情報,位置情報,アクセス日時情報等を記録する(ス
テップS16)。翻訳アクセス情報記録手段21は前記
自動翻訳レベル情報,位置情報,アクセス日時情報等を
書き込むと共に、統計集計手段24により翻訳に伴う情
報(自動翻訳レベル情報,位置情報,アクセス日時情報
等)を統計的に処理し(統計処理した結果を翻訳アクセ
ス統計情報と呼ぶ)(ステップS17)、24時間おき
に、統計処理結果を翻訳家端末30に自動送信する(ス
テップS18)。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】本発明の実施の形態のシステム構成図である。
【図2】同実施の形態における言語自動翻訳サーバのブ
ロック図である。
【図3】(A)は原語文情報の一例、(B)は従来の言
語自動翻訳装置による翻訳文(一次翻訳文)の一例であ
る。
【図4】本発明の実施の形態に適用する、専門家が翻訳
した修正翻訳文(二次翻訳文)の一例である。
【図5】同実施の形態のフローチャートである。
【符号の説明】 NW 通信ネットワーク TJ 言語自動翻訳システム 10(10a〜10n) 利用者端末 20 言語自動翻訳サーバ 30(30a〜30n) 翻訳家端末 40 原語情報発信サーバ

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 通信ネットワークを介して入手した原語
    文情報を、原語文自動翻訳装置に自動翻訳させ、該自動
    翻訳した自動翻訳文を人間が修正し、該人間が修正後の
    翻訳文を、前記原語文自動翻訳装置に反映させることを
    特徴とする言語自動翻訳システム。
  2. 【請求項2】 前記修正する人間は、前記原語文情報の
    属する分野の専門家であることを特徴とする請求項1記
    載の言語自動翻訳システム。
  3. 【請求項3】 原語文からなる情報を通信ネットワーク
    上に発信する原語文情報発信サーバと、 該原語文情報発信サーバが発信した原語文情報を、指定
    された言語に自動翻訳する原語文自動翻訳手段と、 該原語文自動翻訳手段に対し、利用者が選択した原語文
    情報を、指定言語への翻訳を指示する利用者端末と、 該利用者端末が指示して自動翻訳させた前記原語文情報
    の自動翻訳文を、修正する専門家が使用する専門家端末
    と、 前記原語文情報発信サーバと原語文自動翻訳手段と利用
    者端末と翻訳家端末とを相互に接続する通信ネットワー
    クとを備えてなり、 前記原語文自動翻訳手段に自動翻訳させた翻訳文を前記
    翻訳家に修正させ、この修正後の翻訳文を、前記原語文
    自動翻訳手段に反映させることを特徴とする言語自動翻
    訳システム。
  4. 【請求項4】 前記利用者は、前記言語自動翻訳手段に
    自動翻訳させた翻訳文を評価し、該翻訳文の翻訳レベル
    が低いと判断した場合には、前記翻訳家に修正させるこ
    とを特徴とする請求項3記載の言語自動翻訳システム。
  5. 【請求項5】 前記原語文自動翻訳手段は複数種類の言
    語の翻訳が可能であり、前記利用者端末が複数からなる
    場合に、利用者端末からのアクセスが多い原語文情報か
    ら順に前記翻訳家に修正させることを特徴とする請求項
    3または請求項4記載の言語自動翻訳システム。
  6. 【請求項6】 前記自動翻訳辞書手段は複数種類の言語
    の翻訳が可能であり、前記利用者端末が複数からなる場
    合に、利用者による翻訳文レベルの評価結果を登録して
    おき、該評価結果の低い原語文情報から順に前記翻訳家
    に修正させることを特徴とする請求項3または請求項4
    記載の言語自動翻訳システム。
  7. 【請求項7】 通信ネットワーク上に発信された原語文
    からなる情報を、指定された言語に自動翻訳し、該自動
    翻訳後の翻訳文を人間に修正させ、修正後の翻訳文の結
    果を、次回の翻訳に反映させることを特徴とする原語文
    自動翻訳サーバ。
  8. 【請求項8】 当該原語文自動翻訳サーバは、前記自動
    翻訳後の翻訳文を、当該原語文情報の属する分野の専門
    家たる前記人間に修正させることを特徴とする請求項7
    記載の原語文自動翻訳サーバ。
  9. 【請求項9】 当該原語文自動翻訳サーバは、前記自動
    翻訳後の翻訳文を、利用者による該翻訳文の評価レベル
    が低い場合に、前記人間に修正させることを特徴とする
    請求項7または請求項8記載の原語文自動翻訳サーバ。
  10. 【請求項10】 当該原語文自動翻訳サーバは、前記自
    動翻訳後の翻訳文を、当該原語文情報に対する利用者か
    らの翻訳要求が多い場合に、前記人間に修正させること
    を特徴とする請求項7または請求項8記載の原語文自動
    翻訳サーバ。
  11. 【請求項11】 通信ネットワーク上に発信された原語
    文からなる情報を指定するステップと、 前記原語文情報を指定された言語に自動翻訳するステッ
    プと、 該自動翻訳後の翻訳文を人間に修正させるステップと、 該人間が修正後の翻訳文の結果を次回の翻訳に反映させ
    るステップとを含むことを特徴とする言語自動翻訳方
    法。
  12. 【請求項12】 前記自動翻訳後の翻訳文を人間に修正
    させるステップは、前記原語文情報の属する分野の専門
    家に修正させるステップであることを特徴とする請求項
    11記載の言語自動翻訳方法。
  13. 【請求項13】 利用者に前記自動翻訳後の翻訳文の評
    価させるステップと、前記利用者の評価レベルが低い場
    合には、前記翻訳文を修正させるステップとを含むこと
    を特徴とする請求項11または請求項12記載の言語自
    動翻訳方法。
  14. 【請求項14】 利用者からの翻訳要求が多い原語文情
    報から順に前記専門家に修正させるステップを、含むこ
    とを特徴とする請求項12または請求項13記載の言語
    自動翻訳方法。
  15. 【請求項15】 通信ネットワーク上に発信された原語
    文からなる情報を指定する処理と、 該指定された言語に自動翻訳する処理と、 該自動翻訳後の翻訳文の修正を人間に促す処理と、 修正後の翻訳文の結果を次回の翻訳に反映させる処理と
    をコンピュータに実行させるためのプログラム。
  16. 【請求項16】 前記自動翻訳後の翻訳文を人間に修正
    を促す処理は、前記原語文情報の属する分野の専門家に
    よる修正を促す処理であることを特徴とする請求項15
    記載のプログラム。
  17. 【請求項17】 利用者に前記自動翻訳後の翻訳文の評
    価をさせる処理と、 前記利用者の評価レベルが低い場合には、前記翻訳文を
    修正させる処理とを含むことを特徴とする請求項15ま
    たは請求項16記載のプログラム。
  18. 【請求項18】 利用者からの翻訳要求が多い原語文情
    報から順に前記修正させる処理を、含むことを特徴とす
    る請求項16または請求項17記載のプログラム。
JP2001205640A 2001-07-06 2001-07-06 言語自動翻訳システム Pending JP2003022265A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001205640A JP2003022265A (ja) 2001-07-06 2001-07-06 言語自動翻訳システム
US10/188,979 US20030009320A1 (en) 2001-07-06 2002-07-05 Automatic language translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001205640A JP2003022265A (ja) 2001-07-06 2001-07-06 言語自動翻訳システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004046031A Division JP3858901B2 (ja) 2004-02-23 2004-02-23 言語自動翻訳システム

Publications (1)

Publication Number Publication Date
JP2003022265A true JP2003022265A (ja) 2003-01-24

Family

ID=19041913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001205640A Pending JP2003022265A (ja) 2001-07-06 2001-07-06 言語自動翻訳システム

Country Status (2)

Country Link
US (1) US20030009320A1 (ja)
JP (1) JP2003022265A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101641320B1 (ko) * 2015-02-26 2016-07-25 클라인 아담 로 전문가 첨삭 방식의 번역 장치 및 그 방법
KR101656001B1 (ko) * 2016-02-12 2016-09-08 이은숙 네트워크를 이용한 번역 서비스 방법
KR101692930B1 (ko) * 2016-07-22 2017-01-04 사라소프트주식회사 의료기록지 번역 시스템 및 의료기록지 번역 방법
KR101695396B1 (ko) * 2016-08-31 2017-01-11 이은숙 인공지능 번역 소프트웨어를 이용하여 번역을 수행하는 방법
JP2017058865A (ja) * 2015-09-15 2017-03-23 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
KR20180125213A (ko) * 2017-05-15 2018-11-23 이은숙 딥러닝 인공지능 번역 소프트웨어를 이용하여 번역을 수행하고 컨텐츠를 제공하는 방법
US20210216727A1 (en) * 2020-01-13 2021-07-15 International Business Machines Corporation Machine translation integrated with user analysis

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7904595B2 (en) 2001-01-18 2011-03-08 Sdl International America Incorporated Globalization management system and method therefor
US7346487B2 (en) * 2003-07-23 2008-03-18 Microsoft Corporation Method and apparatus for identifying translations
US7310605B2 (en) * 2003-11-25 2007-12-18 International Business Machines Corporation Method and apparatus to transliterate text using a portable device
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US8700383B2 (en) * 2005-08-25 2014-04-15 Multiling Corporation Translation quality quantifying apparatus and method
US20070067154A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Language translation system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8145472B2 (en) * 2005-12-12 2012-03-27 John Shore Language translation using a hybrid network of human and machine translators
US11222185B2 (en) 2006-10-26 2022-01-11 Meta Platforms, Inc. Lexicon development via shared translation database
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US9070363B2 (en) * 2007-10-26 2015-06-30 Facebook, Inc. Speech translation with back-channeling cues
US7983897B2 (en) * 2007-02-14 2011-07-19 Google Inc. Machine translation feedback
WO2008120036A1 (en) * 2007-03-29 2008-10-09 Nokia Corporation Method at a central server for managing a translation dictionary and a translation server system
US8527260B2 (en) * 2007-09-06 2013-09-03 International Business Machines Corporation User-configurable translations for electronic documents
US20090132257A1 (en) * 2007-11-19 2009-05-21 Inventec Corporation System and method for inputting edited translation words or sentence
US8719002B2 (en) * 2009-01-15 2014-05-06 International Business Machines Corporation Revising content translations using shared translation databases
US9087045B2 (en) * 2009-11-24 2015-07-21 Intel Corporation Methods and systems for real time language translation using social networking
US8566078B2 (en) * 2010-01-29 2013-10-22 International Business Machines Corporation Game based method for translation data acquisition and evaluation
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US9547626B2 (en) 2011-01-29 2017-01-17 Sdl Plc Systems, methods, and media for managing ambient adaptability of web applications and web services
US10657540B2 (en) 2011-01-29 2020-05-19 Sdl Netherlands B.V. Systems, methods, and media for web content management
US10580015B2 (en) 2011-02-25 2020-03-03 Sdl Netherlands B.V. Systems, methods, and media for executing and optimizing online marketing initiatives
US10140320B2 (en) 2011-02-28 2018-11-27 Sdl Inc. Systems, methods, and media for generating analytical data
US8527259B1 (en) * 2011-02-28 2013-09-03 Google Inc. Contextual translation of digital content
US8825467B1 (en) * 2011-06-28 2014-09-02 Google Inc. Translation game
US9984054B2 (en) 2011-08-24 2018-05-29 Sdl Inc. Web interface including the review and manipulation of a web document and utilizing permission based control
US20130262078A1 (en) * 2012-03-30 2013-10-03 George Gleadall System and method for providing text content on web pages in multiple human languages
US9773270B2 (en) 2012-05-11 2017-09-26 Fredhopper B.V. Method and system for recommending products based on a ranking cocktail
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9239832B2 (en) * 2012-08-03 2016-01-19 Red Hat, Inc. Modifying language of a user interface on a computing device
US10452740B2 (en) 2012-09-14 2019-10-22 Sdl Netherlands B.V. External content libraries
US11386186B2 (en) 2012-09-14 2022-07-12 Sdl Netherlands B.V. External content library connector systems and methods
US11308528B2 (en) 2012-09-14 2022-04-19 Sdl Netherlands B.V. Blueprinting of multimedia assets
US9916306B2 (en) 2012-10-19 2018-03-13 Sdl Inc. Statistical linguistic analysis of source content
US8996355B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for reviewing histories of text messages from multi-user multi-lingual communications
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US8990068B2 (en) 2013-02-08 2015-03-24 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996353B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9231898B2 (en) 2013-02-08 2016-01-05 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US10162811B2 (en) 2014-10-17 2018-12-25 Mz Ip Holdings, Llc Systems and methods for language detection
US9372848B2 (en) 2014-10-17 2016-06-21 Machine Zone, Inc. Systems and methods for language detection
JP6320982B2 (ja) * 2014-11-26 2018-05-09 ネイバー コーポレーションNAVER Corporation 翻訳文エディタ提供装置、並びに翻訳文エディタ提供方法
US10229674B2 (en) 2015-05-15 2019-03-12 Microsoft Technology Licensing, Llc Cross-language speech recognition and translation
US10614167B2 (en) 2015-10-30 2020-04-07 Sdl Plc Translation review workflow systems and methods
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
EP3444727A1 (en) * 2017-08-18 2019-02-20 Televic Education NV A revision system and method for revising translated texts
WO2019060353A1 (en) 2017-09-21 2019-03-28 Mz Ip Holdings, Llc SYSTEM AND METHOD FOR TRANSLATION OF KEYBOARD MESSAGES
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US10540452B1 (en) * 2018-06-21 2020-01-21 Amazon Technologies, Inc. Automated translation of applications
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
CN114341867B (zh) * 2019-10-15 2023-06-09 深圳市欢太科技有限公司 翻译方法、装置、客户端、服务器和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6760695B1 (en) * 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
AUPQ539700A0 (en) * 2000-02-02 2000-02-24 Worldlingo.Com Pty Ltd Translation ordering system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101641320B1 (ko) * 2015-02-26 2016-07-25 클라인 아담 로 전문가 첨삭 방식의 번역 장치 및 그 방법
JP2017058865A (ja) * 2015-09-15 2017-03-23 株式会社東芝 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
KR101656001B1 (ko) * 2016-02-12 2016-09-08 이은숙 네트워크를 이용한 번역 서비스 방법
WO2017138786A1 (ko) * 2016-02-12 2017-08-17 이은숙 네트워크를 이용한 번역 서비스 방법
KR101692930B1 (ko) * 2016-07-22 2017-01-04 사라소프트주식회사 의료기록지 번역 시스템 및 의료기록지 번역 방법
KR101695396B1 (ko) * 2016-08-31 2017-01-11 이은숙 인공지능 번역 소프트웨어를 이용하여 번역을 수행하는 방법
KR20180125213A (ko) * 2017-05-15 2018-11-23 이은숙 딥러닝 인공지능 번역 소프트웨어를 이용하여 번역을 수행하고 컨텐츠를 제공하는 방법
KR101953019B1 (ko) 2017-05-15 2019-02-27 이은숙 딥러닝 인공지능 번역 소프트웨어를 이용하여 번역을 수행하고 컨텐츠를 제공하는 방법
US20210216727A1 (en) * 2020-01-13 2021-07-15 International Business Machines Corporation Machine translation integrated with user analysis
US11429795B2 (en) * 2020-01-13 2022-08-30 International Business Machines Corporation Machine translation integrated with user analysis

Also Published As

Publication number Publication date
US20030009320A1 (en) 2003-01-09

Similar Documents

Publication Publication Date Title
JP2003022265A (ja) 言語自動翻訳システム
CN101194253B (zh) 来源于单语和可用双语语料库的搭配翻译
US7536293B2 (en) Methods and systems for language translation
US7496497B2 (en) Method and system for selecting web site home page by extracting site language cookie stored in an access device to identify directional information item
JP2831647B2 (ja) 機械翻訳システム
CN107491547A (zh) 基于人工智能的搜索方法和装置
US6996561B2 (en) System and method for interactively entering data into a database
US20100138402A1 (en) Method and system for improving utilization of human searchers
KR20160149978A (ko) 검색 엔진 및 그의 구현 방법
KR20040111188A (ko) 적응형 기계 번역
WO2005066847A2 (en) Systems and methods for improving search quality
JP2006252382A (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
Mangeot Papillon lexical database project: Monolingual dictionaries and interlingual links
JP2001175683A (ja) 翻訳サーバシステム
CN116795968A (zh) 一种基于Chat LLM技术的知识扩展及QA***
CN112447168A (zh) 语音识别***、方法、音箱、显示设备和交互平台
US20090144280A1 (en) Electronic multilingual business information database system
JP3858901B2 (ja) 言語自動翻訳システム
CN111737288B (zh) 搜索控制方法、装置、终端设备、服务器及存储介质
WO2010060117A1 (en) Method and system for improving utilization of human searchers
CN115618087B (zh) 对多语言翻译语料进行存储、搜索和显示方法及装置
CN117891927B (zh) 基于大语言模型的问答方法、装置、电子设备及存储介质
Reddy et al. Healthbot-An AI based chatbot using Webspider and Mediglobe
JP2004178167A (ja) 情報検索方法及び装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031211

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040205

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040205