JP5483526B2

JP5483526B2 - 機械翻訳システム及び機械翻訳方法

Info

Publication number: JP5483526B2
Application number: JP2008334468A
Authority: JP
Inventors: 宗益子
Original assignee: Rakuten Inc
Current assignee: Rakuten Group Inc
Priority date: 2008-12-26
Filing date: 2008-12-26
Publication date: 2014-05-07
Anticipated expiration: 2028-12-26
Also published as: JP2010157066A

Description

本発明は、文書を機械的に翻訳する仕組みに関し、特に、Ｗｅｂページ内に表示されるテキストをリアルタイムで翻訳するシステム及び方法に関するものである。

＜従来例１＞
Ｗｅｂページ中のテキストを機械的に翻訳するサービスがインターネット上で提供されている（例えば、非特許文献１参照）。
同サービスでは、ＷｅｂページのＵＲＬを入力として受け取ると、当該ＵＲＬに対応するＷｅｂページ中のテキストをユーザが指定した言語に翻訳し、元のＨＴＭＬデータを変換して出力する。ただし、同サービスは、当該Ｗｅｂページ内の画像に含まれる文字を翻訳する機能を備えていない。

＜従来例２＞
画像と文字とが混在する画像データの文字部分のみを翻訳した画像を作成する手法が知られている（例えば、特許文献１参照）。
同手法では、画像と文字とが混在する画像データのうち文字データの存在する部分（文字領域）を特定し、文字領域から文字データを抽出し、抽出した文字データをテキストデータに変換し、テキストデータを翻訳し、翻訳データを調整して文字領域に貼り付け、翻訳データが貼り付けられた文字領域を元の画像データと合成する（同文献図２のフローチャート，図３〜図１０の説明図等参照）。

＜従来例３＞
文書の背景となる色や模様などの体裁を維持しつつ、文字の部分だけを別の言語に翻訳された新たな文字に差し替える手法が知られている（例えば、特許文献２）。
同手法では、単一色の用紙に文字が印字された文書をスキャンして得たビットマップ画像から文字を認識した後、その文字を描画していた画素を用紙と同じ属性の画素で埋め戻した上で、認識した文字を翻訳して得た新たな文字を画像に書き込むことにより新たなビットマップ画像を生成する（同文献図１のフローチャート，図２の遷移図等参照）。

＜従来例４＞
原文と翻訳文とを対応付けて閲覧性の向上を図る手法が知られている（例えば、特許文献３参照）。
同手法では、文字データを所定の言語に翻訳し、翻訳文の文字列長を原文の文字列長と同一長さに補正した上で、原文と翻訳文を対応付けた画像を生成する（同文献図３のフローチャート，図４・図５の説明図等参照）。

なお、文字列長を比較する手法として、ドット数の累計を判定する点，キャラクタ数を判定する点，印刷時の長さを判定する点が記載又は示唆されている（同文献段落００２９，００３５等参照）。
また、文字列長を補正する手法として、文字のフォントを変更する点，文字のポイントを変更する点，文字列全体を均等割付とする点，文字をルビ文字とする点が記載又は示唆されている（同文献段落００３０，００３４等参照）。

＜従来例５＞
ある言語で作成された文書を異なる言語の文書に翻訳する際に、翻訳文のレイアウトを原文と同一にする手法が知られている（例えば、特許文献４参照）。
同手法では、原文の文字列から翻訳文を生成し、翻訳文中の省略対象語句（長い単語又は長いフレーズ）を省略語に置換し、省略対象語句が省略語に置換された翻訳文の画像を原文と同一のレイアウトで生成した上で、省略対象語句と省略語との対応リストを余白部分に配置した翻訳文を出力する（同文献図３のフローチャート，図４〜図７の説明図等参照）。

なお、省略対象語句を省略語に置換するのは、例えば単位領域において翻訳文の行数が対応する原文の行数を上回るときである（同文献段落００３２等参照）。
また、省略対象語句とするのは、例えば単位領域において構成文字数及び出現回数がいずれも所定の閾値を超える語句である（同文献段落００３３等参照）。

特開２００３−１２２７５１号公報特開２００６−２５１９０２号公報特開２００６−２７６９０５号公報特開２００７−０３４４３０号公報 Google, Inc.、"Google 翻訳"、インターネット<URL: http://translate.***.co.jp/>

インターネット上で外国人向けのサービスを提供する場合、外国語のＷｅｂページがあると便利である。ただし、全てのＷｅｂページについて各国語のパターンを予め用意しておくのは、手間がかかり過ぎるため事実上不可能である。
このとき、例えば上記＜従来例１＞の翻訳サービスと同様の仕組みを利用すれば、各Ｗｅｂページをいずれか１つの言語で作成しておくだけで、各国語のＷｅｂページをリアルタイムで作成して提供することがとりあえずは可能である。

一方、サービスを提供するＷｅｂページには画像が配置されることが多く、当該画像にはしばしば文字が含まれている（図１（ａ）の１１０ａ）。
このとき、例えば上記＜従来例１＞の翻訳サービスでは、画像中の文字が翻訳されない（図１（ｂ）の１１０ｂ）。また、例えば上記＜従来例２＞や＜従来例３＞のように画像内の文字を適宜抽出して翻訳するという手法は、処理に時間がかかるためリアルタイム処理を前提とする翻訳サービスにおいては採用し難い。

本発明が解決しようとする課題は、Ｗｅｂページ全体を機械翻訳にかけたときに画像内の文字が翻訳されずにそのまま表示されてしまう不具合を解消する、という点である。

上記課題を解決するため、本発明は、ある言語で表現されたＷｅｂページを提供するとともに、該Ｗｅｂページを他の言語に翻訳する機械翻訳システムであって、Ｗｅｂページを閲覧するユーザの端末と通信ネットワークを介して接続しており、ある言語で表現されたＷｅｂページの構造を記述するＨＴＭＬデータと、ＨＴＭＬデータが参照する画像データとを少なくとも記憶するＷｅｂデータ記憶手段と、テキストの翻訳処理に利用される辞書データを少なくとも記憶する翻訳データ記憶手段とを有し、前記Ｗｅｂデータ記憶手段に記憶するＨＴＭＬデータは、文字を含み可視化されている画像を示す文字画像と、該文字画像に重なる所定位置の前面に表示位置が設定され、かつ不可視化されている前記ある言語のテキストを示す予備テキストとの組を少なくとも１組含み、翻訳対象のＷｅｂページに対応するＵＲＬと、翻訳先言語の指定データとを少なくとも含む翻訳要求を前記端末から受信する翻訳要求受信手段と、前記受信したＵＲＬに対応するＷｅｂページの構造を記述するＨＴＭＬデータを前記Ｗｅｂデータ記憶手段より取得するＨＴＭＬデータ取得手段と、前記翻訳データ記憶手段に記憶している辞書データを参照して、前記取得したＨＴＭＬデータ中の前記予備テキストを含む所定の翻訳対象テキストを前記受信した指定データに対応する翻訳先言語に翻訳するテキスト翻訳手段と、前記取得したＨＴＭＬデータ中の不可視化されており且つ前記テキスト翻訳手段により翻訳された前記予備テキストを可視化するとともに、該ＨＴＭＬデータ中の可視化されている前記文字画像を不可視化する可視化要素切替手段と、前記可視化要素切替手段により処理された前記ＨＴＭＬデータを前記端末に送信する翻訳済ＨＴＭＬデータ送信手段と、前記端末からの画像データを指定した送信要求に応じて、該指定された画像データを前記Ｗｅｂデータ記憶手段より読み出して該端末に送信する画像データ送信手段とを備えることを特徴とする。

前記可視化要素切替手段は、テキストの文字色属性を透明から有色に変更し、テキストを含む領域の表示属性を非表示から表示に変更し又はテキストを含む領域のタグを挟むコメントタグを削除する、ことにより不可視化されている予備テキストを可視化するとよい。
前記可視化要素切替手段は、画像の表示属性を表示から非表示に変更し、画像に対応するタグを削除し、画像に対応するタグをコメントタグで挟み、画像を含む領域の表示属性を表示から非表示に変更し又は画像を含む領域に対応するタグをコメントタグで挟む、ことにより可視化されている文字画像を不可視化するとよい。
前記翻訳済ＨＴＭＬデータ送信手段は、前記取得したＨＴＭＬデータの基準ＵＲＬを、前記受信した翻訳要求に含まれる翻訳対象のＷｅｂページのＵＲＬに変更してもよい。
前記翻訳済ＨＴＭＬデータ送信手段は、翻訳後の予備テキストの長さが前記取得したＨＴＭＬ中の翻訳前の予備テキストの長さと比較して一定以上長いとき、該翻訳後の予備テキストの長さを短く補正してもよい。

また、上記課題を解決するため、本発明は、ある言語で表現されたＷｅｂページを提供するとともに、該Ｗｅｂページを他の言語に翻訳する機械翻訳システムによる機械翻訳方法であって、前記機械翻訳システムは、Ｗｅｂページを閲覧するユーザの端末と通信ネットワークを介して接続しており、ある言語で表現されたＷｅｂページの構造を記述するＨＴＭＬデータと、ＨＴＭＬデータが参照する画像データとを少なくとも記憶するＷｅｂデータ記憶手段と、テキストの翻訳処理に利用される辞書データを少なくとも記憶する翻訳データ記憶手段とを有し、前記Ｗｅｂデータ記憶手段に記憶するＨＴＭＬデータは、可視化されている画像を示す文字画像と、該文字画像に重なる所定位置の前面に表示位置が設定され、かつ不可視化されている前記ある言語のテキストを示す予備テキストとの組を少なくとも１組含み、翻訳対象のＷｅｂページに対応するＵＲＬと、翻訳先言語の指定データとを少なくとも含む翻訳要求を前記端末から受信する翻訳要求受信ステップと、前記受信したＵＲＬに対応するＷｅｂページの構造を記述するＨＴＭＬデータを前記Ｗｅｂデータ記憶手段より取得するＨＴＭＬデータ取得ステップと、前記翻訳データ記憶手段に記憶している辞書データを参照して、前記取得したＨＴＭＬデータ中の前記予備テキストを含む所定の翻訳対象テキストを前記受信した指定データに対応する翻訳先言語に翻訳するテキスト翻訳ステップと、前記取得したＨＴＭＬデータ中の不可視化されており且つ前記テキスト翻訳ステップにおいて翻訳された前記予備テキストを可視化するとともに、該ＨＴＭＬデータ中の可視化されている前記文字画像を不可視化する可視化要素切替ステップと、前記可視化要素切替ステップにおいて処理された前記ＨＴＭＬデータを前記端末に送信する翻訳済ＨＴＭＬデータ送信ステップと、前記端末からの画像データを指定した送信要求に応じて、該指定された画像データを前記Ｗｅｂデータ記憶手段より読み出して該端末に送信する画像データ送信ステップとを備えることを特徴とする。

上記いずれかの機械翻訳システムが備える各手段を１又は複数のコンピュータに機能として実現させるためのプログラムも本発明である。
さらに、上記課題を解決するため、本発明の情報処理装置は、文字を含み可視化されている文字画像と、該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得手段と、Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替手段と、前記可視化要素切替処理が実行されたソースを出力する出力手段と、を備える。
さらに、上記課題を解決するため、本発明は、コンピュータにより実行される情報処理方法であって、文字を含みかつ可視化されている文字画像と該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得ステップと、Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替ステップと、前記可視化要素切替処理が実行されたソースを出力する出力ステップと、を含む。
文字を含みかつ可視化されている文字画像と該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得機能と、Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替機能と、前記可視化要素切替処理が実行されたソースを出力する出力機能と、をコンピュータに実行させるプログラムも本発明である。

本発明の機械翻訳システムは、文字を含み可視化されている文字画像の参照データ（ＵＲＬ）と、当該文字画像に重なる領域に表示位置が設定され、かつ不可視化されている予備テキストデータとを少なくとも１組含むＨＴＭＬデータをＷｅｂデータ記憶手段に記憶しておき、翻訳処理において当該不可視化されている予備テキストデータを可視化するとともに、当該可視化されている文字画像の参照データを不可視化する。このように、Ｗｅｂページを部分的に２層構成（文字を含む画像のレイヤ及び不可視化されたテキストのレイヤ）にしておき、翻訳処理において表示される要素を切り替えることにより、当該Ｗｅｂページ（ＨＴＭＬデータ）を機械翻訳にかけたとき、文字を含む画像が表示されていた領域に翻訳後のテキストが表示されるようになる。この点において、画像内の文字が翻訳されずにそのまま表示されてしまう不具合が解消される。
また、本発明の情報処理装置は、文字を含みかつ可視化されている文字画像と該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースに対して、翻訳手段による翻訳の対象である予備テキストを可視化するとともに該翻訳手段による翻訳の対象でない文字を含む文字画像を不可視化する可視化要素切替処理を実行する。
このように、翻訳対象のＷｅｂページを部分的に２層構成（文字画像のレイヤ及び予備テキストのレイヤ）にしておき、表示される要素を切り替えることにより、当該翻訳対象Ｗｅｂページのソース（例えば、ＨＴＭＬデータ）を機械翻訳にかけたとき、文字を含む画像が表示されていた領域に翻訳後のテキストが表示されるようになる。この点において、画像内の文字が翻訳されずにそのまま表示されてしまう不具合が解消される。

＜定義＞
以下の説明中で使用される用語の意義は、それぞれ次の定義の通りとする。
・機械翻訳…コンピュータ等を利用して人手を介さず自動的に行う翻訳。
・可視化…ユーザが視認できるようにする処理を包含する概念。
・不可視化…ユーザが視認できないようにする処理を包含する概念。例えば、非表示に設定する，透明に設定する，要素を削除する，要素をコメントアウトする等の処理形態が考えられる。

＜実施形態＞
［１．実施形態の概要］
本実施形態の概要を、図２〜図５を参照して説明する。
本実施形態のシステムは、Ｗｅｂページを閲覧するユーザに対し、Ｗｅｂページ内に第１の言語で表示されている部分を、各ユーザが指定（選択）した第２の言語に翻訳するサービス（機械翻訳サービス）を提供するシステムである。
なお、以下の説明では、Ｗｅｂページ内の日本語の部分を英語に翻訳する例を用いている。

［１−１．システムの構成］
図２に示すように、本実施形態のシステムは、全体として、Ｗｅｂページを提供するＷｅｂサーバ１１，翻訳処理を行う翻訳サーバ１２及びＷｅｂブラウザを有するユーザ端末２０により構成される。
Ｗｅｂサーバ１１は、Ｗｅｂページの構造を記述するＨＴＭＬデータ及び当該ＨＴＭＬデータが参照するデータ（例えば、画像データ）を少なくとも記憶するＷｅｂＤＢ１３を有している。一方、翻訳サーバ１２は、Ｗｅｂページの機械翻訳処理において参照する辞書データを少なくとも記憶する翻訳ＤＢ１４を有している。

なお、翻訳ＤＢ１４に記憶する辞書データは、語彙や文法を定義したデータや、統計的学習手法により構築したモデルを含んでいるものとする。また、特定の語句に対する特定の訳語を定めたデータを記憶していてもよい。
本実施形態においては、ＷｅｂＤＢ１３，翻訳ＤＢ１４をＷｅｂサーバ１１，翻訳サーバ１２にそれぞれ接続された外部の記憶装置に構築しているが、記憶している情報の読出しが可能であればＷｅｂサーバ１１，翻訳サーバ１２に内蔵された記憶装置に構築してもよい。

Ｗｅｂサーバ１１と翻訳サーバ１２は、通信ネットワーク（本実施形態ではＬＡＮ等のプライベートネットワーク）により互いに接続し、機械翻訳システム１０を形成している。また、ユーザ端末２０は、通信ネットワーク（本実施形態ではインターネット３０）を介してＷｅｂサーバ１１及び翻訳サーバ１２とそれぞれ接続可能である。
なお、Ｗｅｂサーバ１１，翻訳サーバ１２，ユーザ端末２０の間の通信は、ルータ４０により制御される。

［１−２．主要な特徴］
［（ａ）実施形態１の主要な特徴］
実施形態１の主要な特徴は、文字を含まない画像の参照データ（ＵＲＬ）と、当該画像に重なる領域の前面に表示位置が設定されたテキストデータとの組を少なくとも１組含むＨＴＭＬデータをＷｅｂＤＢ１３に記憶しておく点にある。
このように、Ｗｅｂページを部分的に２層構成（文字を含まない画像のレイヤ及びテキストのレイヤ）にしておくことにより、当該Ｗｅｂページ（ＨＴＭＬデータ）を機械翻訳にかけたとき、文字を含まない画像に重なる領域の前面に翻訳後のテキストが表示されるようになる。この点において、画像内の文字が翻訳されずにそのまま表示されてしまう不具合が解消される。

図３に、実施形態１における翻訳前後のＷｅｂページの一部を示す。
翻訳前のＷｅｂページには、通常のテキスト３１０ａの他に、文字を含まない画像３２０と、画像３２０に重なる領域の前面に表示位置が設定されたテキスト３３０ａとが表示される（図３（ａ））。
一方、翻訳後のＷｅｂページには、テキスト３１０ａが翻訳されたテキスト３１０ｂと、翻訳前後において変化しない画像３２０と、テキスト３３０ａが翻訳されたテキスト３３０ｂが表示される（図３（ｂ））。

［（ｂ）実施形態２の主要な特徴］
実施形態２の主要な特徴は、文字を含み可視化されている画像の参照データ（ＵＲＬ）と、当該画像に重なる領域に表示位置が設定され、かつ不可視化されているテキストデータとを少なくとも１組含むＨＴＭＬデータをＷｅｂＤＢ１３に記憶しておき、翻訳処理において当該不可視化されているテキストデータを可視化するとともに、当該可視化されている画像データを不可視化する点にある。
このように、Ｗｅｂページを部分的に２層構成（文字を含む画像のレイヤ及び不可視化されたテキストのレイヤ）にしておき、翻訳処理において表示されるレイヤを切り替えることにより、当該Ｗｅｂページ（ＨＴＭＬデータ）を機械翻訳にかけたとき、文字を含む画像が表示されていた領域に翻訳後のテキストが表示されるようになる。この点において、画像内の文字が翻訳されずにそのまま表示されてしまう不具合が解消される。

図４に、実施形態２における翻訳前後のＷｅｂページの一部を示す。
翻訳前のＷｅｂページには、通常のテキスト４１０ａと、文字を含む画像４２０とが表示される（図４（ａ−１））。また、翻訳前のＷｅｂページは、画像４２０に重なる領域に表示位置が設定され、かつ不可視化されたテキストデータ４３０ａを有している（図４（ａ−２））。
一方、翻訳後のＷｅｂページには、テキスト４１０ａが翻訳されたテキスト４１０ｂと、テキスト４３０ａが翻訳されたテキスト４３０ｂが表示される（図４（ｂ））。なお、画像４２０は不可視化されているため、翻訳後のＷｅｂページ内では視認できない。

［２．機械翻訳の手順］
［２−１．機械翻訳手順の概要］
本実施形態のシステムによる機械翻訳処理の流れ及びデータの流れを、図５のシーケンスチャートを参照して簡単に説明する。
図５に示すように、機械翻訳システム１０を構成するＷｅｂサーバ１１及び翻訳サーバ１２は、下記〔手順１〕〜〔手順４〕によりユーザ端末２０に翻訳後のＷｅｂページを表示させる。
なお、図５のシーケンスチャートには、参照すべき他の図面の番号が付記されている。必要に応じて、当該他の図面を参照されたい。

〔手順１〕
前提として、ユーザ端末２０は、Ｗｅｂサーバ１１から提供されたＷｅｂページを表示しているものとし（Ｓ５０５ａ）、当該Ｗｅｂページを翻訳対象のＷｅｂページとする（実施形態１では図３（ａ）、実施形態２では図４（ａ−１））。また、翻訳対象のＷｅｂページには、翻訳後の言語を選択し翻訳を要求するための要素（例えば、プルダウン，ラジオボタン，プルダウン又はラジオボタンとボタン又は画像又はリンクとの組）が表示されているものとする。
翻訳対象のＷｅｂページにおいてユーザが翻訳後の言語を指定（選択）し、翻訳を要求する所定の操作を行うと、ユーザ端末２０は、翻訳サーバ１２にＷｅｂページの翻訳を要求する（Ｓ５１０ａ）。

図６に、翻訳要求の主要な項目を例示する。
翻訳要求には、「翻訳処理プログラムのＵＲＬ」，「翻訳対象ＷｅｂページのＵＲＬ」，「第１言語（翻訳対象Ｗｅｂページの言語）」，「第２言語（翻訳先の言語）」及び「テキストデータの文字コード」が含まれる。
本実施形態では、「翻訳対象ＷｅｂページのＵＲＬ」以下をＵＲＬパラメータとするＨＴＴＰリクエストを翻訳要求としている。なお、図６に示す各項目を他の形式で送信してもよい。

〔手順２〕
翻訳サーバ１２は、ユーザ端末２０から翻訳要求を受信する（Ｓ５１０ｂ）と、受信した「翻訳対象ＷｅｂページのＵＲＬ」に対応するＨＴＭＬデータの送信をＷｅｂサーバ１１に要求する（Ｓ５１５ｂ）。
Ｗｅｂサーバ１１は、翻訳サーバ１２からＨＴＭＬデータの送信要求を受信する（Ｓ５１５ｃ）と、受信した「翻訳対象ＷｅｂページのＵＲＬ」に対応するＨＴＭＬデータ（翻訳前のＨＴＭＬデータ）をＷｅｂＤＢ１３より読み出し又は生成して、翻訳サーバ１２に送信する（Ｓ５２０ｃ）。

〔手順３〕
翻訳サーバ１２は、Ｗｅｂサーバ１１から翻訳前のＨＴＭＬデータを受信する（Ｓ５２０ｂ）と、受信した翻訳前のＨＴＭＬデータを対象として機械翻訳処理を実行し、翻訳後のＨＴＭＬデータをユーザ端末２０に送信する（Ｓ５２５ｂ）。
なお、機械翻訳処理の流れ及び翻訳前後のＨＴＭＬデータについては、別に項目を設けて実施形態ごとに詳細に説明する（後述の図７〜図１０参照）。

〔手順４〕
ユーザ端末２０は、翻訳サーバ１２から翻訳後のＨＴＭＬデータを受信する（Ｓ５２５ａ）と、受信したＨＴＭＬを解釈して画像なしのＷｅｂページを表示する（Ｓ５３０ａ）とともに、当該ＨＴＭＬが参照している画像データの送信をＷｅｂサーバ１１に要求する（Ｓ５３５ａ）。
Ｗｅｂサーバ１１は、画像データの送信要求を受信する（Ｓ５３５ｃ）と、指定された画像データをＷｅｂＤＢ１３より読み出し、ユーザ端末２０に送信する（Ｓ５４０ｃ）。
ユーザ端末２０は、Ｗｅｂサーバ１１から画像データを受信する（Ｓ５４０ａ）と、既に表示されているＷｅｂページ内の所定の位置に画像を追加表示する（Ｓ５４５ａ）。表示完了後のＷｅｂページは、前述のとおりである（実施形態１では図３（ｂ）、実施形態２では図４（ｂ））。

［２−２．実施形態１の機械翻訳処理手順等］
［（ａ）翻訳前のＨＴＭＬデータ］
図７（ａ）に、実施形態１における翻訳前のＨＴＭＬデータの一部を例示する。
翻訳前のＨＴＭＬデータには、テキストデータ７１０ａの他に、画像の参照データ７２０と、テキストデータ７３０ａとが含まれている。また、いくつかのタグには、スタイルシート（ＣＳＳ形式）によりスタイルが設定されている。
テキストデータ７１０ａ，画像の参照データ７２０，テキストデータ７３０ａは、それぞれ翻訳前のＷｅｂページ（図３（ａ））のテキスト３１０ａ，画像３２０，テキスト３３０ａに対応する。

画像の参照データ７２０が参照する画像は、所定の領域（幅８４０ピクセル，高さ１２０ピクセル）の上から０ピクセル，左から０ピクセルの位置に左上の頂点を合わせて、幅８４０ピクセル，高さ１２０ピクセルで表示されるように設定されている。一方、テキストデータ７３０ａに対応するテキストは、上記所定の領域（幅８４０ピクセル，高さ１２０ピクセル）の上から３０ピクセルの位置に通常通りに表示されるように設定されている（ここでは、センタリング等）。したがって、上記の所定の領域において、画像とテキストは重なって表示される。
なお、Ｗｅｂページ内の要素はＨＴＭＬの記述順に重なる（後ろに記述された要素が前面に表示される）ため図７（ａ）の例では特に設定していないが、重ね合わせの順序を明示的に設定してもよい。重ね合わせ順序は、例えば「z-index」属性の値（数値）の大小により設定することができる。

［（ｂ）翻訳処理］
実施形態１における翻訳処理の流れを、図８のフローチャートを参照して詳細に説明する。
図８に示すように、翻訳サーバ１２は、下記〔手順３１〕〜〔手順３４〕によりＨＴＭＬデータを翻訳する。

〔手順３１〕
ＨＴＭＬの基準ＵＲＬを変更する（Ｓ８１０）。
具体的には、相対ＵＲＬ形式で記述された参照データ等（例えば、参照データ７２０（図７（ａ））中のsrc属性の値）のＵＲＬが基準とするＵＲＬを、<base>タグのhref属性の値として絶対ＵＲＬ形式で記述する。ここでは、ユーザ端末２０から受信した検索要求（図６）に含まれる「翻訳対象ＷｅｂページのＵＲＬ」を基準ＵＲＬとする。
なお、ＨＴＭＬ内のＵＲＬが全て絶対ＵＲＬ形式で記述されているという前提であれば、基準ＵＲＬを変更する処理を省略してもよい。また、相対ＵＲＬ形式で記述された全てのＵＲＬを個別に絶対ＵＲＬ形式に書き換えても同一の効果を得ることができる。

〔手順３２〕
ＨＴＭＬデータ内で要素（エレメント）の内容（コンテンツ）となっているテキストデータを１つ抽出し（Ｓ８２０）、抽出したテキストデータ（原文）を「第１言語」から「第２言語」へと翻訳して翻訳文を生成する（Ｓ８３０）。
なお、翻訳サーバ１２は、テキストの翻訳に当たり翻訳ＤＢ１４に記憶している辞書データを参照する。

〔手順３３〕
必要に応じて翻訳文のサイズを補正し（Ｓ８４０）、抽出したテキストデータを翻訳文に置換する（Ｓ８５０）。
例えば、上記＜従来例４＞と同様の手法により、文字列長を比較した上で翻訳文の長さを補正するとよい。なお、上記＜従来例５＞と同様の手法により、所定の条件を満たす語句を翻訳文中から抽出し、所定の方法により生成した省略語に置換してもよい。この場合、省略語の定義を掲載したＷｅｂページを別途生成した上で、翻訳後のＷｅｂページには省略語の定義を掲載したＷｅｂページへのリンクを表示するとよい。また、省略語にポインタを合わせたときに省略対象語句がポップアップ表示されるように構成してもよい。

〔手順３４〕
翻訳したテキストデータが、ＨＴＭＬデータ内で要素の内容となっている最後のテキストデータか否かを判定する（Ｓ８６０）。
具体的には、ＨＴＭＬデータ内で要素の内容となっている次のテキストデータを検索し、次のテキストデータが検出されないときに、直前に翻訳したテキストデータが最後のテキストデータであると判定する。最後のテキストデータでないとき（Ｓ８６０でＮｏ）、上記〔手順３２〕に戻り、次のテキストデータについて抽出〜置換の処理（〔手順３２〕〜〔手順３３〕）を繰り返す。一方、最後のテキストデータであるとき（Ｓ８６０でＹｅｓ）、ループを抜ける。

［（ｃ）翻訳後のＨＴＭＬデータ］
図７（ｂ）に、実施形態１における翻訳後のＨＴＭＬデータの一部を例示する。
図７（ｂ）は、図７（ａ）のＨＴＭＬデータを図８のフローチャートに示す処理により翻訳した後のＨＴＭＬデータである。

翻訳後のＨＴＭＬデータには、テキストデータ７１０ａが翻訳されたテキストデータ７１０ｂ，翻訳前後において変化しない画像の参照データ７２０，テキストデータ７３０ａが翻訳されたテキストデータ７３０ｂが含まれている。また、基準ＵＲＬを明示するタグ７４０ｂが追加されている。
テキストデータ７１０ｂ，画像の参照データ７２０，テキストデータ７３０ｂは、それぞれ翻訳後のＷｅｂページ（図３（ｂ））のテキスト３１０ｂ，画像３２０，テキスト３３０ｂに対応する。
なお、テキストデータ７１０ｂの文字サイズは、上記〔手順３３〕の補正処理（図８のＳ８４０）により通常の９０％に補正されている。その他のデータの設定には特に変更がない。

［２−３．実施形態２の機械翻訳処理手順等］
［（ａ）翻訳前のＨＴＭＬデータ］
図９（ａ）に、実施形態２における翻訳前のＨＴＭＬデータの一部を例示する。
翻訳前のＨＴＭＬデータには、テキストデータ９１０ａの他に、画像の参照データ９２０ａと、テキストデータ９３０ａとが含まれている。また、いくつかのタグには、スタイルシート（ＣＳＳ形式）によりスタイルが設定されている。
テキストデータ９１０ａ，画像の参照データ９２０ａは、それぞれ翻訳前のＷｅｂページ（図４（ａ−１））のテキスト４１０ａ，画像４２０に対応する。また、テキストデータ９３０ａは、翻訳前のＷｅｂページが有する不可視化されたテキストデータ４３０ａ（図４（ａ−２））に対応する。

画像の参照データ９２０ａが参照する画像は、所定の領域（幅８４０ピクセル，高さ１２０ピクセル）の上から０ピクセル，左から０ピクセルの位置に左上の頂点を合わせて、幅８４０ピクセル，高さ１２０ピクセルで表示されるように設定されている。
一方、テキストデータ９３０ａに対応するテキストは、上記所定の領域（幅８４０ピクセル，高さ１２０ピクセル）の上から３０ピクセルの位置に通常通りに表示されるように設定されている（ここでは、センタリング等）。ただし、テキストデータ９３０ａに対応するテキストは不可視化されている（文字色属性の値が透明（transparent）に設定されている）ため、Ｗｅｂブラウザのウィンドウ内では視認できない。

［（ｂ）翻訳処理］
実施形態２における翻訳処理の流れを、図１０のフローチャートを参照して説明する。
図１０に示すように、翻訳サーバ１２は、上記〔手順３１〕〜〔手順３４〕（実施形態１と同様）に加え、下記〔手順３５〕によりＨＴＭＬデータを翻訳する。
なお、図１０のフローチャートにおいて、図８のフローチャートに示した処理と同一の符号が付されている処理は、同一の処理を示す。

〔手順３５〕
不可視化されている全ての翻訳文を可視化する（Ｓ１０７０）とともに、可視化した翻訳文と重なる全ての画像を不可視化する（Ｓ１０８０）。
例えば図９（ａ）の例では、class属性の値が「class_11」である「<div>」タグのclass属性を削除する。これにより、テキストデータ９３０ａに対応するテキスト（明示的に不可視化されていたテキスト）は、親要素の属性を継承して可視化される（文字色属性が透明から有色に変更される）。また、class属性の値が「class_21」である「<img>」タグのclass属性の値を「class_22」に変更する。これにより、画像の参照データ９２０ａに対応する画像（明示的に可視化されていた画像）は、明示的に不可視化される（表示属性が表示から非表示に変更される）。
なお、翻訳文の可視化及び／又は画像の不可視化は、上記のようにクラス属性を一括で適用して行ってもよいし、該当するタグごとに個別に行ってもよい。

［（ｃ）翻訳後のＨＴＭＬデータ］
図９（ｂ）に、実施形態２における翻訳後のＨＴＭＬデータの一部を例示する。
図９（ｂ）は、図９（ａ）のＨＴＭＬデータを図１０のフローチャートに示す処理により翻訳した後のＨＴＭＬデータである。

翻訳後のＨＴＭＬデータには、テキストデータ９１０ａが翻訳されたテキストデータ９１０ｂ，参照データ９２０ａが不可視化された参照データ９２０ｂ，テキストデータ９３０ａが翻訳され可視化されたテキストデータ９３０ｂが含まれている。また、基準ＵＲＬを明示するタグ９４０ｂが追加されている。
テキストデータ９１０ｂ，テキストデータ９３０ｂは、それぞれ翻訳後のＷｅｂページ（図４（ｂ））のテキスト４１０ｂ，テキスト４３０ｂに対応する。
なお、テキストデータ９１０ｂの文字サイズは、上記〔手順３３〕の補正処理（図１０のＳ８４０）により通常の９０％に補正されている。その他のデータの設定には、特に明示したものを除き変更がない。

［３．変形例等］
［３−１．システム構成の変形例］
［（ａ）翻訳サーバが遠隔地にある構成］
上述の実施形態では、Ｗｅｂサーバ１１と翻訳サーバ１２とをＬＡＮ等のプライベートネットワークを介して接続している（図２）。これは、両サーバが同一の事業者の管理下にあることを想定した構成である。
これに対し、図１１に示すように、Ｗｅｂサーバ１１と翻訳サーバ１２とをインターネット３０等のパブリックネットワークを介して接続してもよい。これは、Ｗｅｂサーバ１１又は翻訳サーバ１２が遠隔地（例えば、他の事業所，遠隔地のデータセンター，他の事業者の管理下等）にあることを想定した構成である。

［（ｂ）Ｗｅｂサーバが翻訳処理機能を備える構成］
上述の実施形態では、Ｗｅｂサーバ１１と翻訳サーバ１２とにより機械翻訳システム１０を構成している（図２）。これは、ハードウェアごとに特定の処理機能に特化し、負荷分散を図った構成である。
これに対し、機械翻訳処理の全てのステップをＷｅｂサーバ１１が実行するように構成してもよい。この場合、図１２に示すように、Ｗｅｂサーバ１１はＷｅｂＤＢ１３と翻訳ＤＢ１４とを有する。また、ユーザ端末２０から翻訳要求を受信して、翻訳対象のＨＴＭＬデータを取得し、翻訳処理を実行し、翻訳後のＨＴＭＬデータ及び必要な画像データを送信する処理の主体は、全てＷｅｂサーバ１１となる。

［３−２．処理分担の変形例］
上述の実施形態では、Ｗｅｂサーバ１１はＨＴＭＬデータ又は画像データを送信する処理に特化している。同様に、翻訳サーバ１２はユーザ端末２０から翻訳要求を受信して翻訳後のＨＴＭＬデータを生成し、ユーザ端末２０に送信する処理に特化している（図５）。
これに対し、ユーザ端末２０から翻訳要求を受信する処理及び翻訳後のＨＴＭＬデータをユーザ端末２０に送信する処理をＷｅｂサーバ１１が担当することとし、翻訳サーバ１２はＷｅｂページの翻訳処理（図８のＳ８１０〜Ｓ８６０，図１０のＳ８１０〜Ｓ１０８０）のみに特化するように構成してもよい。

［３−３．スタイル設定の変形例］
［（ａ）不可視化されているテキストの可視化の変形例］
不可視化されているテキストを可視化する処理では、他の設定項目との整合性を考慮した上で、例えば次の手法を採用してもよい。
・<div>要素のvisibility属性（表示属性）を「hidden」から「visible」（デフォルト）に変更する
・テキストデータそのもの又は該テキストデータを内容とする要素全体を挟んでいるコメントタグを削除する。

［（ｂ）可視化されている画像の不可視化の変形例］
可視化されている画像を不可視化する処理では、他の設定項目との整合性を考慮した上で、例えば次の手法を採用してもよい。
・<div>要素全体又は<img>タグをコメントタグで挟む（コメントアウトする）
・<div>要素全体又は<img>タグを削除する
・<div>要素のvisibility属性（表示属性）を「visible」（デフォルト）から「hidden」に変更する
・<div>要素又は<img>タグのdisplay属性（表示形式）を「none」に変更する

［（ｃ）不可視化の概念］
上述の実施形態２では、不可視化という用語を、「全く視認できない」ようにする処理を包含する概念として用いている。
これに対し、半透明に設定する，透過性を高める，グレイアウトする，極めて薄い色に設定する（ＲＧＢの各値をいずれも概ね２００以上に設定する）等、ユーザが「殆ど視認できない」ようにする処理によっても、「不可視化」と同様の効果を奏する場合がある。したがって、これらの処理も「不可視化」と実質的に等価である。

［３−４．スタイル設定の変形例］
上述の実施形態１では、ＨＴＭＬのタグに個別にスタイルを設定している（図７）。また、上述の実施形態２では、ＨＴＭＬソース内で定義したスタイルを特定のクラス名が付された全てのタグに適用するようにしている（図９）。
これに対し、所定のスタイルシート言語（例えば、CSS（Cascading Style Sheets））で記述した外部ファイルを参照することによりスタイルを適用してもよい。また、スタイルを全てＨＴＭＬタグの属性により設定してもよい。

［４．ソースコードの記載例，Ｗｅｂページの表示例］
図１３に例示するＨＴＭＬのソースに対し、図１４に例示するスタイルシートのソース（ファイル名「test.css」）を関連付ける。このとき、ＨＴＭＬ中のテキストの表示位置は、図１５に例示する画像（ファイル名「test.gif」）に合わせて、図１６に例示するようにそれぞれ設定される。なお、図１６は、最上部の白色文字が明確になるように背景を灰色にして示した。
図１７に、図１３に例示するＨＴＭＬのソースをＷｅｂブラウザに読み込んだＷｅｂページ表示例を示す。このように、画像の背景部分と文字部分とを分離して２層構成（画像のレイヤ，テキストのレイヤ）にすることで、文字部分のみを機械翻訳の対象にすることができる。なお、図１７に示す表示例は、文字と一体化された画像（図１８）と比較しても、十分な表現性を備えている。

（従来例）（ａ）翻訳前のＷｅｂページの一部，（ｂ）翻訳後のＷｅｂページの一部を示す図である。システムの構成例を示す図である。（実施形態１）（ａ）翻訳前のＷｅｂページの一部，（ｂ）翻訳後のＷｅｂページの一部を示す図である。（実施形態２）（ａ−１）翻訳前のＷｅｂページの一部，（ａ−２）翻訳前のＷｅｂページが有する不可視化されたデータ，（ｂ）翻訳後のＷｅｂページの一部を示す図である。（実施形態）機械翻訳手順を示すシーケンスチャートである。（実施形態）翻訳要求の主要な項目を示す図である。（実施形態１）（ａ）翻訳前のＨＴＭＬソースの一部，（ｂ）翻訳後のＨＴＭＬソースの一部を示す図である。（実施形態１）翻訳処理の流れを示すフローチャートである。（実施形態２）（ａ）翻訳前のＨＴＭＬソースの一部，（ｂ）翻訳後のＨＴＭＬソースの一部を示す図である。（実施形態２）翻訳処理の流れを示すフローチャートである。（他の実施形態）システム構成の変形例を示す図である。（他の実施形態）システム構成の変形例を示す図である。（他の実施形態）ＨＴＭＬデータのソースの記載例である。（他の実施形態）スタイルシートのソースの記載例である。（他の実施形態）参照画像の表示例である。（他の実施形態）テキストの表示位置を例示する図である。（他の実施形態）日本語のＷｅｂページの表示例である。（他の実施形態）文字を含む画像の表示例である。

符号の説明

１０機械翻訳システム
１１Ｗｅｂサーバ
１２翻訳サーバ
１３ＷｅｂＤＢ
１４翻訳ＤＢ
２０ユーザ端末
３０インターネット
４０ルータ

Claims

ある言語で表現されたＷｅｂページを提供するとともに、該Ｗｅｂページを他の言語に翻訳する機械翻訳システムであって、
Ｗｅｂページを閲覧するユーザの端末と通信ネットワークを介して接続しており、
ある言語で表現されたＷｅｂページの構造を記述するＨＴＭＬデータと、ＨＴＭＬデータが参照する画像データとを少なくとも記憶するＷｅｂデータ記憶手段と、
テキストの翻訳処理に利用される辞書データを少なくとも記憶する翻訳データ記憶手段と
を有し、
前記Ｗｅｂデータ記憶手段に記憶するＨＴＭＬデータは、文字を含み可視化されている画像を示す文字画像と、該文字画像に重なる所定位置の前面に表示位置が設定され、かつ不可視化されている前記ある言語のテキストを示す予備テキストとの組を少なくとも１組含み、
翻訳対象のＷｅｂページに対応するＵＲＬと、翻訳先言語の指定データとを少なくとも含む翻訳要求を前記端末から受信する翻訳要求受信手段と、
前記受信したＵＲＬに対応するＷｅｂページの構造を記述するＨＴＭＬデータを前記Ｗｅｂデータ記憶手段より取得するＨＴＭＬデータ取得手段と、
前記翻訳データ記憶手段に記憶している辞書データを参照して、前記取得したＨＴＭＬデータ中の前記予備テキストを含む所定の翻訳対象テキストを前記受信した指定データに対応する翻訳先言語に翻訳するテキスト翻訳手段と、
前記取得したＨＴＭＬデータ中の不可視化されており且つ前記テキスト翻訳手段により翻訳された前記予備テキストを可視化するとともに、該ＨＴＭＬデータ中の可視化されている前記文字画像を不可視化する可視化要素切替手段と、
前記可視化要素切替手段により処理された前記ＨＴＭＬデータを前記端末に送信する翻訳済ＨＴＭＬデータ送信手段と、
前記端末からの画像データを指定した送信要求に応じて、該指定された画像データを前記Ｗｅｂデータ記憶手段より読み出して該端末に送信する画像データ送信手段と
を備える
ことを特徴とする機械翻訳システム。
請求項１に記載の機械翻訳システムにおいて、
前記可視化要素切替手段は、テキストの文字色属性を透明から有色に変更し、テキストを含む領域の表示属性を非表示から表示に変更し又はテキストを含む領域のタグを挟むコメントタグを削除する、ことにより不可視化されている前記予備テキストを可視化する
ことを特徴とする機械翻訳システム。
請求項１又は２に記載の機械翻訳システムにおいて、
前記可視化要素切替手段は、画像の表示属性を表示から非表示に変更し、画像に対応するタグを削除し、画像に対応するタグをコメントタグで挟み、画像を含む領域の表示属性を表示から非表示に変更し又は画像を含む領域に対応するタグをコメントタグで挟む、ことにより可視化されている前記文字画像を不可視化する
ことを特徴とする機械翻訳システム。
請求項１〜３のいずれか１項に記載の機械翻訳システムにおいて、
前記翻訳済ＨＴＭＬデータ送信手段は、前記取得したＨＴＭＬデータの基準ＵＲＬを、前記受信した翻訳要求に含まれる翻訳対象のＷｅｂページのＵＲＬに変更する
ことを特徴とする機械翻訳システム。
請求項１〜４のいずれか１項に記載の機械翻訳システムにおいて、
前記翻訳済ＨＴＭＬデータ送信手段は、翻訳後の前記予備テキストの長さが前記取得したＨＴＭＬ中の翻訳前の前記予備テキストの長さと比較して一定以上長いとき、該翻訳後の前記予備テキストの長さを短く補正する
ことを特徴とする機械翻訳システム。
ある言語で表現されたＷｅｂページを提供するとともに、該Ｗｅｂページを他の言語に翻訳する機械翻訳システムによる機械翻訳方法であって、
前記機械翻訳システムは、Ｗｅｂページを閲覧するユーザの端末と通信ネットワークを介して接続しており、
ある言語で表現されたＷｅｂページの構造を記述するＨＴＭＬデータと、ＨＴＭＬデータが参照する画像データとを少なくとも記憶するＷｅｂデータ記憶手段と、
テキストの翻訳処理に利用される辞書データを少なくとも記憶する翻訳データ記憶手段とを有し、
前記Ｗｅｂデータ記憶手段に記憶するＨＴＭＬデータは、可視化されている画像を示す文字画像と、該文字画像に重なる所定位置の前面に表示位置が設定され、かつ不可視化されている前記ある言語のテキストを示す予備テキストとの組を少なくとも１組含み、
翻訳対象のＷｅｂページに対応するＵＲＬと、翻訳先言語の指定データとを少なくとも含む翻訳要求を前記端末から受信する翻訳要求受信ステップと、
前記受信したＵＲＬに対応するＷｅｂページの構造を記述するＨＴＭＬデータを前記Ｗｅｂデータ記憶手段より取得するＨＴＭＬデータ取得ステップと、
前記翻訳データ記憶手段に記憶している辞書データを参照して、前記取得したＨＴＭＬデータ中の前記予備テキストを含む所定の翻訳対象テキストを前記受信した指定データに対応する翻訳先言語に翻訳するテキスト翻訳ステップと、
前記取得したＨＴＭＬデータ中の不可視化されており且つ前記テキスト翻訳ステップにおいて翻訳された前記予備テキストを可視化するとともに、該ＨＴＭＬデータ中の可視化されている前記文字画像を不可視化する可視化要素切替ステップと、
前記可視化要素切替ステップにおいて処理された前記ＨＴＭＬデータを前記端末に送信する翻訳済ＨＴＭＬデータ送信ステップと、
前記端末からの画像データを指定した送信要求に応じて、該指定された画像データを前記Ｗｅｂデータ記憶手段より読み出して該端末に送信する画像データ送信ステップと
を備える
ことを特徴とする機械翻訳方法。
請求項１〜５のいずれか１項に記載の機械翻訳システムが備える各手段を１又は複数のコンピュータに機能として実現させるためのプログラム。
文字を含み可視化されている文字画像と、該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得手段と、
Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替手段と、
前記可視化要素切替処理が実行されたソースを出力する出力手段と、
を備える情報処理装置。
文字を含みかつ可視化されている文字画像と該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得ステップと、
Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替ステップと、
前記可視化要素切替処理が実行されたソースを出力する出力ステップと、
を含む、コンピュータによる情報処理方法。
文字を含みかつ可視化されている文字画像と該文字画像に重なるように表示位置が設定されかつ不可視化されている予備テキストとの組を少なくとも１組含む翻訳対象Ｗｅｂページの構造を記述するソースを取得する取得機能と、
Ｗｅｂページの構造を記述するソース中の翻訳対象テキストを翻訳する翻訳手段により翻訳された前記予備テキストを可視化するとともに前記文字画像を不可視化する可視化要素切替処理を、前記取得されたソースに対して実行する可視化要素切替機能と、
前記可視化要素切替処理が実行されたソースを出力する出力機能と、
をコンピュータに実行させるためのプログラム。