JPH1145245A - 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法 - Google Patents

外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法

Info

Publication number
JPH1145245A
JPH1145245A JP9217129A JP21712997A JPH1145245A JP H1145245 A JPH1145245 A JP H1145245A JP 9217129 A JP9217129 A JP 9217129A JP 21712997 A JP21712997 A JP 21712997A JP H1145245 A JPH1145245 A JP H1145245A
Authority
JP
Japan
Prior art keywords
translated
translation
target document
foreign language
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9217129A
Other languages
English (en)
Inventor
Naoyuki Nomura
直之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9217129A priority Critical patent/JPH1145245A/ja
Publication of JPH1145245A publication Critical patent/JPH1145245A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 より自然な翻訳結果を得ることが可能な外国
語文読解支援システムを提供する。 【解決手段】 まず最初に翻訳対象文書(英語等)か
ら、自然言語処理により複合名詞句等の所定の非訳出語
句を抽出する。そして非訳出語句の部分を逐語訳するこ
となく、カタカナ表記に変換して対象文書全体を翻訳す
る。このようにすることで、例えば「Action Manager」
を変に逐語訳せずに、「アクション マネージャ」とカ
タカナ表記することで、その内容を知っている文章全体
としての読解が容易になる。また、内容を知らないユー
ザであっても、意味不明の逐語訳よりも、特殊な語句で
あることを前提に他の部分を読むことができるため混乱
することなく読み進むことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、外国語文読解支援
システム、外国語文読解支援プログラムが記憶された記
憶媒体、及び外国語文読解支援方法に係り、詳細には、
取得した文書の翻訳に関する。
【0002】
【従来の技術】外国語で記載された文書を日本語の文書
に翻訳するシステムのように、所定の言語で作成された
文書(外国語文)をそれと異なる言語の文書に翻訳する
翻訳システムが実用化されている。翻訳システムは、イ
ンターネットやパソコン通信等の各種通信により自由に
且つ大量に情報を入手できるようになった現在では、広
く使用されるようになってきている。この翻訳システム
では、翻訳用の辞書を使用して原文(翻訳対象文書)を
一定のアルゴリズムに従って所定の言語に翻訳してい
る。翻訳は比較的短時間で行われるため、通信を行って
いる場合に外国語で作成されたホームページを理解する
うえで有効である。
【0003】
【発明が解決しようとする課題】しかし、従来の翻訳シ
ステムでは、辞書中に存在しない語句が原文中にある
と、その語句を逐語訳しているため、文全体としてよく
わからない翻訳になったり、時には読解不能になる場合
もあった。これは、本来一体として意味をなすべき複合
名詞句等の語句を正確に認識できていないにもかかわら
ず、これらの語句おを分離して逐語訳をしてしまうため
である。例えば、図13に示すように、「Action Manag
er is now varing. So…」といった原文に対して、従来
の翻訳システムでは、翻訳辞書に存在しない「Action M
anager」の部分を逐語訳により「演技課長」と翻訳して
しまう。その結果、「演技課長は、今や多様化してい
る。従って…」という翻訳文では何のことかよくわから
なかった。
【0004】そこで本発明は、前記従来の課題を解決す
るために成されたもので、より自然な翻訳結果を得るこ
とが可能な外国語文読解支援システムを提供することを
第1の目的とする。また本発明は、より自然な翻訳結果
を得ることが可能な外国語文読解支援プログラムが記憶
された記憶媒体を提供することを第2の目的とする。ま
た本発明は、より自然な翻訳結果を得ることが可能な外
国語文読解支援方法を提供することを第3の目的とす
る。
【0005】
【課題を解決するための手段】請求項1に記載した外国
語文読解支援システムでは、図5に示すように、翻訳対
象となる対象文書を取得する対象文書取得手段501
と、この対象文書取得手段501で取得された対象文書
から非訳出語句を抽出する非訳出語句抽出手段502
と、翻訳辞書503と、前記翻訳辞書503を使用して
前記対象文書を翻訳する翻訳手段504とを備え、前記
翻訳手段504は、前記非訳出語句抽出手段502で抽
出された非訳出語句の訳語として前記対象文書中の原文
表記を訳語として翻訳することにより、前記第1の目的
を達成する。請求項2に記載した外国語文読解支援シス
テムでは、図6に示すように、翻訳対象となる対象文書
を取得する対象文書取得手段501と、前記対象文書取
得手段501で取得された対象文書から非訳出語句を抽
出する非訳出語句抽出手段502と、前記非訳出語句抽
出手段502で抽出された非訳出語句を翻訳対象語によ
る表記に変換する表記変換手段505と、翻訳辞書50
3と、前記翻訳辞書503を使用して前記対象文書を翻
訳する翻訳手段506とを備え、前記翻訳手段506
は、前記非訳出語句抽出手段502で抽出された非訳出
語句の訳語として、前記表記変換手段505により変換
された表記、または、前記表記変換手段505により変
換された表記と前記対象文書中の原文表記の両表記を使
用して、前記対象文書を翻訳することにより、前記第1
の目的を達成する。請求項3に記載した発明では、図
6、図7に示すように、請求項1又は請求項2に記載し
た外国語文読解支援システムにおいて、前記非訳出語句
抽出手段505は、前記翻訳辞書503中には独立して
存在しない名詞句を非訳出語句として抽出する。請求項
4に記載した発明では、図6、図7に示すように、請求
項1又は請求項2に記載した外国語文読解支援システム
において、前記非訳出語句抽出手段502は、複合名詞
句を非訳出語句として抽出する。請求項5に記載した発
明では、図7に1例を示すように、請求項1から請求項
4のうちのいずれか1の請求項に記載の外国語文読解支
援システムにおいて、前記非訳出語句の重要度を判定す
る重要度判定手段507を備え、前記翻訳手段504
は、この重要度判定手段507により判定された重要度
に応じて前記非訳出語句を他の翻訳部分と区別して表示
する。請求項6に記載した発明では、図7に1例を示す
ように、請求項1から請求項4のうちのいずれか1の請
求項に記載の外国語文読解支援システムにおいて、前記
対象文書取得手段501により取得された対象文書の段
落、文、及び非訳出語句のうちの少なくとも1つの単位
に対する類似文書または関連記述を検索する検索手段5
08と、前記検索手段508で検索された類似文書また
は関連記述を、該当単位に関連付ける関連付け手段50
9と、を具備させる。請求項7に記載した発明では、図
9に示すように、翻訳対象となる対象文書を取得する対
象文書取得機能601と、この対象文書取得機能601
で取得された対象文書から非訳出語句を抽出する非訳出
語句抽出機能602と、翻訳辞書603と、前記翻訳辞
書603を使用して前記対象文書を翻訳する翻訳機能6
04とを備え、前記翻訳機能604は、前記非訳出語句
抽出機能602で抽出された非訳出語句の訳語として前
記対象文書中の原文表記を訳語として翻訳することをコ
ンピュータに実現させるためのコンピュータ読取り可能
な外国語文読解支援プログラムが記憶された記憶媒体と
することで、前記第2の目的を達成する。請求項8に記
載した発明では、図10に示すように、翻訳対象となる
対象文書を取得する対象文書取得機能601と、前記対
象文書取得機能601で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出機能602と、前記非訳
出語句抽出機能602で抽出された非訳出語句を翻訳対
象語による表記に変換する表記変換機能605と、翻訳
辞書603と、前記翻訳辞書603を使用して前記対象
文書を翻訳する翻訳機能604とを備え、前記翻訳機能
604は、前記非訳出語句抽出機能602で抽出された
非訳出語句の訳語として、前記表記変換機能605によ
り変換された表記、または、前記表記変換機能605に
より変換された表記と前記対象文書中の原文表記の両表
記を使用して、前記対象文書を翻訳することをコンピュ
ータに実現させるためのコンピュータ読取り可能な外国
語文読解支援プログラムが記憶された記憶媒体とするこ
とで、前記第2の目的を達成する。請求項9に記載した
発明では、図9、図10に示すように、請求項7または
請求項8に記載した外国語文読解支援プログラムが記憶
された記憶媒体において、前記非訳出語句抽出機能60
2は、前記翻訳辞書中には独立して存在しない名詞句を
非訳出語句として抽出する。請求項10に記載した発明
では、図9、図10に示すように、請求項7または請求
項8に記載した外国語文読解支援プログラムが記憶され
た記憶媒体において、前記非訳出語句抽出機能602
は、複合名詞句を非訳出語句として抽出する。請求項1
1に記載した発明では、図11に1例を示すように、請
求項7から請求項10のうちのいずれか1の請求項に記
載の外国語文読解支援プログラムが記憶された記憶媒体
において、前記非訳出語句の重要度を判定する重要度判
定機能607を備え、前記翻訳機能604は、この重要
度判定機能607により判定された重要度に応じて前記
非訳出語句を他の翻訳部分と区別して表示する。請求項
12に記載した発明では、図12に1例を示すように、
請求項7から請求項11のうちのいずれか1の請求項に
記載の外国語文読解支援プログラムが記憶された記憶媒
体において、前記対象文書取得機能601により取得さ
れた対象文書の段落、文、及び非訳出語句のうちの少な
くとも1つの単位に対する類似文書または関連記述を検
索する検索機能608と、前記検索機能608で検索さ
れた類似文書または関連記述を、該当単位に関連付ける
関連付け機能609と、を具備させる。請求項13に記
載した外国語文読解支援方法では、翻訳辞書を使用して
前記対象文書を翻訳する際に、翻訳対象となる対象文書
から非訳出語句を抽出701し、抽出した非訳出語句の
訳語として、翻訳対象語による表記に変換した非訳出語
句の表記と、前記対象文書中の原文表とのうちの少なく
とも一方の表記を使用して翻訳702する。
【0006】
【発明の実施の形態】以下、本発明の外国語文読解支援
システム、外国語文読解支援プログラムが記憶された記
憶媒体、及び外国語文読解支援方法における好適な実施
の形態について、図1から図9を参照して説明する。 (1)実施形態の概要 本実施形態による外国語文読解支援は、まず最初に翻訳
対象文書(英語等)から、自然言語処理により複合名詞
句等の所定の非訳出語句を抽出する。そして非訳出語句
の部分を逐語訳することなく、カタカナ表記に変換して
対象文書全体を翻訳する。このようにすることで、例え
ば「Action Manager」を変に逐語訳せずに、「アクショ
ン マネージャ」とカタカナ表記することで、その内容
を知っている文章全体としての読解が容易になる。ま
た、内容を知らないユーザであっても、意味不明の逐語
訳よりも、特殊な語句であることを前提に他の部分を読
むことができるため混乱することなく読み進むことがで
きる。
【0007】(2)実施の形態の詳細 本実施形態の外国語文読解支援システムは、パーソナル
コンピュータやワードプロセッサ等を含むコンピュータ
システムで構成するだけでなく、LAN(ローカル・エ
リア・ネットワーク)のサーバ、コンピュータ(パソコ
ン)通信のホスト、インターネット上に接続されたコン
ピュータシステム等によって構成することも可能であ
る。また、ネットワーク上の各機器に機能分散させ、ネ
ットワーク全体で外国語文読解支援システムを構成する
ことも可能である。
【0008】図1は、外国語文読解支援システムの構成
を表したブロック図である。外国語文読解支援システム
は、図1に示すようにシステム全体を制御するための制
御部11を備えている。この制御部11には、データバ
ス等のバスライン21を介して、入力装置としてのキー
ボード12やマウス13、表示装置14、印刷装置1
5、記憶装置16、記憶媒体駆動装置17、通信制御装
置18、入出力I/F19、及び文字認識装置20が接
続されている。制御部11は、CPU111、ROM1
12、RAM113を備えている。ROM112は、C
PU111が各種制御や演算を行うための各種プログラ
ムやデータが予め格納されたリードオンリーメモリであ
る。
【0009】RAM113は、CPU111にワーキン
グメモリとして使用されるランダムアクセスメモリであ
る。このRAM113には、本実施形態による外国語文
読解支援処理を行うためのエリアとして、翻訳対象とな
る対象文書が格納される対象文書格納エリア1131
と、対象文書から翻訳しない語句として抽出した非訳出
語句とそのカタカナ表記を格納する非訳出語句格納エリ
ア1132と、非訳出語句にカタカナ表記を使用して翻
訳した翻訳文書を格納する翻訳文書格納エリア1133
その他の各種エリアが確保されるようになっている。
【0010】キーボード12は、自システム内で対象文
書や他言語を入力する場合の対象文書取得手段や他言語
入力手段の一部を構成し、かな文字を入力するためのか
なキーやテンキー、各種機能を実行するための機能キ
ー、カーソルキー、等の各種キーが配置されている。マ
ウス13は、ポインティングデバイスであり、表示装置
14に表示されたキーやアイコン等を左クリックするこ
とで対応する機能の指定を行う入力装置である。表示装
置14は、例えばCRTや液晶ディスプレイ等が使用さ
れる。この表示装置には、キーボード12やマウス13
による入力結果が表示されたり、外国語文読解支援処理
における、対象文書や翻訳文書等が表示されたりするよ
うになっている。印刷装置15は、表示装置14に表示
された文書や、記憶装置16の文書格納部164に格納
された文書等や、ユーザに対する請求書の印刷を行うた
めのものである。この印刷装置としては、レーザプリン
タ、ドットプリンタ、インクジェットプリンタ、ページ
プリンタ、感熱式プリンタ、熱転写式プリンタ、等の各
種印刷装置が使用される。
【0011】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に使用される記憶媒体としては、主と
してハードディスクが使用されるが、後述の記憶媒体駆
動装置17で使用される各種記憶媒体のうちの読み書き
可能な記憶媒体を使用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、プログラム格納部1
62、データ格納部163、文書データベース164、
アクセス履歴データベース165、翻訳に使用される翻
訳辞書165、図示しないその他の格納部(例えば、こ
の記憶装置16内に格納されているプログラムやデータ
等をバックアップするための格納部)等を有している。
プログラム格納部162には、本実施形態における外国
語文読解支援処理プログラム、非訳出語句抽出プログラ
ム等の各種プログラムの他、仮名漢字変換辞書161を
使用して入力された仮名文字列を漢字混り文に変換する
仮名漢字変換プログラム等の各種プログラムが格納され
ている。データ格納部163には、ユーザに関するデー
タ等の、システムが必要とする各種データが格納されて
いる。文書データベース164には、主として日本語の
文書が多数格納されている。必要に応じてこの日本語文
書のなかから所定の文書等と類似している類似文書が検
索される。この文書データベース164に格納される各
文書の形式は特に限定されるものではなく、テキスト形
式の文書、HTML(Hyper Text Markup Language)形
式の文書、JIS形式の文書等の各種形式の文書の格納
が可能である。
【0012】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラム等には、本実
施形態の外国語文読解支援システムにより実行される外
国語文読解支援処理等の各種処理プログラム、および、
そこで使用される辞書、データ等も含まれる。ここで、
記憶媒体とは、コンピュータプログラムやデータ等が記
憶される記憶媒体をいい、具体的には、フロッピーディ
スク、ハードディスク、磁気テープ等の磁気記憶媒体、
メモリチップやICカード等の半導体記憶媒体、CD−
ROMやMO、PD(相変化書換型光ディスク)等の光
学的に情報が読み取られる記憶媒体、紙カードや紙テー
プ等の用紙(および、用紙に相当する機能を持った媒
体)を用いた記憶媒体、その他各種方法でコンピュータ
プログラム等が記憶される記憶媒体が含まれる。本実施
形態の外国語文読解支援システムにおいて使用される記
憶媒体としては、主として、CD−ROMやフロッピー
ディスクが使用される。記憶媒体駆動装置17は、これ
らの各種記憶媒体からコンピュータプログラムを読み込
む他に、フロッピーディスクのような書き込み可能な記
憶媒体に対してRAM113や記憶装置16に格納され
ているデータ等を書き込むことが可能である。
【0013】本実施形態の外国語文読解支援システムで
は、制御部11のCPU111が、記憶媒体駆動装置1
7にセットされた外部の記憶媒体からコンピュータプロ
グラムを読み込んで、記憶装置16の各部に格納(イン
ストール)する。そして、本実施形態による外国語文読
解支援処理等の各種処理を実行する場合、記憶装置16
から該当プログラムをRAM113に読み込み、実行す
るようになっている。但し、記憶装置16からではな
く、記憶媒体駆動装置17により外部の記憶媒体から直
接RAM113にプログラムを読み込んで実行すること
も可能である。また、外国語文読解支援システムによっ
ては、本実施形態の外国語文読解支援処理プログラム等
を予めROM112に記憶させておき、これをCPU1
11が実行するようにしてもよい。さらに、本実施形態
の外国語文読解支援処理プログラム等の各種プログラム
やデータを、通信制御装置18を介して他の記憶媒体か
らダウンロードし、実行するようにしてもよい。
【0014】通信制御装置18は、外国語文読解支援シ
ステムと他のパーソナルコンピュータやワードプロセッ
サ等の各種電子機器との間をネットワーク接続するため
の制御装置である。通信制御装置18は、これら各種電
子機器が有している対象文書と同一の言語の文書、入力
された他言語の文書、および同一言語や他言語の文書の
データベースを検索対象としてアクセスすることが可能
になっている。対象となる文書には、テキスト形式やH
TML形式等の各種形式の文書の他、ビットマップデー
タ等の各種データも含まれる。入出力I/F19は、音
声や音楽等の出力を行うスピーカ等の各種機器を接続す
るためのインターフェースである。文字認識装置20
は、用紙等に記載された文字をテキスト形式やHTML
等の各種形式で認識する装置であり、イメージスキャナ
や文字認識プログラム等で構成されている。
【0015】本実施形態では、キーボード12の入力操
作により作成され文書(RAM113の所定格納エリア
に格納)の他、記憶媒体駆動装置17により記憶媒体か
ら読み出した外部で作成された文書、予め文書データベ
ースに格納されている文書、通信制御装置18からダウ
ンロードした文書、及び文字認識装置20で文字認識し
た文書、等の各種文書を翻訳の対象となる対象文書とし
て取得する(文書取得手段)ことが可能である。
【0016】以上のように構成された本実施形態の外国
語文読解支援システムによる外国語文読解支援処理の動
作について、図2から図4を使用して説明する。本実施
形態では、翻訳を希望する文書(原文)が英語で記載さ
れており、これを日本語に翻訳する場合を例に説明す
る。
【0017】図2は外国語文読解支援処理のメイン動作
を表したフローチャートである。CPU111は、まず
外国語文読解支援(翻訳)を希望する対象文書(原文)
を、取得し(ステップ11)。
【0018】そしてキーボード12やマウス13等の入
力装置で指定された原文の言語(例えば英語)と翻訳言
語(例えば日本語)、及び、表示形式を取得し、RAM
113の所定格納エリアに格納する(ステップ12)。
ここで、ユーザにより原文言語の指定がされない場合、
CPU111は、取得した対象文書を解析して言語を特
定する。解析は、各言語固有の表記文字の存在をチェッ
クすることで行う。また、翻訳言語のユーザ選択は原則
として必須項目であるため、選択がされない場合には、
画面表示により選択を促す。ただし、外国語文読解支援
システムが1種類の翻訳(例えば、英語から日本語の
み)だけが可能である場合には、原文言語と翻訳言語の
取得と格納は不要である。CPU111は、原文言語、
翻訳言語、表示形式を取得する場合、翻訳可能な言語の
組み合わせと、表示形式を画面に表示してユーザに選択
してもらうようにする。
【0019】次にCPU111は、RAM113の対象
文書格納エリア1132に格納した対象文書から、原文
言語に対応したプ非訳出語句抽出プログラムを起動し、
非訳出語句を資源言語処理(NLP)抽出し、抽出した
非訳出語句(原文の表記)を非訳出語句格納エリア11
32に格納する(ステップ13)。ここで、非訳出語句
として抽出する語句の例としては、複合名詞句が抽出さ
れ、その例として、名詞+代名詞、名詞+固有名詞、固
有名詞+冠詞+普通名詞(例;Billy the kid )、形容
詞+普通名詞+固有名詞(例;Mad scientist Doctor E
mett Brown)等がある。更に例示すれば、原文言語が英
語の場合、「An incremental utterance taskoriented
dialogue production system 」、「An Internet based
wide area computer assisted foreign language lear
ning prototype demonstration system」等の複合名詞
句が非訳出語句として抽出される。
【0020】次にCPU111は、ステップ12で指定
された表示形式が、カタカナ表示を含む表示形式か否か
を確認する(ステップ14)。カタカナ表示を含む表示
形式である場合には(;Y)、ステップ13で抽出した
非訳出語句をカタカナ表記に変換し(表記変換手段)、
非訳出語句に対応させて変換したカタカナ表記を非訳出
語句格納エリア1132に格納する(ステップ15)。
ここで、非訳出語句のカタカナ表記への変換は、原文が
英語の場合にはローマ字読みにより、または、各単語の
発音記号により変換する。
【0021】そして、CPU111は、翻訳辞書165
と、非訳出語句格納エリア1132に格納された非訳出
語句及び/又はカタカナ表記(選択された表示形式によ
って選択)とを使用して対象文書を翻訳し翻訳結果を翻
訳文書格納エリア1133に格納する(ステップ1
6)。翻訳が終了するとCPU111は、RAM113
に格納した翻訳文書を指定された表示形式で表示して
(ステップ17)、処理を終了する。
【0022】図3は、表示形式として「カタカナ表記」
が選択された場合の翻訳結果の表示画面を表したもので
ある。この図3では、原文(対象文書)と日本語翻訳結
果とを横に対比して表示しているが、いずれか一方のみ
を表示したり、上下に対比して表示したりすることも可
能である。この図に示したように、非訳出語句「Action
Manager」を変に「演技課長」といった意味不明の語に
逐語訳せず、「アクション マネージャ」と一括してカ
タカナで表記しているので、当該言語を知っているユー
ザは直ちに理解することができる。また、当該言語を知
らないユーザであっても、意味不明の逐語訳で文章全体
がわからなくなるということがなく、特殊な語句である
ことを前提に他の部分を読むことができるため混乱する
ことなく読み進むことができる。
【0023】図4は、他の表示形式が選択された場合の
表示画面を表したものであり、(A)は「原文表記」の
表示画面、(B)は「カタカナ表記(原文表記)」の表
示画面をあらわしたものである。この図に示すように、
原文表記をすることで、その原文の語学力があるユーザ
にとっては原文表記から直ちに内容を理解することがで
き、そうでないユーザとては、原文表記から辞書等によ
って調べなければいけない単語を明確にすることができ
る。なお、図示しないが、表示形式として「原文表記
(カタカナ表記)」が選択された場合には、非訳出語句
「Action Manager」にたいして、「Action Manager(ア
クション マネージャ)」と表示する。
【0024】以上、本実施形態による対象文書に対して
カタカナ表記/原文表記混りの翻訳を行う処理について
説明したが、更に、以下の処理を行うようにしてもよ
い。すなわち、ステップ13で抽出した非訳出語句の重
要度を対象文書を使用して判定し、その重要度に応じ
て、翻訳結果の翻訳文中の原文表記やカタカナ表記部分
を他の部分特別して表示するようにする。原文表記やカ
タカナ表記の区別表示としては、色、濃度、文字サイ
ズ、文字の太さ等の文字飾り情報等を用いて強調した
り、逆強調したりするようにしてもよい。強調するのは
重要度が高い場合で、赤等の目立つ色、高濃度、拡大文
字(重要度に応じて大きさを変える)、太文字、のいず
れか1以上により強調する。逆強調するのは重要度が低
い場合で、水色や灰色等の目立たない色、低濃度、縮小
文字、細文字、の1以上により目立たないように逆強調
する。
【0025】非訳出語句の重要度の判定方法としては、
各種提案されている公知の重要語判定方法を使用する。
例えば、PU111は、形態素解析を行うことで対象文
書から自立語を抽出して候補語とする。そして抽出した
候補語の対象文書中での出現頻度、評価関数から、各候
補語の重要度を決定し、一定の閾値以上の重要度を有す
る候補語を重要語とする。ここで、評価関数としては、
例えば、所定の語句が予め指定されている場合にはその
語句に対する重み付け等が使用される。そして、非訳出
語句中に出現する重要語候補をチェックし、重要度の合
計値をその非訳出語句の重要度とする。
【0026】また、非訳出語句の重要度の判定方法とし
て、「全文情報からの意味的情報の抽出と加工」(情報
処理学会第38回全国大会予稿集、第222頁;198
9年)で提案されているように、文書中の重要語を字種
や動詞等の情報から抽出して判定するようにしてもよ
い。
【0027】また、本実施形態による対象文書に対して
カタカナ表記/原文表記混りの翻訳を行う処理に加え
て、更に、以下の処理を行うようにしてもよい。すなわ
ち、ステップ11で取得した対象文書の、段落、文、非
訳出語句のうちの少なくとも1つ毎に、による類似文書
または関連記述を検索し、ハイパーリンクを付ける。そ
して、ユーザーが当該箇所にスクロールしたりマウスカ
ーソルをかざしたりした際に、バルーン(吹き出し)状
に関連文書名一覧や文書内容の一部(先頭や要約)を表
示し、理解を支援する。この際、母国語の関連文書を優
先表示するようにしてもよい。
【0028】ここで、類似文書の検索は、公知の各種検
索方法を使用することができ、例えば、文書の特徴を表
す文書ベクトル(文書中に含まれるキーワードの重要度
を要素とするベクトル)を使用し、2文書に対する文書
ベクトル間の角度に依存するコサインにより以下のよう
にして両文書の類似度を求める。すなわち、両文書ベク
トルbnとbn+1間の角度をqとし、両文書ベクトル
の内積をbn・bn+1とし、両文書ベクトルの大きさ
をそれぞれ|bn|、|bn+1|とした場合、両文書
ベクトルの類似度Snn+1は次の数式1により求ま
る。
【0029】
【数1】 類似度Snn+1=COS(q) =(bn・bn+1)/(|bn|×|bn+1|)
【0030】この類似度Sの値は−1≦S≦1までの値
をとり、1に近いほど2つの文書ベクトルが互いに平行
に近く、2つの文書同士は似ていると考えることができ
る。従って、一定の閾値以上の類似度を有する文書を類
似する文書と判断し、検索結果とする。
【0031】以上、本実施形態の構成および外国語文読
解支援の処理について説明したが、本発明では、これら
の各形態に限定されるものではなく、請求項に記載され
た発明の範囲内で種々の変形をすることが可能である。
例えば、実施形態では、対象文書の言語(原文言語)と
して英語、翻訳言語として日本語を例に説明したが、本
発明ではこれらの組み合わせに限定されるものではな
く、あらゆる言語間の組み合わせとすることが可能であ
る。その場合、対象となる文書が作成された言語用の形
態素解析アルゴリズム等を使用するといった、本発明の
構成には影響のない部分を変更するだけでよい。
【0032】以上の実施形態において説明した、各装
置、各部、各動作、各処理等に対しては、それらを含む
上位概念としての各手段(〜手段)により、実施形態を
構成することが可能である。例えば、「2文書に対する
文書ベクトル間の角度に依存するコサインにより以下の
ようにして両文書の類似度を求める」との記載に対して
「類似度算出手段」を構成するようにしてもよい。同様
に、その他各種動作に対して「〜(動作)手段」等の上
位概念で実施形態を構成するようにしてもよい。
【0033】
【発明の効果】本発明によれば、翻訳辞書を使用して前
記対象文書を翻訳する際に、翻訳対象となる対象文書か
ら非訳出語句を抽出し、抽出した非訳出語句の訳語とし
て、翻訳対象語による表記に変換した非訳出語句の表記
と、前記対象文書中の原文表とのうちの少なくとも一方
の表記を使用して翻訳するようにしたので、より自然な
翻訳結果が提供され、外国語文読解が支援される。
【図面の簡単な説明】
【図1】本発明の1実施形態における外国語文読解支援
システムの構成を表したブロック図である。
【図2】同上、実施形態における外国語文読解支援処理
のメイン動作を表したフローチャートである。
【図3】同上、実施形態における表示形式として「カタ
カナ表記」が選択された場合の翻訳結果の表示画面を表
した説明図である。
【図4】同上、実施形態における他の表示形式が選択さ
れた場合の表示画面を表したもので、(A)は「原文表
記」の表示画面、(B)は「カタカナ表記(原文表
記)」の表示画面をあらわした説明図である。
【図5】請求項1に記載した発明のクレーム対応図であ
る。
【図6】請求項2に記載した発明のクレーム対応図であ
る。
【図7】請求項5に記載した発明のクレーム対応図の1
例である。
【図8】請求項6に記載した発明のクレーム対応図の1
例である。
【図9】請求項7に記載した発明のクレーム対応図であ
る。
【図10】請求項8に記載した発明のクレーム対応図で
ある。
【図11】請求項11に記載した発明のクレーム対応図
の1例である。
【図12】請求項12に記載した発明のクレーム対応図
の1例である。
【図13】請求項13に記載した発明のクレーム対応図
である。
【図14】従来の翻訳結果を表す説明図である。
【符号の説明】
11 制御部 112 ROM 113 RAM 1131 対象文書格納エリア 1132 非訳出語句格納エリア 1133 翻訳文書格納エリア 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 161 仮名漢字変換辞書 162 プログラム格納部 163 データ格納部 164 文書データベース 165 翻訳辞書 17 記憶媒体駆動装置 18 通信制御装置 19 入出力I/F 20 文字認識装置

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 翻訳対象となる対象文書を取得する対象
    文書取得手段と、 この対象文書取得手段で取得された対象文書から非訳出
    語句を抽出する非訳出語句抽出手段と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳手
    段とを備え、 前記翻訳手段は、前記非訳出語句抽出手段で抽出された
    非訳出語句の訳語として前記対象文書中の原文表記を訳
    語として翻訳することを特徴とする外国語文読解支援シ
    ステム。
  2. 【請求項2】 翻訳対象となる対象文書を取得する対象
    文書取得手段と、 前記対象文書取得手段で取得された対象文書から非訳出
    語句を抽出する非訳出語句抽出手段と、 前記非訳出語句抽出手段で抽出された非訳出語句を翻訳
    対象語による表記に変換する表記変換手段と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳手
    段とを備え、 前記翻訳手段は、前記非訳出語句抽出手段で抽出された
    非訳出語句の訳語として、前記表記変換手段により変換
    された表記、または、前記表記変換手段により変換され
    た表記と前記対象文書中の原文表記の両表記を使用し
    て、前記対象文書を翻訳することを特徴とする外国語文
    読解支援システム。
  3. 【請求項3】 前記非訳出語句抽出手段は、前記翻訳辞
    書中には独立して存在しない名詞句を非訳出語句として
    抽出する、ことを特徴とする請求項1又は請求項2に記
    載の外国語文読解支援システム。
  4. 【請求項4】 前記非訳出語句抽出手段は、複合名詞句
    を非訳出語句として抽出する、ことを特徴とする請求項
    1又は請求項2に記載の外国語文読解支援システム。
  5. 【請求項5】 前記非訳出語句の重要度を判定する重要
    度判定手段を備え、 前記翻訳手段は、この重要度判定手段により判定された
    重要度に応じて前記非訳出語句を他の翻訳部分と区別し
    て表示することを特徴とする請求項1から請求項4のう
    ちのいずれか1の請求項に記載の外国語文読解支援シス
    テム。
  6. 【請求項6】 前記対象文書取得手段により取得された
    対象文書の段落、文、及び非訳出語句のうちの少なくと
    も1つの単位に対する類似文書または関連記述を検索す
    る検索手段と、 前記検索手段で検索された類似文書または関連記述を、
    該当単位に関連付ける関連付け手段と、を具備すること
    を特徴とする請求項1から請求項5のうちのいずれか1
    の請求項に記載の外国語文読解支援システム。
  7. 【請求項7】 翻訳対象となる対象文書を取得する対象
    文書取得機能と、 この対象文書取得機能で取得された対象文書から非訳出
    語句を抽出する非訳出語句抽出機能と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳機
    能とを備え、 前記翻訳機能は、前記非訳出語句抽出機能で抽出された
    非訳出語句の訳語として前記対象文書中の原文表記を訳
    語として翻訳することをコンピュータに実現させるため
    のコンピュータ読取り可能な外国語文読解支援プログラ
    ムが記憶された記憶媒体。
  8. 【請求項8】 翻訳対象となる対象文書を取得する対象
    文書取得機能と、 前記対象文書取得機能で取得された対象文書から非訳出
    語句を抽出する非訳出語句抽出機能と、 前記非訳出語句抽出機能で抽出された非訳出語句を翻訳
    対象語による表記に変換する表記変換機能と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳機
    能とを備え、 前記翻訳機能は、前記非訳出語句抽出機能で抽出された
    非訳出語句の訳語として、前記表記変換機能により変換
    された表記、または、前記表記変換機能により変換され
    た表記と前記対象文書中の原文表記の両表記を使用し
    て、前記対象文書を翻訳することをコンピュータに実現
    させるためのコンピュータ読取り可能な外国語文読解支
    援プログラムが記憶された記憶媒体。
  9. 【請求項9】 前記非訳出語句抽出機能は、前記翻訳辞
    書中には独立して存在しない名詞句を非訳出語句として
    抽出する、ことを特徴とする請求項7又は請求項8に記
    載の外国語文読解支援プログラムが記憶された記憶媒
    体。
  10. 【請求項10】 前記非訳出語句抽出機能は、複合名詞
    句を非訳出語句として抽出する、ことを特徴とする請求
    項7又は請求項8に記載の外国語文読解支援プログラム
    が記憶された記憶媒体。
  11. 【請求項11】 前記非訳出語句の重要度を判定する重
    要度判定機能を備え、 前記翻訳機能は、この重要度判定機能により判定された
    重要度に応じて前記非訳出語句を他の翻訳部分と区別し
    て表示することを特徴とする請求項7から請求項10の
    うちのいずれか1の請求項に記載の外国語文読解支援プ
    ログラムが記憶された記憶媒体。
  12. 【請求項12】 前記対象文書取得機能により取得され
    た対象文書の段落、文、及び非訳出語句のうちの少なく
    とも1つの単位に対する類似文書または関連記述を検索
    する検索機能と、 前記検索機能で検索された類似文書または関連記述を、
    該当単位に関連付ける関連付け機能と、を具備すること
    を特徴とする請求項7から請求項11のうちのいずれか
    1の請求項に記載の外国語文読解支援プログラムが記憶
    された記憶媒体。
  13. 【請求項13】 翻訳辞書を使用して前記対象文書を翻
    訳する際に、 翻訳対象となる対象文書から非訳出語句を抽出し、 抽出した非訳出語句の訳語として、翻訳対象語による表
    記に変換した非訳出語句の表記と、前記対象文書中の原
    文表とのうちの少なくとも一方の表記を使用して翻訳す
    ることを特徴とする外国語文読解支援方法。
JP9217129A 1997-07-27 1997-07-27 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法 Pending JPH1145245A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9217129A JPH1145245A (ja) 1997-07-27 1997-07-27 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9217129A JPH1145245A (ja) 1997-07-27 1997-07-27 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法

Publications (1)

Publication Number Publication Date
JPH1145245A true JPH1145245A (ja) 1999-02-16

Family

ID=16699316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9217129A Pending JPH1145245A (ja) 1997-07-27 1997-07-27 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法

Country Status (1)

Country Link
JP (1) JPH1145245A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312463A (ja) * 2000-04-28 2001-11-09 Kodansha Ltd 表示言語変換システム、記憶媒体、及び情報販売システム
JP2007018359A (ja) * 2005-07-08 2007-01-25 Sharp Corp 言語処理装置及び言語処理方法と、言語処理プログラム
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術
US11194259B2 (en) 2018-08-30 2021-12-07 Taiwan Semiconductor Manufacturing Co., Ltd. Equipment module with enhanced protection from airborne contaminants, and method of operation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312463A (ja) * 2000-04-28 2001-11-09 Kodansha Ltd 表示言語変換システム、記憶媒体、及び情報販売システム
US7174287B2 (en) 2000-04-28 2007-02-06 Kodansha Co., Ltd. Display language conversion system, storage medium and information selling system
JP2007018359A (ja) * 2005-07-08 2007-01-25 Sharp Corp 言語処理装置及び言語処理方法と、言語処理プログラム
JP2008108209A (ja) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> 機械翻訳の精度を向上させる技術
US8126698B2 (en) 2006-10-27 2012-02-28 International Business Machines Corporation Technique for improving accuracy of machine translation
US11194259B2 (en) 2018-08-30 2021-12-07 Taiwan Semiconductor Manufacturing Co., Ltd. Equipment module with enhanced protection from airborne contaminants, and method of operation

Similar Documents

Publication Publication Date Title
KR100930185B1 (ko) 사전기능을 갖는 전자기기 및 문자입력방법
KR19980080220A (ko) 언어 식별 장치, 언어 식별 방법 및 언어 식별의 프로그램을 기록한 기록매체
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d&#39;enregistrement, programme et ordinateur
JPH11338858A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
Somers The translator's workstation
JP2010198241A (ja) 中国語入力装置およびプログラム
JPH1145247A (ja) 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
Jamro Sindhi language processing: A survey
JPH1145245A (ja) 外国語文読解支援システム、外国語文読解支援プログラムが記憶された記憶媒体、及び外国語文読解支援方法
JPH1153396A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH1145278A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JP2003323425A (ja) 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
Patkar et al. Translation of English to Ahirani Language
Joshi et al. Frequency based predictive input system for Hindi
Somers Translation technologies and minority languages
JPH10320399A (ja) 言語識別装置,言語識別方法および言語識別のプログラムを記録した記録媒体
JP3377942B2 (ja) 電子辞書検索装置および電子辞書検索装置制御用プログラムを記憶したコンピュータ読取可能な記憶媒体
JPH1145280A (ja) 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法
JP2004118461A (ja) 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP2022148873A (ja) 情報検索装置、情報検索方法およびプログラム
Modi POS Tagging and Structural Annotation of Handwritten Text Image Corpus of Devnagari Script

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061031