JPH11195024A - 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法 - Google Patents

集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法

Info

Publication number
JPH11195024A
JPH11195024A JP9360720A JP36072097A JPH11195024A JP H11195024 A JPH11195024 A JP H11195024A JP 9360720 A JP9360720 A JP 9360720A JP 36072097 A JP36072097 A JP 36072097A JP H11195024 A JPH11195024 A JP H11195024A
Authority
JP
Japan
Prior art keywords
distribution information
inappropriate expression
concentrated appearance
concentrated
appearance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9360720A
Other languages
English (en)
Inventor
Fumiko Kikuchi
文子 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9360720A priority Critical patent/JPH11195024A/ja
Publication of JPH11195024A publication Critical patent/JPH11195024A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 かな漢字変換後の文書について、否定表現や
推測表現の様に集中して出現すると不適切な表現につい
て、その集中度をチェックする。 【解決手段】 集中出現不適切表現記憶手段3は、集中
出現不適切表現を記憶する。修正対象文書記憶手段5
は、検査対象の修正対象文書を記憶する。分布情報演算
手段7は、前記修正対象文書から前記集中出現不適切表
現箇所を抽出し、前記集中出現不適切表現箇所の分布情
報を求める。報知手段9は、前記抽出した集中出現不適
切表現箇所の分布情報を報知する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、かな漢字変換後
の文書検査装置に関し、特に、集中出現不適切表現箇所
の分布情報検出に関する。
【0002】
【従来技術およびその課題】今日、かな漢字変換装置に
は、かな漢字変換後の文章について悪文の箇所が存在す
るか否かを指摘する機能が付加されている。例えば、”
彼は、日曜日にはピクニックに出かけれるだろう。それ
は太陽のめぐみを受けられることを意味する。しかし、
雨に降られない日曜日はなくもない。”という文章につ
いて、悪文指摘処理実行すると、画面上に、まず、「”
出かけれる”:ら抜き表現です、」と表示される。つぎ
の箇所を表示する命令を与えると、「”それ”:指示語
です」と表示される。以下同様にして、「”受けられ
る”:受身表現です」、「”なくもない”:二重否定で
す」というふうに、該当箇所を順次指摘する。
【0003】このような悪文表現としては、文中に1箇
所その表現があるだけでも修正すべきである表現と、1
箇所だけであればそれほど問題ないけれども、ある程度
繰返し使用されると好ましくない表現がある。操作者
は、前者に属する表現については、指摘があればこれを
修正する必要がある。これに対して、後者に属する表現
については、操作者が順次表示される箇所を操作者自身
が記憶しておき、集中する度合いが高ければ、ある箇所
(複数の場合もあり)について表現を修正すればよい。
【0004】しかし、上記かな漢字変換装置において
は、前者の場合も後者の場合も一律に箇所を指摘するだ
けであったので、操作者は集中する度合いを明確に把握
することができなかった。
【0005】この発明は上記問題を解決し、集中して出
現すると不適切な表現について、その集中度を確実かつ
簡易に把握できる集中出現不適切表現箇所の分布情報を
検出する装置またはその方法を提供することを目的とす
る。
【0006】
【課題を解決するための手段および発明の効果】本発明
にかかる集中出現不適切表現箇所の分布情報検出装置ま
たは分布情報検出方法においては、予め集中出現不適切
表現を記憶しておき、修正対象文書が与えられると、こ
の修正対象文書中における前記集中出現不適切表現箇所
の分布情報を求める。したがって、集中して出現すると
不適切な表現について、その分布情報を得ることができ
る。
【0007】本発明にかかる集中出現不適切表現箇所の
分布情報検出装置においては、報知手段は、前記抽出し
た集中出現不適切表現箇所の分布情報を報知する。した
がって、集中して出現すると不適切な表現について、そ
の集中度を確実かつ簡易に把握できる。
【0008】本発明にかかる集中出現不適切表現箇所の
分布情報検出装置においては、前記報知手段は、前記修
正対象文章を、集中出現不適切表現箇所と集中出現不適
切表現以外の表現箇所とを区別可能状態で表示する。し
たがって、操作者は、修正対象文章を参照するだけで、
その集中度を確実かつ簡易に把握できる。
【0009】本発明にかかる集中出現不適切表現箇所の
分布情報検出装置においては、前記報知手段は、集中出
現不適切表現箇所をハイライト表示することにより、前
記集中出現不適切表現以外の表現箇所と区別可能状態で
表示する。したがって、操作者は、修正対象文章のハイ
ライト表示箇所を参照するだけで、その集中度を確実か
つ簡易に把握できる。
【0010】本発明にかかる集中出現不適切表現箇所の
分布情報検出装置においては、前記報知手段は、集中出
現不適切表現の種類を区別可能状態で報知する。したが
って、集中出現不適切表現箇所の種類毎に、その集中度
を知ることができる。
【0011】本発明にかかる集中出現不適切表現箇所の
分布情報検出装置においては、前記報知手段は、前記集
中出現不適切表現箇所が所定領域内に所定数以上集中し
ている場合に、前記抽出した分布情報を報知する。した
がって、操作者は、その集中度を確実かつ簡易に把握で
きる。
【0012】
【発明の実施の態様】1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
す分布情報検出装置1は、かな漢字変換装置によって変
換された後の変換文章に集中出現不適切表現の分布を報
知する装置であり、集中出現不適切表現記憶手段3、修
正対象文書記憶手段5、分布情報演算手段7、および報
知手段9を備えている。
【0013】集中出現不適切表現記憶手段3は、集中出
現不適切表現を記憶する。修正対象文書記憶手段5は、
検査対象の修正対象文書を記憶する。分布情報演算手段
7は、前記修正対象文書から前記集中出現不適切表現箇
所を抽出し、前記集中出現不適切表現箇所の分布情報を
求める。報知手段9は、前記抽出した集中出現不適切表
現箇所の分布情報を報知する。本実施形態においては、
集中出現不適切表現箇所をハイライト表示することによ
り、前記修正対象文章を、集中出現不適切表現箇所と集
中出現不適切表現以外の表現箇所とを区別可能状態で表
示し、これにより、前記分布情報を報知するようにし
た。
【0014】なお、集中出現不適切表現の種類を区別可
能状態で報知するようにしてもよい。また、前記集中出
現不適切表現箇所が所定領域内に所定数以上集中してい
る場合に、前記抽出した分布情報を報知するようにして
もよい。
【0015】このように、予め集中出現不適切表現を記
憶しておき、修正対象文書が与えられると、この修正対
象文書中における前記集中出現不適切表現箇所の分布情
報を求めることにより、集中して出現すると不適切な表
現について、その分布情報を得ることができる。
【0016】2.ハードウェア構成 図2に、図1に示す集中出現不適切表現箇所の分布情報
検出装置1をCPUを用いて実現したハードウェア構成
の一例を示す。
【0017】集中出現不適切表現箇所の分布情報検出装
置21は、CPU23、メモリ27、ハードディスク2
6、CRT30、FDD25、キーボード28、マウス
31およびバスライン29を備えている。CPU23
は、ハードディスク26に記憶された制御プログラムに
したがいバスライン29を介して、各部を制御する。
【0018】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク25
aから読み出されてハードディスク26にインストール
されたものである。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記憶媒体から、ハード
ディスクにインストールさせるようにしてもよい。さら
に、通信回線を用いてダウンロードするようにしてもよ
い。
【0019】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。
【0020】ハードディスク26の辞書部26bは、集
中して出現すると好ましくない集中出現不適切表現が複
数記憶されている。具体的には、「〜でない」「〜では
ない」等の否定語表現、「〜られる」「される」等の受
動態表現、「〜だろう」「〜であろう」等の推測表現、
「それ」、「あれ」等の指示語表現が記憶されている。
【0021】メモリ27は、文章バッファ27a、作業
バッファ27bを有する。文章バッファ27aには、検
査対象の文書データが記憶されている。本実施形態にお
いては、かかる文書データは、キーボード28から入力
された変換対象文字列が、ハードディスク26に記憶さ
れたかな漢字変換プログラムによって、かな漢字変換さ
れたものである。なお、メモリ27にはその他、各種の
演算結果等が記憶される。
【0022】CRT30には、集中出現不適切表現箇所
がハイライト表示される。
【0023】3.フローチャート つぎに、ハードディスク26に記憶されているプログラ
ムについて、図3を用いて説明する。この実施形態にお
いては、図4Aに示すような文書をチェックする場合に
ついて説明する。
【0024】CPU23は、文書バッファ27aに記憶
されている検査対象の文字列を作業バッファ27bに読
み出す(図3ステップST3)。CPU23は、読み出
した文字列を図4Bに示すように、形態素解析をおこな
う(ステップST5)。
【0025】つぎに、CPU23は、要素番号iを初期
化する(ステップST7)。つぎに、CPU23は、作
業バッファ27bの要素番号i番目の要素について、辞
書部26bに記憶されている否定表現があるか否か判断
する(ステップST11)。この場合、0番目の要素
「彼は」は否定表現ではないので、ステップST15へ
進み、受身表現か否か判断する。同様にして、要素「彼
は」は受身表現ではないので、ステップST19へ進
み、推測表現か否か判断する。同様にして、要素「彼
は」は推測表現ではないので、ステップST23へ進
み、指示語表現か否か判断する。
【0026】同様にして、要素「彼は」は指示語ではな
いので、ステップST27に進み、CPU23は、最終
要素であるか否か判断する。この場合、次の要素がある
ので、ステップST29へ進み、要素番号iをインクリ
メントし、ステップST9に戻り、作業バッファ27b
の2番目の要素について、辞書部26bに記憶されてい
る集中出現不適切表現であるか否か判断する(ステップ
ST11〜ステップST23)。
【0027】このようにして、作業バッファ27bの各
要素について、辞書部26bに記憶されている集中出現
不適切表現であるか否かが判断される。そして、否定表
現である場合には、否定表現フラグfhが設定される
(ステップST13)。また、受身表現である場合に
は、受身表現フラグfuが設定される(ステップST1
7)。また、推測表現である場合には、推測表現フラグ
fpが設定される(ステップST21)。また、指示語
である場合には、指示語フラグfsが設定される(ステ
ップST25)。
【0028】このようにして、図5に示すように、作業
バッファ26bの各要素について、集中出現不適切表現
である場合には、対応するフラグが設定される。
【0029】CPU23は、ステップST27にて、最
終要素である場合にはステップST31に進み、フラグ
の状態に基づいて、表示する(ステップST31)。本
実施形態においては、図6に示すように、否定表現につ
いては2重囲み、受身表現については2重下線、推測表
現については破線下線、指示語については波線下線とい
うように、種類毎に区別して表示した。
【0030】このように、集中出現不適切表現に関する
分布情報を得ることができ、これを表示することによ
り、操作者はチェック対象の文書について、集中出現不
適切表現が集中して否かを明確、かつ簡易に知ることが
できる。例えば、「美味しい紅茶の条件は難しくありま
せん。高価な道具や厳選された水は必要ないのです。た
だ、焦ることはいけません。お湯の沸かし過ぎも望まし
くないでしょう。」というような否定表現が連続する場
合を指摘することができる。
【0031】4.他の実施形態 本実施形態においては、集中出現不適切表現として前記
否定語表現等を採用したが、これに限定されず、例え
ば、等、ほど、くらい等の語の限定性を緩める表現を採
用してもよい。
【0032】また、例えば「〜の〜の〜の」や、「〜で
あるが、〜であるが、〜である。」との同一助詞が繰返
される場合も抽出するようにしてもよい。
【0033】また、連続する複数の文で、文頭の1文節
〜数文節が同じ形態素列で構成される場合、例えば、
「それに〜である。それに〜とする。それに〜」という
ような場合に、これを集中出現不適切表現として抽出す
るようにしてもよい。また、連続する複数の文で、文末
の1文節〜数文節が同じ形態素列で構成される場合、例
えば、「〜に言いました。〜と言いました。〜が言いま
した。」のように、「言い」と「ました」の組合わせが
文末に連続するような場合に、これを抽出するようにす
ればよい。これにより、否定表現や受身表現以外でも、
同型の文頭・文末表現が連続しているような退屈・稚拙
な印象を与える文章を抽出することができる。なお、上
記繰返しの場合の抽出は、前記否定表現等の抽出の後
に、各構成形態素を比較することにより、行なうように
すればよい。
【0034】また、本実施形態においては、集中出現不
適切表現を複数記憶しておき、形態素解析の各要素中に
集中出現不適切表現が含まれているか否かを判断するよ
うにしたが、集中出現不適切表現を含む語を辞書部に記
憶しておき、判断するようにしてもよい。
【0035】なお、本実施形態においては、集中出現不
適切表現箇所を集中出現不適切表現以外の箇所と区別し
て表示することにより、集中出現不適切表現に関する分
布情報を報知するようにした。しかし、これに限定され
ず、検査対象文書について、集中出現不適切表現箇所を
集中出現不適切表現以外の箇所との割合に基づいて、予
め設定された割合を越えて集中出現不適切表現箇所が存
在する場合には、これを報知するようにしてもよい。
【0036】また、表示の手法として、2重下線等に限
定されず、ハイライト表現を行なうようにしてもよい。
さらに、種類毎に色を変えて表示するようにしてもよ
い。
【0037】さらに、集中出現不適切表現箇所と集中出
現不適切表現以外の表現箇所とを区別可能な程度の大き
さで、各頁を縮小表示し、複数頁を画面に一覧表辞する
ようにしてもよい。これにより、複数頁に渡った集中出
現不適切表現の分布把握が容易となる。この場合の処理
について、図7を用いて説明する。
【0038】CPU23は、図3ステップST31の処
理の後、入力されるキーの種類を判断する(図7ステッ
プST41)。入力されたキーが複数頁表示モードとす
るキーである場合には、全頁が一覧表示される(ステッ
プST45)。例えば全ページで8ページである場合に
は、図8に示すように、第1頁73a〜第8頁73hが
画面71に一覧表示される。このように縮小表示して
も、前記分布を把握をするだけであれば、そこに表示さ
れた文字を識別できる必要はないので、なんら問題はな
い。
【0039】そして、操作者は、前記分布が集中してお
り修正が必要であると判断した場合には、マウス31
(図2参照)でその領域をクリックする。これにより、
CPU23は、編集可能モードとするキーであると判断
して、編集可能モードで表示される(ステップST4
7)。例えば、第1頁73aに分布が集中しているの
で、該当箇所73a1をクリックすると、その領域の文
字が認識可能な大きさで表示される。この状態で、編集
用のキー、例えば、かなキー等が押されると、編集処理
を行なう(図7ステップST43)。操作者が再度全体
頁を参照したい場合には、複数頁表示モードとするキー
を押せばよい。
【0040】このように、分布を把握する場合には分布
把握可能な大きさで表示し、編集する場合には編集可能
な大きさで表示することにより、分布の把握とその修正
が容易となる。特に、前記ハイライト表示や色を変える
場合には、前記縮小表示しても、操作者による分布把握
が容易となる。
【0041】なお、上記複数頁を表示する場合には、1
の画面に表示できる頁数は限界があるので、所定頁数よ
りも全頁が多い場合には、複数に分けて表示するように
してもよい。この場合には、ステップST45の前に、
全頁が所定頁を越えていないかを判断し、越えている場
合には分割表示を行ない、越えていない場合には全頁表
示を行なうようにすればよい。さらに、操作者が前記所
定頁を設定できるようにしてもよい。これにより、使用
しているコンピュータの画面の大きさに応じて、表示で
きる頁数を選択することができる。
【0042】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。
【図面の簡単な説明】
【図1】本発明にかかる集中出現不適切表現箇所の分布
情報検出装置1の機能ブロック図である。
【図2】図1に示す分布情報検出装置1をCPU23を
用いて実現したハードウエア構成の一例を示す図であ
る。
【図3】分布情報検出処理のフローチャートである。
【図4】チェック対象の文書の一例を示す。
【図5】作業バッファ27bのデータ構造を示す図であ
る。
【図6】CRT30への表示の一例を示す図である。
【図7】複数頁表示・修正処理のフローチャートであ
る。
【図8】複数頁表示の一例を示す図である。
【符号の説明】
3・・・・・・集中出現不適切表現記憶手段 5・・・・・・修正対象文書記憶手段 7・・・・・・分布情報演算手段 9・・・・・・報知手段 23・・・・・CPU 27・・・・・メモリ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成10年1月14日
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】図7
【補正方法】変更
【補正内容】
【図7】
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】図8
【補正方法】変更
【補正内容】
【図8】

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】集中出現不適切表現を記憶する集中出現不
    適切表現記憶手段、 修正対象文書を記憶する修正対象文書記憶手段、 前記修正対象文書から前記集中出現不適切表現箇所を抽
    出し、前記集中出現不適切表現箇所の分布情報を求める
    分布情報演算手段、 を備えたことを特徴とする集中出現不適切表現箇所の分
    布情報検出装置。
  2. 【請求項2】請求項1の集中出現不適切表現箇所の分布
    情報検出装置において、 前記抽出した集中出現不適切表現箇所の分布情報を報知
    する報知手段、 を備えたことを特徴とする集中出現不適切表現箇所の分
    布情報検出装置。
  3. 【請求項3】請求項2の集中出現不適切表現箇所の分布
    情報検出装置において、 前記報知手段は、前記修正対象文章を、集中出現不適切
    表現箇所と集中出現不適切表現以外の表現箇所とを区別
    可能状態で、表示することにより、前記分布情報を報知
    すること、 を特徴とする集中出現不適切表現箇所の分布情報検出装
    置。
  4. 【請求項4】請求項3の集中出現不適切表現箇所の分布
    情報検出装置において、 前記報知手段は、集中出現不適切表現箇所をハイライト
    表示することにより、前記集中出現不適切表現以外の表
    現箇所と区別可能状態で表示すること、 を特徴とする集中出現不適切表現箇所の分布情報検出装
    置。
  5. 【請求項5】請求項2〜4のいずれかの集中出現不適切
    表現箇所の分布情報検出装置において、 前記報知手段は、集中出現不適切表現の種類を区別可能
    状態で報知すること、 を特徴とする集中出現不適切表現箇所の分布情報検出装
    置。
  6. 【請求項6】請求項2〜5のいずれかの集中出現不適切
    表現箇所の分布情報検出装置において、 前記報知手段は、前記集中出現不適切表現箇所が所定領
    域内に所定数以上集中している場合に、前記抽出した分
    布情報を報知すること、 を特徴とする集中出現不適切表現箇所の分布情報検出装
    置。
  7. 【請求項7】予め集中出現不適切表現を記憶しておき、
    修正対象文書が与えられると、この修正対象文書中にお
    ける前記集中出現不適切表現箇所の分布情報を求めるこ
    と、 を特徴とする集中出現不適切表現箇所の分布情報検出方
    法。
  8. 【請求項8】入力装置、制御装置、表示装置および記憶
    装置を備えたコンピュータを、以下の手段を備えた装置
    として機能させるプログラムを記憶させた記憶媒体であ
    って、 集中出現不適切表現を記憶する集中出現不適切表現記憶
    手段、 修正対象文書を記憶する修正対象文書記憶手段、 前記修正対象文書から前記集中出現不適切表現箇所を抽
    出し、前記集中出現不適切表現箇所の分布情報を求める
    分布情報演算手段、 を特徴とする記憶媒体。
JP9360720A 1997-12-26 1997-12-26 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法 Pending JPH11195024A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9360720A JPH11195024A (ja) 1997-12-26 1997-12-26 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9360720A JPH11195024A (ja) 1997-12-26 1997-12-26 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法

Publications (1)

Publication Number Publication Date
JPH11195024A true JPH11195024A (ja) 1999-07-21

Family

ID=18470628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9360720A Pending JPH11195024A (ja) 1997-12-26 1997-12-26 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法

Country Status (1)

Country Link
JP (1) JPH11195024A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084180A (ja) * 2011-10-12 2013-05-09 Nomura Research Institute Ltd 文書管理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084180A (ja) * 2011-10-12 2013-05-09 Nomura Research Institute Ltd 文書管理装置

Similar Documents

Publication Publication Date Title
US6533822B2 (en) Creating summaries along with indicators, and automatically positioned tabs
JP2782478B2 (ja) 自国言語サポートプログラムのテスト方法およびテスト装置
EP0370774A2 (en) Machine translation system
JPH05303590A (ja) 自動翻訳装置
JPH11328166A (ja) 文字入力装置及び文字入力処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11195024A (ja) 集中出現不適切表現箇所の分布情報検出装置および分布情報検出方法
JPH07334499A (ja) 文字列入力装置
JP3564317B2 (ja) 文書表示方法及び表示装置
JP2621999B2 (ja) 文書処理装置
JP3382257B2 (ja) 文字処理装置及びその方法
JP2786260B2 (ja) かな漢字変換装置
JP2864691B2 (ja) 学習支援装置
JPH11184854A (ja) 電子辞書
JP2737160B2 (ja) 文章処理装置
JP3347364B2 (ja) 文章処理装置及びその方法
JP2682048B2 (ja) 文章処理装置
JP2729996B2 (ja) 文書処理装置及び方法
JPH07200605A (ja) 翻訳装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH05204914A (ja) ルビ付加機能処理装置及び処理方法
JP2004355248A (ja) 電子辞書
JPS61156462A (ja) ワ−ドプロセツサ
JPH0581252A (ja) 文書処理装置
JPH032963A (ja) 文書処理装置
JPH11175528A (ja) 電子辞書