JPS6177955A - 文書処理における文番号の自動採番方式 - Google Patents

文書処理における文番号の自動採番方式

Info

Publication number
JPS6177955A
JPS6177955A JP59198536A JP19853684A JPS6177955A JP S6177955 A JPS6177955 A JP S6177955A JP 59198536 A JP59198536 A JP 59198536A JP 19853684 A JP19853684 A JP 19853684A JP S6177955 A JPS6177955 A JP S6177955A
Authority
JP
Japan
Prior art keywords
sentence
english
numbers
input
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59198536A
Other languages
English (en)
Other versions
JPH0778797B2 (ja
Inventor
Kenji Okura
健治 大倉
Kazuhiko Fukasaku
和彦 深作
Hiromi Nakajima
中島 寛美
Takahiro Nakano
中野 敬博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHIKIYOU JOHO CENTER KK
Hitachi Ltd
Original Assignee
SHIKIYOU JOHO CENTER KK
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHIKIYOU JOHO CENTER KK, Hitachi Ltd filed Critical SHIKIYOU JOHO CENTER KK
Priority to JP59198536A priority Critical patent/JPH0778797B2/ja
Publication of JPS6177955A publication Critical patent/JPS6177955A/ja
Publication of JPH0778797B2 publication Critical patent/JPH0778797B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Record Information Processing For Printing (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、自然言語の文書を一文一文識別しなければな
らない分野(例えば、機械翻訳システム)のために、各
文に、識別番号を効率的に自動採番する方式に関するも
のである。
〔発明の背景〕
従来、自然言語で書かれた文章は、特開昭57−121
765で示されるような文章編集装置(ワードプロセッ
サ)で処理されているが、これは複数の文を一つの処理
巣位としてまとめて処理をしている。
従って、−文一文を認識して処理は行われていない。ま
た特開昭56−42876で示されるような電子式翻訳
装置においては、単語もしくは一文を即時に翻訳し、表
示するため、入力となる各文あるいは各単語に認識番号
を付与する必要がなかった。
しかし、特開昭58−40684で開示された方式によ
る英語から日本語への機械翻訳においては、−文一文を
識別し“て処理をしなければならないシステムも現われ
出している。このようなシステムでは入力となる一文(
以後−センテンスという)毎に識別番号を付与しなけれ
ばならないが、従来は、入力者が各センテンスに意識的
に識別番号を付与して、キー付データを作成しなければ
ならなかった。
〔発明の目的〕
本発明は、上記の点に鑑み、自然言語で書かれた文書の
入力において、各センテンスの採番を、機械的かつ効率
的に付加する方式を提供することを目的とする。
〔発明の概要〕
上記の目的を達成するため、本発明は、自然言語で書か
れた文書に文書の構造に則して特殊記号および文末記号
を付加することくより各センテンスに、物理的な概念に
合致した番号すなわち、センテンスの検索の際、連想し
易いような番号を自動的に採番する方式を提供したもの
である。
〔発明の実施例〕
以下、本発明の実施例を詳細に説明する。
第1図は、本発明による自動採番方式を実施するための
装置の一実施例を示すブロック図を表わす。
図において1はディスプレイ装置、2はキーボード等の
入力装置、3はブOセッサ、4はメモリ、5は画面バッ
ファ、6は磁気ディスク等の外部メモリを表わしている
。本実施例では説明の都合上、自然言語を英語として採
番方式および、入力方式について説明する。
自然言語で書力)れた文書は、第2図で示すような本や
新聞等の形で存在することが多い。これらの文書を説明
する際、「何という本の、何ページの何行目に書かれて
いる文章はとか、何という新聞の、何面に載っている何
カラムの記事は何々だ」という具合K、文書の位置付け
をすることが多い。
この物理的に付けた名称(例えば、第2図に示すような
ドキエメント、ページ、パラグラフ、センテンスという
名称)を利用し、特定の1センテンスにドキエメント名
(9桁)、ページ数(4桁)、パラグラフ番号(2桁)
、センテンス番号(2桁)の合わせて17桁の識別番号
を付与し、この識別番号付きで外部メモリ6の英文ファ
イルに格納した例がWc3図である。このファイルは、
識別番号の指定により、センテンスデータの入出力が可
能であり、かつ識別番号の上昇順、下降順でもデータの
入出力が可能である。この詳細を第4図に示す。
外部メモリ6の英文ファイルは、第4図に示すように、
識別番号と、どこのデータ部にデータが格納しであるか
を位置付けるポインタ群からなるインデックス部と、識
別番号と英文または和文データを格納するデータ、一部
からなるファイルである。
第4図のインデックスセット(I8 )1101は、各
シーケンスセット(38)1102に格納している識別
番号の最大番号と、どのシーケンスセットかを示すポイ
ンタが格納し゛(1)す、シーケンスセット1102に
は、各コントロールエリア(CA)1103の中のコン
トロールインターバル(CI)の中の最大識別番号と、
どのコントロールインターバルかを示すポインターが格
納されている。こコテハコントロールインターバルは、
磁気ディスク装置の1トラツクに相当する。インデック
ス部を検索することにより、任意のデータを絖み出すこ
とができ、かつ上昇順あるいは下降順にも読み出しする
ことができる。ま1こ、上昇順、下降順に読み出したと
き、データ部のレコード1104には識別番号を持つて
いるため、読み出したデータの識別番号を知ることが可
能である。
また、このファイルは、第5図に示すような管理情報を
第4図のデータレコード部中にレコードとして持ってい
る。ページ管理情報1201iJ蓄積されているドキエ
メント毎にあり、ページ管理情。
報であることを示すためにレコード識別番号のページ、
バラグラフ、センテンスのエリアにはすべてOが書き込
まれている。バラグラフ管理情報1202はページ毎に
用意され、バラグラフとセンテンスのエリアが0である
ことにより識別される。
同様にセンテンス管理情報1203が用意されている。
これらには現在蓄積されているページやバラグラフやセ
ンテンスの最大の番号と、蓄積されている(ファイルに
登録されている)ページやバラグラフやセンテンスの数
などが格納されている。
例えばページ管理情報では、そのドキ鳥メントにおいて
登録されているページの最大のページ番号とページ数な
どである。
この管理情報を使用することにより、以下で説明するセ
ンテンスの自動採番にて直接センテンスを検索すること
なしに、最大ページ数、最大パラグラフ数、最大センテ
ンス数などを知ることができる。なお、管理情報レコー
ドは、英文ファイルの中に存在しなくても良い。すなわ
ち、外部ファイルとして一つのファイルとして存在して
も良い。
文書を機械処理にて利用可能にするために、被処理文書
は外部メモリの英文ファイルに第1図の入力装置2から
入力される。この場合、新規に入力する場合と、追加的
に入力する場合の2通りが考えられる。なお、英文の文
書入力において、1センテンスの区切りは、第6図に示
す文末記号に二文字分の空白を付加することにより認識
するものとする。(例えば、T11is is a p
en、ΔΔ・・・Δは空白を示す。) 以上の構成から成る実施例の作動を第7図の処理フロー
図および、第8図の処理過程を示す画面を用いて説明す
る。
まず、プロセッサ3は第8図1alのガイダンス画面を
ディスプレイ族′B1へ表示する。入力者は、この11
面に対して、キーボード2から英文の文書の新規入力か
追加入力かの指示データを入力する( 5L)1 )。
この指示データによりプロセッサ3はモード(新規入力
モードまたは追加入力モード)を設定する( 502 
)。
新規入力モードの場合、プロセッサ3は、ドキエメント
名を問い合わせる画面を作成し、画面バッファ5へ転送
する。ディスプレイ装置に表示された画面(第8図(b
))に対して、入力者は、ドキ為メント名のみをキーボ
ード2から指定する(503兎プロセツサ3は、指定さ
れたドキ島メント名が外部メモリ6の英文ファイルに存
在するかどうか調べ(504)、存在するならばドキエ
メント名指定誤りとして処理をステップ503へもどす
。存在しなければ、新規入力としてステップ507の処
理へ制御を移す。
追加入力モードの場合、プロセッサ3は、ドキ為メント
名、ページ数、パラグラフ番号を問い合わせる画面を作
成し、画面バッファ5へ転送する。
ディスプレイ装置に表示された画面(第8図(b))に
対して、入力者は、ドキ2メント名、ページ数バラグラ
フ番号をキーボード2より指定する。ページ数、パラグ
ラフ番号は、追加入力を行う位置に応じて設定する( 
505 )。プロセッサ3は、指定されたドキエメント
名、ページ数、バラグラフ番号を識別番号に持つデータ
が、外部ファイルの英文ファイルに存在するかどうか調
べ(506) 、存在しなければ指定誤りとして505
の処理へもどす。
存在するならば、507の処理へ制御を移す。プロセッ
サ3は第8図(C)の英文人力画面を作放し、画面バッ
ファ5へ転送する。第8図(C)は、ドキエメント名、
ページ数、パラグラフ番号等を表示するインデックス表
示領域、前画面の情報の一部もしくは、外部メモリ6の
英文ファイルの情報の一部を表示する前画面情報表示領
域、英文データを入力するための英文データ入力領域、
入力時のエラー情報を表示するエラーメツセージ表示領
域から成っている。
前画面情報表示領域には、新規入力時の最初の英文人力
画面の場合、何も表示しないが、追加入力時の英文人力
画面の場合には、外部メモリ6の英文ファイルの追加入
力しようとするセンテンスの直前のセンテンスの情報を
表示する。入力者は英文データ入力領域に英文の文書を
入力する。
(507)このとき各センテンスの文末に1第6図に示
す文末記号の−づと、二つ以上の空白を加えて入力する
。プロセッサ3は、この文末記号と二つ以上の空白によ
りセンテンスの区切りを認識し各センテンスに識別番号
を付与する。英文の文書は、第9図の新規入力時の採番
方法および第10図の追加入力時の採番方法における入
力方法の欄に記述しである入力方法で英文を入力するこ
とにより、ページ数やバラグラフ番号を変更する。
藁9図、第10図における符号の意味は下記のとおりで
ある。
Δ:1個以上の空白、^二〇個以上の空白p:指定ペー
ジ数(4桁以内=1〜9999 )h:指定パラグラフ
番号(2桁以内:1〜99)po:l英文前のページ数 す、:l英文前のバラグラフ番号 jg:l英文前のセンテンス番号 Pl:外部メモリの英文ファイル中の既存ページ数の集
合 P2:#1面バクファメモリ中の既存ページ数の集合H
1:外部メモリの英文ファイル中の既存パラグラフ番号
の集合 H2:画面バクノアメモリ中の既存バラグラフ番号の集
合 hI:外部メモリの英文ファイル中のpページの最大パ
ラグラフ番号 帯1:採番条件を満足しないとエラー 条件式の説明:a5A・・・aが集金人の要素である。
aへA・・・aが集合Aの要素でな い0 第9図、第10図の説明として、第11図〜第12図を
用いて説明する。この例は新規登録の例である。
第11図、第12図は、あるマニアルの135ページと
136ページの内容をそのまま抜粋したものであり、第
13図は、このマニアルのセンテンスを第9図の採番方
法での入力方法にて入力した例である。
まず、第11図の下から五行目以降から、第12図にか
けて入力する場合を例としている。ドキュメント名とし
ては% DOCφφφ1“をすでに指定しである。第1
3図の英文人力画面の先頭の英文は135ページの第三
パラグラフの第1番目のセンテンスであることを指定す
るために、特殊記号の1・“(アットマーク)を付加し
、′・・135Δ@3 ΔScheduling jo
b  −・・“の入力形式−なりている。この1@・“
(アットマークの2個連1i!!>はページ変更を指定
する記号であり、直後の数値135により、ページ数を
135に変更したことを:を味する。これは第5図のペ
ージ管理情報1201に格納される。′e“(アットマ
ーク1個)は、パラグラフ変更を指定する記号であり、
直後の数t3により、パラグラフ番号を3に変更したこ
とを意味する。これもパラグラフ管理情報1202に格
納される。Δは空白を意味する。上記の指定により、先
頭の英文センテンスの識別番号は、第3図の例で示した
識別番号のようになる。また先頭の英文は1 :“(コ
ロン)と二つの空白によってセンテンスの区切りをプロ
セッサ3に認識させることが可能となっている。次の英
文センテンスには、特殊記号のゝ・“が付加していない
が、この場合、一つ前のセンテンスのセンテンス番号に
数値1が加えられた識別番号を付与されることKなる。
これは第5図のセンテンス管理情報120y)最大ペー
ジ番号を読み出しそれに1を加えることにより得られる
。この更新された番号はセンテンス管理情@1203に
も書き込まれる。以上のような採番方法についてまとめ
た表が、第9図、第1011である。
続いて、画面バッファ5からメモリ4へ転送された英文
の入力データをプロセッサ3は、特殊記号および文末記
号(第6図)Kより、第9図、第10図の採番方法にも
とづいて、各センテンスに識別番号を付与する。ページ
、パラグラフ、センテンスの番号の更新は上記のように
特に番号の指定がなければ第9図、第10に示すページ
変更、バラグラフ変更、センテンス変更の記号に応答し
て、前記管理情報を読みとりそこに記憶された最大番号
に1を加えたものを識別番号として与える。
一方、更新された最大番号は管理情報中に格納される。
この際、外部メモリ6の英文ファイルに同じ識別番号を
持ったセンテンスが存在するかど゛うか(同じものがあ
ればエラー)、また英文人力画面内の各センテンスの識
別番号が重複しないか等の論理チェックを行う(508
)。入力英文の採番条件、採番チェック条件については
、第9図、第10図に記述しである。入力英文の採番チ
ェックにてのエラーがある場合、ステップ510へ制御
を移し、無ければステップ511へ制御を移す(509
)。
入力英文データにエラーが有る場合、エラーを発見した
最初の位置を明示する情報(カーソルの位置情報等)と
エラーメツセージを画面バッファ5へ転送する。英文人
力者は、エラーメツセージを参考にして、画面に明示さ
れた位置から、入力データの修正を行う(510)。
入力英文のエラーが無い場合、ステップ508の処理に
て自動採番された識別番号と供に、各英文センテンスを
外部メモリ6の英文ファイルへキー付きデータとして書
き込む(511)。
英文人力処理がすべて終了した場合、人力操作は終りと
なる。しかし引き続き入力する場合には513へ制御を
移す(512)。
プロセッサ3は、現在処理した画面の情報の一部を利用
して、次の英文人力画面を作成し、画面バッファへ転送
する(513)。この具体的な例な第14図に示す。英
文人力画面の作成にあたっては、前画面に表示している
最終センテンスを前画面情報表示領域に表示する(再1
4図(a))。前画面が1401で次画面が1402で
示gnる。前l!1lIlsli情報表示領域に、表示
すべき−センテンスが、全−C納iらない場合には、セ
ンテンスの麦から、納まる長さのデータだけ表示する。
前1fiI向に表示しているNk後のセンテンスに文末
記号Bよび二つ以上の空白がない場合、そのセンテンス
は、最終センテンスとはgRされず、未入力の扱いとし
、英文データ入力領域に表示する(第14図(b))。
前画面が1403次画面が1404で示される。このよ
つに、前画面情報の一部を英文人力画面に表示すること
により、円滑な入力操作が可能となる。
〔発明の効果〕
以上説明したごとく、本発明によれば、自然言語の文傅
人力にεいて、自然に近い入力方法(より、各センテン
スに効率的な自動採番が行え、しかも識別番号は、物理
的なものから容易に連想することがoJ能な形式となっ
ている。
【図面の簡単な説明】
第1図は、本発明による一実施例を示すブロック図、第
2図は、自然1語で書かれた文書の例を示す図、第3図
は、本発明による一実施例における英文ファイルの説明
図、第4図はファイルの構成を示す図、県5図は管理情
報を説明する図、第6図は英文における文末記号を示す
図、第7図は本発明による一実施例の処理フローを示す
フロー図、第8図は本発明による一実施例におけるディ
スプレイ画面を示す図、第9図、第10図は本発明によ
る一実施例の自動採番方法を示す図、第11図第12図
は、あるマニアルを抜粋した文書を示す図第13図は、
本発明による一実施例の英文人力画面の例を示す図、第
14図は、本発明による一実施例である人力方式の処理
概要を示す説明図である。 〔符号の説明〕 1・・・ディスプレイ装置 2・・・キーボード等の入力装置 3・・・プロセッサ   4・・・メモリ5・・・画面
バッファ 6・・・磁気ディスク等の外部メモリ 第 1(!1 第 2圓 (Q−) (+Wヘシシノン (ト) 第 3 名 vJ4唖 t2o;1 躬 6I¥1 も70 手続補正書(方式) 事件の表示 昭和 59年特許願第 198556号発 明 0 名
 弥  文書処理における文會号の自動様番号式補正を
する者 鰭との関係 特許出願人 名  称   15101株式会社  日  立 製 
作 所(纜か  1名) 代   理   人

Claims (1)

    【特許請求の範囲】
  1. 1、自然言語の文書入力において、付加入力した特殊記
    号、および文末記号の認識により、連続して入力される
    文書の一文一文に自動的に、効率的な文番号付けをする
    ことを特徴とする文書処理における文番号の自動採番方
    式。
JP59198536A 1984-09-25 1984-09-25 文書処理における文番号の自動採番方法 Expired - Lifetime JPH0778797B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59198536A JPH0778797B2 (ja) 1984-09-25 1984-09-25 文書処理における文番号の自動採番方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59198536A JPH0778797B2 (ja) 1984-09-25 1984-09-25 文書処理における文番号の自動採番方法

Publications (2)

Publication Number Publication Date
JPS6177955A true JPS6177955A (ja) 1986-04-21
JPH0778797B2 JPH0778797B2 (ja) 1995-08-23

Family

ID=16392781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59198536A Expired - Lifetime JPH0778797B2 (ja) 1984-09-25 1984-09-25 文書処理における文番号の自動採番方法

Country Status (1)

Country Link
JP (1) JPH0778797B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013127684A (ja) * 2011-12-16 2013-06-27 Kyocera Document Solutions Inc データ処理プログラム、及びデータ処理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816341A (ja) * 1981-07-20 1983-01-31 Sharp Corp 文章編集装置
JPS59724A (ja) * 1982-06-26 1984-01-05 Fujitsu Ltd 日本語ワ−ド・プロセツサにおける自動項目番号付け方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816341A (ja) * 1981-07-20 1983-01-31 Sharp Corp 文章編集装置
JPS59724A (ja) * 1982-06-26 1984-01-05 Fujitsu Ltd 日本語ワ−ド・プロセツサにおける自動項目番号付け方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013127684A (ja) * 2011-12-16 2013-06-27 Kyocera Document Solutions Inc データ処理プログラム、及びデータ処理装置

Also Published As

Publication number Publication date
JPH0778797B2 (ja) 1995-08-23

Similar Documents

Publication Publication Date Title
US6279018B1 (en) Abbreviating and compacting text to cope with display space constraint in computer software
US3917317A (en) Book indexing and processing system
EP0075732A2 (en) Method and apparatus for merge processing in a text processing system
JPS62267876A (ja) 画像登録方式
Blenkhorn et al. Automated braille production from word-processed documents
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
JPS6177955A (ja) 文書処理における文番号の自動採番方式
JPS6048081A (ja) 文字処理装置
JPS58225485A (ja) 図書索引の自動生成方式
JPS6057422A (ja) 文書目次索引作成装置
JPH02136956A (ja) レイアウト情報の抽出方法
JP2795754B2 (ja) データ検索処理方式
Haskins Final Report on the Rules for Descriptive Cataloging in the Library of Congress
JP2002297574A (ja) ルビ付与システムおよびプログラム
JPS60225976A (ja) 目次作成機能を有するデ−タ処理システム
JPS638820A (ja) 文書清書装置
Uskup et al. Editing and Printing a Dialect Atlas by Computer
Grimm EDP user documentation: The missing link
Tanaka et al. Automatic Contractions of English Braille through a Computer
JPS6229833B2 (ja)
JPS61117656A (ja) デ−タ処理システムにおける日本語処理方式
HUQ Problems and Prospects in The Organization of Bengali Materials
JPS6048082A (ja) 文字処理装置
JPS59165146A (ja) コンパイラにおける日本語名標処理方式
JPH04310171A (ja) 文書作成装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term