JP2763227B2 - Format determination method - Google Patents

Format determination method

Info

Publication number
JP2763227B2
JP2763227B2 JP4066681A JP6668192A JP2763227B2 JP 2763227 B2 JP2763227 B2 JP 2763227B2 JP 4066681 A JP4066681 A JP 4066681A JP 6668192 A JP6668192 A JP 6668192A JP 2763227 B2 JP2763227 B2 JP 2763227B2
Authority
JP
Japan
Prior art keywords
format
logical structure
rule
document data
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4066681A
Other languages
Japanese (ja)
Other versions
JPH0581247A (en
Inventor
美和子 土井
勇 岩井
美佳 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4066681A priority Critical patent/JP2763227B2/en
Publication of JPH0581247A publication Critical patent/JPH0581247A/en
Application granted granted Critical
Publication of JP2763227B2 publication Critical patent/JP2763227B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、文書出力フォーマット
を決定する文書整形方法に係わり、特に指定されたペー
ジ条件を守った出力形態の決定を可能にした文書整形方
法に関するものである。 【0002】 【従来の技術】一般にワードプロセッサでは、予め設定
されたフォーマットに基づいた文書データのページ割り
付けが行われている。従って、例えば学会の全国大会の
発表論文集のように、納めるべきページ数に条件のある
文書では、入力された文書の文字数から、上記ページ数
を超えないように1ページ当りの文字数及び行数を設定
する必要があった。 【0003】また、設定された1ページ当りの文字数及
び行数が、その々をページについて入力された文書の文
字数よりかなり大きなような場合には、文字間隔および
行ピッチが適切に設定されていないという状況になり、
文書データの出力フォーマットは、そのページの上部に
詰まって出力されるなど依然として見苦しいものとな
る。このことから文字間隔および行ピッチについても正
確に設定する必要があった。 【0004】しかしながら、文書作成者が文書データ量
からページに対して見易いように文字数及び行数を設定
し、さらに文字間隔および行ピッチについても設定する
のは、フォーマットを決定するまでに非常に手間がかか
る作業であった。 【0005】 【発明が解決しようとする課題】このように、従来のワ
ードプロセッサでは、所定のページ内に文書を見易く納
めるためには、文書作成者が文書の文字数及び行数を決
定したり、文字間隔および行ピッチを調整をする等の試
行錯誤を繰返すという繁雑な作業が必要であった。 【0006】本発明は、このような事実に基づき、文書
データの量に基いて、指定されたページ条件を満たすよ
うに文書データの出力フォーマットを決定する文書整形
方法を提供することを目的とする。 【0007】 【課題を解決するための手段】本発明は、見出し・段落
等あるいは章・節などの論理構造を持つ文書データの出
力形態を制御するための書式であって、論理構造には依
存せずに文書データを適用対象とする論理構造非依存書
式に加えて、規定された論理構造のカテゴリに該当する
文書データの部分を適用対象とする論理構造依存書式を
含んで構成される書式を決定する書式決定方法であっ
て、文書データを出力する際に要する出力領域の減少ま
たは増加を伴う書式の内容変更を規定した規則であっ
て、前記論理構造依存書式の内容変更を規定した論理構
造依存規則を少なくとも1つ含むものを第1の記憶手段
に記憶し、書式を決定する対象となる文書データとこの
文書データの論理構造の情報を第2の記憶手段と第3の
記憶手段に記憶し、前記第1の記憶手段に記憶された規
則を、少なくとも前記第3の記憶手段から取得した論理
構造の情報に基づいて適用して、前記第2の記憶手段に
記憶された文書データを指定ページ内に展開した出力形
態で出力装置から出力可能なようにかつ該出力形態に係
る最終ページでの余白部分に相当する行数を少なくさせ
るように調整した書式を決定することを特徴とする。好
ましくは、前記論理構造依存書式は、文書データのうち
所定の階層レベルの見出しに該当する部分の前または後
に設ける空白行の設定数を含むものであり、前記論理構
造依存規則は、前記空白行の設定数を増加または減少さ
せる規則であるようにしてもよい。好ましくは、前記論
理構造依存規則は、見出しと段落との間にある空白行な
どの区切り要素を章・節などの階層により優先順位をつ
けながら文書全体に関して統一して変形させるように書
式を変更させるものであるようにしてもよい。好ましく
は、前記第1の記憶手段に記憶される規則を適用して書
式を決定するときに、前記論理構造に基づいて見出しと
これを受ける段落とはページ渡りしないように書式を決
定するようにしてもよい。好ましくは、前記第1の記憶
手段に記憶される規則は、前記論理構造非依存書式の内
容変更を規定した規則を少なくとも1つ含むものであ
り、この規則の適用に先だって、少なくとも1つの論理
構造依存規則を適用するようにしてもよい。好ましく
は、前記論理構造非依存書式は、ページ当たりの行数お
よび1行当たりの文字数を含むものであり、前記第1の
記憶手段に記憶される規則は、前記ページ当たりの行数
および1行当たりの文字数の少なくとも一方を変更させ
る規則を含むものであるようにしてもよい。 【0008】 【作用】本発明では、文書データの持つ見出し・段落等
あるいは章・節などの論理構造に基づき出力形態を調整
するための規則を適用することを通して、文書データを
指定ページ内に展開した出力形態で出力装置から出力可
能なようにかつ該出力形態に係る最終ページでの余白部
分に相当する行数を少なくさせるように調整した書式を
決定する。 【0009】 【実施例】以下、図面を参照しながら本発明の一実施例
について説明する。図1は本実施例に係る文書整形方法
が適用される装置の概略構成を示すものである。 【0010】入力部1は、例えばキーボードなどからな
る入力手段であり、文書データやページ制約情報等、必
要なデータを入力するためのものである。この入力部1
を介して入力されたデータは、装置全体の制御を司る文
書管理部2に与えられる。文書管理部2に与えられた文
書データは、原文記憶部3に格納される。文書管理部2
は、原文記憶部3に格納された文書データの区切りコー
ド、例えば改行コードを検出し、これを1文の最後とみ
なして1文毎に分解する。表示部4は、このように分解
された文書データを図2に示すように文番号とともに表
示する。 【0011】論理構造解析部5は、内部に日本語辞書を
備えており、この日本語辞書を参照して入力文書の形態
要素のつながり関係、前後の文の構造をもとに、章、節
等の論理構造を判定する。例えば、図2の例では文番号
1は最初の文章で「文書理解システム」という名詞句で
終わっているので、この1番の文の属性は標題であると
判断する。また、この標題には見出しパターンが付加さ
れていないので、見出しパターンにはnullコードが与え
られる。文番号2は、「大川太郎」という固有名詞であ
ることが日本語辞書を参照して分るので、これは著者名
であると判断する。この著者名についても見出しパター
ンはnullである。このようにして解析された結果を図3
に示す。この解析された論理構造は、構造記憶部6に格
納される。数字+後置部等の見出しパターンは、検出さ
れた順に、例えば章見出し、節見出しとし、かつ同一構
造のものは同一レベルの見出しと考えて属性を決定して
いく。 【0012】整形規則辞書7は、得られた論理構造の展
開形態(書式)を、指定されたページに納まるようにす
るには、その書式をどのように変更すべきかに関する規
則とを備えている。図4は記憶されている書式の例であ
る。星印が付いているところが現在選択されている書式
である。また、規則は図5に示される。 【0013】即ち、規則1は、整形記憶辞書7に記憶さ
れている書式のうち「属性:後文」を1行ずつ減らして
行く規則で、例えば図6(a)から同図(b)に示すよ
うに、見出しと次に続く段落との間を行を縮めるもので
ある。この規則は、小見出し→項見出し→節見出し→章
見出しの順、つまりレベルの低い順に適用される。最も
小さな間隔(空行0)になれば、それ以上この規則は適
用されない。又、この規則は、記憶されている書式がも
ともと「後文=空行0」を選択しているときには適用さ
れない。 【0014】規則2は、整形規則辞書7に記憶されてい
る書式の「属性:前文」を1行ずつ減らしていく規則
で、例えば図6(b)から同図(c)に示すように、見
出しとその前の段落との間の行を縮めるためのものであ
る。最も小さい間隔(空行0)になれば、この規則は適
用されない。以後は規則1と同様である。 【0015】規則3は、整形規則辞書7に記憶されてい
る「属性:後文」を空白1にし、さらに見出しの「属
性:下線」を「有」にする規則で、図6(c)から同図
(d)に示すように、見出しとそれに続く段落との間を
改行せずに空白により区切るようにし、その分、見出し
が目立つように下線を引くように変更することを意味し
ている。 【0016】規則4は、各指定用紙の大きさ(A4、B
4)に対する1行当りの字数を1字ずつ変更できること
を規定している。また、この規則4を適用すると、1行
当りの文字間隔も変更できる。 【0017】規則5は、各指定用紙の大きさに対する1
頁当りの行数を1行ずつ変更できることを規定してい
る。また、この規則5を適用すると、1頁当りの行ピッ
チも変更できる。その他に、規則6は文字サイズの変更
を規定している。これらの規則4〜6は、指定されたペ
ージ内に文書が納まるようにするためのものである。整
形処理部8は、上記整形規則辞書7の規則を適用して、
文書データが指定されたページ数内に納まるように最適
な書式を決定する。さらに、出力部9は、この整形処理
部8で決定された書式で文書データを出力する。次に、
このように構成された本実施例の動作について説明す
る。 【0018】入力部1を介して図2の文書データが入力
され、原文記憶部3にこれが格納されると、論理構造解
析部5は、図7に示す処理を行なって文書データの論理
構造を決定する。 【0019】即ち、まず、文書データ中から見出し語が
あるかどうかが判定され(a)、見出し語がある場合に
は、見出し候補を作成する(b)。次に、作成された見
出し候補のなかで一致する見出し規則が有るかどうかを
確認し(c)、見出しを作る(d)。もし見出し語が検
出されなかった場合及び一致する見出し規則が得られな
かった場合には、見出し無しとして処理をする(e)。
次に、一致する文書構造規則があるかどうかを調べ
(f)、一致する文書構造規則がある場合には、文書構
造を作る(g)。そして、その文書構造を構造記憶部6
に書込む(h)。もし、一致する文書規則がない場合に
は、エラー処理を行なう(i)。以上の処理を行なう
と、構造記憶部6には、図3に示すような論理構造が格
納される。次に、整形処理部8での動作を図8に基づき
説明する。 【0020】まず、整形処理部8は、予め指定された書
式、或は初期設定された書式に基づいて、文書データを
展開する(j)。この展開の結果、指定されたページ数
の中に納まっているかどうかを確認する(k)。ここで
指定のページ数に納まっている場合には、ここでの処理
は終了するが、指定ページを超過している場合には、余
分な行数mを計算する(l)。規則1から順に適用しな
がら(n,m,o)、その都度、短くなる行数nを計算
する(p)。この計算は、m≦nになるまで続行される
(q)。 【0021】例えば、文書データをA4で2ページに納
めて出力するように指定され、初期展開を図4の書式に
従って展開したところ、2ページに納まらずに、4行分
余ったとする。この場合、整形処理部8は、整形規則辞
書7の規則を規則1から順番に適用して、短くできる行
数を計算する。 【0022】いま、この文書に節見出しが4か所あり、
かつ規則1が適用できれば、全体で1行×4=4行分短
くできる。この場合は、4行短くなれば、指定の2ペー
ジに納まるので、整形処理部8は、ページ制約が守れた
と判断して処理を終了する。文書管理部4は、新しい書
式の文書を表示部4で表示させるとともに、出力部9を
介してプリントアウトさせる。 【0023】また、規則1の代わりに規則4を適用して
予め指定された、あるいは初期設定された指定用紙の大
きさに対する1行当たりの字数では、文書データが指定
ページからはみ出す場合は、1字ずつ増やすことができ
る。これにより当然、文字間隔も変更され、適切な書式
で文書が出力される。 【0024】規則5も同様に、予め指定された、あるい
は初期設定された指定用紙の大きさに対する1頁当たり
の行数を1行ずつ増減し、行ピッチを変更し、文書デー
タが指定ページに過不足なく納まることで文書を出力す
る。このような処理を行なうことにより、ユーザになん
ら負担をかけることなく、指定されたページに、見易い
形で納まった文書を得ることができる。 【0025】なお、以上は指定ページからはみ出す場合
の短縮方法について重点的に説明しているが、指定ペー
ジに足りない場合についても、殆ど同様に処理すること
ができる。この場合には、図5の規則1、2の空行変更
値を(−1)→(+1)に変更し、規則4、5をそれぞ
れ1字、1行ずつ減らすように変更することができるよ
うにしておく。そして、図9に示すように、指定ページ
に足りない行数mを求めた後(r)、mの正負を判定し
(s)、m=0であれば指定ページ数に丁度納まってい
るので終了し、m<0ならば上記変更値を(−1)にセ
ットし(t)、m>0ならば上記変更値を(+1)にセ
ットする(u)。そして、規則1から順に適用し、増え
た行数nを計算する(v)。そして、|m|≦|n|に
なったら(w)、処理を終了すればよい。 【0026】なお、以上の各実施例では図5に示すよう
な整形規則に従ってページ制約を守る例を説明したが、
この規則を変更することは十分可能である。また、規則
の適用順序や規則の内容も、ユーザの指定により種々変
更することは可能である。また、書式の構造や論理構造
も、上記実施例で示した内容に限定されるものではな
い。 【0027】更には、規則の適用により、指定ページに
納めることが困難な場合には、その旨のメッセージを出
すようにすることも可能である。また、見出し語とその
本文とがページわたりしないように、例えば見出し語が
ページの最後の行に位置したときには、その見出し語を
次のページに送る等の処理を、論理構造に基づき行なえ
ば、更に見易い文書を得ることができる。 【0028】 【発明の効果】本発明によれば、文書データの持つ見出
し・段落等あるいは章・節などの論理構造に基づき出力
形態を調整するための規則を適用することを通して、文
書データを指定ページ内に展開した出力形態で出力装置
から出力可能なようにかつ該出力形態に係る最終ページ
での余白部分に相当する行数を少なくさせるように調整
した書式を得ることができる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document shaping method for determining a document output format, and more particularly, to a method for determining an output mode that complies with designated page conditions. It relates to the document formatting method. 2. Description of the Related Art Generally, in a word processor, pages are assigned to document data based on a preset format. Therefore, in the case of a document having a condition for the number of pages to be accommodated, such as a collection of papers presented at a national conference of a society, the number of characters per page and the number of lines per page must not exceed the number of pages described above. Had to be set. When the number of characters and the number of lines per page are considerably larger than the number of characters of a document input for each page, the character spacing and line pitch are not properly set. That situation,
The output format of the document data is still unsightly, such as being output at the top of the page. For this reason, it is necessary to accurately set the character spacing and line pitch. However, setting the number of characters and the number of lines so that the document creator can easily view the page based on the amount of document data, and also setting the character spacing and line pitch are extremely troublesome until the format is determined. It was a tedious task. As described above, in a conventional word processor, a document creator determines the number of characters and the number of lines of a document, or sets the number of characters in order to fit the document within a predetermined page in a legible manner. A complicated operation of repeating trial and error, such as adjusting the interval and the line pitch, was required. An object of the present invention is to provide a document shaping method for determining an output format of document data so as to satisfy a specified page condition based on the amount of document data based on such fact. . SUMMARY OF THE INVENTION The present invention is a format for controlling an output form of document data having a logical structure such as a heading / paragraph or a chapter / section. In addition to the logical structure-independent format that applies to document data without using logical data, a format that includes a logical structure-dependent format that applies to the portion of document data that falls under the specified logical structure category A method for determining a format, which is a rule that specifies a change in the content of a format accompanied by a decrease or increase in the output area required when outputting document data, and a logical structure that specifies a change in the content of the logical structure-dependent format. A document including at least one dependency rule is stored in a first storage unit, and document data for which a format is to be determined and information on a logical structure of the document data are stored in a second storage unit and a third storage unit. And applying the rules stored in the first storage means based on at least the information on the logical structure obtained from the third storage means, to thereby store the document data stored in the second storage means. A format adjusted so as to be output from the output device in an output form expanded into a designated page and to reduce the number of lines corresponding to a margin on the last page according to the output form. I do. Preferably, the logical structure-dependent format includes a set number of blank lines provided before or after a portion corresponding to a heading of a predetermined hierarchical level in the document data. May be a rule for increasing or decreasing the set number of. Preferably, the logical structure-dependent rule is modified so that a delimiter element such as a blank line between a heading and a paragraph is unified and deformed throughout the entire document while prioritizing according to a hierarchy such as a chapter or a section. It may be made to make it. Preferably, when the format is determined by applying the rules stored in the first storage means, the format is determined based on the logical structure so that the heading and the paragraph receiving the heading do not cross pages. You may. Preferably, the rule stored in the first storage means includes at least one rule that defines a change in the content of the logical structure-independent format, and prior to application of this rule, at least one logical structure Dependency rules may be applied. Preferably, the logical structure-independent format includes the number of lines per page and the number of characters per line, and the rules stored in the first storage means include the number of lines per page and one line. A rule for changing at least one of the number of characters per hit may be included. According to the present invention, the document data is expanded in the designated page by applying a rule for adjusting the output form based on the logical structure of the document data such as a heading / paragraph or a chapter / section. A format adjusted so that the output device can output in the output form and the number of lines corresponding to the blank portion in the last page according to the output form is determined. An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a schematic configuration of an apparatus to which the document shaping method according to the present embodiment is applied. The input unit 1 is an input means such as a keyboard, for inputting necessary data such as document data and page restriction information. This input unit 1
Is input to the document management unit 2 which controls the entire apparatus. The document data provided to the document management unit 2 is stored in the original text storage unit 3. Document management unit 2
Detects a delimiter code of the document data stored in the original text storage unit 3, for example, a line feed code, and decomposes it for each sentence by regarding this as the end of one sentence. The display unit 4 displays the document data thus decomposed together with the sentence number as shown in FIG. The logical structure analysis unit 5 has a Japanese dictionary inside, and refers to the Japanese dictionary to determine the chapters and sections based on the connection relationship between the form elements of the input document and the structure of the preceding and following sentences. Is determined. For example, in the example of FIG. 2, sentence number 1 ends with the noun phrase “document understanding system” in the first sentence, and thus the attribute of the first sentence is determined to be the title. In addition, since a title pattern is not added to this title, a null code is given to the title pattern. Since the sentence number 2 is known to be a proper noun “Taro Okawa” by referring to the Japanese dictionary, it is determined that this is the author name. The heading pattern for this author name is also null. FIG. 3 shows the results of the analysis in this manner.
Shown in The analyzed logical structure is stored in the structure storage unit 6. The heading patterns such as numerals and postfixes are, for example, chapter headings and section headings in the order of detection, and attributes having the same structure are determined as headings of the same level and attributes are determined. The formatting rule dictionary 7 has rules on how to change the format of the logical structure so that the developed form (format) of the logical structure can be accommodated in the designated page. . FIG. 4 is an example of a stored format. The format with a star is the currently selected format. Also, the rules are shown in FIG. That is, rule 1 is a rule in which “attribute: post sentence” in the format stored in the format storage dictionary 7 is reduced line by line. For example, FIG. As shown, it shortens the line between the heading and the following paragraph. This rule is applied in the order of subheadings → section headings → section headings → chapter headings, that is, in ascending order. At the smallest interval (blank line 0), this rule no longer applies. Also, this rule is not applied when the stored format originally selects "second sentence = blank line 0". Rule 2 is a rule for reducing the "attribute: preamble" of the format stored in the formatting rule dictionary 7 line by line. For example, as shown in FIGS. 6 (b) to 6 (c), This is to shorten the line between the heading and the paragraph before it. At the smallest interval (blank line 0), this rule is not applied. After that, it is the same as rule 1. Rule 3 is a rule that sets “Attribute: Subsequent” stored in the formatting rule dictionary 7 to blank 1 and further sets “Attribute: Underline” of the heading to “Yes”. As shown in FIG. 11D, the heading and the paragraph following it are separated by a space without line break, and the heading is underlined accordingly. . Rule 4 specifies the size of each designated sheet (A4, B
4) that the number of characters per line can be changed one by one. By applying this rule 4, the character spacing per line can also be changed. [0017] Rule 5 is that 1 for each designated paper size.
It specifies that the number of lines per page can be changed line by line. By applying this rule 5, the line pitch per page can be changed. In addition, Rule 6 regulates a change in the character size. These rules 4 to 6 are for ensuring that the document fits within the specified page. The shaping processing unit 8 applies the rules of the shaping rule dictionary 7 to
Determine the optimal format so that the document data will fit within the specified number of pages. Further, the output unit 9 outputs the document data in the format determined by the shaping processing unit 8. next,
The operation of the present embodiment thus configured will be described. When the document data of FIG. 2 is input via the input unit 1 and stored in the original text storage unit 3, the logical structure analysis unit 5 performs the processing shown in FIG. decide. That is, first, it is determined whether or not there is a headword from the document data (a). If there is a headword, a heading candidate is created (b). Next, it is confirmed whether there is a matching heading rule among the created heading candidates (c), and a heading is created (d). If a headword is not detected or a matching heading rule is not obtained, it is determined that there is no heading (e).
Next, it is checked whether there is a matching document structure rule (f), and if there is a matching document structure rule, a document structure is created (g). Then, the document structure is stored in the structure storage unit 6.
(H). If there is no matching document rule, error processing is performed (i). When the above processing is performed, a logical structure as shown in FIG. Next, the operation of the shaping section 8 will be described with reference to FIG. First, the shaping section 8 expands the document data based on a format specified in advance or a format set initially (j). As a result of this development, it is checked whether the number of pages is within the specified number of pages (k). Here, if the number is within the specified number of pages, the processing here ends, but if the number exceeds the specified number of pages, an extra line number m is calculated (l). While sequentially applying rules from rule 1, (n, m, o), the number n of rows to be shortened is calculated each time (p). This calculation is continued (m) until m ≦ n. For example, it is assumed that the document data is designated to be stored in two pages in A4 and output, and the initial development is performed according to the format shown in FIG. In this case, the shaping processing unit 8 calculates the number of lines that can be shortened by applying the rules of the shaping rule dictionary 7 in order from rule 1. Now, there are four section headings in this document,
In addition, if Rule 1 can be applied, the total length can be shortened by 1 line × 4 = 4 lines. In this case, if the length is shortened by four lines, the data can be accommodated in the specified two pages. Therefore, the shaping processing unit 8 determines that the page restriction has been observed and ends the processing. The document management unit 4 displays the document in the new format on the display unit 4 and prints out the document via the output unit 9. If the number of characters per line specified or previously set by applying Rule 4 instead of Rule 1 to the specified paper size, if the document data is out of the specified page, 1 Can be increased by letters. This naturally changes the character spacing and outputs the document in an appropriate format. Similarly, in rule 5, the number of lines per page with respect to a designated or initialized designated paper size is increased or decreased by one line at a time, and the line pitch is changed. Documents are output when they fit in exactly the right amount. By performing such a process, it is possible to obtain a document that fits in the specified page in an easily viewable form without putting any burden on the user. Although the above description focuses on the method of shortening when the specified page is exceeded, almost the same processing can be performed when the specified page is insufficient. In this case, the blank line change values of rules 1 and 2 in FIG. 5 can be changed from (−1) to (+1), and rules 4 and 5 can be changed so as to reduce one character and one line each. So that Then, as shown in FIG. 9, after calculating the number m of lines that are insufficient for the specified page (r), the sign of m is determined (s). If m = 0, the line is just within the specified number of pages. When m <0, the change value is set to (-1) (t), and when m> 0, the change value is set to (+1) (u). Then, the rules are applied in order from rule 1 to calculate the increased number n of rows (v). Then, when | m | ≦ | n | (w), the processing may be terminated. In each of the above embodiments, an example has been described in which page restrictions are adhered to in accordance with a shaping rule as shown in FIG.
It is quite possible to change this rule. Further, the order of application of the rules and the contents of the rules can be variously changed by the designation of the user. Also, the format structure and logical structure are not limited to the contents described in the above embodiment. Further, when it is difficult to fit the content on the designated page due to the application of the rule, a message to that effect can be issued. Also, if the headword is located on the last line of the page so that the headword does not cross the page, if processing such as sending the headword to the next page is performed based on the logical structure, Further, a document which is easy to read can be obtained. According to the present invention, the document data is specified by applying rules for adjusting the output form based on the logical structure of the document data such as a headline / paragraph or a chapter / section. It is possible to obtain a format adjusted so that it can be output from the output device in the output form expanded in the page and to reduce the number of lines corresponding to the blank portion on the last page in the output form.

【図面の簡単な説明】 【図1】本発明の一実施例の全体構成を示すブロック
図。 【図2】表示部における表示形態の一例を示す図。 【図3】構造記憶部に記憶される論理構造の一例を示す
図。 【図4】整形規則辞書に格納される書式データを示す
図。 【図5】図4に示す整形規則辞書に格納される整形規則
を示す図。 【図6】図5に示す整形規則を適用して変化する文書形
態の例を示す図。 【図7】論理構造解析手順を示す流れ図。 【図8】文書整形手順を示す流れ図。 【図9】本発明の他の実施例に係る文書整形手順を示す
流れ図。 【符号の説明】 1…入力部、2…文書管理部、3…原文記憶部、4…表
示部、5…論理構造解析部、6…構造記憶部、7…整形
規則辞書、8…整形処理部、9…出力部。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an overall configuration of an embodiment of the present invention. FIG. 2 is a diagram showing an example of a display mode on a display unit. FIG. 3 is a diagram showing an example of a logical structure stored in a structure storage unit. FIG. 4 is a diagram showing format data stored in a formatting rule dictionary. FIG. 5 is a view showing shaping rules stored in the shaping rule dictionary shown in FIG. 4; FIG. 6 is a view showing an example of a document form that changes by applying the shaping rule shown in FIG. 5; FIG. 7 is a flowchart showing a logical structure analysis procedure. FIG. 8 is a flowchart showing a document shaping procedure. FIG. 9 is a flowchart showing a document shaping procedure according to another embodiment of the present invention. [Description of Signs] 1 ... input unit, 2 ... document management unit, 3 ... original storage unit, 4 ... display unit, 5 ... logical structure analysis unit, 6 ... structure storage unit, 7 ... shaping rule dictionary, 8 ... shaping process Unit, 9 ... output unit.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−70370(JP,A) 特開 昭63−59657(JP,A) 特開 昭58−138655(JP,A) 特開 昭57−79987(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/21 G06F 17/22 G06F 17/24──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-63-70370 (JP, A) JP-A-63-59657 (JP, A) JP-A-58-138655 (JP, A) 79987 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G06F 17/21 G06F 17/22 G06F 17/24

Claims (1)

(57)【特許請求の範囲】 1.見出し・段落等あるいは章・節などの論理構造を持
つ文書データの出力形態を制御するための書式であっ
て、論理構造には依存せずに文書データを適用対象とす
る論理構造非依存書式に加えて、規定された論理構造の
カテゴリに該当する文書データの部分を適用対象とする
論理構造依存書式を含んで構成される書式を決定する書
式決定方法であって、 文書データを出力する際に要する出力領域の減少または
増加を伴う書式の内容変更を規定した規則であって、前
記論理構造依存書式の内容変更を規定した論理構造依存
規則を少なくとも1つ含むものを第1の記憶手段に記憶
し、 書式を決定する対象となる文書データとこの文書データ
の論理構造の情報を第2の記憶手段と第3の記憶手段に
記憶し、 前記第1の記憶手段に記憶された規則を、少なくとも前
記第3の記憶手段から取得した論理構造の情報に基づい
て適用して、前記第2の記憶手段に記憶された文書デー
タを指定ページ内に展開した出力形態で出力装置から出
力可能なようにかつ該出力形態に係る最終ページでの余
白部分に相当する行数を少なくさせるように調整した書
式を決定することを特徴とする書式決定方法。 2.前記論理構造依存書式は、文書データのうち所定の
階層レベルの見出しに該当する部分の前または後に設け
る空白行の設定数を含むものであり、 前記論理構造依存規則は、前記空白行の設定数を増加ま
たは減少させる規則であることを特徴とする請求項1に
記載の書式決定方法。 3.前記論理構造依存規則は、見出しと段落との間にあ
る空白行などの区切り要素を章・節などの階層により優
先順位をつけながら文書全体に関して統一して変形させ
るように書式を変更させるものであることを特徴とする
請求項1に記載の書式決定方法。 4.前記第1の記憶手段に記憶される規則を適用して書
式を決定するときに、前記 論理構造に基づいて見出しと
これを受ける段落とはページ渡りしないように書式を決
定することを特徴とする請求項1ないし3のいずれか1
項に記載の書式決定方法。 5.前記第1の記憶手段に記憶される規則は、前記論理
構造非依存書式の内容変更を規定した規則を少なくとも
1つ含むものであり、 この規則の適用に先だって、少なくとも1つの論理構造
依存規則を適用することを特徴とする請求項1に記載の
書式決定方法。 6.前記論理構造非依存書式は、ページ当たりの行数お
よび1行当たりの文字数を含むものであり、 前記第1の記憶手段に記憶される規則は、前記ページ当
たりの行数および1行当たりの文字数の少なくとも一方
を変更させる規則を含むものであることを特徴とする請
求項1または5に記載の書式決定方法。
(57) [Claims] 1.Has a logical structure such as headings / paragraphs or chapters / sections
Format to control the output format of document data.
Target the document data without depending on the logical structure.
In addition to the logical structure independent format,
Applies to document data that falls under the category
A document that determines the format that includes the logical structure-dependent format
An expression determination method, Reduced output area required when outputting document data or
A rule that stipulates a change in the content of a form with an increase
Logical structure dependent, which stipulates changes to the contents of the logical structure dependent format
Stores at least one rule in the first storage means
And Document data whose format is to be determined and this document data
Information of the logical structure of the second storage means and the third storage means
Remember, The rule stored in the first storage means is at least
Based on the information of the logical structure obtained from the third storage means
The document data stored in the second storage means.
Output from the output device in an output format in which
In the last page of the output
A book adjusted to reduce the number of lines corresponding to the white part
A method for determining a format, comprising determining an expression. 2.The logical structure-dependent format is a predetermined format in the document data.
Before or after the section corresponding to the heading of the hierarchy level
Including the set number of blank lines The logical structure dependent rule increases the set number of blank lines.
Claim 1 characterized by the following rules:
How to determine the format of the description. 3.The logical structure-dependent rule is placed between the heading and the paragraph.
Elements such as blank lines that are
Unify and transform the entire document while prioritizing
It is characterized by changing the format so that
The format determination method according to claim 1. 4.Applying the rules stored in the first storage means,
When determining the formula, Headings based on logical structure
Format the paragraph that receives it so that it does not cross pages.
4. The method according to claim 1, wherein
Format determination method described in section. 5.The rule stored in the first storage means is the logic
At least the rules governing the structure-independent format changes
Including one, Prior to the application of this rule, at least one logical structure
The method according to claim 1, wherein a dependency rule is applied.
Format determination method. 6.The logical structure independent format is based on the number of lines per page.
And the number of characters per line, The rule stored in the first storage means is the
At least one of the number of lines per line and the number of characters per line
Contracts that include rules for changing
The format determination method according to claim 1 or 5.
JP4066681A 1992-03-25 1992-03-25 Format determination method Expired - Fee Related JP2763227B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4066681A JP2763227B2 (en) 1992-03-25 1992-03-25 Format determination method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4066681A JP2763227B2 (en) 1992-03-25 1992-03-25 Format determination method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP62054111A Division JPH0668748B2 (en) 1987-03-11 1987-03-11 Document formatting method

Publications (2)

Publication Number Publication Date
JPH0581247A JPH0581247A (en) 1993-04-02
JP2763227B2 true JP2763227B2 (en) 1998-06-11

Family

ID=13322920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4066681A Expired - Fee Related JP2763227B2 (en) 1992-03-25 1992-03-25 Format determination method

Country Status (1)

Country Link
JP (1) JP2763227B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1093618A (en) * 1996-09-17 1998-04-10 Murata Mach Ltd Communication terminal device
JP2002157238A (en) 2000-09-06 2002-05-31 Seiko Epson Corp Browsing information preparing system, digital contents preparing system, digital contents distributing system and digital contents preparing program
JP6388756B2 (en) * 2012-08-08 2018-09-12 ナレッジオンデマンド株式会社 Electronic manual output system, electronic manual output method, and electronic manual output program
JP7200530B2 (en) * 2018-08-06 2023-01-10 コニカミノルタ株式会社 Information processing device and information processing program

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5779987A (en) * 1980-11-07 1982-05-19 Fujitsu Ltd Document processing system
JPS5781643A (en) * 1980-11-07 1982-05-21 Fujitsu Ltd Character-string input system
JPS58138655A (en) * 1982-02-12 1983-08-17 Toshiba Corp Controlling system for printing document
JP2741750B2 (en) * 1986-08-30 1998-04-22 キヤノン株式会社 Image processing device
JPS6370370A (en) * 1986-09-12 1988-03-30 Ricoh Co Ltd Document preparing device
JPH0668748B2 (en) * 1987-03-11 1994-08-31 株式会社東芝 Document formatting method

Also Published As

Publication number Publication date
JPH0581247A (en) 1993-04-02

Similar Documents

Publication Publication Date Title
US7805671B1 (en) Style sheet generation
US6533822B2 (en) Creating summaries along with indicators, and automatically positioned tabs
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
KR19980080220A (en) Recording medium recording language identification device, language identification method and program of language identification
JP2765665B2 (en) Translation device for documents with typographical information
JPH077410B2 (en) Document layout method
JPH05158401A (en) Document fast reading support/display system and document processor and document retrieving device
JP2763227B2 (en) Format determination method
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
JPH0668748B2 (en) Document formatting method
JP3076348B2 (en) Document shaping apparatus and document shaping method
JP2680540B2 (en) Document layout method
JP2680501B2 (en) Document output method
JP2829264B2 (en) Document layout method
JP2680500B2 (en) Document layout method
JP2682570B2 (en) Document layout method
JPH07141366A (en) Word processor and method for generating document with notes
JPH0778800B2 (en) Document processor
JP2575947B2 (en) Phrase extraction device
JP3470926B2 (en) Document processing apparatus and document processing method
JPH02136956A (en) Extracting method for layout information
JPH05298317A (en) Doucment forming device
JPH07182344A (en) Machine translation system
JPH04286063A (en) Device and method for processing document
JPS63245760A (en) Document shaping device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees