JP4474670B2 - Document shaping apparatus and document shaping method - Google Patents

Document shaping apparatus and document shaping method Download PDF

Info

Publication number
JP4474670B2
JP4474670B2 JP2008294857A JP2008294857A JP4474670B2 JP 4474670 B2 JP4474670 B2 JP 4474670B2 JP 2008294857 A JP2008294857 A JP 2008294857A JP 2008294857 A JP2008294857 A JP 2008294857A JP 4474670 B2 JP4474670 B2 JP 4474670B2
Authority
JP
Japan
Prior art keywords
document
solid
shaping
text
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008294857A
Other languages
Japanese (ja)
Other versions
JP2010122829A (en
Inventor
輝美 石澤
和男 山本
Original Assignee
有限会社 ローバルコミュニケーションズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 有限会社 ローバルコミュニケーションズ filed Critical 有限会社 ローバルコミュニケーションズ
Priority to JP2008294857A priority Critical patent/JP4474670B2/en
Publication of JP2010122829A publication Critical patent/JP2010122829A/en
Application granted granted Critical
Publication of JP4474670B2 publication Critical patent/JP4474670B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、入力された文書データを整形して整形文書に変換する文書整形装置および文書整形方法に関する。   The present invention relates to a document shaping apparatus and a document shaping method for shaping input document data and converting it into a shaped document.

ワードプロセッサ等の文書作成装置の中には、文書の“章”、“節”および“項”というような文書構造を論理解析し、予め定められた変換ルールに従って整形し、整形文書を作成する装置がある。   Among document creation devices such as word processors, a device for logically analyzing a document structure such as “chapter”, “section”, and “term” of a document, shaping it according to a predetermined conversion rule, and creating a shaped document There is.

特許文献1には、抽出した段落について文書構造上の要素を決定し、段落内の文字位置と構成文字種からルールに基づいて段落内の文書構造上の階層レベルを判定し、判定した階層レベルに応じた文書構造上の要素を決定し、決定した段落の要素と、決定した段落内の要素について、構造スタイル定義に設定された構造スタイルを体裁スタイルに代えてそれぞれ適用することが記載されている。   In Patent Document 1, an element on the document structure is determined for the extracted paragraph, a hierarchical level on the document structure in the paragraph is determined based on a rule from a character position and a constituent character type in the paragraph, and the determined hierarchical level is determined. The document structure element is determined, and the structural style set in the structural style definition is applied to the determined paragraph element and the determined paragraph element instead of the appearance style. .

特許文献2には、文書の各記載項目の属性を判別し、記載項目間の階層構造を特定し、その階層構造を表わすルールデータを生成することが記載されている。   Patent Document 2 describes that the attribute of each description item of a document is determined, a hierarchical structure between the description items is specified, and rule data representing the hierarchical structure is generated.

特許文献3には、レイアウト編集ルールを準備しておいて、編集対象文書における各種文字列情報の存在を認識し、その文字列情報に応じたレイアウト編集処理を施すことにより編集対象文書のレイアウトに整えることが記載されている。   In Patent Document 3, a layout editing rule is prepared, the existence of various character string information in the document to be edited is recognized, and a layout editing process corresponding to the character string information is performed to create the layout of the document to be edited. It is described that it is arranged.

特許文献4には、整形処理が異なる1種類あるいは複数種類の文書整形装置を選択し、選択した文書整形装置の各々によって文書整形のルールを示す属性を含んだ同一文書を整形させ、選択した文書整形装置の各々が整形した結果をビットマップ画像に変換することが記載されている。   In Patent Document 4, one type or a plurality of types of document shaping devices with different shaping processes are selected, the same document including an attribute indicating a document shaping rule is shaped by each of the selected document shaping devices, and the selected document is selected. It describes that the result of shaping by each shaping device is converted into a bitmap image.

特開2007−164705号公報JP 2007-164705 A 特開2007−52615号公報JP 2007-52615 A 特開平6−139235号公報JP-A-6-139235 特開平11−282840号公報JP-A-11-282840

上述したように、従来入力された文書データを解析ルールによって複数の段落に分割し、各段落の階層構造を決定し、各種のルールを適用して目的とする構造スタイルの文書を自動的に作成することが行われ、多種多様なスタイルの電子化文書に対応することが行われている。しかしながら、従来の文書変換方法にあっては入力された文書データから整形された構造の文書への変換に当って複雑な、高度な、あるいは多種多様の変換ルールを用いて行っており、汎用性があるというものではなかった。   As described above, previously input document data is divided into multiple paragraphs according to analysis rules, the hierarchical structure of each paragraph is determined, and various rules are applied to automatically create a document with the desired structural style. It has been done to deal with a wide variety of styles of electronic documents. However, in the conventional document conversion method, conversion from input document data to a document with a structured structure is performed using complicated, advanced or various conversion rules. There was no such thing as.

ところで、整形構造の文書の中には取扱説明書あるいは検査報告書のようにこれらを取り扱う企業内に文書構造が特定されていて、入力される文章データがこの特定されている文書構造が近似しているのにもかかわらず一々フォーマットを変換していることが行われている。このような方法では、特定されている文書構造の文章に変換するのがわずらわしいので、目的とする特定されている文書構造を予め指定することによって、簡便で、汎用性のある変換によって迅速に目的とする特定されている文書構造の文書を作成したいというニーズがある。
本発明は、かかる点に鑑みて入力される文章データが目的とする特定されている整形文書構造に近似している場合に、この近似していることを生かして当該整形文書を指定しておくことによって、簡便で、汎用性のある変換によって迅速に目的とする特定されている整形文書構造の文章を作成することのできる文書整形装置および文書整形方法を提供することを目的とする。
By the way, the document structure is specified in the company that handles these, such as an instruction manual or an inspection report, in the document of the structured structure, and the document structure to which the specified sentence data is approximated is input. Despite the fact that the format is being converted one by one. In such a method, since it is troublesome to convert to a sentence having a specified document structure, it is easy to quickly specify a target structure by specifying the target specified document structure in a simple and versatile manner. There is a need to create a document having a specified document structure.
In consideration of this point, the present invention designates the formatted document by taking advantage of this approximation when the input text data approximates the target specified formatted document structure. Accordingly, it is an object of the present invention to provide a document shaping apparatus and a document shaping method capable of creating a sentence of a specified formatted document structure quickly and easily by simple and versatile conversion.

本発明は、データベースに格納された整形モデルを指定しておくことを前提として、任意スタイルの認識されたクライアント文書構造について第一のルールを適用して特定スタイルのベタ書き文書構造を有するベタ書き文書テキストを構成し、ベタ書き文書構造を認識して第二ル−ルを適用して整形された整形文書構造に変換して整形スタイルの整形テキストを構成することを特徴とする。   The present invention is based on the premise that a formatting model stored in a database is designated, and the first rule is applied to a recognized client document structure of an arbitrary style to thereby create a solid writing having a solid writing document structure of a specific style. A document text is formed, a solid document structure is recognized, converted to a formatted document structure formed by applying a second rule, and a formatted text of a formatting style is configured.

本発明は、具体的には、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置において、
文書データを入力する文書データ入力手段と、
整形モデルを指定する整形モデル指定手段と、
入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成するクライアント文書テキスト構成手段と、
クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識するクライアント文書構造認識手段と、
データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段と、
特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識するベタ書き文書構造認識手段と、
データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する整形文書テキスト構成手段と、
第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納するデータベースを備え、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成すること
を特徴とする文書整形装置を提供する。この文書整形装置は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを表示する文書表示手段を備えることができる。従って、整形モデルを文書表示手段に表示して、指定することができる。
Specifically, the present invention provides a document shaping apparatus including a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute.
Document data input means for inputting document data;
A shaping model specifying means for specifying a shaping model;
Client document text composing means for composing an input document data having a hierarchical structure as a client document text of an arbitrary style of a sentence structure having a hierarchical structure;
A client document structure recognizing means for recognizing a client document structure having a hierarchical structure by analyzing a client document structure having an arbitrary style for a client document text.
Using the first conversion rule stored in the database, the client document structure of an arbitrary style is simply written in a flat form regardless of the formatting model attribute of the formatting model in which the hierarchical document structure is specified. A solid document text composing means for composing a specific style solid document text converted into a document structure;
A solid document text having a specific style of a solid-written document structure is composed of a hierarchical structure, and the solid-written document structure in which the document structure is recognized is analyzed. A solid document structure recognition means for recognizing a written document structure;
Using the second conversion rule stored in the database, convert the recognized solid document structure of a specific style into a formatted formatted document structure according to the attributes of the registered formatting model, and configure the formatting text of the formatting style Formatted text formatting means to
The first conversion rule is a rule that determines the attribute conversion method for a document that converts text into a uniform solid text that is simply arranged in a flat form regardless of the attributes of the specified shaping model. A second conversion rule that defines a sentence attribute conversion method for converting to a formatted model sentence in accordance with the attributes of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model indicating the shaping model attribute It has a database that stores models whose model features are predetermined,
The formatted document text composing means provides a document formatting apparatus that configures a specific formatted document text according to a specified specific formatting model attribute. The document formatting apparatus can include a document display unit that displays a specific formatted document text configured by the formatted document text configuration unit. Therefore, the shaping model can be displayed and designated on the document display means.

本発明は、また、前記クライアント文書構造認識手段またはベタ書き文書構造認識手段は、階層構成の各階層の文書を解析して、文書の文頭、または文章の文頭および文書の文尾にタグを付与し、ベタ書き文書構造認識手段は、双方のタグによって1つの文書として認識することを特徴とする文書整形装置
を提供する。
In the present invention, the client document structure recognizing unit or the solid document structure recognizing unit analyzes the document of each layer of the hierarchical structure, and adds a tag to the beginning of the document, or the beginning of the document and the end of the document. The solid-written document structure recognizing means provides a document shaping apparatus characterized by recognizing as one document by both tags.

本発明は、また、前記クライアント文書構造認識手段またはベタ書き文書構造認識手段は、1つまたは2つのタグによって規定された1つの文書の中に特異構成の文書がある時に、この特異文書の文頭または文頭および文尾に別のタグが付与されて特異文書として認識することを特徴とする文書整形装置を提供する。   In the present invention, the client document structure recognizing unit or the solid document structure recognizing unit is configured such that when there is a document having a unique configuration in one document defined by one or two tags, Alternatively, there is provided a document shaping device characterized in that a different tag is attached to the beginning and end of a sentence so that the document is recognized as a unique document.

本発明は、また、前記クライアント文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成され、
クライアント文書構造認識手段が、タグから文字列および行からなる構造を認識し、
ベタ書き文書構成手段が、文字列および行構造からなるベタ書き文書テキストを構成し、
ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析してタグが付与されたベタ書き文字列および行構造を認識し、
整形テキスト構成手段が、タグが付与されたベタ書き文字列および行構造を整形モデルに従って、整形された文字列および行構造に変換し、
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が単にフラットに並べられる特定のベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、整形モデルに従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法、および整形モデルが、文字行および列が定められたモデルであること、
を特徴とする文字整形装置を提供する。
According to the present invention, the client document structure includes a character string and a line structure including “chapter”, “section”, and “section”.
The client document structure recognition means recognizes the structure consisting of character strings and lines from the tag,
The solid document composition means composes a solid document text composed of a character string and a line structure,
The solid writing structure recognizing means analyzes the solid writing character string and line structure consisting of “chapter”, “section” and “section” to recognize the solid writing character string and line structure to which the tag is attached,
The formatted text composing means converts the solid character string and the line structure to which the tag is attached into the formatted character string and the line structure according to the formatting model,
The first conversion rule is a string and line attribute conversion method that converts a character string and a column structure to a specific solid writing structure that is simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is an attribute conversion method to a character string and a line formatted according to the “chapter”, “section” and “term” of the solid writing structure according to the formatting model, and the formatting The model is a model with character lines and columns,
A character shaping device characterized by the above.

本発明は、また、前記任意スタイルのクライアント文書テキストはページ書式属性を備え、第一の変換ルールはクライアント文書テキストが備えるページ書式属性を解除するルールでもあり、第二の変換ルールは整形モデルに従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあり、整形文書テキストはページ書式の属性を備えることを特徴とする文書整形装置を提供する。   According to the present invention, the client document text of any style has a page format attribute, the first conversion rule is a rule for canceling the page format attribute of the client document text, and the second conversion rule is in accordance with a formatting model. This is also a rule for adding a page format attribute to a solid document structure, and provides a document formatting device in which a formatted document text has a page format attribute.

本発明は、また、前記整形文書テキスト構成手段は、特定スタイルのベタ書き文書構造を整形モデルに従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成するときに、双方のタグによって規定された文書ごとに構成することを特徴とする文書整形装置を提供する。   According to the present invention, when the formatted document text composing means converts the solid document structure of a specific style into a formatted document structure formed according to the formatting model to construct the formatted text of the formatting style, both tags A document shaping apparatus is provided that is configured for each document defined by the above.

本発明は、また、上述に規定する整形文書テキストを構成するときに、上述に規定された別のタグによって規定された特異文書について、整形後の文書の該当の個所の文書を特異構成とすることを特徴とする文書整形装置を提供する。   In the present invention, when the formatted document text specified above is configured, the document at the corresponding position of the formatted document is set as a specific configuration for the specific document specified by another tag specified above. A document shaping apparatus characterized by the above is provided.

本発明は、また、第一の変換ルールが、
設定済み文字の大きさを統一する
設定済み書体を統一する
設定済み書体の強調なくす
設定済み行の間隔を統一する
設定済み文頭、文末位置、揃え、インデント、タブを解除する
設定済みの1つの段落内複数行における2行目以降の文頭位置の字下げをなくす
設定済みの改ページ設定をなくす
ことを定める文章構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法であることを特徴とする文書整形装置を提供する。
In the present invention, the first conversion rule is
Unify the size of the set type Unify the typeface that has been set Unset emphasis on the set type Unify the spacing between the set lines Preset sentence, end of sentence position, alignment, indent, one set paragraph to release tabs It is an attribute conversion method that converts the sentence structure, character string and line attributes, and page format attributes that eliminate the indentation at the beginning of the second and subsequent sentences in multiple lines. A document shaping apparatus characterized by the above.

本発明は、また、前記第一の変換ルールのページの書式の属性変換方法が、
1行の文字数、1ページの行数の設定を解除する
用紙の大きさ、方向設定を解除する
変換方法を備えることを特徴とする文書整形装置を提供する。
The present invention also provides an attribute conversion method of the page format of the first conversion rule.
There is provided a document shaping apparatus including a conversion method for canceling the setting of the number of characters per line and the number of lines for canceling the setting of the number of lines per page.

本発明は、また、前記第二の変換ルールが、
各文書構造にかかる本文文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造にかかる本文行の間隔が登録および選択されたものに適用される
各文書構造行の間隔が登録および選択されたものに適用される
各文章の文頭、文尾位置および揃え、インデントにタブ設定が適用される
各文章の1つの段落内複数行における2行目以降の文頭位置を設定する字下げが適用される
“章”、“節”および“項”の階層に下位階層が適用される
組み合わせおよび文字の置換えとして、半角化、補足及び統一化が適用される
最終行で改ページされることを定めるページの書式の属性を変換する
を定める文書構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法であることを特徴とする文書整形装置を提供する。
In the present invention, the second conversion rule may be
Each of the text structure font sizes, typefaces, and emphasis instructions applied to those registered and selected for each document structure. Applies to the document structure line interval that is registered and selected for the document structure. Applies to each document structure line interval that is registered and selected. The lower hierarchy is applied to the “chapter”, “section”, and “section” hierarchies where the indentation that sets the beginning of the second and subsequent sentences in multiple lines within one paragraph of each sentence to which the setting is applied is applied. As a combination and character replacement, the document structure that defines the conversion of page format attributes that specify page breaks at the last line to which half-width, supplement, and unification is applied, string and line attributes, and To provide a document formatting apparatus which is a attribute conversion method for converting an attribute of the over-di format.

本発明は、また、前記第二の変換ルールのページの書式の属性変換方法が、
上下左右の余白が登録および選択されたものに適用される
ページ、柱文が登録および選択された形式に適用される
1ページの行数および1行の文字数が登録および選択されたものに適用される
用紙方向が登録および選択されたものに適用される
変換方法を備えることを特徴とする文書整形装置を提供する。
The present invention also provides an attribute conversion method for the page format attribute of the second conversion rule.
Applies to pages where the top, bottom, left, and right margins are registered and selected, and those where the number of lines per page and the number of characters per line are applied to the format where the column sentence is registered and selected There is provided a document shaping apparatus comprising a conversion method applied to a registered and selected sheet orientation.

本発明は、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置による文書整形方法において、
文書データ入力手段によって、文書データを入力し、
整形モデル指定手段によって、整形モデルを指定し、
クライアント文書テキスト構成手段によって、入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成し、
クライアント文書構造認識手段によって、クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識し、
ベタ書き文書構成手段によって、データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成し、
ベタ書き文書構造認識手段によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識し、
整形文書テキスト構成手段によって、データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成し、
データベースに、第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納し、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成表示すること、
を特徴とする文書整形方法を提供する。
The present invention relates to a document shaping method by a document shaping device comprising a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute.
Enter the document data by the document data input means,
Specify the shaping model by the shaping model designation means,
By the client document text composing means, the input document data is configured as a client document text of an arbitrary style with a sentence structure consisting of a hierarchical structure, with respect to a document having a hierarchical structure,
The client document structure recognizing means recognizes the client document structure consisting of a hierarchical structure by analyzing the client document structure in which the hierarchical structure of the client document text is an arbitrary style,
By using the first conversion rule stored in the database by the solid document composition means, the client document structure of an arbitrary style is simply changed regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. Construct a solid text document of a specific style converted to a solid document structure that is arranged in a flat form,
The solid document structure recognizing means has a hierarchical structure for a solid document text having a solid document structure of a specific style. Recognizes the structure of a solid document with a specific style
Using the second conversion rule stored in the database, the formatted document text composing means converts the recognized solid document structure of a specific style into a formatted document structure according to the attributes of the registered formatting model. Compose formatting style formatting text,
Attribute conversion method for documents, which is the first conversion rule in the database, and the text is uniformly converted into a specific solid text arranged in a flat shape regardless of the shaping model attribute of the specified shaping model A second conversion rule, a rule for determining a sentence attribute conversion method for converting to a formatted model sentence according to the attribute of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model attribute Stores a model whose shaping model features indicated by
The formatted document text composing means composes and displays a specific formatted document text according to a specified specific formatting model attribute,
A document shaping method characterized by the above.

本発明は、上述のように、データベースに格納された整形モデルを指定しておいて、任意スタイルの認識されたクライアント文書構造について第一のルールを適用して特定スタイルのベタ書き文書構造を有するベタ書き文書テキストを構成し、ベタ書き文書構造を認識して第二ル−ルを適用して整形された整形文書構造に変換して整形スタイルの整形テキストを構成するようにしているので、入力される文章データが目的とする特定されている整形文書構造に近似している場合に、当該整形文書を指定しておくことによって、近似性を利用して、簡便で、汎用性のある変換によって迅速に目的とする特定されている整形文書構造の文章を作成することのできる文書整形装置および文書整形方法を提供することができる。   As described above, the present invention has a solid document structure of a specific style by specifying a formatting model stored in a database and applying the first rule to a recognized client document structure of an arbitrary style. Since it is composed of solid document text, it recognizes the solid document structure and converts it into a formatted document structure that is formatted by applying the second rule. If the text data to be processed is similar to the target specified formatted document structure, by specifying the formatted document, the approximation can be used to make the conversion simple and versatile. It is possible to provide a document shaping apparatus and a document shaping method capable of quickly creating a sentence having a specified formatted document structure.

以下、本発明の実施例を図面に基づいて説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の実施例である文書整形装置の構成を示すブロック図である。
図1において、文書整形装置100は文書整形手段1および文書表示手段2から構成され、文書整形のルールを示す属性を含んだ文書をこの属性に対応したルールに従って整形する文書整形手段(装置)と文書整理結果を表示する文書表示手段(装置)を備える。
FIG. 1 is a block diagram showing a configuration of a document shaping apparatus according to an embodiment of the present invention.
In FIG. 1, a document shaping apparatus 100 includes a document shaping means 1 and a document display means 2, and a document shaping means (apparatus) for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute. Document display means (apparatus) for displaying the result of document organization is provided.

図1(a)において、文書整形手段1は、演算処理手段11およびデータベース12から構成される。演算処理手段11は、整形モデル処理(手段)21、文書データ入力22、クライアント文書テキスト構成23、クライアント文書構造認識24、タグ設定機能25、ベタ書き文書テキスト構成機能26、ベタ書き構造認識27、整形文書テキスト構成28、および整形文書テキスト表示29を備える。   In FIG. 1A, the document shaping unit 1 includes an arithmetic processing unit 11 and a database 12. The arithmetic processing means 11 includes a shaping model process (means) 21, a document data input 22, a client document text structure 23, a client document structure recognition 24, a tag setting function 25, a solid document text composition function 26, a solid structure recognition 27, A formatted document text configuration 28 and a formatted document text display 29 are provided.

整形モデル処理21によってデータベース12に登録済み整形モデルを指定することができる。
データベース12は、登録済みモデル31、第一の変換ルール32および第二の変換ルール33を格納し、コンピュータ処理によって必要とされる各種のプログラムおよび手順を格納する。また、データベース12はタグ付与ルール34および各種文書テキスト35を格納する。
A shaping model registered in the database 12 can be designated by the shaping model processing 21.
The database 12 stores a registered model 31, a first conversion rule 32, and a second conversion rule 33, and stores various programs and procedures required by computer processing. Further, the database 12 stores a tag assignment rule 34 and various document texts 35.

文書表示手段2は、文書表示機能を備え、画面36に文書で構成される画面を表示することができる。   The document display means 2 has a document display function, and can display a screen composed of documents on the screen 36.

文書データ37は、キーボードからあるいは読み取り手段等の各種の入力手段の操作によって文書整形手段1に入力され、データベース12に格納される。
図1(b)は、上述した文書整形手段1の演算処理手段による整形モデル処理機能21になされる整形モデル登録処理を示す。
The document data 37 is input to the document shaping unit 1 from the keyboard or by operating various input units such as a reading unit and stored in the database 12.
FIG. 1B shows a shaping model registration process performed by the shaping model processing function 21 by the arithmetic processing means of the document shaping means 1 described above.

整形モデルデータ38が上述したと同様の各種の入力手段の操作によって演算処理手段11に入力される。   The shaping model data 38 is input to the arithmetic processing means 11 by operating various input means similar to those described above.

整形モデル処理21は整形モデルデータ38を入力し、登録処理することができる。具体的には、整形モデル処理21は入力された整形モデルについて後述する整形モデル特徴項目を画面36に表示し、整形モデル特徴項目を操作者に選択させ、組み合わせて、この特徴項目の選択(指定)、組み合わされた整形モデルの登録指示を行うことができる。登録指示された整形モデルは整形モデルリストに加えられて、番号等のIDが付されて、もしくはIDなしで整形モデルとして登録される。登録された整形モデルはリストによる一覧と共に、リストの1つを選択することによって整形モデルを特定し、上述した特徴項目の組み合わせから各項目内のいずれかの特徴を選択できるようにして、画面36に表示させ得る。   The shaping model processing 21 can input the shaping model data 38 and perform registration processing. Specifically, the shaping model processing 21 displays a shaping model feature item, which will be described later, for the inputted shaping model on the screen 36, causes the operator to select the shaping model feature item, and combines them to select (specify) the feature item. ), The combined shaping model can be registered. The shaping model instructed for registration is added to the shaping model list, and an ID such as a number is added, or is registered as a shaping model without an ID. The registered shaping model is specified by selecting one of the lists together with the list by the list, so that any feature in each item can be selected from the combination of feature items described above. Can be displayed.

以上のように構成された図1および図2に示す演算処理手段11において、文書データ37を入力する文書データ入力22によって文書データ入力手段が構成される。   In the arithmetic processing means 11 shown in FIGS. 1 and 2 configured as described above, the document data input means is configured by the document data input 22 for inputting the document data 37.

整形モデル処理21によって文書表示手段2の画面36に表示された、登録された整形モデルを指定する整形モデル指定手段が構成される。   The shaping model designating means for designating the registered shaping model displayed on the screen 36 of the document display means 2 by the shaping model processing 21 is configured.

クライアント文書テキスト構成23によって、入力された文書データ37が階層構成からなる文書である場合に、階層構成からなる文書構造が任意スタイルのクライアント文書テキストとして構成するクライアント文書テキスト構成手段が構成される。従って、ここで「クライアント」とは、ユーザ等の利用者という意味であって変換する前のデータであることを示す。   When the input document data 37 is a document having a hierarchical structure, the client document text structure 23 constitutes client document text composing means for composing the document structure having a hierarchical structure as client document text of an arbitrary style. Therefore, here, “client” means a user such as a user and indicates data before conversion.

クライアント文書構造認識24によって、クライアント文書テキストについて、階層構成からなる文書構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識するクライアント文書構造認識手段が構成される。   The client document structure recognition unit 24 constitutes client document structure recognition means for analyzing a client document structure having a hierarchical structure by analyzing a client document structure having an arbitrary style for a client document text.

タグ設定25によってクライアント文書構造を構成する各文章の文頭と文尾、各文章中の特異文章の文頭と文尾にタグを付着するタグ設定手段が構成される。このタグ設定手段は、クライアント文書構造認識手段の一部をなし、各文章、すなわち各文章を構成する文字列の文頭と文尾にタグが付着されてクライアント文書構造が認識される。クライアント文書構造の認識には各文章を構成する文字列の中の特異文章の文頭と文尾に付着されたタグによって切り出し可能な文章についての認識が含まれる。上記の例では文頭と文尾にタグを付着させているが、文頭のみにタグを付着させてもよい。   The tag setting 25 constitutes tag setting means for attaching a tag to the beginning and end of each sentence constituting the client document structure, and to the beginning and end of the unique sentence in each sentence. The tag setting means constitutes a part of the client document structure recognition means, and a tag is attached to each sentence, that is, the sentence head and the sentence end of each character string to recognize the client document structure. Recognition of the client document structure includes recognition of a sentence that can be extracted by a tag attached to the beginning and end of a unique sentence in a character string constituting each sentence. In the above example, the tag is attached to the beginning and end of the sentence, but the tag may be attached only to the beginning of the sentence.

ベタ書き文章テキスト構成26によって、データベース12に格納された第一の交換ルール32を用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が、指定される整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段が構成される。   By using the first exchange rule 32 stored in the database 12 by the solid sentence text structure 26, the client document structure of an arbitrary style can be changed regardless of the formatting model attribute designated by the hierarchical structure. Solid document text composing means for constructing a solid document text of a specific style converted into a solid document structure simply arranged in a flat form.

ベタ書き文書構造認識27によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識するベタ書き文書構造認識手段が構成される。   By the solid document structure recognition 27, the solid document text having a solid document structure of a specific style has a hierarchical structure, and the solid document structure in which the document structure is recognized is analyzed to have a hierarchical structure. A solid document structure recognizing means for recognizing a solid document structure of a specific style in which is recognized.

整形文書テキスト構成28によって、データベース12に格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き構造を登録済みモデル31の属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する整形文書テキスト構成手段が構成される。   By using the second conversion rule stored in the database 12, the formatted document text configuration 28 converts the recognized solid-style structure of a specific style into a formatted document structure that is formatted according to the attributes of the registered model 31. Formatted document text composing means for composing formatted text of the formatting style is configured.

データベース12は、第一の変換ルール32であって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納する。   The database 12 is the first conversion rule 32, and the attribute of the document in which the text is uniformly converted into a specific solid text arranged in a flat shape regardless of the attributes of the shaping model of the designated shaping model. A rule for determining a conversion method, a second conversion rule, a rule for determining a sentence attribute conversion method for converting to a formatted model sentence according to the attributes of the shaping model and corresponding to the hierarchical structure, and a shaping model, A model whose shaping model feature indicated by the model attribute is predetermined is stored.

また、データベース12は、各文章および各文章中の特異文章の文頭および文尾にタグを付与するルール(タグ付与ルール)を格納し、タグが付与された文章からなる文章構造を格納する。すなわち認識されたクライアント文章構造および認識されたベタ書き文書構造、更には構成された整形文書テキストを含む各種文書テキスト35を格納する。   Further, the database 12 stores a rule for attaching a tag to each sentence and a sentence head and a sentence tail of a unique sentence in each sentence (tag assignment rule), and stores a sentence structure including sentences to which a tag is attached. That is, various document texts 35 including the recognized client sentence structure, the recognized solid document structure, and the formed formatted document text are stored.

整形文書テキスト構成手段は、最終的に指定された特定の整形モデル属性に従って特定の整形文書テキストを構成する。   The formatted document text composing means configures the specific formatted document text according to the finally specified specific formatting model attribute.

文書表示手段2は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを画面36に表示する。   The document display unit 2 displays the specific formatted document text configured by the formatted document text configuration unit on the screen 36.

図2は、データベース12に登録された整形モデル(登録済みモデル)31の構成を示す。   FIG. 2 shows the configuration of the shaping model (registered model) 31 registered in the database 12.

整形モデル31はX軸、Y軸構成からなる表形式で表現できる。X軸には整形モデル属性である整形モデル特徴項目が設定され、Y軸には文書名および文書名に関連した整形モデル例が設定される。   The shaping model 31 can be expressed in a tabular format consisting of X-axis and Y-axis configurations. A shaping model feature item, which is a shaping model attribute, is set on the X axis, and a shaping model example related to the document name and the document name is set on the Y axis.

整形モデル属性として、文章の構成である“章”、“節”および“項”の階層属性、文章の構成付帯である文字列、行の属性、ページ書式の属性、次ページの属性、本文以外のページの書式の属性(頁番号、柱文)、加算、削減、補正についての置換え属性および特異文章についての記録済み文字効果属性が設定される。   Formatting model attributes include “chapter”, “section” and “section” hierarchy attributes that are sentence structures, text strings that are incidental to sentence structures, line attributes, page format attributes, next page attributes, and other than body text The page format attributes (page number, column sentence), replacement attributes for addition, reduction, correction, and recorded character effect attributes for unique sentences are set.

文書名としては、例えば取扱説明書、検査報告書が設定され、取扱説明書についての整形モデルとして例えば据付編、解析編、サービスマン編が設定され、検査報告書についての整形モデルとして、例えば評価編(1)、評価編(2)が設定される。   As the document name, for example, an instruction manual and an inspection report are set. For example, an installation edition, an analysis edition, and a service man edition are set as a shaping model for the instruction manual. For example, an evaluation is given as a shaping model for the inspection report. Part (1) and evaluation part (2) are set.

文章の構成は、“章”、“節”および“項”の階層属性とされる。この場合、項の下位についても設定可能であるが、本例の場合、項に含めて考えてよい。   The composition of the sentence is a hierarchical attribute of “chapter”, “section”, and “section”. In this case, the lower order of the term can be set, but in this example, it may be included in the term.

各種文字列情報としては、例えば章、節、項などのタイトルや見出し、強調した文字、文章がある。それに対応して文章構成についての属性は、文字列が見出し、その他のワードのいずれかであるか、さらに見出しである場合には、それが章(大見出し)、節(中見出し)、項(小見出し)で規定される。   Examples of various character string information include titles and headings such as chapters, sections, and sections, emphasized characters, and sentences. Correspondingly, the attribute of the sentence structure is that if the character string is a heading, another word, or even a heading, it is a chapter (major heading), section (medium heading), section ( Subheading).

文章の構成を基本属性として、文字の列、行の属性、ページの属性、改ページの属性、本文以外の書式の属性、置換え属性あるいは/および記録済み文字効果属性が付帯として設定され得る。これらの属性の内容は図2に示す通りである。   A text string, a line attribute, a page attribute, a page break attribute, a format attribute other than the body text, a replacement attribute, and / or a recorded character effect attribute can be set as an appendage with the composition of the sentence as a basic attribute. The contents of these attributes are as shown in FIG.

図3は、他のデータベースの例を示す。文章の構成属性について相違があるが、基本的には図2に示す例と同じである。   FIG. 3 shows another database example. Although there is a difference in the composition attribute of the sentence, it is basically the same as the example shown in FIG.

図4は、クライアント文書テキスト41からベタ書き文書テキスト42に第一の変換ルール32を用いて変換し、ベタ書き文書テキスト42を第二の変換ルール33を用いて整形文書テキスト43に変換している様子を示す図である。第一の変換ルール32および第二の変換ルール33はデータベース12に格納され、演算処理手段11(図1)によって演算処理のために参照される。文書データの入力と共に、整形モデルが指定される。   FIG. 4 shows the conversion from the client document text 41 to the solid document text 42 using the first conversion rule 32, and the solid document text 42 is converted to the formatted document text 43 using the second conversion rule 33. FIG. The first conversion rule 32 and the second conversion rule 33 are stored in the database 12 and are referred to for arithmetic processing by the arithmetic processing means 11 (FIG. 1). A shaping model is specified along with the input of document data.

図5は、図4に示す例についての他の例を示しており、ベタ書き状態で入力されるが、任意スタイルの一つであると考えると、基本的には図4に示す例と同じである。   FIG. 5 shows another example of the example shown in FIG. 4, which is input in a solid writing state, but is basically the same as the example shown in FIG. 4 when considered as one of arbitrary styles. It is.

上述したように、クライアント文書テキスト構成手段によって、入力された文章データが階層構成からなる文書である場合に、階層構成からなる文書構造が任意スタイルのクライアント文書テキスト41として構成される。この場合は図6の(a)、(b)に示すように任意の形でのクライアント文書テキストは、クライアント文書構造認識手段によって、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造が認識される。   As described above, when the input text data is a document having a hierarchical structure by the client document text composing means, the document structure having the hierarchical structure is configured as the client document text 41 having an arbitrary style. In this case, as shown in FIGS. 6A and 6B, the client document text in an arbitrary form is analyzed by the client document structure recognizing means by analyzing the client document structure in which the hierarchical sentence structure is an arbitrary style. Thus, a client document structure having a hierarchical structure is recognized.

図4、図5に示すように、クライアント文書構造認識手段は、階層構成の各階層の文書を解析して、文書の文頭および文書の文尾にタグ(T)を付与し、双方のタグによって1つの文書として認識するようにしている。図4、図5において、文頭のタグについてはTを四角で囲ったマークで、文尾のタグについては、改行マークの後に示したTを四角で囲ったマークで示している。勿論、Tに代わるマークが使用可能である。また、クライアント文書構造認識手段は、前記2つのタグによって規定された1つの文書の中に特異構成の文書がある時に、この特異文書の文頭および文尾に別のタグを付与し特異文書として認識することができるようにしている。   As shown in FIGS. 4 and 5, the client document structure recognizing unit analyzes the document of each layer of the hierarchical structure, and gives a tag (T) to the beginning of the document and the end of the document. The document is recognized as one document. 4 and 5, the tag at the beginning of the sentence is indicated by a mark surrounded by a square, and the tag at the end of the sentence is indicated by a mark surrounded by a square after the line feed mark. Of course, a mark in place of T can be used. The client document structure recognizing means recognizes a unique document by assigning another tag to the head and tail of the unique document when there is a unique document in one document defined by the two tags. To be able to.

ベタ書き文書テキスト構成手段によって、データベースに格納された第一の変換ルールが用いられ、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストが構成される。   The first conversion rule stored in the database is used by the solid document text composing means, and the client document structure in an arbitrary style is used regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. A solid document text of a specific style converted to a solid document structure that is simply arranged in a flat form is constructed.

図7にベタ書き文書テキストの属性を示す。図7(a)はベタ書き文書テキストの属性について、文字列、行の属性およびページ書式の属性について示し、図7(b)、(c)は2つの例について文字列方向、行方向についてのベタ書き文書テキストにタグを付与する例について示す。
特定スタイルのベタ書き文書構造を有するベタ書き文書テキストは、ベタ書き文書構造認識手段によって、階層構成からなり、文書構造の認識されたベタ書き文書構造が解析されて、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造が認識される。
FIG. 7 shows the attributes of the solid document text. FIG. 7A shows the character string, line attribute, and page format attribute for the solid document text attribute. FIGS. 7B and 7C show the character string direction and the line direction for two examples. An example of adding a tag to a solid document text will be described.
A solid document text having a solid document structure of a specific style is composed of a hierarchical structure by a solid document structure recognition means, and the solid document structure in which the document structure is recognized is analyzed to form a hierarchical structure. A solid document structure of a specific style in which is recognized is recognized.

図8に、ベタ書き文書テキストについての文書構造認識例(a)、(b)を示す。
クライアント文書構造認識手段によるタグ付与に代えて、ベタ書き文書構造認識手段によってタグを付与するようにしてもよい。この場合に、別のタグを付与する時には、データベース12に特異文字、文章を記憶させておいて、該当のベタ書き文章についてタグを付与することを行う。タグの付与は、クライアント文書テキストについて行うのがベタ書き文書テキストについて行うのに比べて望ましい。いずれにしてもベタ書き文書構造認識手段は、双方のタグによって1つの文書として認識することになる。別のタグが付与されている場合も同様である。
FIG. 8 shows document structure recognition examples (a) and (b) for a solid document text.
Instead of tagging by the client document structure recognition unit, a tag may be added by the solid document structure recognition unit. In this case, when assigning another tag, the unique character and sentence are stored in the database 12, and the tag is assigned to the corresponding solid sentence. It is preferable to add a tag to the client document text as compared to the solid document text. In any case, the solid document structure recognizing means recognizes one document by both tags. The same applies when another tag is assigned.

図4、図5に示すように、整形テキスト構成手段によって、データベースに格納された第二の変換ルール33を用いて、認識された特定スタイルのベタ書き文書構造が登録済み整形モデルの属性に従って、整形された整形文書構造に変換されて整形スタイルの整形文書テキストが構成される。   As shown in FIG. 4 and FIG. 5, by using the second conversion rule 33 stored in the database by the formatted text composing means, the solid document structure of the recognized specific style is determined according to the attributes of the registered formatted model. It is converted into a formatted document structure to form a formatted document text in a formatting style.

上述したクライアント文書テキストが構成されるに際して、文書データの入力の際に、操作者は目的とする特定の整形モデルを指定し、整形モデルの属性に近似した構造で文書データの入力を行う。従って、ベタ書き文書テキストから整形文書テキストへの変換は迅速、スムーズになされることになる。   When the above-described client document text is constructed, when inputting the document data, the operator designates a specific specific shaping model and inputs the document data with a structure approximate to the attributes of the shaping model. Therefore, the conversion from the solid document text to the formatted document text is performed quickly and smoothly.

図4、図5において、クライアント文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成される。
クライアント文書構造認識手段が、双方のタグから文字列および行からなる構造を認識する。
4 and 5, the client document structure is composed of a character string and a line structure including “chapter”, “section”, and “section”.
The client document structure recognizing means recognizes a structure composed of a character string and a line from both tags.

ベタ書き文書テキスト構成手段が、文字列および行構造からなるベタ書き文書テキストを構成する。図9に、ベタ書き文書テキストを画面表示した(a)、(b)、(c)の例について示す。
ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析して双方のタグが付与されたベタ書き文字列および行構造を認識する。
整形テキスト構成手段が、双方のタグが付与されたベタ書き文字列および行構造を整形モデルに従って、整形された文字列および行構造に変換する。
The solid document text composing means constructs a solid document text composed of a character string and a line structure. FIG. 9 shows examples of (a), (b), and (c) in which a solid document text is displayed on the screen.
The solid writing structure recognizing means analyzes the solid writing character string and the line structure made up of “chapter”, “section”, and “item” to recognize the solid writing character string and the line structure to which both tags are attached.
The formatted text composing means converts the solid-written character string and line structure to which both tags are attached into the shaped character string and line structure according to the formatting model.

図10に、タグの属性について例示する。図10(a)は、文書の構成タグについて、図10(b)本文用タグについて、図10(c)は表用タグについて、そして図10(d)は図面用タグについて説明する。例えば、図10(a)において、変換内容が章、節、項の組み合わせにタグが付着されると、変換後にあっては、第1章、1.1.1・・・のように表示されることになる。他の例についても同様に変換される。なお、図10(c)におけるセルは表の1つのマスを表わしている。   FIG. 10 illustrates the tag attributes. FIG. 10A illustrates a document configuration tag, FIG. 10B illustrates a body tag, FIG. 10C illustrates a table tag, and FIG. 10D illustrates a drawing tag. For example, in FIG. 10A, when a tag is attached to a combination of chapters, sections, and terms in the conversion content, after conversion, it is displayed as Chapter 1, 1.1.1. Will be. Other examples are similarly converted. In addition, the cell in FIG.10 (c) represents one square of a table | surface.

図11に、整形文書テキストのページ書式属性を示し、図11(a)は奇数ページ書式、図11(b)は偶数ページ書式の例を示す。
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が単にフラットに並べられる特定のベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、整形モデルに従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法、および整形モデルが、文字行および列が定められたモデルである。これらのルールについて説明する。
FIG. 11 shows page format attributes of the formatted document text, FIG. 11A shows an example of an odd page format, and FIG. 11B shows an example of an even page format.
The first conversion rule is a string and line attribute conversion method that converts a character string and a column structure to a specific solid writing structure that is simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is an attribute conversion method to a character string and a line formatted according to the “chapter”, “section” and “term” of the solid writing structure according to the formatting model, and the formatting The model is a model in which character lines and columns are defined. These rules will be described.

図12は、データベース12の詳細内容を示し、整形モデル属性である整形モデル特徴項目の詳細を示す。内容については図12の記載事項が参照される。   FIG. 12 shows the detailed contents of the database 12 and shows the details of the shaping model feature item which is the shaping model attribute. Refer to the description of FIG. 12 for the content.

図13は、クライアント文書テキストをベタ書き文書テキストへ変換する第一の変換ルールについて示す。このルールによれば、文字列、行の属性、ページの書式属性に従ってそれぞれ変換がなされる。文字列にその一部として表、図面が加えられる。   FIG. 13 shows a first conversion rule for converting client document text into solid document text. According to this rule, conversion is performed according to the character string, line attribute, and page format attribute. A table and a drawing are added as part of the character string.

このルールによれば、任意スタイルのクライアント文書構造は、階層構成からなる文書構造が指定される整形モデルに関係なく、単にフラット状に並べられるベタ書き文書構造に変換される。   According to this rule, the client document structure of an arbitrary style is converted into a solid document structure that is simply arranged in a flat form, regardless of the formatting model in which the document structure having a hierarchical structure is specified.

具体的には、第一の変換ルールは、
設定済み文字の大きさを統一する
設定済み書体を統一する
設定済み書体の強調なくす
設定済み行の間隔を統一する
設定済み文頭、文末位置、揃え、インデント、タブを解除する
設定済みの1つの段落内複数行における2行目以降の文頭位置の字下げをなくす
設定済みの改ページ設定をなくす
ことを定める文章構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法である。また、第一の変換ルールのページの書式の属性変換方法が、
1行の文字数、1ページの行数の設定を解除する
用紙の大きさ、方向設定を解除する
変換方法を備える。
Specifically, the first conversion rule is
Unify the size of the set type Unify the typeface that has been set Unset emphasis on the set type Unify the spacing between the set lines Preset sentence, end of sentence position, alignment, indent, one set paragraph to release tabs This is an attribute conversion method for converting a sentence structure, a character string and line attributes, and a page format attribute that determine that a set page break setting that eliminates indentation at the second and subsequent lines in a plurality of lines is eliminated. Also, the attribute conversion method of the page format of the first conversion rule is
There is a conversion method for canceling the setting of the number of characters per line and the setting of the paper size and direction for canceling the setting of the number of lines per page.

図14は、クライアント文書テキストからベタ書き文書テキストへの変換の事例を(a)、(b)で示す。   FIG. 14 shows an example of conversion from client document text to solid document text by (a) and (b).

図15は、ベタ書き文書テキストを整形文書テキストへ変換する第二の変換ルールについて示す。このルールによれば、文字列、行の属性、ページの書式属性に従ってそれぞれ変換がなされる。文字列にその一部として表、図面が加えられる。このルールによれば、認識された特定スタイルのベタ書き文書構造は、登録済み整形モデルの属性に従って、整形された整形文書構造に変換される。更に、このルールによれば、基本変形された整形文書構造は更に指定された特定の整形モデルの属性に従って特定の整形テキストに変換される。具体的には、第二の変換ルールは、
各文書構造にかかる本文文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造にかかる本文行の間隔が登録および選択されたものに適用される
各文書構造行の間隔が登録および選択されたものに適用される
各文章の文頭、文尾位置および揃え、インデントにタブ設定が適用される
各文章の1つの段落内複数行における2行目以降の文頭位置を設定する字下げが適用される
“章”、“節”および“項”の階層に下位階層が適用される
組み合わせおよび文字の置換えとして、半角化、補足及び統一化が適用される
最終行で改ページされることを定めるページの書式の属性を変換する
を定める文書構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法である。また、第二の変換ルールのページの書式の属性変換方法が、
上下左右の余白が登録および選択されたものに適用される
ページ、柱文が登録および選択された形式に適用される
1ページの行数および1行の文字数が登録および選択されたものに適用される
用紙方向が登録および選択されたものに適用される
変換方法を備える。
FIG. 15 shows a second conversion rule for converting a solid document text into a formatted document text. According to this rule, conversion is performed according to the character string, line attribute, and page format attribute. A table and a drawing are added as part of the character string. According to this rule, the recognized solid document structure of a specific style is converted into a formatted formatted document structure according to the attributes of the registered formatting model. Further, according to this rule, the basic deformed formatted document structure is further converted into specific formatted text according to the attribute of the specified specific formatting model. Specifically, the second conversion rule is
Each of the text structure font sizes, typefaces, and emphasis instructions applied to those registered and selected for each document structure. Applies to the document structure line interval that is registered and selected for the document structure. Applies to each document structure line interval that is registered and selected. The lower hierarchy is applied to the “chapter”, “section”, and “section” hierarchies where the indentation that sets the beginning of the second and subsequent sentences in multiple lines within one paragraph of each sentence to which the setting is applied is applied. As a combination and character replacement, the document structure that defines the conversion of page format attributes that specify page breaks at the last line to which half-width, supplement, and unification is applied, string and line attributes, and It is an attribute conversion method for converting the attributes of the over-di format. Also, the attribute conversion method of the page format of the second conversion rule is
Applies to pages where the top, bottom, left, and right margins are registered and selected, and those where the number of lines per page and the number of characters per line are applied to registered and selected forms. Conversion method applied to the registered and selected paper orientation.

図16は、ベタ書きテキストから整形文書テキストへの変換の事例を(a)、(b)で示す。   FIGS. 16A and 16B show an example of conversion from solid text to formatted document text by (a) and (b).

このように、任意スタイルのクライアント文書テキストはページ書式属性を備え、第一の変換ルールはクライアント文書テキストが備えるページ書式属性を解除するルールでもある。第二の変換ルールは整形モデルに従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあり、整形文書テキストはページ書式の属性を備える。   As described above, the client document text of an arbitrary style has a page format attribute, and the first conversion rule is also a rule for canceling the page format attribute of the client document text. The second conversion rule is also a rule for adding a page format attribute to the solid document structure according to the formatting model, and the formatted document text has a page format attribute.

整形文書テキスト構成手段は、特定スタイルのベタ書き文書構造を整形モデルに従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成するときに、双方のタグによって規定された文書ごとに構成する。   The formatted document text constructing means converts the formatted text structure of a specific style into a formatted formatted document structure according to the formatting model and constructs the formatted text of the formatted style for each document defined by both tags. Constitute.

図17は、本発明の実施例のフローチャートを示す。
フローは、整形モデル登録フローおよび整形文書構成・表示フローからなる。
FIG. 17 shows a flowchart of an embodiment of the present invention.
The flow includes a shaping model registration flow and a shaping document configuration / display flow.

整形モデル登録フローは、ステップS1からS5で構成される。画面に、整形モデルの属性を示す整形モデル特徴項目が表示され(S1)、操作者によって整形モデル特徴項目についての項目内容が指定され(S2)、これによって整形モデル特徴項目が組み合わされて整形モデルの属性が決定される(S3)。   The shaping model registration flow includes steps S1 to S5. A shaping model feature item indicating the attributes of the shaping model is displayed on the screen (S1), and an item content about the shaping model feature item is designated by the operator (S2), and the shaping model feature item is combined thereby, and the shaping model is combined. Are determined (S3).

整形項目の組み合わされた整形モデルの登録指示が操作者によってなされ(S4)、演算処理手段によってデータベースへの整形モデルの登録がなされ(S5)、登録済み整形モデルとしての出力が可能とされる。
整形文書テキスト構成・表示フローは、ステップS11からS21で構成される。
The operator gives an instruction to register the shaping model in which the shaping items are combined (S4), and the shaping model is registered in the database by the arithmetic processing means (S5), and output as a registered shaping model is possible.
The formatted document text composition / display flow is composed of steps S11 to S21.

新たに、整形モデルに従って整形モデルを構成しようとする操作者は、データベースに登録された整形モデルを呼び出し、当該整形モデルを指定する。データベースに多くの整形モデルが登録されているような場合には、順次整形モデルを画面に表示して行って、操作者が目的としている特定の整形モデルに最も近似した整形モデルを選択し、特定する。データベースに近似した整形モデルがないような場合には、既存の文書テキストを読み込んで、整形モデルの属性を特定し、整形モデルとして登録し、この整形モデルを画面上で指定することを行う。データベースが特定のサーバ内に構築され、特定の操作者のみが、特定のデータベースにアプローチして利用できるようにしてもよいし、数多くの整形モデルを一般に公開して誰でも利用できるようにしてもよい。   A new operator who intends to configure a shaping model according to the shaping model calls the shaping model registered in the database and designates the shaping model. When many shaping models are registered in the database, the shaping models are sequentially displayed on the screen, and the shaping model that is closest to the specific shaping model intended by the operator is selected and specified. To do. If there is no shaping model that approximates the database, the existing document text is read, the attributes of the shaping model are specified, registered as a shaping model, and this shaping model is designated on the screen. The database may be built in a specific server and only a specific operator may approach and use the specific database, or a number of formatting models may be made publicly available to anyone. Good.

いずれにしても、ステップS5で登録された整形モデルの一つが画面に表示され、目的とする特定の整形モデルとして指定される。次いで、文書データが入力される(S12)。文書データを入力してから整形モデルを指定するようにしてもよい。   In any case, one of the shaping models registered in step S5 is displayed on the screen and designated as the specific shaping model of interest. Next, document data is input (S12). The shaping model may be designated after inputting the document data.

クライアント文書テキスト構成手段によってクライアント文書テキストが構成され、クライアント文書構造認識手段によってクライアント文書構造が認識される(S13)。タグ設定のルールが適用され(S14)、各文章についてタグが設定される(S15)。   The client document text is composed by the client document text composing means, and the client document structure is recognized by the client document structure recognizing means (S13). A tag setting rule is applied (S14), and a tag is set for each sentence (S15).

第一の変換ルールが適用され(S16)、ベタ書き文書テキスト構成手段によってベタ書き文書テキストが構成される(S17)。ベタ書き文書構造認識手段によってベタ書き文書テキストについてベタ書き文書構造が認識される(S18)。このベタ書き文書構造には、タグ設定による文章構造の“章”、“節”および“項”からなる階層構造が含まれる。タグ設定は、ベタ書き文書テキストについて行ってもよいが、S15の段階で設定するのが望ましい。整形テキスト構成手段に、第二の変換ルールが適用され(S19)、設定タグおよび第二の変換ルールに従って階層テキストに変換され、特定の整形モデルの属性に従って目的の整形文書構造を備えたテキストとして構成される(S21)。構成された整形文書テキストは、整形文書テキストとして文書表示手段の画面に表示され、利用に供される(S22)。   The first conversion rule is applied (S16), and the solid document text is constituted by the solid document text composing means (S17). The solid document structure recognition unit recognizes the solid document structure for the solid document text (S18). This solid document structure includes a hierarchical structure consisting of “chapter”, “section”, and “section” of the text structure by tag setting. Although the tag setting may be performed for the solid document text, it is desirable to set the tag in step S15. The second conversion rule is applied to the formatted text composing means (S19), converted into hierarchical text according to the setting tag and the second conversion rule, and the text having the desired formatted document structure according to the attribute of the specific formatting model Configured (S21). The configured formatted document text is displayed as a formatted document text on the screen of the document display means and used (S22).

以上のフローによれば、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段と、文書整理結果を表示する文書表示手段を備えた文書整形装置によって、次に示すステップを備えた文書整形方法が構成される。
文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段と、文書整理結果を表示する文書表示手段を備えた文書整形装置による文書整形方法において、
文書データ入力手段によって、文書データを入力する。
文書表示手段に表示された整形モデルを指定する整形モデル指定手段と、
クライアント文書テキスト構成手段によって、入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成する。
According to the above flow, by the document shaping device including the document shaping means for shaping the document including the attribute indicating the document shaping rule according to the rule corresponding to the attribute, and the document display means for displaying the document organization result, A document shaping method including the following steps is configured.
In a document shaping method by a document shaping device comprising a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute, and a document display means for displaying a document organization result,
The document data is input by the document data input means.
A shaping model designation means for designating a shaping model displayed on the document display means;
The client document text composing means configures a document whose input document data has a hierarchical structure as an arbitrary style client document text having a hierarchical structure.

クライアント文書構造認識手段によって、クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識する。   The client document structure recognizing means analyzes the client document structure having a hierarchical structure by analyzing the client document structure having an arbitrary style for the client document text.

ベタ書き文書テキスト構成手段によって、データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成する。
ベタ書き文書構造認識手段によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識する。
By using the first conversion rule stored in the database by the solid-written document text composing means, the client document structure in an arbitrary style can be changed regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. It constructs a solid document text of a specific style converted into a solid document structure that is simply arranged in a flat form.
The solid document structure recognizing means has a hierarchical structure for a solid document text having a solid document structure of a specific style. Recognize a solid document structure of a specific style.

整形文書テキスト構成手段によって、データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する。
そして、整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成し、文書表示手段は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを画面に表示する
ことからなる文書整形方法が構成される。
Using the second conversion rule stored in the database, the formatted document text composing means converts the recognized solid document structure of a specific style into a formatted document structure according to the attributes of the registered formatting model. Configure formatting text in formatting style.
Then, the formatted document text composing means configures the specific formatted document text according to the specified specific formatting model attribute, and the document display means displays the specific formatted document text configured by the formatted document text composing means on the screen. A document shaping method consisting of:

本発明の実施例の全体構成を示す図。The figure which shows the whole structure of the Example of this invention. 本実施例に使用するデータベースの内容を示す図。The figure which shows the content of the database used for a present Example. 図2に示すデータベースの他の例を示す図。The figure which shows the other example of the database shown in FIG. 本実施例の変換方法を説明する図。The figure explaining the conversion method of a present Example. 図4に示す変換方法の他の例を示す図。The figure which shows the other example of the conversion method shown in FIG. クライアント文書構造認識を示す図。The figure which shows client document structure recognition. ベタ書き文書テキスト属性を示す図。The figure which shows a solid writing document text attribute. ベタ書き文書構造認識を示す図。The figure which shows solid writing document structure recognition. ベタ書き文書テキスト画面表示例を示す図。The figure which shows the example of a solid writing document text screen display. タグの属性を示す図。The figure which shows the attribute of a tag. 整形文書テキストのページの書式属性を示す図。The figure which shows the format attribute of the page of formatted document text. データベースに格納された整形モデルの属性を示す図。The figure which shows the attribute of the shaping model stored in the database. ベタ書き文書テキストに変換する第一変換ルールを説明する図。The figure explaining the 1st conversion rule converted into a solid document text. ベタ書き文書テキストへの変換事例を示す図。The figure which shows the conversion example to a solid writing document text. 整形文書テキストに変換する第二の変換ルールを説明する図。The figure explaining the 2nd conversion rule converted into formatted document text. 整形文書テキストへの変換事例を示す図。The figure which shows the conversion example to the formatted document text. 本発明の実施例のフローチャート図。The flowchart figure of the Example of this invention.

符号の説明Explanation of symbols

1…文書整形手段、2…文書表示手段、11…演算処理手段、12…データベース、21…整形モデル処理、22…文書データ入力、23…クライアント文書テキスト構成、24…クライアント文書構造認識、25…タグ設定、26…ベタ書き文書テキスト構成、27…ベタ書き文書構造認識、28…整形文書テキスト構成、29…整形文書テキスト表示、31…登録済みモデル、32…第一の変換ルール、33…第二の変換ルール、34…タグ付与ルール、35…各種文書テキスト、36…画面、37…文書データ、38…整形モデルデータ、41…クライアント文書テキスト、42…ベタ書き文書テキスト、43…整形文書テキスト、100…文書整形装置。   DESCRIPTION OF SYMBOLS 1 ... Document shaping means, 2 ... Document display means, 11 ... Arithmetic processing means, 12 ... Database, 21 ... Formatting model processing, 22 ... Document data input, 23 ... Client document text structure, 24 ... Client document structure recognition, 25 ... Tag setting, 26 ... solid document text structure, 27 ... solid document structure recognition, 28 ... formatted document text structure, 29 ... formatted document text display, 31 ... registered model, 32 ... first conversion rule, 33 ... first Two conversion rules, 34 ... tag assignment rules, 35 ... various document texts, 36 ... screen, 37 ... document data, 38 ... formatted model data, 41 ... client document text, 42 ... solid document text, 43 ... formatted document text , 100 ... Document shaping apparatus.

Claims (7)

入力した文書を含む文書データをルールに従って整形する文書整形手段を備えた文書整形装置において、
整形モデルを受け付け、受け付けた整形モデルを指定する整形モデル指定手段と、
前記文書データを入力する文書データ入力手段と、
受け付けた整形モデルが文章の組み合わせ、文書の構成および文章行の形成で示される複数の整形モデル属性を備えていて、該複数の整形モデル属性から選択された整形モデル属性を受け付け、当該整形モデル属性の組み合わせを行う処理によって整形モデルを登録する整形モデル登録手段と、
受け付けられた整形モデルおよび該整形モデルに関連してモデル処理された整形モデル属性を格納し、入力された文書を、整形モデルの整形モデル属性に関係なく一律に、単にフラット状に並べられ、ベタ書きされたベタ書き構造のベタ書き文書に変換する第一の文書変換方法を定める第一の変換ルール、および前記格納された整形モデル属性に従ってベタ書き文書構造を整形文書構造に変換する第二の文書変換方法を定める第二の変換ルールを格納するデータベースと、
各ベタ書き文章に、各ベタ書き文が何を意味するものであるかを示すタグを付着するタグ設定手段と、
前記データベースに格納された第一の変換ルールを用いて、前記データベースに格納された整形モデルの整形モデル属性に関係なく、単にフラット状に並べられ、各文章にタグが付着されたベタ書き文章から構成されたベタ書き構造のベタ書き文書テキストを構成するベタ書き文書テキスト構成手段と、
前記ベタ書き文書構造を有するベタ書き文書テキストについて、該ベタ書き文書構造を解析し、タグが付着された各ベタ書き文章で構成された階層構成からなるベタ書き文書構造を認識するベタ書き文書構造認識手段と、
前記データベースに格納された第二の変換ルールを用いて、認識されたベタ書き文書構造について、前記データベースに格納された整形モデル属性に従ってタグが付着された各ベタ書き文章を各整形文章に変換し、整形された整形文書構造に変換して整形文書テキストを構成する整形文書テキスト構成手段と、
前記ベタ書き文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成され、
前記ベタ書き文書構造認識手段が、双方のタグによって該タグ間の文章を1つの文章と認識することによって、“章”、“節”および“項”からなる文字列および行からなるベタ書き文書構造を認識し、
前記ベタ書き文書構成手段が、第一の変換ルールを用いて、文字列および行構造からなるベタ書き文書テキストを構成し、
前記ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析してタグが付着されたベタ書き文字列および行構造を認識し、
前記整形テキスト構成手段が、第二の変換ルールを用いて、タグが付着されたベタ書き文字列および行構造を前記格納された整形モデル属性に従って、整形された文字列および行構造に変換し、
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が
単にフラットに並べられるベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、格納された整形モデル属性に従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法を定めるルールであること、
を特徴とする文書整形装置。
In a document shaping apparatus having a document shaping means for shaping document data including an input document according to a rule,
A shaping model designation means for accepting a shaping model and designating the accepted shaping model;
Document data input means for inputting the document data;
The received shaping model has a plurality of shaping model attributes indicated by a combination of sentences, a document structure and a sentence line formation, accepts a shaping model attribute selected from the plurality of shaping model attributes, and the shaping model attribute Shaping model registration means for registering a shaping model by the process of combining
The received shaping model and the shaping model attribute model-processed in relation to the shaping model are stored, and the input document is uniformly arranged in a flat shape regardless of the shaping model attribute of the shaping model, A first conversion rule that defines a first document conversion method for converting to a written document with a written solid writing structure, and a second that converts the solid document structure into a formatted document structure according to the stored formatting model attribute A database for storing a second conversion rule for determining a document conversion method;
Each solid writing texts, and tagging means each solid writing statement section is attached a tag that indicates whether the mean?,
Using the first conversion rule stored in the database, regardless of the shaping model attribute of the shaping model stored in the database, it is simply arranged in a flat shape, from a solid sentence with a tag attached to each sentence Solid document text composing means for composing a solid document text having a structured solid structure;
For the solid document text having the solid document structure, the solid document structure is analyzed, and the solid document structure that recognizes the solid document structure having a hierarchical structure composed of each solid document with tags attached thereto. Recognition means;
Using the second conversion rule stored in the database, with respect to the recognized solid document structure, each solid sentence with tags attached according to the formatting model attribute stored in the database is converted into each formatted sentence. , Formatted document text composing means for converting the formatted document structure into a formatted document text,
The solid document structure is composed of a character string and a line structure composed of “chapter”, “section”, and “section”.
The solid document structure recognition means recognizes the text between the tags as a single text by both tags, so that a solid text document consisting of character strings and lines consisting of “chapter”, “section”, and “term” Recognize the structure,
The solid writing document composing means composes a solid writing document text composed of a character string and a line structure using the first conversion rule,
The solid writing structure recognizing means recognizes the solid writing character string and the line structure to which the tag is attached by analyzing the solid writing character string and the line structure consisting of “chapter”, “section” and “term”;
Using the second conversion rule, the formatted text composing means converts the solid-written character string and line structure to which the tag is attached into a formatted character string and line structure according to the stored formatting model attribute,
The first conversion rule is a rule that defines the attribute conversion method for character strings and lines that are converted into a solid writing structure in which character strings and column structures are simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is a method for converting an attribute into a character string and a line that are formatted according to the “chapter”, “section”, and “term” of the solid writing structure according to the stored formatting model attribute. That it is a set rule,
A document shaping device characterized by this.
請求項1において、前記タグ設定手段が、文章の文頭および文尾にタグを付着し、前記ベタ書き文書構造認識手段が、双方のタグによって該タグ間の文章を1つの文章として認識することを特徴とする文書整形装置。   2. The tag setting unit according to claim 1, wherein the tag setting unit attaches a tag to a sentence head and a sentence end, and the solid document structure recognizing unit recognizes a sentence between the tags as one sentence by both tags. A document formatting device. 請求項2において、タグ設定手段が、2つのタグによって規定された1つの文書の中の文書の文頭および文尾に別のタグを付着させることを特徴とする文書整形装置。   3. The document shaping apparatus according to claim 2, wherein the tag setting means attaches another tag to the beginning and end of the document in one document defined by the two tags. 請求項2または3において、クライアント文書テキストがページ書式属性を持つ場合に、該ページ書式の属性を解除するルールでもあり、第二の変換ルールは格納された整形モデル属性に従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあることを特徴とする文書整形装置。   4. The method according to claim 2, wherein when the client document text has a page format attribute, it is also a rule for canceling the attribute of the page format, and the second conversion rule has a solid document structure according to the stored formatting model attribute. A document formatting apparatus, which is also a rule for adding page format attributes. 請求項3において、前記整形文書テキスト構成手段は、ベタ書き文書構造を前記格納された整形モデル属性に従って、整形された整形文書構造に変換して整形テキストを構成するときに、整形文書をタグによって規定された文書ごとに構成することを特徴とする文書整形装置。   4. The formatted document text composing means according to claim 3, wherein the formatted document text composing means converts the formatted document structure into a formatted formatted document structure according to the stored formatting model attribute, and forms the formatted text by a tag. A document shaping apparatus comprising a specified document for each document. 請求項5に規定する前記整形文書テキストを構成するときに、前記整形文書が請求項3に規定された別のタグによって規定された文書の変換後の文書中に別のタグによって規定された文書を当該タグによって認識された文章を含んで構成されることを特徴とする文書整形装置。   A document defined by another tag in a converted document of a document defined by another tag defined in claim 3 when the formatted document text defined in claim 5 is constructed. A document shaping apparatus comprising a sentence recognized by the tag. 入力した文書を含む文書データをルールに従って整形する文書整形手段を備えた文書整形装置による文書整形方法において、
整形モデル指定手段が、整形モデルを受け付け、受け付けたモデルを指定し、
文書データ入力手段が、前記文書データを入力し、
整形モデル登録手段が、受け付けた整形モデルが文章の組み合わせ、文書の構成および文章行の形成で示される複数の整形モデル属性を備えていて、該複数の整形モデル属性から選択された整形モデル属性を受け付け、当該整形モデル属性の組み合わせを行う処理によって整形モデルを登録し、
データベースが、受け付けられた整形モデルおよび該整形モデルに関連してモデル処理された整形モデル属性を格納し、入力された文書を、整形モデルの整形モデル属性に関係なく一律に、単にフラット状に並べられ、ベタ書きされたベタ書き構造のベタ書き文書に変換する第一の文書変換方法を定める第一の変換ルール、および前記格納された整形モデル属性に従ってベタ書き文書構造を整形文書構造に変換する第二の文書変換方法を定める第二の変換ルール、を格納し、
タグ設定手段が、各ベタ書き文章に、各ベタ書き文章が何を意味するものであるかを示すタグを付着し、
ベタ書き文書テキスト構成手段が、前記データベースに格納された第一の変換ルールを用いて、前記データベースに格納された整形モデルの整形モデル属性に関係なく、単にフラット状に並べられ、各文章にタグが付着されたベタ書き文章から構成されたベタ書き構造のベタ書き文書テキストを構成し、
ベタ書き文書構造認識手段が、前記ベタ書き文書構造を有するベタ書き文書テキストについて、該ベタ書き文書構造を解析し、タグが付着された各ベタ書き文章で構成された階層構成からなるベタ書き文書構造を認識し、
整形文書テキスト構成手段が、前記データベースに格納された第二の変換ルールを用いて、認識されたベタ書き文書構造について、前記データベースに格納された前記整形モデル属性に従ってタグが付着された各ベタ書き文章を各整形文章に変換し、整形された整形文書構造に変換して整形文書テキストを構成し、
前記ベタ書き文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成され、
前記ベタ書き文書構造認識手段が、双方のタグによって該タグ間の文章を1つの文章と認識することによって、“章”、“節”および“項”からなる文字列および行からなるベタ書き文書構造を認識し、
前記ベタ書き文書構成手段が、第一の変換ルールを用いて、文字列および行構造からなるベタ書き文書テキストを構成し、
前記ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析してタグが付着されたベタ書き文字列および行構造を認識し、
前記整形テキスト構成手段が、第二の変換ルールを用いて、タグが付着されたベタ書き文字列および行構造を前記格納された整形モデル属性に従って、整形された文字列および行構造に変換し、
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が
単にフラットに並べられるベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、格納された整形モデル属性に従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法を定めるルールであること、
を特徴とする文書整形方法。
In a document shaping method by a document shaping device provided with a document shaping means for shaping document data including an input document according to a rule,
The shaping model designation means accepts the shaping model, specifies the accepted model,
Document data input means inputs the document data,
The shaping model registration means has a plurality of shaping model attributes indicated by the received shaping model by a combination of sentences, a document structure and a sentence line formation, and a shaping model attribute selected from the plurality of shaping model attributes is selected. Accept and register the shaping model by the process of combining the shaping model attributes,
The database stores the received shaping model and the shaping model attributes model-processed in relation to the shaping model, and the input documents are simply arranged in a flat form regardless of the shaping model attribute of the shaping model. The solid document structure is converted into a formatted document structure according to a first conversion rule that defines a first document conversion method for converting to a solid document with a solid written structure written in solid, and the stored formatting model attribute Storing a second conversion rule defining a second document conversion method;
Tag setting means attaches a tag indicating what each solid writing means to each solid writing ,
The solid document text composing means uses the first conversion rule stored in the database, and is simply arranged in a flat form regardless of the shaping model attribute of the shaping model stored in the database, and tags each sentence. Consists of a solid writing document text with a solid writing structure composed of solid writing sentences with
The solid writing document structure recognition unit analyzes the solid writing document structure for the solid writing document text having the solid writing document structure, and is a solid writing document having a hierarchical structure including each solid writing document to which a tag is attached. Recognize the structure,
The solid document text composing means uses the second conversion rule stored in the database, and for each recognized solid document structure, each solid writing to which a tag is attached according to the formatting model attribute stored in the database. Convert the text into each formatted text, convert it into a formatted text structure, compose the formatted text,
The solid document structure is composed of a character string and a line structure composed of “chapter”, “section”, and “section”.
The solid document structure recognition means recognizes the text between the tags as a single text by both tags, so that a solid text document consisting of character strings and lines consisting of “chapter”, “section”, and “term” Recognize the structure,
The solid writing document composing means composes a solid writing document text composed of a character string and a line structure using the first conversion rule,
The solid writing structure recognizing means recognizes the solid writing character string and the line structure to which the tag is attached by analyzing the solid writing character string and the line structure consisting of “chapter”, “section” and “term”;
Using the second conversion rule, the formatted text composing means converts the solid-written character string and line structure to which the tag is attached into a formatted character string and line structure according to the stored formatting model attribute,
The first conversion rule is a rule that defines the attribute conversion method for character strings and lines that are converted into a solid writing structure in which character strings and column structures are simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is a method for converting an attribute into a character string and a line that are formatted according to the “chapter”, “section”, and “term” of the solid writing structure according to the stored formatting model attribute. That it is a set rule,
A document shaping method characterized by the above.
JP2008294857A 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method Expired - Fee Related JP4474670B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008294857A JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008294857A JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Publications (2)

Publication Number Publication Date
JP2010122829A JP2010122829A (en) 2010-06-03
JP4474670B2 true JP4474670B2 (en) 2010-06-09

Family

ID=42324126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008294857A Expired - Fee Related JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Country Status (1)

Country Link
JP (1) JP4474670B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457659B (en) * 2019-07-05 2023-07-25 中国平安人寿保险股份有限公司 Clause document generation method and terminal equipment

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303571A (en) * 1992-04-24 1993-11-16 Casio Comput Co Ltd Document processor
JPH10334087A (en) * 1998-03-23 1998-12-18 Canon Inc Document processing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303571A (en) * 1992-04-24 1993-11-16 Casio Comput Co Ltd Document processor
JPH10334087A (en) * 1998-03-23 1998-12-18 Canon Inc Document processing method

Also Published As

Publication number Publication date
JP2010122829A (en) 2010-06-03

Similar Documents

Publication Publication Date Title
JP4869630B2 (en) Method and system for mapping content between a start template and a target template
CN100454293C (en) Document editing method, document editing device
US9529438B2 (en) Printing structured documents
JP2006506713A (en) Iterative method for assigning elements and apparatus for assigning elements
WO2006046523A1 (en) Document analysis system and document adaptation system
JP2018028751A (en) Document conversion method and document conversion program
JP4666996B2 (en) Electronic filing system and electronic filing method
JP2007164705A (en) Method and program for converting computerized document
JP4474670B2 (en) Document shaping apparatus and document shaping method
US11410575B2 (en) Interface and tools for accessible textbook generation
CN112100977A (en) Window partial refreshing method, electronic device and storage medium
JP5645481B2 (en) Apparatus, method, and program
JP2001167091A (en) Method and device for processing information and medium
JP3076348B2 (en) Document shaping apparatus and document shaping method
JP2000076226A (en) Document data editing system
JP2006350959A (en) Image processor, image processing method and image processing program
JP5563706B1 (en) Document file generation apparatus, document file generation method, and document file generation program
JP4508264B2 (en) Database construction apparatus, database construction method, database construction program, recording medium
JP5589396B2 (en) Layout support device, layout support method, and program
JP3674905B2 (en) Document editing device
King Design spaces: The limitations of variability in typeface design
JP2000339307A (en) Typesetting device
JP2013161375A (en) Edition system
Lepper et al. Technical Topologies of Texts
JP2005352880A (en) Xml document creation system

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100226

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4474670

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees