JP4065546B2 - 文書処理装置及びその方法 - Google Patents
文書処理装置及びその方法 Download PDFInfo
- Publication number
- JP4065546B2 JP4065546B2 JP2004300279A JP2004300279A JP4065546B2 JP 4065546 B2 JP4065546 B2 JP 4065546B2 JP 2004300279 A JP2004300279 A JP 2004300279A JP 2004300279 A JP2004300279 A JP 2004300279A JP 4065546 B2 JP4065546 B2 JP 4065546B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- structured
- document
- structured document
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
- Editing Of Facsimile Originals (AREA)
Description
複数の第1構造化文書及び複数の第1データを入力し、当該複数の第1データのそれぞれに基づいて当該複数の第1構造化文書のそれぞれに含まれるコンテンツ及び矩形サイズ情報を抽出し、第2構造化文書及び第2データに基づいて、それぞれが当該複数の第1構造化文書のそれぞれに対応する複数の第3構造化文書を生成する構造化文書生成手段と、
前記複数の第3構造化文書を1つの第4構造化文書に統合する統合手段と、
前記第4構造化文書に含まれる複数の矩形サイズ情報に基づいて、複数の矩形を所定領域内にレイアウトするレイアウト手段と、
前記レイアウトされた複数の矩形のそれぞれに、対応するコンテンツを可視化するレンダリング手段とを有し、
前記複数の第1データのそれぞれは、前記複数の第1構造化文書のそれぞれから抽出すべきコンテンツ及び矩形サイズ情報が配置された当該複数の第1構造化文書における位置を示し、
前記第2データは、前記複数の第1構造化文書のそれぞれから抽出されたコンテンツ及び矩形サイズ情報を挿入すべき前記第2構造化文書における位置を示し、
前記構造化文書生成手段は、前記複数の第1構造化文書のそれぞれから抽出したコンテンツ及び矩形サイズ情報を、前記第2データが示す前記第2構造化文書における位置に挿入して、前記複数の第3構造化文書のそれぞれを生成し、
前記複数の矩形サイズ情報のそれぞれは、前記第4構造化文書に含まれる複数のコンテンツのそれぞれに対応する矩形のサイズを示すことを特徴とする。
構造化文書を処理する文書処理装置の文書処理方法であって、
前記文書処理装置の構造化文書生成手段が、複数の第1構造化文書及び複数の第1データを入力し、当該複数の第1データのそれぞれに基づいて当該複数の第1構造化文書のそれぞれに含まれるコンテンツ及び矩形サイズ情報を抽出し、第2構造化文書及び第2データに基づいて、それぞれが当該複数の第1構造化文書のそれぞれに対応する複数の第3構造化文書を生成する構造化文書生成工程と、
前記文書処理装置の統合手段が、前記複数の第3構造化文書を1つの第4構造化文書に統合する統合工程と、
前記文書処理装置のレイアウト手段が、前記第4構造化文書に含まれる複数の矩形サイズ情報に基づいて、複数の矩形を所定領域内にレイアウトするレイアウト工程と、
前記文書処理装置のレンダリング手段が、前記レイアウトされた複数の矩形のそれぞれに、対応するコンテンツを可視化するレンダリング工程とを有し、
前記複数の第1データのそれぞれは、前記複数の第1構造化文書のそれぞれから抽出すべきコンテンツ及び矩形サイズ情報が配置された当該複数の第1構造化文書における位置を示し、
前記第2データは、前記複数の第1構造化文書のそれぞれから抽出されたコンテンツ及び矩形サイズ情報を挿入すべき前記第2構造化文書における位置を示し、
前記構造化文書生成工程では、前記構造化文書生成手段が、前記複数の第1構造化文書のそれぞれから抽出したコンテンツ及び矩形サイズ情報を、前記第2データが示す前記第2構造化文書における位置に挿入して、前記複数の第3構造化文書のそれぞれを生成し、
前記複数のエリア情報のそれぞれは、前記第4構造化文書に含まれる複数のコンテンツのそれぞれに対応する矩形のサイズを示すことを特徴とする。
本発明の目的は前述したように、実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フロッピィ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM,CD−R、磁気テープ、不揮発性のメモリカー また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータで稼動しているOS(オペレーティングシステム)などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれる。
Claims (5)
- 複数の第1構造化文書及び複数の第1データを入力し、当該複数の第1データのそれぞれに基づいて当該複数の第1構造化文書のそれぞれに含まれるコンテンツ及び矩形サイズ情報を抽出し、第2構造化文書及び第2データに基づいて、それぞれが当該複数の第1構造化文書のそれぞれに対応する複数の第3構造化文書を生成する構造化文書生成手段と、
前記複数の第3構造化文書を1つの第4構造化文書に統合する統合手段と、
前記第4構造化文書に含まれる複数の矩形サイズ情報に基づいて、複数の矩形を所定領域内にレイアウトするレイアウト手段と、
前記レイアウトされた複数の矩形のそれぞれに、対応するコンテンツを可視化するレンダリング手段とを有し、
前記複数の第1データのそれぞれは、前記複数の第1構造化文書のそれぞれから抽出すべきコンテンツ及び矩形サイズ情報が配置された当該複数の第1構造化文書における位置を示し、
前記第2データは、前記複数の第1構造化文書のそれぞれから抽出されたコンテンツ及び矩形サイズ情報を挿入すべき前記第2構造化文書における位置を示し、
前記構造化文書生成手段は、前記複数の第1構造化文書のそれぞれから抽出したコンテンツ及び矩形サイズ情報を、前記第2データが示す前記第2構造化文書における位置に挿入して、前記複数の第3構造化文書のそれぞれを生成し、
前記複数の矩形サイズ情報のそれぞれは、前記第4構造化文書に含まれる複数のコンテンツのそれぞれに対応する矩形のサイズを示すことを特徴とする文書処理装置。 - 前記複数の第1構造化文書のそれぞれはXMLデータを、前記複数の第1データのそれぞれは当該XMLデータへのXPATHを規定する情報を含み、
前記構造化文書生成手段は、前記情報に基づいて前記複数の第1構造化文書のそれぞれに含まれるコンテンツ及び矩形サイズ情報を抽出することを特徴とする請求項1に記載の文書処理装置。 - 構造化文書を処理する文書処理装置の文書処理方法であって、
前記文書処理装置の構造化文書生成手段が、複数の第1構造化文書及び複数の第1データを入力し、当該複数の第1データのそれぞれに基づいて当該複数の第1構造化文書のそれぞれに含まれるコンテンツ及び矩形サイズ情報を抽出し、第2構造化文書及び第2データに基づいて、それぞれが当該複数の第1構造化文書のそれぞれに対応する複数の第3構造化文書を生成する構造化文書生成工程と、
前記文書処理装置の統合手段が、前記複数の第3構造化文書を1つの第4構造化文書に統合する統合工程と、
前記文書処理装置のレイアウト手段が、前記第4構造化文書に含まれる複数の矩形サイズ情報に基づいて、複数の矩形を所定領域内にレイアウトするレイアウト工程と、
前記文書処理装置のレンダリング手段が、前記レイアウトされた複数の矩形のそれぞれに、対応するコンテンツを可視化するレンダリング工程とを有し、
前記複数の第1データのそれぞれは、前記複数の第1構造化文書のそれぞれから抽出すべきコンテンツ及び矩形サイズ情報が配置された当該複数の第1構造化文書における位置を示し、
前記第2データは、前記複数の第1構造化文書のそれぞれから抽出されたコンテンツ及び矩形サイズ情報を挿入すべき前記第2構造化文書における位置を示し、
前記構造化文書生成工程では、前記構造化文書生成手段が、前記複数の第1構造化文書のそれぞれから抽出したコンテンツ及び矩形サイズ情報を、前記第2データが示す前記第2構造化文書における位置に挿入して、前記複数の第3構造化文書のそれぞれを生成し、
前記複数のエリア情報のそれぞれは、前記第4構造化文書に含まれる複数のコンテンツのそれぞれに対応する矩形のサイズを示すことを特徴とする文書処理方法。 - 前記複数の第1構造化文書のそれぞれはXMLデータを、前記複数の第1データのそれぞれは当該XMLデータへのXPATHを規定する情報を含み、
前記構造化文書生成工程では、前記情報に基づいて前記複数の第1構造化文書のそれぞれに含まれるコンテンツ及びサイズ情報を抽出することを特徴とする請求項3に記載の文書処理方法。 - コンピュータを、請求項1又は2に記載の文書処理装置として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004300279A JP4065546B2 (ja) | 2004-10-14 | 2004-10-14 | 文書処理装置及びその方法 |
US11/250,656 US7661063B2 (en) | 2004-10-14 | 2005-10-13 | Document processing apparatus and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004300279A JP4065546B2 (ja) | 2004-10-14 | 2004-10-14 | 文書処理装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006113803A JP2006113803A (ja) | 2006-04-27 |
JP4065546B2 true JP4065546B2 (ja) | 2008-03-26 |
Family
ID=36182245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004300279A Expired - Fee Related JP4065546B2 (ja) | 2004-10-14 | 2004-10-14 | 文書処理装置及びその方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7661063B2 (ja) |
JP (1) | JP4065546B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018204324A1 (de) | 2017-03-31 | 2018-10-04 | Asahi Kasei Microdevices Corporation | Nichtflüchtiges Speicherelement und Referenzspannung-Erzeugungsschaltkreis |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8127221B2 (en) * | 2008-02-29 | 2012-02-28 | Microsoft Corporation | Optimal sizes of objects in a document |
JP5478936B2 (ja) * | 2009-05-13 | 2014-04-23 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
US20150281210A1 (en) * | 2014-03-31 | 2015-10-01 | Bank Of America Corporation | Password-protected application data file with decoy content |
CN107533742B (zh) | 2016-02-19 | 2020-08-28 | 株式会社三昧 | 档案组合创建*** |
JP6348162B2 (ja) * | 2016-11-30 | 2018-06-27 | 株式会社サマデイ | ポートフォリオ作成システム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250272A (ja) * | 1998-01-08 | 1999-09-17 | Xerox Corp | 自動イメ―ジレイアウト方法及びシステム |
US7287018B2 (en) * | 1999-01-29 | 2007-10-23 | Canon Kabushiki Kaisha | Browsing electronically-accessible resources |
JP3946934B2 (ja) | 1999-08-05 | 2007-07-18 | 株式会社東芝 | ウェブページ部品統合処理装置、ウェブページ部品統合処理方法及びクライアント装置 |
US6829614B2 (en) * | 1999-09-30 | 2004-12-07 | Nec Corporation | Scrambling method of the data files |
US6721727B2 (en) * | 1999-12-02 | 2004-04-13 | International Business Machines Corporation | XML documents stored as column data |
JP3943830B2 (ja) | 2000-12-18 | 2007-07-11 | 株式会社東芝 | 文書合成方法および文書合成装置 |
JP3842573B2 (ja) * | 2001-03-30 | 2006-11-08 | 株式会社東芝 | 構造化文書検索方法、構造化文書管理装置及びプログラム |
JP4039484B2 (ja) * | 2002-02-28 | 2008-01-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | XPath評価方法、これを用いたXML文書処理システム及びプログラム |
US7228496B2 (en) * | 2002-07-09 | 2007-06-05 | Kabushiki Kaisha Toshiba | Document editing method, document editing system, server apparatus, and document editing program |
US7290006B2 (en) * | 2003-09-30 | 2007-10-30 | Microsoft Corporation | Document representation for scalable structure |
-
2004
- 2004-10-14 JP JP2004300279A patent/JP4065546B2/ja not_active Expired - Fee Related
-
2005
- 2005-10-13 US US11/250,656 patent/US7661063B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018204324A1 (de) | 2017-03-31 | 2018-10-04 | Asahi Kasei Microdevices Corporation | Nichtflüchtiges Speicherelement und Referenzspannung-Erzeugungsschaltkreis |
Also Published As
Publication number | Publication date |
---|---|
US7661063B2 (en) | 2010-02-09 |
US20060085739A1 (en) | 2006-04-20 |
JP2006113803A (ja) | 2006-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1810124B1 (en) | Document managing system and method thereof | |
EP1538534A2 (en) | Generation of a PPML template from a PDF document | |
US20050193334A1 (en) | Layout system, layout apparatus, layout program, template selection program, storage medium having stored therein layout program, and storage medium having stored therein template selection program, as well as layout method | |
WO2007030695A1 (en) | Methods and systems for providing direct style sheet editing | |
CN102165410A (zh) | 打印结构化文档 | |
US7661063B2 (en) | Document processing apparatus and control method thereof | |
JP4666996B2 (ja) | 電子ファイリングシステム、電子ファイリング方法 | |
JP4566196B2 (ja) | 文書処理方法および装置 | |
JP4373470B2 (ja) | 文書変換活用システム | |
JP2010282327A (ja) | フォーマット変換システムおよびフォーマット変換方法並びにプログラム | |
JP2007172247A (ja) | 情報処理装置及び情報処理方法及び情報処理プログラム | |
Hassan | Object-level document analysis of PDF files | |
JP4627530B2 (ja) | 文書処理方法および装置 | |
JPH10222510A (ja) | 文書変換方法 | |
JPWO2006051974A1 (ja) | 文書処理装置および文書処理方法 | |
Héroux et al. | Automatic ground-truth generation for document image analysis and understanding | |
JP2005063243A (ja) | 情報処理装置、プログラム及びコンピュータ読み取り可能な記録媒体 | |
US8386922B2 (en) | Information processing apparatus and information processing method | |
JP2005149269A (ja) | 構造化文書の処理システム | |
JP2001301265A (ja) | 印刷書式設定方法及び印刷書式設定装置 | |
JP2004145736A (ja) | 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体 | |
Shao et al. | Graphics recognition in PDF documents | |
Lin et al. | Active document versioning: from layout understanding to adjustment | |
JP2008186090A (ja) | データ生成装置、データ生成方法及びプログラム | |
JP5400344B2 (ja) | ドキュメント変換装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071005 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080105 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140111 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |