JPH10134081A - ページ作成支援方法及び装置 - Google Patents

ページ作成支援方法及び装置

Info

Publication number
JPH10134081A
JPH10134081A JP8308745A JP30874596A JPH10134081A JP H10134081 A JPH10134081 A JP H10134081A JP 8308745 A JP8308745 A JP 8308745A JP 30874596 A JP30874596 A JP 30874596A JP H10134081 A JPH10134081 A JP H10134081A
Authority
JP
Japan
Prior art keywords
data
area
page
image
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8308745A
Other languages
English (en)
Inventor
Hiroshi Kumamoto
浩 熊本
Hiroshi Nakajima
宏 中嶋
Masayuki Oyagi
雅之 大八木
Masayuki Horiuchi
雅之 堀内
Koji Ota
浩二 太田
Hidenori Yatake
英紀 八竹
Hitoshi Suzuki
等 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP8308745A priority Critical patent/JPH10134081A/ja
Publication of JPH10134081A publication Critical patent/JPH10134081A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 画像領域と文字領域とを含む画像データを、
煩雑な編集作業等を要することなく、比較的にデータ量
の少ないページデータ(インターネット上のホームペー
ジ、ワープロデータ、DTPデータ等)に変換できるよ
うにしたページ作成支援方法及び装置を提供する。 【解決手段】 画像入力装置から取り込んだ画像を記憶
する入力画像データ記憶手段と、前記記憶された入力画
像の画像領域と文字領域とをそれぞれ認識し、そられの
領域のデータを切り出す領域認識手段と、前記切り出さ
れた文字領域に含まれる文字情報をテキストデータに変
換するテキストデータ変換手段と、前記切り出された画
像データと変換したテキストデータとからページデータ
を生成するページデータ生成手段と、を具備する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、インター
ネット上のホームページの作成作業等に好適なページ作
成支援方法及び装置に係り、特に、画像領域と文字領域
との双方を含む画像データをハイパーテキスト等のペー
ジ記述言語に効率よく変換できるようにしたページ作成
支援方法及び装置に関する。
【0002】
【従来の技術】従来、この種のページ作成支援装置とし
ては、ワープロで作成された電子ファイルをハイパーテ
キスト等のページ記述言語に変換する装置、画像入力装
置から読み込まれる画像をページに張り付けたりする装
置、さらには、関連するキーワードに手作業でリンクを
張るようにした装置(ハイパーメディア型文書管理アプ
リケーションを効率よく開発するためのソフトウェア基
盤:東京電力株式会社・技術開発本部・システム研究所
・情報研究室)等が知られている。
【0003】
【発明が解決しようとする課題】このような従来のペー
ジ作成支援装置は、(1)画像入力装置から読み込んだ
画像をそのまま画像データとして扱う方式のものと、
(2)文字の部分だけをOCR等で読み込ませてテキス
トデータに変換し、画像については別に入力して後でテ
キストデータと画像データを編集する方式のものとに大
別される。
【0004】しかしながら、上記の(1)の場合にあっ
ては、画像データとして扱うことからデータ量が膨大な
ものとなり、通信を使ってデータを転送するシステムに
おいては、通信時間がかかり過ぎるという問題点があ
る。
【0005】また、上記の(2)の場合にあっては、画
像と文字列を別々に入力することから、後で編集(割付
など)する手間がかかり過ぎると言う問題点がある。
【0006】この発明は、従来のページ作成支援装置に
おける問題点に鑑みてなされてものであり、その目的と
するところは、画像領域と文字領域とを含む画像データ
を、煩雑な編集作業等を要することなく、比較的にデー
タ量の少ないページデータ(インターネット上のホーム
ページ、ワープロデータ、DTPデータ等)に変換でき
るようにしたページ作成支援方法及び装置を提供するこ
とにある。
【0007】
【課題を解決するための手段】この出願の請求項1に記
載の発明は、画像入力装置から取り込んだ画像を記憶す
る入力画像データ記憶手段と、前記記憶された入力画像
の画像領域と文字領域とをそれぞれ認識し、それらの領
域のデータを切り出す領域認識手段と、前記切り出され
た文字領域に含まれる文字情報をテキストデータに変換
するテキストデータ変換手段と、前記切り出された画像
データと変換したテキストデータとからページデータを
生成するページデータ生成手段と、を具備することを特
徴とするページ作成支援装置にある。
【0008】そして、この請求項1に記載の発明によれ
ば、ペーパーベースの資料を容易に変換・編集できる
こと、読み込んだ画像情報をそのまま使用する場合に
比べて、データの量が少なくなり、通信などで転送する
場合に処理が早く終わること、テキストデータに変換
することで、きれいなフォントを利用できるので、表示
がきれいになること、テキストデータに変換すること
で、修正が容易に行えるようになること、と言った効果
が得られる。
【0009】この出願の請求項2に記載の発明は、前記
生成されたページデータを複数記憶するだけの記憶容量
を有するページデータ記憶手段と、ユーザにより入力さ
れたか、若しくは、データペースに記憶されているキー
ワード、若しくは、タイトルにマッチングする文字列
を、前記ページデータ記憶手段に格納されたページデー
タから検出するキーワード・タイトル検出手段と、前記
検出されたキーワード或いはタイトルに関連するページ
データ同士をリンクさせるリンク手段と、を具備するこ
とを特徴とする請求項1に記載のページ作成支援装置に
ある。
【0010】そして、この請求項2に記載の発明によれ
ば、データベースに格納されているデータと自動的に
リンクさせる機能、並びに、複数のページを作成した
場合にそれらのページ間に自動的にリンクを張る機能を
実現して、それらの間にリンクを張る手間を大幅に軽減
することができる。
【0011】この出願の請求項3に記載の発明は、前記
領域認識部は、入力画像データを一定サイズのブロック
でサーチしつつ、そのブロック内の画像特徴量を算出す
る入力画像サーチ手段と、前記算出された特徴量に基づ
いてファジイ推論を実行することにより、その領域が画
像領域であるか若しくは文字領域であるかを判断する領
域推論手段と、画像領域と判断された領域と文字領域と
判断された領域とを元の入力画像データから切り出す領
域切り出し手段と、前記切り出された画像データを領域
別に格納する領域別データ記憶手段と、を具備すること
を特徴とする請求項1若しくは請求項2に記載のページ
作成支援装置にある。
【0012】そして、この請求項3に記載の発明によれ
ば、画像領域と文字領域とを的確に判定することができ
る。
【0013】この出願の請求項4に記載の発明は、前記
ページデータ生成部は、前記切り出された各領域のデー
タに付属する位置情報を読み出し、その位置情報に従っ
て一定の順序で領域データをソートする位置情報読み出
し手段と、前記ソートされた領域データのそれぞれにペ
ージ記述言語を付加して配置するページデータ付加手段
と、を具備することを特徴とする請求項1若しくは請求
項2に記載のページ作成支援装置にある。
【0014】そして、この請求項4に記載の発明によれ
ば、元の画像データのレイアウトを的確に再現すること
ができる。
【0015】この出願の請求項5に記載の発明は、前記
ページデータ生成部は、画像データとテキストデータと
を割り付ける位置を、テンプレートに従って割り付ける
ことを特徴とする請求項1若しくは請求項2に記載のペ
ージ作成支援装置にある。
【0016】そして、この請求項5に記載の発明によれ
ば、元の画像データのレイアウトを簡単な処理で的確に
再現することができる。
【0017】この出願の請求項6に記載の発明は、画像
入力装置から取り込んだ画像を記憶媒体に記憶する入力
画像データ記憶ステップと、前記記憶された入力画像の
画像領域と文字領域とをそれぞれ認識し、それらの領域
のデータを切り出す領域認識ステップと、前記切り出さ
れた文字領域に含まれる文字情報をテキストデータに変
換するテキストデータ変換ステップと、前記切り出され
た画像データと変換したテキストデータとからページデ
ータを生成するページデータ生成ステップと、を具備す
ることを特徴とするページ作成支援方法にある。
【0018】この出願の請求項7に記載の発明は、前記
生成されたページデータを複数記憶させるページデータ
記憶ステップと、ユーザにより入力されたか、若しく
は、データペースに記憶されているキーワード、若しく
は、タイトルにマッチングする文字列を、前記ページデ
ータ記憶ステップにて格納されたページデータから検出
するキーワード・タイトル検出ステップと、前記検出さ
れたキーワード或いはタイトルに関連するページデータ
同士をリンクさせるリンクステップと、を具備すること
を特徴とする請求項1に記載のページ作成支援方法にあ
る。
【0019】この出願の請求項8に記載の発明は、前記
領域認識部は、入力画像データを一定サイズのブロック
でサーチしつつ、そのブロック内の画像特徴量を算出す
る入力画像サーチステップと、前記算出された特徴量に
基づいてファジイ推論を実行することにより、その領域
が画像領域であるか若しくは文字領域であるかを判断す
る領域推論ステップと、画像領域と判断された領域と文
字領域と判断された領域とを元の入力画像データから切
り出す領域切り出しステップと、前記切り出された画像
データを領域別に格納する領域別データ記憶ステップ
と、を具備することを特徴とする請求項1若しくは請求
項2に記載のページ作成支援方法にある。
【0020】この出願の請求項9に記載の発明は、前記
ページデータ生成部は、前記切り出された各領域のデー
タに付属する位置情報を読み出し、その位置情報に従っ
て一定の順序で領域データをソートする位置情報読み出
しステップと、前記ソートされた領域データのそれぞれ
にページ記述言語を付加して配置するページデータ付加
ステップと、を具備することを特徴とする請求項1若し
くは請求項2に記載のページ作成支援方法にある。
【0021】この出願の請求項10に記載の発明は、前
記ページデータ生成部は、画像データとテキストデータ
とを割り付ける位置を、テンプレートに従って割り付け
ることを特徴とする請求項1若しくは請求項2に記載の
ページ作成支援方法にある。
【0022】
【発明の実施の形態】以下、この発明の好ましい実施の
形態につき、添付図面を参照して詳細に説明する。
【0023】本発明に係るページ作成支援装置の実施の
一形態の構成を図1のブロック図に示す。同図に示され
るように、このページ作成支援装置は、入力画像データ
記憶部1と、領域認識部2と、テキストデータ変換部3
と、ページデータ生成部4とから構成されている。
【0024】入力画像データ記憶部1は、イメージスキ
ャナ、デジタルカメラ、ビデオカメラ等の画像入力装置
から入力された画像データを記憶する機能を有するもの
であり、具体的には、半導体メモリやハードディスク等
の大容量記憶媒体により構成されている。なお、この入
力画像記憶部1には、画像の再入力や複数の入力画像を
使用したページの結合等が容易にできるように、複数の
画像を記憶できる記憶容量が確保されている。
【0025】領域認識部2は、入力された画像データの
中で、どの部分が画像領域であり、またどの部分が文字
領域であるかを認識する機能を有するものである。この
領域認識部2の詳細が図2に示されている。
【0026】同図に示されるように、この領域認識部2
は、入力画像サーチ部21と、領域推論部22と、領域
切り出し部23と、領域別データ記憶部24とから構成
されている。
【0027】入力画像サーチ部21は、入力画像の特徴
量を算出する機能を有するものである。この特徴量算出
処理は、例えば、図3に示されるように、入力画像を一
定のブロック(16×16画素)でサーチし、そのブロ
ック内の『色数』、『明るさ』、『コントラスト』等を
算出すること等により行われる。このとき、サーチする
ブロックの大きさは、ユーザが指定するようにして、領
域の認識精度を調整するようにしても良い。
【0028】領域推論部22は、前記算出された入力画
像の特徴量に基づいて、そのブロック領域が画像領域で
あるか文字領域であるかを推論により判断する機能を有
するものである。この領域判断にファジイ推論を採用す
る場合、例えば、次のようなルール(1)〜(3)が適
用される([表1]参照)。
【0029】
【表1】 表−1 [ルール] (1) IF ブロックの色数=少ない AND 明るさ=明るい THEN 文字領域 (2) IF ブロックの色数=多い THEN 画像領域 (3) IF ブロックのコントラスト=高い THEN 文字領域
【0030】続いて、領域推論部22は、図4に示され
るように、各ブロック毎に画像領域か文字領域かが決ま
れば、隣接する同一領域のグループ同士を結合して、よ
り大きなブロック領域を生成する。
【0031】領域切り出し部23は、画像領域と判断さ
れた領域と文字領域と判断された領域とを、もとの入力
画像データから切り出す機能を有するものである。切り
出す際には、その領域の位置(左上の座標、領域の幅、
領域の長さ)を記憶しておく。これは、後述するページ
データ生成部4において、画像データとテキストデータ
とを並び替えるために使用される。
【0032】領域別データ記憶部24は、前記切り出さ
れたデータをメモり又はファイルに記憶する機能を有す
るものである。画像データをファイルに記憶する場合に
は、それらの画像データは、JPG、BMP等の一般的
な公知の画像データのフォーマットで格納される。
【0033】図1に戻って、テキストデータ変換部3
は、領域認識部2で文字の領域が認識された場合に、そ
の領域の文字をテキストデータに変換する機能を有する
ものである。すなわち、文字領域であると認識された領
域は、OCR等の文字認識技術によりキャラクタに変換
される。
【0034】ページデータ生成部4は、前記の過程を経
て切り出された画像データやテキストデータを、ハイパ
ーテキスト等のページに表示するためのページ記述言語
に変換する機能を有するものである。ページデータ生成
部4の詳細が図5に示されている。
【0035】同図に示されるように、ページデータ生成
部4は、位置情報読み出し部41と、ページデータ付加
部42と、出力部43とから構成されている。
【0036】位置情報読み出し部41は、切り出された
領域に付属する位置情報を読み出し、その位置情報に基
づいて、切り出された各領域のデータを縦座標値の小さ
い順にソートする機能を有するものである。
【0037】ページデータ付加部42は、上記でソート
された各領域のデータにページ記述言語を付加して、画
像データ並びにテキストデータを配置する機能を有する
ものである。
【0038】出力部43は、以上で生成されたページデ
ータを該当するファイルへと出力する機能を有するので
ある。
【0039】次に、以上の構成よりなるページ作成支援
装置の作用を図6のフローチャート、図7及び図8の画
面説明図、並びに、図9のページ出力例を参照して順次
系統的に説明する。
【0040】今仮に、入力画像データ記憶部1(図1参
照)には、図7に示されるような画像領域と文字領域と
を併有する画像データが記憶されているものと想定す
る。なお、前述したように、この画像データは、例え
ば、イメージスキャナ、デジタルカメラ、ビデオカメラ
等から入力されたものである。
【0041】この状態において、図6に示される処理が
開始されると、入力された画像データの中で、どの部分
が画像領域で、どの部分が文字領域かの判断が行われる
(ステップ601)。先に説明したように、この領域認
識処理(ステップ601)は、領域認識部2(図1参
照)を構成する入力画像サーチ部21並びに領域推論部
22(図2参照)の作動により行われる。
【0042】図7に示される画像データに対して領域認
識処理(ステップ601)を施した結果の一例を図8に
示す。同図に示されるように、この例では、与えられた
画像データの中から、画面上部約左半分に描かれた『画
像領域1』(sample1.jpg)と、画面上部約右半分に描
かれた『文字領域1』と、画面下部中央の水平方向に細
長い『画像領域2』(sample2.jpg)と、画面最下部約
左半分の水平方向に細長い『文字領域2』とが領域認識
されている。
【0043】その後、画像領域の存否並びに文字領域の
存否が判定され(ステップ602,604)、画像領域
が存在すると判定される場合には(ステップ602YE
S)、当該画像領域の切り出しファイル化が行われ(ス
テップ603)、また文字領域が存在すると判定される
場合には(ステップ604YES)、テキスト変換処理
が行われる(ステップ606)。先に説明したように、
この画像切り出し処理(ステップ603,605)並び
にテキスト変換処理(ステップ606)は、領域認識部
2(図1参照)を構成する領域切り出し部23並びにテ
キストデータ変換部3(図3参照)の作動により行われ
る。
【0044】その後、上で得られた画像ファイル(図8
の『画像領域1』、『画像領域2』に相当)並びにテキ
ストファイル(図8の『文字領域1』、『文字領域2』
に相当)は、ページ記述言語化処理(ステップ607)
の実行により、ハイパーテキスト等のページ記述言語に
変換される。先に説明したように、このページ記述言語
化処理(ステップ607)は、ページデータ生成部4
(図1参照)を構成する位置情報読み出し部41、ペー
ジデータ付加部42、並びに、出力部43(図5参照)
の作動により行われる。
【0045】図8に示される領域分割された画像データ
に対して、ページ記述言語化処理(ステップ607)を
施した結果として得られたページデータの一例を図9に
示す。このページデータの内容は、以下の3つの部分
(1)〜(3)に分かれている。
【0046】(1)ヘッダ部 ページ言語の始まりを示す。ページデータの先頭に付加
されている。
【0047】(2)本体部 座標位置の順番に従って生成される。縦座標値の一番小
さいものから順に、『画像領域1』、『文字領域1』、
『画像領域2』、『文字領域2』の順で、ページ記述言
語が付加されることとなる。このとき、画像領域並びに
文字領域に対する処理は次のようになる。
【0048】画像領域の場合:画像ファイルにリンク
を張る。
【0049】<IMG SRC=”画像ファイル名”> 文字領域の場合:変換した文字列を並べる。
【0050】(3)フッダ部 ページ言語の終わりを示す。ページデータの最後に付加
する。
【0051】以上説明した本発明に係るページ作成支援
装置の実施の一形態によれば、画像入力装置(イメージ
スキャナ、デジタルカメラ等)から取り込んだ画像を記
憶する入力画像データ記憶部1と、入力画像の画像領域
と文字領域とをそれぞれ認識し、それらの領域のデータ
を切り出す領域認識部2と、切り出した文字領域に含ま
れる文字情報をテキストデータに変換するテキストデー
タ変換部3と、切り出した画像データと変換したテキス
トデータとからページデータを生成するページデータ生
成部4とからなるものであるから、ペーパーベースの
資料を容易に変換・編集できること、読み込んだ画像
情報をそのまま使用する場合に比べて、データの量が少
なくなり、通信などで転送する場合に処理が早く終わる
こと、テキストデータに変換することで、きれいなフ
ォントを利用できるので、表示がきれいになること、
テキストデータに変換することで、修正が容易に行える
ようになること、と言った効果が得られることとなる。
【0052】なお、以上の実施の一形態においては、文
字領域と画像領域とを格別に認識するために、入力画像
サーチ部21並びに領域推論部22を使用しているが、
これに代えて、例えば特開平05−14701号公報に
示されるように、イメージスキャナ等の有する領域認識
機能を利用しても良いことは勿論である。
【0053】また、以上の実施の一形態においては、文
字領域と画像領域とを完全自動認識させるようにしてい
るが、図10に示されるように、領域認識部2(図1参
照)の代わりに、画像表示・領域指定部5を設け、これ
により画像を取り込んで、人手による領域指定を行える
ようにしても良く、更には、図11に示されるように、
画像表示・領域指定部5を新たに設け、領域認識部1で
認識した画像を一旦画像表示・領域指定部5で表示し、
表示した画像の上で人手により領域の修正・入力を行え
るようにしても良い。
【0054】また、以上の実施の一形態においては、切
り出された画像に付された位置情報を使用して各画像の
割付を行っているが、図12に示されるように、テンプ
レート記憶部6を新たに設け、画像データとテキストデ
ータを割り付ける位置をテンプレートに従って決定する
ようにしても良い。
【0055】次に、本発明に係るページ作成支援装置の
さらに別の実施の形態を図13〜図18を参照して説明
する。この実施の形態においては、先の例で説明された
ページ作成支援装置100の出力側に新たにページリン
ク部7が設けられており、これにより、データベース
に格納されているデータと自動的にリンクさせる機能、
並びに、複数のページを作成した場合にそれらのペー
ジ間に自動的にリンクを張る機能を実現して、それらの
間にリンクを張る手間を大幅に軽減している。
【0056】ページリンク部7の一例が図13に詳細に
示されている。同図に示されように、このページリンク
部7は、ページデータ記憶部71と、キーワード・リン
クデータ72と、キーワード・タイトル検出部73と、
リンク部74とから構成されている。
【0057】ページデータ記憶部71には、ページ作成
支援装置100で作成されたページデータを記憶する機
能を有するものである。特に、このページデータ記憶部
71には、ページデータが複数個だけ記憶できる記憶容
量が確保されている。
【0058】キーワード・リンクデータ・データベース
(DB)72には、よく利用されるキーワードとそのリ
ンクデータとが格納されている。キーワード・リンクデ
ータ・データベース(DB)72の一例が図14に示さ
れている。この例では、キーワード(連絡網、電話等)
とリンク先データの実体、或いは、リンク先アドレス/
ファイル名(連絡.HTML、電話.HTML等)とが
対となって記憶されている。
【0059】キーワード・タイトル検出部73は、ユー
ザが入力したキーワード或いはデータベース72に記憶
されているキーワードにマッチする文字列を、ページデ
ータ記憶部71に格納されているデータから検出する機
能を有するものである。また、このキーワード・タイト
ル検出部73では、ページのタイトルとその文字列も同
時に検出するようになっている。
【0060】リンク部74は、検出したキーワード或い
はタイトルに関連するデータをリンクさせる機能を有す
るものである。
【0061】次に、以上の構成よりなるページリンク部
7を備えたページ作成支援装置の作用を、図15〜図1
8の説明図を参照して説明する。
【0062】第1のステップとして、先ず、ページデー
タ作成支援装置100から出力されたページデータは、
そのまま、ページデータ記憶部81に格納される。今仮
に、図15並びに図16に示される2ページのページデ
ータ(『ページデータ1(スポーツ大会.HTML)』、
『ページデータ2(催し物紹介.HTML)』)がページ作
成支援装置100にて作成され、これらがそのままペー
ジデータ記憶部81に格納されているものと想定する。
【0063】第2のステップとして、キーワード・タイ
トル検出部83は、キーワード・リンクデータDB83
に格納されているキーワードを、ページデータ記憶部8
1に格納されているページデータから検出する。同時
に、タイトルの文字列が、それ以外のページデータに含
まれている場合は、その文字列を検出する。
【0064】第3のステップとして、リンク部84は、
キーワードとマッチする文字列が存在する場合には、そ
のキーワードにキーワード・リンクデータDB83のリ
ンクデータをリンクさせる。これは、次のように、検出
されたキーワードとの入れ替えを行うことにより実現さ
れる。
【0065】すなわち、一例としてキーワードである
『連絡網』(図14参照)が検出された場合、このキー
ワードである『連絡網』は次のように入れ替えられる。
【0066】[例]連絡網 → <A HREF=”連絡.HT
ML”>連絡網</A> 第4のステップとして、リンク部84は、タイトルの文
字列が存在する場合には、キーワードの場合と同様にし
て、ページデータとリンクさせる。これは、次のよう
に、検出されたタイトルとの入れ替えを行うことにより
実現される。
【0067】すなわち、一例としてタイトルである『ス
ポーツ大会』、『催し物紹介』が検出された場合には、
これらのタイトルである『スポーツ大会』、『催し物紹
介』は次のように入れ替えられる([表2]参照)。
【0068】
【表2】 表−2 [例]スポーツ大会 → <A HREF=”スポーツ大会.HTML”>スポーツ・・・ ・・・大会</A> [例]催し物紹介 → <A HREF=”催し物紹介.HTML”>催し物紹介</A>
【0069】以後、検出したキーワード及びタイトルの
文字列がなくなるまで、上記の第3のステップ及び第4
のステップが繰り返し実行され、その結果が出力される
こととなる。
【0070】このようにして、リンク処理が完了して出
力されたページデータの一例が図17並びに図18に示
されている。それらの図において、下線が付された部分
が変更された部分である。
【0071】図15並びに図16に示された元のページ
データ(『ページデータ1(スポーツ大会.HTML)』、
『ページデータ2(催し物紹介.HTML)』)と比較して
説明する。図15に示された元の『ページデータ1』に
含まれるキーワード『連絡網』は、図17に示されたリ
ンク処理後の『ページデータ1』においては、『<AHRE
F=”連絡.HTML”>連絡網</A>』に置き換えが行わ
れている。
【0072】また、図15に示された元の『ページデー
タ1』に含まれるキーワード『催し物紹介』は、図17
に示されたリンク処理後の『ページデータ1』において
は、『<A HREF=”催し物紹介.HTML”>催し物紹介<
/A>』に置き換えが行われている。
【0073】さらに、図16に示された元の『ページデ
ータ2』に含まれるキーワード『スポーツ大会』は、図
18に示されたリンク処理後の『ページデータ2』にお
いては、『<A HREF=”スポーツ大会.HTML”>スポー
ツ大会</A>』に置き換えが行われている。
【0074】なお、図17に示されるように、『ページ
データ1』の本体部<BODY>には、ヘッダ部<HE
AD>に含まれるタイトル<TITLE>である『スポ
ーツ大会』と同一の語を含む文『スポーツ大会を開催し
ます。』が存在するが、これは同一ページ内のデータで
あるから、両者間にリンクが張られることはない。
【0075】以上の説明で明らかなように、このリンク
処理を含む実施の形態によれば、データベースに格納
されているデータと自動的にリンクさせる機能、並び
に、複数のページを作成した場合にそれらのページ間
に自動的にリンクを張る機能を実現して、それらの間に
リンクを張る手間を大幅に軽減することができる。
【0076】以上の各実施の形態において、図1、図
2、図5、図10〜図13に示される機能ブロック図の
構成は、コンピュータに一定のプログラムを組み込むこ
とによりソフトウェア的に実現することができることは
勿論であり、その際に、コンピュータプログラムはハー
ドディスクにインストールして起動され、またCDRO
MやDVD等の各種の光ディスク等に格納して提供する
ことができる。
【0077】
【発明の効果】以上の説明から明らかなように、本発明
によれば、画像領域と文字領域とを含む画像データを、
煩雑な編集作業等を要することなく、比較的にデータ量
の少ないページデータ(インターネット上のホームペー
ジ、ワープロデータ、DTPデータ等)に変換すること
ができる。
【図面の簡単な説明】
【図1】本発明にかかるページ作成支援装置の実施の一
形態の構成を示すブロック図である。
【図2】同実施の一形態を構成する領域認識部の詳細を
示すブロック図である。
【図3】同領域認識部に含まれる入力画像サーチ部の動
作を説明するための説明図である。
【図4】同僚域認識部に含まれる領域推論部の動作を説
明するための説明図である。
【図5】同実施の一形態を構成するページデータ生成部
の詳細を示すブロック図である。
【図6】同実施の一形態の作用を系統的に説明するため
のフローチャートである。
【図7】サンプル入力画像の一例を示す説明図である。
【図8】領域認識処理されたサンプル入力画像を示す説
明図である。
【図9】領域認識されたサンプル入力画像をページ記述
言語に変換した例を示す説明図である。
【図10】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。
【図11】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。
【図12】本発明にかかるページ作成支援装置の実施の
一形態の変形例の構成を示すブロック図である。
【図13】本発明にかかるページ作成支援装置の他の実
施の一形態の構成を示すブロック図である。
【図14】同実施の一形態に含まれるキーワード・リン
クデータDBの構成を示す説明図である。
【図15】同実施の一形態に適用されるページデータの
一例を示す説明図である。
【図16】同実施の一形態に適用されるページデータの
一例を示す説明図である
【図17】リンク処理が完了した図15に示されるペー
ジデータの一例を示す説明図である。
【図18】リンク処理が完了した図16に示されるペー
ジデータの一例を示す説明図である。
【符号の説明】
1 入力画像データ記憶部 2 領域認識部 3 テキストデータ変換部 4 ページデータ生成部 5 画像表示・領域指定部 6 テンプレート記憶部 7 ページリンク部 21 入力画像サーチ部 22 領域推論部 23 領域切り出し部 24 領域別データ記憶部 41 位置情報読み出し部 42 ページデータ付加部 43 出力部 71 ページデータ記憶部 72 キーワード・リンクデータDB 73 キーワード・タイトル検出部 74 リンク部 100 ページ作成支援装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 堀内 雅之 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 太田 浩二 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 八竹 英紀 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 鈴木 等 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 画像入力装置から取り込んだ画像を記憶
    する入力画像データ記憶手段と、 前記記憶された入力画像の画像領域と文字領域とをそれ
    ぞれ認識し、それらの領域のデータを切り出す領域認識
    手段と、 前記切り出された文字領域に含まれる文字情報をテキス
    トデータに変換するテキストデータ変換手段と、 前記切り出された画像データと変換したテキストデータ
    とからページデータを生成するページデータ生成手段
    と、 を具備することを特徴とするページ作成支援装置。
  2. 【請求項2】 前記生成されたページデータを複数記憶
    するだけの記憶容量を有するページデータ記憶手段と、 ユーザにより入力されたか、若しくは、データペースに
    記憶されているキーワード、若しくは、タイトルにマッ
    チングする文字列を、前記ページデータ記憶手段に格納
    されたページデータから検出するキーワード・タイトル
    検出手段と、 前記検出されたキーワード或いはタイトルに関連するペ
    ージデータ同士をリンクさせるリンク手段と、 を具備することを特徴とする請求項1に記載のページ作
    成支援装置。
  3. 【請求項3】 前記領域認識部は、 入力画像データを一定サイズのブロックでサーチしつ
    つ、そのブロック内の画像特徴量を算出する入力画像サ
    ーチ手段と、 前記算出された特徴量に基づいてファジイ推論を実行す
    ることにより、その領域が画像領域であるか若しくは文
    字領域であるかを判断する領域推論手段と、 画像領域と判断された領域と文字領域と判断された領域
    とを元の入力画像データから切り出す領域切り出し手段
    と、 前記切り出された画像データを領域別に格納する領域別
    データ記憶手段と、 を具備することを特徴とする請求項1若しくは請求項2
    に記載のページ作成支援装置。
  4. 【請求項4】 前記ページデータ生成部は、 前記切り出された各領域のデータに付属する位置情報を
    読み出し、その位置情報に従って一定の順序で領域デー
    タをソートする位置情報読み出し手段と、 前記ソートされた領域データのそれぞれにページ記述言
    語を付加して配置するページデータ付加手段と、 を具備することを特徴とする請求項1若しくは請求項2
    に記載のページ作成支援装置。
  5. 【請求項5】 前記ページデータ生成部は、画像データ
    とテキストデータとを割り付ける位置を、テンプレート
    に従って割り付けることを特徴とする請求項1若しくは
    請求項2に記載のページ作成支援装置。
  6. 【請求項6】 画像入力装置から取り込んだ画像を記憶
    媒体に記憶する入力画像データ記憶ステップと、 前記記憶された入力画像の画像領域と文字領域とをそれ
    ぞれ認識し、それらの領域のデータを切り出す領域認識
    ステップと、 前記切り出された文字領域に含まれる文字情報をテキス
    トデータに変換するテキストデータ変換ステップと、 前記切り出された画像データと変換したテキストデータ
    とからページデータを生成するページデータ生成ステッ
    プと、 を具備することを特徴とするページ作成支援方法。
  7. 【請求項7】 前記生成されたページデータを複数記憶
    させるページデータ記憶ステップと、 ユーザにより入力されたか、若しくは、データペースに
    記憶されているキーワード、若しくは、タイトルにマッ
    チングする文字列を、前記ページデータ記憶ステップに
    て格納されたページデータから検出するキーワード・タ
    イトル検出ステップと、 前記検出されたキーワード或いはタイトルに関連するペ
    ージデータ同士をリンクさせるリンクステップと、 を具備することを特徴とする請求項1に記載のページ作
    成支援方法。
  8. 【請求項8】 前記領域認識部は、 入力画像データを一定サイズのブロックでサーチしつ
    つ、そのブロック内の画像特徴量を算出する入力画像サ
    ーチステップと、 前記算出された特徴量に基づいてファジイ推論を実行す
    ることにより、その領域が画像領域であるか若しくは文
    字領域であるかを判断する領域推論ステップと、 画像領域と判断された領域と文字領域と判断された領域
    とを元の入力画像データから切り出す領域切り出しステ
    ップと、 前記切り出された画像データを領域別に格納する領域別
    データ記憶ステップと、 を具備することを特徴とする請求項1若しくは請求項2
    に記載のページ作成支援方法。
  9. 【請求項9】 前記ページデータ生成部は、 前記切り出された各領域のデータに付属する位置情報を
    読み出し、その位置情報に従って一定の順序で領域デー
    タをソートする位置情報読み出しステップと、 前記ソートされた領域データのそれぞれにページ記述言
    語を付加して配置するページデータ付加ステップと、 を具備することを特徴とする請求項1若しくは請求項2
    に記載のページ作成支援方法。
  10. 【請求項10】 前記ページデータ生成部は、画像デー
    タとテキストデータとを割り付ける位置を、テンプレー
    トに従って割り付けることを特徴とする請求項1若しく
    は請求項2に記載のページ作成支援方法。
JP8308745A 1996-11-05 1996-11-05 ページ作成支援方法及び装置 Pending JPH10134081A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8308745A JPH10134081A (ja) 1996-11-05 1996-11-05 ページ作成支援方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8308745A JPH10134081A (ja) 1996-11-05 1996-11-05 ページ作成支援方法及び装置

Publications (1)

Publication Number Publication Date
JPH10134081A true JPH10134081A (ja) 1998-05-22

Family

ID=17984784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8308745A Pending JPH10134081A (ja) 1996-11-05 1996-11-05 ページ作成支援方法及び装置

Country Status (1)

Country Link
JP (1) JPH10134081A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002318806A (ja) * 2001-04-20 2002-10-31 Dainippon Printing Co Ltd データ入力システム
JP2002351895A (ja) * 2001-05-28 2002-12-06 Dainippon Printing Co Ltd 印刷製版データからの情報抽出装置
US8682075B2 (en) 2010-12-28 2014-03-25 Hewlett-Packard Development Company, L.P. Removing character from text in non-image form where location of character in image of text falls outside of valid content boundary

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002318806A (ja) * 2001-04-20 2002-10-31 Dainippon Printing Co Ltd データ入力システム
JP2002351895A (ja) * 2001-05-28 2002-12-06 Dainippon Printing Co Ltd 印刷製版データからの情報抽出装置
US8682075B2 (en) 2010-12-28 2014-03-25 Hewlett-Packard Development Company, L.P. Removing character from text in non-image form where location of character in image of text falls outside of valid content boundary

Similar Documents

Publication Publication Date Title
JP2896634B2 (ja) 全文登録語検索装置および全文登録語検索方法
KR100461019B1 (ko) 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법
JP3178475B2 (ja) データ処理装置
US6336124B1 (en) Conversion data representing a document to other formats for manipulation and display
JP2002055872A (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
JP2005122295A (ja) 関係図作成プログラム、関係図作成方法、および関係図作成装置
JP2004355528A (ja) 情報処理装置、プログラム、及び記録媒体
JPH11328218A (ja) コンテンツ属性情報正規化方法、情報収集・サービス提供システム、属性情報設定装置並びにプログラム格納記録媒体
JPH10134081A (ja) ページ作成支援方法及び装置
JP3692416B2 (ja) 情報フィルタリング方法および装置
JPH11250077A (ja) 情報処理装置、情報処理方法及び記録媒体
US20030009490A1 (en) Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP3504002B2 (ja) ノード・リンク自動生成方法
JPH10307837A (ja) 検索装置並びに検索プログラムを記録した記録媒体
JP2008225584A (ja) 物品推薦装置、物品推薦システム、物品推薦方法及び物品推薦プログラム
JP3477822B2 (ja) 文書登録検索システム
JP3744136B2 (ja) 訳語選択装置と記憶媒体
JP3943005B2 (ja) 情報検索プログラム
JP4113145B2 (ja) 文書処理装置及び文書処理方法
JP3258051B2 (ja) 情報検索装置および情報検索方法
JP2001067366A (ja) データベース検索結果表示システム、方法及び記録媒体
JP3239845B2 (ja) 全文検索装置および方法
JPH10162126A (ja) 文書の電子化装置
JPH10207758A (ja) ホームページ分析表示システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040308