JPWO2017131184A1 - 書物電子化方法および書物電子化装置 - Google Patents

書物電子化方法および書物電子化装置 Download PDF

Info

Publication number
JPWO2017131184A1
JPWO2017131184A1 JP2017563865A JP2017563865A JPWO2017131184A1 JP WO2017131184 A1 JPWO2017131184 A1 JP WO2017131184A1 JP 2017563865 A JP2017563865 A JP 2017563865A JP 2017563865 A JP2017563865 A JP 2017563865A JP WO2017131184 A1 JPWO2017131184 A1 JP WO2017131184A1
Authority
JP
Japan
Prior art keywords
book
data
page
dimensional
sheet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017563865A
Other languages
English (en)
Other versions
JP6432871B2 (ja
Inventor
中西 徹
徹 中西
耕二 小山田
耕二 小山田
尚久 坂本
尚久 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University
Sharp Corp
Original Assignee
Kyoto University
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University, Sharp Corp filed Critical Kyoto University
Publication of JPWO2017131184A1 publication Critical patent/JPWO2017131184A1/ja
Application granted granted Critical
Publication of JP6432871B2 publication Critical patent/JP6432871B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

書物の3次元データから、書物のページに記載された文字列等の情報を得る。書物電子化装置(1)は、書物のシートおよびシートの隙間に応じたデータ値を有する書物の3次元データにおける、書物のページに対応するページ領域を特定する面特定部(12)と、ページ領域における文字列または図形を2次元平面にマッピングすることで、書物に書かれた文字列または図形を含む2次元ページデータを生成するデータ生成部(13)とを備える。

Description

本発明は書物のページデータを生成する技術に関する。
読むために書物を開くことで、書物が傷むことがある。特に古い書物は、開くと傷んだり破損したりする可能性がある。例えば、イタリアで発見された、古代ローマ時代に噴火によって焦げてしまった巻物状の古文献がある。この古文献は、全体が黒ずんでいるため肉眼による判読が難しく、かつ、脆いので開くことができない。
非特許文献1には、噴火によって焦げてしまった巻物状のこの古文献から、古文献に書かれていたギリシャ文字を抽出したことが記載されている。非特許文献1では、X線位相コントラスト断層撮影によって古文献の3次元データを生成し、3次元データの中に単独のギリシャ文字と見られる画素のパターンが発見されたことが報告されている。
非特許文献2には、3次元データを可視化する技術が記載されている。非特許文献2の技術では、連続的なデータ値の分布を有する3次元データから、特定のデータ値を有する等値面(Isosurface)を自動的に特定する。
Vito Mocella et. al., "Revealing letters in rolled Herculaneum papyri by X-ray phase-contrast imaging", NATURE COMMUNICATIONS, 6:5895 doi: 10.1038/ncomms6895 (2015) Takayuki Itoh et. al., "Automatic Isosurface Propagation Using an Extrema Graph and Sorted Boundary Cell Lists", IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, VOL. 1, NO. 4, DECEMBER 1995
しかしながら、非特許文献1には、単独の文字を抽出したことは記載されているが、単語または文が抽出されたことは記載されていない。文字列を抽出できない原因は、巻物状である古文献の3次元データにおけるページ領域が正確に特定されていないことにあると考えられる。
本発明の目的は、書物の3次元データから、書物のページに記載された文字列等の情報を得ることにある。
本発明の一態様に係る書物電子化方法は、書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定するステップと、上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するステップとを含む方法である。
本発明の一態様に係る書物電子化装置は、書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定する領域特定部と、上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するデータ生成部とを備える構成である。
本発明の一態様によれば、書物の3次元データから、書物のページに記載された文字列等の情報を得ることができる。
本発明の一実施形態に係る書物電子化装置の構成を示すブロック図である。 上記書物電子化装置における処理フローを示す図である。 対象となる書物の3次元データを示す斜視図である。 3次元データの一部を拡大して示す図である。 本発明の他の実施形態に係る書物電子化装置の構成を示すブロック図である。 上記書物電子化装置における処理フローを示す図である。
〔実施形態1〕
(書物の3次元データ)
対象となる書物は、1枚のシートが巻かれた巻物でもよいし、複数のシートが綴じられた本でもよいし、綴じられずに複数のシートが重なっているものでもよい。書物のシートは、一般的には紙であるが、これに限らず、プラスティック等でもよい。
まず、書物の3次元データを用意する。閉じたままの書物をX線位相コントラスト断層撮影装置によって撮影することによって、書物の3次元データ(ボリュームデータ)を得ることができる。この3次元データは、3次元空間における各点がデータ値を有する、書物を表す3次元画像である。データ値は、その位置の物質に応じたスカラー値である。なお、3次元データの各座標が2つ以上の値(例えば、第1波長による画素値と第2波長による画素値)を有していてもよい。3次元データは、重なった複数のシートと、シート同士の間の隙間(空気)と、シート上のインク(文字)との情報を含む。3次元データの解像度(分解能)は、シートの厚さおよび隙間の幅より小さい。すなわち、座標のピッチはシートの厚さおよび隙間の幅より小さい。また、3次元データの解像度は、書物に書かれた文字を判別できる程度に十分小さいことが好ましい。ここでは簡単に、3次元データの各点は、0以上10以下の範囲のデータ値を有するとする。6以上9未満のデータ値はインクに対応し、3以上6未満のデータ値はシートに対応し、0以上3未満のデータ値はシートの隙間(空気)に対応すると仮定して説明する。なお、9以上のデータ値は他の部分に対応する。データ値と物質との対応関係は、サンプルの書物を撮影することで決定することができる。なお、X線位相コントラスト断層撮影以外のX線断層撮影によって、このような3次元データを得ることもできる。
(書物電子化装置の構成)
図1は、本実施形態の書物電子化装置1の構成を示すブロック図である。書物電子化装置1は、位置指定部11、面特定部12(領域特定部)、およびデータ生成部13を備える。3次元データはあらかじめ書物電子化装置1に入力されている。書物電子化装置1の詳細な動作は後述する。
位置指定部11は、3次元データのデータ値に基づき、ページ領域を特定するための初期点を指定する。位置指定部11は、初期点の情報を面特定部12に出力する。
面特定部12は、指定された初期点に繋がるページ領域を特定する。面特定部12は、ページ領域に対応する点の集合、および各点のデータ値を、データ生成部13に出力する。
データ生成部13は、特定されたページ領域のデータを2次元の(平面の)ページデータに変換する。ページデータは、書物のページ内における複数の文字または図形の位置関係(文字等の配置)の情報を有する。
(ページデータ生成処理フロー)
図2は、書物電子化装置1における処理フローを示す図である。
(初期点の指定)
図3は、対象となる書物の3次元データを示す斜視図である。書物の3次元データは、複数のシートの領域と、シートの隙間の領域とを含む。そのため、3次元データの全てのデータを走査して1つのシートの領域を探すのは非効率である。
位置指定部11は、3次元データにおいて、少なくとも1つのページと交差するように、線状の経路Lを指定する(S1)。経路Lは、簡単には直線でよいが、曲線でもよい。経路Lは、あらかじめ決まったものでもよく、所定の複数の経路からユーザが選択してもよい。例えば表紙と裏表紙とを貫通する経路Lを指定すれば、経路Lは書物の全てのページと交差すると考えられる。そのため、位置指定部11は、3次元データの全てのデータを走査するより、効率的に各ページの1点を特定することができる。
位置指定部11には、シートのデータ値と隙間のデータ値とを分ける閾値(ここでは3)が設定されている。ページは、シートの一面であるので、ページに対応する領域(ページ領域)は、シートと隙間との境界に対応する位置に存在する。経路Lに沿ってデータ値を見ると、経路とページとが交差する位置で、データ値が閾値を越えて変化する。位置指定部11は、経路Lに沿ってデータ値を参照し、データ値が閾値に対応する点をページ領域の初期点として指定する(S2)。経路Lが複数のページと交差する場合、位置指定部11は、複数のページ領域に対応する複数の初期点を指定してもよい。
(ページ領域の特定)
図4は、3次元データの一部を拡大して示す図である。点P2と点P4との間の点i1が、位置指定部11によって初期点として指定されている。初期点i1を含む、直交座標系の単位セルC1に注目する。単位セルC1は、8つの点P1〜P8を各頂点とする直方体(立方体)である。例えば、点P2のデータ値が閾値より大きく、かつ、点P4のデータ値が閾値より小さい場合、点P2と点P4との間にデータ値が閾値に対応する初期点i1(すなわちページ領域に対応する点)が存在すると考えられる。ページ領域PGは、初期点i1を含み、初期点i1から面状(平面状または曲面状)に延びている。そのため、ページ領域PGは、初期点i1を含む単位セルC1の中を通っていると考えられる。
面特定部12は、初期点i1を含む単位セルC1に注目し、単位セルC1においてページ領域PGが通過する複数の辺を特定する。例えば、座標軸に沿って隣接する2頂点(P3とP4)において、一方のデータ値が閾値以上でありかつ他方のデータ値が閾値未満である場合、面特定部12は、ページ領域PGが該2頂点間(辺P3−P4)を通過すると判定する。単位セルC1では、ページ領域PGは、辺P2−P4、辺P3−P4、辺P6−P8、および辺P7−P8を通過する。
ページ領域PGが辺P3−P4を通過するので、ページ領域PGは、該辺P3−P4を含む他の単位セルC2(C1に隣接する単位セル)を通過する。また、ページ領域PGは、辺P2−P4を含む他の単位セルC3を通過する。面特定部12は、単位セルC1と同様に単位セルC2、C3について、ページ領域PGが通過する辺を特定する。このように、面特定部12は、ページ領域PGが通過すると判定した各辺を含む他の単位セルについて、同様の判定を行う。これにより、面特定部12は、ページ領域PGが通過する単位セルを特定することができる。ここで、面特定部12は、注目した単位セルC1に隣接する全てのセルについて判定を行うのではなく、ページ領域PGが通過しないと考えられる単位セルC4等については判定を省略することができる。
面特定部12は、ページ領域PGの位置を特定する(S3)。例えば、面特定部12は、ページ領域PGが通過する辺において、データ値が閾値以上である(シートまたはインクに対応する)一方の頂点を、ページ領域PGに対応する点として特定してもよい。
または、面特定部12は、該辺において、データ値が閾値に近いいずれかの頂点をページ領域PGに対応する点として特定してもよい。
または、面特定部12は、該辺を「閾値と一方の点のデータ値との差」:「閾値と他方の点のデータ値との差」に内分する点を、ページ領域PGに対応する点として特定してもよい。面特定部12は、このような中間点のデータ値を、周囲の点のデータ値から補間によって決定してもよい。
面特定部12は、指定された初期点i1から、初期点i1に繋がる等値面を自動的に探索することで、初期点i1に対応するページ領域PGを正確に特定することができる。等値面とは、3次元空間で定義されたスカラー場において、データ値が同じである点の集合である。面特定部12は、データ値が所定範囲内の等値面(等値体積:Isovolume)を特定してもよい。3次元データにおけるデータ点の数がNの3乗ある場合、面特定部12は、Nの2乗のオーダーのデータ点を調べることで、1つのページ領域PGを特定することができる。
なお、3次元空間におけるページ領域PGは、微細な凹凸を含む面であり得る。面特定部12は、データ生成部13に特定したページ領域PGを渡す前に、凹凸を含む該ページ領域PGをスムージングすることにより、滑らかな曲面のページ領域に変換してもよい。また、面特定部12は、ページ領域PGをシートの内側、または、シートの外側に平行移動してもよい。例えば、インクがシートの内側に染みこんでいる場合、シートの表面を表すページ領域PGをシートの内側に平行移動させることで、インクで表される文字等の情報をより確実にページ領域PGに含めることができる。また、インクがシートの表面上に盛り上がって形成されている場合、ページ領域PGをシートの外側に平行移動させることで、インクで表される文字等の情報をより確実にページ領域PGに含めることができる。
(ページデータ生成)
撮影された書物のシート(特に古い書物のシート)は、曲がっていたりし得る。そのため、特定されたページ領域PGは、3次元空間における曲面であり得る。データ生成部13は、ページ領域PGのデータを2次元の(平面の)ページデータに変換する。具体的には、データ生成部13は、ページ領域PGの各点のデータ値を、2次元平面上にマッピングすることで、ページデータを生成する(S4)。2次元のページデータの各点のデータ値は、概ねシートおよびインクのいずれかに対応する。ページ領域PGが穴あきの面であった場合、2次元のページデータにおいて穴に対応する箇所のデータ値は、他の値(隙間に対応する値等)であってよい。もちろん、2次元のページデータは、他のデータ値の点を含んでもよい。なお、マッピングの方法として、公知の方法(例えば、鞍点特徴を利用した3次元メッシュ展開等)を利用することができる。
データ生成部13によって生成された2次元のページデータは、書物のページ内における複数の文字または図形の位置関係の情報を有する。2次元のページデータは、書物の1ページの画像を表すと考えることができる。該ページに含まれる文字列または図形は、インクに対応するデータ値の配置によって表される。すなわち、ページデータは、書物のページに書かれた文字列(配列された複数の文字)または図形を含む。例えば、表示装置が、シートに対応するデータ値とインクに対応するデータ値とを、異なる階調または異なる色によって表示することで、書物の1ページの画像を、ユーザに視認可能に表示することができる。データ生成部13は、ページデータの視認性のために、各データ値を対応する階調または色のデータに変換してもよい。
また、データ生成部13は、2次元のページデータからパターンマッチング等によって文字を抽出し、抽出された文字をテキストデータ(文字コード)に変換してもよい。これにより、データ生成部13は、書物のページに書かれた文字列をテキストデータで表したページデータを得ることができる。
以上では、書物の1ページのページデータを得る流れを説明した。位置指定部11は、複数のページ領域に対応する複数の初期点を指定することができる。それゆえ、他の初期点について、面特定部12およびデータ生成部13が同様の処理を行うことで、データ生成部13は、他のページのページデータを生成することができる。面特定部12は、厚みのあるシートの表面(一面)をページ領域PGとして特定することができる。そのため、面特定部12は、表裏に対応する2つの初期点から2つのページ領域PGを特定することで、シートの両面のページ領域を個別に特定することができる。データ生成部13は、経路L上の複数の初期点の配置または特定された複数のページ領域PGの配置から、得られた複数のページデータを、ページ番号に対応付けてもよい。このように、書物電子化装置1は、書物の3次元データから、書物の複数のページに対応する複数のページデータを生成することができる。
本実施形態の書物電子化装置1は、3次元データにおいて1つのページに対応する連続したページ領域を特定する。書物電子化装置1は、特定されたページ領域のデータ値から2次元のページデータを生成する。このページデータは、書物のページに書かれた複数の文字(文字列)の配置または図形の情報を有する。ページデータは、正確に特定されたページ領域に基づいて生成されるため、ノイズが存在したとしても、ページデータ上の文字列等は正確に識別されることができる。それゆえ、書物電子化装置1は、ページデータから容易に元の書物に書かれた文字列または図形の情報を得ることができる。よって、書物電子化装置1は、単独の文字だけでなく、書物に書かれた複数の文字からなる単語または文を読み取ることができる。また、表示装置等に表示されたページデータにおいて、ユーザは文字列等を容易に識別することができる。
本実施形態の書物電子化装置1によれば、書物の3次元データから、書物のページに書かれた(描かれた)文字または図形等の情報を含むページデータを生成することができる。3次元データを作成する際に、書物を開く必要はなく、書物のシートが湾曲した状態であってもよい。それゆえ、開くと破損する可能性のある古文献に書かれている情報を、古文献を傷つけることなく電子化することができる。また、書物電子化装置1によれば、スキャナー等で書物を1ページずつスキャンする必要がないため、古文献に限らず、書物を容易に電子化することができる。過去に出版された電子データのない文献を効率よく電子化することにより、万が一災害等によって文化財(文献)が失われても、その内容を再現することができる。また、書物電子化装置1を写真アルバムに適用することにより、写真アルバムを電子化することもできる。
(変形例)
なお、シートまたは文字を描くインクの種類に応じて、X線位相コントラスト断層撮影によって得た3次元データにおけるシートまたはインクに対応するデータ値は異なり得る。シート、インク、および隙間(空気)を分ける複数の閾値は、シートおよびインクの種類に応じて適宜設定される。
なお、位置指定部11は、ユーザによる初期点の指定を受け付けてもよい。位置指定部11は、表示装置に書物の3次元データを表示し、ユーザは、シートの表面(ページ領域PG)と見られる点を初期点として指定してもよい。
なお、書物電子化装置は、初期点を指定することなく、面特定部が、例えば閾値に近いデータ値を有する点の集合をページ領域として特定してもよい。
〔実施形態2〕
本発明の他の実施形態について説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。本実施形態では、書物電子化装置は、3次元データに前処理を行ってからページ領域の特定を行う。
図5は、本実施形態の書物電子化装置2の構成を示すブロック図である。書物電子化装置2は、前処理部14、位置指定部11、面特定部12、およびデータ生成部13を備える。
図6は、書物電子化装置2における処理フローを示す図である。位置指定部11が経路を指定する処理(S1)の前に、前処理部14による微分演算の処理(S5)が追加されている。
前処理部14は、書物の3次元データに対して前処理として微分演算を行うことで、微分された3次元データを生成する。微分演算は、データ値の変化(勾配)が大きい箇所程、大きな値に変換する。通常、シート等の境界では、急激にデータ値が変化すると考えられる。微分された3次元データは、この境界に対応する領域において大きな値を有し、他の領域では比較的小さな値を有すると考えられる。これにより、書物電子化装置2は、シートの表面に対応するページ領域を正確に特定することができる。前処理部14は、微分された3次元データを位置指定部11に出力する。
位置指定部11は、例えば上述の実施形態のように、少なくとも1つのページと交差するように、線状の経路を指定する。位置指定部11は、経路に沿って微分された3次元データの値を参照し、値が所定の閾値を越える点、または値が極大値である点をページ領域の初期点として指定する。初期点はシートの表面であるページに対応する。
面特定部12は、初期点に対応するページ領域を特定する。例えば、面特定部12は、初期点に隣接する点のうち、微分された3次元データにおける値が所定の閾値を越える点を、ページ領域を構成する点として特定する。面特定部12は、ページ領域を構成する点に隣接する点について、同様の判定を行う。
または、面特定部12は、指定された初期点と、微分前の3次元データのデータ値とに基づいて、実施形態1と同様の方法で、ページ領域を特定してもよい。
データ生成部13は、実施形態1と同様に、特定されたページ領域に対応するデータ値(微分前)を、2次元のページデータ上にマッピングする。
本実施形態の書物電子化装置2によれば、シートの表面をページ領域として正確に特定することができる。そのため、書物に書かれた単語および文の情報を正確に得ることができる。
〔実施形態3〕
書物電子化装置1、2の制御ブロック(特に位置指定部11、面特定部12、データ生成部13、および前処理部14)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、書物電子化装置1、2は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る書物電子化方法は、書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定するステップと、上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するステップとを含む方法である。
上記の構成によれば、書物の3次元データにおけるページ領域を特定した上で、書物の3次元データにおける該ページ領域に位置する文字列または図形を、2次元平面にマッピングする。これにより、書物に書かれた文字列または図形を含む2次元ページデータを得ることができる。そのため、書物の該ページに書かれた内容(文章等)を、正確に可読性の高い2次元ページデータに変換することができる。それゆえ、書物の3次元データから、書物のページに記載された文字列等の情報を得ることができる。
本発明の態様2に係る書物電子化方法は、上記の態様1において、上記3次元データにおける、上記ページの一点に対応する初期点を指定するステップを含み、上記ページ領域を特定するステップでは、上記3次元データから、上記初期点に繋がる上記ページ領域を特定する方法としてもよい。
上記の構成によれば、指定された初期点に対応する1つのページ領域を効率よく特定することができる。
本発明の態様3に係る書物電子化方法は、上記の態様2において、上記3次元データにおいて線状の経路を指定するステップを含み、上記初期点を指定するステップでは、上記経路におけるデータ値に基づき、上記経路と上記ページ領域とが交差する点を、上記初期点として指定する方法としてもよい。
上記の構成によれば、ページ領域の一点を、効率よく指定することができる。そのため、処理時間を短縮し、効率よく書物の電子化を行うことができる。
本発明の態様4に係る書物電子化方法は、上記の態様1から3のいずれか一項において、上記ページ領域を特定するステップでは、上記シートのデータ値と上記シートの隙間のデータ値とを分ける閾値に対応する等値面を特定する方法としてもよい。
シートのデータ値とシートの隙間のデータ値とを分ける閾値に対応する等値面は、シートの表面に対応すると考えられる。それゆえ、文字等が存在するシートの表面を特定することができる。
本発明の態様5に係る書物電子化方法は、上記の態様2または3において、上記3次元データに対して微分演算をすることにより、微分された3次元データを生成するステップを含み、上記初期点を指定するステップでは、上記微分された3次元データにおける値に基づき、上記初期点を指定する方法としてもよい。
シートと隙間との境界では、データ値が急激に変化していると考えられる。微分演算をすることにより、ページ領域に対応する、シートと隙間との境界を抽出することができる。
本発明の態様6に係る書物電子化装置は、書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定する領域特定部と、上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するデータ生成部とを備える構成である。
本発明の各態様に係る書物電子化装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記書物電子化装置が備える各部(ソフトウェア要素)として動作させることにより上記書物電子化装置をコンピュータにて実現させる書物電子化装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1、2 書物電子化装置
11 位置指定部
12 面特定部(領域特定部)
13 データ生成部
14 前処理部

Claims (7)

  1. 書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定するステップと、
    上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するステップとを含むことを特徴とする書物電子化方法。
  2. 上記3次元データにおける、上記ページの一点に対応する初期点を指定するステップを含み、
    上記ページ領域を特定するステップでは、上記3次元データから、上記初期点に繋がる上記ページ領域を特定することを特徴とする請求項1に記載の書物電子化方法。
  3. 上記3次元データにおいて線状の経路を指定するステップを含み、
    上記初期点を指定するステップでは、上記経路におけるデータ値に基づき、上記経路と上記ページ領域とが交差する点を、上記初期点として指定することを特徴とする請求項2に記載の書物電子化方法。
  4. 上記ページ領域を特定するステップでは、上記シートのデータ値と上記シートの隙間のデータ値とを分ける閾値に対応する等値面を特定することを特徴とする請求項1から3のいずれか一項に記載の書物電子化方法。
  5. 上記3次元データに対して微分演算をすることにより、微分された3次元データを生成するステップを含み、
    上記初期点を指定するステップでは、上記微分された3次元データにおける値に基づき、上記初期点を指定することを特徴とする請求項2または3に記載の書物電子化方法。
  6. 書物のシートおよび上記シートの隙間に応じたデータ値を有する上記書物の3次元データを用いて、上記3次元データにおける、上記書物のページに対応するページ領域を特定する領域特定部と、
    上記ページ領域における文字列または図形を2次元平面にマッピングすることで、上記書物に書かれた文字列または図形を含む2次元ページデータを生成するデータ生成部とを備えることを特徴とする書物電子化装置。
  7. 請求項6に記載の書物電子化装置における、上記領域特定部、および上記データ生成部としてコンピュータを機能させるための制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2017563865A 2016-01-28 2017-01-27 書物電子化方法および書物電子化装置 Expired - Fee Related JP6432871B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016014858 2016-01-28
JP2016014858 2016-01-28
PCT/JP2017/003014 WO2017131184A1 (ja) 2016-01-28 2017-01-27 書物電子化方法および書物電子化装置

Publications (2)

Publication Number Publication Date
JPWO2017131184A1 true JPWO2017131184A1 (ja) 2018-09-20
JP6432871B2 JP6432871B2 (ja) 2018-12-05

Family

ID=59398113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017563865A Expired - Fee Related JP6432871B2 (ja) 2016-01-28 2017-01-27 書物電子化方法および書物電子化装置

Country Status (4)

Country Link
US (1) US10496904B2 (ja)
JP (1) JP6432871B2 (ja)
CN (1) CN108496204B (ja)
WO (1) WO2017131184A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019139505A (ja) * 2018-02-09 2019-08-22 シャープ株式会社 電子化装置および電子化方法
JP2019144702A (ja) 2018-02-16 2019-08-29 シャープ株式会社 書物電子化装置および書物電子化方法
JP6746634B2 (ja) * 2018-06-25 2020-08-26 シャープ株式会社 書物電子化装置および書物電子化方法
JP6840701B2 (ja) 2018-06-25 2021-03-10 シャープ株式会社 書物電子化装置および書物電子化方法
JP6797869B2 (ja) * 2018-08-08 2020-12-09 シャープ株式会社 書物電子化装置および書物電子化方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6426748B1 (en) * 1999-01-29 2002-07-30 Hypercosm, Inc. Method and apparatus for data compression for three-dimensional graphics
JP5551957B2 (ja) 2010-03-31 2014-07-16 富士フイルム株式会社 投影画像生成装置およびその作動方法、並びに投影画像生成プログラム
US8457403B2 (en) * 2011-05-19 2013-06-04 Seiko Epson Corporation Method of detecting and correcting digital images of books in the book spine area
JP6399840B2 (ja) * 2014-07-22 2018-10-03 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US9588651B1 (en) * 2014-09-24 2017-03-07 Amazon Technologies, Inc. Multiple virtual environments
JP2017054285A (ja) * 2015-09-09 2017-03-16 ルネサスエレクトロニクス株式会社 スキャンシステム、端末装置及びスキャン方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VITO MOCELLA ET AL.: "Revealing letters in rolled Herculaneum papyri by X-ray phase-contrast imaging", NATURE COMMUNICATIONS, JPN7018003494, 2015, pages pp. 1-6 *

Also Published As

Publication number Publication date
JP6432871B2 (ja) 2018-12-05
US20180322372A1 (en) 2018-11-08
CN108496204A (zh) 2018-09-04
CN108496204B (zh) 2020-03-10
WO2017131184A1 (ja) 2017-08-03
US10496904B2 (en) 2019-12-03

Similar Documents

Publication Publication Date Title
JP6432871B2 (ja) 書物電子化方法および書物電子化装置
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
CN100502454C (zh) 图像处理装置及其方法
JP5854802B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
AU2009217445A1 (en) Fast line linking
JP2007183742A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2010187376A (ja) 文書画像サイズ変更方法
Dambrogio et al. Unlocking history through automated virtual unfolding of sealed documents imaged by X-ray microtomography
Yu et al. Artificial intelligence for Dunhuang cultural heritage protection: the project and the dataset
Pintus et al. State‐of‐the‐art in Multi‐Light Image Collections for surface visualization and analysis
JPH1075351A (ja) テキストのバイナリー画像から抽出されたシンボルを比較する方法
US9619700B2 (en) Image processing device, image processing method, program, and information storage medium
Zhu et al. Seamless Satellite‐image Synthesis
Pal et al. Interactive exploration and flattening of deformed historical documents
Kim et al. Interactive tree modeling and deformation with collision detection and avoidance
Lin et al. Scale-aware black-and-white abstraction of 3D shapes
KR101768913B1 (ko) 지리 정보 데이터 분할 방법, 분할 장치 및 이를 수행하는 프로그램을 기록하는 기록매체
Obrador Automatic color scheme picker for document templates based on image analysis and dual problem
Morita et al. Inscription segmentation using synthetic inscription images for text detection at stone monuments
Xing et al. Automated quadrilateral mesh generation for digital image structures
Hossain et al. On the benchmarking of ResNet forgery image model using different datasets
JP7477663B2 (ja) 学習装置、学習方法及び学習プログラム
JP6797869B2 (ja) 書物電子化装置および書物電子化方法
JP7108955B2 (ja) ノート
CN110827192B (zh) 书籍电子化装置以及书籍电子化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180612

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180612

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181026

R150 Certificate of patent or registration of utility model

Ref document number: 6432871

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees