JP5205028B2 - 手書き注釈管理装置およびインタフェース - Google Patents

手書き注釈管理装置およびインタフェース Download PDF

Info

Publication number
JP5205028B2
JP5205028B2 JP2007267345A JP2007267345A JP5205028B2 JP 5205028 B2 JP5205028 B2 JP 5205028B2 JP 2007267345 A JP2007267345 A JP 2007267345A JP 2007267345 A JP2007267345 A JP 2007267345A JP 5205028 B2 JP5205028 B2 JP 5205028B2
Authority
JP
Japan
Prior art keywords
annotation
information
handwritten
document
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007267345A
Other languages
English (en)
Other versions
JP2009098763A (ja
Inventor
康介 小西
尚司 池田
直広 古川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007267345A priority Critical patent/JP5205028B2/ja
Publication of JP2009098763A publication Critical patent/JP2009098763A/ja
Application granted granted Critical
Publication of JP5205028B2 publication Critical patent/JP5205028B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Machine Translation (AREA)

Description

本発明は手書き注釈を含む文書管理装置における手書き注釈の重要度を計算する技術に関する。
近年文書への手書きメモを電子化する技術が普及している。その一つとしてタブレットPCが挙げられる。これはペンデバイスを備えたパーソナルコンピュータであり、ペンデバイスでディスプレイ上に描いた内容を電子的に取り込むことができる。上記技術のもう一つ例としてデジタルペンが挙げられる。これは紙に印刷された細かなドットをペンに内蔵されたカメラで読み取ることで、紙への手書きメモを電子化することができる。
またこれらのデバイスの普及に伴い、電子化された手書きメモを文書への注釈として文書情報と一緒に管理する技術も普及している。例えばMicrosoft社が開発したMicrosoft Office 2007では、タブレットを用いてワープロ文書やプレゼンテーション文書に手書きメモを追加して保存することができる。また特許文献1では、電子文書と紙上への手書きメモを一緒に管理する技術が開示されている。これらの技術によって、文書への手書き注釈を電子的に保存して管理することが可能になった。
これらの技術を背景に、近年文書への手書き注釈を解析して情報表示や検索に利用する技術が注目されている。官公庁や企業の業務では、下線や丸囲みなどを書き込むことによって、文書中の重要な部分を記録することが行われている。このような手書き注釈の記録は業務における重要な知識を含んでいることが多いので、それを電子的に管理して検索したり閲覧したりすることは有用である。これを実現する場合、管理される注釈の数は膨大になるので、検索において重要なものを優先的に提示することが重要となる。すなわち単語列からなる検索クエリーに対してそれぞれの注釈の重要度を計算する手段が重要である。
このような手書き注釈の検索を実現するものとして、記入内容や文書内容にもとづき手書き注釈情報に重要度をつけて検索する技術が提案されている。例えば非特許文献1では、検索キーワードと手書き注釈を記入した箇所付近のテキストとの類似度によって重要度を計算する手法が提案されている。また特許文献2では、手書き注釈を記入した部分の文書内容の語句の重要度によって手書き注釈の重要度を計算する手段が開示されている。また特許文献3では、特定の文書の範囲を指定してその範囲に記入された手書き注釈のみを検索する手段が開示されている。これらの手段によって、注釈をつけた文書のテキスト内容をもとに注釈情報を検索することが可能になる。
特開2005-135211 特開2004-206654 特開2004-199484 特開2006-301695 Gene Golovchinsky, Morgan N. Price, and Bill N. Schilit," FromReading to Retrieval:Freeform Ink Annotations as Queries" Proceedings of ACM SIGIR 99, ACM Press, pp. 19−25, 1999.
しかしながら、業務においては色々な箇所の似たような文章に下線などが記入される場合が多く、前記のような語句の類似度や重要度による注釈の重要度計算手段では、似たような文章につけられた注釈をうまく区別できない。また業務においては、ある文書の一部分と別の文書の一部分との対応関係や、その対応関係の強さの度合いなどを注釈によって明示的に記録することがある。このような記録は作業者の作業における過程や知識を表現するものであり、注釈情報を検索する場合に活用すれば従来のテキスト内容に基づく検索手法よりも一層効率のよい検索ができることが期待される。
このような注釈による対応関係の情報を活用するものとして、特許文献4では文書中に着けられた手書きの追記マークを解釈し、マークの種類ごとに文書の内容を並べて表示する技術が開示されている。しかしながらそれはあくまで一文書内の手書き注釈の表示方法に関するものであり、注釈情報が大量に記録された中から検索によって効率的に情報を取り出すことに関する技術ではない。
そこで本発明では、手書き注釈情報を含む文書管理装置において、注釈情報を検索する際にユーザによる注釈間の対応付け情報を利用して検索結果を出力することで、テキスト内容には表れないユーザの作業過程の知識を活用して注釈情報を探すことが可能な注釈検索手段を提供する。
上記課題を解決するため、本発明は、以下のように文書管理システム、検索システム、検索方法を提供する。
文書管理システムであって、文書に対し手書きされた手書き情報を電子的に取得する手段と、取得された前記手書き情報から、対象の文章の範囲と当該文章へのマークを抽出し注釈情報データベースに登録する注釈情報解析手段と、前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる手書き情報であって、前記マークに対応するマークが手書きされている文書から対象の文章の範囲を抽出し、対比注釈として対比注釈情報データベースに登録する対比注釈登録部とを有することを特徴とする。
さらに、前記対比注釈登録部は、前記手書き情報から、対比注釈に対する評価情報を取得して、前記対比注釈データベースに登録することを特徴とする
さらに、前記対比注釈に対する評価情報として、手書きされる評価記号とその評価値の組合せが登録された評価値データベースを有することを特徴とする。
さらに、前記対比注釈登録部は、対応するマークが手書きされている文書中の対象の文章の範囲同士で、共通語及び差異語を抽出して対比注釈情報データベースに登録することを特徴とする。
さらに、前記共通語及び差異語の抽出は、それぞれの文章における特徴語を抽出し、特徴語同士を比較することにより抽出することを特徴とする文書管理システム。
また、検索システムであって、電子的に取得された文書への手書き情報であって、対象の文章の範囲と当該文章へのマークが登録された注釈情報データベースと、前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる情報であって、前記マークに対応するマークが手書きされている文書から抽出された対象の文章の範囲が対比注釈として登録された対比注釈情報データベースと、キーワードの入力を受け付ける手段と、入力された前記キーワードを含む文章を前記注釈情報データベースから検索する注釈検索部と、前記検索部によって検索された文章とその文章に対応する対比注釈が登録されている文章とを前記対比注釈情報データベースから抽出し、前記対比注釈の重要度を計算する注釈評価部と、前記注釈評価部によって計算された重要度に基づいて、抽出された文章への手書き情報を表示する表示手段とを有する特徴とする。
さらに、前記対比注釈情報データベースは、前記手書き情報から取得された前記対比注釈に対する評価情報を有し、前記注釈評価部は、前記評価情報の重要度に基いて抽出された文章の組を並べ替え、前記表示手段に前記並べ替えの順で前記手書き情報を表示することを特徴とする。
また、検索キーワード入力手段、検索手段、表示手段、データベースを用いた検索方法であって、前記データベースは、電子的に取得された文書への手書き情報であって、対象の文章の範囲と当該文章へのマークが登録された注釈情報データベースと、前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる情報であって、前記マークに対応するマークが手書きされている文書から抽出された対象の文章の範囲が対比注釈として登録された対比注釈情報データベースとを有し、前記入力手段が検索キーワードの入力を受け付け、前記検索手段が、入力された前記キーワードを含む文章を前記注釈情報データベースから検索し、検索された文章とその文章に対応する対比注釈が登録されている文章とを前記対比注釈情報データベースから抽出し、前記対比注釈の重要度を計算し、前記表示部が、計算された重要度に基づいて、抽出された文章への手書き情報を表示することを特徴とする検索システム。
これにより、テキストの内容が似通った手書き注釈だけでなく、その注釈内容と関係性があると過去に作業者によって判断された部分の注釈に対しても適切に重要度を割り当てることができ、過去の作業知識を利用して重要な注釈を優先的に検索することが可能になる。
また、本発明では、業務フローおよび該業務フローに含まれる文書の集合を管理し、同一業務フロー内の文書に記入された同一マークを持つ注釈の組を検出することで、記入者が意図した注釈の対応付けを抽出することができる。
また本発明では、検索クエリーとテキストの整合性が高い注釈だけでなく、そのような注釈と対比関係によって結び付けられている注釈の重要度を高めることによって、テキスト内容だけでなく記入者の意図を反映して重要度を計算する手法を提案する。
また本発明では、検索結果として出力された注釈情報をリスト形式に表示するだけでなく、注釈の対比関係を重要度順にリスト形式に表示したり、注釈の対比関係をネットワーク状に表示したりすることによって、過去の記入者が記した注釈間の関係を可視化する手法を提案する。
本発明によれば、企業内で大量に蓄積された文書情報の中から、記入者が関係あると明示的に記した文書内容の組を抽出し、その関係性を用いてテキスト内容によらない尺度によって重要な文書情報を優先的に探し出せるようになる。
本発明の実施形態にかかる情報管理装置の構成について図1に従い述べる。本発明の実施例としての情報管理装置は、情報管理サーバ101と情報管理クライアント102からなる。
情報管理サーバ101は本装置を使用するユーザの情報を格納するユーザ情報DB103、文書の情報を格納する文書情報DB104、文書に書き加えられた手書きを格納するストローク情報DB105、ストロークと文書内容を解析して下線や丸囲みであるというストロークの形状やどの部分に下線が引かれているかという注釈内容を格納する注釈情報DB106、業務フローとその中で利用される文書の情報を格納する業務フロー情報DB107、記入者が意図したと考えられる注釈間の対応づけを格納する対比注釈情報DB108、注釈に対して記入者が明示的に評価をつける際の評価記号と評価値の対応付けを格納する評価値DB130、クライアントから記入データを受け取りストローク情報DBや注釈情報DBにデータを格納する記入データ登録部109、クライアントから検索クエリーを受け取り注釈情報のリストを返信する注釈情報検索処理部110から構成される。記入データ登録部109は、ストローク情報DBに情報を格納するストローク情報登録部120、下線や丸囲みなどの手書きの形状やその対象となる文章を解析して注釈情報DBに情報を格納する注釈解析・登録部121、追記マークなどをもとに注釈間の対応関係を抽出して対比注釈情報DBに情報を格納する対比注釈登録部122で構成される。注釈情報検索処理部110は、検索クエリーのテキストを内容として含む注釈情報を取得するキーワードによる注釈検索部123、注釈情報や対比注釈情報の内容をもとに検索クエリーに対する注釈情報の重要度を計算する注釈評価部124、重要度をもとに注釈情報を並び替えて検索結果としてクライアントに出力する検索結果生成部125で構成される。
情報管理クライアント102は、各ユーザがこれを用いて文書への手書き注釈を電子化したり注釈情報を検索して閲覧したりするための端末であり、ペンデバイスから記入データを読み取りサーバに送信する記入データ読み込み部111、ユーザから検索クエリーを受け取ってサーバに送信してサーバから返信される結果を画面にリスト形式で表示する注釈情報検索部112から構成される。クライアントにはペンデバイス113が接続され、文書への記入を電子化したものを読み取ることができる。
最初に、情報管理サーバにおける情報管理の形式を図2から図5に示す。
ユーザ情報DB103の管理形式を、図2を用いて説明する。ユーザ情報は、それぞれのユーザに固有に割り当てられるユーザID201、ユーザ名202から構成される。
文書情報DB104の管理形式を、図3を用いて説明する。文書情報は、それぞれの文書に固有に割り当てられる文書ID301、文書を作成したユーザを表す作成ユーザID302、作成日時303、更新日時304、文書の電子ファイルを格納する電子文書データ305、文書のページ数306、文書インスタンスIDリスト307から構成される。文書インスタンスIDは当該文書に記入を行う際の記入対象となる中間データで、同一文書に別々のユーザが書き込んだ場合に、それらを分割しつつ同一の文書に書き込んだということを管理するためのものである。例えば別々のユーザがそれぞれある文書に記入をしたい場合は、それぞれ別々の文書インスタンスを生成して書き込みを行う。
ストローク情報DB105の管理形式を、図4を用いて説明する。ストローク情報は、それぞれのストロークに固有に割り当てられるストロークID401、ストロークを記入した文書インスタンスのID402、ストロークを記入したページ番号403、ストロークを記入したユーザのID404、記入開始時刻405、サンプリング点数406から構成され、さらにストロークを構成するサンプリング点のリストへのポインタ407を持つ。サンプリング点はX座標408、Y座標409、差分時刻410から構成される。ストローク情報はサンプリング点のリストによりストロークの形状を保持するだけでなく、記入者や記入時刻などの情報も併せて保持する。
注釈情報DB106の管理形式を、図5を用いて説明する。注釈情報は、それぞれの注釈に固有に割り当てられる注釈ID501、注釈を記入したユーザのID502、注釈を構成するストロークのIDのリスト503、該注釈の一部であり記入者が該注釈に割り当てたとみなすマーク504、下線や丸囲みなどの注釈の形状505、下線が引かれた文章や丸囲みされた文章など注釈が記入された対象となる文章を格納する被注釈文字列506から構成される。510は注釈の例である。510は下線によって文書内容の範囲が選択されており、さらに左上に「1a」という記号が記入されている。本装置はこのようなストロークから下線と「1a」というマークを検出し、注釈情報として登録する。
業務フロー情報DB107の管理形式を、図6を用いて説明する。業務フロー情報は、それぞれの業務フローに固有に割り当てられる業務フローID601、業務フローの開始日時602と終了日時603、および業務フローに含まれる文書情報604の集合から構成される。業務フローに含まれる文書情報604は、該当する文書インスタンスID605、該当する業務フローID606、該業務フローにおいて該文書より先に作成もしくは利用される文書である親文書インスタンスのID606、該業務フローにおいて該文書より後に作成もしくは利用される文書である子文書インスタンスのID607から構成される。業務フロー内の文書情報の集合は、親子関係によって図6に示すようなネットワーク構造を持つ。
対比注釈情報DB108の管理形式を、図7を用いて説明する。対比注釈情報は、検出されたそれぞれの対比注釈に固有に割り当てられる対比注釈ID701、対比注釈を構成する注釈のIDの組702、記入者が明示的に示した該対比注釈の評価値703、二つの注釈の被注釈文字列の間の共通語のリスト704、二つの注釈の被注釈文字列の間の差異語のリスト705、706から構成される。注釈710と注釈711の組は対比注釈の例である。注釈710は縦括弧によって範囲選択がされており、その左上に「1a」というマークが記入されている。注釈711は下線によって範囲選択がされており、その左上に「1a」というマークが記入されている。さらにこれらの注釈が記入された文書インスタンスは同一業務フローに属している。この時本装置は両注釈のマークが同一であることを検出し、その組を対比注釈として対比注釈DBに登録する。
次に、ユーザがペンで文書に注釈を記入した時の情報登録処理を図8から図10を用いて説明する。まず情報登録処理の全体の流れを、図8を用いて説明する。ユーザ807がペンデバイス808を使って文書インスタンス809に記入した場合、クライアント801の記入データ読み込み部はペンデバイスからストロークの座標や時刻の情報を取得し、ストローク情報802を生成してサーバ803に送信する。この時ペンデバイスとしてペンタブレットやタブレットPCなどを用いてもよいし、Anotoデジタルペンのような紙に直接記入するペンデバイスを用いてもよい。サーバは送信されたストローク情報を受け取ると、ストローク情報登録部804においてストローク情報をストローク情報DBに登録し、次に注釈解析・登録部805においてストロークの形状を解析してその結果を注釈情報DBに登録する。最後に対比注釈登録部806において、同一業務フロー内の文書インスタンスに記入された注釈でマークが同じものを取得して対比注釈情報DBに登録する。これによってユーザが注釈を記入するたびに、どの部分に下線を引いたかなどという情報やユーザが明示的に示した注釈の対応関係が自動的にサーバに登録される。
情報登録処理における注釈解析・登録部のフローチャートを図9に示す。注釈解析・登録部は、ステップ901においてクライアントから送信されたストローク情報を受け取り、ステップ902において線や丸囲みなどストロークの形状を認識する。ステップ902において、下線や丸囲みなどあらかじめ設定された注釈形状が認識されれば、ステップ903の条件分岐によってステップ904に進む。もし注釈形状が認識されなかった場合は注釈解析・登録部が終了になる。ステップ904においては、ストロークの形状と文書内容の位置情報を比べ合わせ、注釈が覆っている範囲を検出する。例えば下線の場合は、下線の座標と文書テキストの座標から、どの文章に下線が引かれているかを検出する。ステップ905では注釈の識別子として記入された記号をマークとして検出する。ステップ906では注釈形状や注釈範囲およびマークの情報を注釈情報として注釈情報DBに登録する。
情報登録処理における対比注釈登録部のフローチャートを図10に示す。対比注釈登録部は、ステップ1001において注釈解析・登録部で登録された注釈情報1を取得し、ステップ1002において注釈情報1が記入された文書インスタンスの情報を取得し、さらに該文書インスタンスが属する業務フローの情報を取得する。次にステップ1003において該業務フローに属する全ての文書インスタンスに記入された全ての注釈情報を取得し、ステップ1004でそれらの注釈情報の中からマークが注釈情報1と同一であるものを全て取得する。ステップ1005では注釈情報1とステップ1004で取得した注釈情報との組を対比注釈として対比注釈情報DBに登録する。ステップ1006ではユーザが記入した対比注釈に対する評価情報から、対比注釈の評価値を設定する。ここでの評価値記入方法は、例えば余白にマークの記号と評価記号を並べて記入することによって行うことができる。ここで、図21に示すように、評価記号が表す評価値については、評価記号と合わせて予め評価値DBに登録させておいてもよい。最後にステップ1007で対比注釈における二つの注釈の共通・差異語をテキスト処理によって抽出する。ここで共通・差異語抽出は、例えばまず注釈の被注釈文字列から一般的なテキスト処理によって特徴語を抽出し、それらが二つの注釈で共通に表れているか否かをみることによって実現できる。
対比注釈登録部のステップ1006における評価記号記入方法の例を図11に示す。この例では文書インスタンス1101に注釈1103が、文書インスタンス1102に注釈1104が記入されており、これらはそれぞれ「1a」という同一のマークを持ち対比注釈として登録される。さらに文書インスタンス1102の余白には対比注釈の評価情報1105が記入されている。この時本装置はこのような記述を文字認識によって検出し、「1a」というマークに対して「x」という評価がされているとみなす。ここで評価記号xにあらかじめ割り当てた値を該対比注釈の評価値として設定する。また図11の例では「2b」というマークを持つ対比注釈に対しては評価記号yに対応する評価値を設定することになる。なお、ここでは文書の余白にマークの種類ごとにまとめて評価記号を記入したが、それぞれの注釈の側に個別に評価記号を書き込むような方式をとってもよい。この記入された記号に従って、評価値が登録される。登録される際に、評価値を図7にある通り数値で登録してもよい。このようにユーザの記入によって注釈の評価値を登録することで、注釈検索時に記入者の意図をより反映させて注釈の重要度を計算することができる。
上記の対比注釈に対する評価は、データベースに評価値が登録された後に変更することもできる。文書インスタンスへの追記による評価変更の例を図12に示す。この例では以前に余白に記入した評価記号に斜線を引き、その上に新たな評価記号を記入している。本装置はこの斜線および評価記号を文字認識により検出し、データベースの該当するマークに関する対比注釈の評価値を変更登録する。 また評価変更は文書インスタンスへの記入だけでなくPCの画面などからキーボード入力で行ってもよい。その例を図13に示す。本例では画面1301にある業務フローに属する文書インスタンスとそこに記入されたマークが表として表示されている。表の各欄には該当文書インスタンスに記入された該当マークに対する評価記号が表示されている。例えば文書D0032154には項目1aに対してXという評価記号が、項目2b、3c、4dに対してはYという評価記号が記入されていることを表している。またそれぞれの文書に対して全ての項目の評価記号が記入されるわけではなく、例えば文書D0032162には項目1aに関する評価記号が記入されていないため該当する欄が空白になっている。ユーザはPCの画面から各欄の値を変更することができ、その場合本装置は対比注釈情報DBに登録されている対応する対比注釈の評価値を修正する。図13の例では文書D0032154での項目1aに対する評価記号をXからYに修正しており、それに応じて対応する対比注釈情報の重要度が、評価記号Xに割り当てられた評価値2.0から評価記号Yに割り当てられた評価値1.0に変更されている。対比注釈登録ステップ1006における共通・差異語抽出部のフローチャートを図14に示す。共通・差異語抽出部は、ステップ1401において対象となる注釈情報1、2を取得し、ステップ1402においてそれぞれの注釈情報の被注釈文字列から特徴語を抽出する。この特徴語抽出は通常用いられるような辞書による方式やTF−IDFなどの単語出現頻度による方式などを用いて実現できる。次にステップ1403において抽出されたそれぞれの特徴語の中から両者の注釈に共通な語を共通語として対比注釈情報に登録する。またステップ1404においては注釈情報1の被注釈文字列における特徴語であり注釈情報2の被注釈文字列に出現しないものを差異語1として対比注釈情報に登録し、同様にステップ1405においては注釈情報2の被注釈文字列における特徴語であり注釈情報1の被注釈文字列に出現しないものを差異語2として対比注釈情報に登録する。これらの共通語や差異語はテキスト検索におけるキーとなるが、対比注釈における二つの注釈の関係を特徴づけるものとしても有用である。
以上が手書き情報登録部の処理の流れである。手書き情報登録部の結果としてどのような文書に下線や丸囲みを記入したかを表す注釈情報や、記入者はどの部分が関係深いと考えているかを表す対比注釈情報が得られる。これらの情報によって、検索において単純なテキストの類似性を比べるだけでは得られない効果が得られることが期待できる。その例を図15で示す。
3つの文書の部分1501、1502、1503の内容を見ると、これらの内容はそれぞれ類似性が高いにもかかわらず、1501と1502は「特徴語」「抽出」という共通単語を含むので類似性が高いとみなされるが、1503は共通単語を含まないのでこれら二つの文書とは類似性が低いとみなされてしまう。よって例えば「特徴語」というキーワードで検索した場合1501、1502は取得できるが1503は取得できない。一方本発明のように手書き注釈から文書間の対応付けを見つけ出しておけば、もし1504、1505、1506に関連性があると誰かが注釈を記入していた場合には、テキスト内容の類似性に関係なくこれらの文書間の関係を取得することができる。そのような手書き注釈は記入者が判断して記入したものなので、それらが実際に関係深い可能性は高いといえる。このような状態では、例えば「特徴語」というキーワードで検索した場合1504、1505だけでなく1506の文書もこの対応関係をもとに取得することができる。このように、本発明による手法によって表記のゆれや語句の違いがあったとしても、作業者の過去の思考・知識を利用して検索を効率化できる効果が得られる。 次に、ユーザがサーバで管理されている注釈情報を検索する処理を図16から図20を用いて説明する。
まず検索処理の全体の流れを、図16を用いて説明する。ユーザがクライアントの注釈検索部に検索クエリー1601を入力すると、注釈検索部はその検索クエリーをサーバに送信する。検索クエリーはキーワードとなる単語列で構成される。サーバは検索クエリーを受け取ると、まずキーワードによる注釈検索部1602によって検索クエリーの単語列に含まれる単語を被注釈文字列に含むような注釈情報を全て取得する。次に注釈評価部1603において、それぞれの注釈の重要度およびこれらの注釈と対応関係にある注釈の重要度を計算する。最後に検索結果生成部1604において、キーワードによる注釈検索部1602によって得られた注釈情報を注釈評価部1603において得られた重要度の順に並べ直し、その上位N件のリスト1605を検索結果としてクライアントに送信する。クライアントは検索結果を受け取ると、注釈の形状や文書の内容を含めて注釈情報を画面にリスト表示する。ここで注釈評価部ではユーザの評価や時間の情報などテキストの情報以外を用いて重要度を計算しており、単なるキーワードによる類似性では得られなかった関連性に関する情報を取得することができる。
上記検索処理における注釈評価部のフローチャートを図17に示す。注釈評価部は、ステップ1701において重要度を計算する対象となる注釈情報を受け取り、ステップ1702において該注釈情報の重要度を計算する。ここで注釈情報の重要度は検索キーワードと被注釈文字列との類似度をもとに計算してもよいし、さらに対比注釈を優先的に検索したい場合は該注釈情報を含む対比注釈情報の数が多いものの重要度を高くするようにしてもよい。また検索者が人や日時の条件を指定して、それらの条件に近い記入者や記入日時を持つ注釈情報の重要度を高めるようにしてもよく、それによって関係の深い人や期間に記入されたものを優先的に検索するといったことも可能になる。具体的な重要度計算方法の例を示すと、検索キーワードと被注釈文字列との類似度をコサイン距離で計算した値をd、該注釈情報を含む対比注釈情報の数をn、該注釈情報の記入時刻をt1、検索条件として指定された日時をt2、該注釈情報の記入者のユーザIDをu1、検索条件として指定されたユーザのIDをu2として、該注釈情報の重要度を適当な係数a1〜a4を定めてa1×d+a2×n+a3×|t1―t2|+a4×eq(u1,u2)という式で計算することができる。ここで関数eqは二つの引数が等しい場合は1を、そうでない場合は0を返すとする。重要度計算では上記の方法以外に、検索キーワードと被注釈文字列との類似度をコサイン距離以外の方法で求めることもできるし、重要度の計算式を単純な足し合わせではなく2次関数や平方根などのより複雑な計算式を用いることもできる。次にステップ1703において該注釈情報を含む対比注釈情報を全て取得し、最後にステップ1704において、ステップ1703で取得した対比注釈情報に含まれる全ての注釈情報の重要度を計算する。ここでこれらの注釈情報の重要度はステップ1702で計算した重要度をもとに計算するが、さらに対比注釈の評価値などを加味してもよい。また対比注釈の共通語・差異語の性質を重要度計算に反映させてもよい。例えば検索者が指定した検索キーワードが対比注釈の共通語に含まない場合に重要度を高めてもよく、これによって検索者が指定した検索キーワードの内容と関係が深いと記入者が判断したにも関わらず検索キーワードを直接含んでいないためにステップ1702において重要度が低くなってしまうような部分の重要度を高めることができる。このような計算の具体的な方法の例を示すと、ステップ1702で計算した注釈情報の重要度をv、対比注釈の評価値をe、検索キーワードと対比注釈の共通語との間に共通の単語が含まれているかどうかを現す値をc(共通単語が含まれていればc=0、そうでなければc=1)として、該注釈情報の重要度を適当な係数b1〜b3を定めてb1×v+b2×e+b3×cという式で計算することができる。また対比注釈の差異語の量が多い場合に重要度を高くしてもよく、これによってもステップ1702における単純なテキスト検索では重要度が低くなってしまうような部分の重要度を高める効果が得られる。これによって、テキスト検索で引っかかった注釈だけでなく、記入者がそれらと関係があると判断した注釈も検索結果に含めることができる。
最後に検索結果の出力形態の例を図18に示す。ここでは注釈の重要度の順番に、注釈付近の文書内容をリスト表示している。さらに対比注釈がある場合には対応付けられた注釈も並べて表示することで、どのような意図でその注釈が付けられたかを分かりやすくしている。この例では「アルミニウム」と「混合」という検索キーワードで検索を実行している。この検索キーワードを受け取ると、サーバの注釈検索部1602でキーワード検索によって注釈情報1804、1805、1806が抽出され、注釈評価部のステップ1702においてその重要度が計算される。さらに注釈評価部のステップ1703、1704によって対比注釈によってそれらと関係付けられた注釈情報1807、1808が抽出されてそれらの重要度も計算される。そして検索結果生成部1604において、対比注釈によって関係付けられた注釈情報があるならばそれらをペアにして、抽出された注釈情報の重要度の高い順に並び替えて出力する。検索結果を見ると、注釈情報1807には「アルミニウム」「混合」という単語は含まれていないにも関わらず、関係のある内容であると判断されて検索できている。
本検索機能によって、表記のゆれに強い検索が実現できることを図19の例を用いて説明する。図19は「パーソナルコンピューター」という検索キーワードで注釈検索を実行した結果を表している。二つの検索結果はそれぞれ「パーソナルコンピューター」という単語を含む注釈であるが、それぞれに対比注釈によって関係づけられている注釈は「個人用計算機」、「ワードプロセッサー」と「パーソナルコンピューター」という単語が含まれていないものが表示されている。これらの単語は類義語であり関連性が高いのはもちろんであるが、従来のテキスト検索では検索結果として出力することはできなかった。本手法では過去にこれらの関連性に注目した人がいれば、これらの関係性を取得することができる。
また検索結果をリスト表示ではなく、文書をノード、対比注釈関係をエッジとするグラフ構造で表示する検索結果出力例を図20に示す。ここでは、ユーザによって入力された評価値に基き、類似性が高い場合にはエッジを短くしてノード間の距離を短くして表示してもよい。図12,13で示したような注釈の訂正があった場合には、重要度に応じたリンク付けの表示を変えた表示にしなおしてもよい。このような表示方法によって、各注釈間の関係をより簡潔に概観することが可能になる。
本発明の実施形態である情報管理装置10の構成図である。 同情報管理装置10におけるユーザ情報DB103の情報格納形式である。 同情報管理装置10における文書情報DB104の情報格納形式である。 同情報管理装置10におけるストローク情報DB105の情報格納形式である。 同情報管理装置10における注釈情報DB106の情報格納形式である。 同情報管理装置10における業務フロー情報DB107の情報格納形式である。 同情報管理装置10における対比注釈情報DB108の情報格納形式である。 同情報管理装置10における記入データ登録処理の全体の流れを示す図である。 記入データ登録処理における注釈解析・登録部の処理の流れを示すフローチャートである。 記入データ登録処理における対比注釈登録部の処理の流れを示すフローチャートである。 対比注釈情報に対する評価記号の記入例を示す図である。 対比注釈情報に対する評価記号を手書きによって訂正する例を示す図である。 対比注釈情報に対する評価記号をPC画面から訂正する例を示す図である。 対比注釈登録部における共通・差異語抽出部の処理の流れを示すフローチャートである。 対比注釈情報を管理することによる効果を説明する図である。 情報管理装置10における注釈情報検索処理の全体の流れを示す図である。 注釈情報検索処理における注釈評価部の処理の流れを示すフローチャートである。 注釈情報検索処理における検索結果のリストによる出力例を示す図である。 対比注釈を管理することによる注釈情報検索に対する効果を説明する図である。 注釈情報検索処理における検索結果のグラフ構造による出力例を示す図である。 情報管理装置10の評価値DB130の情報格納形式である。
符号の説明
10…情報管理システム、101…情報管理サーバ、102…情報管理クライアント、103…ユーザ情報DB、104…文書情報DB、105…ストローク情報DB、106…注釈情報DB、107…注釈登録部、108…注釈検索処理部、109…注釈検索部、110…記入データ読み込み部、111…ペンデバイス。

Claims (14)

  1. 文書に対し手書きされた手書き情報を電子的に取得する手段と、
    取得された前記手書き情報から、対象の文章の範囲と当該文章へのマークを抽出し注釈情報データベースに登録する注釈情報解析手段と、
    前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる手書き情報であって、前記マークに対応するマークが手書きされている文書から対象の文章の範囲を抽出し、対比注釈として対比注釈情報データベースに登録する対比注釈登録部とを有し、
    前記対比注釈登録部は、対応するマークが手書きされている文書中の対象の文章の範囲同士で、共通語及び差異語を抽出して対比注釈情報データベースに登録することを特徴とする文書管理システム。
  2. 請求項1に記載の文書管理システムであって、前記対比注釈登録部は、前記手書き情報から、対比注釈に対する評価情報を取得して、前記対比注釈データベースに登録することを特徴とする文書管理システム。
  3. 請求項2に記載の文書管理システムであって、さらに、前記対比注釈に対する評価情報として、手書きされる評価記号とその評価値の組合せが登録された評価値データベースを有することを特徴とする文書管理システム。
  4. 請求項3に記載の文書管理システムであって、前記共通語及び差異語の抽出は、それぞれの文章における特徴語を抽出し、特徴語同士を比較することにより抽出することを特徴とする文書管理システム。
  5. 請求項2に記載の文書管理システムであって、前記対比注釈登録部は、文書に対し記入された評価情報が変更された場合には、変更を前記対比注釈データベースに登録することを特徴とする文書管理システム。
  6. 請求項2に記載の文書管理システムであって、前記対比注釈データベースに登録された前記評価情報を変更するインターフェースを有することを特徴とする文書管理システム。
  7. 電子的に取得された文書への手書き情報であって、対象の文章の範囲と当該文章へのマークが登録された注釈情報データベースと、
    前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる情報であって、前記マークに対応するマークが手書きされている文書から抽出された対象の文章の範囲が対比注釈として登録された対比注釈情報データベースと、
    キーワードの入力を受け付ける手段と、
    入力された前記キーワードを含む文章を前記注釈情報データベースから検索する注釈検索部と、
    前記検索部によって検索された文章とその文章に対応する対比注釈が登録されている文章とを前記対比注釈情報データベースから抽出し、前記対比注釈の重要度を計算する注釈評価部と、
    前記注釈評価部によって計算された重要度に基づいて、抽出された文章への手書き情報を表示する表示手段と、を有し、
    前記対比注釈情報データベースは、対比注釈として、対応するマークが手書きされている文書中の対象の文章の範囲同士で抽出された共通語及び差異語が登録されることを特徴とする検索システム。
  8. 請求項7に記載の検索システムにおいて、前記重要度は、前記キーワードと前記文章の範囲における文字列との類似度であることを特徴とする検索システム。
  9. 請求項7に記載の検索システムにおいて、前記重要度は、前記対比注釈の情報量の多さであることを特徴とする検索システム。
  10. 請求項7に記載の検索システムにおいて、前記重要度は、前記業務フローの手書き入力者、日時の少なくとも一つ以上に基づくことを特徴とする検索システム。
  11. 請求項7に記載の検索システムにおいて、前記対比注釈情報データベースは、前記手書き情報から取得された前記対比注釈に対する評価情報を有し、前記注釈評価部は、前記評価情報の重要度に基いて抽出された文章の組を並べ替え、前記表示手段に前記並べ替えの順で前記手書き情報を表示することを特徴とする検索システム。
  12. 請求項7に記載の検索システムにおいて、
    前記重要度は、前記キーワードが前記共通語に含まれるか否かの値又は差異語の多さであることを特徴とする検索システム。
  13. 請求項7に記載の検索システムにおいて、前記対比注釈情報データベースは、前記手書き情報から取得された前記対比注釈に対する評価情報を有し、前記表示手段は、前記評価情報に基いて複数の前記手書き情報の組を2次元配置することを特徴とする検索システム。
  14. 検索キーワード入力手段、検索手段、表示手段、データベースを用いた検索方法であって、
    前記データベースは、
    電子的に取得された文書への手書き情報であって、対象の文章の範囲と当該文章へのマークが登録された注釈情報データベースと、
    前記手書き情報を取得したのと同じ業務フロー内で取得した、前記手書き情報とは異なる情報であって、前記マークに対応するマークが手書きされている文書から抽出された対象の文章の範囲が対比注釈として登録された対比注釈情報データベースとを有し、
    前記入力手段が検索キーワードの入力を受け付け、
    前記検索手段が、
    入力された前記キーワードを含む文章を前記注釈情報データベースから検索し、検索された文章とその文章に対応する対比注釈が登録されている文章とを前記対比注釈情報データベースから抽出し、前記対比注釈の重要度を計算し、
    前記表示部が、計算された重要度に基づいて、抽出された文章への手書き情報を表示し、
    前記対比注釈情報データベースは、対比注釈として、対応するマークが手書きされている文書中の対象の文章の範囲同士で抽出された共通語及び差異語が登録されることを特徴とする検索方法
JP2007267345A 2007-10-15 2007-10-15 手書き注釈管理装置およびインタフェース Expired - Fee Related JP5205028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007267345A JP5205028B2 (ja) 2007-10-15 2007-10-15 手書き注釈管理装置およびインタフェース

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007267345A JP5205028B2 (ja) 2007-10-15 2007-10-15 手書き注釈管理装置およびインタフェース

Publications (2)

Publication Number Publication Date
JP2009098763A JP2009098763A (ja) 2009-05-07
JP5205028B2 true JP5205028B2 (ja) 2013-06-05

Family

ID=40701733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007267345A Expired - Fee Related JP5205028B2 (ja) 2007-10-15 2007-10-15 手書き注釈管理装置およびインタフェース

Country Status (1)

Country Link
JP (1) JP5205028B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5422268B2 (ja) * 2009-06-19 2014-02-19 株式会社日立製作所 デジタルペンを用いた文書管理システムおよび文書管理方法
JP5444946B2 (ja) * 2009-08-26 2014-03-19 富士ゼロックス株式会社 筆記情報処理装置、筆記情報処理システム、及びプログラム
JP5683817B2 (ja) * 2010-01-07 2015-03-11 レノボ・イノベーションズ・リミテッド(香港) 携帯送信端末、携帯受信端末及び携帯送受信システム
JP5353872B2 (ja) * 2010-12-21 2013-11-27 カシオ計算機株式会社 情報表示装置及び情報表示プログラム
JP2014032632A (ja) 2012-08-06 2014-02-20 Toshiba Corp 電子機器、方法、およびプログラム
JP6303669B2 (ja) * 2014-03-19 2018-04-04 大日本印刷株式会社 資料検索装置、資料検索システム、資料検索方法、及び、プログラム
WO2017149711A1 (ja) * 2016-03-02 2017-09-08 株式会社日立製作所 文書管理装置および文書管理方法
JP6439738B2 (ja) * 2016-04-18 2018-12-19 カシオ計算機株式会社 画像処理装置及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4192729B2 (ja) * 2002-09-16 2008-12-10 富士ゼロックス株式会社 自由形式注釈を強調するための方法、注釈強調表示装置、及び自由形式注釈を強調するためのプログラム
JP2005182460A (ja) * 2003-12-19 2005-07-07 Canon Inc 情報処理装置、注釈処理方法、情報処理プログラムおよび情報処理プログラムを格納した記録媒体
JP2006301695A (ja) * 2005-04-15 2006-11-02 Fuji Xerox Co Ltd 文書処理装置およびプログラム

Also Published As

Publication number Publication date
JP2009098763A (ja) 2009-05-07

Similar Documents

Publication Publication Date Title
CN109992645B (zh) 一种基于文本数据的资料管理***及方法
JP5205028B2 (ja) 手書き注釈管理装置およびインタフェース
US9323731B1 (en) Data extraction using templates
US7519900B2 (en) System and method for processing digital annotations
US10423697B2 (en) User interface with navigation controls for the display or concealment of adjacent content
US9378205B1 (en) System and method for managing and sharing pharmaceutical clinical trial regulatory documents
JP4682284B2 (ja) 文書差分検出装置
US20080195657A1 (en) Context-based community-driven suggestions for media annotation
US20140245121A1 (en) Creating and Switching a View of a Collection Including Image Data and Symbolic Data
JP2000222394A (ja) 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体
Ugale et al. Document management system: A notion towards paperless office
CN104123269A (zh) 一种基于模板的出版物半自动生成方法及***
Stoffel et al. Enhancing document structure analysis using visual analytics
US9558400B2 (en) Search by stroke
CN114064851A (zh) 一种政府办公文档多机检索方法及***
WO2008041367A1 (fr) Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document
CN114023414A (zh) 一种体检报告多层次结构录入方法、***以及存储介质
KR20120058544A (ko) 이미지 구성요소의 검색
US8612431B2 (en) Multi-part record searches
Bartoli et al. Semisupervised wrapper choice and generation for print-oriented documents
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
Mitocaru et al. The Lib2Life Platform-Processing, Indexing and Semantic Search for Old Romanian Documents.
JP7086424B1 (ja) 特許用文章生成装置、特許用文章生成方法、および特許用文章生成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees