JP6884930B2 - 文書検索装置、文書検索プログラム、文書検索方法 - Google Patents
文書検索装置、文書検索プログラム、文書検索方法 Download PDFInfo
- Publication number
- JP6884930B2 JP6884930B2 JP2020550371A JP2020550371A JP6884930B2 JP 6884930 B2 JP6884930 B2 JP 6884930B2 JP 2020550371 A JP2020550371 A JP 2020550371A JP 2020550371 A JP2020550371 A JP 2020550371A JP 6884930 B2 JP6884930 B2 JP 6884930B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- keyword
- search
- document information
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 43
- 238000012545 processing Methods 0.000 claims description 47
- 238000000605 extraction Methods 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 10
- 238000010187 selection method Methods 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 22
- 238000010586 diagram Methods 0.000 description 13
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 9
- 239000002253 acid Substances 0.000 description 7
- 230000003647 oxidation Effects 0.000 description 6
- 238000007254 oxidation reaction Methods 0.000 description 6
- 238000005984 hydrogenation reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002985 plastic film Substances 0.000 description 1
- 229920006255 plastic film Polymers 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[1] 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索部と、
前記入力キーワードから生成されたワイルドカード文字列からなるワイルドカード文字列群から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索部に、前記類似キーワードによる、前記文書データベースの検索を実行させる類似キーワード選択部と、
前記文書データベースに対する、前記入力キーワードによる検索結果と、前記類似キーワードによる検索結果とを出力する出力部と、を有する文書検索装置。
[2] 前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部と、
前記ワイルドカード文字列群により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索部と、を前記文書検索装置が、さらに有し、
前記類似キーワード選択部において、前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択する、[1]記載の文書検索装置。
[3] 前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部を、前記文書検索装置が、さらに有し、
類似キーワード選択部が、前記文書検索部に、前記類似キーワードによる、前記非該当文書情報群の検索を実行させ、
出力部が、前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する、[1]記載の文書検索装置。
[4] 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索部と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索部と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索部に、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択部と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力部と、を有する文書検索装置。
[5] 特定の分野のキーワード群が格納されたキーワードデータベースを参照し、前記ワイルドカード文字列群に含まれる各文字列について、前記入力キーワードとの類似度と、前記特定の分野のキーワードとの類似度と、をそれぞれ取得する類似度取得部を有し、
前記類似キーワード選択部は、前記ワイルドカード文字列群に含まれる文字列、又は、非該当文書情報群に存在するワイルドカード文字列群に含まれる文字列、のうち、前記入力キーワードとの類似度が最も高くなる文字列を、類似キーワードに選択する、[1]乃至[4]の何れか一項に記載の文書検索装置。
[6] 前記類似キーワードに選択された文字列の類似度が、所定の条件を満たすか否かを判定する条件判定部を有し、
前記類似キーワード選択部は、
前記選択された文字列の類似度が前記所定の条件を満たさない場合、前記選択された文字列のうち、類似度が前記所定の条件を満たす文字列を高類似キーワードとし、
前記文書検索部は、
前記非該当文書情報群を前記高類似キーワードで検索し、
前記出力部は、前記高類似キーワードによる検索結果を出力する、[2]乃至[5]の何れか一項に記載の文書検索装置。
[7] 前記ワイルドカード文字列群に含まれる文字列、または、前記非該当文書情報群に存在するワイルドカード文字列群に含まれる文字列のうち、前記入力キーワードとの類似度が最も高くなかった文字列のうち、入力キーワードとの類似度が所定の閾値以上の文字列を、非類似キーワードに選択する非類似キーワード選択部を有し、
前記文書検索部は、
前記非該当文書情報群を前記非類似キーワードで検索し、
前記出力部は、前記非類似キーワードによる検索結果を、前記入力キーワードによる検索結果と、前記類似キーワードによる検索結果と共に出力する、[2]乃至[5]の何れか一項に記載の文書検索装置。
[8] 前記出力部は、
前記入力キーワードによる検索結果である文書情報と、前記類似キーワードによる検索結果である文書情報と、を一覧として、端末装置に表示させる、[1]乃至[5]の何れか一項に記載の文書検索装置。
[9] 前記出力部は、
前記入力キーワードによる検索結果である文書情報と、前記高類似キーワードによる検索結果である文書情報と、を一覧として、端末装置に表示させる、[6]に記載の文書検索装置。
[10] 前記出力部は、
前記非類似キーワードによる検索結果である文書情報を、前記入力キーワードによる検索結果である文書情報と、前記類似キーワードによる検索結果である文書情報と、共に、一覧として、端末装置に表示させる、[7]記載の文書検索装置。
[11] 前記文書情報において、前記テキストデータは、前記文書画像データを特定する識別情報と対応付けられており、
前記出力部は、
前記一覧において、前記文書情報の選択を受け付けて、
前記文書画像データと、前記文書画像データの識別情報とが対応付けられて格納された文書画像データベースを参照し、選択された前記文書情報の識別情報と対応する文書画像データを、前記一覧と共に表示させる、[8]乃至[10]の何れか一項に記載の文書検索装置。
[12] 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索処理と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する文書情報群抽出処理と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索処理と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索処理によって、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択処理と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力処理と、をコンピュータに実行させる文書検索プログラム。
[13] コンピュータによる文書検索方法であって、前記コンピュータが、
紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索手順と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する文書情報群抽出手順と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索手順と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索手順において、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択手順と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力手順と、を実行する文書検索方法。
以下に、図面を参照して、第一の実施形態について説明する。図1は、第一の実施形態の文書検索システムのシステム構成の一例を示す図である。
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、類似キーワードを選択する際の類似度に条件を設定する点が第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
250を有する。
以下に図面を参照して、第三の実施形態について説明する。第三の実施形態では、入力キーワードとの類似度が最も高くなかったため類似キーワードとして選択されなかったワイルドカード文字列のうち、入力キーワードとのワイルドカード文字列との類似度が所定の閾値以上の文字列を、非類似キーワードとし、入力キーワード、類似キーワード及び非類似キーワードのそれぞれによって文書データベース220を検索する点が、第一の実施形態と相違する。よって、以下の第三の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
また、本国際出願は、2018年10月4日に出願された日本国特許出願2018−189438に基づく優先権を主張するものであり、日本国特許出願2018−189438の全内容を本国際出願に援用する。
200、200A、200B 文書検索装置
210 文書画像データベース
220 文書データベース
230 特定分野キーワードデータベース
240、240A、240B 検索処理部
241 入力受付部
242 文書検索部
243 非該当文書情報群抽出部
244 検索文字列生成部
245 文字列検索部
246 類似度取得部
247 類似キーワード選択部
248 文書一覧取得部
249 出力部
250 条件判定部
251 非類似キーワード選択部
300 端末装置
Claims (13)
- 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索部と、
前記入力キーワードから生成されたワイルドカード文字列からなるワイルドカード文字列群から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索部に、前記類似キーワードによる、前記文書データベースの検索を実行させる類似キーワード選択部と、
前記文書データベースに対する、前記入力キーワードによる検索結果と、前記類似キーワードによる検索結果とを出力する出力部と、を有する文書検索装置。 - 前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部と、
前記ワイルドカード文字列群により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索部と、を前記文書検索装置が、さらに有し、
前記類似キーワード選択部において、前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択する、請求項1記載の文書検索装置。 - 前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部を、前記文書検索装置が、さらに有し、
類似キーワード選択部が、前記文書検索部に、前記類似キーワードによる、前記非該当文書情報群の検索を実行させ、
出力部が、前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する、請求項1記載の文書検索装置。 - 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索部と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する非該当文書情報群抽出部と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索部と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索部に、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択部と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力部と、を有する文書検索装置。 - 特定の分野のキーワード群が格納されたキーワードデータベースを参照し、前記ワイルドカード文字列群に含まれる各文字列について、前記入力キーワードとの類似度と、前記特定の分野のキーワードとの類似度と、をそれぞれ取得する類似度取得部を有し、
前記類似キーワード選択部は、前記ワイルドカード文字列群に含まれる文字列、又は、非該当文書情報群に存在するワイルドカード文字列群に含まれる文字列、のうち、前記入力キーワードとの類似度が最も高くなる文字列を、類似キーワードに選択する、請求項1乃至4の何れか一項に記載の文書検索装置。 - 前記類似キーワードに選択された文字列の類似度が、所定の条件を満たすか否かを判定する条件判定部を有し、
前記類似キーワード選択部は、
前記選択された文字列の類似度が前記所定の条件を満たさない場合、前記選択された文字列のうち、類似度が前記所定の条件を満たす文字列を高類似キーワードとし、
前記文書検索部は、
前記非該当文書情報群を前記高類似キーワードで検索し、
前記出力部は、前記高類似キーワードによる検索結果を出力する、請求項2乃至5の何れか一項に記載の文書検索装置。 - 前記ワイルドカード文字列群に含まれる文字列、または、前記非該当文書情報群に存在するワイルドカード文字列群に含まれる文字列のうち、前記入力キーワードとの類似度が最も高くなかった文字列のうち、入力キーワードとの類似度が所定の閾値以上の文字列を、非類似キーワードに選択する非類似キーワード選択部を有し、
前記文書検索部は、
前記非該当文書情報群を前記非類似キーワードで検索し、
前記出力部は、前記非類似キーワードによる検索結果を、前記入力キーワードによる検索結果と、前記類似キーワードによる検索結果と共に出力する、請求項2乃至5の何れか一項に記載の文書検索装置。 - 前記出力部は、
前記入力キーワードによる検索結果である文書情報と、前記類似キーワードによる検索結果である文書情報と、を一覧として、端末装置に表示させる、請求項1乃至5の何れか一項に記載の文書検索装置。 - 前記出力部は、
前記入力キーワードによる検索結果である文書情報と、前記高類似キーワードによる検索結果である文書情報と、を一覧として、端末装置に表示させる、請求項6に記載の文書検索装置。 - 前記出力部は、
前記非類似キーワードによる検索結果である文書情報を、前記入力キーワードによる検索結果である文書情報と、前記類似キーワードによる検索結果である文書情報と、共に、一覧として、端末装置に表示させる、請求項7記載の文書検索装置。 - 前記文書情報において、前記テキストデータは、前記文書画像データを特定する識別情報と対応付けられており、
前記出力部は、
前記一覧において、前記文書情報の選択を受け付けて、
前記文書画像データと、前記文書画像データの識別情報とが対応付けられて格納された文書画像データベースを参照し、選択された前記文書情報の識別情報と対応する文書画像データを、前記一覧と共に表示させる、請求項8乃至10の何れか一項に記載の文書検索装置。 - 紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索処理と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する文書情報群抽出処理と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索処理と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索処理によって、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択処理と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力処理と、をコンピュータに実行させる文書検索プログラム。 - コンピュータによる文書検索方法であって、前記コンピュータが、
紙文書を画像化した文書画像データから文字認識処理により抽出したテキストデータを含む文書情報が格納された文書データベースを、入力キーワードで検索する文書検索手順と、
前記文書データベースから、前記入力キーワードによる検索結果である文書情報群以外の文書情報群である非該当文書情報群を抽出する文書情報群抽出手順と、
前記入力キーワードから生成されたワイルドカード文字列により前記非該当文書情報群を検索し、非該当文書情報群に存在するワイルドカード文字列群を取得する文字列検索手順と、
前記非該当文書情報群に存在するワイルドカード文字列群の中から、前記入力キーワードとの類似度に応じて類似キーワードを選択し、前記文書検索手順において、前記類似キーワードによる、前記非該当文書情報群の検索を実行させる類似キーワード選択手順と、
前記文書データベースに対する前記入力キーワードによる検索結果と、前記非該当文書情報群に対する前記類似キーワードによる検索結果とを出力する出力手順と、を実行する文書検索方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018189438 | 2018-10-04 | ||
JP2018189438 | 2018-10-04 | ||
PCT/JP2019/038016 WO2020071252A1 (ja) | 2018-10-04 | 2019-09-26 | 文書検索装置、文書検索プログラム、文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6884930B2 true JP6884930B2 (ja) | 2021-06-09 |
JPWO2020071252A1 JPWO2020071252A1 (ja) | 2021-09-02 |
Family
ID=70055057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020550371A Active JP6884930B2 (ja) | 2018-10-04 | 2019-09-26 | 文書検索装置、文書検索プログラム、文書検索方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11755659B2 (ja) |
JP (1) | JP6884930B2 (ja) |
CN (1) | CN112868001B (ja) |
TW (1) | TWI794547B (ja) |
WO (1) | WO2020071252A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115917527A (zh) * | 2020-07-22 | 2023-04-04 | 昭和电工株式会社 | 文档检索装置、文档检索***、文档检索程序、以及文档检索方法 |
CN113176979B (zh) * | 2021-05-24 | 2022-11-04 | 深圳赛安特技术服务有限公司 | 应用程序异常监控方法、装置、计算机设备及存储介质 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08115330A (ja) * | 1994-10-14 | 1996-05-07 | Hitachi Ltd | 類似文書検索方法および装置 |
JP3307336B2 (ja) | 1998-09-02 | 2002-07-24 | 日本電気株式会社 | 文書検索方法および文書検索装置並びに文書検索プログラムを記録した記録媒体 |
US6470336B1 (en) * | 1999-08-25 | 2002-10-22 | Matsushita Electric Industrial Co., Ltd. | Document image search device and recording medium having document search program stored thereon |
JP3526821B2 (ja) | 1999-08-25 | 2004-05-17 | 松下電器産業株式会社 | 文書検索装置 |
US6944344B2 (en) * | 2000-06-06 | 2005-09-13 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval apparatus, recording medium and program |
JP3669626B2 (ja) | 2000-06-06 | 2005-07-13 | 松下電器産業株式会社 | 検索装置、記録媒体およびプログラム |
JP2004171316A (ja) * | 2002-11-21 | 2004-06-17 | Hitachi Ltd | Ocr装置及び文書検索システム及び文書検索プログラム |
JP4208566B2 (ja) | 2002-12-26 | 2009-01-14 | キヤノン株式会社 | 文書画像検索装置及びその方法、文書画像検索システム、プログラム |
JP4502114B2 (ja) * | 2003-06-24 | 2010-07-14 | セイコーインスツル株式会社 | データベース検索装置 |
JP4461769B2 (ja) * | 2003-10-29 | 2010-05-12 | 株式会社日立製作所 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
US7894670B2 (en) * | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US8620083B2 (en) * | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US20060069675A1 (en) * | 2004-09-30 | 2006-03-30 | Ogilvie John W | Search tools and techniques |
JP2006139659A (ja) | 2004-11-15 | 2006-06-01 | Fujitsu Ltd | 単語認識装置、単語認識方法、単語認識プログラム |
US8312016B2 (en) * | 2006-04-25 | 2012-11-13 | Rockstar Consortium Us Lp | Method and apparatus for document matching |
US7761464B2 (en) * | 2006-06-19 | 2010-07-20 | Microsoft Corporation | Diversifying search results for improved search and personalization |
US7539032B2 (en) * | 2006-09-19 | 2009-05-26 | Netlogic Microsystems, Inc. | Regular expression searching of packet contents using dedicated search circuits |
US7689613B2 (en) * | 2006-10-23 | 2010-03-30 | Sony Corporation | OCR input to search engine |
CN101779202A (zh) * | 2007-06-15 | 2010-07-14 | 东洋工程株式会社 | 文档管理装置、方法和程序 |
JP4436894B2 (ja) * | 2007-08-09 | 2010-03-24 | パナソニック株式会社 | コンテンツ検索装置 |
CN101842787A (zh) * | 2007-09-14 | 2010-09-22 | 谷歌公司 | 在查询结果中建议替选查询 |
JP5173721B2 (ja) * | 2008-10-01 | 2013-04-03 | キヤノン株式会社 | 文書処理システム及びその制御方法、プログラム、記憶媒体 |
JP2010102676A (ja) * | 2008-10-23 | 2010-05-06 | Hiroshima Dia System Co Ltd | 複数の単語より構成される検索文字列のあいまい検索方法 |
US8484014B2 (en) * | 2008-11-03 | 2013-07-09 | Microsoft Corporation | Retrieval using a generalized sentence collocation |
JP5647916B2 (ja) * | 2010-02-26 | 2015-01-07 | 楽天株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
US9094647B2 (en) * | 2010-11-29 | 2015-07-28 | James Williamson | AMOLED television frame |
JP5594134B2 (ja) | 2010-12-28 | 2014-09-24 | 富士通株式会社 | 文字列検索装置,文字列検索方法および文字列検索プログラム |
DE102011011881A1 (de) * | 2011-02-21 | 2012-08-23 | Thyssenkrupp Uhde Gmbh | Verfahren zur Beseitigung von N2O und NOX aus dem Prozess zur Salpetersäureherstellung |
US20130198244A1 (en) * | 2011-07-29 | 2013-08-01 | Kevin Albrecht | Systems and methods for monitoring document transmission |
US9916383B1 (en) * | 2013-07-12 | 2018-03-13 | Aplix Research, Inc. | Systems and methods for document analytics |
AU2013214496A1 (en) * | 2013-08-12 | 2015-02-26 | Infotext Holdings Pty Ltd | A Search Method |
US9626594B2 (en) | 2015-01-21 | 2017-04-18 | Xerox Corporation | Method and system to perform text-to-image queries with wildcards |
US10204177B2 (en) * | 2015-11-30 | 2019-02-12 | International Business Machines Corporation | Matching an ordered set of strings containing wild cards |
US10445355B2 (en) * | 2016-04-07 | 2019-10-15 | RELX Inc. | Systems and methods for providing a visualizable results list |
WO2018097091A1 (ja) * | 2016-11-25 | 2018-05-31 | 日本電信電話株式会社 | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム |
CN107220343B (zh) * | 2017-05-26 | 2020-09-01 | 福州大学 | 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法 |
US10482344B2 (en) * | 2018-01-04 | 2019-11-19 | Wipro Limited | System and method for performing optical character recognition |
CN113378061B (zh) * | 2021-07-02 | 2023-05-30 | 抖音视界有限公司 | 一种信息搜索方法、装置、计算机设备及存储介质 |
-
2019
- 2019-09-26 WO PCT/JP2019/038016 patent/WO2020071252A1/ja active Application Filing
- 2019-09-26 CN CN201980065122.XA patent/CN112868001B/zh active Active
- 2019-09-26 US US17/282,036 patent/US11755659B2/en active Active
- 2019-09-26 JP JP2020550371A patent/JP6884930B2/ja active Active
- 2019-10-02 TW TW108135688A patent/TWI794547B/zh active
-
2023
- 2023-06-22 US US18/339,544 patent/US20230342400A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
TWI794547B (zh) | 2023-03-01 |
US20210374189A1 (en) | 2021-12-02 |
CN112868001B (zh) | 2024-04-26 |
WO2020071252A1 (ja) | 2020-04-09 |
TW202025073A (zh) | 2020-07-01 |
US11755659B2 (en) | 2023-09-12 |
JPWO2020071252A1 (ja) | 2021-09-02 |
US20230342400A1 (en) | 2023-10-26 |
CN112868001A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6826576B2 (en) | Very-large-scale automatic categorizer for web content | |
EP2100260B1 (en) | Identifying images using face recognition | |
US7047236B2 (en) | Method for automatic deduction of rules for matching content to categories | |
US6549913B1 (en) | Method for compiling an image database, an image database system, and an image data storage medium | |
US6178417B1 (en) | Method and means of matching documents based on text genre | |
US20120102002A1 (en) | Automatic data validation and correction | |
US6480838B1 (en) | System and method for searching electronic documents created with optical character recognition | |
US20070050709A1 (en) | Character input aiding method and information processing apparatus | |
JP7149721B2 (ja) | 情報処理装置、文字認識エンジン最適化方法及びプログラム | |
WO2020056977A1 (zh) | 知识点推送方法、装置及计算机可读存储介质 | |
WO2007139039A1 (ja) | 情報分類装置、情報分類方法、及び情報分類プログラム | |
US20070136220A1 (en) | Apparatus for learning classification model and method and program thereof | |
JP6884930B2 (ja) | 文書検索装置、文書検索プログラム、文書検索方法 | |
US11520835B2 (en) | Learning system, learning method, and program | |
US20240211518A1 (en) | Automated document intake system | |
US11797551B2 (en) | Document retrieval apparatus, document retrieval system, document retrieval program, and document retrieval method | |
Ruocco et al. | Event clusters detection on flickr images using a suffix-tree structure | |
JP5752073B2 (ja) | データ修正装置 | |
JP3979288B2 (ja) | 文書検索装置および文書検索プログラム | |
WO2023286340A1 (ja) | 情報処理装置および情報処理方法 | |
JP7421384B2 (ja) | 情報処理装置、修正候補表示方法、及びプログラム | |
JP2001229177A (ja) | 事例ベース構築方法、事例ベース構築装置及び事例ベース構築プログラムを記録した記録媒体 | |
JP2007213481A (ja) | 情報提示システム、情報提示方法及び情報提示プログラム | |
JPH11306198A (ja) | 検索データベース構築方法及び検索データ構築システム並びに記録媒体 | |
JPH0869455A (ja) | 文書検索方法,文書検索装置及び文書記憶装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210302 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210302 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20210407 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6884930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |