JP6374289B2 - 文字列検索装置および方法並びにプログラム - Google Patents
文字列検索装置および方法並びにプログラム Download PDFInfo
- Publication number
- JP6374289B2 JP6374289B2 JP2014214988A JP2014214988A JP6374289B2 JP 6374289 B2 JP6374289 B2 JP 6374289B2 JP 2014214988 A JP2014214988 A JP 2014214988A JP 2014214988 A JP2014214988 A JP 2014214988A JP 6374289 B2 JP6374289 B2 JP 6374289B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- character string
- additional
- result
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 35
- 238000011156 evaluation Methods 0.000 claims description 56
- 238000012015 optical character recognition Methods 0.000 claims description 33
- 238000010845 search algorithm Methods 0.000 claims description 11
- 230000010354 integration Effects 0.000 claims description 9
- 238000013500 data storage Methods 0.000 claims description 8
- 239000003814 drug Substances 0.000 description 28
- 229940079593 drug Drugs 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 241000220225 Malus Species 0.000 description 6
- 238000007689 inspection Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 238000003255 drug test Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000021016 apples Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
2 OCR装置
3 データベース装置
4 ディスプレイ
10 文字列受付部
11 検索部
12 評価部
13 追加検索要否判定部
14 検索結果統合部
15 記憶部
16 出力部
17 制御部
Claims (12)
- 検索対象の文字列を用いてデータ記憶部を参照して検索を行う検索部と、
該検索部によって検索された検索結果の文字列と前記検索対象の文字列とを照合して前記検索結果の文字列を評価することによって、前記検索結果の文字列の信頼度を算出する評価部と、
前記評価部において算出された信頼度に基づいて、追加検索が必要か否かを判定する追加検索要否判定部とを備え、
前記検索部が、前記追加検索要否判定部において前記追加検索が必要であると判定された場合には、前記検索対象の文字列に基づく前記追加検索を行い、
最初の前記検索の検索結果と前記追加検索の結果とを合併統合する検索結果統合部をさらに備えた文字列検索装置。 - 前記評価部が、前記検索結果の文字列を分割して部分文字列を生成し、該生成した部分文字列と前記検索対象の文字列とを照合して前記評価を行う請求項1に記載の文字列検索装置。
- 前記評価部が、2種類以上の指標を用いて前記評価を行う請求項2に記載の文字列検索装置。
- 前記評価部が、前記部分文字列が前記検索対象の文字列の中に含まれる割合および前記検索対象の文字列の中における前記部分文字列の出現頻度を前記指標として前記評価を行う請求項3に記載の文字列検索装置。
- 前記評価部が、前記部分文字列の出現頻度が高い前記検索結果の文字列から順に並べ、前記検索結果の文字列の数が予め設定された閾値よりも多い場合には、予め設定された数の下位の順位の前記検索結果の文字列を最初の前記検索の検索結果から除外する請求項4に記載の文字列検索装置。
- 前記追加検索要否判定部が、前記部分文字列の出現頻度が最も高い前記検索結果の文字列を取得し、該取得した文字列の前記部分文字列が前記検索対象の文字列の中に含まれる割合が予め設定された閾値より大きい場合には、前記追加検索は不要と判定し、前記割合が閾値以下である場合には、前記追加検索が必要であると判定する請求項5に記載の文字列検索装置。
- 最初の前記検索に用いられる前記検索対象の文字列に基づく検索クエリと前記追加検索に用いられる前記検索対象の文字列に基づく検索クエリとが異なる請求項1から6いずれか1項に記載の文字列検索装置。
- 最初の前記検索に用いられる検索アルゴリズムと前記追加検索に用いられる検索アルゴリズムとが異なる請求項1から7いずれか1項に記載の文字列検索装置。
- 最初の前記検索に用いられるデータ記憶部と前記追加検索に用いられるデータ記憶部とが異なる請求項1から8いずれか1項に記載の文字列検索装置。
- 前記検索対象の文字列が、OCR(optical character recognition)によって取得されたものである請求項1から9いずれか1項に記載の文字列検索装置。
- 文字列検索装置が、
検索対象の文字列を用いて検索を行い、
該検索による検索結果の文字列と前記検索対象の文字列とを照合して前記検索結果の文字列を評価することによって、前記検索結果の文字列の信頼度を算出し、
前記算出された信頼度に基づいて、追加検索が必要か否かを判定して、前記追加検索が必要であると判定された場合には、前記検索対象の文字列に基づく前記追加検索を行い、
最初の前記検索の検索結果と前記追加検索の結果とを合併統合する文字列検索方法。 - コンピュータを、
検索対象の文字列を用いて検索を行う検索部と、
該検索部によって検索された検索結果の文字列と前記検索対象の文字列とを照合して前記検索結果の文字列を評価することによって、前記検索結果の文字列の信頼度を算出する評価部と、
前記評価部において算出された信頼度に基づいて、追加検索が必要か否かを判定する追加検索要否判定部として機能させる文字列検索プログラムであって、
前記検索部が、前記追加検索要否判定部において前記追加検索が必要であると判定された場合には、前記検索対象の文字列に基づく前記追加検索を行い、
最初の前記検索の検索結果と前記追加検索の結果とを合併統合する検索結果統合部としてさらに機能させることを特徴とする文字列検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214988A JP6374289B2 (ja) | 2014-10-22 | 2014-10-22 | 文字列検索装置および方法並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214988A JP6374289B2 (ja) | 2014-10-22 | 2014-10-22 | 文字列検索装置および方法並びにプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018135921A Division JP6608119B2 (ja) | 2018-07-19 | 2018-07-19 | 薬剤名出力装置および薬剤名出力方法並びに薬剤名出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016081445A JP2016081445A (ja) | 2016-05-16 |
JP6374289B2 true JP6374289B2 (ja) | 2018-08-15 |
Family
ID=55958872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014214988A Active JP6374289B2 (ja) | 2014-10-22 | 2014-10-22 | 文字列検索装置および方法並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6374289B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7017027B2 (ja) | 2017-03-17 | 2022-02-08 | 富士フイルムビジネスイノベーション株式会社 | 検索装置、検索プログラム、および検索システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099566A (ja) * | 2000-09-26 | 2002-04-05 | Toshiba Corp | 情報検索方法および情報検索装置 |
JP2003044515A (ja) * | 2001-08-01 | 2003-02-14 | Aisin Aw Co Ltd | 検索装置及び検索プログラム |
-
2014
- 2014-10-22 JP JP2014214988A patent/JP6374289B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016081445A (ja) | 2016-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106844368B (zh) | 用于人机对话的方法、神经网络***和用户设备 | |
US10146859B2 (en) | System and method for entity recognition and linking | |
US9146987B2 (en) | Clustering based question set generation for training and testing of a question and answer system | |
US9230009B2 (en) | Routing of questions to appropriately trained question and answer system pipelines using clustering | |
US9348900B2 (en) | Generating an answer from multiple pipelines using clustering | |
US20190361961A1 (en) | Fact validation in document editors | |
KR20210158344A (ko) | 디지털 어시스턴트를 위한 머신 러닝 시스템 | |
US10642928B2 (en) | Annotation collision detection in a question and answer system | |
KR20160060821A (ko) | 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법 | |
US11397855B2 (en) | Data standardization rules generation | |
US8402042B2 (en) | Named entity database or mining rule database update apparatus and method using named entity database and mining rule merged ontology schema | |
Li et al. | Dimsim: An accurate chinese phonetic similarity algorithm based on learned high dimensional encoding | |
Czyżewski et al. | Analysis of results of large‐scale multimodal biometric identity verification experiment | |
Uthayamoorthy et al. | Ddspell-a data driven spell checker and suggestion generator for the tamil language | |
JP5812534B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP2011018155A (ja) | 幼児語彙発達データベース作成方法、幼児語彙発達データベース作成装置、幼児語彙発達データベース作成プログラム | |
JP6608119B2 (ja) | 薬剤名出力装置および薬剤名出力方法並びに薬剤名出力プログラム | |
JP6374289B2 (ja) | 文字列検索装置および方法並びにプログラム | |
KR101757222B1 (ko) | 한글 문장에 대한 의역 문장 생성 방법 | |
CN116741333A (zh) | 一种医药营销管理*** | |
Gonzales | Sociolinguistic analysis with missing metadata? Leveraging linguistic and semiotic resources through deep learning to investigate English variation and change on Twitter | |
JP5594134B2 (ja) | 文字列検索装置,文字列検索方法および文字列検索プログラム | |
JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
Efremova et al. | Towards population reconstruction: extraction of family relationships from historical documents | |
Steinmetz et al. | COALA-A Rule-Based Approach to Answer Type Prediction. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170307 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20170523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170908 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170908 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180619 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180719 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6374289 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |