JP6702589B2 - 電子デバイスにおいて受け付けられた入力ストリングの置き換えとして単語の候補を提案するための方法 - Google Patents
電子デバイスにおいて受け付けられた入力ストリングの置き換えとして単語の候補を提案するための方法 Download PDFInfo
- Publication number
- JP6702589B2 JP6702589B2 JP2017535694A JP2017535694A JP6702589B2 JP 6702589 B2 JP6702589 B2 JP 6702589B2 JP 2017535694 A JP2017535694 A JP 2017535694A JP 2017535694 A JP2017535694 A JP 2017535694A JP 6702589 B2 JP6702589 B2 JP 6702589B2
- Authority
- JP
- Japan
- Prior art keywords
- words
- word
- list
- edit distance
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 110
- 230000008569 process Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 2
- 230000004807 localization Effects 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 230000017105 transposition Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000036316 preload Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/02—Input arrangements using manually operated switches, e.g. using keyboards or dials
- G06F3/023—Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
- G06F3/0233—Character input methods
- G06F3/0237—Character input methods using prediction or retrieval techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/274—Converting codes to words; Guess-ahead of partial word inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
(i)必要な応答時間は、ユーザに効果的であるよう短くなくてはならないが、出願人が先に開示したシステムでは、ユーザが意図したかもしれない、考えられる3語の組み合わせが約57兆個あり、最新のデスクトップパーソナルコンピュータにおいてですら、これらを一つずつスキャンするプロシージャはどれも実現可能でなく、ハンドヘルド又は携帯型の電子デバイスにおいてはなお一層実現可能ではない。
(ii)1つの選択肢を検討する場合、受け付けられた元の入力文字ストリング又はそのようなストリングの一部に対するその近接度をある程度のものにする必要がある。このプロシージャは、何度も、すなわち、ユーザが意図したかもしれない位置の各々について一回呼び出されるので、この場合も計算効率のよいことを必要とする。このプロセスのある部分又は全体は、多数の容認できる入力のどれが実際の入力に近い又は最も近いかを決定する際、それらの容認できる入力を含む辞書に対する実際の入力の類似度を比較する段階と、場合により、当該容認できる入力を、実際の入力に対するそれらの近接度の観点からランク付け又はスコア付けする段階とを含むことが多い。
(iii)当該方法は、メモリが限られていることが多いスマートフォン又はタブレットコンピュータ又は同様のものなどの携帯型又はハンドヘルドの電子デバイスにおいて動作するよう適合される必要があり、故に、当該方法は、できるだけ少ないメモリを利用する必要がある。
本発明の目的は、入力文字ストリングの予想される置き換えとして単語の候補を提案するためのシステムに関連する1又は複数の問題をある程度まで緩和又は除去することである。
d(0,c)=ci、式中、iは挿入コストである。
d(r,0)=rd、式中、dは削除コストである。
a)最後の文字を削除する段階、次に、
b)結果として得られた長さr−1の元のストリングの冒頭サブストリングであるストリングを(長さcを有する)目標ストリングで置き換える段階。
Claims (25)
- 電子デバイスにおいて受け付けられた入力ストリングに基づいて、単語のリストから1又は複数の単語の候補を提案するためのコンピュータ実装方法であって、
a)前記入力ストリングの冒頭サブストリングと、前記単語のリストにおける各単語の冒頭サブストリングとの間の編集距離の値を受け付けるために、前記電子デバイスのメモリ内に配列を設ける段階と、
b)前記編集距離の値を計算すべく、前記単語のリストにおける各単語を前記受け付けられた入力ストリングと比較する編集距離アルゴリズムを適用する段階と、
c)前記単語のリストの1又は複数の単語について、それが、以前に検討された単語の接頭部と重複する文字数Kを決定することにより段階b)を修正し、前記以前に検討された単語の前記K個の接頭文字についての前記編集距離の値の一部又は全部を使用して、検討中の前記単語のための前記メモリの配列に編集距離の値を保持する段階とを備え、
段階b)は、一たび、受け付けられた入力ストリングにとっての予め定められた数の単語の候補が選択されると終了され、
前記方法はさらに、
d)受け付けられた入力ストリングにとっての前記予め定められた数の単語の候補を前記電子デバイスの位置特定モジュールに入力する段階であって、前記位置特定モジュールは、受け付けられた入力ストリングにとっての前記予め定められた数の単語の候補を、数値的な位置座標に解決する、段階
を備える方法。 - 前記配列は、キャッシュメモリに設けられる、請求項1に記載の方法。
- 段階b)は、文字を含まない空語又は空ストリングに適用される、請求項1又は2に記載の方法。
- 段階b)は、前記単語のリスト内のいくつかの単語であって、前記リストにおいて間隔を空けて配置されている、いくつかの単語に適用される、請求項1又は2に記載の方法。
- 前記単語のリストは、順序付けられた単語のリストを含み、段階b)は、前記順序付けられた単語のリストにおいて第1番目の単語に適用される、請求項1、3、又は4の何れか一項に記載の方法。
- 単語の前記編集距離の値は、編集距離テーブルの形態で提供される、請求項1から5の何れか一項に記載の方法。
- 前記保持する段階は、以前に検討された単語についての編集距離テーブルの最初のK+1個の行又は列を、検討中の単語についての前記編集距離テーブルの前記最初のK+1個の行又は列として保持する段階を含む、請求項6に記載の方法。
- 段階cに続いて、前記編集距離アルゴリズムを使用して、前記単語のリスト内の各単語についての前記編集距離テーブルの更なる行を計算する段階d)を更に備える、請求項6又は7に記載の方法。
- メモリ内に1つの配列だけを設ける段階を備える、請求項1から8の何れか一項に記載の方法。
- 前記編集距離アルゴリズムは、ワグナー‐フィッシャーアルゴリズムを含む、請求項1から9の何れか一項に記載の方法。
- ワグナー‐フィッシャーアルゴリズムによって決定される標準的な値で、各編集距離テーブルの第1行及び第1列を予め割り当てる段階を更に備える、請求項6から8の何れか一項に記載の方法。
- 前記単語のリストが未だ順序付けられていない場合、
前記未だ順序付けられていない単語のリスト内の各単語と、前記未だ順序付けられていない単語のリスト内のその元の位置の指標を関連付ける段階と、
前記未だ順序付けられていない単語のリスト内の前記単語を、前記未だ順序付けられていない単語のリスト内のそれらの元の位置の、それらの関連付けられた指標を有する、順序付けられた単語のリストへと再配列する段階とを更に備える、請求項1から11の何れか一項に記載の方法。 - 前記未だ順序付けられていない単語のリストの順序を再配列する前記段階は、アルファベット順に、及び、数値的に、のうち少なくとも何れかで、前記単語を配列する段階を含む、請求項12に記載の方法。
- 前記方法は、前記リストの前記単語を、順序付けられた単語のリストへと順序付ける段階を備え、前記単語のリストの前記単語を順序付けられた単語のリストへと配列するプロセスは、オフラインで行われる、一回だけ行われる、又は、オフラインで一回だけ行われる、請求項1から13の何れか一項に記載の方法。
- メモリに設けられた前記配列の2次元のサイズは、予期される受け付けられた入力ストリング又は許容される入力ストリングより大きい、又はそれに等しい第1の次元と、前記単語のリスト内の最長単語の長さより大きい、又はそれに等しい第2の次元とを有する、請求項1から14の何れか一項に記載の方法。
- 単語についての編集距離テーブルを計算する前記段階は、一たび、前記単語についての前記編集距離テーブルの所与の行における全てのエントリが閾値より大きいと決定されると終了される、請求項6から8、及び11の何れか一項に記載の方法。
- 単語についての編集距離テーブルを計算する前記段階は、一たび、受け付けられた入力ストリングにとっての予め定められた数の単語の候補が選択されると終了される、請求項6から8、11、及び16の何れか一項に記載の方法。
- 受け付けられた入力ストリングにとっての前記予め定められた数の単語の候補は、優先度付きキューデータ構造を使用することによって選択される、請求項17に記載の方法。
- 受け付けられた入力ストリングにとっての前記予め定められた数の単語の候補は、二分ヒープにおいて実装された優先度付きキューデータ構造を使用することによって選択される、請求項17に記載の方法。
- 前記方法は、完全に前記電子デバイスにおいて実装される、請求項1から19の何れか一項に記載の方法。
- 前記方法は、サーバベースの方法である、請求項1から19の何れか一項に記載の方法。
- 電子デバイスであって、前記電子デバイスにおいて受け付けられた入力ストリングに基づいて、単語のリストから1又は複数の単語の候補を提案するための、電子デバイスであって、
機械可読命令を格納するメモリと、
請求項1から21の何れか一項に記載の方法の段階を実施すべく前記機械可読命令を実行するプロセッサとを備えるデバイス。 - 電子デバイスにおいて受け付けられた入力ストリングに基づいて、単語のリストから1又は複数の単語の候補を提案するためのシステムであって、
機械可読命令を格納するメモリ、及び、前記機械可読命令を実行するプロセッサを有するサーバと、
機械可読命令を格納するメモリ、及び、前記機械可読命令を実行するプロセッサを有する電子デバイスとを備え、
前記サーバ及び前記電子デバイスは、ネットワークを通じて互いに通信し、
前記電子デバイスにおける受け付けられたストリングに基づいて前記電子デバイスによって前記サーバに送信された要求に応答して、前記サーバは、請求項1から19の何れか一項に記載の方法の段階を実施する、システム。 - 請求項1から21の何れか一項に記載の方法の段階を電子デバイスのプロセッサに実施させるためのプログラム。
- 請求項1から19の何れか一項に記載の方法の段階をサーバのプロセッサに実施させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1500104.3A GB2535439A (en) | 2015-01-06 | 2015-01-06 | A method for suggesting candidate words as replacements for an input string received at an electronic device |
GB1500104.3 | 2015-01-06 | ||
PCT/EP2016/050002 WO2016110455A1 (en) | 2015-01-06 | 2016-01-02 | A method for suggesting candidate words as replacements for an input string received at an electronic device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018506115A JP2018506115A (ja) | 2018-03-01 |
JP6702589B2 true JP6702589B2 (ja) | 2020-06-03 |
Family
ID=55085643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017535694A Active JP6702589B2 (ja) | 2015-01-06 | 2016-01-02 | 電子デバイスにおいて受け付けられた入力ストリングの置き換えとして単語の候補を提案するための方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11017169B2 (ja) |
EP (1) | EP3243142A1 (ja) |
JP (1) | JP6702589B2 (ja) |
KR (1) | KR102482391B1 (ja) |
CN (1) | CN107408108A (ja) |
GB (1) | GB2535439A (ja) |
WO (1) | WO2016110455A1 (ja) |
ZA (1) | ZA201705193B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2549240A (en) | 2015-01-06 | 2017-10-18 | What3Words Ltd | A method for suggesting one or more multi-word candidates based on an input string received at an electronic device |
CN106326484A (zh) * | 2016-08-31 | 2017-01-11 | 北京奇艺世纪科技有限公司 | 搜索词纠错方法及装置 |
US20180074970A1 (en) * | 2016-09-09 | 2018-03-15 | Sap Se | Cache-Efficient Fragmentation of Data Structures |
JP6690484B2 (ja) * | 2016-09-15 | 2020-04-28 | 富士通株式会社 | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 |
WO2019070412A1 (en) * | 2017-10-03 | 2019-04-11 | Precision Location Intelligence, Inc. | SYSTEM FOR GENERATING AND USING GEOGRAPHIC HASH EXPRESSIONS |
CN108595419B (zh) * | 2018-04-11 | 2022-05-03 | 广州视源电子科技股份有限公司 | 候选词评估方法、候选词排序方法及装置 |
CN108681535B (zh) * | 2018-04-11 | 2022-07-08 | 广州视源电子科技股份有限公司 | 候选词评估方法、装置、计算机设备和存储介质 |
MA43451B2 (fr) * | 2018-10-01 | 2021-08-31 | Univ Int Rabat | Procédé de prédiction des codes à barres non lus par intelligence artificielle |
KR20210132855A (ko) * | 2020-04-28 | 2021-11-05 | 삼성전자주식회사 | 음성 처리 방법 및 장치 |
US11776529B2 (en) * | 2020-04-28 | 2023-10-03 | Samsung Electronics Co., Ltd. | Method and apparatus with speech processing |
CN112905026B (zh) * | 2021-03-30 | 2024-04-16 | 完美世界控股集团有限公司 | 展示单词建议的方法、装置、存储介质及计算机设备 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000057291A1 (en) | 1999-03-24 | 2000-09-28 | Justsystem Corporation | Spelling correction method using improved minimum edit distance algorithm |
US7584173B2 (en) * | 2003-02-24 | 2009-09-01 | Avaya Inc. | Edit distance string search |
US7584093B2 (en) * | 2005-04-25 | 2009-09-01 | Microsoft Corporation | Method and system for generating spelling suggestions |
KR100835289B1 (ko) * | 2006-11-20 | 2008-06-05 | 엔에이치엔(주) | 키 배열 정보를 이용한 단어 추천 방법 및 그 시스템 |
US7630978B2 (en) * | 2006-12-14 | 2009-12-08 | Yahoo! Inc. | Query rewriting with spell correction suggestions using a generated set of query features |
US7957955B2 (en) * | 2007-01-05 | 2011-06-07 | Apple Inc. | Method and system for providing word recommendations for text input |
US8232973B2 (en) * | 2008-01-09 | 2012-07-31 | Apple Inc. | Method, device, and graphical user interface providing word recommendations for text input |
US20100251105A1 (en) * | 2009-03-31 | 2010-09-30 | Lenovo (Singapore) Pte, Ltd. | Method, apparatus, and system for modifying substitution costs |
ES2642379T3 (es) * | 2010-11-10 | 2017-11-16 | Rakuten, Inc. | Dispositivo de registro de palabras relacionadas, dispositivo de procesamiento de información, método de registro de palabras relacionadas, programa para dispositivo de registro de palabras relacionadas, y medio de almacenamiento |
US9235654B1 (en) * | 2012-02-06 | 2016-01-12 | Google Inc. | Query rewrites for generating auto-complete suggestions |
US9218333B2 (en) * | 2012-08-31 | 2015-12-22 | Microsoft Technology Licensing, Llc | Context sensitive auto-correction |
US20150149482A1 (en) * | 2013-03-14 | 2015-05-28 | Google Inc. | Using Live Information Sources To Rank Query Suggestions |
GB2513196A (en) | 2013-04-19 | 2014-10-22 | What3Words Ltd | A method and apparatus for identifying and communicating locations |
US9230041B2 (en) * | 2013-12-02 | 2016-01-05 | Qbase, LLC | Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching |
US10380144B2 (en) * | 2015-06-16 | 2019-08-13 | Business Objects Software, Ltd. | Business intelligence (BI) query and answering using full text search and keyword semantics |
-
2015
- 2015-01-06 GB GB1500104.3A patent/GB2535439A/en not_active Withdrawn
-
2016
- 2016-01-02 US US15/542,014 patent/US11017169B2/en active Active
- 2016-01-02 EP EP16700322.7A patent/EP3243142A1/en not_active Withdrawn
- 2016-01-02 WO PCT/EP2016/050002 patent/WO2016110455A1/en active Application Filing
- 2016-01-02 KR KR1020177021489A patent/KR102482391B1/ko active IP Right Grant
- 2016-01-02 CN CN201680005162.1A patent/CN107408108A/zh active Pending
- 2016-01-02 JP JP2017535694A patent/JP6702589B2/ja active Active
-
2017
- 2017-08-01 ZA ZA2017/05193A patent/ZA201705193B/en unknown
Also Published As
Publication number | Publication date |
---|---|
KR20170122727A (ko) | 2017-11-06 |
EP3243142A1 (en) | 2017-11-15 |
JP2018506115A (ja) | 2018-03-01 |
ZA201705193B (en) | 2018-11-28 |
KR102482391B1 (ko) | 2022-12-29 |
CN107408108A (zh) | 2017-11-28 |
WO2016110455A1 (en) | 2016-07-14 |
US11017169B2 (en) | 2021-05-25 |
GB2535439A (en) | 2016-08-24 |
US20170364502A1 (en) | 2017-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6702589B2 (ja) | 電子デバイスにおいて受け付けられた入力ストリングの置き換えとして単語の候補を提案するための方法 | |
US10055439B2 (en) | Fast, scalable dictionary construction and maintenance | |
US20090043741A1 (en) | Autocompletion and Automatic Input Method Correction for Partially Entered Search Query | |
CN111052064B (zh) | 自动提供基于手势的自动完成建议的方法及其电子设备 | |
CN107851108B (zh) | 使用位向量搜索索引的匹配文档 | |
US20090287660A1 (en) | Bit string searching apparatus, searching method, and program | |
CN108304484A (zh) | 关键词匹配方法及装置、电子设备和可读存储介质 | |
CN102063508A (zh) | 基于广义后缀树的中文搜索引擎模糊自动补全方法 | |
US10387543B2 (en) | Phoneme-to-grapheme mapping systems and methods | |
JP5930228B2 (ja) | 情報処理装置、方法及びプログラム | |
US10949465B1 (en) | Efficient graph tree based address autocomplete and autocorrection | |
WO2015075920A1 (ja) | 入力支援装置、入力支援方法及び記録媒体 | |
WO2012015021A1 (en) | Stroke and structure input method and system | |
JP6834109B2 (ja) | 電子デバイスにおいて受け付けられた入力ストリングに基づいて、1又は複数の複数語候補を提案するための方法 | |
US10546061B2 (en) | Predicting terms by using model chunks | |
OA18487A (en) | A method for suggesting candidate words as replacements for an input string received at an electronic device. | |
JP6076285B2 (ja) | 翻訳装置、翻訳方法及び翻訳プログラム | |
CN112286579B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
CN113988091A (zh) | 一种用于笔译过程的数据交互方法与*** | |
CN113569010A (zh) | 过滤检索结果的方法、装置、设备以及存储介质 | |
JP4076533B2 (ja) | 情報変換装置及びプログラム | |
JP2021096761A (ja) | 検索支援装置 | |
WO2020035738A1 (en) | Techniques for automated control of computer programs through text-based user interfaces | |
OA18355A (en) | A method for suggesting one or more multiword candidates based on an input string received at an electronic device. | |
JPH09259124A (ja) | 文書表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6702589 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |