JP5462361B2 - マップサーチのためのクエリパーシング - Google Patents
マップサーチのためのクエリパーシング Download PDFInfo
- Publication number
- JP5462361B2 JP5462361B2 JP2012518721A JP2012518721A JP5462361B2 JP 5462361 B2 JP5462361 B2 JP 5462361B2 JP 2012518721 A JP2012518721 A JP 2012518721A JP 2012518721 A JP2012518721 A JP 2012518721A JP 5462361 B2 JP5462361 B2 JP 5462361B2
- Authority
- JP
- Japan
- Prior art keywords
- token
- location
- score
- type
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 132
- 238000012549 training Methods 0.000 claims description 42
- 238000013179 statistical model Methods 0.000 claims description 31
- 238000000638 solvent extraction Methods 0.000 claims 4
- 230000008569 process Effects 0.000 description 46
- 238000012545 processing Methods 0.000 description 28
- 238000004891 communication Methods 0.000 description 14
- 238000005192 partition Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008439 repair process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000007781 pre-processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241001465382 Physalis alkekengi Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
-単一のタームである、タームユニグラム(term unigram)、
-2つの隣接するタームから成るタームシーケンスである、タームバイグラム(term bigram)、
-タイプ「None」を伴う隣接するタームのシーケンス、
-全てのタームのシーケンス、
-単一のタイプである、タイプユニグラム(type unigram)、
-2つの隣接するタイプから成るタイプシーケンスであるタイプバイグラム(type bigram)、および
-全てのタイプのシーケンス、に対してカウントされる。例えば、住所
タームユニグラム:「北京」(Beijing)、
タームバイグラム:
全てのタームのシーケンス:
タイプユニグラム:「市」(City)、「区」(District)、「路」(Road);
タイプバイグラム:「市、区」(City, District)、「区、路」(District, Road);
全てのタイプのシーケンス:「市、区、路」(City、District、Road);ということになる。
上述の項目において、タイプ「None」を伴う隣接するタームのシーケンスは、この例の中ではカウントされない。なぜなら、トークンシーケンス[ターム:北京(Beijing)、タイプ:市(City)]、[ターム:
-「項目」フィールド510であって、タームユニグラム、タイプユニグラム、ならびに、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、タイプバイグラム、および全てのタイプのシーケンスを含む、タームまたはタイプのシーケンス、の1つの内容を記録するフィールドと、
-「項目タイプ」フィールド520であって、項目が、タームユニグラム、タイプユニグラム、タイプバイグラム、タームバイグラム、タイプ「None」を伴う隣接するタームのシーケンス、全てのタームのシーケンス、および全てのタイプのシーケンス、という項目タイプの中の、どのタイプであるかを記録するフィールドと、
-「タイトルの中の発生回数」フィールド530であって、対応する項目がタイトルの中で何回発生するかを記録するフィールドと、
-「アドレスの中の発生回数」フィールド540であって、対応する項目がアドレスの中で何回発生するかを記録するフィールドとを有する。一部の実装形態においては、モデルエントリは同様に、5番目のフィールドであり、項目の言語を示す「言語」フィールド550を持つことができる。
項目のロケーション統計スコア=log(l_count)*l_count/(l_count+q_count)
---方程式(1)
項目のクエリ統計スコア=log(q_count)*q_count/(l_count+q_count)
---方程式(2)
ここで、l_countおよびq_countは、アドレスおよびタイトルにおける項目の発生回数をそれぞれ表し、これらは、統計モデル250の中に格納される。例えば、タームユニグラム
ターム:北京(Beijing)、タイプ:市(City)
ターム:
ターム:
query_conf = query_score / (query_score + location_score)
...方程式(3)
location_conf = location_score / (query_score + location_score)
...方程式(4)
ここで、query_confおよびlocation_confは、それぞれ、項目のクエリ信頼スコアおよびロケーション信頼スコアであり、query_scoreおよびlocation_scoreは、それぞれ、項目のクエリ統計スコアおよびロケーション統計スコアである。次に、分割のクエリ部に対するクエリ信頼スコアは、クエリ部のタームクエリスコアを決定するために使用される、項目のクエリ信頼スコアの平均として定義され(図8B)、また分割のロケーション部に対するロケーション信頼スコアは、ロケーション部のタームロケーション信頼スコアを決定するために使用される、項目のロケーション信頼スコアの平均として定義される(図7B)。ある分割の分割信頼スコアは、この分割のロケーション部のロケーション信頼スコアと、この分割のクエリ部のクエリ信頼スコアとの平均として定義される。一例として、分割信頼スコアは、[0、1]の範囲内の値を有し、分割信頼スコアが高いほど、分割の正しさにおける信頼がある。分割信頼スコアは同様に、パーシングモジュール230により参考として出力することができる追加のパーシング結果である。
120 サーバ
130 ネットワーク
140 マップサーチシステム
200 パーシングシステム
210 トークン化モジュール
220 モデル訓練モジュール
230 パーシングモジュール
240 辞書
250 統計モデル
1002 処理装置
1004 第1のデータストア
1006 第2のデータストア
1008 入力装置
1110 出力装置
1012 ネットワークインターフェース
Claims (20)
- コンピュータ実装される方法であって、
マップサーチのためにユーザから受信した入力エントリを複数のトークンを含むトークンシーケンスにパーシングするステップであって、各トークンが、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを含む、ステップと、
前記トークンシーケンスの可能な分割位置を決定するステップであって、各可能な分割位置は、ロケーション情報を含む可能なロケーションサブシーケンスと、検索対象を示す可能なクエリサブシーケンスとに、前記トークンシーケンスを分割する、ステップと、
前記可能な分割位置の各々について分割スコアを決定するステップと、
最も高い分割スコアを有する前記可能な分割位置から、ロケーションサブシーケンスおよびクエリサブシーケンスを選択するステップと、
前記ロケーションサブシーケンスによって示されるロケーションに近いロケーションに関連する前記クエリサブシーケンスに応答する情報を検索するステップとを含む、ことを特徴とする方法。 - 前記入力エントリを前記トークンシーケンスにパーシングするステップは、
アドレスタイプのトークンとして前記入力エントリ中で単語を特定するために、アドレス関連単語の辞書を使用するステップを含む、ことを特徴とする請求項1に記載の方法。 - 前記辞書のアドレス関連単語が、行政区名、道路名、アドレス関連サフィックス、アドレス関連プリフィックス、および番号の、少なくとも1つを含む、ことを特徴とする請求項2に記載の方法。
- 「Road」のタイプを伴うトークンと「Number」のタイプを伴うトークンとの間の分割位置を禁止するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記トークンシーケンスの前記可能な分割位置を決定するステップは、
各可能な分割位置について、前記可能な分割位置から生成された2つのトークンサブシーケンスの各々に対して、ロケーション統計スコアおよびクエリ統計スコアを決定するステップと、
前記可能なロケーションサブシーケンスとしてより高いロケーション統計スコアを有する前記トークンサブシーケンスを、かつ前記可能なクエリサブシーケンスとして他のトークンサブシーケンスを特定するステップとをさらに含む、ことを特徴とする請求項1に記載の方法。 - 前記可能な分割位置のそれぞれに対して前記分割スコアを決定するステップは、
各可能な分割位置について、前記可能な分割位置に対する前記分割スコアを決定するために、前記可能なロケーションサブシーケンスとして特定された前記トークンサブシーケンスの前記ロケーション統計スコア、または前記可能なクエリサブシーケンスとして特定された前記トークンサブシーケンスの前記クエリ統計スコアの少なくとも1つを使用するステップを含む、ことを特徴とする請求項5に記載の方法。 - トークンサブシーケンスの前記ロケーション統計スコアまたは前記クエリ統計スコアの少なくとも1つが、統計モデルを参照することにより決定され、トークンサブシーケンスの前記ロケーション統計スコアが、前記トークンサブシーケンスがロケーションである確率を示し、および前記トークンサブシーケンスのクエリ統計スコアが、前記トークンサブシーケンスがクエリである確率を示す、ことを特徴とする請求項5に記載の方法。
- 前記統計モデルが、タイトルおよびアドレスを含む訓練データに基づいて生成される、ことを特徴とする請求項7に記載の方法。
- 訓練データアドレスが、前記訓練データアドレスの中のトレーリングタイトルを除去するために前処理され、および訓練データタイトルが、前記訓練データタイトルの中の接頭されている行政区名を除去するために、訓練データとして使用される前に前処理される、ことを特徴とする請求項8に記載の方法。
- 前記統計モデルが、
タイトルおよびアドレスを含む前記訓練データのそれぞれを、複数のトークンを含み、各トークンがタームと、前記タームにアノテートされたタイプとを含むトークンシーケンスにパーシングするステップと、
前記訓練データのトークン化されたタイトルおよびアドレス中に現れる複数の項目の発生回数をカウントおよび格納するステップと、により生成され、
複数の項目は、単一のタームから成るユニグラム、2つの隣接するタームから成るバイグラム、タイプ「None」を伴う隣接するタームから成るシーケンス、トークン化されたタイトルまたはアドレス内に現れる全てのタームのシーケンス、ユニグラムに関連するタイプから成るタイプユニグラム、バイグラムに関連するタイプから成るタイプバイグラム、またはシーケンスに関連するタイプから成るタイプのシーケンス、のうちのいずれか1つを複数含む、ことを特徴とする請求項8に記載の方法。 - 前記可能な分割位置の各々に対する前記分割スコアは、前記可能なロケーションサブシーケンスとして特定された前記トークンサブシーケンスの前記ロケーション統計スコアと、前記可能なクエリサブシーケンスとして特定された前記トークンサブシーケンスの前記クエリ統計スコアとの合計によって決定される、ことを特徴とする請求項6に記載の方法。
- 前記可能な分割位置について前記可能なクエリサブシーケンスのための前記クエリ統計スコアは、前記可能なクエリサブシーケンス中のトークン数に基づくクエリ乗数を含む、ことを特徴とする請求項11に記載の方法。
- 前記可能な分割位置について前記可能なクエリサブシーケンスのための前記クエリ統計スコアは、ロケーション乗数を含み、前記ロケーション乗数は、前記可能なロケーションサブシーケンスが、階層順にアドレスタイプのタームを有する場合、前記ロケーションに関連するベースロケーション乗数および付加的な乗数を含む、ことを特徴とする請求項11に記載の方法。
- トークンサブシーケンスのためのロケーション統計スコアまたはクエリ統計スコアを決定する前記ステップが、
前記トークンサブシーケンス中に現れる項目のスコアに基づいて、前記トークンサブシーケンスのためのタームスコアを決定するステップであって、前記項目のスコアは、訓練データの集成のタイトルおよびアドレス中の項目のカウントに基づく、ステップと、
前記トークンサブシーケンス中に現れる項目タイプのスコアに基づいて、前記トークンサブシーケンスのためのタームスコアを決定するステップであって、前記項目タイプのスコアは、訓練データの集成のタイトルおよびアドレス中の項目タイプのカウントに基づく、ステップと、
前記タームスコアおよび前記トークンシーケンスの前記タイプのスコアを加えるステップとを含む、ことを特徴とする請求項7に記載の方法。 - ロケーション統計スコアを決定するための前記項目のスコアは、log(l_count)*l_count/(l_count+q_count)によって決定され、l_countおよびq_countは、訓練データの前記集成中のアドレスおよびタイトル内の前記項目の発生回数を表す、ことを特徴とする請求項14に記載の方法。
- クエリ統計スコアを決定するための前記項目のスコアは、log(q_count)*q_count/(l_count+q_count)によって決定され、l_countおよびq_countは、訓練データの前記集成中のアドレスおよびタイトル内の前記項目の発生回数を表す、ことを特徴とする請求項14に記載の方法。
- 前記入力エントリの前記トークンシーケンスに前記パーシングするステップは、
前記トークンシーケンスの中で、誤ってアノテートされたタイプを有するトークンを修復するステップをさらに含む、ことを特徴とする請求項1に記載の方法。 - 前記トークンシーケンスの中で、誤ってアノテートされたタイプを有するトークンを修復する前記ステップは、
前記トークンが、前記タイプ「Number」のトークンに続かない場合、前記タイプ「数量サフィックス」のトークンを、前記タイプ「None」のトークンへと変更するステップを含む、ことを特徴とする請求項17に記載の方法。 - 1または複数のコンピュータと、命令を格納する1または複数の記録装置とを具備するシステムであって、前記命令は、前記1または複数のコンピュータによって実行されるときに、
マップサーチのためにユーザから受信した入力エントリを1または複数のトークンのトークンシーケンスにパーシングするステップであって、各トークンは、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを有し、前記タームにアノテートされた前記タイプは、前記タームがアドレス関連情報および前記アドレス関連情報のタイプを含むかどうかを示す、ステップと、
前記トークンシーケンスの可能な分割位置を決定するステップであって、可能な分割位置は、前記トークンシーケンスを1または2のサブシーケンスに分割する、ステップと、
前記可能な分割位置の各々に対する可能な分割方法を決定するステップであって、各可能な分割可能方法は、(1)ロケーション情報を示す可能なロケーション部と、(2)前記ロケーション部に関連する検索対象を示す可能なクエリ部との少なくとも1に、前記トークンシーケンスを分割する、ステップと、
前記可能な分割方法の各々の発生確率に対する分割スコアを決定するステップと、
結果として得られた分割方法として、最も高い分割スコアを有する前記可能な分割方法を選択するステップと、
前記結果として得られた分割方法の前記ロケーション部に基づいて地理的領域またはロケーションを取得するとともに、前記結果として得られた分割方法の前記クエリ部に関連し、かつ、前記取得された地理的領域またはロケーションの所に、中に、または近くに位置する1または複数のエンティティに関する情報を検索するためにマップサーチを実行するステップと、を含む動作を前記1または複数のコンピュータに実行させる、ことを特徴とするシステム。 - 命令を格納する機械読み取り可能な記録媒体であって、前記命令は、機械により実行されるとき、
マップサーチのためにユーザから受信した入力エントリを1または複数のトークンのトークンシーケンスにパーシングするステップであって、各トークンは、前記入力エントリのセグメントを表すタームと、前記タームにアノテートされたタイプとを有し、前記タームにアノテートされた前記タイプは、前記タームがアドレス関連情報および前記アドレス関連情報のタイプを含むかどうかを示す、ステップと、
前記トークンシーケンスの可能な分割位置を決定するステップであって、可能な分割位置は、前記トークンシーケンスを1または2のサブシーケンスに分割する、ステップと、
前記可能な分割位置の各々に対する可能な分割方法を決定するステップであって、各可能な分割可能方法は、(1)ロケーション情報を示す可能なロケーション部と、(2)前記ロケーション部に関連する検索対象を示す可能なクエリ部との少なくとも1に、前記トークンシーケンスを分割する、ステップと、
前記可能な分割方法の各々の発生確率に対する分割スコアを決定するステップと、
結果として得られた分割方法として、最も高い分割スコアを有する前記可能な分割方法を選択するステップと、
前記結果として得られた分割方法の前記ロケーション部に基づいて地理的領域またはロケーションを取得するとともに、前記結果として得られた分割方法の前記クエリ部に関連し、かつ、前記取得された地理的領域またはロケーションの所に、中に、または近くに位置する1または複数のエンティティに関する情報を検索するためにマップサーチを実行するステップと、を含む動作を前記機械に実行させる、ことを特徴とする機械読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2009/072667 WO2011003232A1 (en) | 2009-07-07 | 2009-07-07 | Query parsing for map search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012532388A JP2012532388A (ja) | 2012-12-13 |
JP5462361B2 true JP5462361B2 (ja) | 2014-04-02 |
Family
ID=43428731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012518721A Active JP5462361B2 (ja) | 2009-07-07 | 2009-07-07 | マップサーチのためのクエリパーシング |
Country Status (5)
Country | Link |
---|---|
US (1) | US8745065B2 (ja) |
JP (1) | JP5462361B2 (ja) |
KR (1) | KR101516858B1 (ja) |
CN (1) | CN102483748B (ja) |
WO (1) | WO2011003232A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8150848B2 (en) * | 2008-01-04 | 2012-04-03 | Google Inc. | Geocoding multi-feature addresses |
US8255379B2 (en) * | 2009-11-10 | 2012-08-28 | Microsoft Corporation | Custom local search |
US8595812B2 (en) | 2009-12-18 | 2013-11-26 | Sabre Inc. | Tokenized data security |
US8473431B1 (en) | 2010-05-14 | 2013-06-25 | Google Inc. | Predictive analytic modeling platform |
CA2712028C (en) * | 2010-08-25 | 2011-12-20 | Ibm Canada Limited - Ibm Canada Limitee | Geospatial database integration using business models |
US8533224B2 (en) * | 2011-05-04 | 2013-09-10 | Google Inc. | Assessing accuracy of trained predictive models |
US20120317104A1 (en) * | 2011-06-13 | 2012-12-13 | Microsoft Corporation | Using Aggregate Location Metadata to Provide a Personalized Service |
US9009183B2 (en) * | 2011-11-03 | 2015-04-14 | Microsoft Technology Licensing, Llc | Transformation of a system change set from machine-consumable form to a form that is readily consumable by a human |
CN102426596B (zh) * | 2011-11-03 | 2014-07-30 | 北京地拓科技发展有限公司 | 地图加载方法和装置 |
CN102571910B (zh) * | 2011-11-16 | 2014-08-13 | 腾讯科技(深圳)有限公司 | 在社交网络中查找附近用户的方法和服务器 |
US9275147B2 (en) * | 2012-06-18 | 2016-03-01 | Google Inc. | Providing query suggestions |
US9268822B2 (en) * | 2012-07-18 | 2016-02-23 | Salesforce.Com, Inc. | System and method for determining organizational hierarchy from business card data |
CN104662527A (zh) * | 2012-08-10 | 2015-05-27 | 诺基亚公司 | 用于提供众包地理编码的方法和装置 |
US9767121B2 (en) * | 2013-02-12 | 2017-09-19 | C/O Vmobo, Inc. | Location-based mobile search |
CN105209858B (zh) * | 2013-03-15 | 2018-11-16 | 邓白氏公司 | 企业场所数据的非确定性消岐和匹配 |
WO2014145059A2 (en) | 2013-03-15 | 2014-09-18 | Bell Tyler | Apparatus, systems, and methods for analyzing movements of target entities |
US9047325B2 (en) * | 2013-04-08 | 2015-06-02 | International Business Machines Corporation | Modularizing complex XML data for generation and extraction |
WO2014173965A1 (en) * | 2013-04-23 | 2014-10-30 | Face Recording And Measurements Ltd. | Database management system |
US10204139B2 (en) * | 2013-05-06 | 2019-02-12 | Verizon Patent And Licensing Inc. | Systems and methods for processing geographic data |
CN103631839B (zh) * | 2013-06-27 | 2017-08-29 | 西南科技大学 | 一种页面地域权重模型实现方法 |
US9830354B2 (en) | 2013-08-07 | 2017-11-28 | International Business Machines Corporation | Accelerating multiple query processing operations |
US9619499B2 (en) | 2013-08-07 | 2017-04-11 | International Business Machines Corporation | Hardware implementation of a tournament tree sort algorithm |
US9495418B2 (en) | 2013-08-07 | 2016-11-15 | International Business Machines Corporation | Scalable acceleration of database query operations |
US9251218B2 (en) | 2013-08-07 | 2016-02-02 | International Business Machines Corporation | Tunable hardware sort engine for performing composite sorting algorithms |
US9727595B2 (en) * | 2013-09-20 | 2017-08-08 | Uber Technologies, Inc. | Location searching with category indices |
GB2522432A (en) * | 2014-01-23 | 2015-07-29 | Locpin Ltd | Computer system and method |
US9465811B2 (en) * | 2014-03-20 | 2016-10-11 | Facebook, Inc. | Polygon-based indexing of places |
US9582515B1 (en) | 2014-04-11 | 2017-02-28 | Google Inc. | Detecting queries for specific places |
US9519802B2 (en) | 2014-05-07 | 2016-12-13 | American Express Travel Related Services Company, Inc. | Systems and methods for document and data protection |
WO2015191010A1 (en) * | 2014-06-12 | 2015-12-17 | Sun Vasan | Searching for a map using an input image as a search query |
US10127275B2 (en) | 2014-07-11 | 2018-11-13 | International Business Machines Corporation | Mapping query operations in database systems to hardware based query accelerators |
US9953171B2 (en) * | 2014-09-22 | 2018-04-24 | Infosys Limited | System and method for tokenization of data for privacy |
US10310813B2 (en) | 2014-12-29 | 2019-06-04 | International Business Machines Corporation | Hardware implementation of a tournament tree sort algorithm using an external memory |
US20160196349A1 (en) * | 2015-01-07 | 2016-07-07 | Microsoft Technology Licensing, Llc | Geocoding multi-entity queries |
US9881166B2 (en) * | 2015-04-16 | 2018-01-30 | International Business Machines Corporation | Multi-focused fine-grained security framework |
US10002128B2 (en) * | 2015-09-09 | 2018-06-19 | Samsung Electronics Co., Ltd. | System for tokenizing text in languages without inter-word separation |
US10268756B2 (en) | 2015-12-18 | 2019-04-23 | Here Global B.V. | Method and apparatus for providing natural language input in a cartographic system |
US10282466B2 (en) * | 2015-12-31 | 2019-05-07 | Samsung Electronics Co., Ltd. | Machine processing of search query based on grammar rules |
US10671932B1 (en) * | 2017-01-27 | 2020-06-02 | Intuit Inc. | Software application selection models integration |
US11640436B2 (en) | 2017-05-15 | 2023-05-02 | Ebay Inc. | Methods and systems for query segmentation |
CN107491489A (zh) * | 2017-07-18 | 2017-12-19 | 深圳天珑无线科技有限公司 | 一种地图搜索方法、装置及计算机可读存储介质 |
CN110019617B (zh) * | 2017-12-05 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 地址标识的确定方法和装置、存储介质、电子装置 |
US10606851B1 (en) * | 2018-09-10 | 2020-03-31 | Palantir Technologies Inc. | Intelligent compute request scoring and routing |
US10783175B2 (en) * | 2018-09-28 | 2020-09-22 | Microsoft Technology Licensing, Llc | Expanding search queries using query term weighting |
US11010376B2 (en) | 2018-10-20 | 2021-05-18 | Verizon Patent And Licensing Inc. | Methods and systems for determining search parameters from a search query |
CN109657034A (zh) * | 2018-11-05 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 地址相似度计算方法及其*** |
US11120007B2 (en) | 2018-11-26 | 2021-09-14 | Palantir Technologies Inc. | Module expiration management |
US10409641B1 (en) | 2018-11-26 | 2019-09-10 | Palantir Technologies Inc. | Module assignment management |
US11293776B2 (en) | 2018-11-27 | 2022-04-05 | Verizon Patent And Licensing Inc. | Smart geocoding of road intersections |
US20200183936A1 (en) * | 2018-12-10 | 2020-06-11 | Teradata Us, Inc. | Predictive query parsing time and optimization |
CN109783589B (zh) * | 2018-12-13 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 电子地图解析地址的方法、装置及存储介质 |
US11631047B2 (en) * | 2019-04-12 | 2023-04-18 | Flipkart Internet Pvt. Ltd. | System and method of geocoding |
CN111159239B (zh) * | 2019-12-31 | 2024-03-05 | 北京四维图新科技股份有限公司 | 搜索方法和设备 |
CN113094600A (zh) | 2020-01-08 | 2021-07-09 | 百度在线网络技术(北京)有限公司 | 电子地图的搜索方法、装置、设备和介质 |
CN113849531B (zh) * | 2021-09-23 | 2024-03-22 | 北京百度网讯科技有限公司 | 查询方法及装置 |
CN117786242B (zh) * | 2024-02-26 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种基于位置的搜索方法及相关装置 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2583879B2 (ja) * | 1987-03-16 | 1997-02-19 | 日本電信電話株式会社 | 情報検索装置 |
JP3199093B2 (ja) * | 1993-12-13 | 2001-08-13 | シャープ株式会社 | 住所情報検索装置 |
JP2001249922A (ja) * | 1999-12-28 | 2001-09-14 | Matsushita Electric Ind Co Ltd | 単語分割方式及び装置 |
CA2414379A1 (en) | 2000-06-30 | 2002-01-10 | Troy Schultz | Method and apparatus for a gis based search engine utilizing real time advertising |
US20070027672A1 (en) * | 2000-07-31 | 2007-02-01 | Michel Decary | Computer method and apparatus for extracting data from web pages |
US7207012B1 (en) * | 2003-01-30 | 2007-04-17 | Sprint Communications Company L.P. | System and method for mapping deployment status of high bandwidth metropolitan area networks |
EP1604309A2 (en) | 2003-03-18 | 2005-12-14 | Metacarta, Inc. | Corpus clustering, confidence refinement, and ranking for geographic text search and information retrieval |
US7752210B2 (en) * | 2003-11-13 | 2010-07-06 | Yahoo! Inc. | Method of determining geographical location from IP address information |
JP4246055B2 (ja) * | 2003-12-19 | 2009-04-02 | アルパイン株式会社 | 車載用ナビゲーション装置及び周辺施設検索表示方法 |
US20070168370A1 (en) * | 2004-11-16 | 2007-07-19 | Hardy Mark D | System and methods for provisioning geospatial data |
JP2006162516A (ja) * | 2004-12-09 | 2006-06-22 | Fujitsu Ten Ltd | 情報端末装置 |
US7483881B2 (en) * | 2004-12-30 | 2009-01-27 | Google Inc. | Determining unambiguous geographic references |
US7506254B2 (en) * | 2005-04-21 | 2009-03-17 | Google Inc. | Predictive conversion of user input |
JP5064388B2 (ja) * | 2005-07-13 | 2012-10-31 | グーグル・インコーポレーテッド | 位置識別方法 |
US20080086356A1 (en) * | 2005-12-09 | 2008-04-10 | Steve Glassman | Determining advertisements using user interest information and map-based location information |
US8924269B2 (en) * | 2006-05-13 | 2014-12-30 | Sap Ag | Consistent set of interfaces derived from a business object model |
CN101136028B (zh) * | 2006-07-10 | 2012-07-04 | 日电(中国)有限公司 | 基于自然语言的位置查询***以及基于关键词的位置查询*** |
JP4926689B2 (ja) | 2006-12-18 | 2012-05-09 | 三菱電機株式会社 | 施設検索装置 |
US8359309B1 (en) * | 2007-05-23 | 2013-01-22 | Google Inc. | Modifying search result ranking based on corpus search statistics |
WO2008156600A1 (en) * | 2007-06-18 | 2008-12-24 | Geographic Services, Inc. | Geographic feature name search system |
CN101350013A (zh) * | 2007-07-18 | 2009-01-21 | 北京灵图软件技术有限公司 | 一种地理信息的搜索方法和*** |
US7983913B2 (en) * | 2007-07-31 | 2011-07-19 | Microsoft Corporation | Understanding spoken location information based on intersections |
JP4962959B2 (ja) | 2007-07-31 | 2012-06-27 | ヤフー株式会社 | 地図上の領域を求める方法 |
JP2009104450A (ja) | 2007-10-24 | 2009-05-14 | Nagoya Institute Of Technology | Webチャットの観測に基づく商品推薦システム |
US8364470B2 (en) * | 2008-01-15 | 2013-01-29 | International Business Machines Corporation | Text analysis method for finding acronyms |
US20090210388A1 (en) * | 2008-02-20 | 2009-08-20 | Microsoft Corporation | Efficiently discovering and synthesizing maps from a large corpus of maps |
GB2460045A (en) | 2008-05-13 | 2009-11-18 | Triad Group Plc | Analysing multiple data sources for a user request using business and geographical data, with selected rule sets to filter the data on the databases. |
US8364462B2 (en) * | 2008-06-25 | 2013-01-29 | Microsoft Corporation | Cross lingual location search |
US8521731B2 (en) * | 2008-07-09 | 2013-08-27 | Yahoo! Inc. | Systems and methods for query expansion in sponsored search |
US8666652B2 (en) * | 2008-09-30 | 2014-03-04 | Sas Institute Inc. | System and method for running stored statistical processes using a web-based graphical information system |
US8015172B1 (en) * | 2009-07-03 | 2011-09-06 | eBridge, Inc. | Method of conducting searches on the internet to obtain selected information on local entities and provide for searching the data in a way that lists local businesses at the top of the results |
KR101289082B1 (ko) | 2009-09-02 | 2013-07-22 | 한국전자통신연구원 | 지역 정보 서비스 제공 시스템 및 그 방법 |
US8255379B2 (en) | 2009-11-10 | 2012-08-28 | Microsoft Corporation | Custom local search |
-
2009
- 2009-07-07 JP JP2012518721A patent/JP5462361B2/ja active Active
- 2009-07-07 KR KR1020127000638A patent/KR101516858B1/ko active IP Right Grant
- 2009-07-07 US US13/383,181 patent/US8745065B2/en not_active Expired - Fee Related
- 2009-07-07 WO PCT/CN2009/072667 patent/WO2011003232A1/en active Application Filing
- 2009-07-07 CN CN200980161026.1A patent/CN102483748B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102483748B (zh) | 2016-04-20 |
KR101516858B1 (ko) | 2015-05-04 |
WO2011003232A1 (en) | 2011-01-13 |
US20120278339A1 (en) | 2012-11-01 |
KR20120123241A (ko) | 2012-11-08 |
JP2012532388A (ja) | 2012-12-13 |
CN102483748A (zh) | 2012-05-30 |
US8745065B2 (en) | 2014-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5462361B2 (ja) | マップサーチのためのクエリパーシング | |
US10657460B2 (en) | Systems and methods to facilitate local searches via location disambiguation | |
US7890493B2 (en) | Translating a search query into multiple languages | |
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
JP5064388B2 (ja) | 位置識別方法 | |
CN1871603B (zh) | 处理查询的***和方法 | |
US7937402B2 (en) | Natural language based location query system, keyword based location query system and a natural language and keyword based location query system | |
US9928296B2 (en) | Search lexicon expansion | |
US20160078047A1 (en) | Method for obtaining search suggestions from fuzzy score matching and population frequencies | |
KR101945749B1 (ko) | 데이터베이스 검색방법, 네비게이션 장치 및 인덱스 구조 생성 방법 | |
US20060212433A1 (en) | Prioritization of search responses system and method | |
US9740767B2 (en) | Systems and methods for analyzing failed and successful search queries | |
CN107203526B (zh) | 一种查询串语义需求分析方法及装置 | |
WO2015065719A1 (en) | Computerized systems and methods for identifying a character string for a point of interest | |
US9703871B1 (en) | Generating query refinements using query components | |
JP2004046775A (ja) | 固有表現抽出装置及び方法並びに固有表現抽出プログラム | |
CN116069897A (zh) | 查询纠错方法、装置、计算机设备、存储介质及程序产品 | |
KR20120009817A (ko) | 검색 서비스 제공 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5462361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |