JP2023530795A

JP2023530795A - 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置

Info

Publication number: JP2023530795A
Application number: JP2022543043A
Authority: JP
Inventors: ファン、ミアオ; フアン、ジジョウ; ワン、ハイフェン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-05-24
Filing date: 2021-11-17
Publication date: 2023-07-20
Also published as: EP4174712A4; WO2022247165A1; CN113342912B; CN113342912A; EP4174712A1; US20240177469A1; KR20220160534A

Abstract

本開示は、人工知能技術の分野のビッグデータとディープラーニング技術に関する地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置を開示する。具体的な実現案は、符号化される地理的位置区域を決定し、前記地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得し、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得する。本開示は、地理的位置区域に対する合理的な符号化を実現して、地理的機能と地物分布が類似する地理的位置区域の符号化結果がより類似するようになる。

Description

本開示は、出願日が２０２１年０５月２４日であり、出願番号が２０２１１０５６５４３４．６であり、発明の名称が「地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置」である中国特許出願の優先権を主張する。
本開示は、コンピュータアプリケーション技術の分野に関し、特に、人工知能技術におけるビッグデータとディープラーニング技術に関する。

モバイルインターネット技術の急速な発展に伴い、モバイルインターネットアプリケーションは各方面から私たちの生活に影響を与えている。ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ、パーソナルコンピュータ）時代とは異なり、ほとんどのモバイルアプリケーションにはすべて新しい次元の情報である地理的位置が追加される。

地理的位置の記録と応用を容易にするために、異なる地理的位置領域を合理的に符号化する必要がある。

これに鑑みて、本開示は、地理的位置区域の合理的な符号化を実現するために、地理的位置区域の符号化方法、装置、機器、及びコンピュータ記憶媒体を提供する。

本開示の第１の態様によれば、符号化モデルを確立する方法を提供し、
トレーニングデータを取得するステップであって、前記トレーニングデータは、１つ以上の３つ組を含み、前記３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含むステップと、
前記トレーニングデータを使用して符号化モデルをトレーニングするステップであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するステップと、を含み、
前記符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。

本開示の第２の態様によれば、地理的位置区域の符号化方法を提供し、
符号化される地理的位置区域を決定するステップと、
前記地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得するステップと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するステップと、を含む。

本開示の第３の態様によれば、符号化モデルを確立する装置を提供し、
トレーニングデータを取得するための取得ユニットであって、前記トレーニングデータは、１つ以上の３つ組を含み、前記３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む取得ユニットと、
前記トレーニングデータを使用して符号化モデルをトレーニングするためのトレーニングユニットであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するトレーニングユニットと、を含み、
前記符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。

本開示の第４の態様によれば、地理的位置区域の符号化装置を提供し、
符号化される地理的位置区域を決定するための決定ユニットと、
前記地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得するための取得ユニットと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するための符号化ユニットと、を含む。

本開示の第５の態様によれば、電子機器を提供し、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる。

本開示の第６の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに上記の方法を実行させる。

本開示の第７の態様によれば、コンピュータプログラム製品を提供し、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行される時に上記の方法を実現する。

上記の技術的解決策から分かるように、本開示により提供される符号化モデルは、地理的位置区域の地理的機能情報と地物分布情報に基づいて符号化して、地理的機能と地物分布が類似する地理的位置区域の符号化結果をより類似させることができ、このような符号化方式は従来の符号化方式と比較してより合理的である。

本明細書で説明された内容は、本開示の実施例のキー又は重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。

図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示の実施例により提供される符号化モデルを確立する方法のフローチャートである。本開示の実施例により提供される符号化モデルの概略構造図である。本開示の実施例により提供される地理的位置区域の符号化方法のフローチャートである。本開示の実施例により提供されるアプリケーション地理的位置区域符号化結果の例示的な図である。本開示の実施例により提供される符号化モデルを確立する装置の構造図である。本開示の実施例により提供される地理的位置区域の符号化装置の構造図である。本開示の実施例を実現するための電子機器のブロック図である。

以下、図面に基づいて、本開示の例示的な実施例を説明する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。

地理的位置区域符号化は、１つのコードを使用して地理的位置区域を表して、限られた地理的位置区域セットでそれを他の地理的位置区域と区別するために用いられる。

地理的位置区域は、１つの都市、１つの区、１つの街区など、行政区画に従って分割することができる。１ｋｍ×１ｋｍの区画に分割し、各区画を１つの地理的位置区域とするなど、予め設定された精度と形状に従って分割することもできる。

現在、すべての従来の地理的区域符号化方式は、すべて「実際の空間距離に近い地理的位置区域はより類似した符号化を有する」この原則に従い、つまり、従来の地理的位置区域の符号化は位置情報に基づいて行われ、例えば、一般に用いられるＧｅｏＨａｓｈ符号化である。しかし、実際の応用では、これらの符号化方式は合理的ではない。本開示の核心構想は、「地理的機能と地物分布が類似する地理的位置区域はより類似した符号化を有する」この原則に基づく。以下は実施例を組み合わせて本開示により提供される方法を詳細に説明する。

本開示における地理的位置区域の符号化は、主に符号化モデルに基づいて実現されるため、主に、符号化モデルを確立する段階と符号化モデルを使用して地理的位置区域を符号化する段階の２つの段階を含む。以下はこの２つの段階をそれぞれ説明する。

図１は本開示の実施例により提供される符号化モデルを確立する方法のフローチャートである。当該方法の実行主体は、符号化モデルを確立する装置であってもよく、当該装置は、サーバ側のアプリケーションに位置することができ、又はサーバ側のアプリケーションのプラグイン又はソフトウェア開発キット（ＳｏｆｔｗａｒｅＤｅｖｅｌｏｐｍｅｎｔＫｉｔ、ＳＤＫ）などの機能ユニットに位置することもでき、又は、高い計算能力を備えるコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図１に示すように、当該方法は、以下のステップを含むことができ、
１０１では、トレーニングデータを取得し、トレーニングデータは、１つ以上の３つ組を含み、３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。

１０２では、トレーニングデータを使用して符号化モデルをトレーニングし、符号化モデルはサンプルごとにそれぞれ以下の内容を実行し、前記内容は、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得し、符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。

上記の実施例に示す技術的解決策から分かるように、確立された符号化モデルは、地理的位置区域の地理的機能情報と地物分布情報に基づいて符号化して、地理的機能と地物分布が類似する地理的位置区域の符号化結果をより類似させることができる。以下は実施例を組み合わせて上記の各ステップを詳細に説明する。

まず、実施例を組み合わせて上記のステップ１０１、すなわち「トレーニングデータを取得する」を詳細に説明する。

本開示で使用されるトレーニングデータは、すべて３つ組を使用し、各３つ組は、アンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。各サンプルは、すべて地理的位置区域である。ポジティブサンプルは、地理的機能と地物分布においてアンカーサンプルと非常に類似した地理的位置区域である。ネガティブサンプルは、地理的機能と地物分布においてアンカーサンプルと類似しない地理的位置区域である。

トレーニングデータの各３つ組は人工的な方式で選択することができる。このような方式は正確性が高いが、人件費の消費も高く、効率が低い。したがって、本開示の実施例ではいくつかの自動的にトレーニングデータを取得する方式を提供し、例えば、以下のいくつかの方式に限られていない。
第１の方式：地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択する。

本方式では、予め分割された各地理的位置区域からアンカーサンプルを選択することができる。アンカーサンプルのポジティブサンプルを選択する場合、隣接する２つの地理的位置区域は地理的機能と地物分布で類似する可能性が高いため、アンカーサンプルの隣接地理的位置区域からポジティブサンプルとして１つを選択することができる。選択方式は、ランダムに選択する方式であってもよく、一定の規則に従って選択する方式であってもよい。アンカーサンプルのネガティブサンプルを選択する場合、非隣接地理的位置区域からネガティブサンプルとして１つを選択することができる。選択方式は、同様にランダムに選択する方式であってもよく、一定の規則に従って選択する方式であってもよい。

第２の方式：ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する。

ユーザの慣習的な好みに基づいて、出発地と目的地は、地理的機能と地物分布で類似する可能性が高い。したがって、ナビゲーションログから大量のユーザのナビゲーション情報を取得し、ナビゲーション開始点とナビゲーション終了点で構成された所在地理的位置区域ペアを統計し、出現頻度又は出現回数が一定の条件を満たす地理的位置区域ペアをアンカーサンプルとポジティブサンプルとすることができる。アンカーサンプルのネガティブサンプルはポジティブサンプルとアンカーサンプル以外の他の地理的位置区域からランダムに選択することができる。

第３の方式：検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとしてランダムに選択する。

類似して、ユーザの慣習的な好みに基づいて、ユーザが検索を開始した位置と検索したターゲット位置が地理的機能と地物分布で類似する可能性が大きい。したがって、検索ログから大量のユーザの検索情報を取得することができる。検索した開始位置とターゲット位置で構成された所在地理的位置区域ペアを統計し、出現頻度又は出現回数が一定の条件を満たす地理的位置区域ペアをアンカーサンプルとポジティブサンプルとすることができる。アンカーサンプルのネガティブサンプルはポジティブサンプルとアンカーサンプル以外の他の地理的位置区域からランダムに選択することができる。

以下は実施例を組み合わせて上記のステップ１０２、すなわち「トレーニングデータを使用して符号化モデルをトレーニングする」のプロセスを詳細に説明する。

トレーニングデータ内の各３つ組について、３つ組内のサンプルに対して少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報をそれぞれ抽出する。

地理的機能情報は、ＰＯＩ（ＰｏｉｎｔＯｆＩｎｔｅｒｅｓｔ、関心ポイント）情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含むことができる。

ＰＯＩ情報は、地理的位置区域に含まれたＰＯＩ名称、ＰＯＩタイプ、ＰＯＩ数、住所などを含むことができる。これらのＰＯＩ情報は、主に、地理的位置区域の地理的機能を反映することができる。例えば、ディズニーランドと遊園地が位置する地理的位置区域の地理的機能は類似する。

ユーザ情報は、地理的位置区域内のユーザの年齢分布、性別比率、職業タイプ分布、学歴状況、及び給与状況などを含むことができる。例えば、科学技術園類の地理的位置区域内のユーザは、男性が多く、２５歳～３５歳間、プログラマー、大学以上の学歴、給与が高い特徴を呈する。

当該地理的位置区域で開始された場所クエリワードは、主に、当該地理的位置区域のユーザ好みを反映し、地理的位置区域の地理的機能もある程度で反映する。この部分のデータは、検索ログから取得し、検索ログ内の当該地理的位置区域で開始された場所クエリワードを統計し、出現頻度又は出現回数が一定の条件を満たす場所クエリワードを取得することもできる。

地物分布情報は、地理的位置区域の地図画像と実景画像のうちの少なくとも１つを含むことができる。これらの画像は、地図類アプリケーションのサービス側又はデータベースから取得することができる。

地理的位置区域の地図画像は、地図で表示される当該地理的位置区域の画像であってもよい。当該地図画像は、衛星画像であってもよく、ベースマップ画像であってもよい。地図画像は、例えば、陸地、水系、緑地などのさまざまな区域タイプの地図要素を含み、例えば、高速道路、都市主路、鉄道などの道路も含み、例えば、観光地、ホテル、学校、デパート、店舗、オフィスビル、スタジアムなどのさまざまなタイプのＰＯＩを含むこともできる。地図画像は、地理的位置区域の地物分布をよく反映する。

実景画像とは、実際の景色に基づいて描画又は撮影された画像を指し、例えば、ストリートビュー画像であってもよい。実景画像も地理的位置区域の地物分布をよく反映する。

以下の実施例の説明と理解を容易にするために、後続の実施例では地理的位置区域（各サンプル）からＰＯＩ情報、ユーザ情報、当該地理的位置区域で開始された場所クエリワード、地図画像、及び実景画像のこの５つのタイプの特徴を抽出することを例とし、この５つのタイプの特徴は、Ｘ_１、Ｘ_２、Ｘ_３、Ｘ_４、及びＸ_５としてそれぞれ表す。

地理的位置区域から抽出された上記の５つのタイプの特徴Ｘ_１、Ｘ_２、Ｘ_３、Ｘ_４、及びＸ_５を符号化モデルに入力し、符号化モデルからこの５つのタイプの特徴に対してそれぞれ埋め込み処理を行って、各タイプの特徴のベクトル表現をそれぞれ取得し、すなわちＰＯＩ情報のベクトル表現［数１］、ユーザ情報のベクトル表現［数２］、当該地理的位置区域で開始された場所クエリワードのベクトル表現［数３］、地図画像のベクトル表現［数４］、及び実景画像のベクトル表現［数５］をそれぞれ取得する。次に、埋め込み処理によって取得された各ベクトル表現を融合処理して、当該地理的位置区域の符号化結果ｖを取得する。

図２は本開示の実施例により提供される符号化モデルの概略構造図である。図２に示すように、符号化モデルは、少なくとも２つの埋め込みネットワークを含むことができ、埋め込みネットワークの数は、地理的位置区域から抽出された特徴タイプの数と一致する。上記のＸ_１、Ｘ_２、Ｘ_３、Ｘ_４、及びＸ_５の５つのタイプの特徴を例とすると、符号化モデルは、５つの埋め込みネットワークを含み、Ｍ_１、Ｍ_２、Ｍ_３、Ｍ_４、及びＭ_５としてそれぞれ表す。

埋め込みネットワークＭ_１、Ｍ_３について、入力されたＰＯＩ情報とクエリワードは、通常、テキスト類のデータであるため、例えば、ＲＮＮなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークＭ_１、Ｍ_３で行われる埋め込み処理は、Ｍ_１（Ｘ_１,θ_１）、及びＭ_３（Ｘ_３,θ_３）としてそれぞれ表すことができ、θ_１及びθ_３は、それぞれ埋め込みネットワークＭ_１、Ｍ_３のモデルパラメータである。

埋め込みネットワークＭ_２について、入力されたユーザ情報は、通常、属性分布類のデータであるため、例えば、ＤＮＮなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークＭ_２で行われる埋め込み処理は、Ｍ_２（Ｘ_２,θ_２）として表すことができ、θ_２は、埋め込みネットワークＭ_２のモデルパラメータである。

埋め込みネットワークＭ_４、及びＭ_５について、入力されたのは画像類のデータであるため、例えば、ＣＮＮなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークＭ_４、Ｍ_５で行われる埋め込み処理は、Ｍ_４（Ｘ_４,θ_４）、及びＭ_５（Ｘ_５,θ_５）としてそれぞれ表すことができ、θ_４、及びθ_５は、それぞれ埋め込みネットワークＭ_４、及びＭ_５のモデルパラメータである。

各埋め込みネットワークによって出力されたベクトル表現は融合ネットワークに送信して融合処理を行って、地理的位置区域に対する符号化結果ｖを取得する。その中、融合処理は、各ベクトル表現をスプライシングした後、全接続のマッピングを経て符号化結果を取得することができる。又は、融合処理は、各ベクトル表現に対して外積を取る処理をした後に符号化結果を取得することもできる。他の処理方式であってもよく、ここでは一つ一つ列挙しない。融合ネットワークのモデルパラメータはθとして表す。

トレーニングプロセスでは、３つ組（ｖ_ａ, ｖ_＋, ｖ_－）について、ｖ_ａは、アンカーサンプルであり、ｖ_＋は、ポジティブサンプルであり、ｖ_－は、ネガティブサンプルである。符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。

上記の符号化モデルが各サンプルに対する処理は、ｆ（）と表すと仮定すると、損失関数は、例えば、以下に定義することができ、

その中、ｒは、予め設定された最小間隔であり、目的は、アンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離と、アンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離との間に１つの最小の間隔ｒがあることを確保するためである。［数７］は、ユークリッド距離を表す。

トレーニングプロセスでは、各反復は、例えば、損失関数の値を収束し、予め設定された反復回数に達するなどのトレーニング終了条件を満たすまで、損失関数の値を使用して符号化モデルのモデルパラメータ、すなわち上記のθ_１、θ_２、θ_３、θ_４、θ_５、及びθを更新する。

これにより、符号化モデルをトレーニングして取得し、トレーニングに基づいて取得された符号化モデルは、地理的位置区域を符号化するために用いられることができる。図３は本開示の実施例により提供される地理的位置区域の符号化方法のフローチャートである。当該方法の実行主体は、地理的位置区域の符号化装置であってもよく、当該装置は、サーバ側のアプリケーションに位置することができ、又はサーバ側のアプリケーションのプラグイン又はＳＤＫなどの機能ユニットに位置することもでき、又は、高い計算能力を備えるコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図３に示すように、当該方法は、以下のステップを含むことができ、
３０１では、符号化される地理的位置区域を決定する。

３０２では、地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得する。

３０３では、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、地理的位置区域の符号化結果を取得する。

以下は実施例を組み合わせて上記の各ステップを詳細に説明する。

まず、上記のステップ３０１、すなわち「符号化される地理的位置区域を決定する」を詳細に説明する。

予め設定された精度に従って予め分割された地理的位置区域を符号化される地理的位置区域とし、符号化結果を１つずつ決定することができる。その中の１つの地理的位置区域を符号化される地理的位置区域として符号化結果を決定することもできる。

実際の使用シナリオでは、このような場合がある。すなわちユーザの地理的位置座標を取得し、当該地理的位置座標を入力とし、当該地理的位置座標が位置する地理的位置区域を符号化される地理的位置区域として決定する。

当該使用シナリオでは、符号化モデルを使用して入力された地理的位置座標が所在する地理的位置区域の符号化結果をリアルタイムで決定することができる。予めに各地理的位置区域に対して符号化結果を取得した後に記憶し、入力された地理的位置座標を取得した後に、記憶された各地理的位置区域の符号化結果をクエリする方式によって当該地理的位置座標の所在地理的位置区域の符号化結果を決定することもできる。

ステップ３０２において地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得することは、図１に示す実施例のステップ１０２の記載を参照することができ、ここでは詳しく説明しない。また、符号化モデルをトレーニングするプロセスでどのような特徴を使用するかは、本ステップでも同様にどのような特徴を抽出する。

図２に示す符号化モデルをトレーニングして取得した後、上記のステップ３０３では、抽出された地理的機能情報と地物分布情報などのさまざまな特徴を各埋め込みネットワークにそれぞれ入力する。各埋め込みネットワークによって各特徴を符号化した後に各ベクトル表現を取得し、次に、融合ネットワークによって各ベクトル表現に対して融合処理を行って、符号化される地理的位置区域に対する符号化結果を取得する。つまり、様々なタイプの特徴に対してマルチモーダル情報の符号化を行った後、統一された符号化結果にマッピングする。例えば、デジタル符号化結果に、マッピングする。

その中、各埋め込みネットワークと融合ネットワークの具体的な処理は、図１に示す実施例の関連する記載を参照することができ、ここでは詳しく説明しない。

上記の符号化方式によって、地理的機能と地物分布で類似する地理的位置区域はより類似した符号化結果を有するようにすることができる。

上記の実施例の方式を使用して地理的位置区域を符号化した後、さまざまなアプリケーションシナリオに適用することができる。以下は、以下のいくつかのみを列挙し、
第１のアプリケーションシナリオ：地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定する。

例えば、地図類アプリケーションで情報検証を行うようにすべての高架道路を見つける必要がある。１つの高架道路の土地を見つけた後、符号化結果の類似性を使用して、当該土地の符号化結果が類似性要求を満たすすべての他の土地を見つけることができる。見つかったこれらの土地も、理論的には、高架道路所在の土地であるべきであり、これらの土地を選別と検証し、例えば、高架道路に店舗類ＰＯＩがある場合、明らかに間違っている。

また、例えば、あるファストフードチェーン店に対して場所を選択する必要がある場合、営業状況のよい支店が位置する土地を決定した後、符号化結果の類似性を使用してこれらの土地と一定の類似性要求を満たす土地を見つけ、これらの土地から場所を選択して当該ファストフードチェーン店の新しい支店を確立することができる。地理的機能と地物分布の類似性のため、新しい選択された場所の土地に確立された当該ファストフードチェーン店の新しい支店もよい営業状況が備えるはずである。

また、例えば、ユーザが特定の地理的特色を有する区域を決定する必要がある場合、まず、１つの当該特色を有する区域を選択し、当該区域をクエリ区域とすることができる。当該クエリ区域の符号化結果と他の地理的位置区域の符号化結果に対して類似度計算を行って、上位Ｎ個の地理的位置区域を選別し、Ｎは予め設定された正の整数である。これらの選別された地理的位置区域は同様に当該特定の地理的特色を有する。例を挙げると、例えば、ユーザが住宅区と河川がある区域、又は、住宅区が河川に近い区域を検索したい。図４に示すように、ユーザは、まず、１つの河川に近い住宅小区Ａを見つけ、これと類似した他の住宅小区を見つけたい。そうすると、当該住宅小区Ａが位置する地理的位置区域をクエリ区域とすることができる。当該クエリ区域の符号化結果と他の地理的位置区域の符号化結果に対して類似度計算を行い、実際には地理的セマンティクス上の類似度計算が行われ、上位１０個の地理的位置区域を選別し、この１０個の地理的位置区域に含まれた住宅小区は、河川に近い住宅小区と見なすことができ、例えば、その中から住宅小区Ｂを選別する。類似する方式を使用して、例えば、河川に近い別荘区、道路と河川に近い作業区、川を渡るトンネル、及び学校に近い住宅小区群などを検索することもできる。

第２のアプリケーションシナリオ：ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索推奨を行う。

例えば、ユーザが検索を開始する時、ユーザが検索する時の所在地理的位置区域を取得し、当該地理的位置区域の符号化結果を入力特徴の１つとして検索推奨を行う。例えば、入力ボックスに「ｂａ」を入力する時、ユーザの入力に伴い、ドロップダウンボックスなどの形式でユーザに検索語の推奨を行う。ユーザが北京のあるホテルに位置する場合、例えば、「八達嶺長城」などの観光地を優先的に推奨する。ユーザが科学技術園に位置する場合、例えば、「百度ビル」などの科学技術系会社のオフィスビルを優先的に推奨する。

第３のアプリケーションシナリオ：ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索結果ソートを行う。

例えば、ユーザが検索を開始する時、ユーザが検索する時の所在地理的位置区域を取得し、当該地理的位置区域の符号化結果を入力特徴の１つとして検索結果のソートを行う。このような検索結果のソート方式が、地理的位置区域の地理的機能と地物分布に基づいて推奨することができる。例えば、北京のあるソフトウェアパークと成都のあるソフトウェアパークで開始されたレストラン類の検索について、両者は地理的位置上に遠いが、地理的機能と地物分布の類似性のため、その符号化結果が非常に類似し、これに基づいて行われるレストラン類の検索結果にも一定の類似性が存在し、例えば、すべてファストフード類が好ましい。

また、例えば、北京のあるソフトウェアパークと金融街の距離が非常に近いが、両者の符号化結果は遠く離れている。したがって、レストラン類の検索結果のソートを行う時に、多く異なる。例えば、ソフトウェアパークのユーザについてはファストフード類のレストランを優先的に返し、金融街のユーザについては西洋料理類のレストランを優先とする。

以上は本開示により提供される方法で行われる詳細な説明であり、以下は実施例を組み合わせて本開示により提供される装置で行われる詳細な説明である。

図５は本開示の実施例により提供される符号化モデルを確立する装置の構造図である。図５に示すように、当該装置５００は、取得ユニット５０１とトレーニングユニット５０２を含むことができ、分割ユニット５０３をさらに含むことができる。各構成ユニットの主な機能は以下のようであり、
取得ユニット５０１は、トレーニングデータを取得するために用いられ、トレーニングデータは、１つ以上の３つ組を含み、３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。

トレーニングユニット５０２は、トレーニングデータを使用して符号化モデルをトレーニングするために用いられ、符号化モデルはサンプルごとにそれぞれ以下の内容を実行し、前記内容は、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得する。

符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。

その中、地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含むことができ、
地物分布情報は、地図画像と実景画像のうちの少なくとも１つを含むことができる。

その中、取得ユニット５０１は、以下のいくつかの方式を使用してトレーニングデータを取得することができるが、これらに限定されない。
第１の方式：地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択する。

第３の方式：検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する。

分割ユニット５０３は、予め設定された精度に従って地理的位置区域を予め分割するために用いられる。

実現可能な方式として、符号化モデルは、少なくとも２つの埋め込みネットワークと融合ネットワークを含むことができる。

トレーニングユニット５０２は、サンプルから抽出された少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を各埋め込みネットワークにそれぞれ入力することができる。

埋め込みネットワークは、入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得するために用いられる。

融合ネットワークは、各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得するために用いられる。

トレーニングユニット５０２は、符号化モデルをトレーニングする場合、損失関数の値に基づいて埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、損失関数は、トレーニングターゲットに基づいて予め確立して取得する。

図６は本開示の実施例により提供される地理的位置区域の符号化装置の構造図である。図６に示すように、当該装置６００は、決定ユニット６０１、取得ユニット６０２、及び符号化ユニット６０３を含むことができ、分割ユニット６０４とアプリケーションユニット６０５をさらに含むことができる。

決定ユニット６０１は、符号化される地理的位置区域を決定するために用いられる。

取得ユニット６０２は、地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得するために用いられる。

符号化ユニット６０３は、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、地理的位置区域の符号化結果を取得するために用いられる。

その中、地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含み、
地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも１つを含む。

分割ユニット６０４は、予め設定された精度に従って地理的位置区域を予め分割するために用いられる。

実現可能な方式として、決定ユニット６０１は、入力された地理的位置座標を取得し、地理的位置座標が位置する地理的位置区域を符号化される地理的位置区域として決定する。

別の実現可能な方式として、決定ユニット６０１は、分割された各地理的位置区域をそれぞれ符号化される地理的位置区域とすることができる。

アプリケーションユニット６０５は、地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索推奨又は検索結果ソートを行うために用いられる。

本明細書の各実施例は、すべて漸進する方式を使用して説明し、各実施例間の同一の類似する部分は互いに参照すればよく、各実施例は、すべて他の実施例との異なる点を重点的に説明する。特に、装置の実施例について、方法の実施例と基本的に類似するため、説明が比較的に簡単であり、関連点は、方法の実施例の部分の説明を参照すればよい。

本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。

図７に示すように、本開示の実施例に係る地理的位置区域の符号化方法、及び符号化モデルを確立する方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様の計算デバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び／又は要求される本開示の実現を制限することを意図したものではない。

図７に示すように、機器７００は計算ユニット７０１を含み、計算ユニット７０１は、読み取り専用メモリ（ＲＯＭ）７０２に記憶されているコンピュータプログラム又は記憶ユニット７０８からランダムアクセスメモリ（ＲＡＭ）７０３にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行することができる。ＲＡＭ７０３には、機器７００が動作するに必要な様々なプログラムとデータも記憶することができる。計算ユニット７０１、ＲＯＭ７０２、及びＲＡＭ７０３は、バス７０４を介してお互いに接続される。入出力（Ｉ／Ｏ）インターフェース７０５もバス７０４に接続される。

機器７００内の複数のコンポーネントは、Ｉ／Ｏインターフェース７０５に接続されており、キーボード、マウスなどの入力ユニット７０６と、様々なタイプのディスプレイ、スピーカなどの出力ユニット７０７と、ディスク、光ディスクなどの記憶ユニット７０８と、及びネットワークカード、モデム、無線通信トランシーバなどの通信ユニット７０９と、を含む。通信ユニット７０９は、機器７００が、インターネットなどのコンピュータネットワーク、及び／又は様々な電気通信ネットワークを介して他の機器と情報／データを交換することを可能にする。

計算ユニット７０１は、様々な処理と計算能力を備える汎用及び／又は専用の処理コンポーネントである。計算ユニット７０１のいくつかの例は、中央処理装置（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット７０１は、地理的位置区域の符号化方法、及び符号化モデルを確立する方法などの上記の様々な方法と処理を実行する。例えば、いくつかの実施例では、地理的位置区域の符号化方法、及び符号化モデルを確立する方法は、記憶ユニット７０８などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。

いくつかの実施例では、コンピュータプログラムの一部又は全部は、ＲＯＭ７０２及び／又は通信ユニット７０９を介して機器７００にローディング及び／又はインストールされる。コンピュータプログラムがＲＡＭ７０３にローディングされて計算ユニット７０１によって実行される場合、上記の地理的位置区域の符号化方法、及び符号化モデルを確立する方法の一つ又は複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット７０１は、他の任意の適切な方式（例えば、ファームウェアによって）を介して地理的位置区域の符号化方法、及び符号化モデルを確立する方法を実行するように構成されることができる。

本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップシステム（ＳＯＣ）、ローディングプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び／又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。

本開示の方法を実施するためのプログラムコードは、一つ又は複数のプログラミング言語の任意の組み合わせを使用して作成することができる。これらのプログラムコードは、プログラムコードがプロセッサ又はコントローラによって実行される時にフローチャート及び／又はブロック図に規定された機能／動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサ又はコントローラに提供することができる。プログラムコードは、完全に機械上で実行されたり、部分的に機械上で実行されたり、独立したソフトウェアパッケージとして部分的に機械上で実行され、部分的にリモート機械上実行されたり、又は完全にリモート機械又はサーバ上で実行されたりすることができる。

本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、又は機器の使用、又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又は機器、又は上記の内容の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つ又は複数のワイヤに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光学記憶装置、磁気記憶装置、又は上記の内容の任意の適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、又はミドルウェアコンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバー）、又はフロントエンドコンポーネントを含むコンピューティングシステム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする）、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、を含む。

コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、クラウド計算又はクラウドホストとも呼ばれ、クラウド計算サービスシステムの中の一つのホスト製品であり、従来の物理ホストとＶＰＳサービス（「ＶｉｒｔｕａｌＰｒｉｖａｔｅＳｅｒｖｅｒ」、又は「ＶＰＳ」と略称する）に、存在する管理困難度が高く、業務拡張性が弱い欠陥を解決する。サーバは、分散システムのサーバであってもよく、又はブロックチェーンを組み合わせるサーバであってもよい。

上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。

上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims

トレーニングデータを取得するステップであって、前記トレーニングデータは、１つ以上の３つ組を含み、前記３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含むステップと、
前記トレーニングデータを使用して符号化モデルをトレーニングするステップであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するステップと、を含み、
前記符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む、
符号化モデルを確立する方法。
前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含み、
前記地物分布情報は、地図画像と実景画像のうちの少なくとも１つを含む、
請求項１に記載の符号化モデルを確立する方法。
前記トレーニングデータを取得するステップは、
地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択し、又は、
ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択し、又は、
検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択するステップを含む、
請求項１又は２に記載の符号化モデルを確立する方法。
予め設定された精度に従って地理的位置区域を予め分割するステップをさらに含む、
請求項１から３のいずれか一項に記載の符号化モデルを確立する方法。
前記符号化モデルは、少なくとも２つの埋め込みネットワークと融合ネットワークを含み、
サンプルから抽出された少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を各埋め込みネットワークにそれぞれ入力し、
前記埋め込みネットワークは入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得し、
前記融合ネットワークは各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得し、
前記符号化モデルをトレーニングする時、損失関数の値に基づいて前記埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、前記損失関数は、前記トレーニングターゲットに基づいて予め確立して取得する、
請求項１から４のいずれか一項に記載の符号化モデルを確立する方法。
符号化される地理的位置区域を決定するステップと、
前記地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得するステップと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するステップと、を含む、
地理的位置区域の符号化方法。
前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含み、
前記地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも１つを含む、
請求項６に記載の地理的位置区域の符号化方法。
予め設定された精度に従って地理的位置区域を予め分割するステップをさらに含み、
前記符号化される地理的位置区域を決定するステップは、入力された地理的位置座標を取得するステップと、前記地理的位置座標が位置する地理的位置区域を前記符号化される地理的位置区域として決定するステップと、を含む、
請求項６又は７に記載の地理的位置区域の符号化方法。
地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、前記ユーザに対して検索推奨又は検索結果ソートを行うステップをさらに含む、
請求項６から８のいずれか一項に記載の地理的位置区域の符号化方法。
トレーニングデータを取得する取得ユニットであって、前記トレーニングデータは、１つ以上の３つ組を含み、前記３つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む取得ユニットと、
前記トレーニングデータを使用して符号化モデルをトレーニングするトレーニングユニットであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するトレーニングユニットと、を含み、
前記符号化モデルのトレーニングターゲットは、３つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、３つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む、
符号化モデルを確立する装置。
前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含み、
前記地物分布情報は、地図画像と実景画像のうちの少なくとも１つを含む、
請求項１０に記載の符号化モデルを確立する装置。
前記取得ユニットは、
地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択し、又は、
ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択し、又は、
検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する、
請求項１０又は１１に記載の符号化モデルを確立する装置。
予め設定された精度に従って地理的位置区域を予め分割する分割ユニットをさらに含む、
請求項１０から１２のいずれか一項に記載の符号化モデルを確立する装置。
前記符号化モデルは、少なくとも２つの埋め込みネットワークと融合ネットワークを含み、
前記トレーニングユニットは、サンプルから抽出された少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を各埋め込みネットワークにそれぞれ入力し、
前記埋め込みネットワークは、入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得し、
前記融合ネットワークは、各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得し、
前記トレーニングユニットは、前記符号化モデルをトレーニングする時、損失関数の値に基づいて前記埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、前記損失関数は、前記トレーニングターゲットに基づいて予め確立して取得する、
請求項１０から１３のいずれか一項に記載の符号化モデルを確立する装置。
符号化される地理的位置区域を決定する決定ユニットと、
前記地理的位置区域の少なくとも１つの地理的機能情報と少なくとも１つの地物分布情報を取得する取得ユニットと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得する符号化ユニットと、を含む、
地理的位置区域の符号化装置。
前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも１つを含み、
前記地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも１つを含む、
請求項１５に記載の地理的位置区域の符号化装置。
予め設定された精度に従って地理的位置区域を予め分割する分割ユニットをさらに含み、
前記決定ユニットは、入力された地理的位置座標を取得し、前記地理的位置座標が位置する地理的位置区域を前記符号化される地理的位置区域として決定する、
請求項１５又は１６に記載の地理的位置区域の符号化装置。
地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、前記ユーザに対して検索推奨又は検索結果ソートを行うアプリケーションユニットをさらに含む、
請求項１５から１７のいずれか一項に記載の地理的位置区域の符号化装置。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項１から５のいずれか一項に記載の符号化モデルを確立する方法を実行する、
電子機器。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項６から９のいずれか一項に記載の地理的位置区域の符号化方法を実行する、
電子機器。
コンピュータに請求項１から５のいずれか一項に記載の符号化モデルを確立する方法を実行させるコンピュータ命令が記憶されている、
非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータに請求項６から９のいずれか一項に記載の地理的位置区域の符号化方法を実行させるコンピュータ命令が記憶されている、
非一時的なコンピュータ読み取り可能な記憶媒体。
プロセッサによって実行される時に請求項１から５のいずれか一項に記載の符号化モデルを確立する方法を実現する、
コンピュータプログラム。
プロセッサによって実行される時に請求項６から９のいずれか一項に記載の地理的位置区域の符号化方法を実現する、
コンピュータプログラム。