JP2023530795A - 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置 - Google Patents

地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置 Download PDF

Info

Publication number
JP2023530795A
JP2023530795A JP2022543043A JP2022543043A JP2023530795A JP 2023530795 A JP2023530795 A JP 2023530795A JP 2022543043 A JP2022543043 A JP 2022543043A JP 2022543043 A JP2022543043 A JP 2022543043A JP 2023530795 A JP2023530795 A JP 2023530795A
Authority
JP
Japan
Prior art keywords
encoding
geographic location
location area
sample
geographic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022543043A
Other languages
English (en)
Inventor
ファン、ミアオ
フアン、ジジョウ
ワン、ハイフェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2023530795A publication Critical patent/JP2023530795A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Remote Sensing (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本開示は、人工知能技術の分野のビッグデータとディープラーニング技術に関する地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置を開示する。具体的な実現案は、符号化される地理的位置区域を決定し、前記地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得し、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得する。本開示は、地理的位置区域に対する合理的な符号化を実現して、地理的機能と地物分布が類似する地理的位置区域の符号化結果がより類似するようになる。

Description

本開示は、出願日が2021年05月24日であり、出願番号が202110565434.6であり、発明の名称が「地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置」である中国特許出願の優先権を主張する。
本開示は、コンピュータアプリケーション技術の分野に関し、特に、人工知能技術におけるビッグデータとディープラーニング技術に関する。
モバイルインターネット技術の急速な発展に伴い、モバイルインターネットアプリケーションは各方面から私たちの生活に影響を与えている。PC(Personal Computer、パーソナルコンピュータ)時代とは異なり、ほとんどのモバイルアプリケーションにはすべて新しい次元の情報である地理的位置が追加される。
地理的位置の記録と応用を容易にするために、異なる地理的位置領域を合理的に符号化する必要がある。
これに鑑みて、本開示は、地理的位置区域の合理的な符号化を実現するために、地理的位置区域の符号化方法、装置、機器、及びコンピュータ記憶媒体を提供する。
本開示の第1の態様によれば、符号化モデルを確立する方法を提供し、
トレーニングデータを取得するステップであって、前記トレーニングデータは、1つ以上の3つ組を含み、前記3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含むステップと、
前記トレーニングデータを使用して符号化モデルをトレーニングするステップであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するステップと、を含み、
前記符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。
本開示の第2の態様によれば、地理的位置区域の符号化方法を提供し、
符号化される地理的位置区域を決定するステップと、
前記地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得するステップと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するステップと、を含む。
本開示の第3の態様によれば、符号化モデルを確立する装置を提供し、
トレーニングデータを取得するための取得ユニットであって、前記トレーニングデータは、1つ以上の3つ組を含み、前記3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む取得ユニットと、
前記トレーニングデータを使用して符号化モデルをトレーニングするためのトレーニングユニットであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するトレーニングユニットと、を含み、
前記符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。
本開示の第4の態様によれば、地理的位置区域の符号化装置を提供し、
符号化される地理的位置区域を決定するための決定ユニットと、
前記地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得するための取得ユニットと、
取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するための符号化ユニットと、を含む。
本開示の第5の態様によれば、電子機器を提供し、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる。
本開示の第6の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、前記コンピュータ命令は、前記コンピュータに上記の方法を実行させる。
本開示の第7の態様によれば、コンピュータプログラム製品を提供し、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行される時に上記の方法を実現する。
上記の技術的解決策から分かるように、本開示により提供される符号化モデルは、地理的位置区域の地理的機能情報と地物分布情報に基づいて符号化して、地理的機能と地物分布が類似する地理的位置区域の符号化結果をより類似させることができ、このような符号化方式は従来の符号化方式と比較してより合理的である。
本明細書で説明された内容は、本開示の実施例のキー又は重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。
図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示の実施例により提供される符号化モデルを確立する方法のフローチャートである。 本開示の実施例により提供される符号化モデルの概略構造図である。 本開示の実施例により提供される地理的位置区域の符号化方法のフローチャートである。 本開示の実施例により提供されるアプリケーション地理的位置区域符号化結果の例示的な図である。 本開示の実施例により提供される符号化モデルを確立する装置の構造図である。 本開示の実施例により提供される地理的位置区域の符号化装置の構造図である。 本開示の実施例を実現するための電子機器のブロック図である。
以下、図面に基づいて、本開示の例示的な実施例を説明する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
地理的位置区域符号化は、1つのコードを使用して地理的位置区域を表して、限られた地理的位置区域セットでそれを他の地理的位置区域と区別するために用いられる。
地理的位置区域は、1つの都市、1つの区、1つの街区など、行政区画に従って分割することができる。1km×1kmの区画に分割し、各区画を1つの地理的位置区域とするなど、予め設定された精度と形状に従って分割することもできる。
現在、すべての従来の地理的区域符号化方式は、すべて「実際の空間距離に近い地理的位置区域はより類似した符号化を有する」この原則に従い、つまり、従来の地理的位置区域の符号化は位置情報に基づいて行われ、例えば、一般に用いられるGeoHash符号化である。しかし、実際の応用では、これらの符号化方式は合理的ではない。本開示の核心構想は、「地理的機能と地物分布が類似する地理的位置区域はより類似した符号化を有する」この原則に基づく。以下は実施例を組み合わせて本開示により提供される方法を詳細に説明する。
本開示における地理的位置区域の符号化は、主に符号化モデルに基づいて実現されるため、主に、符号化モデルを確立する段階と符号化モデルを使用して地理的位置区域を符号化する段階の2つの段階を含む。以下はこの2つの段階をそれぞれ説明する。
図1は本開示の実施例により提供される符号化モデルを確立する方法のフローチャートである。当該方法の実行主体は、符号化モデルを確立する装置であってもよく、当該装置は、サーバ側のアプリケーションに位置することができ、又はサーバ側のアプリケーションのプラグイン又はソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットに位置することもでき、又は、高い計算能力を備えるコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図1に示すように、当該方法は、以下のステップを含むことができ、
101では、トレーニングデータを取得し、トレーニングデータは、1つ以上の3つ組を含み、3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。
102では、トレーニングデータを使用して符号化モデルをトレーニングし、符号化モデルはサンプルごとにそれぞれ以下の内容を実行し、前記内容は、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得し、符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。
上記の実施例に示す技術的解決策から分かるように、確立された符号化モデルは、地理的位置区域の地理的機能情報と地物分布情報に基づいて符号化して、地理的機能と地物分布が類似する地理的位置区域の符号化結果をより類似させることができる。以下は実施例を組み合わせて上記の各ステップを詳細に説明する。
まず、実施例を組み合わせて上記のステップ101、すなわち「トレーニングデータを取得する」を詳細に説明する。
本開示で使用されるトレーニングデータは、すべて3つ組を使用し、各3つ組は、アンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。各サンプルは、すべて地理的位置区域である。ポジティブサンプルは、地理的機能と地物分布においてアンカーサンプルと非常に類似した地理的位置区域である。ネガティブサンプルは、地理的機能と地物分布においてアンカーサンプルと類似しない地理的位置区域である。
トレーニングデータの各3つ組は人工的な方式で選択することができる。このような方式は正確性が高いが、人件費の消費も高く、効率が低い。したがって、本開示の実施例ではいくつかの自動的にトレーニングデータを取得する方式を提供し、例えば、以下のいくつかの方式に限られていない。
第1の方式:地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択する。
本方式では、予め分割された各地理的位置区域からアンカーサンプルを選択することができる。アンカーサンプルのポジティブサンプルを選択する場合、隣接する2つの地理的位置区域は地理的機能と地物分布で類似する可能性が高いため、アンカーサンプルの隣接地理的位置区域からポジティブサンプルとして1つを選択することができる。選択方式は、ランダムに選択する方式であってもよく、一定の規則に従って選択する方式であってもよい。アンカーサンプルのネガティブサンプルを選択する場合、非隣接地理的位置区域からネガティブサンプルとして1つを選択することができる。選択方式は、同様にランダムに選択する方式であってもよく、一定の規則に従って選択する方式であってもよい。
第2の方式:ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する。
ユーザの慣習的な好みに基づいて、出発地と目的地は、地理的機能と地物分布で類似する可能性が高い。したがって、ナビゲーションログから大量のユーザのナビゲーション情報を取得し、ナビゲーション開始点とナビゲーション終了点で構成された所在地理的位置区域ペアを統計し、出現頻度又は出現回数が一定の条件を満たす地理的位置区域ペアをアンカーサンプルとポジティブサンプルとすることができる。アンカーサンプルのネガティブサンプルはポジティブサンプルとアンカーサンプル以外の他の地理的位置区域からランダムに選択することができる。
第3の方式:検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとしてランダムに選択する。
類似して、ユーザの慣習的な好みに基づいて、ユーザが検索を開始した位置と検索したターゲット位置が地理的機能と地物分布で類似する可能性が大きい。したがって、検索ログから大量のユーザの検索情報を取得することができる。検索した開始位置とターゲット位置で構成された所在地理的位置区域ペアを統計し、出現頻度又は出現回数が一定の条件を満たす地理的位置区域ペアをアンカーサンプルとポジティブサンプルとすることができる。アンカーサンプルのネガティブサンプルはポジティブサンプルとアンカーサンプル以外の他の地理的位置区域からランダムに選択することができる。
以下は実施例を組み合わせて上記のステップ102、すなわち「トレーニングデータを使用して符号化モデルをトレーニングする」のプロセスを詳細に説明する。
トレーニングデータ内の各3つ組について、3つ組内のサンプルに対して少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報をそれぞれ抽出する。
地理的機能情報は、POI(Point Of Interest、関心ポイント)情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含むことができる。
POI情報は、地理的位置区域に含まれたPOI名称、POIタイプ、POI数、住所などを含むことができる。これらのPOI情報は、主に、地理的位置区域の地理的機能を反映することができる。例えば、ディズニーランドと遊園地が位置する地理的位置区域の地理的機能は類似する。
ユーザ情報は、地理的位置区域内のユーザの年齢分布、性別比率、職業タイプ分布、学歴状況、及び給与状況などを含むことができる。例えば、科学技術園類の地理的位置区域内のユーザは、男性が多く、25歳~35歳間、プログラマー、大学以上の学歴、給与が高い特徴を呈する。
当該地理的位置区域で開始された場所クエリワードは、主に、当該地理的位置区域のユーザ好みを反映し、地理的位置区域の地理的機能もある程度で反映する。この部分のデータは、検索ログから取得し、検索ログ内の当該地理的位置区域で開始された場所クエリワードを統計し、出現頻度又は出現回数が一定の条件を満たす場所クエリワードを取得することもできる。
地物分布情報は、地理的位置区域の地図画像と実景画像のうちの少なくとも1つを含むことができる。これらの画像は、地図類アプリケーションのサービス側又はデータベースから取得することができる。
地理的位置区域の地図画像は、地図で表示される当該地理的位置区域の画像であってもよい。当該地図画像は、衛星画像であってもよく、ベースマップ画像であってもよい。地図画像は、例えば、陸地、水系、緑地などのさまざまな区域タイプの地図要素を含み、例えば、高速道路、都市主路、鉄道などの道路も含み、例えば、観光地、ホテル、学校、デパート、店舗、オフィスビル、スタジアムなどのさまざまなタイプのPOIを含むこともできる。地図画像は、地理的位置区域の地物分布をよく反映する。
実景画像とは、実際の景色に基づいて描画又は撮影された画像を指し、例えば、ストリートビュー画像であってもよい。実景画像も地理的位置区域の地物分布をよく反映する。
以下の実施例の説明と理解を容易にするために、後続の実施例では地理的位置区域(各サンプル)からPOI情報、ユーザ情報、当該地理的位置区域で開始された場所クエリワード、地図画像、及び実景画像のこの5つのタイプの特徴を抽出することを例とし、この5つのタイプの特徴は、X、X、X、X、及びXとしてそれぞれ表す。
地理的位置区域から抽出された上記の5つのタイプの特徴X、X、X、X、及びXを符号化モデルに入力し、符号化モデルからこの5つのタイプの特徴に対してそれぞれ埋め込み処理を行って、各タイプの特徴のベクトル表現をそれぞれ取得し、すなわちPOI情報のベクトル表現[数1]、ユーザ情報のベクトル表現[数2]、当該地理的位置区域で開始された場所クエリワードのベクトル表現[数3]、地図画像のベクトル表現[数4]、及び実景画像のベクトル表現[数5]をそれぞれ取得する。次に、埋め込み処理によって取得された各ベクトル表現を融合処理して、当該地理的位置区域の符号化結果vを取得する。
Figure 2023530795000002
Figure 2023530795000003
Figure 2023530795000004
Figure 2023530795000005
Figure 2023530795000006
図2は本開示の実施例により提供される符号化モデルの概略構造図である。図2に示すように、符号化モデルは、少なくとも2つの埋め込みネットワークを含むことができ、埋め込みネットワークの数は、地理的位置区域から抽出された特徴タイプの数と一致する。上記のX、X、X、X、及びXの5つのタイプの特徴を例とすると、符号化モデルは、5つの埋め込みネットワークを含み、M、M、M、M、及びMとしてそれぞれ表す。
埋め込みネットワークM、Mについて、入力されたPOI情報とクエリワードは、通常、テキスト類のデータであるため、例えば、RNNなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークM、Mで行われる埋め込み処理は、M(X)、及びM(X)としてそれぞれ表すことができ、θ及びθは、それぞれ埋め込みネットワークM、Mのモデルパラメータである。
埋め込みネットワークMについて、入力されたユーザ情報は、通常、属性分布類のデータであるため、例えば、DNNなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークMで行われる埋め込み処理は、M(X)として表すことができ、θは、埋め込みネットワークMのモデルパラメータである。
埋め込みネットワークM、及びMについて、入力されたのは画像類のデータであるため、例えば、CNNなどのタイプのニューラルネットワークを使用することができる。埋め込みネットワークM、Mで行われる埋め込み処理は、M(X)、及びM(X)としてそれぞれ表すことができ、θ、及びθは、それぞれ埋め込みネットワークM、及びMのモデルパラメータである。
各埋め込みネットワークによって出力されたベクトル表現は融合ネットワークに送信して融合処理を行って、地理的位置区域に対する符号化結果vを取得する。その中、融合処理は、各ベクトル表現をスプライシングした後、全接続のマッピングを経て符号化結果を取得することができる。又は、融合処理は、各ベクトル表現に対して外積を取る処理をした後に符号化結果を取得することもできる。他の処理方式であってもよく、ここでは一つ一つ列挙しない。融合ネットワークのモデルパラメータはθとして表す。
トレーニングプロセスでは、3つ組(v, v, v) について、vは、アンカーサンプルであり、vは、ポジティブサンプルであり、vは、ネガティブサンプルである。符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。
上記の符号化モデルが各サンプルに対する処理は、f()と表すと仮定すると、損失関数は、例えば、以下に定義することができ、
Figure 2023530795000007
その中、rは、予め設定された最小間隔であり、目的は、アンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離と、アンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離との間に1つの最小の間隔rがあることを確保するためである。[数7]は、ユークリッド距離を表す。
Figure 2023530795000008
トレーニングプロセスでは、各反復は、例えば、損失関数の値を収束し、予め設定された反復回数に達するなどのトレーニング終了条件を満たすまで、損失関数の値を使用して符号化モデルのモデルパラメータ、すなわち上記のθ、θ、θ、θ、θ、及びθを更新する。
これにより、符号化モデルをトレーニングして取得し、トレーニングに基づいて取得された符号化モデルは、地理的位置区域を符号化するために用いられることができる。図3は本開示の実施例により提供される地理的位置区域の符号化方法のフローチャートである。当該方法の実行主体は、地理的位置区域の符号化装置であってもよく、当該装置は、サーバ側のアプリケーションに位置することができ、又はサーバ側のアプリケーションのプラグイン又はSDKなどの機能ユニットに位置することもでき、又は、高い計算能力を備えるコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図3に示すように、当該方法は、以下のステップを含むことができ、
301では、符号化される地理的位置区域を決定する。
302では、地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得する。
303では、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、地理的位置区域の符号化結果を取得する。
以下は実施例を組み合わせて上記の各ステップを詳細に説明する。
まず、上記のステップ301、すなわち「符号化される地理的位置区域を決定する」を詳細に説明する。
予め設定された精度に従って予め分割された地理的位置区域を符号化される地理的位置区域とし、符号化結果を1つずつ決定することができる。その中の1つの地理的位置区域を符号化される地理的位置区域として符号化結果を決定することもできる。
実際の使用シナリオでは、このような場合がある。すなわちユーザの地理的位置座標を取得し、当該地理的位置座標を入力とし、当該地理的位置座標が位置する地理的位置区域を符号化される地理的位置区域として決定する。
当該使用シナリオでは、符号化モデルを使用して入力された地理的位置座標が所在する地理的位置区域の符号化結果をリアルタイムで決定することができる。予めに各地理的位置区域に対して符号化結果を取得した後に記憶し、入力された地理的位置座標を取得した後に、記憶された各地理的位置区域の符号化結果をクエリする方式によって当該地理的位置座標の所在地理的位置区域の符号化結果を決定することもできる。
ステップ302において地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得することは、図1に示す実施例のステップ102の記載を参照することができ、ここでは詳しく説明しない。また、符号化モデルをトレーニングするプロセスでどのような特徴を使用するかは、本ステップでも同様にどのような特徴を抽出する。
図2に示す符号化モデルをトレーニングして取得した後、上記のステップ303では、抽出された地理的機能情報と地物分布情報などのさまざまな特徴を各埋め込みネットワークにそれぞれ入力する。各埋め込みネットワークによって各特徴を符号化した後に各ベクトル表現を取得し、次に、融合ネットワークによって各ベクトル表現に対して融合処理を行って、符号化される地理的位置区域に対する符号化結果を取得する。つまり、様々なタイプの特徴に対してマルチモーダル情報の符号化を行った後、統一された符号化結果にマッピングする。例えば、デジタル符号化結果に、マッピングする。
その中、各埋め込みネットワークと融合ネットワークの具体的な処理は、図1に示す実施例の関連する記載を参照することができ、ここでは詳しく説明しない。
上記の符号化方式によって、地理的機能と地物分布で類似する地理的位置区域はより類似した符号化結果を有するようにすることができる。
上記の実施例の方式を使用して地理的位置区域を符号化した後、さまざまなアプリケーションシナリオに適用することができる。以下は、以下のいくつかのみを列挙し、
第1のアプリケーションシナリオ:地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定する。
例えば、地図類アプリケーションで情報検証を行うようにすべての高架道路を見つける必要がある。1つの高架道路の土地を見つけた後、符号化結果の類似性を使用して、当該土地の符号化結果が類似性要求を満たすすべての他の土地を見つけることができる。見つかったこれらの土地も、理論的には、高架道路所在の土地であるべきであり、これらの土地を選別と検証し、例えば、高架道路に店舗類POIがある場合、明らかに間違っている。
また、例えば、あるファストフードチェーン店に対して場所を選択する必要がある場合、営業状況のよい支店が位置する土地を決定した後、符号化結果の類似性を使用してこれらの土地と一定の類似性要求を満たす土地を見つけ、これらの土地から場所を選択して当該ファストフードチェーン店の新しい支店を確立することができる。地理的機能と地物分布の類似性のため、新しい選択された場所の土地に確立された当該ファストフードチェーン店の新しい支店もよい営業状況が備えるはずである。
また、例えば、ユーザが特定の地理的特色を有する区域を決定する必要がある場合、まず、1つの当該特色を有する区域を選択し、当該区域をクエリ区域とすることができる。当該クエリ区域の符号化結果と他の地理的位置区域の符号化結果に対して類似度計算を行って、上位N個の地理的位置区域を選別し、Nは予め設定された正の整数である。これらの選別された地理的位置区域は同様に当該特定の地理的特色を有する。例を挙げると、例えば、ユーザが住宅区と河川がある区域、又は、住宅区が河川に近い区域を検索したい。図4に示すように、ユーザは、まず、1つの河川に近い住宅小区Aを見つけ、これと類似した他の住宅小区を見つけたい。そうすると、当該住宅小区Aが位置する地理的位置区域をクエリ区域とすることができる。当該クエリ区域の符号化結果と他の地理的位置区域の符号化結果に対して類似度計算を行い、実際には地理的セマンティクス上の類似度計算が行われ、上位10個の地理的位置区域を選別し、この10個の地理的位置区域に含まれた住宅小区は、河川に近い住宅小区と見なすことができ、例えば、その中から住宅小区Bを選別する。類似する方式を使用して、例えば、河川に近い別荘区、道路と河川に近い作業区、川を渡るトンネル、及び学校に近い住宅小区群などを検索することもできる。
第2のアプリケーションシナリオ:ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索推奨を行う。
例えば、ユーザが検索を開始する時、ユーザが検索する時の所在地理的位置区域を取得し、当該地理的位置区域の符号化結果を入力特徴の1つとして検索推奨を行う。例えば、入力ボックスに「ba」を入力する時、ユーザの入力に伴い、ドロップダウンボックスなどの形式でユーザに検索語の推奨を行う。ユーザが北京のあるホテルに位置する場合、例えば、「八達嶺長城」などの観光地を優先的に推奨する。ユーザが科学技術園に位置する場合、例えば、「百度ビル」などの科学技術系会社のオフィスビルを優先的に推奨する。
第3のアプリケーションシナリオ:ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索結果ソートを行う。
例えば、ユーザが検索を開始する時、ユーザが検索する時の所在地理的位置区域を取得し、当該地理的位置区域の符号化結果を入力特徴の1つとして検索結果のソートを行う。このような検索結果のソート方式が、地理的位置区域の地理的機能と地物分布に基づいて推奨することができる。例えば、北京のあるソフトウェアパークと成都のあるソフトウェアパークで開始されたレストラン類の検索について、両者は地理的位置上に遠いが、地理的機能と地物分布の類似性のため、その符号化結果が非常に類似し、これに基づいて行われるレストラン類の検索結果にも一定の類似性が存在し、例えば、すべてファストフード類が好ましい。
また、例えば、北京のあるソフトウェアパークと金融街の距離が非常に近いが、両者の符号化結果は遠く離れている。したがって、レストラン類の検索結果のソートを行う時に、多く異なる。例えば、ソフトウェアパークのユーザについてはファストフード類のレストランを優先的に返し、金融街のユーザについては西洋料理類のレストランを優先とする。
以上は本開示により提供される方法で行われる詳細な説明であり、以下は実施例を組み合わせて本開示により提供される装置で行われる詳細な説明である。
図5は本開示の実施例により提供される符号化モデルを確立する装置の構造図である。図5に示すように、当該装置500は、取得ユニット501とトレーニングユニット502を含むことができ、分割ユニット503をさらに含むことができる。各構成ユニットの主な機能は以下のようであり、
取得ユニット501は、トレーニングデータを取得するために用いられ、トレーニングデータは、1つ以上の3つ組を含み、3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む。
トレーニングユニット502は、トレーニングデータを使用して符号化モデルをトレーニングするために用いられ、符号化モデルはサンプルごとにそれぞれ以下の内容を実行し、前記内容は、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得する。
符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む。
その中、地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含むことができ、
地物分布情報は、地図画像と実景画像のうちの少なくとも1つを含むことができる。
その中、取得ユニット501は、以下のいくつかの方式を使用してトレーニングデータを取得することができるが、これらに限定されない。
第1の方式:地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択する。
第2の方式:ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する。
第3の方式:検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する。
分割ユニット503は、予め設定された精度に従って地理的位置区域を予め分割するために用いられる。
実現可能な方式として、符号化モデルは、少なくとも2つの埋め込みネットワークと融合ネットワークを含むことができる。
トレーニングユニット502は、サンプルから抽出された少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を各埋め込みネットワークにそれぞれ入力することができる。
埋め込みネットワークは、入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得するために用いられる。
融合ネットワークは、各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得するために用いられる。
トレーニングユニット502は、符号化モデルをトレーニングする場合、損失関数の値に基づいて埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、損失関数は、トレーニングターゲットに基づいて予め確立して取得する。
図6は本開示の実施例により提供される地理的位置区域の符号化装置の構造図である。図6に示すように、当該装置600は、決定ユニット601、取得ユニット602、及び符号化ユニット603を含むことができ、分割ユニット604とアプリケーションユニット605をさらに含むことができる。
決定ユニット601は、符号化される地理的位置区域を決定するために用いられる。
取得ユニット602は、地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得するために用いられる。
符号化ユニット603は、取得された地理的機能情報と地物分布情報を符号化モデルに入力し、符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、地理的位置区域の符号化結果を取得するために用いられる。
その中、地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含み、
地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも1つを含む。
分割ユニット604は、予め設定された精度に従って地理的位置区域を予め分割するために用いられる。
実現可能な方式として、決定ユニット601は、入力された地理的位置座標を取得し、地理的位置座標が位置する地理的位置区域を符号化される地理的位置区域として決定する。
別の実現可能な方式として、決定ユニット601は、分割された各地理的位置区域をそれぞれ符号化される地理的位置区域とすることができる。
アプリケーションユニット605は、地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、ユーザに対して検索推奨又は検索結果ソートを行うために用いられる。
本明細書の各実施例は、すべて漸進する方式を使用して説明し、各実施例間の同一の類似する部分は互いに参照すればよく、各実施例は、すべて他の実施例との異なる点を重点的に説明する。特に、装置の実施例について、方法の実施例と基本的に類似するため、説明が比較的に簡単であり、関連点は、方法の実施例の部分の説明を参照すればよい。
本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。
図7に示すように、本開示の実施例に係る地理的位置区域の符号化方法、及び符号化モデルを確立する方法の電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様の計算デバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本開示の実現を制限することを意図したものではない。
図7に示すように、機器700は計算ユニット701を含み、計算ユニット701は、読み取り専用メモリ(ROM)702に記憶されているコンピュータプログラム又は記憶ユニット708からランダムアクセスメモリ(RAM)703にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行することができる。RAM703には、機器700が動作するに必要な様々なプログラムとデータも記憶することができる。計算ユニット701、ROM702、及びRAM703は、バス704を介してお互いに接続される。入出力(I/O)インターフェース705もバス704に接続される。
機器700内の複数のコンポーネントは、I/Oインターフェース705に接続されており、キーボード、マウスなどの入力ユニット706と、様々なタイプのディスプレイ、スピーカなどの出力ユニット707と、ディスク、光ディスクなどの記憶ユニット708と、及びネットワークカード、モデム、無線通信トランシーバなどの通信ユニット709と、を含む。通信ユニット709は、機器700が、インターネットなどのコンピュータネットワーク、及び/又は様々な電気通信ネットワークを介して他の機器と情報/データを交換することを可能にする。
計算ユニット701は、様々な処理と計算能力を備える汎用及び/又は専用の処理コンポーネントである。計算ユニット701のいくつかの例は、中央処理装置(CPU)、グラフィックス処理ユニット(GPU)、様々な専用の人工知能(AI)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット701は、地理的位置区域の符号化方法、及び符号化モデルを確立する方法などの上記の様々な方法と処理を実行する。例えば、いくつかの実施例では、地理的位置区域の符号化方法、及び符号化モデルを確立する方法は、記憶ユニット708などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。
いくつかの実施例では、コンピュータプログラムの一部又は全部は、ROM702及び/又は通信ユニット709を介して機器700にローディング及び/又はインストールされる。コンピュータプログラムがRAM703にローディングされて計算ユニット701によって実行される場合、上記の地理的位置区域の符号化方法、及び符号化モデルを確立する方法の一つ又は複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット701は、他の任意の適切な方式(例えば、ファームウェアによって)を介して地理的位置区域の符号化方法、及び符号化モデルを確立する方法を実行するように構成されることができる。
本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップシステム(SOC)、ローディングプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。
本開示の方法を実施するためのプログラムコードは、一つ又は複数のプログラミング言語の任意の組み合わせを使用して作成することができる。これらのプログラムコードは、プログラムコードがプロセッサ又はコントローラによって実行される時にフローチャート及び/又はブロック図に規定された機能/動作が実施されるように、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能なデータ処理装置のプロセッサ又はコントローラに提供することができる。プログラムコードは、完全に機械上で実行されたり、部分的に機械上で実行されたり、独立したソフトウェアパッケージとして部分的に機械上で実行され、部分的にリモート機械上実行されたり、又は完全にリモート機械又はサーバ上で実行されたりすることができる。
本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、又は機器の使用、又は命令実行システム、装置又は機器と組み合わせて使用するプログラムを含むか、又は記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁気、赤外線、又は半導体システム、装置又は機器、又は上記の内容の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つ又は複数のワイヤに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM 又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、又は上記の内容の任意の適切な組み合わせを含む。
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバー)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、を含む。
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバは、クラウドサーバであってもよく、クラウド計算又はクラウドホストとも呼ばれ、クラウド計算サービスシステムの中の一つのホスト製品であり、従来の物理ホストとVPSサービス(「Virtual Private Server」、又は「VPS」と略称する)に、存在する管理困難度が高く、業務拡張性が弱い欠陥を解決する。サーバは、分散システムのサーバであってもよく、又はブロックチェーンを組み合わせるサーバであってもよい。
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims (24)

  1. トレーニングデータを取得するステップであって、前記トレーニングデータは、1つ以上の3つ組を含み、前記3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含むステップと、
    前記トレーニングデータを使用して符号化モデルをトレーニングするステップであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するステップと、を含み、
    前記符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む、
    符号化モデルを確立する方法。
  2. 前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含み、
    前記地物分布情報は、地図画像と実景画像のうちの少なくとも1つを含む、
    請求項1に記載の符号化モデルを確立する方法。
  3. 前記トレーニングデータを取得するステップは、
    地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択し、又は、
    ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択し、又は、
    検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択するステップを含む、
    請求項1又は2に記載の符号化モデルを確立する方法。
  4. 予め設定された精度に従って地理的位置区域を予め分割するステップをさらに含む、
    請求項1から3のいずれか一項に記載の符号化モデルを確立する方法。
  5. 前記符号化モデルは、少なくとも2つの埋め込みネットワークと融合ネットワークを含み、
    サンプルから抽出された少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を各埋め込みネットワークにそれぞれ入力し、
    前記埋め込みネットワークは入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得し、
    前記融合ネットワークは各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得し、
    前記符号化モデルをトレーニングする時、損失関数の値に基づいて前記埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、前記損失関数は、前記トレーニングターゲットに基づいて予め確立して取得する、
    請求項1から4のいずれか一項に記載の符号化モデルを確立する方法。
  6. 符号化される地理的位置区域を決定するステップと、
    前記地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得するステップと、
    取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得するステップと、を含む、
    地理的位置区域の符号化方法。
  7. 前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含み、
    前記地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも1つを含む、
    請求項6に記載の地理的位置区域の符号化方法。
  8. 予め設定された精度に従って地理的位置区域を予め分割するステップをさらに含み、
    前記符号化される地理的位置区域を決定するステップは、入力された地理的位置座標を取得するステップと、前記地理的位置座標が位置する地理的位置区域を前記符号化される地理的位置区域として決定するステップと、を含む、
    請求項6又は7に記載の地理的位置区域の符号化方法。
  9. 地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、前記ユーザに対して検索推奨又は検索結果ソートを行うステップをさらに含む、
    請求項6から8のいずれか一項に記載の地理的位置区域の符号化方法。
  10. トレーニングデータを取得する取得ユニットであって、前記トレーニングデータは、1つ以上の3つ組を含み、前記3つ組は、地理的位置区域のアンカーサンプル、ポジティブサンプル、及びネガティブサンプルを含む取得ユニットと、
    前記トレーニングデータを使用して符号化モデルをトレーニングするトレーニングユニットであって、前記符号化モデルは各サンプルにそれぞれ、サンプルの少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、サンプルの符号化結果を取得するトレーニングユニットと、を含み、
    前記符号化モデルのトレーニングターゲットは、3つ組内のアンカーサンプルの符号化結果とポジティブサンプルの符号化結果との間の距離を最小化し、3つ組内のアンカーサンプルの符号化結果とネガティブサンプルの符号化結果との間の距離を最大化することを含む、
    符号化モデルを確立する装置。
  11. 前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含み、
    前記地物分布情報は、地図画像と実景画像のうちの少なくとも1つを含む、
    請求項10に記載の符号化モデルを確立する装置。
  12. 前記取得ユニットは、
    地理的位置区域のアンカーサンプルを取得し、アンカーサンプルの隣接地理的位置区域をポジティブサンプルとして選択し、アンカーサンプルの非隣接地理的位置区域をネガティブサンプルとして選択し、又は、
    ナビゲーションログから、ナビゲーション開始点が位置する地理的位置区域とナビゲーション終了点が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択し、又は、
    検索ログから、検索された開始位置が位置する地理的位置区域とターゲット位置が位置する地理的位置区域をそれぞれ地理的位置区域のアンカーサンプルとポジティブサンプルとして取得し、他の地理的位置区域をネガティブサンプルとして選択する、
    請求項10又は11に記載の符号化モデルを確立する装置。
  13. 予め設定された精度に従って地理的位置区域を予め分割する分割ユニットをさらに含む、
    請求項10から12のいずれか一項に記載の符号化モデルを確立する装置。
  14. 前記符号化モデルは、少なくとも2つの埋め込みネットワークと融合ネットワークを含み、
    前記トレーニングユニットは、サンプルから抽出された少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を各埋め込みネットワークにそれぞれ入力し、
    前記埋め込みネットワークは、入力された情報に対して埋め込み処理を行って、対応するベクトル表現を取得し、
    前記融合ネットワークは、各埋め込みネットワークによって出力されたベクトル表現に対して融合処理を行って、サンプルの符号化結果を取得し、
    前記トレーニングユニットは、前記符号化モデルをトレーニングする時、損失関数の値に基づいて前記埋め込みネットワークと融合ネットワークのモデルパラメータを反復的に更新し、前記損失関数は、前記トレーニングターゲットに基づいて予め確立して取得する、
    請求項10から13のいずれか一項に記載の符号化モデルを確立する装置。
  15. 符号化される地理的位置区域を決定する決定ユニットと、
    前記地理的位置区域の少なくとも1つの地理的機能情報と少なくとも1つの地物分布情報を取得する取得ユニットと、
    取得された地理的機能情報と地物分布情報を符号化モデルに入力し、前記符号化モデルが地理的機能情報と地物分布情報に対してそれぞれ埋め込み処理を行い、埋め込み処理によって取得された各ベクトル表現を融合処理して、前記地理的位置区域の符号化結果を取得する符号化ユニットと、を含む、
    地理的位置区域の符号化装置。
  16. 前記地理的機能情報は、関心ポイント情報、ユーザ情報、及び当該地理的位置区域で開始された場所クエリワードのうちの少なくとも1つを含み、
    前記地物分布情報は、ベースマップ画像とストリートビュー画像のうちの少なくとも1つを含む、
    請求項15に記載の地理的位置区域の符号化装置。
  17. 予め設定された精度に従って地理的位置区域を予め分割する分割ユニットをさらに含み、
    前記決定ユニットは、入力された地理的位置座標を取得し、前記地理的位置座標が位置する地理的位置区域を前記符号化される地理的位置区域として決定する、
    請求項15又は16に記載の地理的位置区域の符号化装置。
  18. 地理的位置区域の符号化結果間の距離を使用して、類似する地理的位置区域を決定し、又は、ユーザが位置する地理的位置区域の符号化結果に基づいて、前記ユーザに対して検索推奨又は検索結果ソートを行うアプリケーションユニットをさらに含む、
    請求項15から17のいずれか一項に記載の地理的位置区域の符号化装置。
  19. 少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
    前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1から5のいずれか一項に記載の符号化モデルを確立する方法を実行する、
    電子機器。
  20. 少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
    前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項6から9のいずれか一項に記載の地理的位置区域の符号化方法を実行する、
    電子機器。
  21. コンピュータに請求項1から5のいずれか一項に記載の符号化モデルを確立する方法を実行させるコンピュータ命令が記憶されている、
    非一時的なコンピュータ読み取り可能な記憶媒体。
  22. コンピュータに請求項6から9のいずれか一項に記載の地理的位置区域の符号化方法を実行させるコンピュータ命令が記憶されている、
    非一時的なコンピュータ読み取り可能な記憶媒体。
  23. プロセッサによって実行される時に請求項1から5のいずれか一項に記載の符号化モデルを確立する方法を実現する、
    コンピュータプログラム。
  24. プロセッサによって実行される時に請求項6から9のいずれか一項に記載の地理的位置区域の符号化方法を実現する、
    コンピュータプログラム。
JP2022543043A 2021-05-24 2021-11-17 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置 Pending JP2023530795A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110565434.6A CN113342912B (zh) 2021-05-24 2021-05-24 地理位置区域的编码方法、建立编码模型的方法及装置
CN202110565434.6 2021-05-24
PCT/CN2021/131177 WO2022247165A1 (zh) 2021-05-24 2021-11-17 地理位置区域的编码方法、建立编码模型的方法及装置

Publications (1)

Publication Number Publication Date
JP2023530795A true JP2023530795A (ja) 2023-07-20

Family

ID=77471102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022543043A Pending JP2023530795A (ja) 2021-05-24 2021-11-17 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置

Country Status (6)

Country Link
US (1) US20240177469A1 (ja)
EP (1) EP4174712A4 (ja)
JP (1) JP2023530795A (ja)
KR (1) KR20220160534A (ja)
CN (1) CN113342912B (ja)
WO (1) WO2022247165A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342912B (zh) * 2021-05-24 2022-03-18 北京百度网讯科技有限公司 地理位置区域的编码方法、建立编码模型的方法及装置
CN113837162B (zh) * 2021-11-29 2022-04-08 腾讯科技(深圳)有限公司 数据处理方法及相关装置
CN114926655B (zh) * 2022-05-20 2023-09-26 北京百度网讯科技有限公司 地理与视觉跨模态预训练模型的训练方法、位置确定方法
CN114998684B (zh) * 2022-05-20 2023-06-23 北京百度网讯科技有限公司 地理与视觉跨模态预训练模型的训练方法、定位调整方法
KR102664445B1 (ko) * 2023-01-12 2024-05-10 이다경 건축토지를 매칭하고 실내 인테리어를 제공하는 서비스 제공 장치, 시스템, 방법 및 프로그램

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866140A (zh) * 2019-11-26 2020-03-06 腾讯科技(深圳)有限公司 图像特征提取模型训练方法、图像搜索方法及计算机设备
CN111666462A (zh) * 2020-04-28 2020-09-15 百度在线网络技术(北京)有限公司 地理位置的推荐方法、装置、设备和计算机存储介质
WO2021020299A1 (ja) * 2019-07-30 2021-02-04 株式会社Nttドコモ 人気度推定システム及び地理的特徴生成モデル

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103609144A (zh) * 2011-06-16 2014-02-26 诺基亚公司 用于解析地理标识的方法和装置
CN108628904B (zh) * 2017-03-23 2021-03-02 北京嘀嘀无限科技发展有限公司 一种路径编码、相似路径检索方法及装置和电子设备
CN110727816A (zh) * 2018-06-29 2020-01-24 百度在线网络技术(北京)有限公司 兴趣点类别确定方法和装置
CN110008293B (zh) * 2019-02-02 2022-12-27 创新先进技术有限公司 地理位置查询方法及装置
AU2019200976A1 (en) * 2019-02-12 2020-08-27 Canon Kabushiki Kaisha Method, system and apparatus for generating training samples for matching objects in a sequence of images
CN111274936B (zh) * 2020-01-19 2023-04-18 中国科学院上海高等研究院 多光谱图像地物分类方法、***、介质及终端
CN111666461B (zh) * 2020-04-24 2023-05-26 百度在线网络技术(北京)有限公司 检索地理位置的方法、装置、设备和计算机存储介质
CN111666292B (zh) * 2020-04-24 2023-05-26 百度在线网络技术(北京)有限公司 用于检索地理位置的相似度模型建立方法和装置
CN112269925B (zh) * 2020-10-19 2024-03-22 北京百度网讯科技有限公司 一种获取地理位置点信息的方法和装置
CN112559885B (zh) * 2020-12-25 2024-01-12 北京百度网讯科技有限公司 地图兴趣点的训练模型确定方法、装置及电子设备
CN113342912B (zh) * 2021-05-24 2022-03-18 北京百度网讯科技有限公司 地理位置区域的编码方法、建立编码模型的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021020299A1 (ja) * 2019-07-30 2021-02-04 株式会社Nttドコモ 人気度推定システム及び地理的特徴生成モデル
CN110866140A (zh) * 2019-11-26 2020-03-06 腾讯科技(深圳)有限公司 图像特征提取模型训练方法、图像搜索方法及计算机设备
CN111666462A (zh) * 2020-04-28 2020-09-15 百度在线网络技术(北京)有限公司 地理位置的推荐方法、装置、设备和计算机存储介质

Also Published As

Publication number Publication date
EP4174712A4 (en) 2024-03-20
WO2022247165A1 (zh) 2022-12-01
CN113342912B (zh) 2022-03-18
CN113342912A (zh) 2021-09-03
EP4174712A1 (en) 2023-05-03
US20240177469A1 (en) 2024-05-30
KR20220160534A (ko) 2022-12-06

Similar Documents

Publication Publication Date Title
JP2023530795A (ja) 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置
CN109145169B (zh) 一种基于统计分词的地址匹配方法
CN109478184B (zh) 识别、处理和显示数据点聚类
WO2022213580A1 (zh) 地图的生成方法、装置、电子设备及存储介质
CN113434623B (zh) 一种基于多源异构空间规划数据的融合方法
US8949196B2 (en) Systems and methods for matching similar geographic objects
CN106462624A (zh) 基于图块的地理编码器
CN107203526B (zh) 一种查询串语义需求分析方法及装置
CN110309433B (zh) 一种数据处理方法、装置及服务器
JP2022018087A (ja) 地図情報表示方法、装置、電子デバイス及び記憶媒体
CN111881377A (zh) 位置兴趣点的处理方法及装置
US11893073B2 (en) Method and apparatus for displaying map points of interest, and electronic device
US9811539B2 (en) Hierarchical spatial clustering of photographs
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
CN112528639A (zh) 对象识别方法和装置、存储介质及电子设备
CN111666461B (zh) 检索地理位置的方法、装置、设备和计算机存储介质
CN113160693A (zh) 一种道路路口的处理方法、装置、设备和存储介质
CN114820960B (zh) 构建图谱的方法、装置、设备和介质
CN112861023B (zh) 地图信息处理方法、装置、设备、存储介质及程序产品
CN115757674A (zh) 地图处理方法、装置、设备及存储介质
CN114036414A (zh) 兴趣点的处理方法、装置、电子设备、介质及程序产品
CN112381166B (zh) 信息点识别方法、装置及电子设备
CN113868555A (zh) 一种轨迹检索方法、装置、设备以及存储介质
CN111767722A (zh) 一种分词方法和装置
Zhang et al. A polygonal buildings aggregation method considering obstacle elements and visual clarity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240312