JP5708278B2 - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP5708278B2
JP5708278B2 JP2011128359A JP2011128359A JP5708278B2 JP 5708278 B2 JP5708278 B2 JP 5708278B2 JP 2011128359 A JP2011128359 A JP 2011128359A JP 2011128359 A JP2011128359 A JP 2011128359A JP 5708278 B2 JP5708278 B2 JP 5708278B2
Authority
JP
Japan
Prior art keywords
cluster
name
area
named
relevance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011128359A
Other languages
English (en)
Other versions
JP2012256171A5 (ja
JP2012256171A (ja
Inventor
達人 佐藤
達人 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011128359A priority Critical patent/JP5708278B2/ja
Priority to US13/467,100 priority patent/US8949238B2/en
Priority to EP12169963A priority patent/EP2541487A1/en
Priority to CN201210180331.9A priority patent/CN102982337B/zh
Publication of JP2012256171A publication Critical patent/JP2012256171A/ja
Publication of JP2012256171A5 publication Critical patent/JP2012256171A5/ja
Application granted granted Critical
Publication of JP5708278B2 publication Critical patent/JP5708278B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • G06F16/444Spatial browsing, e.g. 2D maps, 3D or virtual spaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q90/00Systems or methods specially adapted for administrative, commercial, financial, managerial or supervisory purposes, not involving significant data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本開示は、情報処理装置および情報処理方法に関する。
クラスタリングは、位置情報を有するデータの分類方法として知られている。クラスタリングの例として、特許文献1では、写真を撮影した位置の情報に基づいて、互いに近い位置で撮影された写真を同じクラスタに分類する技術が開示されている。また、特許文献2では、写真を撮影した日時の情報に基づいて、互いに近い日時に撮影された写真を同じクラスタに分類する技術が開示されている。
さらに、クラスタに分類された写真の撮影位置を含む地域の名称をクラスタ名称として与えるといったように、クラスタリングの結果として得られたクラスタに所定の領域の名称を用いて名称を付与する技術も開発されている。
特開2008−250605号公報 特許第4577173号公報
しかし、上記のような技術によってクラスタに与えられた名称は、必ずしも、ユーザが妥当だと感じるような自然な名称ではないことがあった。例えば、写真が撮影位置に基づいて分類されたクラスタの場合、地域の境界をまたいで互いに近い位置で撮影された写真が分類されたクラスタについて、クラスタの領域に比べて不自然に大きな地域の名称が与えられるような場合があった。
そこで、本開示では、所定の領域の名称を用いてより自然なクラスタの名称を生成することが可能な、新規かつ改良された情報処理装置および情報処理方法を提案する。
本開示によれば、特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、上記特徴空間に予め設定された名称つき領域を上記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、上記抽出された名称つき領域と上記クラスタとの間の関連性を、少なくとも上記名称つき領域における上記クラスタとの重複部分の割合に基づいて評価する関連性評価部と、上記評価された関連性に基づいて上記抽出された名称つき領域の名称から上記クラスタの名称を生成するクラスタ名称生成部とを含み、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性評価部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域と上記クラスタとの重複部分から上記第1の名称つき領域と上記クラスタとの重複部分を除いて上記第2の名称つき領域の上記関連性を再評価する情報処理装置が提供される。
また、本開示によれば、特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、上記特徴空間に予め設定された名称つき領域を上記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、上記抽出された名称つき領域と上記クラスタとの間の関連性を、少なくとも上記名称つき領域に含まれる上記位置データの数に基づいて評価する関連性評価部と、上記評価された関連性に基づいて上記抽出された名称つき領域の名称から上記クラスタの名称を生成するクラスタ名称生成部とを含み、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性評価部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域に含まれる上記位置データから上記第1の名称つき領域に含まれる上記位置データを除いて上記第2の名称つき領域の上記関連性を再評価する情報処理装置が提供される。
また、本開示によれば、コンピュータを用いて構築されたシステムにおいて、上記コンピュータが備える各手段が、特徴空間の位置データが分類されるクラスタの情報を取得することと、上記特徴空間に予め設定された名称つき領域を上記クラスタに分類される位置データごとに少なくとも1つ抽出することと、上記抽出された名称つき領域と上記クラスタとの間の関連性を、少なくとも上記名称つき領域における上記クラスタとの重複部分の割合に基づいて評価することと、上記評価された関連性に基づいて上記抽出された名称つき領域の名称から上記クラスタの名称を生成することとを含み、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性を評価することは、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域と上記クラスタとの重複部分から上記第1の名称つき領域と上記クラスタとの重複部分を除いて上記第2の名称つき領域の上記関連性を再評価することを含む、情報処理方法が提供される。
また、本開示によれば、コンピュータを用いて構築されたシステムにおいて、上記コンピュータが備える各手段が、特徴空間の位置データが分類されるクラスタの情報を取得することと、上記特徴空間に予め設定された名称つき領域を上記クラスタに分類される位置データごとに少なくとも1つ抽出することと、上記抽出された名称つき領域と上記クラスタとの間の関連性を、少なくとも上記名称つき領域に含まれる上記位置データの数に基づいて評価することと、上記評価された関連性に基づいて上記抽出された名称つき領域の名称から上記クラスタの名称を生成することとを含み、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性を評価することは、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域に含まれる上記位置データから上記第1の名称つき領域に含まれる上記位置データを除いて上記第2の名称つき領域の上記関連性を再評価することを含む、情報処理方法が提供される。
さらに、本開示によれば、特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、上記クラスタに分類される位置データごとに少なくとも1つ抽出された上記特徴空間上の名称つき領域と上記クラスタとの間の関連性に基づいて上記抽出された名称つき領域の名称から生成された上記クラスタの名称の情報を取得するクラスタ名称情報取得部と、上記クラスタおよび上記クラスタの名称の情報を表示部に表示させる表示制御部とを備え、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性は、少なくとも上記名称つき領域における上記クラスタとの重複部分の割合に基づいて評価され、上記クラスタ名称情報取得部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域と上記クラスタとの重複部分から上記第1の名称つき領域と上記クラスタとの重複部分を除いて再評価された上記第2の名称つき領域の上記関連性に基づいて生成された上記クラスタの名称の情報を取得する情報処理装置が提供される。
また、本開示によれば、特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、上記クラスタに分類される位置データごとに少なくとも1つ抽出された上記特徴空間上の名称つき領域と上記クラスタとの間の関連性に基づいて上記抽出された名称つき領域の名称から生成された上記クラスタの名称の情報を取得するクラスタ名称情報取得部と、上記クラスタおよび上記クラスタの名称の情報を表示部に表示させる表示制御部とを備え、上記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、上記関連性は、少なくとも上記名称つき領域に含まれる上記位置データの数に基づいて評価され、上記クラスタ名称情報取得部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域に含まれる上記位置データから上記第1の名称つき領域に含まれる上記位置データを除いて再評価された上記第2の名称つき領域の上記関連性に基づいて生成された上記クラスタの名称の情報を取得する情報処理装置が提供される。
本開示によれば、所定の名称つき領域の名称から、それぞれの名称つき領域とクラスタとの間の関連性に基づいて適切なクラスタの名称が生成される。
以上説明したように本開示によれば、所定の領域の名称を用いてより自然なクラスタの名称を生成することができる。
他の方法によるクラスタ名称生成の例を示す図である。 本開示の第1の実施形態によるクラスタ名称生成の例を示す図である。 本開示の第1の実施形態に係る情報処理装置の機能構成を概略的に示すブロック図である。 本開示の第1の実施形態におけるクラスタリング処理を示すフローチャートである。 本開示の第1の実施形態におけるクラスタリング結果の例を示す図である。 本開示の第1の実施形態におけるクラスタ名称生成処理の概要を示すフローチャートである。 本開示の第1の実施形態における候補領域抽出部の処理を示すフローチャートである。 本開示の第1の実施形態において領域名称データベースに格納される地域リストの例を示す図である。 本開示の第1の実施形態における画像コンテンツとクラスタと候補領域との関係について説明するための図である。 本開示の第1の実施形態における候補領域の一次リストの例を示す図である。 本開示の第1の実施形態における関連性評価部の処理を示すフローチャートである。 本開示の第1の実施形態における関連性評価部の処理について説明するための図である。 本開示の第1の実施形態における関連性評価部の処理について説明するための図である。 本開示の第1の実施形態における関連性評価部の処理について説明するための図である。 本開示の第1の実施形態におけるクラスタ名称生成部の処理を示すフローチャートである。 本開示の第1の実施形態において設定されうる閾値について説明するための図である。 本開示の第2の実施形態によるクラスタ名称生成の例を示す図である。 本開示の第3の実施形態における特徴マップ空間の例を示す図である。 本開示の第3の実施形態によるクラスタ名称生成の例を示す図である。 本開示の第4の実施形態に係る情報処理装置の機能構成を概略的に示すブロック図である。 本開示の実施形態に係る情報処理装置のハードウェア構成を説明するためのブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.第1の実施形態
1−1.概要
1−2.装置構成
1−3.候補領域抽出部
1−4.関連性評価部
1−5.クラスタ名称生成部
2.第2の実施形態
3.第3の実施形態
4.第4の実施形態
5.ハードウェア構成
6.補足
(1.第1の実施形態)
(1−1.概要)
最初に、図1および図2を参照して、本開示の第1の実施形態の概要について説明する。ここでは、本実施形態によって実現されるクラスタの名称生成についての概略的な理解のために、他の方法によるクラスタ名称生成の例と、本実施形態によるクラスタ名称生成の例とを対比説明する。図1には、他の方法によるクラスタ名称生成の例が示され、図2には、本実施形態によるクラスタ名称生成の例が示されている。
まず、図1に示される他の方法の例について説明する。画像コンテンツ110は、デジタルカメラや携帯電話などの撮影機能を有する機器によって撮影された画像コンテンツである。画像コンテンツ110には、メタ情報として撮影位置の情報が付加される。画像コンテンツ110は、その撮影位置によって地図100上に表現される。また、画像コンテンツ110は、その撮影位置に基づいてクラスタ120に分類される。クラスタ120には、地図100における地域の名称として予め設定された名称を用いて生成されたクラスタ名称122が与えられる。
ここで、地図100における地域の名称は、市町村、都道府県、および地方について設定される。市町村は、いずれかの都道府県に属し、都道府県は、いずれかの地方に属する。つまり、市町村、都道府県、および地方の間には、木構造が存在し、互いに上位と下位の関係にある。図1の例では、クラスタ120に含まれる画像コンテンツ110が複数の地域にまたがる場合、それらの地域に共通する上位の地域の名称がクラスタ名称122として与えられる。
図1の(a)では、画像コンテンツ110が、クラスタ120aとクラスタ120bとに分類される例が示されている。クラスタ120aには、盛岡市に位置する1つの画像コンテンツ110が含まれるため、クラスタ名称122aとして“盛岡市”が与えられる。また、クラスタ120bには、新潟県、福島県、および山形県に位置する3つの画像コンテンツ110が含まれるため、クラスタ名称122bとして、これらの都道府県に共通する上位の地域の名称である“北陸・東北地方”が与えられる。
一方、図1の(b)では、画像コンテンツ110が、クラスタ120cとクラスタ120dとに分類される例が示されている。クラスタ120cには、クラスタ120aと同様に、盛岡市に位置する1つの画像コンテンツ110が含まれ、クラスタ名称122cとして“盛岡市”が与えられる。クラスタ120dには、新潟県および福島県に位置する3つの画像コンテンツ110が含まれるため、クラスタ名称122dとして、これらの都道府県に共通する上位の地域の名称である“北陸・東北地方”が与えられる。
ここで、クラスタ120a,120cは、サイズが市町村の領域と同程度のクラスタである。従って、市町村の名称である“盛岡市”を用いたクラスタ名称122a,122cは、自然な名称と考えられる。また、クラスタ120bは、サイズが平均的な都道府県の領域よりも大きいクラスタである。従って、地方の名称である“北陸・東北地方”を用いたクラスタ名称122bも、自然な名称と考えられる。
しかし、クラスタ120dは、サイズが市町村の領域と同程度のクラスタであるにもかかわらず、サイズがずっと大きいクラスタ120bと同じように、地方の名称である“北陸・東北地方”を用いたクラスタ名称122dが与えられている。かかるクラスタ名称122dは、クラスタ120dのサイズとつり合っておらず、他のクラスタ名称122a〜122cに比べて不自然な印象をユーザに与えかねないものである。
このように、複数の地域にまたがって位置する画像コンテンツ110が分類されるクラスタ120に、クラスタ名称122として複数の地域に共通する上位の地域の名称を与えると、クラスタ120dの例のように、クラスタ120の大きさとクラスタ名称122の指す領域とがつり合わず、クラスタ名称122がユーザに不自然な印象を与える可能性がある。
次に、図2に示される本実施形態の例について説明する。図2の(a)では、図1の(a)と同様の画像コンテンツ110およびクラスタ120a,120bに対して、図1の例と同様にクラスタ名称122a,122bが与えられる例が示されている。また、図2の(b)では、画像コンテンツ110およびクラスタ120c,120dは図1の(b)と同様であり、クラスタ名称122cも図1の例と同様であるが、クラスタ名称122dは、“北陸・東北地方”とはならず、“阿賀町,その他”となる例が示されている。
図2の例でも、図1の例と同様に、地図100における地域の名称を用いてクラスタ名称122が生成される。例えばクラスタ120bでは、図1の例と同様に、画像コンテンツ110が位置する複数の地域に共通する上位の地域の名称である“北陸・東北地方”がクラスタ名称122bとして与えられる。一方、例えばクラスタ120dでは、図1の例とは異なるクラスタ名称122dが与えられる。これは、図2の例では、上位の地域の名称を与えることが適切であるか否かが判定されるためである。上位の地域の名称を与えることが適切ではないと判定された場合、クラスタ120に含まれる画像コンテンツ110が複数の地域にまたがる場合であっても、下位の地域の名称を用いてクラスタ名称122が生成されうる。
このことについて、クラスタ120dを例としてさらに詳しく説明する。クラスタ120dについてのクラスタ名称122dの生成にあたっては、市町村の名称“阿賀町”(新潟県にある町)、その上位の地域である都道府県の名称“新潟県”および“福島県”、さらに上位の地域である地方の名称“北陸・東北地方”などのうち、どの名称がより的確にクラスタ120dの領域を表現しうるかが判定される。図示された例では、クラスタ120dに含まれる3つの画像コンテンツ110のうちの2つの撮影位置が含まれる市町村の名称である“阿賀町”が最も的確であると判定され、クラスタ名称122dに用いられる。さらに、クラスタ120dには撮影位置が阿賀町の領域に含まれない画像コンテンツ110も含まれるため、クラスタ名称122dには“その他”が追加される。
上述のように、クラスタ120dは、サイズが市町村の領域と同程度のクラスタである。図2の例において与えられるクラスタ名称122d“阿賀町,その他”は、クラスタ120dのサイズとつり合った大きさの地域である市町村の名称“阿賀町”を用いて生成されるため、ユーザにより自然な印象を与えうるものと考えられる。
本実施形態では、以上で説明した図2の例のようなクラスタ名称122の生成が実現される。以下では、そのための構成、およびクラスタ名称生成のより詳細な例について説明する。
(1−2.装置構成)
図3を参照して、本開示の第1の実施形態に係る情報処理装置10の機能構成について説明する。図3のブロック図は、本開示の第1の実施形態に係る情報処理装置10の機能構成を概略的に示す。情報処理装置10は、例えばPC(Personal Computer)として実現され、コンテンツ取得部11と、クラスタリング部13と、候補領域抽出部15と、関連性評価部17と、クラスタ名称生成部19と、領域名称データベース21と、クラスタ名称出力部23とを含む。
コンテンツ取得部11は、画像コンテンツ110の情報を取得する。画像コンテンツ110は、例えば、デジタルカメラや携帯電話などの撮影機能を有する機器において撮影されたものであり、撮影位置の情報がメタ情報として付加されている。コンテンツ取得部11は、例えばこれらの機器と通信する接続ポート、または通信装置などによって実現されうる。なお、コンテンツ取得部11は、画像コンテンツ110の画像データを含む全体を取得しなくてもよく、例えばコンテンツを特定するIDと撮影位置のメタ情報だけを取得してもよい。
クラスタリング部13は、コンテンツ取得部11によって取得された画像コンテンツ110をクラスタ120に分類する。候補領域抽出部15と、関連性評価部17と、クラスタ名称生成部19とは、クラスタ120に与えられるクラスタ名称122を生成する。これらの各部の詳細な機能については後述する。クラスタリング部13と、候補領域抽出部15と、関連性評価部17と、クラスタ名称生成部19とは、例えばCPU(Central Processing Unit)、ROM(Read Only Memory)、およびRAM(Random Access Memory)などによって実現されうる。
領域名称データベース21は、候補領域抽出部15によって参照されるデータベースである。領域名称データベース21は、例えば情報処理装置10が有するストレージ装置などによって実現されうる。また、領域名称データベース21は、情報処理装置10の外部にあるストレージ装置によって実現され、情報処理装置10は通信装置を用いてこれを参照してもよい。領域名称データベース21に格納される情報については後述する。
クラスタ名称出力部23は、生成されたクラスタ名称122の情報を出力する。例えば、クラスタ名称122の情報は、情報処理装置10に画像コンテンツ110の情報を提供したデジタルカメラや携帯電話などの他の機器にクラスタ名称122を伴うクラスタ120の情報を送り返すことによって出力されてもよい。この場合、クラスタ名称出力部23は、これらの機器と通信する接続ポート、または通信装置などによって実現されうる。また、クラスタ名称122の情報は、クラスタ120の情報とともに情報処理装置10からユーザに出力されてもよい。この場合、クラスタ名称出力部23は、情報処理装置10が有するディスプレイなどの出力装置によって実現されうる。
なお、情報処理装置10における画像コンテンツ110の取得、画像コンテンツ110をクラスタ120に分類するクラスタリング、およびクラスタ名称122の出力については、上記の例に限らず様々な構成が可能である。例えば、情報処理装置10は、撮影機能を有し、自ら画像コンテンツ110を撮影してもよい。また、情報処理装置10は、他の機器によるクラスタリングの結果を取得し、専らクラスタ名称122の生成を実行してもよい。それゆえ、情報処理装置10は、PC以外にも、デジタルカメラ、ビデオカメラ、ゲーム機、携帯電話、スマートフォン、カーナビゲーションシステム、PDA(Personal Digital Assistant)など、あらゆる種類の情報処理装置でありうる。
(クラスタリング処理)
次に、図4および図5を参照して、本実施形態に係る情報処理装置10におけるクラスタリング処理について説明する。
図4は、本実施形態におけるクラスタリング処理を示すフローチャートである。まず、クラスタリング部13は、コンテンツ取得部11が取得した画像コンテンツ110を取得する(ステップS101)。次に、クラスタリング部13は、画像コンテンツ110のメタ情報から位置情報を抽出する(ステップS103)。ここで抽出される位置情報は、画像コンテンツ110の撮影位置の情報として付加された情報である。
次に、クラスタリング部13は、抽出された位置情報に基づいてクラスタリングを実行する(ステップS105)。クラスタリングによって、画像コンテンツ110がクラスタ120に分類される。クラスタリングには、例えば、位置情報に基づいて画像コンテンツ110の間の距離を算出し、互いに近い距離にある画像コンテンツ110を同じクラスタ120に分類する距離ベースの手法が用いられうるが、これには限られず、公知のあらゆる手法が用いられうる。
次に、クラスタリング部13は、クラスタリングの結果を候補領域抽出部15に出力する(ステップS107)。ここで出力される結果は、例えば図5に示されるようなものである。
図5は、本実施形態におけるクラスタリング結果の例を示す図である。クラスタリング結果は、地図100上での画像コンテンツ110の位置と、画像コンテンツ110が分類されるクラスタ120の領域の情報とを含む。クラスタリング部13から出力されるこれらの情報を、本明細書ではクラスタ情報ともいう。なお、地図100は2次元の特徴空間であり、画像コンテンツ110は特徴空間の位置によって表現されるデータである。また、クラスタリング部13は、クラスタリングを実行することによって上記のクラスタ情報を取得するクラスタ情報取得部である。
(クラスタ名称生成処理)
次に、図6を参照して、本実施形態におけるクラスタ名称生成処理について説明する。
図6は、本実施形態におけるクラスタ名称生成処理の概要を示すフローチャートである。まず、候補領域抽出部15が、候補領域の一次リストを生成する(ステップS201)。次に、関連性評価部17が、候補領域の一次リストから候補領域の二次リストを生成する(ステップS203)。次に、クラスタ名称生成部19が、候補領域の二次リストに基づいて、クラスタ名称122を生成する(ステップS205)。
ここで、候補領域は、クラスタ名称122に名称が用いられる可能性がある領域であり、地図100上に予め設定された地域から抽出される。地域は、地図100上に予め設定された領域であり、例えば“日本国”や“東京都”などのように、それぞれが名称を有する。地図上の地域のように、名称が予め設定された特徴空間上の領域を、本明細書では名称つき領域という。本実施形態では、名称つき領域である地域から候補領域が抽出され、抽出された候補領域からさらに所定の基準に基づいて抽出された地域の名称がクラスタ名称122に用いられる。
この候補領域の抽出のために用いられるのが、候補領域の一次リストおよび二次リストである。これらのリストを、以下では単に一次リストおよび二次リストともいう。一次リストは、クラスタ120に分類される画像コンテンツ110ごとに、当該画像コンテンツ110の位置を包含する地域を少なくとも1つ抽出したリストである。つまり、一次リストに抽出された地域は、少なくとも1つの画像コンテンツ110の位置を包含する。二次リストは、一次リストに含まれるそれぞれの領域について、クラスタ120との関連性の評価値を関連付けたものである。これらのリストは、例えば情報処理装置10が有するストレージ装置などに格納され、必要に応じて更新されうる。
以下で、図7〜図16を参照して、ステップS201〜S205のそれぞれの処理について詳細に説明する。なお、ステップS201の処理は図7に、ステップS203の処理は図11に、ステップS205の処理は図15に、それぞれ対応する。
(1−3.候補領域抽出部)
図7は、本実施形態における候補領域抽出部15の処理を示すフローチャートである。
候補領域抽出部15は、クラスタ120に分類される各画像コンテンツ110についての繰り返し処理を実行する(ステップS301)。ここで、候補領域抽出部15は、画像コンテンツ110のメタ情報から位置情報を抽出する(ステップS303)。ここで抽出される位置情報は、画像コンテンツ110の撮影位置の情報として付加された情報である。
さらに、候補領域抽出部15は、抽出した位置情報に対応する地域を一次リストに追加する(ステップS305)。ここで、位置情報に対応する地域とは、地図100上で画像コンテンツ110の撮影位置を包含する地域である。地域の情報は、地域リストとして領域名称データベース21に格納されている。地域の情報は、例えば図8に示すようなリストでありうる。また、一次リストは、領域名称だけではなく、領域に含まれるコンテンツやクラスタ120の領域との重複面積などの情報を含み、例えば図10に示すようなリストでありうる。
図8は、本実施形態において領域名称データベース21に格納される地域リスト25の例を示す図である。図8を参照すると、地域リスト25は、ID、領域名称、領域データ、領域面積の情報を含む。
このうち、IDは、地域の情報を識別するためのIDである。領域名称は、それぞれの地域に与えられた名称である。領域データは、例えば地図100上の複数の位置を示す情報であり、これらの複数の位置を頂点とする多角形によって各地域の領域が定義される。領域面積は、地図100上での各地域の大きさである。
図示された例において、地域リスト25には、“富士山”、“幕張メッセ”、“海浜幕張駅とその周辺”などのようなランドマーク地域と、“関東地方”、“東京都”、“品川区”などのような住所地域とが両方含まれている。住所地域は、市町村(例えば品川区)、都道府県(例えば東京都)、および地方(例えば関東地方)のように木構造を有し、上位の地域は下位の地域を包含する。
一方、ランドマーク地域は、必ずしも木構造のような規則的な構造を有さない。例えば、図示された例において、“幕張メッセ”の領域と“海浜幕張駅とその周辺”の領域とは部分的に重なり合うが、包含関係にはない。また、ランドマーク地域は、住所地域の木構造とは独立して設定されうる。従って、ランドマーク地域と住所地域との関係も、不規則なものでありうる。
上記の理由によって、図7のステップS305において一次リストに追加される地域は、1つとは限らない。まず、住所地域の場合、木構造を有しているため、下位の地域に画像コンテンツ110の撮影位置が含まれる場合、当該位置はその上位の地域にも含まれることになる。例えば、画像コンテンツ110の撮影位置が“品川区”に含まれる場合、当該位置は“東京都”にも含まれ、さらに“関東地方”にも含まれる。
さらに、ランドマーク地域の場合、複数の地域が不規則に重なり合う可能性があるため、画像コンテンツ110の撮影位置が複数の地域に含まれる場合がある。例えば、画像コンテンツ110の撮影位置が幕張メッセと海浜幕張駅との中間付近である場合、当該位置を含むランドマーク地域として、“幕張メッセ”および“海浜幕張駅とその周辺”の両方が抽出されうる。
図9は、本実施形態における画像コンテンツ110と、クラスタ120と、候補領域130との関係について説明するための図である。図10は、図9の例において生成されうる一次リスト140の例を示す図である。
図9では、画像コンテンツ110が分類されるクラスタ120と、クラスタ120に分類される画像コンテンツ110の撮影位置を少なくとも1つ含む地域である候補領域130a〜130cとが示されている。候補領域130aは、領域名称が“A”であり、“1”〜“5”の画像コンテンツ110の位置を包含する領域である。候補領域130bは、領域名称が“B”であり、“1”,“3”の画像コンテンツ110の位置を包含する領域である。候補領域130cは、領域名称が“C”であり、“2”〜“6”の画像コンテンツ110の位置を包含する領域である。
図10では、候補領域抽出部15が“1”〜“6”の画像コンテンツ110のそれぞれについて候補領域130を抽出することによって生成される一次リスト140の例が示されている。図示された例において、一次リスト140は、領域名称、領域面積、コンテンツID、コンテンツ数、およびクラスタ領域との重複面積の情報を含む。
このうち、領域名称および領域面積は、領域名称データベース21に格納された地域リスト25から取得されうる。コンテンツIDは、例えば、図7のステップS305において各画像コンテンツ110について候補領域130が抽出されるときに、当該画像コンテンツ110の情報から取得されうる。コンテンツ数は、同じくステップS305において、ある画像コンテンツ110についてある候補領域130が最初に抽出された場合のカウントを1とし、その後、他の画像コンテンツ110についても同じ候補領域130が抽出された場合にカウントを増加させることによって取得されうる。クラスタ領域との重複面積は、領域名称データベース21に格納された地域リスト25から取得される各領域の領域データと、クラスタリング部13から提供されるクラスタの領域の情報とから算出されうる。
ここで、候補領域130a〜130cは、いずれも、クラスタ120に分類される画像コンテンツ110の位置を少なくとも1つ包含する領域であるが、この時点では、候補領域130の名称のうちのどれがクラスタ名称122として適切であるかはわからない。それゆえ、候補領域抽出部15は、生成された一次リスト140の情報を関連性評価部17に提供し、関連性評価部17が各候補領域130のクラスタ120との間の関連性を評価する。
(1−4.関連性評価部)
図11は、本実施形態における関連性評価部17の処理を示すフローチャートである。
まず、関連性評価部17は、一次リスト140内の各候補領域130について、関連性評価値を算出する(ステップS401)。本実施形態において、関連性評価値は、各候補領域130に位置が包含される画像コンテンツ110の数、および各候補領域130とクラスタ120の領域との重複面積に基づいて算出される。
次に、関連性評価部17は、一次リスト140内で関連性評価値が最も高い候補領域130を二次リストに追加する(ステップS403)。二次リストに追加される候補領域130の情報には、ステップS401で算出された当該候補領域130の関連性評価値が関連付けられる。
次に、関連性評価部17は、ステップS403において二次リストに追加された候補領域130に関する要素を一次リスト140から削除する(ステップS405)。後述するように、候補領域130に関する要素は、候補領域130に含まれる画像コンテンツ110と、候補領域130と重複するクラスタ120の部分とを含む。
次に、関連性評価部17は、一次リスト140が空になったか否かを判定し(ステップS407)、空になっていれば、処理を終了する。そうでなければ、関連性評価部17は、ステップS403で二次リストに追加された候補領域130に関する要素がステップS405で削除された一次リスト140について、再度、各候補領域130の関連性評価値を算出する(ステップS401)。
上記の処理を終了した関連性評価部17は、生成された二次リストの情報をクラスタ名称生成部19に提供し、クラスタ名称生成部19は、二次リストに含まれる候補領域130の関連性評価値に基づいてクラスタ名称122を生成する。
このように、本実施形態における関連性評価部17の処理では、一次リスト140から候補領域130が二次リストに追加される度に、当該候補領域130に関する要素を一次リスト140から削除し、削除後の一次リスト140に残った各候補領域130について、再度関連性評価値を算出する。かかる処理について、以下でさらに詳しく説明する。
図12〜図14は、図11を参照して説明した関連性評価部17の処理について、さらに詳しく説明するための図である。なお、図12〜図14に示される画像コンテンツ110、クラスタ120、および候補領域130は、図9および図10の例と同様のものである。
図12には、一次リスト140に対する最初の関連性評価値の算出が示されている。本実施形態において、各候補領域130の関連性評価値Eは、コンテンツ数n、候補領域130の面積S、候補領域130とクラスタ120の領域との重複面積Dを用いて、以下の式1で求められる。
E=n×D/S ・・・(式1)
ここで、領域名称が“A”の候補領域130aは、5つの画像コンテンツ110を含み、領域面積50のうち15がクラスタ120と重複する。従って、候補領域130aについて、関連性評価値Eは、5×15/50=1.5になる。
同様に、領域名称が“B”の候補領域130bは、2つの画像コンテンツ110を含み、領域面積55のうち7がクラスタ120と重複する。従って、候補領域130bについて、関連性評価値Eは、2×7/55=0.25になる。
また、領域名称が“C”の候補領域130cは、5つの画像コンテンツ110を含み、領域面積50のうち14がクラスタ120と重複する。従って、候補領域130について、関連性評価値Eは、5×14/50=1.4になる。
この結果、一次リスト140に含まれる候補領域130a〜130cの中では、候補領域130aの関連性評価値Eが最も高く、次いで候補領域130cの関連性評価値Eが高く、また候補領域130bの関連性評価値Eが最も低いことがわかる。本実施形態では、この結果によって、一次リスト140に含まれる候補領域130のうちで、クラスタ120との関連性が最も高く、従って名称がクラスタ名称122に最も適するのは、候補領域130aであると判定される。
図13には、二次リスト150に対する最初の候補領域130の追加が示されている。上記の関連性評価値の算出の結果、一次リスト140の中では候補領域130aの関連性評価値Eが最も高いことが示されたため、関連性評価部17は、候補領域130aの情報を二次リスト150に追加する。二次リスト150には、候補領域130aの領域名称“A”と、算出された関連性評価値“1.5”とが追加される。なお、二次リスト150には、これ以外の候補領域130aに関する情報が追加されてもよい。
ここで、候補領域130aの情報は、二次リスト150への追加に伴って一次リスト140から削除される。また、候補領域130aに関する要素も、一次リスト140から削除される。具体的には、一次リスト140から候補領域130aを示すレコードが削除される。さらに、候補領域130b,130cの情報から、候補領域130aに含まれていた“1”〜“5”の画像コンテンツ110の情報と、クラスタ120の領域のうち候補領域130aと重複していた部分の面積が削除される。
上記の削除の結果が、図13では抹消および訂正の記号によって示されている。候補領域130bに撮影位置が含まれていた“1”,“3”の画像コンテンツ110は、いずれも候補領域130aにも撮影位置が含まれていたため、いずれも一次リスト140から情報が削除される。この結果、一次リスト140上で、候補領域130bには画像コンテンツ110の撮影位置が1つも含まれないことになる。また、クラスタ120の領域のうち、候補領域130bと重複していた部分は、すべて候補領域130aとも重複していたため、これも削除される。この削除の結果、一次リスト140上で、候補領域130bはクラスタ120の領域とは重複しないことになる。
このように、画像コンテンツ110やクラスタ120の領域が削除された結果、画像コンテンツ110の撮影位置を含まなくなったり、クラスタ120の領域と重複しなくなったりした候補領域130については、一次リストから当該候補領域130を示すレコードが削除される。従って、候補領域130bのレコードも、一次リスト140から削除される。
一方、候補領域130cでは、“2”〜“6”の画像コンテンツ110のうち、候補領域130aに含まれていた“2”〜“5”の画像コンテンツ110が削除される。これによって、一次リスト140上で、候補領域130cは、“6”の画像コンテンツ110だけを含むことになる。また、候補領域130cがクラスタ120と重複していた部分のうちの一部は、候補領域130aとも重複していたため、この部分の面積が重複面積Dから除かれる。なお、この領域の面積は11である。従って、候補領域130aに関する要素が削除されると、一次リスト140上で、候補領域130cのクラスタ120の領域との重複面積Dは、14−11=3になる。
図14には、一次リスト140に対する2回目の関連性評価値の算出が示されている。上述のように、最初の関連性評価値の算出に基づく候補領域130aの二次リスト150への追加の結果、一次リスト140からは候補領域130aの情報、および候補領域130aに関する要素が削除される。2回目の関連性評価値の算出は、この削除後の一次リスト140に対して実行される。
上述のように、最初の関連性評価値の算出の結果、一次リスト140では、候補領域130aおよび候補領域130bのレコードが削除されている。従って、2回目の関連性評価値の算出では、候補領域130cについて関連性評価値が算出される。この時点での一次リスト140における候補領域130cは、1つの画像コンテンツ110を含み、領域面積50のうち3がクラスタ120の領域と重複する。従って、候補領域130cについて、関連性評価値Eは、1×3/50=0.06になる。
図示された例では、一次リスト140に候補領域130が1つしかないため、関連性評価部17は、自動的に、関連性評価値Eが最も高い候補領域130として候補領域130cを二次リスト150に追加する。二次リスト150には、候補領域130cの領域名称“C”と、算出された関連性評価値“0.06”とが追加される。
ここで、候補領域130cの情報は、二次リスト150への追加に伴って一次リスト140から削除される。これによって、一次リスト140からはすべての候補領域130の情報が削除され、関連性評価部17は、一次リスト140から二次リスト150を生成する処理を終了する。
(関連性の評価の基準について)
式1に示されるように、本実施形態において、候補領域130とクラスタ120との関連性は、候補領域130のクラスタ120との重複部分の割合と、候補領域130に含まれる画像コンテンツ110の数とに基づいて評価される。
候補領域130のクラスタ120との重複部分の割合に基づいて関連性を評価することによって、クラスタ120とより多くの部分で重複し、かつ、より小さいサイズの候補領域130について、関連性をより高く評価することができる。
また、候補領域130に含まれる画像コンテンツ110の数に基づいて関連性を評価することによって、より多くの画像コンテンツ110を含む候補領域130について、関連性をより高く評価することができる。
これらの2つの基準は、いずれかが単独で関連性の評価に用いられてもよく、また両方が組み合わせて用いられてもよい。いずれかを単独で用いる方が処理を簡単にする上では有利である。しかし、上記の2つの基準を組み合わせて候補領域130の関連性を評価することは、以下で説明するような利点を有する。
まず、候補領域130に含まれる画像コンテンツ110の数nだけに基づいて関連性が評価される場合を考える。この場合、より多くの画像コンテンツ110を含む候補領域130の関連性が高く評価される。それゆえ、例えば木構造を有する住所地域の場合、市町村よりも都道府県、都道府県よりも地方、といったように、上位の地域ほど関連性が高く評価されやすくなる。そうすると、複数の地域にまたがって位置する画像コンテンツ110が分類されたクラスタ120の場合、複数の地域の上位の地域の名称がクラスタ名称122に用いられることになる。この場合、クラスタ120のサイズと、クラスタ名称122に用いられる地域のサイズとが対応しなくなることがあり、自然なクラスタ名称122が生成されるとは限らない。
ここで、さらに候補領域130のクラスタ120との重複部分の割合D/Sに基づいて関連性を評価すると、上位の地域になるほど領域面積Sが大きくなるため、地域の大きさが大きくなるほど、重複部分の割合D/Sの値が小さくなり、関連性評価値Eが小さくなる。従って、より多くの画像コンテンツ110を含みつつも、クラスタ120の大きさに対応した大きさの候補領域130の関連性を最も高く評価することが可能になる。
次に、候補領域130のクラスタ120との重複部分の割合D/Sだけに基づいて関連性が評価される場合を考える。この場合、クラスタ120との重複部分の割合D/Sが大きい候補領域130の関連性が高く評価される。そうすると、例えばクラスタ120に包含されるような小さな地域では、重複部分の割合D/Sの値が1になる、つまり関連性評価値Eが最大になる。この場合、少数の画像コンテンツ110を含む小さな地域の名称が、クラスタ120の大きさに関わらずクラスタ名称122に列挙されてしまうことがあり、自然なクラスタ名称122が生成されるとは限らない。
ここで、さらに候補領域130に含まれる画像コンテンツ110の数nに基づいて関連性が評価すると、小さい地域ほど含まれる画像コンテンツ110の数nが少なくなるため、関連性評価値Eが小さくなる。従って、クラスタ120との重複部分の割合D/Sがある程度高い候補領域130の中で、より多くの画像コンテンツ110を含む候補領域130の関連性を最も高く評価することが可能になる。
このように、2つの基準を組み合わせて候補領域130の関連性を評価することによって、“より多くの画像コンテンツ110を含む”という観点と、“クラスタ120の大きさに近い”という観点の両方をバランスさせて、クラスタ名称122の生成に用いられる候補領域130を選定することが可能になる。
なお、本実施形態のように、木構造を有する住所地域や、不規則に重なり合うランドマーク地域の名称を用いてクラスタ名称122を生成する場合には、上記のように2つの基準を組み合わせて候補領域130とクラスタ120との関連性を評価することが有効である。しかし、例えば後述する他の実施形態の場合のように、名称つき領域の構成が異なれば、いずれか1つの基準を用いた関連性の評価も十分に有効でありうる。
(関連性評価値のバリエーションについて)
関連性評価値Eは、上記の式1以外の式によって算出されてもよい。例えば、関連性評価値Eは、所定の属性に基づく重みづけを含む式によって算出されてもよい。属性は、例えば、候補領域130のカテゴリ、候補領域130の人気度、候補領域130の人口または世帯数、候補領域130が首都や都道府県庁所在地、政令指定都市であるか否か、候補領域130のユーザの編集操作によって選択された回数などでありうる。
このうち、候補領域130のカテゴリは、商業施設、公共施設、住宅施設、観光名所などである。例えば、ユーザが画像コンテンツ110の撮影について設定した特定のカテゴリに重みをつけることにより、当該カテゴリの候補領域130の関連性評価値Eを大きくし、クラスタ名称122に用いられやすくすることができる。これによって、例えば、ユーザによって観光名所というカテゴリが選択されている場合、観光名所のランドマーク地域の名称が優先的にクラスタ名称122に含まれるようにすることが可能になる。
また、候補領域130の人気度、人口などは、候補領域130の重要度、知名度などを反映するものでありうる。これによって、例えば、より人気のあるテーマパークおよび観光名所などのランドマーク地域や、より大きな都市など、ユーザが名称を知っている可能性がより高い地域の名称が優先的にクラスタ名称122に含まれるようにすることが可能になる。
(1−5.クラスタ名称生成部)
図15は、本実施形態におけるクラスタ名称生成部19の処理を示すフローチャートである。
まず、クラスタ名称生成部19は、二次リスト150に候補領域130が存在するか否かを判定する(ステップS501)。この判定が、関連性評価部17から提供された二次リスト150について最初に実行される場合には、二次リスト150には少なくとも1つの候補領域130が存在する。ここで、二次リスト150に候補領域130が含まれていないと判定された場合、クラスタ名称生成部19は、後述のステップS521にジャンプし、クラスタ名称生成の後処理に入る。
ステップS501で二次リスト150に候補領域130が存在すると判定された場合、クラスタ名称生成部19は、二次リスト150内で関連性評価値が最も高い候補領域130を抽出する(ステップS503)。ここで抽出される候補領域130は、この時点で二次リスト150に存在する候補領域130の中でクラスタ120との関連性が最も高いと判定された領域である。つまり、クラスタ名称生成部19は、関連性評価部17によってクラスタ120との関連性が高いと判定されたものから順に、二次リスト150から候補領域130を抽出する。
続いて、クラスタ名称生成部19は、ステップS503において抽出された候補領域130の下位の領域の名称が、既にクラスタ名称122に含まれるか否かを判定する(ステップS505)。下位の領域の名称が既にクラスタ名称に含まれる場合、クラスタ名称生成部19は、抽出された候補領域130を二次リスト150から削除し、上下判定削除フラグを立てる(ステップS507)。上下判定削除フラグは、1つのクラスタ120に対する処理ごとに保持されるフラグであり、後述するステップS521で参照される。その後、クラスタ名称生成部19は、ステップS501に戻り、二次リスト150から候補領域130を抽出する処理を繰り返す。
ここで、下位の領域とは、例えば“市町村−都道府県−地方”のような木構造を有する住所地域のような領域における領域間の上位下位関係によって定義される。例えば、“品川区”は“東京都”の下位の領域であり、“東京都”は“関東地方”の下位の領域である。本実施形態では、例えば、“品川区”が既にクラスタ名称122に含まれる場合に、二次リスト150から“東京都”の候補領域130が抽出されると、“東京都”の候補領域130の情報を二次リスト150から削除する。クラスタ名称122として、“品川区,東京都”のように、上位下位関係にある領域の名称が併記されるのは不自然と考えられるためである。
なお、抽出された候補領域130の上位の領域の名称が既にクラスタ名称122に含まれる状況は、本実施形態における処理では生じないため、判定されていない。また、上述のように、本実施形態では、住所地域とランドマーク地域との間には上位下位関係が設定されていないため、ランドマーク地域と、そのランドマーク地域を包含する住所地域とは、例えば“東京タワー,東京都”のように、クラスタ名称122において併記されうる。
ステップS505において、抽出された候補領域130の下位の領域の名称がクラスタ名称122に含まれないと判定された場合、クラスタ名称生成部19は、抽出された候補領域130の名称をクラスタ名称122に追加するとともに、当該候補領域130を二次リスト150から削除する(ステップS509)。
ここで、本実施形態において、クラスタ名称122は、候補領域130の名称を順次連結することによって生成される。例えば、候補領域130の名称が、二次リスト150から“中華街”、“品川区”の順で抽出された場合、クラスタ名称122は“中華街,品川区”のように生成される。
次に、クラスタ名称生成部19は、クラスタ名称122に含まれる候補領域130の名称の数が閾値に到達したか否かを判定する(ステップS511)。本実施形態では、クラスタ名称122に含まれうる名称の数に上限の閾値T1が設定される。これは、例えば、クラスタ名称122が長くなりすぎて、地図100上に表示されたときにクラスタ120や画像コンテンツ110の視認性を損なうことを防ぐためである。クラスタ名称122に含まれる名称の数が閾値T1に到達したと判定された場合、クラスタ名称生成部19は後述のステップS517に進み、クラスタ名称生成の後処理に入る。
なお、クラスタ名称122に含まれうる名称の数の閾値T1は、例えば地図100の縮尺や、クラスタ120の大きさなどによって、表示のバランスを考慮して自動的に適切な値に設定されうる。例えば、地図100の縮尺が比較的小さい場合には、閾値T1を比較的小さく設定することが適切であると考えられる。また、クラスタ120の大きさが比較的小さい場合にも、閾値T1を比較的小さく設定することが適切であると考えられる。閾値T1は、ユーザ操作によって任意の値にも設定されてもよい。
一方、ステップS511で、クラスタ名称122に含まれる名称の数が閾値T1に到達していないと判定された場合、クラスタ名称生成部19は、これまでにクラスタ名称122に名称が追加された候補領域130の関連性評価値を積算する(ステップS513)。関連性評価値は、二次リスト150から取得されうる。
本実施形態において、関連性評価値の積算値は、クラスタ名称122がクラスタ120の領域を十分に表せているかの指標として用いられる。例えば、クラスタ120に分類される画像コンテンツ110の撮影位置が単一の候補領域130に集中して含まれる場合、当該候補領域130の名称が最初にクラスタ名称122に追加された時点で、関連性評価値の積算値がかなり高くなる。一方、クラスタ120に分類される画像コンテンツ110の撮影位置が複数の候補領域130に分散して含まれる場合、それぞれの候補領域130の関連性評価値は比較的低くなるため、例えば関連性評価値の積算値が最初の例と同じ値になるまでに複数の候補領域130がクラスタ名称122に追加されうる。
続いて、クラスタ名称生成部19は、ステップS513で積算された関連性評価値が閾値に到達したか否かを判定する(ステップS515)。本実施形態では、クラスタ名称122に名称が含まれる候補領域130の関連性評価値の積算値に、下限の閾値T2が設定される。上記のように、関連性評価値の積算値は、クラスタ名称122がクラスタ120の領域を十分に表せているかの指標として用いられる。閾値T2は、不必要に多くの名称をクラスタ名称122に追加しないために設けられる。
なお、閾値T2は、例えば地図100の縮尺や、クラスタ120の大きさなどによって、自動的に適切な値に設定されうる。また、閾値T2の適切な値は、二次リスト150に含まれる候補領域130の関連性評価値の平均値によって動的に設定されてもよい。閾値T2は、ユーザ操作によって任意の値に設定されてもよい。
ステップS515において、積算された関連性評価値が閾値T2に到達したと判定された場合、クラスタ名称生成部19は後述のステップS517に進み、クラスタ名称生成の後処理に入る。一方、積算された関連性評価値が閾値T2に到達していないと判定された場合、クラスタ名称生成部19は、ステップS501に戻り、二次リスト150から候補領域130を抽出する処理を繰り返す。
ステップS511でクラスタ名称に含まれる名称の数が閾値T1に到達したと判定された場合、およびステップS515で関連性評価値の積算値が閾値T2に到達したと判定された場合、クラスタ名称生成部19は、二次リスト150に候補領域130が残っているか否かを判定する(ステップS517)。二次リスト150に候補領域130の情報が残っていると判定された場合、クラスタ名称生成部19は、クラスタ名称122に“その他”を追加する(ステップS519)。
一方、ステップS517において二次リスト150に候補領域130の情報が残っていないと判定された場合、クラスタ名称生成部19は、上下判定削除フラグが立っているか否かを判定する(ステップS521)。上下判定削除フラグは、上記のステップS507において、候補領域130がクラスタ名称122に名称を追加されることなく二次リスト150から削除されるときに立てられるフラグである。ステップS521で上下判定削除フラグが立っていると判定された場合も、クラスタ名称生成部19は、クラスタ名称122に“その他”を追加する(ステップS519)。
このように、ステップS519でクラスタ名称122に“その他”が追加されるのは、関連性評価部17によって生成された二次リスト150(以下、当初の二次リスト150ともいう)に含まれるものの、クラスタ名称122には名称が含まれない候補領域130が存在する場合である。
上述の関連性評価部17による二次リスト150の生成処理から明らかなように、当初の二次リスト150に含まれる各候補領域130は、二次リスト150内の他の候補領域130には包含されない画像コンテンツ110の撮影位置を少なくとも1つ包含する。従って、当初の二次リスト150に含まれるがクラスタ名称122に名称が含まれない候補領域130が存在するということは、その候補領域130に含まれる画像コンテンツ110の撮影位置に対応する名称がクラスタ名称122には含まれないということである。
それゆえ、クラスタ名称生成部19は、このような場合に、“その他”をクラスタ名称122に付加することによって、クラスタ名称122に名称が現れている領域以外の領域に撮影位置を有する画像コンテンツ110がクラスタ120に含まれることを示す。
図16は、本実施形態でクラスタ名称生成部19の処理のために設定される閾値について説明するための図である。なお、図16に示される二次リスト150は、図12〜図14の例で生成される二次リスト150と同様のものである。なお、以下の説明では、図15で説明されたステップを適宜参照する。
図示された例において、当初の二次リスト150には、領域名称が“A”、関連性評価値が“1.5”である候補領域130aの情報と、領域名称が“C”、関連性評価値が“0.06”である候補領域130cの情報とが含まれている。
まず、クラスタ名称122に含まれうる名称の数の閾値T1が2以上ではない場合、すなわち、クラスタ名称122に1つの名称しか含められない場合、ステップS509で名称“A”がクラスタ名称122に追加された後のステップS511で、クラスタ名称122に含まれる名称の数が閾値T1に到達したと判定される。従って、この時点でクラスタ名称122に名称を追加する処理が終了し、候補領域130cの名称“C”はクラスタ名称122には含まれない。
しかし、候補領域130aには、図12において“6”として示される画像コンテンツ110の撮影位置が含まれていない。そのため、クラスタ名称122を単に“A”とすると、クラスタ120に“6”の画像コンテンツ110が含まれることはクラスタ名称122には現れなくなってしまう。それゆえ、クラスタ名称生成部19は、ステップS519で、クラスタ名称122に“その他”を追加する。この結果、“A,その他”というクラスタ名称122yが生成される。
一方、閾値T1が2以上である場合、候補領域130cの領域名称“C”も、クラスタ名称122に含まれる可能性がある。しかし、関連性評価値の積算値の閾値T2が1.5以下である場合、ステップS509で名称“A”がクラスタ名称122に追加された後のステップS515で、関連性評価値の積算値(この時点では候補領域130aの関連性評価値に等しく、1.5である)が閾値T2に到達したと判定される。従って、上記の場合と同様に、“A,その他”というクラスタ名称122yが生成される。
一方、閾値T2が1.5よりも大きい場合、上記のステップS515で積算値が閾値T2に到達したとは判定されず、処理がステップS501に戻って、再度クラスタ名称122に名称を追加する処理が実行される。この結果、2回目のステップS509で、候補領域130cの名称“C”がクラスタ名称122に追加される。その結果、“A,C”というクラスタ名称122xが生成される。
(2.第2の実施形態)
次に、図17を参照して、本開示の第2の実施形態について説明する。図17には、本実施形態によるクラスタ名称生成の例が示されている。
図17を参照すると、画像コンテンツ210は、デジタルカメラや携帯電話などの撮影機能を有する機器によって撮影された画像コンテンツである。画像コンテンツ210には、メタ情報として撮影日時の情報が付加される。画像コンテンツ210は、その撮影日時によって時間軸200上に表現される。また、画像コンテンツ210は、その撮影日時に基づいて、クラスタ220に分類される。
ここで、時間軸200は1次元の特徴空間であり、画像コンテンツ210は特徴空間の位置によって表現されるデータであるといえる。また、時間軸200上には、イベント期間230が予め設定される。イベント期間230は、例えば季節やイベントなどに基づいて、期間と名称とによって定義される。期間は、時間軸200上の領域といえる。従って、イベント期間230は、名称つき領域といえる。
本実施形態では、上述の第1の実施形態における地理的な領域を、時間的な領域すなわち期間に置き換えて、クラスタ名称が生成される。
具体的には、まず、情報処理装置10の候補領域抽出部15が、イベント期間230から候補領域の一次リスト140を生成する。一次リスト140には、クラスタ220に分類される画像コンテンツ210の撮影日時を少なくとも1つ含むイベント期間230が抽出される。イベント期間230の期間および名称は、領域名称データベース21から取得される。
次に、関連性評価部17が、一次リスト140に含まれる各イベント期間230について、クラスタ220との関連性評価値を算出する。関連性評価値は、各イベント期間230に撮影日時が含まれる画像コンテンツ210の数、および各イベント期間230の期間とクラスタ220の期間との重複期間の長さに基づいて算出されうる。関連性評価部17は、一次リスト140の中で関連性評価値が最も高いイベント期間230を関連性評価値の情報とともに二次リスト150に追加するとともに当該イベント期間230に関する情報を一次リスト140から削除する処理を、一次リスト140が空になるまで繰り返す。
次に、クラスタ名称生成部19が、二次リスト150に含まれる各イベント期間230について、関連性評価値が高いものから順に、名称をクラスタ名称222に追加する。本実施形態でも、クラスタ名称222に含まれうる名称の数の閾値T1と、クラスタ名称222に名称が含まれるイベント期間230の関連性評価値の積算値の閾値T2とが設定されうる。クラスタ名称生成部19は、クラスタ名称222へのイベント期間230の名称の追加を、クラスタ名称222に含まれる名称の数が閾値T1に到達するか、関連性評価値の積算値が閾値T2に到達するか、または二次リスト150が空になるまで繰り返す。
なお、上記のクラスタ名称生成処理の細部は、第1の実施形態と同様であるため、詳細な説明を省略する。撮影日時による画像コンテンツのクラスタリングについては、例えば特許第4577173号公報などにおいて紹介されている。本実施形態においても、クラスタリングにはこれらの文献に紹介されたような方法が適宜用いられうるため、クラスタリング処理についても、詳細な説明を省略する。
図17では、画像コンテンツ210が下位のクラスタ220a〜220dと、上位のクラスタ220e,220fとに分類される例が示されている。画像コンテンツ210は、このように、木構造を有するクラスタ220に分類されてもよい。
図示された例において設定されるイベント期間230のうち、イベント期間230a,230bは、“春”、“夏”といった“season”属性のイベント期間である。また、イベント期間230c〜230eは、“ひな祭り”、“子供の日”といった“public event”属性のイベント期間である。イベント期間230f〜230jは、“卒業式”、“花見”といった“private event”属性のイベント期間である。“public event”属性および“private event”属性のイベント期間230c〜230jは、“season”属性のイベント期間230a,230bのいずれかに包含されている。つまり、イベント期間230a,230bと、イベント期間230c〜230jとの間には、木構造が存在するともいえる。一方、イベント期間230c〜230j同士の間では、必ずしも規則的な構造はなく、それぞれの期間は離散的に分布し、一部では重なり合っている。
以下、それぞれのクラスタ220についてのクラスタ名称222の生成を具体的に説明することによって、本実施形態におけるクラスタ名称生成の処理について説明する。
(クラスタ名称の生成例1)
まず、クラスタ220aを例として説明する。クラスタ220aは、“ひな祭り”のイベント期間230cに撮影された2つの画像コンテンツ210と、その少し後に撮影された1つの画像コンテンツ210とを含む。3つの画像コンテンツ210は、“春”のイベント期間230aにすべて含まれる。この場合、候補領域抽出部15は、“ひな祭り”のイベント期間230cと、“春”のイベント期間230aとを、一次リスト140に抽出する。
ここで一次リスト140に抽出されたイベント期間230のうちでは、“ひな祭り”のイベント期間230cが、含まれる画像コンテンツ210が比較的多く、クラスタ220aとの重複領域の割合も大きいため、関連性評価値がより高くなる。一方、“春”のイベント期間230aは、クラスタ220aのすべての画像コンテンツ210を含むが、クラスタ220aに対してイベント期間230aの期間が長いため、クラスタ220aとの重複期間の割合が小さくなり、関連性評価値はより低くなる。従って、関連性評価部17の処理では、イベント期間230c“ひな祭り”が、最初に二次リスト150に追加される。イベント期間230a“春”も、残る1つの画像コンテンツ210を含むイベント期間230として二次リスト150に追加される。
上述のように、イベント期間230cは、木構造においてイベント期間230aの下位にあたるともいえる。そこで、クラスタ名称生成部19は、二次リスト150に含まれるイベント期間230の名称のうち、上位にあたるイベント期間230aの名称“春”を、クラスタ名称222aには含められず、代わりに“その他”が加え、図示されているようにクラスタ名称222aを“ひな祭り,その他”としてもよい。また、地域の名称の場合と異なり、上位下位の関係にある名称が併記されることによる違和感が少ないと考えられる場合には、イベント期間230aの名称“春”をもクラスタ名称222aに含めて、クラスタ名称222aを“ひな祭り,春”としてもよい。
(クラスタ名称の生成例2)
次に、クラスタ220bを例として説明する。クラスタ220bは、“卒業式”のイベント期間230fに撮影された2つの画像コンテンツ210と、“花見”のイベント期間230gと“春休み”のイベント期間230hとが重複する期間に撮影された2つの画像コンテンツ210とを含む。4つの画像コンテンツ210は、“春”のイベント期間230aにすべて含まれる。この場合、候補領域抽出部15は、“卒業式”のイベント期間230fと、“花見”のイベント期間230gと、“春休み”のイベント期間230hと、“春”のイベント期間230aとを、一次リスト140に抽出する。
ここで一次リスト140に抽出されたイベント期間230のうちでは、“卒業式”のイベント期間230fと“花見”のイベント期間230gとが、クラスタ220bとの重複領域の割合が大きく、含まれる画像コンテンツ210が比較的多いため、関連性評価値がより高くなる。一方、“春休み”のイベント期間230hは、含まれる画像コンテンツ210の数はイベント期間230gと同じだが、期間がより長いため、クラスタ220との重複期間の割合が小さくなり、関連性評価値はより低くなる。また、“春”のイベント期間230aは、クラスタ220bのすべての画像コンテンツ210を含むが、クラスタ220bに対してイベント期間230aの期間が長いため、クラスタ220との重複期間の割合が小さくなり、関連性評価値はより低くなる。
従って、関連性評価部17の処理では、イベント期間230f“卒業式”とイベント期間230g“花見”とが、最初に二次リスト150に追加される。これらのイベント期間230を合わせると、クラスタ220bに含まれる画像コンテンツ210の撮影日時がすべて包含される。そのため、これらのイベント期間230の二次リスト150への追加に伴って、残りのイベント期間230h“春休み”とイベント期間230a“春”とのレコードは一次リスト140から削除される。それゆえ、二次リスト150には、イベント期間230f“卒業式”とイベント期間230g“花見”とが追加される。閾値T1および閾値T2の設定値にもよるが、図示された例では、クラスタ名称222bにこれらのイベント期間230の名称が併記され、“卒業式,花見”となる。
上記のクラスタ220bの例において、イベント期間230とクラスタ220との関連性評価値を、第1の実施形態と同様に、コンテンツ数と、イベント期間230のうちクラスタ220と重複する期間の割合とを用いて算出する場合を考える。この場合、イベント期間230f“卒業式”とイベント期間230g“花見”とは、いずれも2つの画像コンテンツ210を含み、かつすべての期間がクラスタ220bと重複するため、関連性評価値が同じ値になる。このような場合のために、例えば、“複数のイベント期間230が同じ関連性評価値を有する場合、より前にあるイベント期間230を優先して二次リスト150に加える”という設定がされていてもよい。これによって、クラスタ名称222bの“卒業式,花見”のように、クラスタ220に対して同程度の関連性のあるイベント期間230がある場合、より前にあるイベント期間230から名称を列挙することによってクラスタ名称222が生成されうる。
(クラスタ名称の生成例3)
次に、クラスタ220cを例として説明する。クラスタ220cは、“七夕”のイベント期間230eに撮影された1つの画像コンテンツ210と、その前に撮影された6つの画像コンテンツ210とを含む。7つの画像コンテンツ210が、“夏”のイベント期間230bにすべて含まれる。この場合、候補領域抽出部15は、“七夕”のイベント期間230eと、“夏”のイベント期間230bとを、一次リスト140に抽出する。
ここで一次リスト140に抽出されたイベント期間230のうち、“七夕”のイベント期間230eは、その期間の全体がクラスタ220cと重複するが、クラスタ220cに含まれる7つの画像コンテンツ210のうちの1つが含まれるにすぎない。一方、“夏”のイベント期間230bは、クラスタ220cと重複しているのはその期間の一部であるが、クラスタ220cに含まれる7つの画像コンテンツのすべてを含む。
従って、関連性評価値の算出の設定にもよるが、図示された例では、イベント期間230b“夏”の関連性評価値の方が高くなり、イベント期間230b“夏”が最初に候補領域の二次リストに追加される。イベント期間230b“夏”は、クラスタ220cに含まれる画像コンテンツ210のすべてを含む。そのため、イベント期間230b“夏”の二次リスト150への追加に伴って、イベント期間230e“七夕”のレコードは一次リスト140から削除される。それゆえ、二次リスト150には、イベント期間230b“夏”だけが追加される。結果として、クラスタ名称222cは、“夏”になる。
以上の例と同様にして、クラスタ220d〜220fについてもクラスタ名称222d〜222fが生成される。
クラスタ220dは、“夏休み”のイベント期間230jに含まれる画像コンテンツ210を主に含むが、それに含まれない画像コンテンツ210をも含む。従って、クラスタ名称222dは“夏休み,その他”になる。
クラスタ220eは、“ひな祭り”、“卒業式”、“花見”のイベント期間230c,230f,230gにそれぞれ含まれる画像コンテンツ210を含む。図示された例では、イベント期間230c,230f,230gは、いずれもクラスタ220e全体の画像コンテンツ210に比べると少しの画像コンテンツ210しか含まないため、上位のイベント期間230aの関連性評価値の方が高くなる。結果として、クラスタ名称222eは“春”になる。
クラスタ220fは、“七夕”、“夏休み”のイベント期間230e,230jにそれぞれ含まれる画像コンテンツ210と、いずれにも含まれない画像コンテンツ210とを含む。図示された例では、上位のイベント期間230bの関連性評価値の方がイベント期間230e,230jよりも高くなる。結果として、クラスタ名称222fは“夏”になる。
(3.第3の実施形態)
次に、図18および図19を参照して、本開示の第3の実施形態について説明する。図18には、本実施形態に係る特徴空間の例が示されている。
図18には、楽曲コンテンツ310が分布する特徴マップ空間300が示されている。楽曲コンテンツ310は、楽曲の音声データを含むコンテンツである。楽曲コンテンツ310には、メタ情報として、例えばテンポ、雰囲気などの楽曲の特徴の情報が付加される。図示された例において、特徴マップ空間300には、楽曲の雰囲気を表す“幸せ”、“悲しい”というパラメータの座標軸と、楽曲のテンポを表す“高速”、“低速”というパラメータの座標軸とが設定され、楽曲コンテンツ310は、それぞれの特徴の情報によって特徴マップ空間300上に表現される。
ここで、特徴マップ空間300は、2次元の特徴空間である。また、楽曲コンテンツ310は、特徴空間の位置によって表現されるデータである。このような特徴マップ空間300を用いた楽曲コンテンツ310の表示は、例えばユーザが楽曲コンテンツ310を検索するためのインターフェースとして用いられる。
図19には、本実施形態によるクラスタ名称生成の例が示されている。特徴マップ空間300上の楽曲コンテンツ310は、クラスタ320に分類される。また、特徴マップ空間300上には、名称つき領域であるカテゴリ領域330が予め設定され、クラスタ320には、カテゴリ領域330の名称を用いたクラスタ名称322が与えられる。
本実施形態では、上述の第1の実施形態における地理的な領域を、特徴マップ空間という仮想的な領域に置き換えてクラスタ名称生成処理が実行される。具体的には、まず、情報処理装置10の候補領域抽出部15が、カテゴリ領域330の中から候補領域の一次リスト140を生成する。一次リスト140には、クラスタ320に分類される楽曲コンテンツ310ごとに少なくとも1つのカテゴリ領域330が抽出される。カテゴリ領域330の領域範囲および名称は、領域名称データベース21から取得される。
次に、関連性評価部17が、一次リスト140に含まれる各カテゴリ領域330について、クラスタ320との関連性評価値を算出する。関連性評価値は、各カテゴリ領域330に位置が含まれる楽曲コンテンツ310の数、または各カテゴリ領域330の領域とクラスタ320の領域との重複の大きさに基づいて算出されうる。関連性評価部17は、一次リスト140の中で関連性評価値が最も高いカテゴリ領域330を関連性評価値の情報とともに二次リスト150に追加するとともに当該カテゴリ領域330に関する情報を一次リスト140から削除する処理を、一次リスト140が空になるまで繰り返す。
次に、クラスタ名称生成部19が、二次リスト150に含まれる各カテゴリ領域330について、関連性評価値が高いものから順に、名称をクラスタ名称322に追加する。本実施形態でも、クラスタ名称322に含まれうる名称の数の閾値T1と、クラスタ名称322に名称が含まれるカテゴリ領域330の関連性評価値の積算値の閾値T2とが設定されうる。クラスタ名称生成部19は、クラスタ名称322へのカテゴリ領域330の名称の追加を、クラスタ名称322に含まれる名称の数が閾値T1に到達するか、関連性評価値の積算値が閾値T2に到達するか、あるいは二次リスト150が空になるまで繰り返す。
なお、上記の処理の細部は、第1の実施形態と同様であるため、詳細な説明を省略する。楽曲の特徴による楽曲コンテンツのクラスタリングについては、例えば特開2008−250857号公報などにおいて紹介されている。本実施形態においても、クラスタリングにはこれらの文献に紹介されたような方法が適宜用いられうるため、クラスタリング処理についても、詳細な説明を省略する。
図19に示された例では、カテゴリ領域330として、テンポが“高速”に近く雰囲気が“悲しい”に近い“emotional”のカテゴリ領域330a、テンポが“高速”に近く雰囲気が“幸せ”に近い“extreme”のカテゴリ領域330b、テンポが中程度で雰囲気が“悲しい”に近い“sad”のカテゴリ領域330c、テンポが中程度で雰囲気が“幸せ”に近い“happy”のカテゴリ領域330d、テンポが“低速”に近く雰囲気が“悲しい”に近い“mellow”のカテゴリ領域330e、テンポが“低速”に近く雰囲気が“幸せ”に近い“relax”のカテゴリ領域330fが設定される。
本実施形態において、これらのカテゴリ領域330は、互いに重複することなく設定されている。このような場合、各カテゴリ領域330に位置が含まれる楽曲コンテンツ310の数と、各カテゴリ領域330とクラスタ320の領域との重複面積とは、いずれも同じような傾向を示す。つまり、楽曲コンテンツ310の数が多いカテゴリ領域330ほど、クラスタ320の領域との重複面積も大きくなり、逆もまた真である。従って、本実施形態では、カテゴリ領域330とクラスタ320との関連性を、上記の2つの基準のいずれか一方に基づいて評価してもよい。
以下、それぞれのクラスタ320についてのクラスタ名称322の生成を具体的に説明することによって、本実施形態におけるクラスタ名称生成の処理について説明する。
(クラスタ名称の生成例1)
まず、クラスタ320aを例として説明する。クラスタ320aは、“sad”のカテゴリ領域に含まれる7つの楽曲コンテンツ310と、“emotional”のカテゴリ領域に含まれる1つの楽曲コンテンツ310とを含む。この場合、候補領域抽出部15は、“sad”のカテゴリ領域330cと、“emotional”のカテゴリ領域330aとを一次リスト140に抽出する。
ここで一次リスト140に抽出されたカテゴリ領域330のうちでは、“sad”のカテゴリ領域330cが、含まれる楽曲コンテンツ310が多く、クラスタ320aとの重複領域の割合も大きいため、関連性評価値がより高くなる。一方、“emotional”のカテゴリ領域330aは、含まれる楽曲コンテンツ310が少なく、クラスタ320aとの重複領域の割合も小さいため、関連性評価値がより低くなる。
従って、関連性評価部17の処理では、カテゴリ領域330cが、最初に二次リスト150に追加される。カテゴリ領域330aも、カテゴリ領域330cには含まれない1つの楽曲コンテンツ310を含むため、続いて二次リスト150に追加される。しかし、カテゴリ領域330c“sad”は、クラスタ320aに含まれる楽曲コンテンツ310のほとんどを包含するため、関連性評価値がかなり高い値になる。それゆえ、例えばカテゴリ領域330c“sad”の関連性評価値が単独で閾値T2に到達するような場合には、カテゴリ領域330a“emotional”はクラスタ名称322aの生成に用いられず、代わりに“others”が加えられる。この結果、図示された例では、クラスタ名称322aが“sad,others”になる。
(クラスタ名称の生成例2)
次に、クラスタ320bを例として説明する。クラスタ320bは、“happy”のカテゴリ領域に含まれる5つの楽曲コンテンツ310と、“relax”のカテゴリ領域に含まれる5つの楽曲コンテンツ310とを含む。この場合、候補領域抽出部15は、“happy”のカテゴリ領域330dと、“relax”のカテゴリ領域330fとを一次リスト140に抽出する。これらのカテゴリ領域330は、いずれも同じ数の楽曲コンテンツ310を含み、同程度の関連性評価値を有するが、カテゴリ領域330dの方が、クラスタ320bとの重複領域の割合が大きいため、関連性評価値がより高くなる。従って、関連性評価部17は、まずカテゴリ領域330dを、次いでカテゴリ領域330fを二次リスト150に追加する。結果として、クラスタ名称322bは“happy,relax”になる。
(4.第4の実施形態)
次に、図20を参照して、本開示の第4の実施形態について説明する。上述の第1〜第3の実施形態は、いずれも、クラスタの情報を取得してクラスタ名称の情報を生成する情報処理装置10に係る実施形態であったが、本実施形態は、生成されたクラスタ名称の情報を取得する情報処理装置30に係る。
図20のブロック図は、本開示の第4の実施形態に係る情報処理装置30の機能構成を概略的に示す。情報処理装置30は、例えばデジタルカメラや携帯電話などとして実現され、コンテンツ情報提供部31と、クラスタ情報取得部33と、クラスタ名称情報取得部35と、表示制御部37と、表示部39とを含む。情報処理装置30は、例えば、サーバとして用いられる情報処理装置10と通信してクライアントとして用いられる情報処理装置でありうる。
コンテンツ情報提供部31は、コンテンツの情報をサーバに提供する。コンテンツは、例えば画像コンテンツまたは楽曲コンテンツなどである。画像コンテンツは、例えば情報処理装置30が有する撮像部によって撮影されたものであってもよいし、また他の機器によって撮影されて情報処理装置30に提供されたものであってもよい。楽曲コンテンツは、情報処理装置30が有するドライブを用いてリムーバブル記憶媒体から取得されたものであってもよいし、インターネットなどのネットワークからダウンロードされたものであってもよい。コンテンツ情報提供部31は、例えばコンテンツの情報をサーバに提供するための通信装置などによって実現されうる。コンテンツ情報提供部31によってサーバに提供される情報には、コンテンツの位置情報がメタ情報として付加されている。他の実施形態の例にもあるように、コンテンツの位置情報は、例えば画像コンテンツの撮影位置や撮影日時、楽曲コンテンツの特徴情報などでありうる。
クラスタ情報取得部33は、コンテンツ情報提供部31によってサーバに提供されたコンテンツの情報に基づいてサーバがコンテンツを分類したクラスタの情報を取得する。クラスタは、他の実施形態の例にもあるように、例えば地図上の領域、時間軸上の期間、または特徴マップ空間上の領域などでありうる。クラスタ情報取得部33は、このようなクラスタの範囲を定義する情報と、クラスタに分類されるコンテンツの情報とをサーバから取得して、表示制御部37に提供する。クラスタ情報取得部33は、例えばクラスタの情報をサーバから取得する通信装置などによって実現されうる。
クラスタ名称情報取得部35は、クラスタ情報取得部33によって取得されたクラスタの情報に対応するクラスタ名称の情報を取得する。クラスタ名称は、例えば他の実施形態の例と同様に、サーバで生成されうる。つまり、クラスタ名称は、特徴空間上の名称つき領域とクラスタとの間の関連性に基づいて抽出された名称つき領域の名称に基づいて生成されうる。クラスタ名称情報取得部35は、このようなクラスタ名称の情報をサーバから取得して、表示制御部37に提供する。クラスタ名称情報取得部35は、例えばクラスタ名称の情報をサーバから取得する通信装置などによって実現されうる。
表示制御部37は、クラスタの情報をクラスタ情報取得部33から取得し、クラスタ名称の情報をクラスタ名称情報取得部35から取得して、これらの情報を表示部39に表示させる。表示制御部37は例えばCPU、ROM、RAMなどによって実現され、表示部39は例えばLCD(Liquid Crystal Display)などのディスプレイによって実現されうる。
上述のように、情報処理装置30は、例えば、上記の第1〜第3の実施形態における情報処理装置10がサーバである場合に、そのサーバに対するクライアントとして機能する装置として実現されうる。つまり、情報処理装置30は、情報処理装置10と通信し、情報処理装置10によって生成されたクラスタ名称をクラスタとともに表示部39に表示する装置でありうる。
また、情報処理装置30は、例えば、上記の第1〜第3の実施形態における情報処理装置10と同一の装置としても実現されうる。つまり、情報処理装置30は、自ら生成したクラスタ名称をクラスタとともに表示部39に表示する装置でもありうる。
このように、情報処理装置30は、多様な装置の形態で実現されうるものである。従って、情報処理装置30は、デジタルカメラや携帯電話以外にも、PC、ビデオカメラ、ゲーム機、スマートフォン、カーナビゲーションシステム、PDAなど、あらゆる種類の情報処理装置でありうる。
いずれの場合も、情報処理装置30の表示部39には、例えば図2、図17、図19などに示されるような、クラスタおよびクラスタ名称が表示される。
(5.ハードウェア構成)
次に、図21を参照しながら、上記で説明された本開示の一実施形態に係る情報処理装置10のハードウェア構成について詳細に説明する。なお、情報処理装置30も、同様のハードウェア構成によって実現されうる。
図21は、本開示の実施形態に係る情報処理装置10のハードウェア構成を説明するためのブロック図である。
情報処理装置10は、CPU901、ROM903、およびRAM905を含む。さらに、情報処理装置10は、ホストバス907、ブリッジ909、外部バス911、インターフェース913、入力装置915、出力装置917、ストレージ装置919、ドライブ921、接続ポート923、および通信装置925を含んでもよい。
CPU901は、演算処理装置および制御装置として機能し、ROM903、RAM905、ストレージ装置919、またはリムーバブル記録媒体927に記録された各種プログラムに従って、情報処理装置10内の動作全般またはその一部を制御する。ROM903は、CPU901が使用するプログラムや演算パラメータ等を記憶する。RAM905は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一次記憶する。これらはCPUバス等の内部バスにより構成されるホストバス907により相互に接続されている。
ホストバス907は、ブリッジ909を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス911に接続されている。
入力装置915は、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチおよびレバーなど、ユーザが操作する操作手段である。また、入力装置915は、例えば、赤外線やその他の電波を利用したリモートコントロール手段であってもよいし、情報処理装置10の操作に対応した携帯電話やPDA等の外部接続機器929であってもよい。さらに、入力装置915は、例えば、上記の操作手段を用いてユーザにより入力された情報に基づいて入力信号を生成し、CPU901に出力する入力制御回路などから構成されている。情報処理装置10のユーザは、この入力装置915を操作することにより、情報処理装置10に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置917は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。このような装置として、CRTディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ELディスプレイ装置およびランプなどの表示装置や、スピーカおよびヘッドホンなどの音声出力装置や、プリンタ装置、携帯電話、ファクシミリなどがある。出力装置917は、例えば、情報処理装置10が行った各種処理により得られた結果を出力する。具体的には、表示装置は、情報処理装置10が行った各種処理により得られた結果を、テキストまたはイメージで表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して出力する。
ストレージ装置919は、情報処理装置10の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置919は、例えば、HDD(Hard Disk Drive)等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイス等により構成される。このストレージ装置919は、CPU901が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。
ドライブ921は、記録媒体用リーダライタであり、情報処理装置10に内蔵、あるいは外付けされる。ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録されている情報を読み出して、RAM905に出力する。また、ドライブ921は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体927に記録を書き込むことも可能である。リムーバブル記録媒体927は、例えば、DVDメディア、HD−DVDメディア、Blu−ray(登録商標)メディア等である。また、リムーバブル記録媒体927は、コンパクトフラッシュ(登録商標)(Compact Flash:CF)、フラッシュメモリ、または、SDメモリカード(Secure Digital memory card)等であってもよい。また、リムーバブル記録媒体927は、例えば、非接触型ICチップを搭載したICカード(Integrated Circuit card)または電子機器等であってもよい。
接続ポート923は、機器を情報処理装置10に直接接続するためのポートである。接続ポート923の一例として、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)ポート等がある。接続ポート923の別の例として、RS−232Cポート、光オーディオ端子、HDMI(High-Definition Multimedia Interface)ポート等がある。この接続ポート923に外部接続機器929を接続することで、情報処理装置10は、外部接続機器929から直接各種のデータを取得したり、外部接続機器929に各種のデータを提供したりする。
通信装置925は、例えば、通信ネットワーク931に接続するための通信デバイス等で構成された通信インターフェースである。通信装置925は、例えば、有線または無線LAN(Local Area Network)、Bluetooth(登録商標)、またはWUSB(Wireless USB)用の通信カード等である。また、通信装置925は、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、または、各種通信用のモデム等であってもよい。この通信装置925は、例えば、インターネットや他の通信機器との間で、例えばTCP/IP等の所定のプロトコルに則して信号等を送受信することができる。また、通信装置925に接続される通信ネットワーク931は、有線または無線によって接続されたネットワーク等により構成され、例えば、インターネット、家庭内LAN、赤外線通信、ラジオ波通信または衛星通信等であってもよい。
以上、情報処理装置10のハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。従って、上記各実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。
(6.補足)
以上で説明した本開示の実施形態では、特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、上記特徴空間に予め設定された名称つき(named)領域を上記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、上記抽出された名称つき領域と上記クラスタとの間の関連性を評価する関連性評価部と、上記評価された関連性に基づいて上記抽出された名称つき領域の名称から上記クラスタの名称を生成するクラスタ名称生成部と、を含む情報処理装置が提供される。
これによって、予め設定された名称つき領域の名称から、それぞれの名称つき領域とクラスタとの間の関連性に基づいて適切なクラスタの名称が生成される。候補領域抽出部がクラスタに分類される位置データごとに少なくとも1つの候補領域を抽出することによって、クラスタに含まれる位置データの一部を含む名称つき領域も、候補領域として抽出されうる。従って、例えば複数の名称つき領域にまたがる比較的小さなクラスタについても適切な名称が生成されうる。
上記関連性評価部は、少なくとも上記名称つき領域における上記クラスタとの重複部分の割合に基づいて上記関連性を評価してもよい。
これによって、例えば、クラスタの大きさに比較して大きすぎる名称つき領域がクラスタ名称の生成に用いられることを防ぎ、クラスタと同程度の大きさの名称つき領域の名称を用いることで、クラスタの大きさに対応した大きさの自然なクラスタ名称が付与されうる。
上記候補領域抽出部は、第1の名称つき領域と第2の名称つき領域とを抽出し、上記関連性評価部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域の上記クラスタとの重複部分から上記第1の名称つき領域の上記クラスタとの重複部分を除いて上記第2の名称つき領域の上記関連性を再評価してもよい。
これによって、各名称つき領域の関連性の評価において、より関連性が高い他の名称つき領域に含まれるクラスタの部分が除外される。従って、大部分が重なっている、または包含関係にあるような名称つき領域の間でも、よりクラスタとの間の関連性が高い名称つき領域が抽出されてクラスタ名称に用いられうる。
上記関連性評価部は、少なくとも上記名称つき領域に含まれる上記位置データの数に基づいて上記関連性を評価してもよい。
これによって、例えば、クラスタの大きさに比較して小さすぎる名称つき領域がクラスタ名称の生成に用いられることを防ぎ、クラスタと同程度の大きさの名称つき領域の名称を用いることで、クラスタの大きさに対応した大きさの自然なクラスタ名称が付与されうる。
上記候補領域抽出部は、第1の名称つき領域と第2の名称つき領域とを抽出し、上記関連性評価部は、上記第1の名称つき領域の上記関連性が上記第2の名称つき領域の上記関連性よりも高い場合に、上記第2の名称つき領域に含まれる上記位置データから上記第1の名称つき領域に含まれる上記位置データを除いて上記第2の名称つき領域の上記関連性を再評価してもよい。
これによって、ある時点で関連性が最も高いと評価された名称つき領域に含まれる位置データは、それ以降の関連性の評価では考慮されなくなる。従って、それ以降の関連性の評価では、他の位置データを有する名称つき領域の関連性が相対的に高く評価される。
上記候補領域抽出部は、複数の上記名称つき領域を抽出し、上記クラスタ名称生成部は、上記名称つき領域の名称を上記関連性が高い順に併記することによって上記クラスタの名称を生成してもよい。
これによって、クラスタの領域を単一の名称で表現することが難しい場合も、名称を併記することでクラスタの領域を的確に表現することができる。
上記関連性評価部は、上記関連性の評価値を算出し、上記クラスタ名称生成部は、上記名称つき領域の上記評価値の積算値が第1の閾値に到達するまで上記名称つき領域の名称を併記することによって上記クラスタの名称を生成してもよい。
これによって、例えば、クラスタとの間の関連性が低いが0ではない名称つき領域の名称が際限なくクラスタ名称に追加されることを防ぎ、クラスタ名称を適切な長さに保つことができ、表示時の視認性を確保することができる。
上記クラスタ名称生成部は、数が第2の閾値に到達するまで上記名称つき領域の名称を併記することによって上記クラスタの名称を生成してもよい。
これによって、クラスタ名称の長さを所定の範囲に制限し、表示時の視認性を確保することができる。
上記クラスタ名称生成部は、上位下位関係にある上記名称つき領域のうち、下位の名称つき領域の名称を優先的に用いて上記クラスタの名称を生成してもよい。
これによって、上位下位関係にある領域の名称がクラスタ名称に併記されてユーザに違和感を与えることを防ぐことができる。
上記クラスタ名称生成部は、上記抽出された名称つき領域のうち上記クラスタの名称に名称が用いられない領域が存在する場合、上記クラスタの名称に“その他”を意味する文言を付加してもよい。
これによって、何らかの理由ですべての位置データに対応する領域の名称をクラスタ名称に含められない場合でも、クラスタ名称に現れている以外の位置データがクラスタに含まれることを示すことができる。
上記の実施形態の説明では、特徴空間として2次元(地図、特徴マップ空間)、および1次元(時間軸)の例を示したが、本技術はこれに限定されるものではない。本技術は、特徴空間上の位置と、この位置が分類されるクラスタと、特徴空間上の所定の領域とが存在すれば、どのような場合にも適用されうるものである。すなわち、本技術は、3次元、またはそれ以上の任意の次元の特徴空間においても、上記の例と同様に適用されうる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、
前記抽出された名称つき領域と前記クラスタとの間の関連性を評価する関連性評価部と、
前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成するクラスタ名称生成部と、
を備える情報処理装置。
(2)前記関連性評価部は、少なくとも前記名称つき領域における前記クラスタとの重複部分の割合に基づいて前記関連性を評価する、前記(1)に記載の情報処理装置。
(3)前記候補領域抽出部は、第1の名称つき領域と第2の名称つき領域とを抽出し、
前記関連性評価部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域と前記クラスタとの重複部分から前記第1の名称つき領域と前記クラスタとの重複部分を除いて前記第2の名称つき領域の前記関連性を再評価する、前記(2)に記載の情報処理装置。
(4)前記関連性評価部は、少なくとも前記名称つき領域に含まれる前記位置データの数に基づいて前記関連性を評価する、前記(1)〜(3)のいずれか1項に記載の情報処理装置。
(5)前記候補領域抽出部は、第1の名称つき領域と第2の名称つき領域とを抽出し、
前記関連性評価部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域に含まれる前記位置データから前記第1の名称つき領域に含まれる前記位置データを除いて前記第2の名称つき領域の前記関連性を再評価する、前記(4)に記載の情報処理装置。
(6)前記候補領域抽出部は、複数の前記名称つき領域を抽出し、
前記クラスタ名称生成部は、前記名称つき領域の名称を前記関連性が高い順に併記することによって前記クラスタの名称を生成する、前記(1)〜(5)のいずれか1項に記載の情報処理装置。
(7)前記関連性評価部は、前記関連性の評価値を算出し、
前記クラスタ名称生成部は、前記名称つき領域の前記評価値の積算値が第1の閾値に到達するまで前記名称つき領域の名称を併記することによって前記クラスタの名称を生成する、前記(6)に記載の情報処理装置。
(8)前記クラスタ名称生成部は、数が第2の閾値に到達するまで前記名称つき領域の名称を併記することによって前記クラスタの名称を生成する、前記(6)または(7)に記載の情報処理装置。
(9)前記クラスタ名称生成部は、上位下位関係にある前記名称つき領域のうち、下位の名称つき領域の名称を優先的に用いて前記クラスタの名称を生成する、前記(1)〜(8)のいずれか1項に記載の情報処理装置。
(10)前記クラスタ名称生成部は、前記抽出された名称つき領域のうち前記クラスタの名称に名称が用いられない領域が存在する場合、前記クラスタの名称に“その他”を意味する文言を付加する、前記(1)〜(9)のいずれか1項に記載の情報処理装置。
(11)特徴空間の位置データが分類されるクラスタの情報を取得することと、
前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出することと、
前記抽出された名称つき領域と前記クラスタとの間の関連性を評価することと、
前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成することと、
を含む情報処理方法。
(12)特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
前記クラスタに分類される位置データごとに少なくとも1つ抽出された前記特徴空間上の名称つき領域と前記クラスタとの間の関連性に基づいて前記抽出された名称つき領域の名称から生成された前記クラスタの名称の情報を取得するクラスタ名称情報取得部と、
前記クラスタおよび前記クラスタの名称の情報を表示部に表示させる表示制御部と、
を備える情報処理装置。
10,30 情報処理装置
11 コンテンツ取得部
13 クラスタリング部
15 候補領域抽出部
17 関連性評価部
19 クラスタ名称生成部
21 領域名称データベース
23 クラスタ名称出力部
33 クラスタ情報取得部
35 クラスタ名称情報取得部
37 表示制御部
39 表示部
100 地図
110,210 画像コンテンツ
120,220,320 クラスタ
122,222,322 クラスタ名称
130 候補領域
140 候補領域の一次リスト
150 候補領域の二次リスト
200 時間軸
230 イベント期間
300 特徴マップ空間
310 楽曲コンテンツ
330 カテゴリ領域

Claims (11)

  1. 特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
    前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、
    前記抽出された名称つき領域と前記クラスタとの間の関連性を、少なくとも前記名称つき領域における前記クラスタとの重複部分の割合に基づいて評価する関連性評価部と、
    前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成するクラスタ名称生成部と
    を備え
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性評価部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域と前記クラスタとの重複部分から前記第1の名称つき領域と前記クラスタとの重複部分を除いて前記第2の名称つき領域の前記関連性を再評価する情報処理装置。
  2. 特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
    前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出する候補領域抽出部と、
    前記抽出された名称つき領域と前記クラスタとの間の関連性を、少なくとも前記名称つき領域に含まれる前記位置データの数に基づいて評価する関連性評価部と、
    前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成するクラスタ名称生成部と
    を備え、
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性評価部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域に含まれる前記位置データから前記第1の名称つき領域に含まれる前記位置データを除いて前記第2の名称つき領域の前記関連性を再評価する情報処理装置。
  3. 前記候補領域抽出部は、複数の前記名称つき領域を抽出し、
    前記クラスタ名称生成部は、前記名称つき領域の名称を前記関連性が高い順に併記することによって前記クラスタの名称を生成する、請求項1または2に記載の情報処理装置。
  4. 前記関連性評価部は、前記関連性の評価値を算出し、
    前記クラスタ名称生成部は、前記名称つき領域の前記評価値の積算値が第1の閾値に到達するまで前記名称つき領域の名称を併記することによって前記クラスタの名称を生成する、請求項に記載の情報処理装置。
  5. 前記クラスタ名称生成部は、数が第2の閾値に到達するまで前記名称つき領域の名称を併記することによって前記クラスタの名称を生成する、請求項またはに記載の情報処理装置。
  6. 前記クラスタ名称生成部は、上位下位関係にある前記名称つき領域のうち、下位の名称つき領域の名称を優先的に用いて前記クラスタの名称を生成する、請求項1〜のいずれか1項に記載の情報処理装置。
  7. 前記クラスタ名称生成部は、前記抽出された名称つき領域のうち前記クラスタの名称に名称が用いられない領域が存在する場合、前記クラスタの名称に“その他”を意味する文言を付加する、請求項1〜のいずれか1項に記載の情報処理装置。
  8. コンピュータを用いて構築されたシステムにおいて、前記コンピュータが備える各手段が、
    特徴空間の位置データが分類されるクラスタの情報を取得することと、
    前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出することと、
    前記抽出された名称つき領域と前記クラスタとの間の関連性を、少なくとも前記名称つき領域における前記クラスタとの重複部分の割合に基づいて評価することと、
    前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成することと
    を含み、
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性を評価することは、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域と前記クラスタとの重複部分から前記第1の名称つき領域と前記クラスタとの重複部分を除いて前記第2の名称つき領域の前記関連性を再評価することを含む、情報処理方法。
  9. コンピュータを用いて構築されたシステムにおいて、前記コンピュータが備える各手段が、
    特徴空間の位置データが分類されるクラスタの情報を取得することと、
    前記特徴空間に予め設定された名称つき領域を前記クラスタに分類される位置データごとに少なくとも1つ抽出することと、
    前記抽出された名称つき領域と前記クラスタとの間の関連性を、少なくとも前記名称つき領域に含まれる前記位置データの数に基づいて評価することと、
    前記評価された関連性に基づいて前記抽出された名称つき領域の名称から前記クラスタの名称を生成することと
    を含み、
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性を評価することは、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域に含まれる前記位置データから前記第1の名称つき領域に含まれる前記位置データを除いて前記第2の名称つき領域の前記関連性を再評価することを含む、情報処理方法。
  10. 特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
    前記クラスタに分類される位置データごとに少なくとも1つ抽出された前記特徴空間上の名称つき領域と前記クラスタとの間の関連性に基づいて前記抽出された名称つき領域の名称から生成された前記クラスタの名称の情報を取得するクラスタ名称情報取得部と、
    前記クラスタおよび前記クラスタの名称の情報を表示部に表示させる表示制御部と
    を備え
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性は、少なくとも前記名称つき領域における前記クラスタとの重複部分の割合に基づいて評価され、
    前記クラスタ名称情報取得部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域と前記クラスタとの重複部分から前記第1の名称つき領域と前記クラスタとの重複部分を除いて再評価された前記第2の名称つき領域の前記関連性に基づいて生成された前記クラスタの名称の情報を取得する情報処理装置。
  11. 特徴空間の位置データが分類されるクラスタの情報を取得するクラスタ情報取得部と、
    前記クラスタに分類される位置データごとに少なくとも1つ抽出された前記特徴空間上の名称つき領域と前記クラスタとの間の関連性に基づいて前記抽出された名称つき領域の名称から生成された前記クラスタの名称の情報を取得するクラスタ名称情報取得部と、
    前記クラスタおよび前記クラスタの名称の情報を表示部に表示させる表示制御部と
    を備え、
    前記名称つき領域は、第1の名称つき領域と第2の名称つき領域とを含み、
    前記関連性は、少なくとも前記名称つき領域に含まれる前記位置データの数に基づいて評価され、
    前記クラスタ名称情報取得部は、前記第1の名称つき領域の前記関連性が前記第2の名称つき領域の前記関連性よりも高い場合に、前記第2の名称つき領域に含まれる前記位置データから前記第1の名称つき領域に含まれる前記位置データを除いて再評価された前記第2の名称つき領域の前記関連性に基づいて生成された前記クラスタの名称の情報を取得する情報処理装置。
JP2011128359A 2011-06-08 2011-06-08 情報処理装置および情報処理方法 Expired - Fee Related JP5708278B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2011128359A JP5708278B2 (ja) 2011-06-08 2011-06-08 情報処理装置および情報処理方法
US13/467,100 US8949238B2 (en) 2011-06-08 2012-05-09 Information processing device, method, and computer program product
EP12169963A EP2541487A1 (en) 2011-06-08 2012-05-30 Information processing device, method, and computer readable medium
CN201210180331.9A CN102982337B (zh) 2011-06-08 2012-06-01 信息处理设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011128359A JP5708278B2 (ja) 2011-06-08 2011-06-08 情報処理装置および情報処理方法

Publications (3)

Publication Number Publication Date
JP2012256171A JP2012256171A (ja) 2012-12-27
JP2012256171A5 JP2012256171A5 (ja) 2014-07-03
JP5708278B2 true JP5708278B2 (ja) 2015-04-30

Family

ID=46354001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011128359A Expired - Fee Related JP5708278B2 (ja) 2011-06-08 2011-06-08 情報処理装置および情報処理方法

Country Status (4)

Country Link
US (1) US8949238B2 (ja)
EP (1) EP2541487A1 (ja)
JP (1) JP5708278B2 (ja)
CN (1) CN102982337B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102202231B1 (ko) * 2012-12-14 2021-01-13 한국전자통신연구원 지리 정보 분석 장치 및 그 방법
EP3147798A4 (en) * 2014-05-22 2018-01-17 Sony Corporation Information processing device, information processing method, and program
JP6334825B2 (ja) * 2015-07-24 2018-05-30 株式会社日立製作所 情報配信装置及び方法
US10360276B2 (en) 2015-07-28 2019-07-23 Expedia, Inc. Disambiguating search queries
US10467284B2 (en) 2015-08-03 2019-11-05 Google Llc Establishment anchoring with geolocated imagery
US20170039264A1 (en) * 2015-08-04 2017-02-09 Google Inc. Area modeling by geographic photo label analysis
JP6602245B2 (ja) * 2016-03-18 2019-11-06 株式会社Nttドコモ 情報処理装置
JP6641398B2 (ja) * 2018-01-26 2020-02-05 株式会社カルチベイトジャパン 醸造酒検索装置及びプログラム
JP6516899B2 (ja) * 2018-04-26 2019-05-22 株式会社日立製作所 情報配信装置及び方法
JP7138866B2 (ja) * 2019-12-26 2022-09-20 株式会社カルチベイトジャパン 情報表示装置、方法、及びプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056009A (ja) * 2000-05-29 2002-02-20 Fuji Xerox Co Ltd 文書分類方法および装置
US7009638B2 (en) * 2001-05-04 2006-03-07 Vexcel Imaging Gmbh Self-calibrating, digital, large format camera with single or multiple detector arrays and single or multiple optical systems
US7257598B2 (en) * 2002-12-19 2007-08-14 Nokia Corporation System and method for generating descriptive link names
US7313574B2 (en) * 2003-10-02 2007-12-25 Nokia Corporation Method for clustering and querying media items
JP2006058979A (ja) * 2004-08-17 2006-03-02 Fuji Photo Film Co Ltd 画像分類装置、画像分類方法、画像分類プログラム、及び撮像装置
JP2006065764A (ja) * 2004-08-30 2006-03-09 Sharp Corp 画像照合装置、画像照合方法、画像照合プログラムおよび画像照合プログラムを記録したコンピュータ読取り可能な記録媒体
JP4457988B2 (ja) * 2005-06-30 2010-04-28 セイコーエプソン株式会社 画像管理装置、画像管理方法およびコンピュータプログラム
JP4356027B2 (ja) 2007-03-30 2009-11-04 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4412342B2 (ja) 2007-03-30 2010-02-10 ソニー株式会社 コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
CN101360174B (zh) * 2007-08-03 2011-05-25 广达电脑股份有限公司 数字图像的分类方法及分类装置
EP2297703A1 (en) * 2008-06-03 2011-03-23 ETH Zurich Method and system for generating a pictorial reference database using geographical information
JP5215046B2 (ja) * 2008-06-05 2013-06-19 株式会社東芝 文書分類装置
KR101384931B1 (ko) * 2009-12-10 2014-04-11 노키아 코포레이션 이미지 처리 방법, 장치 또는 시스템
JP2011128359A (ja) 2009-12-17 2011-06-30 Hitachi Chemical Dupont Microsystems Ltd ポジ型感光性樹脂組成物、それを用いた硬化膜及び電子部品

Also Published As

Publication number Publication date
CN102982337B (zh) 2018-02-23
EP2541487A1 (en) 2013-01-02
CN102982337A (zh) 2013-03-20
US8949238B2 (en) 2015-02-03
US20120317114A1 (en) 2012-12-13
JP2012256171A (ja) 2012-12-27

Similar Documents

Publication Publication Date Title
JP5708278B2 (ja) 情報処理装置および情報処理方法
US11138476B2 (en) Organizing images associated with a user
JP4457660B2 (ja) 画像分類装置、画像分類システム、画像分類に関するプログラム、およびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN104866501B (zh) 电子旅行相册生成方法和***
JP4796435B2 (ja) 画像ビューア
CN108235765A (zh) 一种故事相册的显示方法及装置
US10129336B2 (en) Content management method and cloud server therefor
US20170185670A1 (en) Generating labels for images associated with a user
US20190340252A1 (en) Digital asset search user interface
WO2014129042A1 (ja) 情報処理装置、情報処理方法およびプログラム
US20110234613A1 (en) Generating digital media presentation layouts dynamically based on image features
US9613455B1 (en) Local georeferenced data
JP2011215964A (ja) サーバ装置、クライアント装置、コンテンツ推薦方法及びプログラム
JP5667069B2 (ja) コンテンツ管理装置、コンテンツ管理方法、コンテンツ管理プログラムおよび集積回路
JP2017016388A (ja) 地域アルバム生成サーバ及びその生成方法
AU2012274549A1 (en) Data storage system
JP2008033399A (ja) 情報提供システム
JP7373823B2 (ja) 情報処理装置、情報システム、情報処理方法、およびプログラム
US20140104312A1 (en) Creation and Sharing of Digital Postcards Associated with Locations
JP5708868B1 (ja) プログラム、情報処理装置及び方法
JP6063697B2 (ja) 画像表示のための装置、方法及びプログラム
JP5775241B1 (ja) 情報処理システム、情報処理方法、および情報処理プログラム
WO2011061782A1 (ja) 画像処理装置
US20200394611A1 (en) Information processing device, and non-transitory computer readable medium storing information processing program
O’Connor et al. Promoting Tourist Destinations: A Film Tourism Model

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140520

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150216

R151 Written notification of patent or utility model registration

Ref document number: 5708278

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees