JP2015097036A - 推薦画像提示装置及びプログラム - Google Patents

推薦画像提示装置及びプログラム Download PDF

Info

Publication number
JP2015097036A
JP2015097036A JP2013237107A JP2013237107A JP2015097036A JP 2015097036 A JP2015097036 A JP 2015097036A JP 2013237107 A JP2013237107 A JP 2013237107A JP 2013237107 A JP2013237107 A JP 2013237107A JP 2015097036 A JP2015097036 A JP 2015097036A
Authority
JP
Japan
Prior art keywords
image
preference
user
recommended
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013237107A
Other languages
English (en)
Inventor
香織 片岡
Kaori Kataoka
香織 片岡
数藤 恭子
Kyoko Sudo
恭子 数藤
行信 谷口
Yukinobu Taniguchi
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013237107A priority Critical patent/JP2015097036A/ja
Publication of JP2015097036A publication Critical patent/JP2015097036A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】画像によって示される状況と、ユーザの嗜好とに応じた組み合わせを提示すること。【解決手段】ユーザに推薦する対象となる対象物が撮像された画像である推薦画像と、ユーザの対象物に対する嗜好度を算出するための嗜好パラメータとに基づいて対象物に対する嗜好度を算出する嗜好度算出部と、対象物と画像によって示される状況との組み合わせの適合度を算出するための適合パラメータと、ユーザによって対象物を組み合わせる対象として選択された画像によって示される状況と、推薦画像とに基づいて画像によって示される状況と推薦画像と組み合わせの適合度を算出する適合度算出部と、嗜好度と適合度とに応じた推薦画像を出力する出力部と、を備える推薦画像提示装置。【選択図】図2

Description

本発明は、画像の検索技術に関する。
従来、通信販売などのサイトでは、パーティ用、オフィス用、和風、洋風などのシーンを表すキーワードをユーザに選択させて、選択されたキーワードに関連する衣服の組み合わせを表示することが行われている(例えば、非特許文献1参照)。これにより、ユーザは、各シーンにおける衣服の組み合わせの参考にしたり、表示されている衣服の組み合わせを購入することができる。
[online]、[平成25年10月29日検索]、インターネット(URL:http://with.woman.excite.co.jp/coordinate/)
ところで、実際のパーティ会場などの雰囲気に合わせた衣服の組み合わせが所望される場合がある。しかしながら、パーティ会場などの場所の雰囲気をキーワードで表現することは難しい。そのため、雰囲気に合わせた衣服の組み合わせを要求することが困難である。さらに、雰囲気をキーワードで表現することができたとしても、ユーザの嗜好とは無関係な衣服の組み合わせが表示されてしまうおそれもある。そのため、場所の雰囲気とユーザの嗜好とに応じた衣服の組み合わせを推薦、提示できないという問題があった。このような問題は、衣服の組み合わせや場所の雰囲気に限らず、画像によって示される状況との組み合わせが要求される対象物全般に関する問題である。
上記事情に鑑み、本発明は、画像によって示される状況と、ユーザの嗜好とに応じた組み合わせを提示する技術の提供を目的としている。
本発明の一態様は、ユーザに推薦する対象となる対象物が撮像された画像である推薦画像と、前記ユーザの前記対象物に対する嗜好度を算出するための嗜好パラメータとに基づいて前記対象物に対する嗜好度を算出する嗜好度算出部と、前記対象物と画像によって示される状況との組み合わせの適合度を算出するための適合パラメータと、前記ユーザによって前記対象物を組み合わせる対象として選択された画像によって示される状況と、前記推薦画像とに基づいて前記画像によって示される状況と前記推薦画像と組み合わせの適合度を算出する適合度算出部と、前記嗜好度と前記適合度とに応じた推薦画像を出力する出力部と、を備える推薦画像提示装置である。
本発明の一態様は、コンピュータを、上記推薦画像提示装置として機能させるためのプログラムである。
本発明により、画像によって示される状況と、ユーザの嗜好とに応じた組み合わせを提示することが可能となる。
本実施形態における組み合わせ決定システムのシステム構成を示す図である。 本実施形態における通信端末10及び推薦画像提示装置20の機能構成を表す概略ブロック図である。 ユーザ嗜好DB205の構成図である。 学習用画像から対象物領域を分割した具体例を示す図である。 本実施形態における推薦画像提示装置20の推薦画像送信処理の流れを示すフローチャートである。 本実施形態における通信端末10の画像要求処理の流れを示すフローチャートである。 学習用画像とトピックとの関係を表す図である。 画像特徴量を低次元化するための行列式の概念図である。
以下、本発明の一実施形態を、図面を参照しながら説明する。
図1は、本実施形態における組み合わせ決定システムのシステム構成を示す図である。本実施形態の組み合わせ決定システムは、複数の通信端末10−1〜10−N(Nは2以上の整数)、推薦画像提示装置20及び共有サーバ40を備える。複数の通信端末10−1〜10−Nと推薦画像提示装置20と共有サーバ40とのそれぞれは、ネットワーク30を介して通信可能に接続されている。なお、以下の説明では、通信端末10−1〜10−Nを特に区別しない場合には、通信端末10と記載する。
組み合わせ決定システムの理解のため、本実施形態では、具体例として場所(背景)の雰囲気に適合し、かつ、ユーザの嗜好に合わせたフラワーアレンジメントの組み合わせを決定するシステムについて説明する。まず、以下の説明において使用する文言を定義する。
推薦画像とは、ユーザに推薦する対象となる対象物が撮像された画像である。本実施形態では、対象物としてフラワーアレンジメントが撮像された画像が推薦画像である。なお、対象物として服装や、食器などのテーブルウェアが撮像された画像が推薦画像として用いられてもよい。
嗜好度とは、ユーザが推薦画像に撮像されている対象物を好む度合いの高さを表す。嗜好度が高いほど、ユーザが対象物を好む。
背景画像(画像によって示される状況)とは、対象物以外の背景が撮像された画像である。背景画像の具体例として、景色や建物や部屋や壁などが撮像された画像がある。
適合度とは、背景画像に撮像されている背景と推薦画像に撮像されている対象物とが適合する度合いの高さを表す。適合度が高いほど、背景と対象物との組み合わせが適合している。
まず、背景の雰囲気に合わせたフラワーアレンジメントの組み合わせを要求したいユーザは、通信端末10を操作して背景画像を推薦画像提示装置20に送信する。推薦画像提示装置20は、要求元であるユーザの推薦画像に撮像されている対象物に対する嗜好度と、背景画像に撮像されている背景と対象物との適合度とに基づいて推薦画像を提示する。
以下、組み合わせ決定システムの詳細について説明する。
通信端末10は、例えばスマートフォン、タブレット装置、携帯電話、パーソナルコンピュータ、ノートパソコン、ゲーム機器、PDA(Personal Digital Assistant)等の情報処理装置を用いて構成される。通信端末10は、ユーザによって入力された組み合わせ要求の指示に応じて組み合わせ要求情報を生成し、生成した組み合わせ要求情報をネットワーク30を介して推薦画像提示装置20に送信する。組み合わせ要求とは、ユーザが検索エンジン(例えば、検索用ウェブサイト)に入力した背景画像に関連する推薦画像を推薦画像提示装置20に送信させるための要求である。
推薦画像提示装置20は、情報処理装置を用いて構成される。推薦画像提示装置20は、通信端末10から送信された組み合わせ要求情報に応じて推薦画像を検索する。推薦画像提示装置20は、例えば背景画像に対して適合度が高く、かつ、ユーザの嗜好に合った推薦画像を検索する。また、推薦画像提示装置20は、検索された推薦画像を通信端末10に送信する。
ネットワーク30は、どのように構成されたネットワークでもよい。例えば、ネットワーク30はインターネットを用いて構成されてもよい。
共有サーバ40は、情報処理装置を用いて構成される。共有サーバ40は、通信端末10から送信された対象物画像を、通信端末10のユーザに割り当てられたユーザIDに対応付けて蓄積する。対象物画像とは、ユーザがライフログとして撮りためている、対象物が撮像された画像である。本実施形態では、対象物画像としてフラワーアレンジメントが撮像された画像が用いられる。以下の説明では、共有サーバ40に蓄積された対象物画像を蓄積画像と記載する。共有サーバ40は、例えば画像共有サイトを提供するサーバとして構築されてもよい。
図2は、本実施形態における通信端末10及び推薦画像提示装置20の機能構成を表す概略ブロック図である。まず、通信端末10の機能構成を説明する。通信端末10は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、画像要求プログラムを実行する。画像要求プログラムの実行によって、通信端末10は、入力部101、要求部102、通信部103、表示部104を備える装置として機能する。なお、通信端末10の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。また、画像要求プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、画像要求プログラムは、電気通信回線を介して送受信されてもよい。
入力部101は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の既存の入力装置を用いて構成される。入力部101は、ユーザの組み合わせ要求の指示を通信端末10に入力する際にユーザによって操作される。入力部101は、例えばユーザから背景画像の選択を受け付ける。入力部101は、入力装置を通信端末10に接続するためのインタフェースであってもよい。この場合、入力部101は、入力装置においてユーザの入力に応じ生成された入力信号を通信端末10に入力する。
要求部102は、入力部101に入力された組み合わせ要求の指示に基づいて組み合わせ要求情報を生成する。組み合わせ要求情報には、例えばユーザID及び背景画像の画像データなどの情報が含まれる。
通信部103は、推薦画像提示装置20との間で通信を行う。通信部103は、例えば要求部102によって生成された組み合わせ要求情報を推薦画像提示装置20に送信する。また、通信部103は、例えば推薦画像の画像データ(以下、単に「推薦画像」という。)を推薦画像提示装置20から受信する。
表示部104は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画像表示装置である。表示部104は、例えば推薦画像を表示する。表示部104は、画像表示装置を通信端末10に接続するためのインタフェースであってもよい。この場合、表示部104は、推薦画像を表示するための映像信号を生成し、自身に接続されている画像表示装置に映像信号を出力する。
次に、推薦画像提示装置20の機能構成を説明する。推薦画像提示装置20は、バスで接続されたCPUやメモリや補助記憶装置などを備え、推薦画像送信プログラムを実行する。推薦画像送信プログラムの実行によって、推薦画像提示装置20は、通信部201、画像取得部202、特徴量抽出部203、嗜好パラメータ推定部204、ユーザ嗜好DB(データベース:database)205、適合パラメータ推定部206、組み合わせDB207、推薦画像記憶部208、嗜好度算出部209、適合度算出部210、検索部211、送信制御部212を備える装置として機能する。なお、推薦画像提示装置20の各機能の全て又は一部は、ASICやPLDやFPGA等のハードウェアを用いて実現されてもよい。また、推薦画像送信プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。また、推薦画像送信プログラムは、電気通信回線を介して送受信されてもよい。
通信部201は、通信端末10との間で通信を行う。通信部201は、例えば通信端末10から送信された組み合わせ要求情報を受信する。また、通信部201は、例えば受信された組み合わせ要求情報に応じた推薦画像を通信端末10に送信(出力)する。
画像取得部202は、共有サーバ40に記憶されている蓄積画像や、ネットワーク30上から組み合わせ画像を取得する。組み合わせ画像とは、背景と対象物との組み合わせが撮像されている画像である。
特徴量抽出部203は、画像取得部202によって取得された蓄積画像から特徴量を抽出する。
嗜好パラメータ推定部204は、特徴量抽出部203によって抽出された特徴量を用いて嗜好パラメータを推定する。嗜好パラメータとは、ユーザ毎の嗜好度を算出する際に用いられるパラメータである。
ユーザ嗜好DB205は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。ユーザ嗜好DB205は、嗜好パラメータをユーザIDごとに記憶する。
適合パラメータ推定部206は、画像取得部202によって取得された組み合わせ画像を用いて適合パラメータを推定する。適合パラメータとは、適合度を算出する際に用いられるパラメータである。
組み合わせDB207は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。組み合わせDB207は、適合パラメータを記憶する。
推薦画像記憶部208は、磁気ハードディスク装置や半導体記憶装置などの記憶装置を用いて構成される。推薦画像記憶部208は、推薦画像を記憶している。
嗜好度算出部209は、組み合わせ要求情報に含まれるユーザIDと、嗜好パラメータと、推薦画像とに基づいてユーザIDで識別されるユーザの各推薦画像に対する嗜好度を算出する。嗜好度算出部209の具体的な処理については後述する。
適合度算出部210は、組み合わせ要求情報に含まれる背景画像と、適合パラメータと、推薦画像とに基づいて背景画像と各推薦画像との適合度を算出する。適合度算出部210の具体的な処理については後述する。
検索部211は、嗜好度算出部209によって算出された嗜好度と、適合度算出部210によって算出された適合度とに基づいて要求元であるユーザに送信する対象となる推薦画像を検索する。検索部211は、例えば推薦画像毎に、嗜好度の値と適合度の値とを合算した値(以下、「合算値」という。)が閾値以上である推薦画像を推薦画像記憶部208から検索する。
送信制御部212は、検索部211によって検索された推薦画像を合算値に応じて通信部201に送信させる。送信制御部212は、例えば合算値が高い順に推薦画像を通信部201に送信させてもよい。
次に、ユーザ嗜好DB205の生成方法の具体例を2つ説明する。
(1.単一法)
まず、単一法について説明する。単一法では、1人のユーザが共有サーバ40に蓄積した複数の蓄積画像に基づいて嗜好パラメータが推定される。以下、単一法について詳細に説明する。
単一法では、画像取得部202は、共有サーバ40から1つのユーザIDに対応付けられた複数の蓄積画像を取得する。次に、特徴量抽出部203は、取得された蓄積画像毎に画像特徴量を取得する。画像特徴量は、蓄積画像の特徴を表す値であり、例えば色ヒストグラムであってもよい。嗜好パラメータ推定部204は、取得された複数の画像特徴量に基づいて、そのユーザの画像特徴量の傾向を判定する。例えば、嗜好パラメータ推定部204は、色ヒストグラムに基づいて、最も頻繁に出現する色を判定してもよい。より具体的には、嗜好パラメータ推定部204は、RGB成分のヒストグラムを画像特徴量として取得し、推薦画像がユーザの好みであるか否か判定するための識別器を作成してもよい。識別器には、例えば、1クラスSVM(Support Vector Machine)が用いられてもよい。
(2.複数法)
次に、複数法について説明する。複数法では、共有サーバ40に蓄積された複数人分の蓄積画像に基づいて嗜好パラメータが推定される。例えば、協調フィルタリングを用いることによって、複数法を実現することができる。以下、複数法について詳細に説明する。
まず、ユーザuが複数の蓄積画像検索結果の中から代表特徴量iを選択する確率を式1のようにモデル化する。
uはユーザを表す。zはトピックを表す。εuはユーザのトピック比率集合を表す。iは代表特徴量を表す。Φはトピック毎の出現確率を表す。トピックとは、トピックモデルで学習することによって得られる変数を表す。トピックの具体例としては、『アウトドアかつ活動的な雰囲気のトピック』や『和風かつシンプル風のトピック』や『モダンかつレトロな雰囲気のトピック』など好みを表現するグループにクラスタリングされることが期待される。トピックは、ユーザのトピック比率に従って選択される。トピック比率とは、ユーザがトピックを好む確率を表す。トピック比率集合とは、ユーザ毎のトピック比率の集合を表す。トピック比率は、ユーザ及びトピックの組み合わせ毎に算出される。あるユーザに関する各トピックに対するトピック比率の集合が、トピック比率集合である。出現確率は、あるトピックにおいてある代表特徴量が出現する確率を表す。出現確率は、トピック及び代表特徴量の組み合わせ毎に算出される。
代表特徴量とは、複数の蓄積画像(例えば、共有サーバ40に蓄積されているユーザ毎の対象物画像)をクラスタリングすることによって得られる各クラスタの代表として選択した画像特徴量を表す。
また、式1のようにモデル化する場合、トピックzの数は予め設定することが可能となる。以下の説明では、取得するトピックの数をZとする。トピック比率εと出現確率Φとの組み合わせが嗜好パラメータである。
以下、ユーザ嗜好DB205の生成方法についてさらに具体的に説明する。
画像取得部202は、共有サーバ40から蓄積画像とユーザIDとを取得する。その後、特徴量抽出部203は、蓄積画像から代表特徴量iを取得する。
以下、代表特徴量iの算出方法について説明する。
特徴量抽出部203は、学習画像群(複数の蓄積画像)から画像特徴量を抽出し、それらをクラスタリングし、量子化することによって、代表特徴量iを算出する。具体的には、まず、特徴量抽出部203は、蓄積画像から画像特徴を抽出する。画像特徴としてSIFTやSURFやカラーヒストグラムなどから抽出された各種特徴量を用いる。
特徴量抽出部203は、抽出された各種特徴量をベクトル量子化辞書によって離散的な値に量子化する。量子化辞書とは、画像集合全体の特徴ベクトルに対して、k−means法などを用いてクラスタリングを適用することによって構成される。このk個に量子化された各クラスタの中心特徴ベクトルを代表特徴量iとする。中心特徴ベクトルとは、各クラスタの中心に存在する特徴ベクトルである。また、中心特徴ベクトルは、必ずしも各クラスタの中心に存在する特徴ベクトルである必要なく、各クラスタの中心に一番近い位置に存在する特徴ベクトルを中心特徴ベクトルとしてもよい。蓄積画像から抽出された画像特徴は、一番距離の近い代表特徴量に量子化される。距離はユークリッド距離など何を用いてもよい。
以上で、代表特徴量iの算出方法についての説明を終了する。
次に、嗜好パラメータ推定部204は、特徴量抽出部203が取得した代表特徴量iを用いて各ユーザの嗜好パラメータを推定する。嗜好パラメータ推定部204は、例えばEMアルゴリズム(Expectation Maximization algorithm)を用いて各ユーザu∈Uと各蓄積画像i∈Iに対して、ユーザuのトピック比率ε及び出現確率Φを嗜好パラメータとして推定する。その後、嗜好パラメータ推定部204は、推定した嗜好パラメータをユーザIDに対応付けて格納することによってユーザ嗜好DB205を生成する。
以上で、ユーザ嗜好DB205の生成方法についての説明を終了する。
図3は、ユーザ嗜好DB205の構成図である。
ユーザ嗜好DB205は、レコード50を複数有する。レコード50は、ユーザID、嗜好パラメータの各値を有する。
ユーザIDは、ユーザを一意に識別するための識別情報を表す。嗜好パラメータの値は、ユーザ毎の嗜好度を算出する際に用いられるパラメータを表す。嗜好パラメータの具体例として、トピック比率ε及び出現確率Φがある。トピック比率εの値は、ユーザがトピックを好む確率を表す。出現確率Φの値は、各トピックからの代表特徴量の出現確率を表す。
次に、嗜好度の算出方法について説明する。
嗜好度算出部209は、通信端末10から送信された組み合わせ要求情報に含まれるユーザIDと、推薦画像と、ユーザ嗜好DB205とに基づいて要求であるユーザの嗜好度を算出する。嗜好度の算出には、以下の参考文献1に開示されている技術が用いられてもよい。(参考文献1:片岡香織、木村昭悟、村崎和彦、数藤恭子、谷口行信、「SNSを利用したトピックモデルによる画像へのユーザ嗜好性の解析」、電子情報通信学会技術研究報告 信学技法、Vol.112、No.441(PRMU2012 133)、p19-p24.)
嗜好度算出部209は、推薦画像記憶部208に記憶されている全ての推薦画像に対するユーザの嗜好度を算出する。
以上で、嗜好度の算出方法についての説明を終了する。
次に、組み合わせDB207の生成方法について説明する。
まず、前処理として識別器を作成する方法について説明する。識別器を作成するための学習用画像として、背景(例えば、景色や建物や部屋や壁など)と対象物(例えば、テーブルウェア、服装、フラワーアレンジメントなど)との組み合わせが撮像されている画像が複数枚用意される。学習用画像の具体例として、プロによる背景と対象物との組み合わせ例の本や雑誌、又は、Web上に公開されている背景と対象物との組み合わせ例などがある。識別器の作成方法として、以下の参考文献2に開示されている技術が用いられてもよい。(参考文献2:Blei+, JMLR2003, Latent Dirichlet Allocation)
参考文献2では、まず、学習用画像から複数のトピックが抽出される。次に、抽出された各トピックから各画像特徴量が出現する確率が算出される。より具体的には、手順として、学習用画像から対象物領域の抽出を行うステップ、対象物領域と背景領域とのそれぞれから画像特徴量の抽出を行うステップ、トピックモデルにより対象物領域と背景領域とのそれぞれの画像特徴量の各トピックからの出現確率を算出するステップ、の3つのステップが実行される。対象物領域とは、学習用画像内で対象物が撮像されている領域である。背景領域とは、対象物領域以外の領域である。例えば、背景領域は、壁や部屋や景色が撮像されている領域である。以下、各ステップの処理について説明する。
まず、学習用画像から対象物領域を抽出する処理について説明する。
適合パラメータ推定部206は、学習用画像に背景と、対象物としてテーブルウェアやフラワーアレンジメントとの組み合わせが撮像されている場合には、参考文献3に開示されている技術を適用することで学習用画像から対象物領域を抽出する。参考文献3では、対象物の画像と、対象物が撮像されていない画像とを用意してSVM識別器などを作成し、学習用画像から対象物領域を抽出する。(参考文献3:柳井啓司、「一般物体認識の現状と今後」、情報処理学会論文誌、Vol.48 No.SIG 16(CVIM 19)、Nov.2007.)
上記参考文献3に開示されている技術により学習用画像から対象物領域が抽出された図を図4に示す。図4は、学習用画像から対象物領域を分割した具体例を示す図である。図4(A)は、学習用画像の具体例を示す図である。図4(A)に示されるように学習用画像には、背景として和室、対象物としてフラワーアレンジメント60との組み合わせが撮像されている。適合パラメータ推定部206が図4(A)の学習用画像に対して上記参考文献3に開示されている技術を適用することで、図4(A)の学習用画像が図4(B)に示される対象物領域と図4(C)に示される背景領域とに分割される。
また、適合パラメータ推定部206は、学習用画像に背景と、対象物として服装との組み合わせが撮像されている場合には、参考文献4に開示されている技術を適用することで学習用画像から対象物領域を抽出する。参考文献4では、人検出器により人物領域と背景領域とに分離する。人物領域とは、衣服を着用している人物が撮像されている領域である。(参考文献4:服部博憲、他3名、「固定カメラ映像を対象としたHOG人物検出器のシーン適応手法」、電子情報通信学会技術研究報告 信学技法、画像ラボ、Vol.21、No.12、pp.1-8.2010.12.)
また、適合パラメータ推定部206は、その他の手法として参考文献5に開示されている技術を適用することで学習用画像から対象物領域を抽出する。参考文献5では、Saliency Map(サリエンシーマップ)を作成し、サリエンシーの値が高い(閾値以上)画素を前景部分(本実施形態では、対象物領域)とみなし、サリエンシーの値が低い(閾値未満)画素を背景部分(本実施形態では、背景領域)とみなす手法である。(参考文献5:L. Itti, C. Koch, E. Niebur, “A Model of Saliency-Based Visual Attention for Rapid Scene Analysis, IEEE Transactions on Pattern Analysis and Machine Intelligence”, Vol. 20, No. 11, Nov 1998, pp. 1254-1259.)
以上で、学習用画像から対象物領域を抽出する処理についての説明を終了する。
次に、対象物領域と背景領域とのそれぞれから画像特徴量の抽出する処理について説明する。
適合パラメータ推定部206は、対象物領域及び背景領域それぞれから画像特徴量を抽出する。抽出される特徴量は、例えばカラーヒストグラムやBag of visual wordsなどであってもよい。Bag of visual wordsとしては、例えば以下の参考文献6に開示されている技術が適用されてもよい。(参考文献6:八木康史、斎藤英雄、「コンピュータビジョン最先端ガイド3 “4章 Bag-of-Featuresに基づく物体認識(2) - 一般物体認識 -”)
以上で、対象物領域と背景領域とのそれぞれから画像特徴量の抽出する処理についての説明を終了する。
次に、トピックモデルにより対象物領域と背景領域とのそれぞれの画像特徴量の各トピックからの出現確率を算出する処理について説明する。
本実施形態では、上記参考文献2に開示されているトピックモデルが利用される。学習用画像1枚が参考文献2におけるドキュメントにあたり、各画像特徴量がワードにあたる。例えば、画像特徴量がヒストグラムの場合、対象物領域に対するヒストグラムと背景領域に対するヒストグラムとを合わせてワードとして学習させる。これにより、適合パラメータ推定部206は、学習用画像から抽出された各トピックから各画像特徴量が出現する出現確率を算出する。適合パラメータ推定部206は、この処理を、全ての学習用画像に対して行う。その後、適合パラメータ推定部206は、算出した出現確率を格納することによって組み合わせDB207を生成する。
以上で、組み合わせDB207の生成方法についての説明を終了する。
次に、適合度の算出方法について具体的に説明する。
適合度算出部210は、組み合わせDB207に記憶されている各画像特徴量の各トピックからの出現確率を用いて、推薦画像ごとに、通信端末10から送信された背景画像との適合度を算出する。より具体的には、手順として、背景画像の各出現確率を算出するステップ、各推薦画像の各出現確率を算出するステップ、背景画像の各出現確率と照合するステップ、の3つのステップが実行される。以下、各ステップの処理について説明する。
まず、背景画像の各出現確率を算出する処理について説明する。
適合度算出部210は、組み合わせDB207生成時の学習に用いられた学習用画像の画像特徴量と同じ画像特徴量を背景画像から算出する。次に、適合度算出部210は、組み合わせDB207を参照し、算出した背景画像の各画像特徴量の各トピックからの出現確率を合算することによって背景画像全体に対する各トピックからの出現確率を算出する。
以上で、背景画像の各出現確率を算出する処理についての説明を終了する。
次に、各推薦画像の各出現確率を算出する処理について説明する。
適合度算出部210は、背景画像の各出現確率を算出する処理と同様に、推薦画像全体に対する各トピックからの出現確率を推薦画像ごとに算出する。
以上で、各推薦画像の各出現確率を算出する処理についての説明を終了する。
次に、背景画像の各出現確率と各推薦画像の各出現確率とを照合する処理について説明する。適合度算出部210は、背景画像全体に対する各トピックからの出現確率と、推薦画像全体に対する各トピックからの出現確率とを推薦画像ごとに比較して、各トピックからの出現確率の値の類似度を算出する。類似度とは、各トピックからの出現確率の類似の度合いの高さを表す。類似度を算出する方法として、例えば負のKLダイバージェンス(Kullback Leibler divergence)が用いられてもよい。類似度が高いほど、背景画像と推薦画像との適合度が高い。
以上で、背景画像の各出現確率と各推薦画像の各出現確率とを照合する処理についての説明を終了する。
図5は、本実施形態における推薦画像提示装置20の推薦画像送信処理の流れを示すフローチャートである。
通信部201は、通信端末10から組み合わせ要求情報を受信する(ステップS101)。嗜好度算出部209は、受信された組み合わせ要求情報に含まれるユーザIDと、ユーザ嗜好DB205と、推薦画像とに基づいて当該ユーザIDで識別されるユーザの各推薦画像に対する嗜好度を算出する(ステップS102)。適合度算出部210は、受信された組み合わせ要求情報に含まれる背景画像と、組み合わせDB207と、推薦画像とに基づいて当該背景画像と各推薦画像との適合度を算出する(ステップS103)。検索部211は、推薦画像毎に算出された嗜好度と適合度とに応じて推薦画像を検索する(ステップS104)。具体的には、まず、検索部211は、嗜好度と適合度との合算値を推薦画像毎に算出する。次に、検索部211は、合算値が所定の閾値以上である推薦画像を推薦画像記憶部208から検索する。そして、検索部211は、検索結果として所定の閾値以上である推薦画像を取得し、取得した推薦画像を送信制御部212に出力する。送信制御部212は、通信部201の送信を制御して、検索部211から出力された推薦画像を要求元である通信端末10に送信させる(ステップS105)。例えば、送信制御部212は、合算値が高い順に推薦画像を通信端末10に送信させる。通信部201は、送信制御部212の制御に従って、推薦画像を通信端末10に送信する(ステップS106)。その後、推薦画像提示装置20の処理が終了する。
図6は、本実施形態における通信端末10の画像要求処理の流れを示すフローチャートである。
入力部101は、ユーザから組み合わせ要求の指示を受け付ける(ステップS201)。ユーザから組み合わせ要求の指示が入力されると、要求部102は組み合わせ要求情報を生成する(ステップS202)。通信部103は、生成された組み合わせ要求情報を推薦画像提示装置20に送信する(ステップS203)。その後、通信部103は、推薦画像提示装置20から推薦画像を受信する(ステップS204)。表示部104は、受信された推薦画像を画面に表示する(ステップS205)。例えば、表示部104は、推薦画像提示装置20から送信された順番で推薦画像を表示する。その後、通信端末10の処理が終了する。
以上のように構成された推薦画像提示装置20によれば、通信端末10から送信されたユーザID及び背景画像に基づいて嗜好度及び適合度が算出される。具体的には、嗜好度算出部209は、ユーザIDを元に通信端末10のユーザの嗜好パラメータを取得し、推薦画像に対する嗜好度を算出する。また、適合度算出部210は、背景画像を元に推薦画像との適合度を算出する。そして、嗜好度及び適合度の合算値が所定の閾値以上である推薦画像のみが選択される。したがって、背景に適合し、かつ、ユーザの嗜好に合った推薦画像が選択される。そのため、画像によって示される状況と、ユーザの嗜好とに応じた組み合わせを提示することが可能になる。
<変形例>
本実施形態では、画像取得部202は、共有サーバ40から各ユーザの蓄積画像を取得する構成で示したが、これに限定される必要はない。例えば、各ユーザが画像の公開を許可した場合、画像取得部202は通信端末10に蓄積されている画像を蓄積画像として取得してもよい。
フラワーアレンジメントの他に、背景の雰囲気に合わせた服装の組み合わせやテーブルウェアの組み合わせを対象物としてもよい。
ユーザ嗜好DB204及び組み合わせDB207は、通信端末10から組み合わせ要求情報が受信された際に生成されてもよいし、事前に生成されていてもよい。
本実施形態では、送信制御部212は、合算値が高い推薦画像から順番に通信端末10に送信させる構成を示したが、これに限定される必要はない。例えば、送信制御部212は、合算値が閾値以上の推薦画像を送信させるように構成されてもよい。つまり、送信制御部212は、検索部211から出力された順番で推薦画像を送信させる。
本実施形態では、推薦画像提示装置20は、合算値が閾値以上である推薦画像を送信する構成を示したが、これに限定される必要はない。例えば、推薦画像提示装置20は、嗜好度及び適合度のそれぞれが異なる閾値以上である推薦画像を送信するように構成されてもよい。
本発明の組み合わせ決定システムでは、ユーザによって選択された背景画像に適合し、かつ、ユーザの嗜好に合った対象物の推薦画像を提示する構成を示したが、これに限定される必要はない。例えば、ユーザが通信端末10を操作することによって対象物が撮像された画像(画像によって示される状況)を選択し、推薦画像提示装置20が、対象物が撮像された画像に適合し、かつ、ユーザの嗜好に合った対象物の推薦画像を提示するように構成されてもよい。
これにより、画像によって示される状況として背景以外の画像が選択された場合であっても、ユーザの要求に対応することができる。具体的には、ユーザが通信端末10を操作して花の画像を選択した場合、推薦画像提示装置20は選択された画像によって示される花に適合し、かつ、ユーザの嗜好に合った花瓶の画像を推薦画像として送信する。そのため、画像によって示される状況と、ユーザの嗜好とに応じた組み合わせを提示することが可能になる。
本実施形態では、ユーザ嗜好DB205生成のために使用される学習用画像から取得される代表特徴量iを用いて嗜好パラメータを算出する構成を示したが、これに限定される必要はない。例えば、嗜好パラメータ推定部204は、適合度を算出するために導入される潜在変数を元に計算される画像特徴量を用いて嗜好パラメータを算出してもよい。以下、具体的に説明する。
適合パラメータの推定にトピックモデルが利用された場合、学習用画像の各トピックの生成確率が算出される。図7に各トピックの生成確率を説明する図を示す。図7は、学習用画像とトピックとの関係を表す図である。図7に示す例では、学習用画像の具体例として、「学習用画像Ia」、「学習用画像Ib」、「学習用画像Ic」、「学習用画像Id」の4つの例が示されている。また、図7には、潜在変数であるトピックの具体例として、「トピック1」、「トピック2」、「トピック3」、「トピック4」、「トピック5」、「トピック6」の6つの例が示されている。また、各学習用画像と各トピックとの間には、トピックモデルにより算出された生成確率に基づいてそれぞれ太さの異なる直線が示されている。具体的には、学習用画像Iaから各トピック(トピック1〜トピック6)に対して直線が6本示されている。学習用画像Iaでは、トピック1に対して伸びる線が学習用画像Iaから伸びる直線の中で最も太い。したがって、「学習用画像Ia」で生成される確率が最も高いトピックは「トピック1」であることが表されている。また、領域70内の複数の物体は、画像特徴量である。トピック1から各物体に伸びる直線は、トピック1からの各画像特徴量の出現確率を表す。あるトピックから出現確率の高い画像特徴量に伸びる線ほど、太い直線で表される。
嗜好パラメータ推定部204は、各トピック(トピック1〜トピック6)においてトピックの生成確率が高い学習用画像を複数枚ずつ抽出し、当該トピックを表現するトピック代表画像とする。嗜好パラメータ推定部204は、複数枚のトピック代表画像からトピックを算出するにあたって計算された画像特徴量を抽出し、各画像特徴量にトピックの番号をラベル付けする。図7の場合は、[Iaの特徴量、トピック1]、[Ibの特徴量、トピック2]、[Icの特徴量、トピック3]、[Idの特徴量、トピック4]、・・・というように特徴量低次元化のための学習用データを作成する。これを学習用データとし、下記参考文献7に開示されているLFDA(Local Fisher Discriminant Analysis)などを用いてラベル(トピック番号)ごとに分離できるような低次元の新しい特徴量を決定する。(参考文献7:「Local Fisher discriminant analysis for supervised dimensionality reduction」ICML '06 Proceedings of the 23rd international conference on Machine learning Pages 905-912 ACM New York, NY, USA (c)2006)
具体的には、LFDAにより図8に示される式の行列Aを算出し、ユーザの嗜好のモデル化に用いた画像特徴量、たとえば学習用画像のカラーヒストグラムに行列Aをかけることで、画像特徴量の低次元化を行う。図8は、画像特徴量を低次元化するための行列式の概念図である。嗜好パラメータ推定部204は、上述の処理を、全ての学習用画像の低次元化を行った後でその画像特徴量を用いて、嗜好のモデルを学習させる。
以上のように、適合度を算出するモデルから作成された低次元の特徴量をユーザの嗜好の解析に用いることにより、スパースネスの問題に対処することができる。実際に観測されるカラーヒストグラムの組み合わせは限られていて、このようなデータをデータ行列にすると、ほとんどの要素が0となることが多い。これをトピックごとにうまく分離することができる低次元特徴量を用いることで、さらに精度よく効率よくユーザの嗜好を推定することが可能になる。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
10(10−1〜10−N)…通信端末, 20…推薦画像提示装置, 30…ネットワーク, 40…共有サーバ, 101…入力部, 102…要求部, 103…通信部, 104…表示部, 201…通信部(出力部), 202…画像取得部, 203…特徴量抽出部, 204…嗜好パラメータ推定部, 205…ユーザ嗜好DB, 206…適合パラメータ推定部, 207…組み合わせDB, 208…推薦画像記憶部, 209…嗜好度算出部, 210…適合度算出部, 211…検索部, 212…送信制御部

Claims (2)

  1. ユーザに推薦する対象となる対象物が撮像された画像である推薦画像と、前記ユーザの前記対象物に対する嗜好度を算出するための嗜好パラメータとに基づいて前記対象物に対する嗜好度を算出する嗜好度算出部と、
    前記対象物と画像によって示される状況との組み合わせの適合度を算出するための適合パラメータと、前記ユーザによって前記対象物を組み合わせる対象として選択された画像によって示される状況と、前記推薦画像とに基づいて前記画像によって示される状況と前記推薦画像と組み合わせの適合度を算出する適合度算出部と、
    前記嗜好度と前記適合度とに応じた推薦画像を出力する出力部と、
    を備える推薦画像提示装置。
  2. コンピュータを、請求項1に記載の推薦画像提示装置として機能させるためのプログラム。
JP2013237107A 2013-11-15 2013-11-15 推薦画像提示装置及びプログラム Pending JP2015097036A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013237107A JP2015097036A (ja) 2013-11-15 2013-11-15 推薦画像提示装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013237107A JP2015097036A (ja) 2013-11-15 2013-11-15 推薦画像提示装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2015097036A true JP2015097036A (ja) 2015-05-21

Family

ID=53374299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013237107A Pending JP2015097036A (ja) 2013-11-15 2013-11-15 推薦画像提示装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2015097036A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018198323A1 (ja) * 2017-04-28 2018-11-01 富士通株式会社 行動選択学習装置、行動選択学習プログラム、行動選択学習方法及び行動選択学習システム
JP7119319B2 (ja) 2017-09-15 2022-08-17 大日本印刷株式会社 画像分析装置、画像分析システム、プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018198323A1 (ja) * 2017-04-28 2018-11-01 富士通株式会社 行動選択学習装置、行動選択学習プログラム、行動選択学習方法及び行動選択学習システム
JPWO2018198323A1 (ja) * 2017-04-28 2020-03-05 富士通株式会社 行動選択学習装置、行動選択学習プログラム、行動選択学習方法及び行動選択学習システム
US11449770B2 (en) 2017-04-28 2022-09-20 Fujitsu Limited Action selection learning device, action selection learning method, and storage medium
JP7119319B2 (ja) 2017-09-15 2022-08-17 大日本印刷株式会社 画像分析装置、画像分析システム、プログラム

Similar Documents

Publication Publication Date Title
US11436272B2 (en) Object based image based search
US9430719B2 (en) System and method for providing objectified image renderings using recognition information from images
US8649572B2 (en) System and method for enabling the use of captured images through recognition
US8416997B2 (en) Method of person identification using social connections
US7809192B2 (en) System and method for recognizing objects from images and identifying relevancy amongst images and information
CN110348362B (zh) 标签生成、视频处理方法、装置、电子设备及存储介质
US20150242689A1 (en) System and method for determining graph relationships using images
WO2015101289A1 (zh) 图片管理方法、装置及***
CN113434716B (zh) 一种跨模态信息检索方法和装置
JP6365024B2 (ja) サービス提供装置、方法、及びプログラム
CN108268510B (zh) 一种图像标注方法和装置
EP1889207A2 (en) System and method for enabling the use of captured images through recognition
CN111507285A (zh) 人脸属性识别方法、装置、计算机设备和存储介质
CN113657087A (zh) 信息的匹配方法及装置
CN111507400A (zh) 应用分类方法、装置、电子设备以及存储介质
CN113128526B (zh) 图像识别方法、装置、电子设备和计算机可读存储介质
JP5973309B2 (ja) 配信装置及びコンピュータプログラム
US9639808B2 (en) Non-transitory computer readable medium, information processing apparatus, and attribute estimation method
JP7307607B2 (ja) メディアベースのコンテンツシェアを容易にする方法、コンピュータプログラム及びコンピューティングデバイス
JP2015097036A (ja) 推薦画像提示装置及びプログラム
TW202018540A (zh) 資料庫更新方法和裝置、電子設備、電腦儲存介質
CN114445833B (zh) 文本识别方法、装置、电子设备和存储介质
CN111178409B (zh) 基于大数据矩阵稳定性分析的图像匹配与识别***
US11106737B2 (en) Method and apparatus for providing search recommendation information
CN113032614A (zh) 一种跨模态信息检索方法和装置