JP5663742B2 - 画像検索サーバ及び画像検索サーバの画像情報管理方法 - Google Patents

画像検索サーバ及び画像検索サーバの画像情報管理方法 Download PDF

Info

Publication number
JP5663742B2
JP5663742B2 JP2010210487A JP2010210487A JP5663742B2 JP 5663742 B2 JP5663742 B2 JP 5663742B2 JP 2010210487 A JP2010210487 A JP 2010210487A JP 2010210487 A JP2010210487 A JP 2010210487A JP 5663742 B2 JP5663742 B2 JP 5663742B2
Authority
JP
Japan
Prior art keywords
image information
image
storage unit
stored
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010210487A
Other languages
English (en)
Other versions
JP2012068695A (ja
Inventor
世 東 南
世 東 南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Priority to JP2010210487A priority Critical patent/JP5663742B2/ja
Priority to KR20100095637A priority patent/KR101482755B1/ko
Publication of JP2012068695A publication Critical patent/JP2012068695A/ja
Application granted granted Critical
Publication of JP5663742B2 publication Critical patent/JP5663742B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)

Description

本発明は、画像検索サーバ及び検索サーバの画像管理方法に関する。特に、検索条件に対してランキングを付して検索を行なう画像検索サーバ及び画像検索サーバの画像情報管理方法に関する。
デジタルカメラなどの普及により、画像情報を容易に撮影などすることにより生成できるようになった。また、通信技術およびコンピュータ技術の発達により、撮影などにより生成された画像情報がサーバなどにアップロードされ、インターネット上に多数の画像情報が存在するようになった。また、ウェブページに画像情報のURLを含ませることにより、画像情報を含むウェブページの作成が容易となった。
このような状況において、インターネット上に存在する多数の画像情報を検索用の情報と関連付けて格納し、検索条件に応じて検索を行なうシステムが知られている(例えば、特許文献1参照。)。そのようなシステムのサーバでは、画像情報を格納するファイル名や画像情報を参照するウェブページに含まれる単語などを検索用の情報として格納する。クライアントのブラウザなどからキーワードなどの検索条件が入力されると、複数の画像情報の中から、検索条件に適合する画像情報が検索され、ブラウザなどで閲覧が可能となる。このとき、サーバでは、検索された画像情報に、検索条件に適合する順にランク付けが行なわれる。これにより、ブラウザなどにおいて、ランクの順に画像情報を表示することが可能となる。
特開2004−240692号公報
しかしながら、一般的に画像情報はテキスト情報などよりもデータ量が大きく、また、日々インターネット上に新たに存在することになる画像情報の数が大きいので、画像検索サーバが検索対象とする画像情報を記憶するために必要な記憶容量が増大することになる。
本発明の一実施形態として、通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を記憶する画像情報記憶部と、前記画像情報記憶部に記憶されている画像情報が端末装置へ通信網を介して送信されたログを記憶するログ記憶部と、所定期間内の前記画像情報の送信頻度を前記ログより算出し、前記送信頻度が所定の閾値を越える、または、前記画像情報の送信頻度の増加の割合を前記ログより算出し、前記増加の割合が所定の閾値を越えると、前記画像提供装置より前記画像情報の再読み込みを制御する再読込制御部と、前記再読込制御部の制御により前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおす画像情報再読込部とを有する画像検索サーバを提供する。
本発明の一実施形態として、通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を画像情報記憶部に記憶し、前記画像情報記憶部に記憶された画像情報を端末装置へ通信網を介して送信されたログをログ記憶部に記憶し、所定期間内の前記ログ記憶部に記憶されたログを解析して算出される画像情報の送信頻度が所定の閾値を越える、または、前記ログ記憶部に記憶されたログを解析して算出される画像情報の送信頻度の増加の割合が所定の閾値を越えると、前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおすことを含む画像検索サーバの画像情報管理方法を提供する。
本発明によれば、画像検索サーバが検索対象とする画像情報を効率良く記憶することができる。これにより、必要な記憶容量を従来技術よりも小さくすることができる。
本発明の一実施形態に係る画像検索サーバを含むシステムの概略構成図 本発明の一実施形態に係る画像検索サーバの機能ブロック図 検索画面の表示の一例図 検索の結果の表示の一例図 画像情報に対する問い合わせを処理するために用いるテーブルの一例図 重複した再読込を防止するためのテーブルの一例図 画像情報と送信頻度との関係を示すグラフの一例図 本発明の一実施形態に係る画像検索サーバの処理のフローチャート 検索の結果の表示の一例図 重複した再読込を防止するためのテーブルの一例図 ログを記憶するテーブルの一例図 スライディングウィンドウの一例図 計算機の機能ブロック図
以下、本発明を実施するための形態を、図面を参照しながら説明する。なお、本発明は以下の形態に限定されることはなく、種々の変形を行なって実施することが可能である。
図1は、本発明の一実施形態に係る画像検索サーバを含むシステム100の概略構成図である。システム100は、画像検索サーバ101と画像表示装置102と画像提供装置103とを備え、画像検索サーバ101と画像表示装置102とは、インターネットなどの通信網104を介して通信が可能である。また、画像検索サーバ101と画像提供装置103とは、通信網104を介して通信が可能である。図1において、画像表示装置102と画像提供装置103とがそれぞれ1台のみ示されているが、画像表示装置102と画像提供装置103とのそれぞれは複数存在し、それらが通信網104に接続されていてもよい。同様に画像検索サーバ101も複数存在し、それらが通信網104に接続されていてもよい。
システム100の主な動作は次のようになる。最初に、画像検索サーバ101は、画像提供装置103により提供される画像情報を読み込み記憶する。このときの画像情報の読み込みを画像情報の初回の読み込みといったり、画像情報の第1の読み込みといったりする。初回の読み込み、第1の読み込みの前には、画像情報は画像検索サーバ101に記憶されていないとすることができる。
また、このとき、画像検索サーバ101は、記憶された画像情報を検索するための検索情報を関連付けて記憶する。例えば、画像提供装置103は、ウェブページなどを提供するウェブサーバであり、クローラなどにより画像提供装置103に格納されているウェブページなどを取得し、そのウェブページなどに含まれる単語と画像情報へのリンク情報(例えばURL(Uniform Resource Locator))とを取得して、画像検索サーバ101に単語と画像情報へのURLを伝達する。画像検索サーバ101は、伝達されたURLを用いて、画像提供装置103より画像情報を読み込み記憶するとともに、伝達された単語を検索情報として関連付けて記憶する。
このとき、画像情報は、画像提供装置103に記憶されている状態と同じ情報量で画像検索サーバ101に記憶されるのではなく、情報量が小さくなって記憶されるようになっていてもよい。例えば、画像情報の表す画像のサイズを小さくしたり、画像の品質を低下(例えば非可逆圧縮)させたりするなどして、情報量を削減して記憶してもよい。全ての画像情報をそのまま記憶すると、大きな記憶容量が必要となるからである。また、画像提供装置103は、読み込まれた画像情報そのものを記憶するのではなく、その画像情報へのリンク情報を記憶するだけでもよい。リンク情報を記憶する場合であっても、通常は、画像提供装置103に記憶されている画像情報よりも情報量は小さくなる。
画像表示装置102は、ブラウザなどが動作する端末装置である。ブラウザなどから、画像検索サーバ101に格納されている画像情報についての問い合わせが送信され、画像検索サーバ101により受信されると、画像検索サーバ101は、受信された問い合わせにしたがって、画像情報を検索する。検索の結果が得られると、画像検索サーバ101から画像表示装置102へ検索の結果が送信される。なお、検索の結果は、画像検索サーバ101に記憶された画像情報へのリンクの集合として表現できる。画像表示装置102では、受信したリンクの集合に含まれるリンクを用いて、画像検索サーバ101に画像情報を要求し、画像検索サーバ101は、この要求に応じて、要求された画像情報を画像表示装置102へ送信する。
画像検索サーバ101は、画像表示装置102からの要求に応じて送信した画像情報のログを記憶する。画像検索サーバ101は、そのログを解析し、送信される頻度(送信頻度)の大きな画像情報を検出する。そして、送信される頻度が大きく、所定の基準を満たす画像情報を、画像提供装置103より再度読み込み記憶する。このとき、画像検索サーバ101は、最初に画像情報を記憶したときよりも、情報量を大きくして記憶する。例えば、最初に画像情報を記憶したときよりも、サイズを大きくしたり、高品質な状態で記憶したりする。また、最初に画像情報へのリンク情報を記憶しただけの場合には、画像情報そのものを記憶する。
送信される頻度の大きな画像情報の総数(総数とは、たとえば、画像情報をファイルに格納する場合にはそのファイル数として定義できる)は、送信される頻度の小さな画像情報の総数よりも小さいことが経験的に知られている。したがって、このように、送信される頻度の小さい画像情報の情報量を小さくして記憶し、送信される頻度の大きな画像情報を再度読み込み記憶するときには情報量を大きくして記憶することにより、画像情報を効率良く記憶することができる。すなわち、全ての画像情報を画像提供装置103に記憶されているのと同じ状態で記憶する場合よりも必要な記憶領域の大きさを小さくすることができる。
図2は、画像検索サーバ101の機能ブロック図を示す。図2において、画像検索サーバ200は、画像情報送信部201と、画像情報記憶部202と、ログ記憶部203と、再読込制御部204と、画像情報再読込部205とを有する。
画像情報送信部201は、画像情報記憶部202に記憶されている画像情報を、通信網を介して画像表示装置102に送信する。上述したように、画像情報の送信に先立って、画像表示装置102より問い合わせが受信され、その問い合わせにしたがって、画像情報記憶部202に記憶されている画像情報の検索が行われ、検索の結果を画像表示装置102に返信され、画像表示装置102からの要求された画像情報が送信されてもよい。あるいは、画像表示装置102より問い合わせの受信がされずに、URLなどにより指定される画像情報の要求が受信され、要求された画像情報が送信されてもよい。
画像表示装置102より問い合わせの受信がされる場合には、次の処理が行なわれてもよい。例えば、画像表示装置102より接続要求を画像検索サーバ200が受信すると、画像情報送信部201は、検索のためのインターフェースをHTML(Hyper Text Mark−up Language)などで記述した画面情報を画像表示装置102に送信する。図3は、画面情報による表示が、画像表示装置102のディスプレイに行なわれた画面301を例示する。画面301には、画像情報に対する問い合わせとしての検索語などを入力するエリア302が表示される。また、エリア302に入力された問い合わせを画像検索サーバ200へ送信するためのボタン303が表示されている。
ボタン303が、画像表示装置102に接続されたマウスなどが用いられて押下されると、エリア302に入力された問い合わせなどは、画像検索サーバ200へ送信される。画像検索サーバ200が問い合わせを受信すると、画像情報送信部201により、画像情報記憶部202に記憶されている画像情報が検索される。検索の結果は、画像表示装置102へ返信される。
図4は、画像表示装置102へ返信された検索の結果に基づいて画像表示装置102より要求された画像情報を表わす画像が画像表示装置102のディスプレイの画面301に表示された例を示す。図4においては、画面301には、画像401−410が表示されている。画像401−410は検索の結果の一部の画像情報が表す画像である。他の画像を見ることができるように、スクロールバー411が表示されている。画像401−410は、問い合わせの関連性が高いものほど、上方に表示され、同じ高さの位置に表示される画像の中では、左に表示されるものが右に表示されるものよりも関連性が高いようにすることができる。
なお、画像表示装置102は、返信された検索の結果に含まれる画像情報の全てを一度に要求する必要はない。たとえば、スクロールが行なわれた結果、新たな画像が画面に表示される必要が生じたときに、表示が必要となった画像の画像情報を画像検索サーバに要求してもよい。すなわち、図4においては、画像401−410の10個の画像が表示されている。したがって、最初に検索の結果に含まれる画像情報のうち、10個の画像情報を要求すれば足りる。検索の結果に11以上の画像情報が含まれる場合には、画像401−410以外の画像情報は、スクロールバー411などが操作され、画像401−410以外の画像の表示が必要になった段階で、画像検索サーバに要求すればよい。
図5は、画像情報送信部201が、画像情報に対する問い合わせを処理するために用いるテーブルの一例図を示す。図5においては、検索語それぞれに対して、重みと、画像IDとが関連付けられている。重みの一例としては、画像IDにより示される画像情報が、検索語に対してもつ関連性の大きさを示す値がある。例えば、図5において「アキバ」という語に対してimage7055の画像IDにより示される画像情報には、重みとして100が関連付けられ、image9029のそれには90が関連付けられ、image04016のそれには85が関連付けられている。これにより、image7055の画像IDにより示される画像情報が、「アキバ」という語に対して、image9029、image04016の画像IDにより示される画像情報よりも関連性が高いことが示される。したがって、「アキバ」という問い合わせに対する検索の結果の表示においては、image7055、image9029、image04016の順に表示を行なうことができる。
なお、図5において、「アキバ」という語と、複数の画像IDとが関連づけられている。本発明の一実施形態は、語と画像IDとの関連付けは1対多に限定されることはなく、複数の語と、1つの画像IDとが関連付けられる多対1であってもよし。また、多対多の関連付けであってもよい。
また、問い合わせとして複数の検索語が入力された場合には、例えば、それぞれの検索語に対して関連付けられている画像IDの集合を取得し、集合の共通部分に含まれる画像IDを算出し、検索結果とすることができる。また、問い合わせに対する重みは、それぞれの検索語に対する重みの最小値と定義することができる。例えば、「アキバ」に対して重み100が関連付けられ、「プレゼント」に対して重み80が関連付けられている画像に対しては、「アキバ プレゼント」という2つの検索語から構成される問い合わせに対する重みは、80と定義することができる。
画像情報記憶部202は、画像情報を記憶する。記憶される画像情報は、画像提供装置103に記憶されている画像情報が読み込まれたものである。上述したように、画像情報記憶部202は、クローラなどにより画像提供装置103が提供するウェブページに含まれることが検出され、読み込まれた画像情報やそのリンク情報を記憶する。また、検索頻度の大きな画像情報の再読み込みがされた場合の画像情報も記憶する。また、再読み込みがされる画像情報は、検索の結果として表示される頻度やクリックがされる頻度が多い画像情報となるようにしてもよい。
ログ記憶部203は、画像情報が送信されたログを記憶する。ここでいう「画像情報」とは、画像情報記憶部202に記憶されている画像情報であり、画像表示装置102へ送信された画像情報である。また、他の画像検索サーバから、画像表示装置102へ送信された画像情報のログを記憶してもよい。
また、ログ記憶部203は、画像情報を検索するために画像表示装置102より受信された問い合わせのログを記憶することもできる。すなわち、ログ記憶部203は、画像情報送信部201により受信された問い合わせのログを記憶することもできる。また、ログ記憶部203は、他の画像検索サーバにより受信された問い合わせのログを記憶してもよい。また、画像情報送信部201により検索がされて得られた検索の結果に含まれる画像情報の画像IDを記憶してもよい。
また、ログ記憶部203が記憶するログとして、検索の結果が画像表示装置102の画面301に表示された場合に、どの画像がクリックされたかが記憶されてもよい。この場合には、画像情報送信部201は、検索の結果が図4のように画面301に表示される際に、画像401−410に対してクリックがされた場合に、どの画像がクリックされたかを画像検索サーバ200に送信されるように、検索の結果を画像表示装置102に送信する。
再読込制御部204は、ログ記憶部203に記憶されたログに基づいて、画像情報の再読込を制御する。すなわち、ログ記憶部203に記憶されたログを解析し、送信された頻度の大きな画像情報を再読み込みの対象として決定する。例えば、閾値を定めておき、その閾値よりも、所定期間内に送信された頻度が大きな画像情報を再読み込みの対象とする。また、検索の結果として表示され、クリックされた頻度が多い画像情報を再読み込みの対象として決定してもよい。再読み込みの対象として決定された画像情報は、画像情報再読込部205により画像提供装置103より読み込みがされ、画像情報記憶部202により記憶される。
また、再読込制御部204は、送信された頻度やクリックされた頻度そのものを閾値と比較するのではなく、送信された頻度やクリックされた頻度の増加の割合が、別の閾値を越えた画像情報を再読み込みの対象としてもよい。これにより、世の中で急激に注目を集めていると推測される画像情報を再読み込みの対象とすることができる。
また、再読込制御部204は、他の画像検索サーバやウェブページ検索エンジンなどのログ記憶部に記憶されたログを取得して再読込の対象とする画像情報を決定してもよい。
また、再読込制御部204は、ログ記憶部203に記憶されたログに基づいて、画像IDに対する検索語の重みを算出し、図5に示されるテーブルの「重み」の列に格納されている値を更新してもよい。更新の結果、重みが所定の条件を満たす画像IDの表す画像情報を再読み込みの対象とするようにしてもよい。例えば、重みが所定の閾値を越えた画像情報を再読み込みの対象とする。
重複した再読み込みを防止するために、再読込制御部204は、どの画像情報を再読込の対象としたかを記録するようになっていてもよい。図6は、このために再読込制御部204が管理するテーブルの一例を示す。図6に示されるテーブルにおいては、画像IDに対して、再読み込みがされたかどうかを示す情報と、画像情報のURLとが関連付けられている。再読み込みがされたかどうかを示す情報は、図6においては、NO、YESという値を示すフラグとして表わされている。NOは、再読み込みがされていないことを示す。すなわち、最初にクローラなどにより検出された結果、読み込まれた画像情報やリンク情報が記憶され、その後に再読み込みがされていないことを示す。また、YESは、再読込制御部204により再読み込みがされたことがあることを示す。再読込制御部204により再読込の対象とされると、「オリジナルURL」の列に格納されているリンク情報にしたがって、画像情報の再読み込みがされる。
再読込制御部204は、例えば図6のテーブルの「再読込済」の列に格納されている値がYESである画像情報については、再読み込みの対象としないことにより、無駄な再読み込みの実行を防止することができる。また、図6のテーブルなどに再読み込みの対象とされた時刻あるいは再読込が実際にされた時刻も格納しておくことにより、一度再読み込みがされても、所定の時間以上を経過している画像情報については、再読み込みの対象とすることにより、最新の画像情報を取得することができる。
画像情報再読込部205は、再読込制御部204により再読み込みの対象とされた画像情報を、読み込み、画像情報記憶部202に記憶する。例えば図6に示されるテーブルの「オリジナルURL」に格納されているリンク情報にしたがって画像情報を画像提供装置103より取得する。したがって、初回の読み込み(第1の読み込み)により読み込まれた画像情報に対応する画像情報が再読み込みされて、記憶される。
また、再読み込みの対象とされ、読み込まれて画像情報記憶部202に記憶される画像情報は、初回の読み込みにより画像情報が読み込まれて画像情報記憶部202に記憶されたときよりも、情報量が増加している。例えば、初回の読み込み時に画像情報の情報量を削減して画像情報記憶部202に記憶する場合には、再読み込みの対象とされ、読み込まれた画像情報について、削減する情報量を、初回の読み込み時より小さくする。あるいは、情報量の削減をしない。
本実施形態では、再読込制御部204による、ログ記憶部203によるログの解析の結果に基づいて、画像情報記憶部202に記憶される画像情報が、再読み込みされる。これよって、送信頻度が小さな画像情報を小さな情報量で記憶し、送信頻度が大きな画像情報を大きな情報量で記憶することができる。
図7は、画像情報の送信頻度の降順に画像情報を並べ、画像情報の送信頻度をプロットして得られるグラフを示す。すなわち、図7において、画像情報N(たとえば、送信頻度がN番目となる画像情報)の送信頻度がPとなる。このグラフに示されるように、送信頻度の大きな画像情報の総数は、送信頻度の小さな画像情報の総数よりも少ない。すなわち、送信される画像情報の大部分は、少数の画像情報により占められることになる。したがって、例えば送信頻度の閾値を設定し、その閾値よりも大きな送信頻度の画像情報を大きな情報量で記憶し、その閾値以下の送信頻度の画像情報を小さな情報量で記憶しても、大部分の問い合わせの検索の結果には、大きな情報量で記憶された画像情報が含まれるようにできる。すなわち、画像情報を記憶するのに必要な記憶容量の大きさを小さくしつつ、情報量の大きな画像情報を検索の結果に含まれるようにすることができる。
図8は、本発明の一実施形態に係る画像検索サーバ200の処理を説明するフローチャートである。ステップS801の処理として、所定の時間間隔ごとに、ログ記憶部203に記憶されているログを読出す。ステップS802の処理として、ログの読み出しの結果として、画像ID別の送信頻度を算出する。この送信頻度は、上記の所定の時間間隔内で送信された頻度であってもよい。ステップS803の処理として、送信頻度が所定の条件を満たす画像IDを求める。所定の条件とは、例えば、「送信頻度が所定の閾値を越えている」を採用することができる。ステップS804の処理として、求められた画像IDに関連付けられた「オリジナルURL」のうち「再読込済」フラグがNOとなっているURLの画像を再読み込みする。
なお、本発明の一実施形態においては、画像情報再読込部205により読み込まれた画像情報は、そのまま画像情報記憶部202に記憶されてもよいし、所定のサイズに変更される処理が加えられたり、画像が鮮明になる処理が加えられたりしてもよい。例えば、画面301に画像が表示された際に、同じ幅の画像として表示されるように、画像情報再読込部205により再読み込された画像情報は、所定の幅となるようにサイズが縮小あるいは拡大される処理が施されてもよい。所定の幅としては300ピクセルあるいは、250ピクセル以上350ピクセル以下を採用することができる。この幅にすることにより、多くのパーソナルコンピュータにおいては、ディスプレイの幅は1000ピクセル前後であるので、画像を3列にバランス良く表示することができる。また、画像が鮮明になる処理としては、コントラストを上げたり、全体の明るさを変更したりする処理などが上げられる。
図9は、画像情報再読込部205により読み込まれた画像情報が、同じ幅となるようにサイズが変更される処理がされた後、検索の結果として表示された状態を示す。画像901−907は、同じ幅の画像である。幅として、上述したように300ピクセルあるいは、250ピクセル以上350ピクセル以下を採用することにより、画像を3列にバランスよく表示することができる。
なお、列の数は3に固定されず変更されてもよい。たとえば、画像が表示されるウィンドウ幅が変更された場合、ウィンドウ幅を画像情報の幅によって除算して得られる商の値を列の数とすることができる。
図10は、再読み込みを制御するための別のテーブルの例を示す。すなわち、図6に示すテーブルの別の例を示す。図10に示すテーブルと図6に示すテーブルとを比較すると、図10に示すテーブルに「維持」という列が追加されている。この列に格納される値は、再読み込みが不要な画像IDであるかどうかを示す。例えば、画像情報が、辞典などの時間の経過とともに変化しない情報に関する画像情報である場合には、画像情報は変化しないと考えられるので、再読み込みの必要はない。そこで、「維持」の列の値として、「YES」を格納することにより、画像情報の再読み込みはされない。すなわち、再読込制御部は、維持」の列の値として、「YES」が格納されている画像情報の再読み込みを回避する。「維持」の列の値が「YES」であれば、再読み込みがされたかどうかを管理する必要はない。そのため、図10では、「維持」の列の値が「YES」となっている行では、「再読込済」の列の値は「−」になっている。
また、時間の経過とともに、再読込がされる画像情報の数が増える。このため、画像情報を記憶する領域のサイズが増大する。そこで、ログ記憶部203によるログの解析の結果に基づいて、送信頻度が低下した画像情報を小さな情報量の画像に変更することが考えられる。この場合であっても、「維持」の列の値として「YES」が格納されている画像情報は変更されないことにより、再読み込みの発生などの不要な処理の実行を防止することができる。
以下では、ログ記憶部203に記憶されているログの一例と、再読込制御部204によるログの解析の一例を説明する。この例では、送信された画像情報のログに加えて、問い合わせのログを記憶し、問い合わせとしての検索語がログに記憶される頻度を解析し、送信頻度が急上昇すると予測される画像情報を検出している。
図11は、ログ記憶部203に記憶されているログの一例を示す。ログ記憶部203は、問い合わせとして入力(受信)された検索語を入力された時間と関連付けて記憶する。例えば、「アキバ」は、10年6月22日の11時29分24秒に入力され、「フリースタイル」は、10年6月22日11時29分24秒に入力され、「アキバ」は、10年6月22日11時29分25秒に再度入力されている。また、このような検索語のログは、記録された検索語に関連付けられている画像情報が送信される可能性が高いことを示している。たとえば、図5の検索語と画像IDとの関連付けの一例を参照すると、10年6月22日の11時29分24秒に入力された「アキバ」は、画像IDとしてimage7055、image9029、image04016を有する画像情報が送信される可能性が高いことを示している。画像情報が送信される可能性は、重みが大きくなるほど高くなる。そこで、重みが所定の値以上である画像情報については、検索語のログを分析する際に、送信されたものとみなして扱うことができる。
再読込制御部204は、時間を一定の長さの区間に区切り、記憶されているログを、それぞれの区間に関連付ける。図11に示すように、区間(t−1)には、10年6月22日の11時29分24秒の「アキバ」から10年6月22日11時29分25秒の「アキバ」までを関連付け、区間(t)には、10年6月22日11時29分27秒の「フリースタイル」から10年6月22日の11時29分30秒までの「プレゼント」を関連付ける。
再読込制御部204は、区間ごとに、算定された検索語別の受信頻度をデータベースに保存する。図12は、このデータベースの一例を示す。すなわち、再読込制御部204は、区間ごとに入力された検索語を、ログデータを介して識別し、識別された検索語に基づいて受信がされた回数をカウントし、データベースに保存する。
図12に示されるように、スライディングウィンドウは、図12に示されるテーブルを検索する情報を決める役割をする仮想の時間範囲を意味し、システムの運営者によって設定されたn個の区間内に図12に示すテーブルに保存された情報を選別的に検索することができる。値nは、システムの運営者によって必要に応じて任意の長さに設定される。すなわち、スライディングウィンドウは、現在と、現在から所定の時間間隔の長さだけ過去に遡った時点と、の間の期間となる。
再読込制御部204は、スライディングウィンドウであるn個の期間に属するタイムデータおよびタイムデータに対応する検索語/入力回数(受信回数)を図11に示すテーブルより算出し、検索語別の入力回数を合算する役割をする。すなわち、再読込制御部204は、スライディングウィンドウによって決められた時間範囲内に、画像検索サーバ101に入力(受信)がされた検索語および検索語別の累積入力回数に対する情報を算出する。
再読込制御部204は、合算された入力回数に基づいて検索語別に推定入力回数を演算する。すなわち、再読込制御部204は、現時点から近い限定された時間範囲内で算出された検索語別の入力回数に基づいて、将来の一定の長さの期間において発生するものと予想される入力回数を予測する役割をする。
推定入力回数の演算において、再読込制御部204は、人為的に操作された検索語を除いた後、純粋に検索のために入力された検索語のみを用いて入力回数を予測することができる。例えば、入力回数を増加させようとする意図で広告事業者が特定の検索語を過度に入力する場合、再読込制御部204は、該当検索語を攻撃性検索語として判断し、関連する入力回数が前記推定入力回数の演算に反映されないように所定の除外処理を遂行したりする。また、季節的な変動要素、1週間のうちのどの曜日であるか、一日のうちで午前か午後かなどの時間的な変動要素などを加味して推定入力回数を演算する。
前記推定入力回数を推定する基準時間は、システムの運営者によって柔軟に設定され、例えば、一日を基準として推定したり、一時間を基準として推定したりする。
図12は、推定入力回数を予測する場合に用いられる情報の時間範囲を決めるスライディングウィンドウを例示している。前記スライディングウィンドウは、時間範囲であるn個の期間としてタイムデータ“t〜t−n”で選定し、再読込制御部204は、前記タイムデータ(t〜t−n)に相当する検索語および入力回数を識別する。以後、再読込制御部204は、識別された情報を用いて検索語別の入力回数を合算する。将来の一定の長さの期間における入力回数を予測する場合に用いられる情報の時間範囲を決めるスライディングウィンドウを例示している。前記スライディングウィンドウは、時間範囲であるn期間としてタイムデータ“t〜t−n”で選定し、再読込制御部204は、前記タイムデータ(t〜t−n)に相当する検索語および入力回数を識別する。以後、再読込制御部204は、識別された情報を用いて検索語別の入力回数を合算する。
タイムデータ(t〜t−n)に属する検索語別の入力回数を、例えば“プレゼント−601回、フリースタイル−567回、アキバ−487回”と累計することができる。このような検索語別の入力回数に基づいた再読込制御部204は、検索語それぞれに将来の一定の長さの期間における入力回数を予測し、例えば、季節変動や曜日などを考慮した換算値として選択された“127.4”を各入力回数に掛けて“プレゼント−76567.4回、フリースタイル−72235.8回、アキバ−61916.4回”という、これらかの24時間の入力回数を予測することができる。前記換算値は、システムの運営者によって柔軟に設定される数値であり、前記例で適用した換算値“127.4”は、本発明の運営者が十分な実験および計算を経て最適に活用することができると判断された値として決められる。
したがって、たとえばプレゼントという検索語と関連付けられている画像情報が、次のスライディングウィンドウの期間において、約76567回送信されると予測することができる。
再読込制御部204は、演算された推定入力回数を用いて判定数値を算出する役割をし、同時に、再読込制御部204は、算出された判定数値に基づいて入力回数が急上昇する検索語を検出する役割をする。ここで、判定数値は、関連する検索語が急上昇する検索語であるかを判断する数値情報であり、再読込制御部204は、判定数値が所定数値以上であったり相対的に大きい検索語を、入力回数が急上昇する検索語として判断して検出する。
判定数値の例としては、合算された入力回数に基づいて検索語別の入力順位を決め、入力順位数が大きくなると(入力順位が1位から遠くなると)小さくなり、入力順位数が小さくなると(入力順位が1位に近くなると)大きくなる第1の判定数値がある。このような第1の判定数値は、順位を表す番号(入力順位が1位なら1、3位なら3)の逆数として算出することができる。また、所定の回数である最小入力回数に対する推定入力回数の大きさとして算出される第2の判定数値がある。例えば、推定入力回数を最小入力回数で除して得られる値がある。ここで「最小入力回数」というのは、急上昇する検索語として検出するための最小の入力回数という意味である。
再読込制御部204は、第2の判定数値が所定数値以上であり、第1の判定数値が他の検索語の第1判定数値よりも相対的に高い検索語を優先して入力頻度が急上昇する検索語として検出する。そして、そのような検索語により検索される画像情報を再読込の対象とする。
また、そのような検索語により検索される画像情報と検索語との重み付けを第1の判定数値、第2の判定数値のいずれか一方または両方を用いて更新してもよい。
このように2つの判定数値を用いることにより、1つのスライディングウィンドウにおける検索語の入力回数から送信頻度が急上昇すると予測される画像情報を検出することができる。
なお、本発明の一実施形態に係る画像検索サーバは、計算機によって実現することが可能である。図13は、計算機の機能ブロック図を示す。計算機1300は、CPU(Central Processing Unit)1301と、主記憶としてのRAM(Random Access Memory)1302と、電源投入後に実行するプログラムなどを記憶するROM(Read Only Memory)1303と、二次記憶1304と、通信I/F1305と、表示I/F1306とがバスにより相互に接続された構成を有する。
計算機1300の電源が投入されると、ROM1303に記憶されたプログラムがCPU1301により実行される。このプログラムの実行により、二次記憶1304に記憶されたオペレーティングシステムなどを構成するプログラムがRAM1302にロードされ、CPU1301により実行される。そのようなプログラムとして、本発明の一実施形態に係る画像検索サーバの動作を実現するプログラムがある。なお、本発明の一実施形態に係る画像検索サーバの動作は、複数のプログラムにより実現されてもよい。
例えば、画像情報送信部201を実現するために、通信I/F1305により画像情報の要求を受信し、要求された画像情報を二次記憶部1304から読出し、通信I/F1305によりにより送信する。また、たとえば通信I/F1305により問い合わせを受信し、二次記憶1304やRAM1302に記憶された、図5に示すテーブルの情報を参照して、画像情報の検索をCPU1301により実行し、検索の結果を通信I/F1305により送信することもできる。
また、ログ記憶部203を実現するために、ログは、二次記憶1304やRAM1302に記憶する。画像情報記憶部202を実現するために、画像情報も、二次記憶1304やRAM1302に記憶する。また、再読込制御部204を実現するために、ログ、図5、図6や図10に示されるテーブル構造を二次記憶1304やRAM1302に記憶されている情報を読出し、上述したような判定数値などをCPU1301により演算する。
画像情報再読込部205を実現するために、再読込の対象とされた画像情報は、通信I/F1305により取得要求が送信され、取得要求がされた画像情報が受信され、読出されて二次記憶1304やRAM1302に記憶される。
200 画像検索サーバ、201 画像情報送信部、202 画像情報記憶部、203 ログ記憶部、204 再読込制御部、205 画像情報再読込部

Claims (16)

  1. 通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を記憶する画像情報記憶部と、
    前記画像情報記憶部に記憶されている画像情報が端末装置へ通信網を介して送信されたログを記憶するログ記憶部と、
    所定期間内の前記画像情報の送信頻度を前記ログより算出し、前記送信頻度が所定の閾値を越える、または、前記画像情報の送信頻度の増加の割合を前記ログより算出し、前記増加の割合が所定の閾値を越えると、前記画像提供装置より前記画像情報の再読み込みを制御する再読込制御部と、
    前記再読込制御部の制御により前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおす画像情報再読込部と
    を有する画像検索サーバ。
  2. 前記画像提供装置より第1の読み込みにより取得され前記画像情報記憶部に記憶された画像情報は、前記画像提供装置に記憶されているよりも情報量が減少していることを特徴とする請求項1に記載の画像検索サーバ。
  3. 前記画像提供装置より再読み込みがされ前記画像情報記憶部に記憶される画像情報の表す画像の幅が所定の大きさとなっていることを特徴とする請求項1または2に記載の画像検索サーバ。
  4. 前記再読込制御部は、前記再読み込みした前記画像情報を記録し、前記記録された前記画像情報を再読み込みの対象から除外する請求項1から3のいずれかに記載の画像検索サーバ。
  5. 前記画像情報は、前記画像情報記憶部に記憶されている画像情報を検索するための問い合わせに応じて送信され、
    前記ログ記憶部が記憶するログは、前記問い合わせのログを含むことを特徴とする請求項1から4のいずれかに記載の画像検索サーバ。
  6. 前記画像情報記憶部は、前記画像提供装置より取得される1または複数のキーワードを関連付けて画像情報を記憶し、
    前記問い合わせは、キーワードを用いた問い合わせであることを特徴とする請求項5に記載の画像検索サーバ。
  7. 通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を記憶する画像情報記憶部と、
    前記画像情報記憶部に記憶されている画像情報が端末装置へ通信網を介して送信されたログを記憶するログ記憶部と、
    前記画像情報の送信頻度を前記ログより算出し、前記画像提供装置より前記画像情報の再読み込みを制御する再読込制御部と、
    前記再読込制御部の制御により前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおす画像情報再読込部と、
    を有し、
    前記画像情報は、前記画像情報記憶部に記憶されている画像情報を検索するための問い合わせに応じて送信され、
    前記ログ記憶部が記憶するログは、前記問い合わせのログを含み、
    前記再読込制御部は、
    プロセッサを用いて、現在と現在から所定の時間間隔の長さだけ過去に遡った時点との間の期間に前記ログ記憶部に記憶された前記ログより、問い合わせ別の受信回数を算出し、
    前記プロセッサを用いて、前記算出された受信回数に基づいて、前記問い合わせ別に将来の一定の長さの期間において発生すると予測される推定入力回数を算出し、
    前記プロセッサを用いて、前記算出された受信回数に基づいて、前記問い合わせ別の受信順位数を求め、前記求められた受信順位数が大きくなると小さくなり、前記求められた受信順位数が小さくなると大きくなる第1判定数値を算出し、
    前記プロセッサを用いて、所定の値に対する前記推定入力回数の大きさとして算出される第2判定数値を前記問い合わせ別に算出し、
    前記プロセッサを用いて、前記第2判定数値が所定数値以上であり、前記算出された第1判定数値が他の問い合わせの第1判定数値とよりも相対的に大きい問い合わせにより検索される画像情報の再読み込みを前記画像情報再読込部にさせる制御を行なう画像検索サーバ。
  8. 前記再読込制御部は、再読込不要な画像情報を識別する識別IDを保持し、前記識別IDで識別される画像情報の再読み込みの前記再読込制御部の制御を回避することを特徴とする請求項1から7のいずれかに記載の画像検索サーバ。
  9. 通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を画像情報記憶部に記憶し、
    前記画像情報記憶部に記憶された画像情報を端末装置へ通信網を介して送信したログをログ記憶部に記憶し、
    所定期間内の前記ログ記憶部に記憶されたログを解析して算出される画像情報の送信頻度が所定の閾値を越える、または、前記ログ記憶部に記憶されたログを解析して算出される画像情報の送信頻度の増加の割合が所定の閾値を越えると、前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおすことを含む画像検索サーバの画像情報管理方法。
  10. 前記画像提供装置より第1の読み込みにより取得され前記画像情報記憶部に記憶される画像情報は、前記画像提供装置に記憶されているときよりも情報量が減少していることを特徴とする請求項9に記載の画像検索サーバの画像情報管理方法。
  11. 前記画像提供装置より再読み込みがされ前記画像情報記憶部に記憶される画像情報の表す画像の幅が所定の大きさとなっていることを特徴とする請求項9または10に記載の画像検索サーバの画像情報管理方法。
  12. 前記再読み込みした前記画像情報を記録し、前記記録された前記画像情報を再読み込みの対象から除外することを特徴とする請求項9から11のいずれかに記載の画像検索サーバの画像情報管理方法。
  13. 前記画像情報は、前記画像情報記憶部に記憶されている画像情報を検索するための問い合わせに応じて送信され、
    前記ログ記憶部が記憶するログは、前記問い合わせのログを含むことを特徴とする請求項9から12のいずれかに記載の画像検索サーバの画像情報管理方法。
  14. 前記画像情報記憶部に画像情報を記憶する際には、前記画像提供装置より取得される1または複数のキーワードを関連付けて画像情報を記憶し、
    前記問い合わせは、キーワードを用いた問い合わせであることを特徴とする請求項13に記載の画像検索サーバの画像情報管理方法。
  15. 通信網により接続された画像提供装置より第1の読み込みにより取得された画像情報を画像情報記憶部に記憶し、
    前記画像情報記憶部に記憶された画像情報を端末装置へ通信網を介して送信したログをログ記憶部に記憶し、
    前記ログ記憶部に記憶されたログを解析して算出される画像情報の送信頻度に基づいて、前記画像提供装置より対応する画像情報の再読み込みをして、前記第1の読み込みのときに前記画像情報記憶部に記憶されたときより情報量を増加させて前記画像情報記憶部に記憶しなおすことを含み、
    前記画像情報は、前記画像情報記憶部に記憶されている画像情報を検索するための問い合わせに応じて送信され、
    前記ログ記憶部が記憶するログは、前記問い合わせのログを含み、
    プロセッサを用いて、現在と現在から所定の時間間隔の長さだけ過去に遡った時点との間の期間に前記ログ記憶部に記憶された前記ログより、問い合わせ別の受信回数を算出し、
    前記プロセッサを用いて、前記算出された受信回数に基づいて、前記問い合わせ別に将来の一定の長さの期間において発生すると予測される推定入力回数を算出し、
    前記プロセッサを用いて、前記算出された受信回数に基づいて、前記問い合わせ別の受信順位数を求め、前記求められた受信順位数が大きくなると小さくなり、前記求められた受信順位数が小さくなると大きくなる第1判定数値を算出し、
    前記プロセッサを用いて、所定の値に対する前記推定入力回数の大きさとして算出される第2判定数値を前記問い合わせ別に算出し、
    前記プロセッサを用いて、前記第2判定数値が所定数値以上であり、前記算出された第1判定数値が他の問い合わせの第1判定数値とよりも相対的に大きい問い合わせにより検索される画像情報の再読み込みを行なう画像検索サーバの画像情報管理方法。
  16. 読込不要な画像情報を識別する識別IDを保持し、前記識別IDで識別される画像情報の再読み込みを回避することを特徴とする請求項9から15のいずれかに記載の画像検索サーバの画像情報管理方法。

JP2010210487A 2010-09-21 2010-09-21 画像検索サーバ及び画像検索サーバの画像情報管理方法 Active JP5663742B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010210487A JP5663742B2 (ja) 2010-09-21 2010-09-21 画像検索サーバ及び画像検索サーバの画像情報管理方法
KR20100095637A KR101482755B1 (ko) 2010-09-21 2010-09-30 화상 검색 서버 및 화상 검색 서버의 화상 정보 관리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010210487A JP5663742B2 (ja) 2010-09-21 2010-09-21 画像検索サーバ及び画像検索サーバの画像情報管理方法

Publications (2)

Publication Number Publication Date
JP2012068695A JP2012068695A (ja) 2012-04-05
JP5663742B2 true JP5663742B2 (ja) 2015-02-04

Family

ID=46134719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010210487A Active JP5663742B2 (ja) 2010-09-21 2010-09-21 画像検索サーバ及び画像検索サーバの画像情報管理方法

Country Status (2)

Country Link
JP (1) JP5663742B2 (ja)
KR (1) KR101482755B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10402449B2 (en) 2014-03-18 2019-09-03 Rakuten, Inc. Information processing system, information processing method, and information processing program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0568668A (ja) * 1991-09-12 1993-03-23 Olympus Optical Co Ltd 医療用画像記録装置
JP2004240692A (ja) * 2003-02-05 2004-08-26 Ricoh Co Ltd 画像検索サーバシステム、プログラムおよび記録媒体
JP4599141B2 (ja) * 2004-11-19 2010-12-15 ソニー株式会社 情報提供システム,情報提供サーバおよびコンピュータプログラム
JP4655843B2 (ja) * 2005-09-14 2011-03-23 富士ゼロックス株式会社 ログ情報管理システム及びログ情報管理方法
JP2007122157A (ja) * 2005-10-25 2007-05-17 Olympus Imaging Corp 画像検索装置、画像検索プログラム、画像検索方法及び記録媒体

Also Published As

Publication number Publication date
KR20120030906A (ko) 2012-03-29
JP2012068695A (ja) 2012-04-05
KR101482755B1 (ko) 2015-01-14

Similar Documents

Publication Publication Date Title
US10332009B2 (en) Predicting user navigation events
KR101891493B1 (ko) 사용자 탐색 이벤트의 예측
US9094478B2 (en) Prereading method and system for web browser
US9659265B2 (en) Methods and systems for collecting and analyzing enterprise activities
US20140095966A1 (en) Access to network content
CA2985257A1 (en) System and method for ranking search results
CN103530292A (zh) 网页显示方法和装置
US20110184940A1 (en) System and method for detecting changes in the relevance of past search results
JP4875911B2 (ja) コンテンツ特定方法及び装置
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP2002334107A (ja) 情報検索装置および方法と情報検索プログラムおよび該プログラムを記録した記録媒体
JP2013054606A (ja) 文書検索装置及び方法及びプログラム
JP5663742B2 (ja) 画像検索サーバ及び画像検索サーバの画像情報管理方法
JP4445849B2 (ja) ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム
CN116108269A (zh) 搜索结果展示方法、装置、电子设备及存储介质
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
US20170083625A1 (en) Method and system for predicting popularity of a content item
JP2008204198A (ja) 情報提供システム、及び、情報提供プログラム
US9177255B1 (en) Cloud systems and methods for determining the probability that a second application is installed based on installation characteristics
WO2010131425A1 (ja) 逐次発生データ解析装置、システム、方法、及びプログラム
JP2003108594A (ja) 情報検索装置およびその方法
JP5777663B2 (ja) 検索支援装置及び検索支援プログラム
JP2008242777A (ja) 画像検索システム及び画像検索方法
JP2010072751A (ja) 情報処理装置、コンピュータプログラム及び情報検索システム
JP5094891B2 (ja) 検索スコア算出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140408

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141106

R150 Certificate of patent or registration of utility model

Ref document number: 5663742

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250