JP5108707B2 - 検索サーバ装置、検索方法及びプログラム - Google Patents

検索サーバ装置、検索方法及びプログラム Download PDF

Info

Publication number
JP5108707B2
JP5108707B2 JP2008252898A JP2008252898A JP5108707B2 JP 5108707 B2 JP5108707 B2 JP 5108707B2 JP 2008252898 A JP2008252898 A JP 2008252898A JP 2008252898 A JP2008252898 A JP 2008252898A JP 5108707 B2 JP5108707 B2 JP 5108707B2
Authority
JP
Japan
Prior art keywords
web page
search
terminal
page
web
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008252898A
Other languages
English (en)
Other versions
JP2010086180A (ja
Inventor
浩史 太田
一臣 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2008252898A priority Critical patent/JP5108707B2/ja
Publication of JP2010086180A publication Critical patent/JP2010086180A/ja
Application granted granted Critical
Publication of JP5108707B2 publication Critical patent/JP5108707B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webページの検索においてデバイスを調整した検索方法、プログラム及びそのサーバに関する。
従来、Webページへの広告の掲載方法として、検索連動型やコンテンツマッチ型の広告配信方法が行われている(例えば、特許文献1)。検索連動型の広告配信方法とは、ユーザが検索サイト等に入力した検索キーワードに連動して、関連する広告をその検索結果ページに表示するものをいう。また、コンテンツマッチ型の広告配信方法とは、広告配信対象のサイトに対してそのサイトのコンテンツを解析して、キーワードや概念を抽出し、キーワード等を指定して出稿された広告とのマッチングを行い、マッチング結果として適合する広告をそのコンテンツに表示するものをいう。
また、ユーザが入力した検索キーワードを記憶して、その記憶された検索キーワードが使用される傾向から、広告情報を提供することが行われている(例えば、特許文献2)。このような、ユーザが関心のありそうな広告を表示する試みは、広く行われている。
特開2008−102174号公報 特開2007−219595号公報
ところで、ポータルサイトの運営者には、コンテンツに関して広告の場合と同様に、ユーザが関心のありそうなものをよりユーザの目につく場所に配置することが求められている。ユーザは、利便性に欠けるポータルサイトを利用しなくなる傾向があるため、運営者には、よりユーザが利用しやすいポータルサイトの提供が求められる。その際に、コンテンツに関して、コンテンツそのものの内容の問題の他に、端末に最適なコンテンツが出力されることは、ユーザにとって利便性を有し、有益な方法である。
そこで、本発明は、端末のデバイスを考慮したデバイスを調整した検索方法、プログラム及びそのサーバを提供することを目的とする。
本発明者は、デバイスに対応するデバイスワードを用いることで、検索結果にデバイスを含めて調整する仕組みを見出し、本発明を完成するに至った。本発明は、具体的には次のようなものを提供する。
(1) 端末に対して通信ネットワークを介して接続されたコンピュータが、
前記端末の機種に関するデバイス情報と、前記端末の機種を特定可能なデバイスワードとを関連付けて記憶するデバイス判断記憶部を備え、
検索の対象になるWebページを解析して前記Webページのメタ情報に含むデバイスに関する所定の文字列である前記デバイスワードを、前記デバイス判断記憶部に基づき抽出するWebページ解析ステップと、
前記Webページ解析ステップにより抽出された前記デバイスワードから前記デバイス判断記憶部を用いて、前記Webページに適合するデバイス情報を決定する適合デバイス決定ステップと、
前記適合デバイス決定ステップにより決定された前記デバイス情報を、前記デバイスワードを含んだWebページのリンクデータに対応付けて、前記Webページの特徴を示すページウェイトと共にインデキシング記憶部に記憶するインデキシング記憶ステップと、
を含むデバイスを調整した検索方法。
本発明のこのような構成によれば、端末の機種を特定可能なデバイスワードと、デバイス情報とを対応付けることができる。よって、Webページに含むデバイスワードを用いて、Webページがどのデバイスに適合するかを判断することができる。そして、Webページと、Webページに適合するデバイス情報とを対応付けて記憶することで、検索結果を出力する処理等のコンピュータでの処理において、Webページの特徴の他に、端末のデバイスを考慮して、デバイスを調整する検索をすることができる。
また、本発明のこのような構成によれば、デバイスワードとして、Webページのメタ情報に含むデバイスに関する所定の文字列を、Webページの解析で用いることができる。よって、デバイスに関する所定の文字列を含むメタ情報を検索で使用するにも関わらず、従来の検索技術を用いることができ、その検索は、デバイスを考慮したものにすることができる。
(2) 前記コンピュータが、
検索キーワードを含む要求データを前記端末から受信する受信ステップと、
前記受信ステップにより受信した前記端末の前記デバイス情報を検出するデバイス検出ステップと、
前記受信ステップにより受信した前記検索キーワードに基づき、前記検索キーワードを含むWebページを検索する検索ステップと、
前記検索ステップにより検索した前記Webページのうち前記デバイス検出ステップにより検出した前記デバイス情報に合致するWebページを前記インデキシング記憶部から抽出し、前記インデキシング記憶部の前記ページウェイトを用いて検索結果を調整するWebページ調整ステップと、
前記Webページ調整ステップによる調整結果に基づき、検索された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信ステップと、
を含むことを特徴とする(1)に記載の検索方法。
本発明のこのような構成によれば、検索キーワードによるWebページの検索において、Webページに対応付けて記憶した当該Webページに適合するデバイス情報と、Webページの特徴を示すページウェイトとを用いることができる。そして、このWebページに適合するデバイス情報及びページウェイトと、検出した端末のデバイス情報とを用いることで、Webページの特徴と、検索キーワードを送信した端末のデバイス情報との両方を考慮し、特に、デバイスを優先して、検索結果を調整して端末に送信することができる。
(3) 前記Webページ調整ステップにおいて、前記インデキシング記憶部に記憶された前記ページウェイトが高い前記Webページから順番に、前記インデキシング記憶部から抽出するように前記検索結果を調整すること、
を特徴とする(2)に記載の検索方法。
本発明のこのような構成によれば、検索結果として出力する順番として、デバイスが適合するWebページの中から、ページウェイトの高いものを優先することができる。よって、ランク付けをして出力することで、ユーザに対する利便性に優れた検索結果の出力を提供できる。
(4) 前記インデキシング記憶部は、前記ページウェイトとして、前記Webページに対するクリック履歴、前記Webページに関するリンクデータの数、前記Webページの特徴を示す特徴語の出現度合いの少なくともいずれか1つを記憶すること、
を特徴とする(1)から(3)のいずれか1項に記載の検索方法。
本発明のこのような構成によれば、Webページの特徴を表すものとして、Webページに対するクリック履歴や、Webページに関するリンクデータの数や、Webページの特徴を示す特徴語の出現度合いを用いることができる。よって、Webページの特徴を示す様々なデータを用いて検索結果を出力できる。
(5) 前記コンピュータが、通信ネットワークを介して接続されたWebサーバを定期的に巡回して検索の対象になる前記Webページを取得する取得ステップを含むこと、
を特徴とする(1)から(4)のいずれか1項に記載の検索方法。
本発明のこのような構成によれば、対象とするWebページを定期的に取得するので、常に新しいWebページのデータを用いて検索をすることができる。
(6) (1)から(5)のいずれか1項に記載の方法のステップをコンピュータに実行させるための検索プログラム。
(7) 端末に対して通信ネットワークを介して接続された検索サーバであって、
前記端末の機種に関するデバイス情報と、前記端末の機種を特定可能なデバイスワードとを関連付けて記憶するデバイス判断記憶部と、
検索の対象になるWebページを解析して前記Webページのメタ情報に含むデバイスに関する所定の文字列である前記デバイスワードを抽出するWebページ解析手段と、
前記Webページ解析手段により抽出された前記デバイスワードから前記デバイス判断記憶部を用いて、前記Webページに適合するデバイス情報を決定する適合デバイス決定手段と、
前記適合デバイス決定手段に決定された前記デバイス情報を、前記デバイスワードを含んだWebページのリンクデータに対応付けて、前記Webページの特徴を示すページウェイトと共にインデキシング記憶部に記憶するインデキシング記憶手段と、
を備える検索サーバ。
本発明によれば、端末の機種を特定可能なデバイスワードと、デバイス情報とを対応付けたデータを用いることで、Webページに含むデバイスワードから対応するデバイス情報を決定して、デバイスを考慮した検索結果を出力することができる。
以下、本発明を実施するための最良の形態について図を参照しながら説明する。なお、これはあくまでも一例であって、本発明の技術的範囲はこれに限られるものではない。
(実施形態)
[検索システムの全体構成及び検索サーバの機能構成]
図1は、本実施形態に係る検索システム100の全体構成及び検索サーバ1の機能構成を示す図である。
検索システム100は、検索サーバ1と、コンテンツサーバ2と、通信ネットワーク3と、端末4とにより構成される。図1に示すように、インターネット等の通信回線に代表される通信ネットワーク3を介して、検索サーバ1と、コンテンツサーバ2と、端末4とが互いに通信可能に接続されている。
検索サーバ1は、制御部10と記憶部20とを備える。制御部10は、Webページ取得手段11と、Webページ解析手段12と、適合デバイス決定手段13と、インデキシング記憶手段14と、受信手段15と、デバイス検出手段16と、検索手段17と、Webページ調整手段18と、コンテンツ送信手段19とを備える。また、記憶部20は、デバイス判断データベース(以下、データベースをDBともいう)22と、インデキシングDB24と、回収WebページDB26とを備える。各DBの内容については後述する。
検索サーバ1は、ハードウェアの数に制限はなく、必要に応じて1又は複数のハードウェアで構成してよい。また、複数のハードウェアで構成する場合には、通信ネットワーク3を介して各ハードウェアを接続してもよい。例えば、後述する各機能ごとに別サーバとし、各サーバ間での信号の送受信により、各サーバを連携させることで、本実施形態の機能を実現してもよい。
Webページ取得手段11は、Webページ(コンテンツ)を記憶したコンテンツサーバ2を定期的に巡回して、新しく作成されたWebページや更新されたWebページを回収(取得)するクローラの役割を果たす。回収したWebページは、随時回収WebページDB26に記憶される。
Webページ解析手段12は、回収WebページDB26に記憶されたWebページを解析して、デバイスワードを抽出する。デバイスワードとは、端末4の機種(デバイス)を特定可能な情報をいい、HTML(HyperText Markup Language)で記述されたWebページのうち、ブラウザによって表示されるテキスト文を除くWebページのメタ情報に記述された、例えば、参照するファイル名をいう。また、端末4の機種を特定可能な情報は、例えば、加速度センサを利用したWebページやタッチパネルを利用したWebページ等の入力操作に関する装置の特徴をも含む。
適合デバイス決定手段13は、Webページ解析手段12で抽出されたデバイスワードに基づいて、デバイス判断DB22を用いて、Webページごとに、適合するデバイス情報を決定する。インデキシング記憶手段14は、決定されたデバイス情報を、デバイスワードを含むWebページのリンクデータに対応付けてインデキシングDB24に記憶する。
受信手段15は、端末4から検索キーワードを含む要求データを受信する。デバイス検出手段16は、端末4のデバイス情報を検出する。検索手段17は、検索キーワードを含むWebページを検索する。Webページ調整手段18は、デバイス検出手段16により検出した端末4のデバイス情報と、インデキシングDB24とを用いて、検索結果を調整する。コンテンツ送信手段19は、Webページ調整手段18の調整結果に基づき、Webページのリンクデータを含むコンテンツを端末4に送信する。
コンテンツサーバ2は、複数のWebページを記憶したコンテンツのDBサーバである。コンテンツサーバ2は、通信ネットワーク3に接続されていれば、世界中のあらゆるWebページを記憶したコンテンツのDBサーバが該当する。
端末4は、ユーザが、コンテンツを再生するための操作入力をするためのキーボード、マウス等の入力部や、コンテンツを表示する表示画面を備えた装置である。端末4は、例えば、iPhone(登録商標)5、PC(パーソナルコンピュータ)6、PDA(Personal Data Assistant)等の情報通信端末7、携帯電話機8等の様々な機種の端末を含む。端末4を用いて、ユーザは、検索キーワードを入力したり、コンテンツを視聴したりすることができる。
[検索サーバ1のハードウェア構成図]
図2は、本実施形態に係る検索サーバ1のハードウェア構成を示す図である。本発明が実施されるサーバは標準的なものでよく、以下に構成の一例を示す。
検索サーバ1は、制御部10を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU1012等複数のCPUが追加されてもよい)、バスライン1005、通信I/F(I/F:インターフェイス)1040、メインメモリ1050、BIOS(Basic Input Output System)1060、表示装置1022、I/Oコントローラ1070、キーボード及びマウス等の入力装置1100、ハードディスク1074、光ディスクドライブ1076、並びに半導体メモリ1078を備える。なお、ハードディスク1074、光ディスクドライブ1076、及び半導体メモリ1078はまとめて記憶部20と呼ぶ。
制御部10は、検索サーバ1を統括的に制御する部分であり、ハードディスク1074に記憶された各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
通信I/F1040は、検索サーバ1が、通信ネットワーク3(図1)を介して端末4(図1)と情報を送受信する場合のネットワーク・アダプタである。通信I/F1040は、モデム、ケーブル・モデム及びイーサネット(登録商標)・アダプタを含んでよい。
BIOS1060は、検索サーバ1の起動時にCPU1010が実行するブートプログラムや、検索サーバ1のハードウェアに依存するプログラム等を記録する。
表示装置1022は、ブラウン管表示装置(CRT)、液晶表示装置(LCD)等のディスプレイ装置を含む。
I/Oコントローラ1070には、ハードディスク1074、光ディスクドライブ1076、及び半導体メモリ1078等の記憶装置である記憶部20を接続することができる。
入力装置1100は、検索サーバ1の管理者による入力の受け付けを行うものである。
ハードディスク1074は、本ハードウェアを検索サーバ1として機能させるための各種プログラム、本発明の機能を実行するプログラム及び後述するDBのテーブル及びレコードを記憶する。なお、検索サーバ1は、外部に別途設けたハードディスク(図示せず)を外部記憶装置として利用することもできる。
光ディスクドライブ1076としては、例えば、DVD−ROMドライブ、CD−ROMドライブ、DVD−RAMドライブ、CD−RAMドライブを使用することができる。この場合は各ドライブに対応した光ディスク1077を使用する。光ディスク1077から光ディスクドライブ1076によりプログラム又はデータを読み取り、I/Oコントローラ1070を介してメインメモリ1050又はハードディスク1074に提供することもできる。
なお、本発明でいうコンピュータとは、記憶装置、制御部等を備えた情報処理装置をいい、検索サーバ1は、記憶部20、制御部10等を備えた情報処理装置により構成され、この情報処理装置は、本発明のコンピュータの概念に含まれる。
[コンテンツサーバ2のハードウェア構成]
コンテンツサーバ2も、上述の検索サーバ1と同様な構成を持つ。なお、コンテンツサーバ2のみならず、検索サーバ1にも、コンテンツサーバ2と同様にWebページを記憶するコンテンツのDBを有してもよい。
[端末4のハードウェア構成]
端末4も、上述の検索サーバ1と同様な構成を持つ。例えば、記憶部20は、光ディスクドライブ1076に代えて外部メモリを挿入可能なドライブであってもよい。また、表示装置1022が、タッチパネルとして入力装置1100の機能を備えていてもよい。さらに、端末4が、加速度センサ等のセンサを備えて、そのセンサが、入力装置1100の機能を有してもよい。
[メイン処理のフローチャート]
図3は、本実施形態に係る検索サーバ1のインデキシング処理のフローチャートである。インデキシング処理は、例えば、検索サーバ1の管理者により決められた所定のタイミングで定期的に行う。
S1:制御部10(Webページ取得手段11)は、コンテンツサーバ2をクロールすることにより、Webページを取得する。そして、制御部10は、取得したWebページを、回収WebページDB26に記憶する。
S2:制御部10(Webページ解析手段12)は、Webページ解析処理を行う。具体的には、Webページ解析手段12は、回収WebページDB26に記憶されたWebページを解析して、デバイス情報に対応付けてデバイス判断DB22に格納されたデバイスワードを抽出する。
S3:制御部10は、Webページの特徴を示すページウェイトを算出する。ページウェイトは、例えば、当該WebページがリンクされているWebページの数であるリンクデータ数であり、通信ネットワーク3を介して接続された他の装置(図示せず)により算出されたものを受信して用いてもよい。
S4:制御部10(適合デバイス決定手段13)は、S2で抽出されたデバイスワードから、Webページに適合するデバイス情報を決定する。デバイス情報の決定は、デバイス判断DB22を用いる。
S5:制御部10(インデキシング記憶手段14)は、S4で決定したデバイス情報を、Webページのリンクデータと共にインデキシングDB24に記憶する。同様に、制御部10は、S3で算出したページウェイトを、Webページのリンクデータに対応付けて、インデキシングDB24に記憶する。
このことにより、検索サーバ1は、デバイス情報と、デバイスを特定可能なデバイスワードとを対応付けて記憶したデバイス判断DB22を用いることで、Webページに適合するデバイスを、Webページに含むデバイスワードを用いて決定することができる。
[デバイス判断DB22及びインデキシングDB24]
図4は、本実施形態に係る記憶部20に格納されるデバイス判断DB22及びインデキシングDB24を示す図である。デバイス判断DB22は、上述の図3のS2において、制御部10が、Webページからデバイスワードを抽出し、また、図3のS4において、デバイスワードからデバイス情報を決定するための判断に用いるDBである。また、インデキシングDB24は、上述の図3のS5でにおいて、制御部10がデバイス情報及びページウェイトを記憶するデータベースである。
図4(a)に一例を示すデバイス判断DB22は、デバイスワード22aと、適合デバイス22bとを対応付けて記憶する。適合デバイス22bには、デバイスワード22aに格納したデバイスワードに適合するデバイス情報を格納する。ここで、デバイスAは、iPhone5である。iPhone5は、例えば、専用のライブラリであるスタイルシートの「iui.css」やスクリプトの「iui.js」を用いる特徴がある。そのため、デバイスワード22aには、それぞれのデバイスに特有の情報として、参照ファイル名等のWebページのメタ情報に含むデバイスに関する所定の文字列を格納する。
その他として、携帯電話機8にWebページを表示するためのcHTML(compact HTML)で記述されたWebページのメタ情報に特有の文字列を、デバイスワード22aに格納することができる。デバイスワード22aに格納するものとしては、Webページのメタ情報に含むデバイスを特定できる文字列であれば、どのようなものであってもよい。
図4(b)に一例を示すインデキシングDB24は、ID24aをキー情報として、Webページの位置情報を示すURL(Uniform Resource Locator)24bと、URL24bにより特定されるWebページの特徴語24c、ページウェイト24d、適合デバイス24e及びデバイスワード24fとを記憶する。
URL24bは、Webページの位置情報であり、検索結果として出力するコンテンツのリンクデータとして利用する。また、URL24bは、回収WebページDBに格納されたWebページのインデックスとしても利用できる。
特徴語24cには、Webページに関する特徴を表す語句である特徴語を格納する。特徴語は、Webページのテキストデータを、例えば、形態素解析して、Webページに含まれる単語を抽出し、さらに各単語に対して、語句の出現頻度に基づく指標であるTF(Term Frequency)・IDF(Inverse Document Frequency)を用いて単語の重み付けを行うことで特定する。
ページウェイト24dには、Webページの特徴を示すページウェイトを格納する。例えば、ページウェイトが当該WebページがリンクされているWebページの数である場合、格納するページウェイトの値は、通信ネットワーク3を介して接続された他の装置により算出された値である。このページウェイト24dは、Webページのリンクデータの表示順序の決定のために用いられる。
適合デバイス24eには、Webページの閲覧に最適なデバイス情報を格納する。デバイスワード24fは、適合デバイス24eに格納したデバイス情報を決定付けたデバイスワードを格納する。
なお、本実施形態のページウェイト24dは、リンクデータ数を格納しているが、Webページのクリック数であるクリック履歴や、特徴語のスコア等を用いてもよい。また、ページウェイト24dは、上述のもの以外に、Webページに関する特徴を示す他の指標で代替してもよい。
[適合デバイスの決定例]
次に、適合デバイスの決定方法について説明する。図5は、本実施形態に係る適合デバイスの決定例を示す図である。
図5(a)は、iPhone5の表示画面30を示す。表示画面30には、5つのアイコン31が配置されている。アイコン31は、容量が2MB未満の画像である。iPhone5は、2MB(メガバイト)未満の容量の小さい画像のアイコンであるウェブクリップアイコンが並べられた画面を表示する、という特徴がある。また、図5(b)は、図5(a)を表示するためのプログラム40を示す。プログラム40は、Webページをテキストデータにした場合に表示できるメタ情報である。プログラム40には、「iui.css」と書かれたワード41と、「iui.js」と書かれたワード42とが示されている。
ここで、図4(a)のデバイス判断DB22を用いて、図5(b)を検討する。図5(b)のワード41には、図4(a)のデバイスワード22aが「iui.css」の行51が、図5(b)のワード42には、図4(a)のデバイスワード22aが「iui.js」の行52が、それぞれ該当する。そこで、図4(a)により、デバイスワード22aの該当の行に対応する適合デバイス22bは、いずれも「デバイスA」である。よって、図5に示す「http://www.abc.〜」のWebページは、適合デバイス24eは「デバイスA」(#1)になる。なお、デバイスワード24fには、抽出したデバイスワードのうちの1つである「iui.css」のみを格納しているが、抽出した複数のデバイスワードを記憶してもよい。
[検索処理のフローチャート]
次に、上述したデバイス情報を適用する検索処理について説明する。図6は、本実施形態に係る検索サーバ1での検索処理のフローチャートである。
S21:制御部10(受信手段15)は、端末4から検索キーワードを含む要求データを受信する。
S22:制御部10(デバイス検出手段16)は、要求データから端末4の機種に関するデバイス情報を検出する。デバイス情報の検出は、例えば、端末4から検索キーワードを含む要求データの設定情報により行うことができる。設定情報とは、例えば、iPhone5から送信された検索キーワードを含む要求データの場合には、ブラウザに関する情報をいう。iPhone5の場合は、使用するブラウザが特殊であるため、このブラウザに関する情報からデバイスを検出できる。これらのデバイスを検出するために用いる情報は、予め記憶部20に記憶されている。
S23:制御部10(検索手段17)は、受信した検索キーワードに基づき、キーワードを含むWebページを検索する。このWebページの検索には、回収WebページDB26に記憶されたWebページを用いることができる。
S24:制御部10(Webページ調整手段18)は、検索結果からリンクデータを並べる順番をインデキシングDB24を用いて調整する。この調整は、まず、検索結果として対象になったWebページのうち、デバイスが適合するWebページを、インデキシングDB24に基づき抽出する。そして、抽出したWebページのうち、インデキシングDB24のページウェイト24dに格納された値が大きいものから順番に出力する。例えば、ある同様の内容が掲載されたWebページについて、PC6用とiPhone5用の2つのWebページが用意されている場合を考える。このような場合に、デバイス情報を用いることで、iPhone5で検索した場合には、iPhone5用のWebページを検索結果として出力し、PC6用のWebページは検索結果として出力しないようにすることができる。
S25:制御部10は、調整結果に基づき、Webページのリンクデータを配置したコンテンツを作成する。この場合、図4(b)のURL24bの値を配置できる。
S26:制御部10(コンテンツ送信手段19)は、作成したコンテンツを、端末4に送信する。
このようにすることで、検索サーバ1は、検索キーワードによるWebページの検索において、Webページの特徴と、検索キーワードを送信した端末4のデバイスの適合性との両方を考慮し、しかも、特にデバイスを優先して、調整した検索結果を端末4に送信することができる。よって、端末4では、デバイスを考慮した検索結果を出力することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
(変形形態)
本実施形態では、デバイスをWebページのメタ情報に含む所定の文字列に基づき解析したが、所定の文字列として入力操作に関する装置の特徴を利用してもよい。例えば、加速度センサや、タッチパネルを用いたコンテンツを、各々の入力操作に関する装置を有する端末に送信することで、ユーザは、デバイスの特徴を利用するコンテンツ使用できる。
本実施形態では、要求データに含む環境情報からデバイスを検出するものであったが、デバイス判断DBを用いて要求データを解析してデバイスを検出してもよい。
本実施形態に係る検索システムの全体構成及び検索サーバの機能構成を示す図である。 本実施形態に係る検索サーバのハードウェア構成を示す図である。 本実施形態に係る検索サーバのインデキシング処理のフローチャートである。 本実施形態に係る記憶部に格納されるデバイス判断DB及びインデキシングDBを示す図である。 本実施形態に係る適合デバイス決定例を示す図である。 本実施形態に係る検索サーバでの検索処理のフローチャートである。
符号の説明
1 検索サーバ
2 コンテンツサーバ
4 端末
5 iPhone
6 PC
10 制御部
11 Webページ取得手段
12 Webページ解析手段
13 適合デバイス決定手段
14 インデキシング記憶手段
15 受信手段
16 デバイス検出手段
17 検索手段
18 Webページ調整手段
19 コンテンツ送信手段
20 記憶部
22 デバイス判断DB
24 インデキシングDB
26 回収WebページDB
100 検索システム

Claims (7)

  1. 端末に対して通信ネットワークを介して接続された検索サーバ装置であって、
    前記端末の機種に関するデバイス情報と、前記端末の機種を特定可能であって、所定のライブラリの参照を示す文字列、及び、ウェブクリップアイコンの使用を示す文字列のうち、少なくともひとつを含む、その端末の特徴に関する特有の文字列であるデバイスワードとを関連付けて記憶するデバイス判断記憶部と、
    検索の対象になるWebページを解析して前記Webページのメタ情報に含むデバイスに関する所定の文字列である前記デバイスワードを、前記デバイス判断記憶部に記憶された情報に基づき抽出するWebページ解析手段と、
    前記Webページ解析手段により抽出された前記デバイスワードから前記デバイス判断記憶部に記憶された情報を用いて、前記Webページに適合するデバイス情報を決定する適合デバイス決定手段と、
    前記適合デバイス決定手段により決定された前記デバイス情報を、前記デバイスワードを含んだWebページのリンクデータに対応付けて、前記Webページの特徴を示すページウェイトと共にインデキシング記憶部に記憶するインデキシング記憶手段と、
    検索キーワードを含む要求データを前記端末から受信する受信手段と、
    前記受信手段により受信した前記要求データに含まれる環境情報から、前記端末の前記デバイス情報を検出するデバイス検出手段と、
    前記受信手段により受信した前記検索キーワードに基づき、検索の対象になるWebページを記憶した回収Webページデータベースから前記検索キーワードを含むWebページを検索する検索手段と、
    前記検索手段により検索した前記Webページのうち前記デバイス検出手段により検出した前記デバイス情報に合致する複数のWebページを前記インデキシング記憶部から抽出し、抽出した前記複数のWebページの出力順をそのWebページに対応するページウェイトに応じて調整するWebページ調整手段と、
    前記Webページ調整手段による調整結果に基づき、抽出された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信手段と、
    を備える検索サーバ装置。
  2. 前記デバイス判断記憶部は、入力操作の特徴を含む前記端末の機種に関する前記デバイス情報と、Webページのメタ情報から得られる前記デバイスワードとを関連付けて記憶すること、
    を特徴とする請求項1に記載の検索サーバ装置。
  3. 前記Webページ調整手段において、抽出した前記複数のWebページの出力順をそのWebページに対応するページウェイトが高いものから順番に調整すること、
    を特徴とする請求項1又は請求項2に記載の検索サーバ装置。
  4. 前記インデキシング記憶部は、前記ページウェイトとして、前記Webページに対するクリック履歴、前記Webページに関するリンクデータの数、前記Webページの特徴を示す特徴語の出現度合いの少なくともいずれか1つを記憶すること、
    を特徴とする請求項1から請求項3のいずれか1項に記載の検索サーバ装置。
  5. 通信ネットワークを介して接続されたWebサーバを定期的に巡回して、前記検索の対象になるWebページを取得するWebページ取得手段を備えること、
    を特徴とする請求項1から請求項4のいずれか1項に記載の検索サーバ装置。
  6. 端末に対して通信ネットワークを介して接続されたコンピュータが行う検索方法であって、
    前記コンピュータは、前記端末の機種に関するデバイス情報と、前記端末の機種を特定可能であって、所定のライブラリの参照を示す文字列、及び、ウェブクリップアイコンの使用を示す文字列のうち、少なくともひとつを含む、その端末の特徴に関する特有の文字列であるデバイスワードとを関連付けて記憶するデバイス判断記憶部を備え、
    前記検索方法は、
    検索の対象になるWebページを解析して前記Webページのメタ情報に含むデバイスに関する所定の文字列である前記デバイスワードを、前記デバイス判断記憶部に記憶された情報に基づき抽出するWebページ解析ステップと、
    前記Webページ解析ステップにより抽出された前記デバイスワードから前記デバイス判断記憶部に記憶された情報を用いて、前記Webページに適合するデバイス情報を決定する適合デバイス決定ステップと、
    前記適合デバイス決定ステップにより決定された前記デバイス情報を、前記デバイスワードを含んだWebページのリンクデータに対応付けて、前記Webページの特徴を示すページウェイトと共にインデキシング記憶部に記憶するインデキシング記憶ステップと、 検索キーワードを含む要求データを前記端末から受信する受信ステップと、
    前記受信ステップにより受信した前記要求データに含まれる環境情報から、前記端末の前記デバイス情報を検出するデバイス検出ステップと、
    前記受信ステップにより受信した前記検索キーワードに基づき、検索の対象になるWebページを記憶した回収Webページデータベースから前記検索キーワードを含むWebページを検索する検索ステップと、
    前記検索ステップにより検索した前記Webページのうち前記デバイス検出ステップにより検出した前記デバイス情報に合致する複数のWebページを前記インデキシング記憶部から抽出し、抽出した前記複数のWebページの出力順をそのWebページに対応するページウェイトに応じて調整するWebページ調整ステップと、
    前記Webページ調整ステップによる調整結果に基づき、抽出された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信ステップと、
    を含む検索方法。
  7. 端末に対して通信ネットワークを介して接続され、前記端末の機種に関するデバイス情報と前記端末の機種を特定可能であって、所定のライブラリの参照を示す文字列、及び、ウェブクリップアイコンの使用を示す文字列のうち、少なくともひとつを含む、その端末の特徴に関する特有の文字列であるデバイスワードとを関連付けてデバイス判断記憶部に記憶したコンピュータに、
    検索の対象になるWebページを解析して前記Webページのメタ情報に含むデバイスに関する所定の文字列である前記デバイスワードを、前記デバイス判断記憶部に記憶された情報に基づき抽出するWebページ解析ステップと、
    前記Webページ解析ステップにより抽出された前記デバイスワードから前記デバイス判断記憶部に記憶された情報を用いて、前記Webページに適合するデバイス情報を決定する適合デバイス決定ステップと、
    前記適合デバイス決定ステップにより決定された前記デバイス情報を、前記デバイスワードを含んだWebページのリンクデータに対応付けて、前記Webページの特徴を示すページウェイトと共にインデキシング記憶部に記憶するインデキシング記憶ステップと、
    検索キーワードを含む要求データを前記端末から受信する受信ステップと、
    前記受信ステップにより受信した前記要求データに含まれる環境情報から、前記端末の前記デバイス情報を検出するデバイス検出ステップと、
    前記受信ステップにより受信した前記検索キーワードに基づき、検索の対象になるWebページを記憶した回収Webページデータベースから前記検索キーワードを含むWebページを検索する検索ステップと、
    前記検索ステップにより検索した前記Webページのうち前記デバイス検出ステップにより検出した前記デバイス情報に合致する複数のWebページを前記インデキシング記憶部から抽出し、抽出した前記複数のWebページの出力順をそのWebページに対応するページウェイトに応じて調整するWebページ調整ステップと、
    前記Webページ調整ステップによる調整結果に基づき、抽出された前記Webページのリンクデータを含むコンテンツを、前記端末に送信する送信ステップと、
    を実行させるための検索プログラム。
JP2008252898A 2008-09-30 2008-09-30 検索サーバ装置、検索方法及びプログラム Expired - Fee Related JP5108707B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008252898A JP5108707B2 (ja) 2008-09-30 2008-09-30 検索サーバ装置、検索方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008252898A JP5108707B2 (ja) 2008-09-30 2008-09-30 検索サーバ装置、検索方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2010086180A JP2010086180A (ja) 2010-04-15
JP5108707B2 true JP5108707B2 (ja) 2012-12-26

Family

ID=42250097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008252898A Expired - Fee Related JP5108707B2 (ja) 2008-09-30 2008-09-30 検索サーバ装置、検索方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5108707B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111552879B (zh) * 2020-04-29 2023-10-03 百度在线网络技术(北京)有限公司 数据处理的方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140257A (ja) * 2000-10-31 2002-05-17 Nippon Telegr & Teleph Corp <Ntt> コンテンツ判定方法
JP2004272492A (ja) * 2003-03-07 2004-09-30 Hitachi Software Eng Co Ltd Webサイトの検索表示方法
JP4278050B2 (ja) * 2004-01-30 2009-06-10 ソフトバンクモバイル株式会社 検索装置及び情報提供システム
US20060288015A1 (en) * 2005-06-15 2006-12-21 Schirripa Steven R Electronic content classification
US7653617B2 (en) * 2005-08-29 2010-01-26 Google Inc. Mobile sitemaps

Also Published As

Publication number Publication date
JP2010086180A (ja) 2010-04-15

Similar Documents

Publication Publication Date Title
US8452793B2 (en) Query refinement based on user selections
US8458207B2 (en) Using anchor text to provide context
US9355185B2 (en) Infinite browse
US7516118B1 (en) Methods and systems for assisted network browsing
US8560964B2 (en) Method and system for predictive browsing
JP4848388B2 (ja) 検索クエリに関するスコアを算出する方法
US9223895B2 (en) System and method for contextual commands in a search results page
US20040254935A1 (en) Method and apparatus for automatic consolidation of personalized dynamic data
US20100179876A1 (en) Computer-accessible medium, method and system for assisting in navigating the internet
JP5379978B2 (ja) 検索システム及び検索方法
US8275766B2 (en) Systems and methods for detecting network resource interaction and improved search result reporting
CZ20011380A3 (cs) Více-cílové odkazy pro navigaci mezi hypertextovými dokumenty a podobně
JP2006065395A (ja) ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム
KR20120120459A (ko) 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색 시스템
KR20090003739A (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
TWI417751B (zh) Information providing device, information providing method, information application program, and information recording medium
US20130091415A1 (en) Systems and methods for invisible area detection and contextualization
US20090089245A1 (en) System and method for contextual commands in a search results page
JP4963619B2 (ja) 情報検索システム、情報検索装置、検索結果画面情報生成方法及び検索結果画面情報生成処理プログラム
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
JP5108707B2 (ja) 検索サーバ装置、検索方法及びプログラム
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP2008046879A (ja) ページ表示装置、ページ表示方法、およびコンピュータプログラム
KR100966211B1 (ko) 검색 옵션 레이어를 이용한 검색 방법 및 시스템
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120309

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120316

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120515

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121002

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121005

R150 Certificate of patent or registration of utility model

Ref document number: 5108707

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees