JP5381659B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP5381659B2
JP5381659B2 JP2009272630A JP2009272630A JP5381659B2 JP 5381659 B2 JP5381659 B2 JP 5381659B2 JP 2009272630 A JP2009272630 A JP 2009272630A JP 2009272630 A JP2009272630 A JP 2009272630A JP 5381659 B2 JP5381659 B2 JP 5381659B2
Authority
JP
Japan
Prior art keywords
web page
page
specific type
received data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009272630A
Other languages
English (en)
Other versions
JP2011118454A (ja
Inventor
牧人 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Mobile Communications Ltd
Original Assignee
Fujitsu Mobile Communications Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Mobile Communications Ltd filed Critical Fujitsu Mobile Communications Ltd
Priority to JP2009272630A priority Critical patent/JP5381659B2/ja
Priority to CN2010101356903A priority patent/CN102081639B/zh
Priority to US12/724,697 priority patent/US20110131405A1/en
Publication of JP2011118454A publication Critical patent/JP2011118454A/ja
Application granted granted Critical
Publication of JP5381659B2 publication Critical patent/JP5381659B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/51Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems at application loading time, e.g. accepting, rejecting, starting or inhibiting executable software based on integrity or source reliability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2149Restricted operating environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webページの閲覧時における付加サービスに関する。
近年、Webページの閲覧時における付加サービスが提案されている。例えば、閲覧中のWebページの関連Webページであって、かつ、ユーザの指示(興味、検索方向性)に合致するWebページへのリンクを表示するサービス提供システム(以下、関心連鎖システムと称する)が検討されている。関心連鎖システムによれば、ユーザの興味、関心を喚起するようなWebページを推奨できるので、Webブラウジングにおける利便性の向上が期待できる。特に、関心連鎖システムは、ユーザの興味、関心の強いWebページを取得するために必要とされる操作数を削減できるので、ユーザインタフェースの比較的乏しい情報処理端末(例えば、携帯デバイス)に好適である。しかしながら、関心連鎖システムは、推奨するWebページを取得するために、閲覧中のWebページから抽出したキーワードを検索サイトに送信し、検索結果を取得する必要がある。故に、秘匿されるべきWebページからキーワードが抽出され、外部に流出する事態が想定される。
特許文献1の履歴情報表示装置は、操作部に関するログを記録する。上記履歴情報表示装置に対して手動によりログ除外指定を設定することが可能である。このログ除外指定に合致する情報は、上記履歴情報表示装置の記録対象から除外される。
特許文献2の検索装置は、検索結果に不正なコンテンツについての情報が含まれないように、クローリングを実行する。具体的には、上記検索装置は、コンテンツ提供ルールに従っていない情報をクローリングの対象から除外している。
特開2008−117152号公報 特開2005−301759号公報
特許文献1の履歴情報表示装置は、手動により設定されるログ除外指定に基づき、情報のフィルタリングが可能である。しかしながら、ログ除外指定を手動で設定することは煩雑であるため、ユーザの利便性を損なう。
特許文献2の検索装置は、不正なコンテンツについての情報をサーバ側においてフィルタリングする。仮に、この特許文献2記載の技術を関心連鎖システムの一部(検索サイト)に応用したとしても、秘匿されるべきWebページから抽出されたキーワードが外部に流出する事態の抑制には役立たない。
従って、本発明は、Webページの閲覧時における付加サービスを安全かつ快適に利用するための情報処理装置を提供することを目的とする。
本発明の一態様に係る情報処理装置は、ブラウザによって表示されるWebページの遷移を監視する監視部と、前記ブラウザによって表示されるWebページが遷移すると、現行のWebページが暗号化されたWebページとアクセス時にパスワードを要求するWebページから遷移したWebページとイントラネットから取得したWebページのうち少なくとも1つを含む特定種別のページであるか否かを判定する判定部と、前記現行のWebページが前記特定種別のページでないならば前記現行のWebページから特徴量を抽出する抽出部と、前記特徴量を用いて、前記現行のWebページに関して付加サービスを提供する提供部とを具備する。
本発明の他の態様に係る情報処理装置は、受信データがWebページであるならば、前記受信データが暗号化されたWebページとアクセス時にパスワードを要求するWebページから遷移したWebページとイントラネットから取得したWebページのうち少なくとも1つを含む特定種別のページであるか否かを判定する判定部と、前記受信データがWebページであって、かつ、前記特定種別のページでないならば、前記受信データを解析して現行のWebページを生成するパーサーと、前記現行のWebページから特徴量を抽出する抽出部と、前記特徴量を用いて、前記現行のWebページに関して付加サービスを提供する提供部とを具備する。

本発明によれば、Webページの閲覧時における付加サービスを安全かつ快適に利用するための情報処理装置を提供できる。
第1の実施形態に係る情報処理装置を示すブロック図。 図1の関心連鎖エンジンの動作の一部を示すフローチャート。 図1の関心連鎖エンジンの動作の全体を示すフローチャート。 第2の実施形態に係る情報処理装置を示すブロック図。 図4のページ種別判定部の動作を示すフローチャート。 図4の関心連鎖エンジンの動作を示すフローチャート。
以下、図面を参照して、本発明の実施形態について説明する。
(第1の実施形態)
図1に示すように、本発明の第1の実施形態に係る情報処理装置100は、ブラウザ110、関心連鎖エンジン120及び通信部130を備える。情報処理装置100は、携帯電話機、PC、ポータブルメディアプレーヤ、ビデオゲーム機、TVなどのWebページの閲覧に利用可能な任意の装置によって構成される。尚、図示されていないものの、情報処理装置100は、プロセッサ、メモリ、ディスプレイなどの基本的なハードウェア構成を有している。
ブラウザ110は、情報処理装置100にインストールされているソフトウェアモジュールである。ブラウザ110は、Internet Explorer(登録商標)、Internet Explorer Mobile、Fire Fox(登録商標)、Opera(登録商標)などに代表される一般的なWebブラウザによって構成可能である。ブラウザ110は、一般的なブラウザと同等または類似の機能を備えている。例えば、ブラウザ110は、ユーザが閲覧を希望するWebページのURL(Uniform Resource Locator)を受け付けたり、指定されたURLのWebページのソースデータをインターネット、イントラネット、ローカルファイルなどを介して取得したりする。また、ブラウザ110は、取得したソースデータを解釈し、文字、画像などを整理して画面上に表示する。また、ブラウザ110は、自己の機能またはデータの一部を他のアプリケーションに利用させたり、自己の状態を他のアプリケーションに通知したりするためのインタフェースを外部に提供してもよい。
関心連鎖エンジン120は、情報処理装置100にインストールされているソフトウェアモジュールである。関心連鎖エンジン120は、閲覧中のWebページの関連Webページへのリンク情報を含む関連情報をユーザに提供する。尚、関心連鎖エンジン120は、その他の付加サービス提供エンジンに置き換えられてもよい。この付加サービス提供エンジンは、閲覧中のWebページの特徴量を利用して任意の付加サービスを提供する。
関心連鎖エンジン120は、ブラウザ動作監視部121、ページ種別判定部122、キーワード抽出部123、操作受理UI(ユーザインタフェース)124、関連情報作成部125及び結果表示UI126を含む。
ブラウザ動作監視部121は、ブラウザ110によって表示されるWebページの遷移(移動)を監視する。例えば、ブラウザ動作監視部121は、ブラウザ110から提供されるインタフェースを利用して、Webページの遷移の通知を受信するためのコールバックを予め登録しておく。ブラウザ動作監視部121が、Webページの遷移を検知すると、ページ種別判定部122が動作を開始する。
ページ種別判定部122は、ブラウザ110によって表示されるWebページが遷移すると、遷移先のWebページ(以下、現行のWebページと称する)が特定種別のページであるか否かを判定する。例えば、ページ種別判定部122は、ブラウザ110から提供されるインタフェースを利用して現行のWebページを取得し、上記特定種別のページであるか否かを判定する。ページ種別判定部122が現行のWebページは特定種別のページでないと判定すると、キーワード抽出部123にキーワード抽出要求を送信する。尚、ページ種別判定部122の判定処理の詳細、特定種別のページの詳細は後述される。
キーワード抽出部123は、現行のWebページのソースデータからキーワードなどの特徴量を抽出する。例えば、キーワード抽出部123は、ブラウザ110から提供されるインタフェースを利用して現行のWebページのソースデータを取得する。尚、特徴量の抽出には、種々の手法が適用可能である。また、特徴量はキーワードに限られず画像の特徴量、音声の特徴量などであってもよいが、簡単化のために以下の説明において特徴量はキーワードを指すものとする。キーワード抽出部123がキーワードの抽出を完了すると、その通知を操作受理UI124へ行う。
操作受理UI124は、関連情報の作成に関するユーザの指示操作を受理する。例えば、操作受理UI124は、ブラウザ110の画面上に指示操作の選択肢を示すGUI部品(ボタン、アイコン、ソフトキーなど)を表示する。操作受理UI124が受理する指示操作は、例えばユーザが希望する関連情報のジャンル(ニュース、買い物、写真など)の選択である。操作受理UI124は、受理した指示操作を関連情報作成部125に送る。尚、このようなGUI部品は、キーワード抽出部123の通知を受信した後に表示されてもよいし、当初は非アクティブな状態で表示されていて上記通知を受信してからアクティブな状態に変化してもよい。
関連情報作成部125は、操作受理UI124によって受理された指示操作と、キーワード抽出部123によって抽出されたキーワードとに基づいて、適切な検索サイト20に対する検索クエリを生成する。検索サイト20は、Webブラウジングにおいて一般的に利用される任意の検索サイトを指す。検索サイト20は、ユーザによって選択された特定の1つまたは複数の検索サイトであってもよいし、予め定められる1つまたは複数の検索サイトであってもよい。例えば、関連情報作成部125は、操作受理UI124によって受理され得る指示操作と、対応する検索サイトのURLとを予め保持しておき、実際に受理された指示操作に対応する検索サイトに対して上記キーワードの検索を要求する検索クエリを生成する。関連情報作成部125は、生成した検索クエリを通信部130に送信する。
そして、関連情報作成部125は、通信部130を介して上記検索クエリに対応する検索結果を取得する。関連情報作成部125は、検索結果を解析し、適切な関連Webページを選択する。関連情報作成部125は、選択した関連Webページへのリンク情報を含む関連情報を所定のルールに従って抽出し、結果表示UI126に入力する。例えば、関連情報は、関連Webページへのリンク情報だけでなく、関連Webページの説明文、タイトル、要約文、サムネイルなどを含んでもよい。
結果表示UI126は、関連情報作成部125からの関連情報を表示する。例えば、結果表示UI126は、関連Webページへのリンクを選択可能な形式で、ブラウザ110の画面上に関連情報を表示する。ユーザがクリック、タッチ入力などにより関連情報の選択を確定すると、対応する関連WebページのURLがブラウザ110に送信される。そして、ブラウザ110が関連Webページを取得、表示する。
通信部130は、インターネット、イントラネットなどのネットワーク10へ情報を送信したり、ネットワーク10から情報を受信したりする。特に、通信部130は、ブラウザ110に指定されたURLのWebページを受信したり、関連情報作成部125からの検索クエリをネットワーク10を介して検索サイト20に送信したりする。通信部130は、無線LAN、有線LAN、赤外線通信、近距離無線通信(Bluetooth(登録商標)など)、USB(Universal Serial Bus)を介した通信などの種々の通信機能をサポートしてよい。
以下、図2を用いて、関心連鎖エンジン120の動作の一部である関心連鎖処理を説明する。この関心連鎖処理は、関心連鎖エンジン120の一部であるキーワード抽出部123、操作受理UI(ユーザインタフェース)124、関連情報作成部125及び結果表示UI126によって行われる。
関心連鎖処理が開始すると、キーワード抽出部123は、現行のWebページからキーワードを抽出する(ステップS201)。キーワード抽出部123は、キーワードの抽出の完了を示す通知を操作受理UI124へ送信し、操作受理UI124を起動する(ステップS202)。操作受理UI124は、ユーザからの指示操作を受理する(ステップS203)。
関連情報作成部125は、ステップS201において抽出されたキーワードと、ステップS203において受理された指示操作とに基づいて検索クエリを生成し、通信部130を介して検索サイト20へ送信する(ステップS204)。関連情報作成部125は、ステップS204において送信した検索クエリに対する検索結果を通信部130を介して取得する(ステップS205)。関連情報作成部125は、ステップS205において取得した検索結果に基づいて関連情報を作成し、結果表示UI126はこの関連情報をブラウザ110の画面などに表示し(ステップS206)、関心連鎖処理が完了する。
以下、図3を用いて、関心連鎖エンジン120の全体の動作を説明する。尚、一例として、図3の処理は、ブラウザ110によって表示されるWebページが遷移する度に開始される。
ブラウザ110によるWebブラウジングの間、Webページがブラウザ110によって取得され、表示される(ステップS301)。ブラウザ動作監視部121は、ブラウザ110によって取得及び表示されるWebページの遷移を検知する。ブラウザ動作監視部121がWebページの遷移を検知すると、ページ種別判定部122はブラウザ110から現行のWebページの情報を取得する(ステップS302)。
ページ種別判定部122は、ステップS302において取得した情報に基づいて、現行のWebページが特定種別のページであるか否かを判定する(ステップS303)。現行のWebページが特定種別のページでなければ、処理はステップS200に進む。ステップS200における関心連鎖処理は、図2に示す処理である。一方、現行のWebページが特定種別のページであれば、現行のWebページに対する関心連鎖処理(ステップS200)が省略され、処理は終了する。尚、ステップS200における関心連鎖処理は、現行のWebページの特徴量を利用して付加サービスを提供するための任意の付加サービス提供処理に置き換えられてよい。
ここで、ページ種別判定部122の判定処理の詳細、特定種別のページの詳細を説明する。
特定種別のページは、秘匿されるべきWebページの種別を指す。特定種別のページは、予め定義されている。ページ種別判定部122は、現行のWebページが、各種別の判定基準に合致するか否かを検査することにより、判定結果を得る。
暗号化されたWebページ(以下、便宜的に第1の特定種別のページとも称する)が、特定種別のページの一つとして定義されてよい。第1の特定種別のページは、ユーザの個人情報、秘密情報などを含んでいる可能性が高いため、秘匿されるべきである。例えば、ページ種別判定部122は、現行のWebページのURLをブラウザ110から提供されるインタフェースから取得し、当該URLが「https://」から開始されているか否かを判定基準として利用することにより、現行のWebページが第1の特定種別のページであるか否かを判定できる。また、ページ種別判定部122は、現行のWebページを受信するために使用されたポート番号をブラウザ110から提供されるインタフェースから取得し、当該ポート番号が「443」であるか否かを判定基準として利用することにより、現行のWebページが第1の特定種別のページであるか否かを判定できる。また、ページ種別判定部122は、現行のWebページを解読するためにブラウザ110が暗号化アルゴリズムに基づく復号化処理を行ったか否かを示す情報をブラウザ110から提供されるインタフェースから取得し、この情報を判定基準として利用することにより、現行のWebページが第1の特定種別のページであるか否かを判定できる。
また、アクセス時にパスワードを要求するWebページ(以下、便宜的に第2の特定種別のページとも称する)が、特定種別のページの一つとして定義されてよい。第2の特定種別のページは、提供者が認証されたユーザにのみ閲覧許可されることを意図している可能性が高いため、秘匿されるべきである。ページ種別判定部122は、現行のWebページがBASIC認証、Digest認証などを要求したか否かの情報をブラウザ110から提供されるインタフェースから取得し、この情報を判定基準として利用することにより、現行のWebページが第2の特定種別のページであるか否かを判定できる。
また、アクセス時にパスワードを要求するWebページから遷移したWebページ(以下、便宜的に第3の特定種別のページとも称する)が、特定種別のページの一つとして定義されてよい。第3の特定種別のページは、会員専用のサイト、個人用スペースなどのユーザのプライベートなWebページである可能性が高く、ユーザの個人情報、秘密情報などを含んでいる可能性も高いため、秘匿されるべきである。例えば、ブラウザ110は、ユーザの操作に基づいて現行のWebページへ遷移する直前のWebページにおいて、例えばパスワード入力専用のテキストボックスなどのフォームにパスワードが入力された(認証が要求された)か否かを示す情報を保存し、この直前のWebページにおける認証が成功して現行のWebページへの遷移が生じたことを外部に公開するためのインタフェースを提供している可能性がある。ブラウザ110がこのようなインタフェースを提供していれば、ページ種別判定部122は、現行のWebページの直前のWebページにおいて認証が要求されたか否かを示す情報を上記インタフェースから取得し、この情報を判定基準として利用することにより、現行のWebページが第3の特定種別のページであるか否かを判定できる。また、例えば、ブラウザ110は、自己のCookieを取得し、外部に公開するためのインタフェースを提供している可能性がある。ブラウザ110がこのようなインタフェースを提供していれば、ページ種別判定部122は、ブラウザ110のCookieを上記インタフェースから取得し、当該Cookieに基づいて現行のWebページがパスワードを要求するWebページであるか否かを検査できる。ページ種別判定部122は、このCookieに基づく検査結果を判定基準として利用することにより、現行のWebページが第3の特定種別のページであるか否かを判定できる。このCookieに基づく検査結果を判定基準として利用すれば、パスワード入力を要求されたWebページの直後に遷移したWebページのみならず、例えば会員専用のページから更に遷移したプライベートなページも第3の特定種別のページとして判定される。
また、イントラネットから取得したWebページ(以下、便宜的に第4の特定種別のページとも称する)が、特定種別のページの一つとして定義されてよい。第4の特定種別のページは、限られたユーザにのみ閲覧が許可されている可能性が高いため、秘匿されるべきである。ページ種別判定部122は、現行のWebページのURLをブラウザ110から提供されるインタフェースから取得し、当該URLが「\\」から開始されているか否かなどを判定基準として利用することにより、現行のWebページが第4の特定種別のページであるか否かを判定できる。
以上のような特定種別のページを、キーワード抽出の対象から除外することにより、秘匿されるべきWebページから抽出されたキーワードが外部に流出する事態が抑制される。しかしながら、特定種別のページと判定されるWebページの一部は、キーワード抽出の対象となってもあまり問題とならないかもしれない。例えば、会員制のサイトにおけるニュース用のWebページは、前述の第2の特定種別のページまたは第3の特定種別のページとして判定されるかもしれないが、その内容が世の中に広く公開されていたり、ユーザがその関連情報を希望したりする可能性がある。このような適用除外としてもよいWebページを個別に指定可能とすることは、ユーザの利便性向上に有用である。具体的には、ページ種別判定部122からアクセス可能な記憶部において、いわゆるホワイトリストが定義されてよい。ホワイトリストには、例えば、適用除外となる指定WebページのURLの一部または全部などが記載される。ホワイトリストの内容は、ユーザが設定してもよいし、関心連鎖エンジン120に対応するソフトウェアモジュールまたは情報処理装置100の設計者、製造者、販売者などが設定してもよい。ページ種別判定部122は、現行のWebページが上記指定Webページであるならば、たとえ現行のWebページを特定種別のページと判定していたとしても、キーワード抽出部123にキーワード抽出要求を送信する。或いは、ページ種別判定部122は、特定種別のページの判定処理の前に、現行のWebページが指定Webページであるか否かを判定し、現行のWebページが指定Webページであるならば、特定種別のページの判定処理を省略し、キーワード抽出部123にキーワード抽出要求を送信してもよい。
以上説明したように、本実施形態に係る情報処理装置は、現行のWebページから特徴量を抽出するよりも前に、現行のWebページが特定種別のWebページであるか否かを判定している。そして、現行のWebページが特定種別のWebページであるならば、特徴量の抽出が省略される。従って、本実施形態に係る情報処理装置によれば、秘匿されるべきWebページから特徴量が抽出され、外部に流出する事態が抑制される。また、本実施形態に係る情報処理装置によれば、秘匿されるべきWebページから抽出された特徴量(例えば、ユーザの個人情報)に基づいて付加サービスが提供され、ユーザに不快感を与える事態も抑制される。また、本実施形態に係る情報処理装置によれば、現行のWebページが秘匿されるべきWebページである場合に、特徴量を抽出するための計算コスト、検索クエリを外部へ送信するための通信コストなどの不要なコストを排除できる。
(第2の実施形態)
図4に示すように、本発明の第2の実施形態に係る情報処理装置400は、ブラウザ110、関心連鎖エンジン420及び通信部430を有する。情報処理装置400は、携帯電話機、PC、ポータブルメディアプレーヤ、ビデオゲーム機、TVなどのWebページの閲覧に利用可能な任意の装置によって構成される。尚、図示されていないものの、情報処理装置400は、プロセッサ、メモリ、ディスプレイなどの基本的なハードウェア構成を有している。以下の説明では、図4において図1と同一部分には同一符号を付して示し、異なる部分を中心に述べる。
通信部430は、図1の通信部130と同等または類似の機能を有するが、ページ種別判定部431を含む。ページ種別判定部431は、情報処理装置400または通信部430にインストールされているソフトウェアモジュールである。
ページ種別判定部431は、ネットワーク10を介して通信部430によって受信されたデータ(以下、単に受信データと称する)がWebページであるならば、受信データが特定種別のページであるか否かを判定する。尚、受信データがWebページであるか否かの判定は、ページ種別判定部431によって行われてもよいし、通信部430に含まれる図示しない機能部によって行われてもよい。以降の説明では、ページ種別判定部431が、受信データがWebページであるか否かも判定するものとする。
ページ種別判定部431は、受信データが特定種別のページでないならば、受信データを関心連鎖エンジン420に入力する。尚、本例において、ページ種別判定部431は、受信データが特定種別のページであるか否かに関わらず、受信データをブラウザ110に入力する。但し、受信データがWebページであるか否かの判定をページ種別判定部431以外の機能部が行う場合には、当該機能部は受信データがWebページであればブラウザ110に入力する。
関心連鎖エンジン420は、キーワード抽出部423、操作受理UI124、関連情報作成部125、結果表示UI126及びパーサー427を含む。パーサー427は、ページ種別判定部431からの受信データを解析して現行のWebページを生成する。
キーワード抽出部423は、前述のキーワード抽出部123と同様に、現行のWebページのソースデータからキーワードを抽出する。例えば、キーワード抽出部423は、パーサー427から現行のWebページのソースデータを取得する。キーワード抽出部423がキーワードの抽出を完了すると、その通知を操作受理UI124へ行う。尚、キーワード抽出部423はパーサー427から現行のWebページのソースデータを取得可能なので、ブラウザ110はWebページのソースデータを外部に利用させるためのインタフェースをキーワード抽出部423に提供しなくてもよい。
以下、図5を用いて、ページ種別判定部431の動作を説明する。
まず、ページ種別判定部431は、通信部430によって受信された受信データを取得する(ステップS501)。ページ種別判定部531は、ステップS501において取得した受信データがWebページであるか否かを判定する(ステップS502)。ステップS502において、受信データがWebページと判定されるならば処理はステップS503へ進み、そうでなければ処理は終了する。尚、ページ種別判定部423の判定処理の詳細は後述される。
ステップS503において、ページ種別判定部431は、ステップS501において取得した受信データが特定種別のページであるか否かを判定する。ステップS503において、受信データが特定種別のページと判定されれば処理はステップS505に進み、そうでなければ処理はステップS504へ進む。
ステップS504において、ページ種別判定部431は、ステップS501において取得した受信データを関心連鎖エンジン420へ入力し、処理はステップS505へ進む。ステップS505において、ページ種別判定部431は、ステップS501において取得した受信データをブラウザ110へ入力し、処理は終了する。
以上のようなページ種別判定部431の動作の結果、受信データがWebページであって、かつ、特定種別のページであるならば、当該受信データはブラウザ110には入力されるものの、関心連鎖エンジン420には入力されない。一方、受信データがWebページであって、かつ、特定種別のページでないならば、当該受信データはブラウザ110及び関心連鎖エンジン420の両方に入力される。
以下、図6を用いて、関心連鎖エンジン420の動作を説明する。
まず、関心連鎖エンジン420内のパーサー427は、ページ種別判定部431から受信データを取得する(ステップS601)。尚、前述の通り、この受信データは、Webページであって、かつ、特定種別のページでない。パーサー427は、ステップS601において取得した受信データを解析し、現行のWebページを生成する(ステップS602)。
キーワード抽出部423、操作受理UI124、関連情報作成部125及び結果表示UI126は、ステップS602において生成された現行のWebページに対して関心連鎖処理を行う(ステップS200)。ステップS200における関心連鎖処理は、図2に示す処理であってもよいし、現行のWebページの特徴量を利用して付加サービスを提供するための任意の付加サービス提供処理に置き換えられもてよい。
ここで、ページ種別判定部431の判定処理の詳細を、ページ種別判定部122と異なる部分を中心に説明する。
ページ種別判定部431は、受信データが前述の第1の特定種別のページであるか否かを判定できる。例えば、ページ種別判定部431は、受信データのURLを通信部430から取得し、当該URLが「https://」から開始されているか否かを判定基準として利用することにより、受信データが第1の特定種別のページであるか否かを判定できる。また、ページ種別判定部431は、受信データのために使用されたポート番号を通信部430から取得し、当該ポート番号が「443」であるか否かを判定基準として利用することにより、受信データが第1の特定種別のページであるか否かを判定できる。
また、ページ種別判定部431は、受信データが前述の第2の特定種別のページであるか否かを判定できる。例えば、ページ種別判定部431は、受信データのHTTPヘッダを通信部430から取得し、当該HTTPヘッダを解析する。そして、ページ種別判定部431は、このHTTPヘッダのレスポンスコードに「401」が設定されているか否かを判定基準として利用することにより、受信データが第2の特定種別のページであるか否かを判定できる。
また、ページ種別判定部431は、受信データが前述の第3の特定種別のページであるか否かを判定できる。例えば、ブラウザ110は、自己のCookieを取得し、外部に公開するためのインタフェースを提供している可能性がある。ブラウザ110がこのようなインタフェースを提供していれば、ページ種別判定部431は、ブラウザ110のCookieを上記インタフェースから取得し、当該Cookieに基づいて現行のWebページがパスワードを要求するWebページであるか否かを検査できる。ページ種別判定部431は、このCookieに基づく検査結果を判定基準として利用することにより、受信データが第3の特定種別のページであるか否かを判定できる。このCookieに基づく検査結果を判定基準として利用すれば、パスワード入力を要求されたWebページの直後に遷移したWebページのみならず、例えば会員専用のページから更に遷移したプライベートなページ(を表す受信データ)も第3の特定種別のページとして判定される。
また、ページ種別判定部431は、受信データが前述の第4の特定種別のページであるか否かを判定できる。例えば、ページ種別判定部431は、受信データの送信元のIPドレスを通信部430から取得し、当該IPアドレスがグローバルIPアドレスであるか否かを判定基準として利用することにより、受信データが第4の特定種別のページであるか否かを判定できる(IPアドレスがグローバルIPアドレスであれば、ページ種別判定部431は受信データが第4の特定種別のページでないと判定する)。
尚、ページ種別判定部431からアクセス可能な記憶部において、前述のホワイトリストが定義されてもよい。ホワイトリストの内容は、ユーザが設定してもよいし、ページ種別判定部431に相当するソフトウェアモジュール、通信部430または情報処理装置400の設計者、製造者、販売者などが設定してもよい。ページ種別判定部431は、受信データが上記指定Webページであるならば、たとえ受信データを特定種別のページと判定していたとしても、関心連鎖エンジン420に受信データを入力する。或いは、ページ種別判定部431は、特定種別のページの判定処理の前に、受信データが指定Webページであるか否かを判定し、受信データが指定Webページであるならば、特定種別のページの判定処理を省略し、関心連鎖エンジン420に受信データを入力してもよい。
以上説明したように、本実施形態に係る情報処理装置は、受信データを解析して生成される現行のWebページから特徴量を抽出するよりも前に、受信データが特定種別のWebページであるか否かを判定している。そして、受信データが特定種別のWebページであるならば、特徴量の抽出が省略される。従って、本実施形態に係る情報処理装置によれば、秘匿されるべきWebページから特徴量が抽出され、外部に流出する事態が抑制される。また、本実施形態に係る情報処理装置によれば、秘匿されるべきWebページから抽出された特徴量(例えば、ユーザの個人情報)に基づいて付加サービスが提供され、ユーザに不快感を与える事態も抑制される。また、本実施形態に係る情報処理装置によれば、現行のWebページが秘匿されるべきWebページである場合に、特徴量を抽出するための計算コスト、検索クエリを外部へ送信するための通信コストなどの不要なコストを排除できる。また、本実施形態に係る情報処理装置は、基本的にブラウザから情報を取得することなく特定種別のページの判定を実現しているので、ブラウザが特定のインタフェースを外部に提供していない場合にも有用である。
尚、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
例えば、上記した各実施形態の処理を実現するプログラムを、コンピュータで読み取り可能な記憶媒体に格納して提供することも可能である。記憶媒体としては、磁気ディスク、光ディスク(CD−ROM、CD−R、DVD等)、光磁気ディスク(MO等)、半導体メモリなど、プログラムを記憶でき、かつ、コンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。
また、上記した各実施形態の処理を実現するプログラムを、インターネットなどのネットワークに接続されたコンピュータ(サーバ)上に格納し、ネットワーク経由でコンピュータ(クライアント)にダウンロードさせてもよい。
10・・・ネットワーク
20・・・検索サイト
100・・・情報処理装置
110・・・ブラウザ
120・・・関心連鎖エンジン
121・・・ブラウザ動作監視部
122・・・ページ種別判定部
123・・・キーワード抽出部
124・・・操作受理UI
125・・・関連情報作成部
126・・・結果表示UI
130・・・通信部
400・・・情報処理装置
420・・・関心連鎖エンジン
423・・・キーワード抽出部
427・・・パーサー
430・・・通信部
431・・・ページ種別判定部

Claims (4)

  1. ブラウザによって表示されるWebページの遷移を監視する監視部と、
    前記ブラウザによって表示されるWebページが遷移すると、現行のWebページが暗号化されたWebページとアクセス時にパスワードを要求するWebページから遷移したWebページとイントラネットから取得したWebページのうち少なくとも1つを含む特定種別のページであるか否かを判定する判定部と、
    前記現行のWebページが前記特定種別のページでないならば前記現行のWebページから特徴量を抽出する抽出部と、
    前記特徴量を用いて、前記現行のWebページに関して付加サービスを提供する提供部と
    を具備する情報処理装置。
  2. 受信データがWebページであるならば、前記受信データが暗号化されたWebページとアクセス時にパスワードを要求するWebページから遷移したWebページとイントラネットから取得したWebページのうち少なくとも1つを含む特定種別のページであるか否かを判定する判定部と、
    前記受信データがWebページであって、かつ、前記特定種別のページでないならば、前記受信データを解析して現行のWebページを生成するパーサーと、
    前記現行のWebページから特徴量を抽出する抽出部と、
    前記特徴量を用いて、前記現行のWebページに関して付加サービスを提供する提供部と
    を具備する情報処理装置。
  3. 指定Webページが記載されたホワイトリストを記憶する記憶部を更に具備し、
    前記判定部は、前記現行のWebページが前記特定種別のページであっても、前記現行のWebページが前記指定Webページであるか否かを更に判定し、
    前記抽出部は、前記指定Webページであるならば前記現行のWebページから特徴量を抽出する、
    請求項1記載の情報処理装置。
  4. 指定Webページが記載されたホワイトリストを記憶する記憶部を更に具備し、
    前記判定部は、前記現行のWebページが前記特定種別のページであっても、前記受信データが前記指定Webページであるか否かを更に判定し、
    前記パーサーは、前記受信データが前記指定Webページであるならば前記受信データを解析して現行のWebページを生成する、
    請求項2記載の情報処理装置。
JP2009272630A 2009-11-30 2009-11-30 情報処理装置 Expired - Fee Related JP5381659B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009272630A JP5381659B2 (ja) 2009-11-30 2009-11-30 情報処理装置
CN2010101356903A CN102081639B (zh) 2009-11-30 2010-03-10 信息处理装置
US12/724,697 US20110131405A1 (en) 2009-11-30 2010-03-16 Information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009272630A JP5381659B2 (ja) 2009-11-30 2009-11-30 情報処理装置

Publications (2)

Publication Number Publication Date
JP2011118454A JP2011118454A (ja) 2011-06-16
JP5381659B2 true JP5381659B2 (ja) 2014-01-08

Family

ID=44069727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009272630A Expired - Fee Related JP5381659B2 (ja) 2009-11-30 2009-11-30 情報処理装置

Country Status (3)

Country Link
US (1) US20110131405A1 (ja)
JP (1) JP5381659B2 (ja)
CN (1) CN102081639B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5248655B2 (ja) * 2011-05-18 2013-07-31 株式会社東芝 情報処理装置およびプログラム
JP6430793B2 (ja) * 2014-11-26 2018-11-28 京セラ株式会社 電子機器

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963916A (en) * 1990-09-13 1999-10-05 Intouch Group, Inc. Network apparatus and method for preview of music products and compilation of market data
JPH10269237A (ja) * 1997-03-27 1998-10-09 Hitachi Ltd 文書閲覧システム
JP4436177B2 (ja) * 2004-04-13 2010-03-24 ソフトバンクモバイル株式会社 検索装置
US20070067297A1 (en) * 2004-04-30 2007-03-22 Kublickis Peter J System and methods for a micropayment-enabled marketplace with permission-based, self-service, precision-targeted delivery of advertising, entertainment and informational content and relationship marketing to anonymous internet users
US20060123478A1 (en) * 2004-12-02 2006-06-08 Microsoft Corporation Phishing detection, prevention, and notification
US7693863B2 (en) * 2004-12-20 2010-04-06 Claria Corporation Method and device for publishing cross-network user behavioral data
JP4371068B2 (ja) * 2005-03-15 2009-11-25 日本電気株式会社 情報提供システム及び方法並びに情報提供用プログラム
US20060212507A1 (en) * 2005-03-18 2006-09-21 Clark Darren L Location-based historical performance information for entertainment devices
JP2007200014A (ja) * 2006-01-26 2007-08-09 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
US8386509B1 (en) * 2006-06-30 2013-02-26 Amazon Technologies, Inc. Method and system for associating search keywords with interest spaces
JP4881128B2 (ja) * 2006-11-02 2012-02-22 シャープ株式会社 履歴情報表示装置および方法
US8145521B2 (en) * 2008-07-15 2012-03-27 Google Inc. Geographic and keyword context in embedded applications

Also Published As

Publication number Publication date
US20110131405A1 (en) 2011-06-02
CN102081639A (zh) 2011-06-01
CN102081639B (zh) 2013-08-28
JP2011118454A (ja) 2011-06-16

Similar Documents

Publication Publication Date Title
US8301784B2 (en) Transcoding content for maximizing playback abilities in a switch enabled device
JP5216810B2 (ja) 遠隔画面共有を実行する方法、ユーザ端末、プログラム及びシステム
RU2595761C2 (ru) Управляющая информация, связанная с сетевыми ресурсами
JP5374209B2 (ja) コンテンツ共有システム、コンテンツ共有サーバー及びプログラム
JP4967073B2 (ja) ウェブベースのデスクトップ生産性アプリケーションを介したマルチメディアファイルの挿入
US9311281B2 (en) Methods for facilitating web page image hotspots and devices thereof
EP2110752A1 (en) Content distribution management device, communication terminal, program, and content distribution system
JP2012048457A (ja) 印刷サーバ装置、印刷装置、情報処理方法及びプログラム
JP2007188184A (ja) アクセス制御プログラム、アクセス制御方法およびアクセス制御装置
JP4340241B2 (ja) 利用者認証プログラム、利用者認証方法、利用者認証装置および利用者認証システム
JP2016051329A (ja) コンテンツ管理装置及びその制御方法
JP5381659B2 (ja) 情報処理装置
JP5903783B2 (ja) サーバ装置および情報処理装置
JP4815481B2 (ja) ネットワーク中継機器、ユーザ情報管理システム、およびユーザ情報管理方法
JP2012003411A (ja) ログインシール管理システム及び管理サーバ
WO2016135963A1 (ja) 情報処理装置、情報処理方法、プログラム、記憶媒体
JP5410409B2 (ja) プロフィール情報評価支援装置、プロフィール情報評価支援方法及びプログラム
JP2007249700A (ja) 文書管理装置、文書検索方法、文書検索プログラム及び記録媒体
US8325133B1 (en) Secure opportunistic use of external interfaces
JP6059307B1 (ja) 端末装置、情報送信方法、及び情報送信プログラム
JP2008065501A (ja) サービス利用制御システム、サービス利用制御装置、およびサービス利用制御プログラム
JP4852775B2 (ja) ウエッブ遊戯システム
JP2021015336A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2007213128A (ja) 地図情報提供システム
AU2014233547B2 (en) Systems and methods for accessing and controlling media stored remotely

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees