JP2005202766A - 類似コンテンツの同時提示システム - Google Patents
類似コンテンツの同時提示システム Download PDFInfo
- Publication number
- JP2005202766A JP2005202766A JP2004009337A JP2004009337A JP2005202766A JP 2005202766 A JP2005202766 A JP 2005202766A JP 2004009337 A JP2004009337 A JP 2004009337A JP 2004009337 A JP2004009337 A JP 2004009337A JP 2005202766 A JP2005202766 A JP 2005202766A
- Authority
- JP
- Japan
- Prior art keywords
- page
- similar
- site
- set information
- comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】言語の異なる複数ページの比較閲覧を容易にできるようにする。
【解決手段】表示基準となる基準サイトの識別子を受け付け、特定するとともに、前記基準サイトとは別の言語で表示される比較サイトの識別子を受け付け、特定するサイト特定部と、前記基準サイトの中から基準ページを特定する基準ページ特定部と、前記各サイトに含まれる単語を一つの言語に統一する言語変換部と、Webページに含まれる単語に基づく情報である単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する類似ページを特定する類似ページ特定部と、前記類似ページを前記基準ページと同一画面に表示する表示制御部とを備えるシステムを構成した。
【選択図】図4
【解決手段】表示基準となる基準サイトの識別子を受け付け、特定するとともに、前記基準サイトとは別の言語で表示される比較サイトの識別子を受け付け、特定するサイト特定部と、前記基準サイトの中から基準ページを特定する基準ページ特定部と、前記各サイトに含まれる単語を一つの言語に統一する言語変換部と、Webページに含まれる単語に基づく情報である単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する類似ページを特定する類似ページ特定部と、前記類似ページを前記基準ページと同一画面に表示する表示制御部とを備えるシステムを構成した。
【選択図】図4
Description
本発明は、互いにコンテンツが類似する複数のWebページを同時提示する類似コンテンツの同時提示システム等に関するものである。
Webがラジオやテレビに続くメディアとして一般的となった現在、海外のニュースサイトのWebコンテンツを閲覧することによりその国のニュースをそのまま取得することが可能である。ニュースソースは報道の視点や編集により種々の捉え方ができ、ひとつの事件や事故も国が異なれば視点が異なり、視聴者や読者は同じニュースでも異なった印象を持つ。例えば、A国とB国問の戦争に関するニュースでは、A国の報道ではB国の悪いところが誇張されるであろうし、またその逆も考えられる。このように、ひとつのニュースソースが各国でどのように報道されているか、視聴者自身で把握し比較することができるようになり、Webは我々の生活や世界観を大きく変えてきている。
ところが複数のWebぺ一ジを比較するには、これらのWebぺ一ジの中から類似するぺ一ジを探し出し、その類似したぺ一ジを各々別のプラウザを開いて、各々のウィンドウをクリックしスクロールしコンテンツを読まなけれぱならない。これではユーザにとって、複数のサイトを比較することは困難である。もちろん、非特許文献1、2に示すように、類似Webページを自動検索できるようなシステムは従来研究されているものの、類似ページの表示態様をどのように制御するのかといったことまでには触れられていない。ましてや、言語の異なるサイトにおいては、複数のブラウザを同時にオペレーションするだけでなく、複数の言語を同時に理解しなければならず、ユーザがマルチリンガルでない場合、複数ぺ一ジの閲覧はより困難である。
Jeffrey Dean, Monika R, Henzinger,"Find-ing Related Pages in the World Wide Web" , The 8thInternational World Wide Web Conference (WWW8), Toronto, Canada, May 1999,http://www8.org/w8-papers/4a-search-mining/finding/finding.html Taher H, Aristides G, Dan K, PiotrI, "Evaluating Strategies for Similarity Search on the Web" The 11thInternational World Wide Web Conference (WWW2002), Honolulu, Hawaii, May 2002,http://www2002.org/CDROM/refereed/75/index.html
Jeffrey Dean, Monika R, Henzinger,"Find-ing Related Pages in the World Wide Web" , The 8thInternational World Wide Web Conference (WWW8), Toronto, Canada, May 1999,http://www8.org/w8-papers/4a-search-mining/finding/finding.html Taher H, Aristides G, Dan K, PiotrI, "Evaluating Strategies for Similarity Search on the Web" The 11thInternational World Wide Web Conference (WWW2002), Honolulu, Hawaii, May 2002,http://www2002.org/CDROM/refereed/75/index.html
そこで本発明は、ユーザが指定した言語の異なる複数のWebサイトから類似するWebぺ一ジを発見し、パック、フォワード、クリック、スクロールといったユーザのオペレーションに応じてそれらコンテンツを同期させ自動提示するようにしたものであって、言語の異なる複数ページの比較閲覧を極めて容易にできるようにし、上述した不具合を解決すべくなされたものである。
すなわち本発明に係る類似ページの同時提示システムは、表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定部と、前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定部と、前記各サイトに含まれる単語を一つの言語に統一する機能を有した言語変換部と、 1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、前記基準ページの単語集合情報と前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定部と、前記類似ページを、前記基準ページと同一画面に表示する表示制御部とを備えていることを特徴とする。
前記類似ページ特定部が、前記基準ページのうちで画面の所定位置に表示されている段落の単語集合情報である基準段落単語集合情報と、前記類似ページにおける各段落の単語集合情報との比較に基づいて、前記類似ページのうちから基準ページの前記段落に類似する段落である類似段落を特定する機能をさらに有し、前記表示制御部が、前記類似段落を画面の所定位置に表示する機能をさらに有しているものであれば、段落の類比も把握できるので、比較閲覧がより行いやすくなる。
前記類似ページ特定部が、前記類似ページにおける各段落の単語集合情報について、前記基準段落単語集合情報との差異情報をそれぞれ生成する機能をさらに有し、前記表示制御部が、画面に表示されている類似ページの各段落についての前記差異情報を、視覚での認識が可能なように表示する機能をさらに有しているものであれば、各段落の基準段落に対する類似度を把握でき、より使い勝手に優れたものとなる。
異言語比較における好ましい類似度算出の態様としては、前記類似ページ特定部が、単語集合情報を構成する各単語の出現頻度に品詞による重み付け係数をかけた値を要素とする特徴ベクトルを生成するとともに、比較すべき2つの単語集合情報からそれぞれ生成した特徴ベクトル間のユークリッド距離を算出し、そのユークリッド距離が所定の閾値以下である場合に、類似と判断するものを挙げることができる。
具体的な前記単語集合情報としては、出現頻度に品詞による重み付け係数をかけた値が所定の閾値よりも高い単語である1又は複数の主題語と、前記各主題語に関連づけられ、その主題語との共起度が所定の閾値よりも高い単語である内容語の集合とのセットからなるデータ構造を有したものを挙げることができる。
このような単語情報の場合、前記類似ページ特定部が、比較すべき2つの単語集合情報についてそれらの主題語同士及び内容語同士を比較するようにしておくことが好ましい。
さらに、主題語と内容語とに分離したことを利用してユーザにわかりやすく差異情報を提示するには、前記類似ページ特定部が、前記基準段落単語集合情報との比較において前記主題語が所定以上類似し、かつ内容語同士が所定以上類似する段落を全体類似段落とし、前記主題語のみが所定以上類似する段落を内容相違段落とし、前記内容語のみが所定以上類似する段落を主題相違段落とするものであり、前記表示制御部が、前記全体類似段落、内容相違段落及び主題相違段落を視覚での識別が可能なように表示する機能をさらに有しているものであることが望ましい。
前記類似ページ特定部は、複数の類似ページを抽出して表示しても良いが、より簡単には前記基準ページに最も類似する1つの比較ページを類似ページとするものが好ましい。
また表示の具体的態様としては、前記表示制御部が、前記基準ページと前記類似ページとを同一ウィンドウ内に表示するものを挙げることができる。
基準サイトと比較サイトは別言語であるため、前記表示制御部が、前記類似ページ内の単語のうち、前記基準ページ内で選択された単語と同一の単語を他の単語とは別態様で表示するようにしておけば、非常に見やすくなる。
このシステムを通信可能に接続した複数のコンピュータから構成する場合には、前記サイト特定部、基準ページ特定部、言語変換部、単語集合情報生成部及び類似ページ特定部を備えている情報処理装置と、前記表示制御部を備えている端末装置とから構成することが一つの具体的態様として望ましい。
また、本発明に係る類似ページの同時提示方法は、表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定ステップと、前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定ステップと、前記各サイトに含まれる単語を一つの言語に統一する言語変換ステップと、1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換ステップを介して他の単語集合情報と比較可能に生成する単語集合情報生成ステップと、前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定ステップと、前記類似ページを、前記基準ページと同一画面に表示する表示制御ステップとからなることを特徴とする。
さらに、本発明に係るプログラムは、表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定部と、前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定部と、前記各サイトに含まれる単語を一つの言語に統一する機能を有した言語変換部と、1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定部としての機能をコンピュータに備えさせることを特徴とする。
このように構成した本発明によれば、一の言語のWebサイトを操作するだけで、類似する他の言語のサイトのぺ一ジが同期して自動で提示および操作され、しかも類似ページにおける段落毎の差異情報も視覚により把握できるため、言語の異なる複数ページの比較閲覧が極めて容易にできる。
以下に本発明の一実施形態について図面を参照して説明する。
A 構成
図1は、この実施の形態における類似ページの同時提示システムを示した機器構成図である。このシステムは、クライアントコンピュータP1(端末装置)と、サーバコンピュータP2(情報処理装置)とを通信可能に接続したもので、各コンピュータP1、P2はインターネットに接続されている。
図1は、この実施の形態における類似ページの同時提示システムを示した機器構成図である。このシステムは、クライアントコンピュータP1(端末装置)と、サーバコンピュータP2(情報処理装置)とを通信可能に接続したもので、各コンピュータP1、P2はインターネットに接続されている。
クライアントコンピュータP1は、例えばブラウズ機能を有した汎用コンピュータであり、図2に示すように、CPU101、内部メモリ102、HDD等の外部記憶装置103、通信ネットワークに接続するためのモデム等の通信インタフェース104、ディスプレイ105、マウスやキーボード等の入力手段106等を具備する。
前記サーバコンピュータP2は、例えばサーバ機能を有した汎用コンピュータであり、図3に示すように、CPU201、内部メモリ202、HDD等の外部記憶装置203、通信ネットワークに接続するためのモデム等の通信インタフェース204、ディスプレイ205、マウスやキーボードといった入力手段206等を有する。なお、これら各コンピュータP1、P2は汎用のものに限られず、専用に開発されたものを用いても構わないし、各コンピュータP1、P2が物理的に離れておらず、1つの機器として一体に構成されているものであっても構わない。
機能面から説明すると、図4に示すように、前記各コンピュータP1、P2に所定のプログラムをインストールし、そのプログラムに基づいてCPU101、201や周辺機器を共働させることにより、このシステムが、サイト特定部1、基準ページ特定部2、言語変換部4、単語集合情報生成部3、類似ページ特定部5、表示制御部6等としての機能を発揮するように構成している。なお、この実施形態では前記サイト特定部1、基準ページ特定部2、言語変換部4、単語集合情報生成部3、類似ページ特定部5が、サーバコンピュータP2に設けられ、前記表示制御部6がクライアントコンピュータP1に設けられているが、この限りではないのは言うまでもない。
簡単に各部を説明すると、サイト特定部1は、表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するものである。
基準ページ特定部2は、前記基準サイトの中から、画面に表示されているWebページである基準ページを特定するものである。
言語変換部4は、前記各サイトに含まれる単語を一つの言語に統一する機能を有したものである。
単語集合情報生成部3は、1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換部4を介して他の単語集合情報と比較可能に生成する機能を有したものである。
類似ページ特定部5は、前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定するものである。
表示制御部6は、前記類似ページを、前記基準ページと同一画面に表示するものである。
B 動作
以下に本システムの動作説明を兼ねて各部を詳述する。
以下に本システムの動作説明を兼ねて各部を詳述する。
(1)
ユーザは、基準サイトと比較サイトのURL(識別子)を指定する。すると図5に示すように、各サイトのトップページが表示される。その後ユーザが表示された基準サイトから閲覧したいWebぺ一ジ(以下基準ページという)を、アンカをクリックするなどして選択すると、その基準ページが表示される。この時、基準サイトと比較サイトとは類似した内容を持つサイトであり、別言語(例えば基準サイトは日本語、比較サイトは英語)で記載されているとする。
ユーザは、基準サイトと比較サイトのURL(識別子)を指定する。すると図5に示すように、各サイトのトップページが表示される。その後ユーザが表示された基準サイトから閲覧したいWebぺ一ジ(以下基準ページという)を、アンカをクリックするなどして選択すると、その基準ページが表示される。この時、基準サイトと比較サイトとは類似した内容を持つサイトであり、別言語(例えば基準サイトは日本語、比較サイトは英語)で記載されているとする。
前記一連のユーザの操作は、クライアントコンピュータP1の操作受付部7が受け付け、そこで指定されたURLに基づいて、サーバコンピュータP2のサイト特定部1及び基準ページ特定部2が、各サイト及び基準ページを特定する。次に前記単語集合情報生成部3が、特定されたサイトに関する最近(例えば1時間以内)の情報がデータベースD1に既に登録されているかどうかを確認する。
登録されていなければ、後述の(2)に示すように、前記単語集合情報生成部3がインターネットから各サイトの所定のWebページ情報を取得する。そして、前記各Webページの解析を行い、その結果を前記データベースD1に登録する。一方、登録されていれば後述の(3)以下の動作が行われる。
(2)
このシステムでは言語の異なるサイトを比較するため、単語の辞書ソフトを使用する。現在の単語の辞書ソフトは完全な言語変換を行えないため、あらかじめ2つのサイトにおいて比較する領域を限定し類似ぺ一ジを発見する。この比較する領域を比較領域と呼ぶ。例えばニュースサイトにおいては、分野ごとにカテゴリに分類されている。そこで、類似するカテゴリを発見することにより、比較領域を決定する。
このシステムでは言語の異なるサイトを比較するため、単語の辞書ソフトを使用する。現在の単語の辞書ソフトは完全な言語変換を行えないため、あらかじめ2つのサイトにおいて比較する領域を限定し類似ぺ一ジを発見する。この比較する領域を比較領域と呼ぶ。例えばニュースサイトにおいては、分野ごとにカテゴリに分類されている。そこで、類似するカテゴリを発見することにより、比較領域を決定する。
より具体的には、図6に示すように、前記各々のサイトをディレクトリページとコンテンツページに分ける。ここでいうディレクトリページとは、ぺ一ジのほとんどがアンカーにより構成されているぺ一ジを指す。ディレクトリページ以外のぺ一ジをコンテンツページと呼ぶ。ディレクトリページを示すアンカーテキストをカテゴリ名とする。つまりは、基準ぺ一ジのカテゴリ名は基準ぺ一ジをリンクしているディレクトリページを指すアンカーテキストである。基準ぺ一ジのカテゴリ名を辞書ソフトによって英語に変換する。比較サイトにおいてその基準ぺ一ジのカテゴリ名を発見する。発見したカテゴリの子節点となるぺ一ジすべてを含む領域が比較領域となる。
次に前記比較領域におけるWebページ(以降比較ページと称する)及び前記基準ページについて、ページ単位及び段落単位でTopic Structure(単語集合情報、以下TPと称する)を生成する。
TPはトピック(単語)ti,i∈(1,...,n)からなり、tiは主題語siと内容語の集合Ciとのセットからなる。また、Ciは複数の内容語cim,m∈(1,...,k)で構成される。すなわち、TPは以下のとおりである。
TP={t1,...,ti,...,tn}
ti=(si,Ci)
Ci=(ci1,...,cim)
ti=(si,Ci)
Ci=(ci1,...,cim)
前記主題語は、ぺ一ジ(段落)において密度が高い単語としており、このシステムではぺ一ジ(段落)単位での類似関係を求めるため、単語の出現頻度を用いて抽出する。対象となる単語は名詞のみである。すなわち、主題語の候補となる単語tは、
tf(t)×weight(t)>αである。
tf(t)×weight(t)>αである。
ここで、tf(t)はぺ一ジ(段落)におけるtの出現頻度を示し、weight(t)は品詞による単語の重み付け係数を示し、αは閾値を示す。ここでの重み付け係数weight(t)は、例えば固有名詞3.0、数0.1、助数詞0.1、名詞一般1.0、その他の名詞0.9である。
前記内容語は、主題語との共起度の高い単語である。このシステムではあらかじめ単語の共起辞書D2を作成し、この共起辞書D2を用いて共起度を求める。なお、共起辞書D2はデータベース構造を有する。ぺ一ジ(段落)の主題語を{s1,...,si,...,sn}とすると、各々の主題語siにおいて内容語の集合であるCi=(ci1,...,cij)を求める。cijは、siとの単語の共起度がある閾値(β)以上の単語である。内容語も名詞のみを対象とする。このように、ぺ一ジ(段落)における主題語と内容語を決定する。よって、ぺ一ジ(段落)のTPは、{t1=(s1,C1),...,tn=(sn,Cn)}となる。これらのTPは前記データペースに格納される。
(3)
次に類似ページ特定部5が、前記データペースに格納されているTPから主題語と内容語の特徴ベクトルをそれぞれ生成するとともに、それらのユークリッド距離を用いて基準ページと各比較ページについて比較を行い、ページレベルでのTP及び段落レベルでのTPに基づいてコンテンツの差異情報を取得する。なお、段落レベルでの比較において基準となる段落とは、例えば、画面に表示されている基準ページのうちの中央部に位置する段落(以下、基準段落と称する)のことである。これに先立って、辞書ソフト(言語変換部4)が、英語の主題語と内容語を日本語に変換する。1つの英語には複数の日本語訳が対応している場合がある。その場合、複数の日本語を主題語の候補とする。2ぺ一ジ(段落)間の主題語の類似度Sims 、内容語の類似度Simcは以下のように決定される。
次に類似ページ特定部5が、前記データペースに格納されているTPから主題語と内容語の特徴ベクトルをそれぞれ生成するとともに、それらのユークリッド距離を用いて基準ページと各比較ページについて比較を行い、ページレベルでのTP及び段落レベルでのTPに基づいてコンテンツの差異情報を取得する。なお、段落レベルでの比較において基準となる段落とは、例えば、画面に表示されている基準ページのうちの中央部に位置する段落(以下、基準段落と称する)のことである。これに先立って、辞書ソフト(言語変換部4)が、英語の主題語と内容語を日本語に変換する。1つの英語には複数の日本語訳が対応している場合がある。その場合、複数の日本語を主題語の候補とする。2ぺ一ジ(段落)間の主題語の類似度Sims 、内容語の類似度Simcは以下のように決定される。
Sims=[(fb(s1)−fc(s1))2+...+(fb(sn)−fc(sn))2]1/2
Simc=[(fb(c1)−fc(c1))2+...+(fb(cm)−fc(cm))2]1/2
fb(sn)=tf(sn)×weight(sn)
Simc=[(fb(c1)−fc(c1))2+...+(fb(cm)−fc(cm))2]1/2
fb(sn)=tf(sn)×weight(sn)
ここで、fb(sn)は基準ぺ一ジ(段落)の主題語の特徴ベクトルの要素であり、fc(sn)は比較ぺ一ジ(段落)の主題語の特徴ベクトルの要素である。同様に、fb(cm)は基準ぺ一ジ(段落)の内容語の特徴ベクトルの要素であり、fc(cm)は比較ぺ一ジ(段落)の内容語の特徴ベクトルの要素である。
上記のように求めた主題語の類似度、内容語の類似度に基づき、2ぺ一ジ(段落)問の差異情報を以下のように求める。
・全体類似
主題語の類似度と内容語の類似度がある閾値以下の場合、その2つのぺ一ジ(段落)は主題語と内容語が類似しているため全体類似のぺ一ジ(段落)となる。
主題語の類似度と内容語の類似度がある閾値以下の場合、その2つのぺ一ジ(段落)は主題語と内容語が類似しているため全体類似のぺ一ジ(段落)となる。
・内容相違
主題語の類似度がある閾値以下であり、内容語の類似度は閾値以上である場合、その2つのぺ一ジ(段落)は主題語が類似しているが内容語が相違しているとし、内容相違のぺ一ジ(段落)となる。
主題語の類似度がある閾値以下であり、内容語の類似度は閾値以上である場合、その2つのぺ一ジ(段落)は主題語が類似しているが内容語が相違しているとし、内容相違のぺ一ジ(段落)となる。
・主題相違
主題語の類似度がある閾値以上であり、内容語の類似度は閾値以下である場合、その2つのぺ一ジ(段落)は主題語が相違しているが内容語が類似しているとし、主題相違のぺ一ジ(段落)となる。
主題語の類似度がある閾値以上であり、内容語の類似度は閾値以下である場合、その2つのぺ一ジ(段落)は主題語が相違しているが内容語が類似しているとし、主題相違のぺ一ジ(段落)となる。
そして、このようにして基準ページに全体類似すると判断された比較ページのうちで、基準ページとの前記ユークリッド距離の最も小さい比較ページが類似ページに設定される。また、類似ページ内の段落のうちで、基準段落に全体類似すると判断され、なおかつ基準段落とのユークリッド距離の最も小さい段落が、類似段落に設定される。
(4)
このように特定された類似ページを、表示制御部6が、基準ページと同一のウィンドウ内に表示する。そのとき、表示制御部6は、基準段落と類似段落とが、例えば横並びになって同時表示されるように(図7参照)、表示態様を制御する。
このように特定された類似ページを、表示制御部6が、基準ページと同一のウィンドウ内に表示する。そのとき、表示制御部6は、基準段落と類似段落とが、例えば横並びになって同時表示されるように(図7参照)、表示態様を制御する。
したがって、ユーザが基準ページをスクロールした場合には、当然基準段落が変わるため、変化した基準段落に対応する類似段落が横並び表示されるように、類似ページが自動同期スクロールされる(図8参照)。
また、ユーザがアンカをクリックしたり、フォワード・バックボタンをクリックして基準ページを変更した場合、その変更した基準ページに類似する類似ページが都度特定され、同一ウィンドウ内に表示されることとなる。
一方、Webページは通常複数の段落を有し、これら複数の段落が1つの画面内に表示されることはしばしばある。このシステムでは、ユーザのオペレーションによって2つのWebぺ一ジを同時にかつ同期させて提示しているため、比較ページにおけるどの段落が類似段落なのか、または差異を有する段落なのかユーザにとってわかりにくい。そこでこの実施形態では、上記のように類似ページ特定部5が選別した全体類似段落、内容相違段落及び主題相違段落について、視覚による差別化ができるようにしている。視覚化する方法としてはいくつか考えられるが、ここではそれらを色分けして提示する。これにより、ユーザは、比較ページにおけるどの段落が類似段落なのか、または差異を有する段落なのかを明確に認識することができる。具体的には、図9に模式的に示すように、例えば全体類似段落を赤、内容相違段落を緑、主題相違段落を青といったように色分け表示する。また、各ぺ一ジに全体類似段落、内容相違段落又は主題相違段落が複数存在する場合には、例えば主題相違段落の場合、最初の主題相違の段落は青、次の主題相違の段落は水色と言つたように、色のグラディエーションをつけてわかりやすく提示する。
さらに、言語の異なる2つのぺ一ジを同時に提示しているため、ユーザが特定の単語を発見することは困難である。そのため、ユーザが基準ぺ一ジの単語を選択したとき、図10に示すように、基準ページ及び類似ぺ一ジ上の同じ単語をハイライトして強調表示するなど、他の単語と別態様で提示することにより、ユーザが直感的に把握できるようにしている(図参照)。
その他に、図示しないが、基準段落と類似する段落が比較ぺ一ジになかった場合、本システムは類似段落を他の比較ぺ一ジから検索する。そして類似段落が他の比較ぺ一ジにあったとき、基準ぺ一ジ内のその段落に部分類似アイコンを表示する。ユーザがこの部分類似アイコンをクリックした時、システムはその類似段落を含むぺ一ジを別のウィンドウで部分類似ぺ一ジとして表示する。
C まとめ
このように本実施形態では、一の言語(日本語)のWebサイトを操作するだけで、類似する他の言語(英語)のサイトのぺ一ジが同期して自動で提示および操作され、しかも類似ページにおける段落毎の差異情報も視覚により把握できるため、言語の異なる複数ページの比較閲覧が極めて容易にできる。
このように本実施形態では、一の言語(日本語)のWebサイトを操作するだけで、類似する他の言語(英語)のサイトのぺ一ジが同期して自動で提示および操作され、しかも類似ページにおける段落毎の差異情報も視覚により把握できるため、言語の異なる複数ページの比較閲覧が極めて容易にできる。
なお、本発明は、上記実施形態に限られるものではない。例えば、差異情報の提示方法として前記実施形態では段落を色分けすることによる提示を行ったが、関係する段落を色により提示しただけでは、関連情報をもつ段落の位置がわかるだけであり、段落同士がどのように異なるのか、また段落同士の関係を踏まえたぺ一ジ間の関係がわからない。したがってこれらの関係が明確化されるような、より提示情報量の多い視覚提示方法でも構わない。
また、一の基準サイトに対して多言語複数サイトを比較提示してもよいし、言語変換をデータベースD1への登録時に行ってもよい。
その他、本発明は上記図示例に限られず、その趣旨を逸脱しない範囲で種々の変形が可能である。
1 サイト特定部
2 基準ページ特定部
4 言語変換部
3 単語集合情報生成部
5 類似ページ特定部
6 表示制御部
P1 端末装置(クライアントコンピュータ)
P2 情報処理装置(サーバコンピュータ)
2 基準ページ特定部
4 言語変換部
3 単語集合情報生成部
5 類似ページ特定部
6 表示制御部
P1 端末装置(クライアントコンピュータ)
P2 情報処理装置(サーバコンピュータ)
Claims (15)
- 表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定部と、
前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定部と、
前記各サイトに含まれる単語を一つの言語に統一する機能を有した言語変換部と、
1つのWebページ又は1つの段落に含まれる単語に基づく情報である単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、
前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定部と、
前記類似ページを、前記基準ページと同一画面に表示する表示制御部とを備えている類似ページの同時提示システム。 - 前記類似ページ特定部が、前記基準ページのうちで画面の所定位置に表示されている段落の単語集合情報である基準段落単語集合情報と、前記類似ページにおける各段落の単語集合情報との比較に基づいて、前記類似ページのうちから基準ページの前記段落に類似する段落である類似段落を特定する機能をさらに有し、
前記表示制御部が、前記類似段落を画面の所定位置に表示する機能をさらに有している請求項1記載の類似ページの同時提示システム。 - 前記類似ページ特定部が、前記類似ページにおける各段落の単語集合情報について、前記基準段落単語集合情報との差異情報をそれぞれ生成する機能をさらに有し、
前記表示制御部が、画面に表示されている類似ページの各段落についての前記差異情報を、視覚での認識が可能なように表示する機能をさらに有している請求項2記載の類似ページの同時提示システム。 - 前記類似ページ特定部が、単語集合情報を構成する各単語の出現頻度に品詞による重み付け係数をかけた値を要素とする特徴ベクトルを生成するとともに、比較すべき2つの単語集合情報からそれぞれ生成した特徴ベクトル間のユークリッド距離を算出し、そのユークリッド距離が所定の閾値以下である場合に、類似と判断するものである請求項1、2又は3記載の類似ページの同時提示システム。
- 前記単語集合情報が、出現頻度に品詞による重み付け係数をかけた値が所定の閾値よりも高い単語である1又は複数の主題語と、前記各主題語に関連づけられ、その主題語との共起度が所定の閾値よりも高い単語である内容語の集合とのセットからなるデータ構造を有したものである請求項1、2、3又は4記載の類似コンテンツの同時提示システム。
- 前記類似ページ特定部が、比較すべき2つの単語集合情報についてそれらの主題語同士及び内容語同士を比較するものである請求項5記載の類似ページの同時提示システム。
- 前記類似ページ特定部が、前記基準段落単語集合情報との比較において前記主題語が所定以上類似し、かつ内容語同士が所定以上類似する段落を全体類似段落とし、前記主題語のみが所定以上類似する段落を内容相違段落とし、前記内容語のみが所定以上類似する段落を主題相違段落とするものであり、
前記表示制御部が、前記全体類似段落、内容相違段落及び主題相違段落を視覚での識別が可能なように表示する機能をさらに有している請求項6記載の類似ページの同時提示システム。 - 前記類似ページ特定部が、単語集合情報を構成する主題語の出現頻度に品詞による重み付け係数をかけた値を要素とする主題語特徴ベクトルと、内容語の出現頻度に品詞による重み付け係数をかけた値を要素とする内容語特徴ベクトルとを生成するとともに、比較すべき2つの単語集合情報からそれぞれ生成した主題語特徴ベクトル間及び内容語特徴ベクトル間のユークリッド距離を算出し、それらユークリッド距離に基づいて類比を判断するものである請求項5、6又は7記載の類似ページの同時提示システム。
- 前記類似ページ特定部が、前記基準ページに最も類似する1つの比較ページを類似ページとするものである請求項1、2、3、4、5、6、7又は8記載の類似ページの同時提示システム。
- 前記表示制御部が、前記基準ページと前記類似ページとを同一ウィンドウ内に表示するものである請求項1、2、3、4、5、6、7、8又は9記載の類似ページの同時提示システム。
- 前記表示制御部が、前記類似ページ内の単語のうち、前記基準ページ内で選択された単語と同一の単語を別態様で表示するものである請求項1、2、3、4、5、6、7、8、9又は10記載の類似ページの同時提示システム。
- 表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定部と、
前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定部と、
前記各サイトに含まれる単語を一つの言語に統一する機能を有した言語変換部と、
1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、
前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定部とを備えている情報処理装置。 - 請求項12記載の情報処理装置と通信可能に接続されたものであって、
前記類似ページを、前記基準ページと同一画面に表示する表示制御部を備えている端末装置。 - 表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定ステップと、
前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定ステップと、
前記各サイトに含まれる単語を一つの言語に統一する言語変換ステップと、
1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換ステップを介して他の単語集合情報と比較可能に生成する単語集合情報生成ステップと、
前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定ステップと、
前記類似ページを、前記基準ページと同一画面に表示する表示制御ステップとからなる類似ページの同時提示方法。 - 表示の基準となるWebサイトである基準サイトの識別子を受け付け、その基準サイトを特定するとともに、前記基準サイトとは別の言語で表示されるWebサイトである比較サイトの識別子を受け付け、その比較サイトを特定するサイト特定部と、
前記基準サイトの中から、画面に表示されているWebページである基準ページを特定する基準ページ特定部と、
前記各サイトに含まれる単語を一つの言語に統一する機能を有した言語変換部と、
1つのWebページ又は1つの段落に含まれる全部又は一部の単語を構成要素とする単語集合情報を、前記言語変換部を介して他の単語集合情報と比較可能に生成する機能を有した単語集合情報生成部と、
前記基準ページの単語集合情報と、前記比較サイト中のWebページである各比較ページの単語集合情報との比較に基づいて、前記各比較ページの中から前記基準ページに類似する1又は複数の類似ページを特定する類似ページ特定部としての機能をコンピュータに備えさせることを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004009337A JP2005202766A (ja) | 2004-01-16 | 2004-01-16 | 類似コンテンツの同時提示システム |
US10/892,515 US7240282B2 (en) | 2004-01-16 | 2004-07-15 | Related web contents synchronization and presentation system and method |
US11/513,955 US7856594B2 (en) | 2004-01-16 | 2006-08-31 | Related web contents synchronization and presentation system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004009337A JP2005202766A (ja) | 2004-01-16 | 2004-01-16 | 類似コンテンツの同時提示システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005202766A true JP2005202766A (ja) | 2005-07-28 |
Family
ID=34747212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004009337A Pending JP2005202766A (ja) | 2004-01-16 | 2004-01-16 | 類似コンテンツの同時提示システム |
Country Status (2)
Country | Link |
---|---|
US (2) | US7240282B2 (ja) |
JP (1) | JP2005202766A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007200194A (ja) * | 2006-01-30 | 2007-08-09 | Kyocera Corp | ウェブページの表示方法およびブラウザ装置、並びにウェブページ表示プログラム |
JP2010020703A (ja) * | 2008-07-14 | 2010-01-28 | Canon Inc | 文書管理装置、文書管理方法及びプログラム |
JP4550939B1 (ja) * | 2009-09-17 | 2010-09-22 | 株式会社野村総合研究所 | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム |
JP2010231761A (ja) * | 2009-03-18 | 2010-10-14 | Nec (China) Co Ltd | 多言語ウェブ・サイトからの多言語オブジェクト階層抽出方法およびシステム |
JP2012212213A (ja) * | 2011-03-30 | 2012-11-01 | Toshiba Corp | 情報処理装置及び情報処理方法 |
JP2020024674A (ja) * | 2018-08-06 | 2020-02-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 情報をプッシュするための方法及び装置 |
WO2020080031A1 (ja) * | 2018-10-17 | 2020-04-23 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
KR20230063649A (ko) * | 2021-11-02 | 2023-05-09 | 주식회사 플렉슬 | 한 화면에 전자 문서를 구성하는 페이지들을 두 페이지씩 최적의 비율로 표시할 수 있는 전자 장치 및 그 동작 방법 |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060136824A1 (en) * | 2004-11-12 | 2006-06-22 | Bo-In Lin | Process official and business documents in several languages for different national institutions |
US20060218133A1 (en) * | 2005-03-24 | 2006-09-28 | Atkin Steven E | Constructing dynamic multilingual pages in a Web portal |
US7941484B2 (en) * | 2005-06-20 | 2011-05-10 | Symantec Operating Corporation | User interfaces for collaborative multi-locale context-aware systems management problem analysis |
JPWO2006137563A1 (ja) * | 2005-06-24 | 2009-01-22 | 株式会社ジャストシステム | データ処理装置及びデータ処理方法 |
JP2007272390A (ja) * | 2006-03-30 | 2007-10-18 | Sony Corp | リソース管理装置、タグ候補選定方法及びタグ候補選定プログラム |
JP4935413B2 (ja) * | 2006-09-04 | 2012-05-23 | ソニー株式会社 | アップロード用アドインプログラム、アップロード用補助プログラム及びアップロード方法 |
US8572472B2 (en) * | 2006-09-28 | 2013-10-29 | Mitsubishi Electric Corporation | Fault detection apparatus, fault detection method, and fault detection program |
US8244740B2 (en) * | 2008-11-26 | 2012-08-14 | Microsoft Corporation | Providing suggested sites associated with target sites |
CN101944000A (zh) * | 2010-09-29 | 2011-01-12 | 华为技术有限公司 | 安置图标的方法和装置 |
US8706860B2 (en) | 2011-06-30 | 2014-04-22 | Amazon Technologies, Inc. | Remote browsing session management |
US8577963B2 (en) | 2011-06-30 | 2013-11-05 | Amazon Technologies, Inc. | Remote browsing session between client browser and network based browser |
US9621406B2 (en) | 2011-06-30 | 2017-04-11 | Amazon Technologies, Inc. | Remote browsing session management |
US8799412B2 (en) | 2011-06-30 | 2014-08-05 | Amazon Technologies, Inc. | Remote browsing session management |
US9037696B2 (en) | 2011-08-16 | 2015-05-19 | Amazon Technologies, Inc. | Managing information associated with network resources |
US9195768B2 (en) | 2011-08-26 | 2015-11-24 | Amazon Technologies, Inc. | Remote browsing session management |
US10089403B1 (en) | 2011-08-31 | 2018-10-02 | Amazon Technologies, Inc. | Managing network based storage |
US10693991B1 (en) | 2011-09-27 | 2020-06-23 | Amazon Technologies, Inc. | Remote browsing session management |
US8849802B2 (en) | 2011-09-27 | 2014-09-30 | Amazon Technologies, Inc. | Historical browsing session management |
US9298843B1 (en) | 2011-09-27 | 2016-03-29 | Amazon Technologies, Inc. | User agent information management |
US8589385B2 (en) | 2011-09-27 | 2013-11-19 | Amazon Technologies, Inc. | Historical browsing session management |
US9641637B1 (en) | 2011-09-27 | 2017-05-02 | Amazon Technologies, Inc. | Network resource optimization |
US8914514B1 (en) | 2011-09-27 | 2014-12-16 | Amazon Technologies, Inc. | Managing network based content |
US9152970B1 (en) | 2011-09-27 | 2015-10-06 | Amazon Technologies, Inc. | Remote co-browsing session management |
US9178955B1 (en) | 2011-09-27 | 2015-11-03 | Amazon Technologies, Inc. | Managing network based content |
US9383958B1 (en) | 2011-09-27 | 2016-07-05 | Amazon Technologies, Inc. | Remote co-browsing session management |
US8615431B1 (en) | 2011-09-29 | 2013-12-24 | Amazon Technologies, Inc. | Network content message placement management |
US9313100B1 (en) | 2011-11-14 | 2016-04-12 | Amazon Technologies, Inc. | Remote browsing session management |
US8972477B1 (en) | 2011-12-01 | 2015-03-03 | Amazon Technologies, Inc. | Offline browsing session management |
US9009334B1 (en) | 2011-12-09 | 2015-04-14 | Amazon Technologies, Inc. | Remote browsing session management |
US9117002B1 (en) | 2011-12-09 | 2015-08-25 | Amazon Technologies, Inc. | Remote browsing session management |
US9213705B1 (en) * | 2011-12-19 | 2015-12-15 | Audible, Inc. | Presenting content related to primary audio content |
US9330188B1 (en) | 2011-12-22 | 2016-05-03 | Amazon Technologies, Inc. | Shared browsing sessions |
US9087024B1 (en) | 2012-01-26 | 2015-07-21 | Amazon Technologies, Inc. | Narration of network content |
US9092405B1 (en) | 2012-01-26 | 2015-07-28 | Amazon Technologies, Inc. | Remote browsing and searching |
US9509783B1 (en) | 2012-01-26 | 2016-11-29 | Amazon Technlogogies, Inc. | Customized browser images |
US8627195B1 (en) * | 2012-01-26 | 2014-01-07 | Amazon Technologies, Inc. | Remote browsing and searching |
US8839087B1 (en) | 2012-01-26 | 2014-09-16 | Amazon Technologies, Inc. | Remote browsing and searching |
US9336321B1 (en) | 2012-01-26 | 2016-05-10 | Amazon Technologies, Inc. | Remote browsing and searching |
US9037975B1 (en) | 2012-02-10 | 2015-05-19 | Amazon Technologies, Inc. | Zooming interaction tracking and popularity determination |
US9183258B1 (en) | 2012-02-10 | 2015-11-10 | Amazon Technologies, Inc. | Behavior based processing of content |
US9137210B1 (en) | 2012-02-21 | 2015-09-15 | Amazon Technologies, Inc. | Remote browsing session management |
US10296558B1 (en) | 2012-02-27 | 2019-05-21 | Amazon Technologies, Inc. | Remote generation of composite content pages |
US9374244B1 (en) | 2012-02-27 | 2016-06-21 | Amazon Technologies, Inc. | Remote browsing session management |
US9208316B1 (en) | 2012-02-27 | 2015-12-08 | Amazon Technologies, Inc. | Selective disabling of content portions |
US20130275413A1 (en) * | 2012-03-13 | 2013-10-17 | MindsPlace Inc. | Knowledge visualization and information based social network |
US8804399B2 (en) * | 2012-03-23 | 2014-08-12 | Micron Technology, Inc. | Multi-function resistance change memory cells and apparatuses including the same |
US9460220B1 (en) | 2012-03-26 | 2016-10-04 | Amazon Technologies, Inc. | Content selection based on target device characteristics |
US9307004B1 (en) | 2012-03-28 | 2016-04-05 | Amazon Technologies, Inc. | Prioritized content transmission |
US9772979B1 (en) | 2012-08-08 | 2017-09-26 | Amazon Technologies, Inc. | Reproducing user browsing sessions |
US8943197B1 (en) | 2012-08-16 | 2015-01-27 | Amazon Technologies, Inc. | Automated content update notification |
US10152463B1 (en) | 2013-06-13 | 2018-12-11 | Amazon Technologies, Inc. | System for profiling page browsing interactions |
US9578137B1 (en) | 2013-06-13 | 2017-02-21 | Amazon Technologies, Inc. | System for enhancing script execution performance |
US9635041B1 (en) | 2014-06-16 | 2017-04-25 | Amazon Technologies, Inc. | Distributed split browser content inspection and analysis |
US10209867B1 (en) * | 2015-05-15 | 2019-02-19 | Jordan M. Becker | Electronic documentation integration and viewing system |
US10289296B1 (en) | 2015-08-21 | 2019-05-14 | Google Llc | Systems and methods for dynamically appending supplemental content to an information resource responsive to scroll activity |
US10585576B2 (en) * | 2015-10-26 | 2020-03-10 | Google Llc | Systems and methods for attributing a scroll event in an infinite scroll graphical user interface |
CN105718148A (zh) * | 2016-01-26 | 2016-06-29 | 北京小米移动软件有限公司 | 应用图标的显示方法、装置和设备 |
CN105868320A (zh) * | 2016-03-25 | 2016-08-17 | 乐视控股(北京)有限公司 | 显示方法、装置和*** |
US10726095B1 (en) | 2017-09-26 | 2020-07-28 | Amazon Technologies, Inc. | Network content layout using an intermediary system |
US10664538B1 (en) | 2017-09-26 | 2020-05-26 | Amazon Technologies, Inc. | Data security and data access auditing for network accessible content |
JP7192991B2 (ja) * | 2019-06-24 | 2022-12-20 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
TWI812275B (zh) * | 2022-06-13 | 2023-08-11 | 緯創資通股份有限公司 | 使用者介面同步捲動系統及使用者介面同步捲動方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9426165D0 (en) * | 1994-12-23 | 1995-02-22 | Anthony Andre C | Method of retrieving and displaying data |
US6073143A (en) * | 1995-10-20 | 2000-06-06 | Sanyo Electric Co., Ltd. | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request |
US6457004B1 (en) * | 1997-07-03 | 2002-09-24 | Hitachi, Ltd. | Document retrieval assisting method, system and service using closely displayed areas for titles and topics |
US6070176A (en) * | 1997-01-30 | 2000-05-30 | Intel Corporation | Method and apparatus for graphically representing portions of the world wide web |
US6658626B1 (en) * | 1998-07-31 | 2003-12-02 | The Regents Of The University Of California | User interface for displaying document comparison information |
US6560620B1 (en) * | 1999-08-03 | 2003-05-06 | Aplix Research, Inc. | Hierarchical document comparison system and method |
JP2001167092A (ja) * | 1999-12-13 | 2001-06-22 | Nec Corp | 翻訳サーバシステム |
JP4066600B2 (ja) * | 2000-12-20 | 2008-03-26 | 富士ゼロックス株式会社 | 多言語文書検索システム |
US6978420B2 (en) * | 2001-02-12 | 2005-12-20 | Aplix Research, Inc. | Hierarchical document cross-reference system and method |
US7536413B1 (en) * | 2001-05-07 | 2009-05-19 | Ixreveal, Inc. | Concept-based categorization of unstructured objects |
US7194483B1 (en) * | 2001-05-07 | 2007-03-20 | Intelligenxia, Inc. | Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information |
US6988093B2 (en) * | 2001-10-12 | 2006-01-17 | Commissariat A L'energie Atomique | Process for indexing, storage and comparison of multimedia documents |
US7548863B2 (en) * | 2002-08-06 | 2009-06-16 | Apple Inc. | Adaptive context sensitive analysis |
US7725487B2 (en) * | 2003-12-01 | 2010-05-25 | National Institute Of Information And Communications Technology | Content synchronization system and method of similar web pages |
-
2004
- 2004-01-16 JP JP2004009337A patent/JP2005202766A/ja active Pending
- 2004-07-15 US US10/892,515 patent/US7240282B2/en not_active Expired - Fee Related
-
2006
- 2006-08-31 US US11/513,955 patent/US7856594B2/en not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007200194A (ja) * | 2006-01-30 | 2007-08-09 | Kyocera Corp | ウェブページの表示方法およびブラウザ装置、並びにウェブページ表示プログラム |
JP2010020703A (ja) * | 2008-07-14 | 2010-01-28 | Canon Inc | 文書管理装置、文書管理方法及びプログラム |
JP2010231761A (ja) * | 2009-03-18 | 2010-10-14 | Nec (China) Co Ltd | 多言語ウェブ・サイトからの多言語オブジェクト階層抽出方法およびシステム |
JP4550939B1 (ja) * | 2009-09-17 | 2010-09-22 | 株式会社野村総合研究所 | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム |
JP2011086273A (ja) * | 2009-09-17 | 2011-04-28 | Nomura Research Institute Ltd | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム |
JP2011086278A (ja) * | 2009-09-17 | 2011-04-28 | Nomura Research Institute Ltd | 情報伝播経路特定装置、情報伝播経路特定方法、情報伝播経路特定プログラム |
JP2012212213A (ja) * | 2011-03-30 | 2012-11-01 | Toshiba Corp | 情報処理装置及び情報処理方法 |
JP2020024674A (ja) * | 2018-08-06 | 2020-02-13 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 情報をプッシュするための方法及び装置 |
WO2020080031A1 (ja) * | 2018-10-17 | 2020-04-23 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
JP2020064470A (ja) * | 2018-10-17 | 2020-04-23 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
JP7249125B2 (ja) | 2018-10-17 | 2023-03-30 | 日本電信電話株式会社 | データ処理装置、データ処理方法及びデータ処理プログラム |
US11829719B2 (en) | 2018-10-17 | 2023-11-28 | Nippon Telegraph And Telephone Corporation | Data processing device, data processing method, and data processing program |
KR20230063649A (ko) * | 2021-11-02 | 2023-05-09 | 주식회사 플렉슬 | 한 화면에 전자 문서를 구성하는 페이지들을 두 페이지씩 최적의 비율로 표시할 수 있는 전자 장치 및 그 동작 방법 |
KR102620258B1 (ko) * | 2021-11-02 | 2024-01-02 | 주식회사 플렉슬 | 한 화면에 전자 문서를 구성하는 페이지들을 두 페이지씩 최적의 비율로 표시할 수 있는 전자 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
US7856594B2 (en) | 2010-12-21 |
US20060294461A1 (en) | 2006-12-28 |
US20050160360A1 (en) | 2005-07-21 |
US7240282B2 (en) | 2007-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005202766A (ja) | 類似コンテンツの同時提示システム | |
CN102426607B (zh) | 可扩展搜索项建议引擎 | |
KR100341339B1 (ko) | 디스플레이 스크린 크기 및 윈도우 크기와 관련된 웹 페이지 적응 시스템 | |
US9483577B2 (en) | Small form factor web browsing | |
US8578328B2 (en) | Method for presenting candidate for link target to component in web application, as well as computer program and computer system for the same | |
JP4598874B2 (ja) | 検索結果の効率的ナビゲーション | |
US7877677B2 (en) | Methods and apparatus for enabling use of web content on various types of devices | |
KR100461019B1 (ko) | 소형 화면 단말기를 위한 웹 컨텐츠 변환 시스템 및 방법 | |
KR100815215B1 (ko) | 웹사이트 통합 검색 장치 및 방법 | |
US7725487B2 (en) | Content synchronization system and method of similar web pages | |
US11709881B2 (en) | Visual menu | |
US8429152B2 (en) | Terminal device, content displaying method, and content displaying program | |
JP2005346495A (ja) | 情報処理システム、情報処理方法、および情報処理プログラム | |
JP2004246422A (ja) | 情報検索支援装置 | |
JPH10301944A (ja) | Wwwブラウザ装置 | |
JP7338328B2 (ja) | データ構造、コンピュータプログラム及び画像処理装置 | |
US20050171784A1 (en) | Multilingual adaptive system | |
JP6707484B2 (ja) | 理解支援方法、理解支援装置及びプログラム | |
JP2019053461A (ja) | 画像処理装置、プログラム及び画像データ | |
CN106815288A (zh) | 一种视频相关信息生成方法及其装置 | |
JPH11184876A (ja) | インターネット類似情報検索装置 | |
JP2005157817A (ja) | ハイパーテキスト修正システムおよび方法 | |
JP2006172029A (ja) | 検索結果提示方法 | |
KR20040096798A (ko) | 인터넷 및 네트워크를 이용하여 전자문서뷰어와지식관리서버를 연동하는 시스템 및 방법 | |
JP2008140272A (ja) | 検索実行装置、検索システム、検索方法、検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061010 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070220 |