JP2003316914A - コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム - Google Patents

コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム

Info

Publication number
JP2003316914A
JP2003316914A JP2002121435A JP2002121435A JP2003316914A JP 2003316914 A JP2003316914 A JP 2003316914A JP 2002121435 A JP2002121435 A JP 2002121435A JP 2002121435 A JP2002121435 A JP 2002121435A JP 2003316914 A JP2003316914 A JP 2003316914A
Authority
JP
Japan
Prior art keywords
content
web page
procedure
search
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002121435A
Other languages
English (en)
Other versions
JP4042100B2 (ja
Inventor
Ryuichi Matsuzaki
隆一 松崎
Yasuhiro Satake
康宏 佐竹
Masaaki Matsuura
正明 松浦
Takashi Inoue
貴司 井上
Yasushi Tokunaga
裕史 徳永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2002121435A priority Critical patent/JP4042100B2/ja
Publication of JP2003316914A publication Critical patent/JP2003316914A/ja
Application granted granted Critical
Publication of JP4042100B2 publication Critical patent/JP4042100B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

(57)【要約】 【課題】 Webロボットによる不正利用コンテンツ等
の探索における最適な探索条件情報の割り出しを自動的
に行う。 【解決手段】 収集したWebページ内のコンテンツが
不正利用されているか否か判断するために、Webロボ
ットによるWebページ収集を開始する起点URLの選
定を適切に行うために、類似度算出部11により、当該
コンテンツのCIDやメディア種別等、各コンテンツの
特徴を示すプロファイル情報に基づき、原本コンテンツ
に類似した不正利用コンテンツ事例を選び、探索条件導
出部12により、最も類似する不正利用コンテンツ事例
を選定し、当該事例の不正利用コンテンツを掲載するサ
イトのURLを起点URLとする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ネットワーク上に
散在するWebページの中からデジタルコンテンツを探
索する技術に係わり、特に、不正デジタルコンテンツの
探索を効率化するのに好適なコンテンツ探索技術に関す
るものである。
【0002】
【従来の技術】xDSL(Digital Subscriber Line)
やFTTH(Fiber To The Home)等、アクセスサービ
スの広帯域化が進み、またCDN(Contents Delivery
Network)用プラットフォームが相次いで登場するな
ど、インターネット等のネットワークを介したデジタル
コンテンツの流通に向けた技術基盤が整いつつある。
【0003】しかし、一方で、違法コピーや改竄、著作
権やプライバシーの侵害といったコンテンツの不正利用
の問題が顕在化してきており、コンテンツ流通ビジネス
の発展を妨げる要因となっている.
【0004】例えば、デジタルコンテンツは、その複製
や編集が容易であるため、コンテンツの配信を受けた購
入者が、配信コンテンツを不正にコピーしたり編集した
上で、この不正利用コンテンツをWebページに掲載す
ることが容易にできる。
【0005】こうした状況に対応するため、電子商取引
の課題を世界的規模で検討するGBDe(Global Buisi
ness Dialogue on Electronic Commerce)が、不正利用
コンテンツ発見後にISP(Internet Services ProvI
Der)等の関連事業者がとるべき措置に関して、N&T
(Notice and Takedown:通告と削除)と呼ぶルールを
勧告している。また、暗号化に基づくカプセル化技術等
により許諾された環境以外でのコンテンツ利用を制限す
ることが行われている。
【0006】さらに、ネットワーク上に掲載されている
不正利用コンテンツを発見する従来技術として、探索ロ
ボット(Webロボット)と呼ばれるプログラムを利用
するものがある。すなわち、探索ロボット(Webロボ
ット)により、ネットワーク上からWebページを収集
し、収集したWebページからデジタルコンテンツを検
出して、コンテンツの不正利用の有無を判別するもので
ある。
【0007】このWebロボットによる探索の実行にお
いて、Webロボットが探索処理を開始する際の手がか
りとする起点URL(Webロボットによる探索の起点
となるWebぺージのURL:Uniform Resource Locat
or)等の探索条件情報は、不正利用コンテンツ発見業務
に従事する担当者により、自身の経験や職場でのノウハ
ウ等の暗黙知をもとに割り出され、Webロボットに引
き渡される。
【0008】しかし、このように人間の暗黙知に頼るだ
けでは、探索条件情報を体系的に管理する仕組みが無い
ために、有意な探索を実行するのに、探索条件を何回も
変えて探索をやり直す等、試行錯誤が避けられない。こ
のため、不正利用コンテンツ発見業務に従事する担当者
の負担が大きくなり、また不正利用コンテンツを発見す
るまでの時間を長引かせることになる。
【0009】
【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、例えばWebロボットによる不
正利用等されたコンテンツの探索において、探索条件情
報の割り出しは、人間の暗黙知に頼るだけであり、探索
条件情報を体系的に管理することができない点である。
【0010】本発明の目的は、これら従来技術の課題を
解決し、特に不正利用コンテンツの探索を高効率化する
ことを可能とすることである。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、ネットワーク上に掲載されている例えば
不正利用コンテンツを発見するために探索ロボット(W
ebロボット)によりネットワーク上からWebページ
を収集し、そこから摘出したコンテンツを、電子透かし
/DCD(Distributed Content Descriptor)等による
コンテンツ認証技術により、原本コンテンツの著作権情
報と照合し、不正利用されているか否か判断するという
一連の処理(不正掲載探索)を行う際に、探索ロボット
(Webロボット)によるネットワーク上からのWeb
ページの収集を開始する起点URLの選定を適切に行う
ものである。この適切な起点URLの選定のために、い
わゆるコンテンツID(CID)と呼ばれる技術を利用
して、当該コンテンツのCIDや、メディア情報、内
容、制作者、配信期間といった、各コンテンツの特徴を
示す属性情報(プロファイル情報)を用いる。すなわ
ち、この属性情報(プロファイル情報)を、与えられた
原本コンテンツに類似した不正利用コンテンツ事例を選
ぶための判断材料として用いる。そして、例えば、類似
度が高いと評価された結果に基づき選ばれた不正利用コ
ンテンツを有するサイトのURLを、原本コンテンツの
不正利用の探索時の起点URLとみなす。
【0012】
【発明の実施の形態】以下、本発明の実施の形態を、図
面により詳細に説明する。
【0013】図1は、本発明に係わるコンテンツ探索情
報管理システムを具備したコンテンツ探索システムの構
成例を示すブロック図であり、図2は、図1における不
正利用コンテンツ探索システムの動作例を示す説明図で
ある。
【0014】図1におけるコンテンツ探索システムは特
に不正利用コンテンツを探索するものであり、この不正
利用コンテンツ探索システム1は、CPU(Central Pr
ocessing Unit)や主メモリ、表示装置、入力装置、外
部記憶装置等からなるコンピュータ構成となっており、
光ディスク駆動装置等を介してCD−ROM等の記憶媒
体に記録されたプログラムやデータを外部記憶装置内に
インストールした後、この外部記憶装置から主メモリに
読み込みCPUで処理することにより、以下に示す各処
理機能を構成する。
【0015】本例の不正利用コンテンツ探索システム1
は、コンテンツ探索情報管理システム10と不正利用コ
ンテンツ検出システム20からなり、ネットワーク30
において不正利用されているコンテンツ(不正利用コン
テンツ)の探索を行う。
【0016】コンテンツ探索情報管理システム10は、
類似度算出部11、探索条件導出部12、利権情報デー
タベース13、コンテンツ不正利用事例データベース1
4、事例情報作成部15を有し、また不正利用コンテン
ツ検出システム20は、コンテンツ探索部21、コンテ
ンツ抽出部22、不正利用判定部23を有している。
【0017】このような構成からなる本例の不正利用コ
ンテンツ探索システム1は、例えば、東条、佐竹、中
山、堀岡等による「デジタル権利管理のためのコンテン
ツ不正掲載探索システムの検討」(信学技報 TM20
01−30(2001−7))や、松浦、松崎、井上、
佐竹、徳永等による「不正掲載探索サービスにおけるサ
ービス管理の検討」(信学技報 TM2001−81
(2002−1))に記載のシステムの性能を向上させ
る。
【0018】すなわち、探索ロボット(Webロボッ
ト)によるWebページ収集技術と電子透かし/DCD
等によるコンテンツ認証技術とを統合したコンテンツ不
正掲載探索システムにおいて、ネットワーク上に掲載さ
れている不正利用コンテンツを発見するため、探索ロボ
ット(Webロボット)によりネットワーク上からWe
bページを収集し、そこから摘出したコンテンツを、電
子透かし/DCD等によるコンテンツ認証技術により、
原本コンテンツの著作権情報と照合し、不正利用されて
いるか否か判断するという一連の処理(不正掲載探索)
を行う際に、本例では、探索ロボット(Webロボッ
ト)によるネットワーク上からのWebページの収集を
開始する起点URLの選定を、適切に行う。
【0019】具体的には、適切な起点URLの選定のた
めに、本例では、産学協同のコンソーシアムであるコン
テンツIDフォーラム(cIDf)で制定されている、
コンテンツの著作権保護のための電子透かしやDCD
(Distributed Content Descriptor)といった技術を考
慮した「コンテンツID(CID)」と呼ばれる技術を
利用して、当該コンテンツのCIDや、メディア情報、
内容、制作者、配信期間といった、各コンテンツの特徴
を示すプロファイル情報を用いる。
【0020】尚、コンテンツIDは、世界に唯一のRA
(レジストレーション・オーソリティ)監督のもと、各
コンテンツホルダやコンテンツ発行者自身、または第三
者がそれぞれ運営するコンテンツID管理センタより払
い出され、コンテンツごとに、ヘッダや電子透かしによ
りユニークなコンテンツIDが埋め込まれ、コンテンツ
に関する情報(属性情報)が、コンテンツIDをキーに
各コンテンツID管理センタが運営するデータベース
(IPR−DB)で管理される。
【0021】このようなコンテンツIDを用いることで
提供される機能として、コピーライト機能(だれでもコ
ンテンツの権利関係や作成年月日などの属性情報を知る
ことができるようになる)、コンテンツ属性検索機能
(コンテンツを同一基準で検索したり取り寄せたりする
ことができる)、バーコード機能(業者や業界にまたが
るコンテンツの流通履歴や販売履歴などの収集が効率的
に行える)などと共に不正利用検出機能や正当性検証機
能がある。
【0022】この不正利用検出機能では、コンテンツI
Dをキーに、ネットワーク上の不正利用コンテンツを検
出できる。また、コンテンツの利用条件を参照し、利用
条件遵守の仕組みを構築することもできる。また、正当
性検証機能では、該当コンテンツが正式な著者から発行
され、その後不正改竄が行われていないことの証明な
ど、コンテンツ正当性をチェックすることができる。
【0023】本例では、このようなコンテンツIDを含
むプロファイル情報を、与えられた原本コンテンツに類
似した不正利用コンテンツ事例を選ぶための判断材料と
して用いる。そして、類似度が高いと評価された結果に
基づき選ばれた、不正利用コンテンツを有するサイトの
URLを、原本コンテンツにとっての不正利用探索用の
起点URLとみなす。
【0024】以下、このような動作に関わる不正利用コ
ンテンツ探索システム1におけるコンテンツ探索情報管
理システム10および不正利用コンテンツ検出システム
20のそれぞれの詳細を説明する。
【0025】コンテンツ探索情報管理システム10は、
不正利用コンテンツの探索を開始する際の起点URLの
特定(選定)処理を行い、また、不正利用コンテンツ検
出システム20は、コンテンツ探索情報管理システム1
0で特定(選定)される起点URLを起点として、We
bロボットによる不正利用コンテンツの探索を行う。
【0026】コンテンツ探索情報管理システム10で
は、まず、コンテンツ不正利用事例データベース14に
おいて、コンテンツを特定する識別番号であるコンテン
ツID、当該コンテンツに関する不正利用サイトのUR
L等の不正利用状況に関する情報に加え、当該コンテン
ツの権利属性情報(プロファイル情報)等を関連付けて
レコード化して、図5に示す構成で記録する。以下、図
5の説明を行う。
【0027】図5は、図1におけるコンテンツ不正利用
事例データベースのデータ構造例を示す説明図である。
【0028】図5に示すコンテンツ不正利用事例データ
ベース14で保持するデータレコード例では、「不正掲
載ページURL」といった、コンテンツの不正利用状況
を示す情報に加え、「コンテンツ識別情報」、「メディ
ア種別」、「内容」、「製作者」、「配信期間」等の情
報が記録されている。
【0029】これらの「コンテンツ識別情報」、「メデ
ィア種別」、「内容」、「製作者」、「配信期間」等の
情報は、図1の権利情報データベース13で管理される
プロファイル情報であり、コンテンツ不正利用事例デー
タベース14においては、これらのプロファイル情報が
「不正掲載ページURL」に結びつけられている。
【0030】図1に戻り、コンテンツ探索情報管理シス
テム10では、権利情報データベース13において、コ
ンテンツ識別情報をキーに、当該コンテンツの内容、メ
ディア種別、製作者、配信期間、許容利用形態等の権利
情報(プロファイル情報)を集約して記録する。
【0031】さらに、類似度算出部11においては、不
正利用の鑑定対象である原本コンテンツの識別情報(C
ID)を入力として、権利情報データベース13とコン
テンツ不正利用事例データベース14のそれぞれにリー
ドアクセスし、権利情報データベース13に記録されて
いる原本コンテンツのプロファイル情報と、不正利用事
例データベース14に記録されているコンテンツのプロ
ファイル情報との照合を行うことにより、コンテンツ間
の類似度を算出する。
【0032】そして、探索条件導出部12においては、
類似度算出部11で出力した類似度を入力とし、探索条
件(起点URL)の導出を行う。このようにして探索条
件導出部12において導出した検索条件(起点URL)
を、コンテンツ探索情報管理システム10は、不正利用
コンテンツ検出システム20に渡す。
【0033】また、事例情報作成部15は、不正利用コ
ンテンツが発見された場合に、その不正発見事例に関す
る情報を、権利情報データベース13を参照して集約
し、当該コンテンツに関する権利情報(プロファイル情
報)等の関連付けを行い、不正利用事例データベース1
4に記録する。
【0034】不正利用コンテンツ検出システム20は、
原本コンテンツと探索条件を入力として、不正利用コン
テンツを摘出するものであり、まず、コンテンツ探索部
21において、Webロボットの作用によりネットワー
ク30上からコンテンツを探索し収集する。この際、コ
ンテンツ探索部21は、コンテンツ探索情報管理システ
ム10から渡された起点URLから、Webページのコ
ンテンツ検索・収集を開始する。
【0035】そして、不正利用コンテンツ検出システム
20は、コンテンツ抽出部22において、コンテンツ探
索部21が探索し収集したWebぺージからコンテンツ
を抽出し、さらに、不正利用判定部23において、コン
テンツ抽出部22が取り出したコンテンツから、電子透
かしやDCDといった技術を使って埋め込まれている情
報と、原本コンテンツの著作権情報とを比較することに
より、コンテンツの不正利用の有無を判定する。
【0036】以下、図2を用いて、このような動作にお
ける情報の流れの経過を説明する。
【0037】まず、不正利用コンテンツ検出システム2
0における不正利用コンテンツ検出の鑑定基準となる、
原本コンテンツの識別情報(CID)が類似度算出部1
1に入力される(a)。
【0038】類似度算出部11は、権利情報データベー
ス13にアクセスして(b)原本コンテンツについての
権利情報(プロファイル情報)を取得し(c)、コンテ
ンツ不正利用事例データベース14にアクセスして
(d)コンテンツ不正事例情報を取得した上で(e)、
コンテンツ不正利用事例毎に原本コンテンツとの間の類
似度を、取得した権利情報(プロファイル情報)に基づ
き計算し、探索条件導出部12に出力する(f)。
【0039】類似度算出部11によって出力された、コ
ンテンツ不正利用事例毎の「類似度」が、探索条件導出
部12に入力され、探索条件導出部12は、「類似度」
に基づき探索条件(起点URL)を求め、探索条件情報
として不正利用コンテンツ検出システム20に出力する
(g)。
【0040】不正利用コンテンツ検出システム20は、
探索条件導出部12からの探索条件情報(起点URL)
に基づき、ネットワーク30上のWebページの探索を
開始し、各Webページにおけるコンテンツの不正利用
の検出処理を行う。
【0041】すなわち、起点URLにおけるWebペー
ジのコンテンツを読み出し、このコンテンツのIDをキ
ーに、権利情報データベース13に対してリードアクセ
スし(h)、当該コンテンツに関しての権利情報(プロ
ファイル情報)を取得し(i)、読み出したコンテンツ
の権利情報(プロファイル情報)とを照合して、読み出
したコンテンツの正当性を判定する。
【0042】不正利用されたコンテンツであると判定し
た場合、当該コンテンツのID等を不正利用コンテンツ
情報として事例情報作成部15に送出する(j)。
【0043】事例情報作成部15は、不正利用コンテン
ツ検出システム20からの当該コンテンツのIDをキー
に、権利情報データベース13に対してリードアクセス
し(k)、当該コンテンツに関しての権利情報(プロフ
ァイル情報)を取得し(l)、当該コンテンツが掲載さ
れているWebページのURL等に付与し、不正コンテ
ンツ事例情報として、コンテンツ不正利用事例データベ
ース14に送出し、コンテンツ不正利用事例データベー
ス14において、図5に示す構成で記録する(m)。
【0044】次に、図3および図4を用いて、類似度算
出部11と探索条件導出部12の処理動作を説明する。
【0045】図3は、図1における類似度算出部の処理
動作例を示すフローチャートであり、図4は、図1にお
ける探索条件導出部の処理動作例を示すフローチャート
である。
【0046】図3に示すように、図1の類似度算出部1
1は、まず、探索対象の原本コンテンツの識別情報(C
ID)をキーとして、権利情報データベース13にアク
セスし、当該原本コンテンツの権利情報(プロファイル
情報)を検索する(ステップS301)。
【0047】そして、コンテンツ不正利用事例データベ
ース14より、コンテンツの不正利用事例を取得し(ス
テップS302)、ステップS301で検索した原本コ
ンテンツの権利情報(プロファイル情報)とを比較対照
し、類似度を算出する(ステップS303)。尚、この
ステップS303での処理は、ステップS302で取得
したコンテンツ不正利用事例件数分繰り返す。
【0048】この類似度の算出には、「g(t,c)=
Σw×d(t,c) … i=1〜n」の式で定
義される評価関数(「g(*,*)」)により取り扱
う。この式において、添字の「i」は、比較対照する属
性を区別するための記号であり、「n」は、比較対照す
る属性の個数が「n個」であることを示す記号である。
【0049】また、「t」は属性「i」での原本コン
テンツでの値、「c」は属性「i」でのコンテンツ不
正利用事例の値である。
【0050】評価関数(「g(*,*)」)はターゲッ
トと比較対象の事例の間のギャップであり、「d(t,
c)」は各属性ごとのギャップ、「w」は属性毎に定義
される重み付けを示す。
【0051】属性が数値の場合には、「d(t,c)=
|T−C|/M … (T:原本コンテンツでの値、
C:コンテンツ不正事例の値、M;当該属性でとりうる
最大値)」となり、また、属性が文字列の場合、「d
(t,c)=0 … (tとcが一致する場合)」、
「d(t,c)=1 … (tとcが一致しない場
合)」となる。
【0052】本例では、結果的に、評価関数(「g
(*,*)」)の値が最も小さくなるような事例を、最
も類似度が高い最適事例として、図1の探索条件導出部
12において選定する。
【0053】すなわち、図4に示すように、図1の探索
条件導出部12は、コンテンツ不正事例毎に類似度算出
部11で算出された類似度をソートし(ステップS40
1)、最も類似度の高いコンテンツ不正事例を選び出す
(ステップS402)。
【0054】そして、選んだコンテンツ不正事例情報か
ら、その不正事例を掲載しているWebページのURL
情報を読み出し、原本コンテンツの不正利用をWebロ
ボットで探索する際の起点URLとする(ステップS4
04)。
【0055】以上、図1〜図5を用いて説明したよう
に、本例では、正規のコンテンツの権利情報属性を、当
該コンテンツを特定する識別番号であるコンテンツID
に対応付けて権利情報データベース13に記憶し、ま
た、検出した不正利用コンテンツに関して、そのコンテ
ンツID、当該コンテンツに関する不正利用サイトのU
RL等の不正利用事例情報、当該コンテンツの権利属性
等を関連付けてレコード化したコンテンツ不正利用事例
情報を集約してコンテンツ不正利用事例データベース1
4に記憶する。
【0056】そして、不正利用の鑑定対象である原本コ
ンテンツの権利情報属性を権利情報データベース13か
ら読み出し、この原本コンテンツの権利情報属性と不正
利用事例データベース14に記録された各コンテンツの
権利情報属性との照合を行うことにより、コンテンツ間
の類似度を算出し、その類似度をキーに各コンテンツ不
正利用事例をソートし、最も類似しているコンテンツ不
正利用事例を摘出し、この不正利用コンテンツ掲載のあ
ったWebぺージのURL等を、鑑定対象としている原
本コンテンツにふさわしい探索条件とみなすことによ
り、探索条件を導出する。
【0057】このように、本例では、不正利用の鑑定対
象である原本コンテンツに最も類似する不正利用事例を
掲載したサイトを起点として、Webロボットによる探
索を行うことができ、従来のように探索条件を何回も変
えて探索をやり直す等、試行錯誤を経ることなく、有意
な探索を実行することができる。その結果、不正利用コ
ンテンツ発見業務に従事する担当者の負担が小さくな
り、また不正利用コンテンツを発見するまでの時間も短
縮される。
【0058】本例の技術を利用することにより、例えば
コンテンツ流通事業者は、コンテンツの不正利用監視と
いう、コンテンツホルダ(正規所有者)向けのマネジメ
ントサービスを、コンテンツ流通サービスと抱き合わせ
たり、または、単独で提供することが可能となる。ま
た、結果報告をもとに、コンテンツホルダが法律事務所
等の第三者機関を通じて、不正利用コンテンツを掲載し
ていたプロバイダに掲載削除の依頼をし、この依頼に従
い、プロバイダが不正利用掲載を削除するといった「N
&T」の促進も期待される。
【0059】尚、本発明は、図1〜図5を用いて説明し
た例に限定されるものではなく、その要旨を逸脱しない
範囲において種々変更可能である。例えば、図1に示す
例では、1台のコンピュータで、コンテンツ探索情報管
理システム10と不正利用コンテンツ検索システム20
からなる不正利用コンテンツ探索システム1を構成して
いるが、コンテンツ探索情報管理システム10と不正利
用コンテンツ検索システム20のそれぞれを個別のコン
ピュータで構成し、ネットワーク接続する構成としても
良い。
【0060】また、本例では、不正利用コンテンツの探
索システムを例に説明したが、不正利用コンテンツに限
らず、特定のコンテンツを検出するシステム等にも適用
することができる。すなわち、図1における不正利用コ
ンテンツ探索システム1において、コンテンツ探索情報
管理システム10のコンテンツ不正利用事例データベー
ス14における各事例を不正利用コンテンツに限定せ
ず、例えば、注目度の高いコンテンツの事例を管理する
ものとし、また、不正利用コンテンツ検索システム20
に関しても当システムを例えばWebブラウザとし、コ
ンテンツ探索情報管理システム10の出力結果を、この
WebブラウザのURL入力欄に自動で引き渡すことに
より、特定コンテンツの検出を行うことでも良い。
【0061】また、このコンピュータ構成において、本
例では、光ディスクを記録媒体として用いているが、F
D(Flexible Disk)等を記録媒体として用いることで
も良い。また、プログラムのインストールに関しても、
通信装置を介してネットワーク経由でプログラムをダウ
ンロードしてインストールすることでも良い。
【0062】
【発明の効果】本発明によれば、Webロボットによる
コンテンツの探索において、最適な探索条件情報の割り
出しを自動的に行うことができるので、例えば、不正利
用コンテンツ発見業務に従事する担当者の負担を軽減で
き、かつ不正利用コンテンツを発見するまでの時間も短
縮でき、不正利用コンテンツ等の探索を高効率化するこ
とが可能である。
【図面の簡単な説明】
【図1】本発明に係わるコンテンツ探索情報管理システ
ムを具備したコンテンツ探索システムの構成例を示すブ
ロック図である。
【図2】図1における不正利用コンテンツ探索システム
の動作例を示す説明図である。
【図3】図1における類似度算出部の処理動作例を示す
フローチャートである。
【図4】図1における探索条件導出部の処理動作例を示
すフローチャートである。
【図5】図1におけるコンテンツ不正利用事例データベ
ースのデータ構造例を示す説明図である。
【符号の説明】
1:不正利用コンテンツ探索システム、10:コンテン
ツ探索情報管理システム、11:類似度算出部、12:
探索条件導出部、13:権利情報データベース、14:
コンテンツ不正利用事例データベース、15:事例情報
作成部、20:不正利用コンテンツ検出システム、2
1:コンテンツ探索部(「Webロボット」)、22:
コンテンツ抽出部、23:不正利用判定部、30:ネッ
トワーク。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 180 G06F 17/30 180Z 350 350C (72)発明者 松浦 正明 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 井上 貴司 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 徳永 裕史 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B017 AA06 AA07 BA09 CA16 5B075 KK02 ND36 PR06 UU16

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークを介してWebぺージを探
    索しWebページ内の不正利用コンテンツの検出を行う
    際の上記Webぺージの探索条件を導出するコンテンツ
    探索情報管理システムであって、不正に利用されたコン
    テンツの特徴を示す属性情報を不正利用コンテンツ別に
    記憶装置に記憶する手段と、上記記憶装置から読み出し
    た上記属性情報に基づきコンテンツ間の類似度を求める
    手段と、原本コンテンツに最も類似度の高い不正利用コ
    ンテンツ事例を選出する手段と、選出した事例の不正利
    用コンテンツの属性情報に基づき、上記原本コンテンツ
    を不正利用したコンテンツを掲載したWebページを検
    索するための探索条件を導出する手段とを有することを
    特徴とするコンテンツ探索情報管理システム。
  2. 【請求項2】 不正に利用されたコンテンツの特徴を示
    す属性情報を不正利用コンテンツ別に記憶装置に記憶す
    る手段と、上記記憶装置から読み出した上記属性情報に
    基づきコンテンツ間の類似度を求める手段と、原本コン
    テンツに最も類似度の高い不正利用コンテンツ事例を選
    出する手段と、選出した事例の不正利用コンテンツの掲
    載元のURLを導出する手段とを有することを特徴とす
    るコンテンツ探索情報管理システム。
  3. 【請求項3】 不正に利用されたコンテンツの特徴を示
    す属性情報を不正利用コンテンツの識別情報と当該コン
    テンツを掲載したWebページのURLを付加して記憶
    装置に記憶する手段と、上記記憶装置から読み出した上
    記属性情報に基づきコンテンツ間の類似度を求める手段
    と、原本コンテンツに最も類似度の高い不正利用コンテ
    ンツ事例を選出する手段と、選出した事例の不正利用コ
    ンテンツの掲載元のURLを導出する手段とを有するこ
    とを特徴とするコンテンツ探索情報管理システム。
  4. 【請求項4】 ネットワークを介してWebぺージを探
    索しWebページ内のコンテンツの検出を行う際の上記
    Webぺージの探索条件を導出するコンテンツ探索情報
    管理システムであって、上記コンテンツの特徴を示す属
    性情報をコンテンツ別に記憶装置に記憶する手段と、上
    記記憶装置から読み出した上記属性情報に基づきコンテ
    ンツ間の類似度を求める手段と、検出対象のコンテンツ
    に最も類似度の高いコンテンツ事例を選出する手段と、
    選出した事例のコンテンツの属性情報に基づき、上記検
    出対象のコンテンツに関連するコンテンツを掲載したW
    ebページを検索するための探索条件を導出する手段と
    を有することを特徴とするコンテンツ探索情報管理シス
    テム。
  5. 【請求項5】 Webページ内のコンテンツの特徴を示
    す属性情報をコンテンツ別に記憶装置に記憶する手段
    と、上記記憶装置から読み出した上記属性情報に基づき
    コンテンツ間の類似度を求める手段と、検出対象のコン
    テンツに最も類似度の高いコンテンツ事例を選出する手
    段と、選出した事例のコンテンツを掲載したWebペー
    ジのURLを導出する手段とを有することを特徴とする
    コンテンツ探索情報管理システム。
  6. 【請求項6】 Webページ内のコンテンツの特徴を示
    す属性情報をコンテンツの識別情報と当該コンテンツを
    掲載したWebページのURLを付加して記憶装置に記
    憶する手段と、上記記憶装置から読み出した上記属性情
    報に基づきコンテンツ間の類似度を求める手段と、検出
    対象のコンテンツに最も類似度の高いコンテンツ事例を
    選出する手段と、選出した事例のコンテンツの掲載元の
    WebページのURLを導出する手段とを有することを
    特徴とするコンテンツ探索情報管理システム。
  7. 【請求項7】 ネットワークを介してWebぺージを探
    索しWebページ内の不正利用コンテンツの検出を行う
    際の上記Webぺージの探索条件を導出するシステムの
    コンテンツ探索情報管理方法であって、不正に利用され
    たコンテンツの特徴を示す属性情報を不正利用コンテン
    ツ別に記憶装置に記憶する手順と、上記記憶装置から読
    み出した上記属性情報に基づきコンテンツ間の類似度を
    求める手順と、原本コンテンツに最も類似度の高い不正
    利用コンテンツ事例を選出する手順と、選出した事例の
    不正利用コンテンツの属性情報に基づき、上記原本コン
    テンツを不正利用したコンテンツを掲載したWebペー
    ジを検索するための探索条件を導出する手順とを有する
    ことを特徴とするコンテンツ探索情報管理方法。
  8. 【請求項8】 不正に利用されたコンテンツの特徴を示
    す属性情報を不正利用コンテンツ別に記憶装置に記憶す
    る手順と、上記記憶装置から読み出した上記属性情報に
    基づきコンテンツ間の類似度を求める手順と、原本コン
    テンツに最も類似度の高い不正利用コンテンツ事例を選
    出する手順と、選出した事例の不正利用コンテンツの掲
    載元のURLを導出する手順と、導出したURLを、W
    ebぺージの探索と該Webページ内の不正利用コンテ
    ンツの検出を行うシステムに送出する手順とを有するこ
    とを特徴とするコンテンツ探索情報管理方法。
  9. 【請求項9】 不正に利用されたコンテンツの特徴を示
    す属性情報を不正利用コンテンツの識別情報と当該コン
    テンツを掲載したWebページのURLを付加して記憶
    装置に記憶する手順と、上記記憶装置から読み出した上
    記属性情報に基づきコンテンツ間の類似度を求める手順
    と、原本コンテンツに最も類似度の高い不正利用コンテ
    ンツ事例を選出する手順と、選出した事例の不正利用コ
    ンテンツの掲載元のURLを導出する手順とを有するこ
    とを特徴とするコンテンツ探索情報管理方法。
  10. 【請求項10】 ネットワークを介してWebぺージを
    探索しWebページ内のコンテンツの検出を行う際の上
    記Webぺージの探索条件を導出するシステムのコンテ
    ンツ探索情報管理方法であって、上記コンテンツの特徴
    を示す属性情報をコンテンツ別に記憶装置に記憶する手
    順と、上記記憶装置から読み出した上記属性情報に基づ
    きコンテンツ間の類似度を求める手順と、検出対象のコ
    ンテンツに最も類似度の高いコンテンツ事例を選出する
    手順と、選出した事例のコンテンツの属性情報に基づ
    き、上記検出対象のコンテンツに関連するコンテンツを
    掲載したWebページを検索するための探索条件を導出
    する手順とを有することを特徴とするコンテンツ探索情
    報管理方法。
  11. 【請求項11】 Webページ内のコンテンツの特徴を
    示す属性情報をコンテンツ別に記憶装置に記憶する手順
    と、上記記憶装置から読み出した上記属性情報に基づき
    コンテンツ間の類似度を求める手順と、検出対象のコン
    テンツに最も類似度の高いコンテンツ事例を選出する手
    順と、選出した事例のコンテンツを掲載したWebペー
    ジのURLを導出する手順と、導出したURLを、We
    bぺージの探索と該Webページ内のコンテンツの検出
    を行うシステムに送出する手順とを有することを特徴と
    するコンテンツ探索情報管理方法。
  12. 【請求項12】 Webページ内のコンテンツの特徴を
    示す属性情報をコンテンツの識別情報と当該コンテンツ
    を掲載したWebページのURLを付加して記憶装置に
    記憶する手順と、上記記憶装置から読み出した上記属性
    情報に基づきコンテンツ間の類似度を求める手順と、検
    出対象のコンテンツに最も類似度の高いコンテンツ事例
    を選出する手順と、選出した事例のコンテンツの掲載元
    のURLを導出する手順とを有することを特徴とするコ
    ンテンツ探索情報管理方法。
  13. 【請求項13】 ネットワークを介してWebぺージを
    探索しWebページ内の不正利用コンテンツの検出を行
    うコンテンツ探索システムであって、不正利用コンテン
    ツの特徴を示す属性情報を不正利用コンテンツ別に記憶
    装置に記憶する手段と、上記属性情報に基づき原本コン
    テンツに類似する不正利用コンテンツ事例を特定する手
    段と、特定した不正利用コンテンツ事例から、原本コン
    テンツに最も類似する不正利用コンテンツ事例を選出す
    る手段と、選出した事例の不正利用コンテンツの検出元
    のWebページを起点にWebぺージの探索とWebペ
    ージ内の不正利用コンテンツの検出を行う手段とを有す
    ることを特徴とするコンテンツ探索システム。
  14. 【請求項14】 ネットワークを介してWebぺージを
    探索しWebページ内のコンテンツの検出を行うコンテ
    ンツ探索システムであって、コンテンツの特徴を示す属
    性情報をコンテンツ別に記憶装置に記憶する手段と、上
    記属性情報に基づき検出対象のコンテンツに類似するコ
    ンテンツ事例を特定する手段と、特定したコンテンツ事
    例から、検出対象のコンテンツに最も類似するコンテン
    ツ事例を選出する手段と、選出した事例のコンテンツの
    検出元のWebページを起点にWebぺージの探索とW
    ebページ内のコンテンツの検出を行う手段とを有する
    ことを特徴とするコンテンツ探索システム。
  15. 【請求項15】 ネットワークを介してWebぺージを
    探索しWebページ内の不正利用コンテンツの検出を行
    うシステムのコンテンツ探索方法であって、不正利用コ
    ンテンツの特徴を示す属性情報を不正利用コンテンツ別
    に記憶装置に記憶する手順と、上記記憶装置から読み出
    した上記属性情報に基づき原本コンテンツに類似する不
    正利用コンテンツ事例を特定する手順と、特定した不正
    利用コンテンツ事例から、原本コンテンツに最も類似す
    る不正利用コンテンツ事例を選出する手順と、選出した
    事例の不正利用コンテンツの検出元のWebページを起
    点にWebぺージの探索とWebページ内の不正利用コ
    ンテンツの検出を行う手順とを有することを特徴とする
    コンテンツ探索方法。
  16. 【請求項16】 ネットワークを介してWebぺージを
    探索しWebページ内のコンテンツの検出を行うシステ
    ムのコンテンツ探索方法であって、コンテンツの特徴を
    示す属性情報をコンテンツ別に記憶装置に記憶する手順
    と、上記記憶装置から読み出した上記属性情報に基づき
    検出対象のコンテンツに類似するコンテンツ事例を特定
    する手順と、特定したコンテンツ事例から、検出対象コ
    ンテンツに最も類似するコンテンツ事例を選出する手順
    と、選出した事例のコンテンツの検出元のWebページ
    を起点にWebぺージの探索とWebページ内のコンテ
    ンツの検出を行う手順とを有することを特徴とするコン
    テンツ探索方法。
  17. 【請求項17】 コンピュータに、請求項7から請求項
    12のいずれかに記載のコンテンツ探索情報管理方法に
    おける各手順を実行させるためのプログラム。
  18. 【請求項18】 コンピュータに、請求項15もしくは
    請求項16のいずれかに記載のコンテンツ探索方法にお
    ける各手順を実行させるためのプログラム。
JP2002121435A 2002-04-23 2002-04-23 コンテンツ探索情報管理システムと方法およびコンテンツ探索方法ならびにプログラム Expired - Fee Related JP4042100B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002121435A JP4042100B2 (ja) 2002-04-23 2002-04-23 コンテンツ探索情報管理システムと方法およびコンテンツ探索方法ならびにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002121435A JP4042100B2 (ja) 2002-04-23 2002-04-23 コンテンツ探索情報管理システムと方法およびコンテンツ探索方法ならびにプログラム

Publications (2)

Publication Number Publication Date
JP2003316914A true JP2003316914A (ja) 2003-11-07
JP4042100B2 JP4042100B2 (ja) 2008-02-06

Family

ID=29537373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002121435A Expired - Fee Related JP4042100B2 (ja) 2002-04-23 2002-04-23 コンテンツ探索情報管理システムと方法およびコンテンツ探索方法ならびにプログラム

Country Status (1)

Country Link
JP (1) JP4042100B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096608A (ja) * 2005-09-28 2007-04-12 Yafoo Japan Corp 不正画像検出装置、方法、プログラム
WO2007052988A1 (en) * 2005-11-07 2007-05-10 Qboxdotcom Corp. System and method for providing on-line multimedia contents
JP2010086531A (ja) * 2008-10-02 2010-04-15 Nhn Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
JP2010514071A (ja) * 2006-12-22 2010-04-30 ヤフー! インコーポレイテッド 未承認コンテンツを検出し、報告するための方法及びシステム
JP2020512630A (ja) * 2017-03-17 2020-04-23 ライブランプ インコーポレーテッド 漏洩したデータを識別し、疑わしい漏洩者に有罪性を割り当てるためのシステム及び方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11436214B2 (en) 2019-04-16 2022-09-06 International Business Machines Corporation Preventing search fraud
US11403354B2 (en) 2019-04-16 2022-08-02 International Business Machines Corporation Managing search queries of a search service
US11403356B2 (en) 2019-04-16 2022-08-02 International Business Machines Corporation Personalizing a search of a search service
US11176134B2 (en) 2019-04-16 2021-11-16 International Business Machines Corporation Navigation paths between content items
US11244007B2 (en) 2019-04-16 2022-02-08 International Business Machines Corporation Automatic adaption of a search configuration
US11210352B2 (en) 2019-04-16 2021-12-28 International Business Machines Corporation Automatic check of search configuration changes
US10956430B2 (en) 2019-04-16 2021-03-23 International Business Machines Corporation User-driven adaptation of rankings of navigation elements

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096608A (ja) * 2005-09-28 2007-04-12 Yafoo Japan Corp 不正画像検出装置、方法、プログラム
WO2007052988A1 (en) * 2005-11-07 2007-05-10 Qboxdotcom Corp. System and method for providing on-line multimedia contents
JP2010514071A (ja) * 2006-12-22 2010-04-30 ヤフー! インコーポレイテッド 未承認コンテンツを検出し、報告するための方法及びシステム
JP2010086531A (ja) * 2008-10-02 2010-04-15 Nhn Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
KR101086530B1 (ko) 2008-10-02 2011-11-23 엔에이치엔(주) 웹 문서 원본 판별 방법 및 시스템, 이를 위한 웹 문서 이력 정보 제공 방법 및 시스템
JP2014038650A (ja) * 2008-10-02 2014-02-27 Naver Corp ウェブ文書原本判別方法およびウェブ文書原本判別システム、並びにウェブ文書履歴情報提供方法およびウェブ文書履歴情報提供方法システム
US9477769B2 (en) 2008-10-02 2016-10-25 Nhn Corporation Method and system for detecting original document of web document, method and system for providing history information of web document for the same
JP2020512630A (ja) * 2017-03-17 2020-04-23 ライブランプ インコーポレーテッド 漏洩したデータを識別し、疑わしい漏洩者に有罪性を割り当てるためのシステム及び方法
JP7046970B2 (ja) 2017-03-17 2022-04-04 ライブランプ インコーポレーテッド 漏洩したデータを識別し、疑わしい漏洩者に有罪性を割り当てるためのシステム及び方法

Also Published As

Publication number Publication date
JP4042100B2 (ja) 2008-02-06

Similar Documents

Publication Publication Date Title
US8607354B2 (en) Deriving multiple fingerprints from audio or video content
US7512607B2 (en) Content sharing system; content processing apparatus; information processing apparatus; program; recording medium; and content sharing method
US7650643B2 (en) Method, apparatus, and system for managing, reviewing, comparing and detecting data on a wide area network
US8572049B2 (en) Document authentication
US20070073837A1 (en) Online multimedia file distribution system and method
JPH11232286A (ja) 情報検索システム
JP2002055884A (ja) コンテンツ・コピー管理システム及び方法、情報処理装置及び方法、サーバ、並びに、記憶媒体
JPWO2002056580A1 (ja) コンテンツのディレクトリサービス・システム
JP5000477B2 (ja) コンテンツデータ、コンテンツ不正検出のプログラム、装置及び方法
JP2003316914A (ja) コンテンツ探索情報管理システムと方法およびコンテンツ探索システムと方法ならびにプログラム
JP2000330873A (ja) コンテンツ流通システムおよびその方法、記録媒体
CN110111218B (zh) 一种基于区块链的软件著作权管控***及方法
US20130024698A1 (en) Digital content management system, device, program and method
KR100602339B1 (ko) 워터마킹 컴퓨터 및 방법과, 워터마크의 존재 판단 컴퓨터 및 방법과, 데이터 저장부와, 컴퓨터 판독 가능 기록 매체
CN101211361B (zh) 信息处理装置、信息处理***和信息处理方法
US20210144451A1 (en) Control method, content management system, recording medium, and data structure
JP2000215238A (ja) 不正著作物検出方法
US20030120614A1 (en) Automated e-commerce authentication method and system
CN111382394A (zh) 一种图片的侵权监控方法及装置
JP3554529B2 (ja) コンテンツ管理方法、その装置およびそのプログラム記録媒体
JP2002297541A (ja) 不正利用通知方法、不正利用通知装置および不正利用通知プログラム
JP2009053896A (ja) 不正操作検出装置およびプログラム
JP2002063381A (ja) マルチメディアコンテンツの登録システム
JP2002366531A (ja) 著作権管理システム
JP2021140299A (ja) データマッチングシステム、情報処理装置およびデータマッチング方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131122

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees