JP5252593B2 - 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム - Google Patents

最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム Download PDF

Info

Publication number
JP5252593B2
JP5252593B2 JP2010180917A JP2010180917A JP5252593B2 JP 5252593 B2 JP5252593 B2 JP 5252593B2 JP 2010180917 A JP2010180917 A JP 2010180917A JP 2010180917 A JP2010180917 A JP 2010180917A JP 5252593 B2 JP5252593 B2 JP 5252593B2
Authority
JP
Japan
Prior art keywords
tag
content
optimum
cluster
tags
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010180917A
Other languages
English (en)
Other versions
JP2012042998A (ja
Inventor
勝志 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biglobe Inc
Original Assignee
Biglobe Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biglobe Inc filed Critical Biglobe Inc
Priority to JP2010180917A priority Critical patent/JP5252593B2/ja
Publication of JP2012042998A publication Critical patent/JP2012042998A/ja
Application granted granted Critical
Publication of JP5252593B2 publication Critical patent/JP5252593B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、発信装置が発信するコンテンツに挿入するタグを提案する技術に関する。
従来から、ネットワーク上のコンテンツを検索するのにキーワードが用いられており、そのための技術も提案されている(特許文献1)。
ネットワーク上のコンテンツは、企業等が提供するものが主流であったが、最近は、一般ユーザ自身が発信者となって、Webのホームページ、ブログ、ミニブログ(ツイッター等)等を、コンテンツとして発信するケースが増えている。
この種のコンテンツの特徴の1つに、発信者自身がタグ呼ばれる文字列をコンテンツに挿入できる点が挙げられる。タグとは、コンテンツのカテゴリやトピックを表す文字列であり、具体的には、Webのホームページのメタタグ、ブログの記事テーマ、ミニブログのハッシュタグ等である。
近年、コンテンツの収集者は、キーワード以外でコンテンツを検索したり収集したりするために、タグを使用することが増えている。
また、発信者には、一般的に、商業上の理由や個人のネームバリューの向上という観点から、自身が発信したコンテンツを多くの人に伝えたいという要求がある。
したがって、発信者にとっては、多くの収集者に検索・収集され得る最適なタグをコンテンツに挿入することが、自身の要求を満たすことに繋がると考えられる。
国際公開第99/14690号
しかし、従来は、コンテンツの発信者が自由にタグを作成し、コンテンツに挿入していたため、発信者によってタグが異なったり、同じ発信者であっても発信する時間によってタグが異なったりしていた。このように発信者が作成するタグに一貫性がないと、そのようなタグを収集者が使用する可能性は低くなり、その結果、発信者がせっかく発信したコンテンツが多くの人に伝わらなくなってしまう。
また、発信者によるタグの作成に自由度がありすぎるため、コンテンツの発信に不慣れな初心者などはコンテンツにタグを挿入すること自体をあきらめてしまうことが多い。
そこで、本発明の目的は、上述の課題を解決し、発信者が発信するコンテンツに挿入する最適なタグを提案することができる最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラムを提供することにある。
本発明の最適タグ提案装置は、
発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置であって、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明の最適タグ提案システムは、
コンテンツを発信する発信装置と、前記発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置と、を有してなる最適タグ提案システムであって、
前記最適タグ提案装置は、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明の最適タグ提案方法は、
発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置による最適タグ提案方法であって、
特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する。
本発明のプログラムは、
前記最適タグ提案方法をコンピュータに実行させるためのプログラムである。
本発明によれば、最適タグ提案装置は、特定の単語毎に、その特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、各タグの収集数に応じて代表タグを決定し、発信装置からタグ挿入要求を受けた場合、そのコンテンツに特定の単語が出現する度に、その特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、発信装置に返却する。
すなわち、最適タグ提案装置は、発信装置が発信しようとしているコンテンツと同じ単語が出現する他のコンテンツにおいて実際に挿入されている数が多いタグを提案することになる。
よって、発信装置の発信者は、コンテンツの発信に不慣れな初心者であったり、初めてのカテゴリやトピックでコンテンツを発信したりする場合でも、最適タグ提案装置から提案された、広く使用されているタグを選択してコンテンツに挿入することができるため、自身が発信したコンテンツを多くの人に伝えることができるという効果が得られる。
本発明の一実施形態の最適タグ提案システムの構成を示す図である。 図1に示した最適タグ提案装置の構成を示すブロック図である。 図1および図2に示した最適タグ提案装置におけるタグリストの作成動作を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグリストの作成動作を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作のイメージを説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作の動作例1を説明する図である。 図1および図2に示した最適タグ提案装置における最適タグの返却動作の動作例2を説明する図である。
以下に、本発明を実施するための形態について図面を参照して説明する。
図1を参照すると、本実施形態の最適タグ提案システムは、発信装置10−1〜10−S(Sは2以上の自然数)と、最適タグ提案装置20と、を有している。
発信装置10−1〜10−S(以下、どの発信装置であるか特定しないときは発信装置10と称す)は、コンテンツ(Webのホームページ、ブログ、ミニブログ等)を発信する。なお、発信装置10が発信したコンテンツは、最適タグ提案装置20またはコンテンツ管理サーバ(不図示)で管理され、ネットワーク上に公開されるものとする。
最適タグ提案装置20は、発信装置10から、その発信装置10が発信するコンテンツへのタグ(Webのホームページのメタタグ、ブログの記事テーマ、ミニブログのハッシュタグ等)の挿入要求を受けると、その発信装置10にタグを提案する。
なお、図1においては、発信装置10は、複数設けられていることを想定しているが、1つであっても良い。
図2を参照すると、本実施形態の最適タグ提案装置20は、タグ収集部21と、タグリストDB(Data Base)22と、最適タグ作成部23と、最適タグリストDB24と、最適タグ返却部25と、を有している。
なお、図2においては、単語DB30およびコンテンツDB40は、最適タグ提案装置20の外部に設けられていることを想定しているが、最適タグ提案装置20の内部に設けられていても良い。
単語DB30は、発信装置10が発信するコンテンツに高頻度で出現する単語(特定の単語)が登録されるDBである。この単語は、コンテンツの検索履歴等に基づき、システム管理者により予め単語DB30に登録されているものとする。
コンテンツDB40は、発信装置10が過去に発信したコンテンツが登録されるDBである。
タグ収集部21は、単語DB30に登録された単語毎に、コンテンツDB40から、その単語が出現するコンテンツおよびそのコンテンツに挿入されているタグを収集する。そして、収集したコンテンツ毎に、その単語と、収集したタグとを対応付けたタグリストを作成し、タグリストDB22に登録する。
最適タグ作成部23は、タグリストDB22に登録された単語毎に、タグリストDB22内にその単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、そのクラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定する。そして、その単語と、クラスタリングした各クラスタと、各クラスタの決定した代表タグと、を対応付けた最適タグリストを作成し、最適タグリストDB24に登録する。
最適タグ返却部25は、発信装置10から、コンテンツへのタグの挿入要求を受けた場合、そのコンテンツに最適タグリストDB24に登録された単語が出現する度に、最適タグリストDB24内にその単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定する。そして、決定した候補タグを、要求元の発信装置10に返却する。
以下、本実施形態の動作について、具体例を挙げて詳細に説明する。以下では、発信装置10が発信するコンテンツがミニブログであり、ミニブログに挿入するハッシュタグをタグとして提案するものとする。
(1)タグリストの作成動作
最初に、タグ収集部21によるタグリストの作成動作について、図3を参照して説明する。図3は、単語DB30に登録された単語「ゴルフ」についてタグリストを作成する場合の動作を示している。
図3を参照すると、タグ収集部21は、「ゴルフ」でコンテンツDB40を検索し(ステップS31)、コンテンツDB40から、「ゴルフ」が出現するコンテンツおよびそのコンテンツに挿入されているタグを収集する(ステップS32)。ここでは、3つのコンテンツが収集されたとする。
このうち、図3中の一番上のコンテンツには、「#JLPGA」、「#yokomine」という2つのタグが挿入されている。そのため、タグ収集部21は、タグリストDB22において、図3中の一番上のコンテンツについては、単語「ゴルフ」と、2つのタグ「#JLPGA」、「#yokomine」と、を対応付けする。その他のコンテンツについても同様の処理を行う。
(2)最適タグリストの作成動作
続いて、最適タグ作成部23による最適タグリストの作成動作について、図4を参照して説明する。図4は、タグリストDB22が図3の状態にある時に、タグリストDB22に登録された単語「ゴルフ」について最適タグリストを作成する場合の動作を示している。
まず、最適タグ作成部23は、「ゴルフ」でタグリストDB22を検索し、「ゴルフ」に対応付けられたタグとして出現する数が多い上位N(Nは2以上の自然数)個(図4では10個)の頻出タグを抽出する(ステップS41)。
次に、最適タグ作成部23は、単語を指定せずに全ての単語に対してタグリストDB22を検索し、タグリストDB22に出現する数が多い上位M(Mは2以上の自然数)個(図4では10個)の一般的な頻出タグを抽出する(ステップS42)。
次に、最適タグ作成部23は、ステップS41で抽出した「ゴルフ」の頻出タグの中から、ステップS42で抽出した一般的な頻出タグを除去する(ステップS43)。ここでは、2つのタグ「#followmejp」、「#ohayo」が除去されている。
次に、最適タグ作成部23は、ステップS43の処理の後に残った「ゴルフ」の頻出タグについて、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化する(ステップS44)。例えば、図3中の一番上のコンテンツには、2つのタグ「#JLPGA」、「#yokomine」が挿入されているため、これら2つのタグ同士を接続する。なお、図4のタグ間の線は、接続数が多くなるにしたがって太くなっている。
次に、最適タグ作成部23は、ステップS44の処理結果を基にクラスタリングを行う(ステップS45)。具体的には、ステップS44の処理により得られた各ネットワークをそれぞれクラスタとする。ここでは、2つのクラスタC1,C2が得られている。
次に、最適タグ作成部23は、クラスタ毎に、そのクラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定する(ステップS46)。代表タグの数は、1つに限らず複数であっても良く、クラスタに属するタグの数に応じて代表タグの数を決めても良い。ここでは、5つ以上のタグが属するクラスタの代表タグは2つとし、その他の場合は1つとする条件を採用する。クラスタC1の場合は、6つのタグが属していることから、出現数が多い上位2つのタグ「#golferJP」、「#golfJP」を代表タグとする。一方、クラスタC2の場合は、4つのタグのみが属していることから、出現数が最も多い1つのタグ「#volkswagen」のみを代表タグとする。
上述のように、同一コンテンツに挿入されているタグ同士を接続しネットワーク化することでクラスタリングを行うことにより、「ゴルフ」のような多義語(スポーツの「ゴルフ」と車の「ゴルフ」)の場合も、それぞれの意味の代表タグを得ることができる。
また、タグリストDB22内で「ゴルフ」に対応付けられている全てのタグを対象にするのではなく、頻出タグのみを対象としたり、さらには、頻出タグから一般的な頻出タグを除去した残りのタグを対象としたりするため、どのような文脈でも使われる一般的なタグを提案することを抑制したり、クラスタリングや各クラスタの代表タグの決定に要する時間の短縮化を図ることができる。
その後、最適タグ作成部23は、最適タグリストDB24において、単語「ゴルフ」と、2つのクラスタC1,C2と、2つのクラスタC1,C2の各々の代表タグと、を対応付けする。
(3)最適タグの返却動作
続いて、最適タグ返却部25による最適タグの返却動作について説明する。
(3−1)最適タグの返却動作のイメージ
最初に、最適タグの返却動作の概略的なイメージについて、図5を参照して説明する。
図5を参照すると、まず、発信者は、発信装置10上で発信するコンテンツを入力し(ステップS51)、タグを挿入する場合は「タグ」ボタンをクリックする(ステップS52)。
次に、発信装置10は、発信者のコンテンツを添付したタグ挿入要求を最適タグ提案装置20に送信する(ステップS53)。これを受けて、最適タグ提案装置20の最適タグ返却部25は、コンテンツに挿入するタグの候補となる候補タグを発信装置10に返却する(ステップS54)。ここでは、3つの候補タグ「#golferJP」、「#golfJP」、「#volkswagen」が提案されているが、候補タグの選定方法については後述する。
次に、発信者は、候補タグのいずれかを選択し(ステップS55)、「OK」ボタンをクリックすると、発信装置10は、発信者に選択されたタグをコンテンツに挿入する。ここでは、タグ「#golfJP」が挿入されている。
その後、発信者は、コンテンツを発信する際に、「発信」ボタンをクリックすると(ステップS56)、発信装置10は、タグが挿入されたコンテンツを発信する。
(3−2)最適タグの返却動作の動作例1
続いて、最適タグの返却動作の具体的な動作例1について、図6を参照して説明する。図6は、図5のコンテンツへのタグの挿入要求を受けた場合の動作を示している。また、図6は、この時の最適タグリストDB24の状態も併せて示している。
図6を参照すると、まず、最適タグ返却部25は、発信装置10からタグ挿入要求を受けたコンテンツの形態素解析を行い、コンテンツからストップワードを除去する(ステップS61)。図6では、助詞や助動詞等の一般的な品詞だけをストップワードとしているが、一般名詞や固有名詞以外の品詞を全てストップワードとしても良い。
次に、最適タグ返却部25は、最適タグリストDB24から、ステップS61の処理の後に残った単語のクラスタを収集する(ステップS62)。このとき、最適タグリストDB24に登録されていない単語については無視する。したがって、結果的には、最適タグ返却部25は、コンテンツに出現する単語のうち、最適タグリストDB24に登録されている単語についてのみ、クラスタを収集することになる。
次に、最適タグ返却部25は、最適タグリストDB24から収集した各クラスタの収集数を列挙したリストを作成する(ステップS63)。
その後、最適タグ返却部25は、収集数が多い上位P(Pは2以上の自然数)個(図6では2個)のクラスタを抽出し、抽出した各クラスタの代表タグを候補タグとして決定し、発信装置10に返却する(ステップS64)。ここでは、P=2とし、収集数が最も多い2個のクラスタC1,C2について、クラスタC1の2つの代表タグ「#golferJP」、「#golfJP」と、クラスタC2の1つの代表タグ「#volkswagen」と、が返却されている。
上述のように、最適タグリストDB24からの収集数が多い複数のクラスタの代表タグを返却することにより、「ゴルフ」のような多義語(スポーツの「ゴルフ」と車の「ゴルフ」)の場合も、それぞれの意味の代表タグを返却することができる。
(3−3)最適タグの返却動作の動作例2
続いて、最適タグの返却動作の具体的な動作例2について、図7を参照して説明する。図7は、図5のコンテンツへのタグの挿入要求を受けた場合の動作を示している。また、図7は、この時の最適タグリストDB24の状態も併せて示している。
図7を参照すると、まず、最適タグ返却部25は、図6と同様に、ステップS61〜S63の処理を行う。
最適タグ返却部25は、最適タグリストDB24からクラスタを収集する度に、そのクラスタに対応付けられている代表タグを収集するものとして、続いて、各代表タグの収集数を列挙したリストを作成する(ステップS71)。例えば、代表タグ「#golferJP」は、クラスタC1で2回、クラスタC3で1回、クラスタC65で1回、クラスタC301で1回収集されるため、収集数は計5個となる。
その後、最適タグ返却部25は、収集数が多い上位Q(Qは2以上の自然数)個(図7では3個)の代表タグを候補タグとして決定し、発信装置10に返却する(ステップS72)。ここでは、Q=3とし、収集数が多い上位3個の代表タグ「#golferJP」、「#golfJP」、「#volkswagen」が返却されている。すなわち、結果的には、本動作例でも、図6の動作例1と同様の候補タグが返却されることになる。
なお、本動作例においては、ステップS62において、ステップS61の処理の後に残った単語のクラスタを収集する処理を行う代わりに、ステップS61の処理の後に残った単語の代表タグを収集する処理を行っても良い。この処理により、ステップS71で得られるリストをすぐに作成することができ、その結果、ステップS63,S71の処理を省略できる。
上述したように本実施形態の最適タグ提案装置20は、単語DB30内の特定の単語毎に、その特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、各タグの収集数に応じて代表タグを決定し、発信装置10からコンテンツへのタグ挿入要求を受けた場合、そのコンテンツに特定の単語が出現する度に、その特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、発信装置10に返却する。
すなわち、最適タグ提案装置20は、発信装置10が発信しようとしているコンテンツと同じ単語が出現する他のコンテンツにおいて実際に挿入されている数が多いタグを提案することになる。
よって、発信装置10の発信者は、コンテンツの発信に不慣れな初心者であったり、初めてのカテゴリやトピックでコンテンツを発信したりする場合でも、最適タグ提案装置20から提案された、広く使用されているタグを選択してコンテンツに挿入することができるため、自身が発信したコンテンツを多くの人に伝えることができるようになる。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されものでない。本発明の構成や詳細には、本発明の範囲内で当業者が理解し得る様々な変更をすることができる。
例えば、本実施形態においては、最適タグリストを1つだけ作成することを想定していたが、発信者属性(年齢、性別、生活圏)毎や日時属性(季節、時間帯)毎に最適タグリストを作成し、発信者や発信日時に応じて最適タグリストを切り替えても良い。
具体的には、発信者属性毎に最適タグリストを作成する場合、タグ収集部21は、発信者属性毎に、コンテンツDB40内のコンテンツのうち、その発信者属性を満たす発信者が使用する発信装置10が発信したコンテンツのみを用いてタグリストを作成する。また、最適タグ作成部23は、発信者属性毎に、その発信者属性に応じて作成されたタグリストを用いて最適タグリストを作成する。また、最適タグ返却部25は、発信装置10からタグ挿入要求を受けた場合、その発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、候補タグを決定する。
一方、日時属性毎に最適タグリストを作成する場合、タグ収集部21は、日時属性毎に、コンテンツDB40内のコンテンツのうち、その日時属性を満たす日時に発信装置10が発信したコンテンツのみを用いてタグリストを作成する。また、最適タグ作成部23は、日時属性毎に、その日時属性に応じて作成されたタグリストを用いて最適タグリストを作成する。また、最適タグ返却部25は、発信装置10からタグ挿入要求を受けた場合、タグ挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、候補タグを決定する。
また、本発明の最適タグ提案装置20にて行われる方法は、コンピュータに実行させるためのプログラムに適用してもよい。また、そのプログラムを記憶媒体に格納することも可能である。
10−1〜10−S 発信装置
20 最適タグ提案装置
21 タグ収集部
22 タグリストDB
23 最適タグ作成部
24 最適タグリストDB
25 最適タグ返却部
30 単語DB
40 コンテンツDB

Claims (22)

  1. 発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置であって、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却し、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案装置。
  2. 請求項1に記載の最適タグ提案装置であって、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集部と、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成部と、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却部と、を有し、
    前記最適タグ作成部は、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案装置。
  3. 請求項に記載の最適タグ提案装置であって、
    前記最適タグ作成部は、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案装置。
  4. 請求項2または3に記載の最適タグ提案装置であって、
    前記最適タグ返却部は、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案装置。
  5. 請求項2または3に記載の最適タグ提案装置であって、
    前記最適タグ返却部は、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案装置。
  6. 請求項2からのいずれか1項に記載の最適タグ提案装置であって、
    前記タグ収集部は、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案装置。
  7. 請求項2からのいずれか1項に記載の最適タグ提案装置であって、
    前記タグ収集部は、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案装置。
  8. コンテンツを発信する発信装置と、前記発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置と、を有してなる最適タグ提案システムであって、
    前記最適タグ提案装置は、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却し、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案システム。
  9. 請求項に記載の最適タグ提案システムであって、
    前記最適タグ提案装置は、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集部と、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成部と、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却部と、を有し、
    前記最適タグ作成部は、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案システム。
  10. 請求項に記載の最適タグ提案システムであって、
    前記最適タグ作成部は、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案システム。
  11. 請求項9または10に記載の最適タグ提案システムであって、
    前記最適タグ返却部は、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案システム。
  12. 請求項9または10に記載の最適タグ提案システムであって、
    前記最適タグ返却部は、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案システム。
  13. 請求項から12のいずれか1項に記載の最適タグ提案システムであって、
    前記タグ収集部は、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案システム。
  14. 請求項から12のいずれか1項に記載の最適タグ提案システムであって、
    前記タグ収集部は、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成部は、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却部は、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案システム。
  15. 発信装置が発信するコンテンツに挿入するタグを提案する最適タグ提案装置による最適タグ提案方法であって、
    特定の単語が出現するコンテンツ毎に、当該コンテンツに挿入されているタグを収集し、
    前記特定の単語毎に、当該特定の単語が出現するコンテンツから収集したタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの収集数に応じて代表タグを決定し、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、当該特定の単語のクラスタを収集し、収集したクラスタの代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却し、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案方法。
  16. 請求項15に記載の最適タグ提案方法であって、
    前記特定の単語毎に、所定のコンテンツDBから、当該特定の単語が出現するコンテンツおよび当該コンテンツに挿入されているタグを収集し、収集したコンテンツ毎に、当該特定の単語と前記収集したタグとを対応付けたタグリストを作成するタグ収集ステップと、
    前記特定の単語毎に、前記タグリスト内に当該特定の単語と対応付けられて出現するタグをクラスタリングし、クラスタ毎に、当該クラスタに属するタグの中から、各タグの出現数に応じて代表タグを決定し、当該特定の単語と、前記クラスタリングした各クラスタと、前記決定した各クラスタの代表タグと、を対応付けた最適タグリストを作成する最適タグ作成ステップと、
    前記発信装置から、発信するコンテンツへのタグの挿入要求を受けた場合、当該発信するコンテンツに前記特定の単語が出現する度に、前記最適タグリスト内に当該特定の単語に対応付けられて出現するクラスタを収集し、収集したクラスタに対応付けられている代表タグの中から、各クラスタの収集数に応じて候補タグを決定し、前記発信装置に返却する最適タグ返却ステップと、を有し、
    前記最適タグ作成ステップでは、
    クラスタリングの際に、同一コンテンツに挿入されているタグ同士を接続することでネットワーク化し、各ネットワークをそれぞれクラスタとする、最適タグ提案方法。
  17. 請求項16に記載の最適タグ提案方法であって、
    前記最適タグ作成ステップでは、
    クラスタリングの際に、前記タグリスト内に前記特定の用語に対応付けられて出現する数が多い上位N(Nは2以上の自然数)個のタグから、前記タグリスト内に出現する数が多い上位M(Mは2以上の自然数)個のタグを除き、残余のタグを対象にしてクラスタリングを行う、最適タグ提案方法。
  18. 請求項16または17に記載の最適タグ提案方法であって、
    前記最適タグ返却ステップでは、
    前記最適タグリストから収集したクラスタの中から、収集数が多い上位P(Pは2以上の自然数)個のクラスタを抽出し、
    前記抽出したクラスタの代表タグを前記候補タグとして決定する、最適タグ提案方法。
  19. 請求項16または17に記載の最適タグ提案方法であって、
    前記最適タグ返却ステップでは、
    前記最適タグリストからクラスタを収集する度に、収集したクラスタに対応付けられている代表タグも収集し、収集数が多い上位Q(Qは2以上の自然数)個の代表タグを前記候補タグとして決定する、最適タグ提案方法。
  20. 請求項16から19のいずれか1項に記載の最適タグ提案方法であって、
    前記タグ収集ステップでは、
    発信者属性毎に、前記コンテンツDB内のコンテンツのうち、当該発信者属性を満たす発信者が使用する発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成ステップでは、
    前記発信者属性毎に、当該発信者属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却ステップでは、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該発信装置を使用する発信者の発信者属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案方法。
  21. 請求項16から19のいずれか1項に記載の最適タグ提案方法であって、
    前記タグ収集ステップでは、
    日時属性毎に、前記コンテンツDB内のコンテンツのうち、当該日時属性を満たす日時に前記発信装置が発信したコンテンツを用いて、前記タグリストを作成し、
    前記最適タグ作成ステップでは、
    前記日時属性毎に、当該日時属性に応じて作成された前記タグリストを用いて、前記最適タグリストを作成し、
    前記最適タグ返却ステップでは、
    前記発信装置から、コンテンツへのタグの挿入要求を受けた場合、当該挿入要求を受けた日時の日時属性に応じて作成された最適タグリストを用いて、前記候補タグを決定する、最適タグ提案方法。
  22. 請求項16から21のいずれか1項に記載の最適タグ提案方法をコンピュータに実行させるためのプログラム。
JP2010180917A 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム Active JP5252593B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010180917A JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010180917A JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2012042998A JP2012042998A (ja) 2012-03-01
JP5252593B2 true JP5252593B2 (ja) 2013-07-31

Family

ID=45899275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010180917A Active JP5252593B2 (ja) 2010-08-12 2010-08-12 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5252593B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6056847B2 (ja) * 2012-03-08 2017-01-11 日本電気株式会社 コンテンツ及び投稿情報連携方法、並びに情報処理端末
WO2016151692A1 (ja) 2015-03-20 2016-09-29 株式会社 東芝 タグ付与支援装置、方法およびプログラム
JP6971719B2 (ja) * 2017-08-31 2021-11-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP6633708B2 (ja) * 2018-09-14 2020-01-22 株式会社東芝 タグ付与支援装置、方法およびプログラム
CN110032639B (zh) * 2018-12-27 2023-10-31 ***股份有限公司 将语义文本数据与标签匹配的方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217157A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 操作履歴を利用した自動情報整理装置、方法、およびプログラム
JP4714710B2 (ja) * 2007-06-15 2011-06-29 日本電信電話株式会社 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体
JP5142643B2 (ja) * 2007-09-11 2013-02-13 公立大学法人首都大学東京 タグ付与支援システム及びプログラム
JP5199768B2 (ja) * 2008-07-24 2013-05-15 日本電信電話株式会社 タグ付け支援方法とその装置、プログラム及び記録媒体
JP2010224622A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd タグ付与方法およびタグ付与プログラム

Also Published As

Publication number Publication date
JP2012042998A (ja) 2012-03-01

Similar Documents

Publication Publication Date Title
US8051080B2 (en) Contextual ranking of keywords using click data
CN105068661B (zh) 基于人工智能的人机交互方法和***
US8745039B2 (en) Method and system for user guided search navigation
US9684713B2 (en) Methods and systems for retrieval of experts based on user customizable search and ranking parameters
CA2508060C (en) Search engine spam detection using external data
CN102227725B (zh) 用于匹配实体的***和方法
CN103198057B (zh) 一种自动给文档添加标签的方法和装置
JP5252593B2 (ja) 最適タグ提案装置、最適タグ提案システム、最適タグ提案方法、およびプログラム
EP2131290A1 (en) Method of displaying related keyword and system as the same
JP2013506189A (ja) クエリの一般属性に基づく情報の検索
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
CN104978332B (zh) 用户生成内容标签数据生成方法、装置及相关方法和装置
CN103620604A (zh) 按类别暴露搜索历史
WO2008043645B1 (en) Establishing document relevance by semantic network density
JP2008107867A (ja) コミュニティ抽出方法、コミュニティ抽出処理装置
CN105243149B (zh) 一种基于语义的查询推荐方法和***
CN103186556B (zh) 得到和搜索结构化语义知识的方法及对应装置
JP5556711B2 (ja) カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム
CN109376288A (zh) 一种实现语义搜索的云计算平台及其均衡方法
JP5430960B2 (ja) コンテンツ分類装置、方法及びプログラム
CN109376362A (zh) 一种纠错文本的确定方法以及相关设备
Zhao et al. Towards events detection from microblog messages
WO2010131013A1 (en) Collaborative search engine optimisation
Hiemstra et al. SIGIR's 30th Anniversary: An Analysis of Trends in IR Research and the Topology of its Community
Jin et al. Extracting a social network among entities by web mining

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130411

R150 Certificate of patent or registration of utility model

Ref document number: 5252593

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250