JP5159451B2 - Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior - Google Patents
Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior Download PDFInfo
- Publication number
- JP5159451B2 JP5159451B2 JP2008155237A JP2008155237A JP5159451B2 JP 5159451 B2 JP5159451 B2 JP 5159451B2 JP 2008155237 A JP2008155237 A JP 2008155237A JP 2008155237 A JP2008155237 A JP 2008155237A JP 5159451 B2 JP5159451 B2 JP 5159451B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- info
- bubble
- info bubble
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ネットワークにアクセスするユーザの、特定のテーマに関連する行動を分析する技術に関し、より詳細には、キーワード等の特徴パラメータによって特徴付けられるコンテンツへのアクセスから、ユーザ集団のネットワーク行動を分析する、情報処理装置、分析システム、ネットワーク行動の分析方法およびプログラムに関する。 The present invention relates to a technique for analyzing behavior related to a specific theme of a user who accesses a network, and more particularly, from the access to contents characterized by characteristic parameters such as keywords, the network behavior of a user group. The present invention relates to an information processing apparatus, an analysis system, a network behavior analysis method, and a program.
ネットワーク通信網の普及に伴い、ブログ、SNS(Social
Network Service)などを介してユーザ間での交流が一般化している。ネットワーク上での情報交換は、どのユーザ間でも同じ程度の情報交換が行われている訳ではなく、実世界での情報交換と同様に、頻繁に情報交換が行われる内容やユーザ集団が存在する。
Blogs, SNS (Social
Networking between users via Network Service) has become common. Information exchange on the network does not mean the same level of information exchange among all users, but there are contents and user groups that are frequently exchanged as in the real world information exchange. .
頻繁に情報交換が行われている内容を有するコンテンツに関連付けて当該情報交換を行っているユーザ集団を分析することにより、特定のユーザ集団における情報の拡散度合いを分析することが可能となる。また、特定の内容を有するコンテンツに関連するユーザ集団の規模を時系列的に分析し、コンテンツに関連して特徴付けられるユーザ集団の拡散/縮小の傾向を分析することにより、マーケッティング情報およびユーザ集団情報などを取得することができ、ネットワーク行動を効率的にビジネス・ソリューションに反映させることができる。 It is possible to analyze the degree of information diffusion in a specific user group by analyzing the user group performing the information exchange in association with the content having the information exchanged frequently. Further, by analyzing the size of the user group related to the content having a specific content in time series and analyzing the tendency of the user group to be spread / reduced characterized in relation to the content, the marketing information and the user group are analyzed. Information can be acquired and network behavior can be efficiently reflected in business solutions.
これまで、ネットワークを介して伝送される情報を使用して、伝送されるメッセージの中から重要なテーマを抽出する技術が知られている。例えば、特開2007−328610号公報(特許文献1)では、親子関係のあるメッセージ間で関連度を示すスコアを算出し、スコアを用いたクラスタリングによって、テーマ抽出対象となるメッセージ群の絞り込み、電子掲示板などのコミュニケーションではメッセージ間に親子関係が形成されていることを利用して、抽出テーマを選択する技術が提案されている。 Conventionally, a technique for extracting an important theme from a transmitted message using information transmitted via a network is known. For example, in Japanese Patent Application Laid-Open No. 2007-328610 (Patent Document 1), a score indicating a degree of association between messages having a parent-child relationship is calculated, and a group of messages to be subject to theme extraction is narrowed down by clustering using the score. In communication such as a bulletin board, a technique for selecting an extraction theme by utilizing the fact that a parent-child relationship is formed between messages has been proposed.
上述した特許文献1は、掲示板の中から重要なスレッドを抽出することを目的とするものであり、メッセージを、トランザクションの返答関係を使用してリンクを定義してツリー構造を作成するものである。上述した特許文献1では、例えば、ユーザ間のリンクに対し、スコアを付与する際に、限定されたユーザ集団内で高密度のトランザクションが発生する場合に高スコアを与える。しかしながら、特定の内容を有するコンテンツに関連して集合離散するユーザ集団を分析することを目的とするものではない。
例えば、ブログやSNS上で特定の内容を有するコンテンツがアップロードされた場合、当該コンテンツに関連するメッセージをネットワーク上で送受信する複数のユーザは、予測がつかず、また事前に予測して解析することは極めて困難である。特定のコンテンツに関連して生成するユーザ間のトランザクション頻度を使用して複数のユーザを、特定のユーザ集団として識別することは、ユーザ集団の特徴付けを可能とし、特定のユーザ集団を対象とした宣伝広告などを行うための重要な情報を提供する。 For example, when content having specific contents is uploaded on a blog or SNS, a plurality of users who send and receive messages related to the content on the network cannot predict and analyze in advance. Is extremely difficult. Identifying multiple users as a specific user population using the frequency of transactions between users generated in connection with specific content allows the characterization of the user population and is targeted to a specific user population Providing important information for advertising.
また、逆に特定のユーザ集団がどのようなコンテンツに関心があるのか、およびユーザ集団の特徴を解析することは、コンテンツに関連するビジネスに対する次世代ソリューションの検討を可能とするものということができる。
上述したように、情報の広がり方は、ユーザの属性だけを見ていても判断することができない。例えば、「キーワードとして“IBM東京基礎研究所”を含むコンテンツは、いったいどのようなユーザ層に広まっているのか?」に関して、その情報伝播を解析することが必要な場合があった。さらにSNS内での情報拡散および縮小を時系列的に追跡することによって、以下の項目についての情報を取得することが可能となる。
○情報を最初に発信した人・集団は?
○情報は広がる傾向か?それとも収まる傾向か?
○情報は移動するか?どのような経路での移動か?
○情報を広げる方向にもっとも貢献する人・集団は?
以上の点で、上述したように、特許文献1は、特定のコンテンツに関連した不特定のユーザをユーザ集団として識別することを可能とする技術ではなかった。また、特許文献1は、特定のコンテンツに関連したユーザ集団の時系列的な解析を使用して、ユーザ手段の拡散および縮小を追跡することを可能とするものではない。さらに特許文献1は、特定のユーザ集団に分類されたユーザに共通する属性を分析することにより、ネットワークを介して集合離散するユーザを解析することによってユーザのネットワーク行動を分析することを可能とするものではない。
As described above, it is not possible to determine how the information is spread even if only the user attributes are viewed. For example, there is a case where it is necessary to analyze the information propagation regarding “what kind of user group is content including“ IBM Tokyo Basic Research Laboratories ”as a keyword?”. Furthermore, information on the following items can be acquired by tracking information diffusion and reduction in the SNS in time series.
○ Who was the first person to send information?
○ Does the information tend to spread? Or do they tend to fit?
○ Does the information move? What is the route of travel?
○ Who or group contributes most to the direction of expanding information?
In the above points, as described above,
すなわち、これまで、特定のコンテンツに関連して複数のユーザが形成するユーザ集団を特徴付ける技術が必要とされていた。 That is, until now, there has been a need for a technique for characterizing a user group formed by a plurality of users in relation to specific content.
また、これまで、特徴付けされたユーザ集団の規模が時系列的にどのように推移して行くのかを分析し、コンテンツの内容に関連したネットワーク行動を分析する技術が必要とされていた。 In addition, until now, there has been a need for a technique for analyzing how the scale of the characterized user group changes over time and analyzing network behavior related to the content.
さらに、特徴付けられたユーザ集団に帰属されるユーザに共通する属性を取得して分析する技術が必要とされていた。 Furthermore, there is a need for a technique for acquiring and analyzing attributes common to users belonging to a characterized user group.
本発明は上記の課題を解決するために、情報処理装置は、ネットワークを介してユーザ・コンピュータから情報に対するアクセスを受付け、ユーザ・コンピュータ間に、情報を特徴付けるパラメータに関連して情報に対するネットワーク行動を生成させる。情報の広がりを示す一つの塊を、インフォバブルとして参照し、当該塊を構成するユーザを、特徴付けされたユーザ集団として参照する。ネットワーク行動は、行動履歴として記憶され、インフォバブルを生成するために利用される。情報処理装置は、インフォバブル生成部を含んでおり、インフォバブル生成部は、特徴パラメータを含む情報を抽出し、抽出した情報に対するネットワーク行動を取得する。そして、前記ユーザ・コンピュータをノードとするユーザ・リンクのユーザから、抽出した情報に対するネットワークでのユーザ関わり度gを計算し、さらに設定されたサンプリング間隔で計算したユーザ関わり度gを累積計算してスコア値を計算し、少なくとも1つのユーザをインフォバブルに登録し、インフォバブルを生成する。生成されたインフォバブルは、ネットワーク行動解析部により読み出され、特徴パラメータに関連付けられた情報に対するユーザのネットワーク行動を分析するために使用される。 In order to solve the above-described problems, the information processing apparatus receives access to information from a user computer via a network, and performs network action on the information in relation to parameters characterizing the information between the user computers. Generate. One lump indicating the spread of information is referred to as an info bubble, and users constituting the lump are referred to as a characterized user group. Network behavior is stored as behavior history and used to generate info bubbles. The information processing apparatus includes an info bubble generation unit, which extracts information including feature parameters and acquires network behavior for the extracted information. Then, from the user of the user link having the user computer as a node, the user's relevance g in the network for the extracted information is calculated, and the user relevance g calculated at the set sampling interval is cumulatively calculated. A score value is calculated, at least one user is registered in the info bubble, and an info bubble is generated. The generated info bubble is read by the network behavior analysis unit and used to analyze the user's network behavior with respect to the information associated with the feature parameter.
サンプリング周期ごとに前記ユーザ関わり度により計算されるスコア値を累積計算し、直前生成したインフォバブルを拡張するか、または直前生成したインフォバブルを収縮させるかを決定して、時系列的に複数の異なるユーザを含むインフォバブル・シーケンスを生成する。 A cumulative calculation of the score value calculated according to the degree of user involvement for each sampling period determines whether to expand the info bubble generated immediately before or to contract the info bubble generated immediately before, and Generate an info bubble sequence that includes different users.
インフォバブルの膨張・収縮は、スコア値に設定された膨張しきい値および収縮しきい値を参照して決定される。インフォバブルの膨張は、ユーザ・リンクの隣接ユーザを直前生成したインフォバブルに含ませた場合に、膨張後のバブル平均スコアが収縮しきい値以下とならないことを基準として実行される。 The expansion / contraction of the info bubble is determined with reference to the expansion threshold value and the contraction threshold value set in the score value. The expansion of the info bubble is executed based on the fact that the bubble average score after the expansion does not become the contraction threshold value or less when the adjacent user of the user link is included in the previously generated info bubble.
また、インフォバブルの収縮は、直前生成したインフォバブルが含むスコア値の最小のユーザを選択し、バブル平均スコアが収縮しきい値を超えるまでユーザをインフォバブルから削除することにより実行される。 Further, the shrinkage of the info bubble is executed by selecting the user with the smallest score value included in the info bubble generated immediately before and deleting the user from the info bubble until the bubble average score exceeds the shrinkage threshold.
さらに、ネットワーク行動分析部は、識別値で指定されるインフォバブルを読み出し、インフォバブルの時間進化を使用し特徴パラメータを含む情報の情報伝播を分析し、さらに、読み出した複数のインフォバブルのユーザ属性の類似性を使用してインフォバブルのクラスタを生成し、クラスタを形成するユーザを分析する。 Further, the network behavior analysis unit reads the info bubble specified by the identification value, analyzes the information propagation of the information including the characteristic parameter using the time evolution of the info bubble, and further, the user attributes of the plurality of read info bubbles Generate the info bubble cluster using the similarity of and analyze the users who form the cluster.
すなわち、本発明によれば、特定のコンテンツに関連して生成するユーザ間のトランザクション頻度を使用して複数のユーザを、特定のユーザ集団として識別することにより、ユーザ集団の特徴付けを可能とする、情報処理装置、分析システム、分析方法およびプログラムを提供することが可能となる。 That is, according to the present invention, it is possible to characterize a user group by identifying a plurality of users as a specific user group using a transaction frequency between users generated in relation to a specific content. It is possible to provide an information processing apparatus, an analysis system, an analysis method, and a program.
また、本発明では、上述したユーザ集団の特徴付けを使用することで、逆に特定のユーザ集団がどのようなコンテンツに関心があるのか、およびユーザ集団の特徴を解析することは、コンテンツに関連するビジネスに対する次世代ソリューションの検討を可能とする、情報処理装置、分析システム、分析方法およびプログラムを提供することが可能となる。 In addition, in the present invention, by using the above-described characterization of the user group, it is related to the content to analyze what kind of content the specific user group is interested in and to analyze the characteristics of the user group. It is possible to provide an information processing apparatus, an analysis system, an analysis method, and a program that make it possible to examine next-generation solutions for business.
<セクション1:ハードウェア構成>
以下、本発明を実施の形態をもって説明するが、本発明は、後述する実施形態に限定されるものではない。図1は、本実施形態のユーザのネットワーク行動を分析する分析システム100の実施形態を示す。分析システム100は、ネットワーク116に接続され、ユーザにより操作されて、ネットワーク116を介してサーバ122にアクセスする複数のユーザ・コンピュータ(以下、説明の便宜上、ユーザとして参照する。)112、114を含んで構成されている。ユーザ112は、例えばSNSなどで友人などとして登録されたユーザ・グループを形成する。また、ユーザ114は、これとは異なるユーザ・グループを形成している。ユーザのネットワーク行動は極めて多岐にわたり、また広範なコンテンツがアプリケーション・サーバなどに登録されるので、各ユーザ・グループは、常時完全に分離しているわけではなく、時系列的に相互関連し合い、特定のユーザ・グループに帰属されているユーザが、他のユーザ・グループに参加し、また離脱するなどの行動を取る。
<Section 1: Hardware configuration>
The present invention will be described below with reference to embodiments, but the present invention is not limited to the embodiments described below. FIG. 1 shows an embodiment of an
ネットワーク116には、サーバ機能部120が接続されていて、情報検索、SNS、ウェブ・サービス、メール・サービスなどを含むアプリケーション・サービスをユーザに対して提供している。サーバ機能部120は、情報処理装置122と、複数のデータベース124〜130を含んで構成されている。情報処理装置122は、本実施形態では、SNS、情報検索などのサービスを提供するアプリケーション・サーバモジュールおよびユーザのネットワーク行動を分析するための分析モジュールとを含んで実装されている。これらの各モジュール構成については、より詳細に後述する。
A
また、情報処理装置122は、複数のデータベース124〜130を使用してユーザのネットワーク行動を分析する。ネットワーク・データ記憶部124は、ユーザのネットワーク・アドレスなどを含むネットワーク・データを記憶している。テキスト・データ記憶部126は、ユーザがアップデートしたコンテンツのテキスト部分、メール、ブログなどのコメントなどといったネットワーク行動を分析するために使用するテキスト・データを記憶する。行動履歴記憶部128は、情報処理装置122へのユーザ・アクセスの履歴、いわゆるアクセスログを記録して、後の分析を実行するためのデータを提供する。
In addition, the
さらに、情報処理装置122は、ユーザ情報記憶部130を管理していて、ネットワーク116を介してアクセスするユーザを、例えばユーザ識別値(ユーザID)、ハンドルネーム、IPアドレスなどを使用して識別し、行動履歴記憶部128による行動履歴作成を可能とする。その他、ユーザ情報管理部130は、SNSや特定の権限を有するサービスへのアクセス管理を実行するための情報を含んでいて、情報処理装置122によるサービス提供の管理を可能とさせている。本実施形態では、ネットワーク116は、インターネットなどのネットワークを含むことが好ましいが、インターネット以外にもWAN(Wide Area Network)、LAN(Local Area network)などを含んで構成されていてもよい。
Furthermore, the
また、情報処理装置122は、図1に示すように、アプリケーション・モジュールと分析モジュールとが一体として構成することができる。他の実施形態では、アプリケーション・モジュールを、アプリケーション・サーバとして構成し、分析モジュールを分離して分析サーバとして配置する実装形式を採用することもできる。いずれの実装形式を採用するかについては、特定の用途に依存して、適宜選択することができる。
Further, as shown in FIG. 1, the
上述した情報処理装置122は、PENTIUM(登録商標)、PENTIUM(登録商標)互換チップ、などのCISCアーキテクチャのマイクロプロセッサ、または、POWER PC(登録商標)などのRISCアーキテクチャのマイクロプロセッサを実装することができる。また、情報処理装置122は、WINDOWS(登録商標)200X、UNIX(登録商標)、LINUX(登録商標)などのオペレーティング・システムにより制御されていて、C++、JAVA(登録商標)、JAVA(登録商標)BEANS、PERL、RUBYなどのプログラミング言語を使用して実装される、CGI、サーブレット、APACHEなどのサーバ・プログラムを実行し、ユーザ112、114からの要求を処理し、サービスを提供する。
The
ユーザ112、114と、情報処理装置122との間は、TCP/IPなどのトランザクション・プロトコルに基づき、HTTPプロトコルなどのファイル転送プロトコルを使用するトランザクションを使用したネットワークで接続される。ユーザ112、114は、情報処理装置122にアクセスし、ファイルのアップロード、ダウンロード、ブログ書込み、ブログ読出し、感想・意見の記述、チャット、フォーム送信、フォーム・ダウンロード、コンテンツ・アップロード、コンテンツ・ダウンロードなどを行っている。以下、ユーザが情報処理装置122に対してネットワーク116を介して行う各種の行動を、ユーザのネットワーク行動として参照する。
The
一方、ユーザ112、114は、パーソナル・コンピュータまたはワークステーションなどを使用して実装でき、また、そのマイクロプロセッサ(MPU)は、これまで知られたいかなるシングルコア・プロセッサまたはデュアルコア・プロセッサを含んでいてもよい。また、ユーザ112、114は、WINDOWS(登録商標)、UNIX(登録商標)、LINUX(登録商標)、MAC OSなど、いかなるオペレーティング・システムにより制御することができる。ユーザ112、114がウェブ・クライアントとして機能する場合には、ユーザ112、114は、Internet Explorer(商標)、Mozilla、Opera、Netscape Navigator(商標)などのブラウザ・ソフトウェアを使用して、情報処理装置122にアクセスする。
On the other hand, the
図2は、図1に示した情報処理装置122の機能ブロック構成200を示す。情報処理装置122は、ネットワーク116を介してユーザ112、114からの要求を受領し、またサービスの提供を行うため、OSI基本参照モデルでは、物理層/データリンク層/ネットワーク層レベルの処理を実行するネットワーク・アダプタ280を含んで構成される。ネットワーク・アダプタ280が受領した要求は、アプリケーション提供部270に送られて、情報処理装置122によるサービス処理が実行され、その実行結果は、ネットワーク・アダプタ280を介してネットワーク116を経由してユーザ112、114に送付される。
FIG. 2 shows a
一方、ユーザ112、114が情報処理装置122に対して行った要求、アップロード、ダウンロード、書き込み、読み出しなどのネットワーク行動は、アプリケーション提供部270の処理を処理履歴として各データベースに送付される。例えば、ユーザ112、114のネットワーク行動は、そのトランザクションが発生したタイムスタンプ、ユーザID、コンテンツ内容などが抽出され、行動履歴記憶部128、テキスト・データ記憶部126などに登録され、以後、ユーザ・グループの時間的進化を分析するために利用される。
On the other hand, network actions such as requests, uploads, downloads, writes, and reads made by the
情報処理装置122は、アプリケーション提供部270の他、ユーザのネットワーク行動を分析するための複数のモジュールを含んで構成される。情報処理装置122は、ユーザのネットワーク行動を分析するために、パラメータ制御部210、インフォバブル生成部220とを含んで構成される。パラメータ制御部210は、ユーザのネットワーク行動を、ネットワークを介して送受信されたデータから分析するために使用する、キーワードなどの特徴パラメータを設定・変更する処理を実行する。
The
また、インフォバブル生成部220は、ネットワークを介して送受信されたコンテンツから、設定された特徴パラメータを含むデータを選択して抽出し、当該トランザクションに関わるユーザを、ユーザID、ハンドルネーム、IPアドレスなどにより抽出する。そして、インフォバブル生成部220は、ユーザについて、ユーザ・グループを割当てる処理を実行する。なお、以後、特定の特徴パラメータにより識別されるユーザ・グループを、インフォバブル(IB)として参照する。
In addition, the info
インフォバブル生成部220は、上述した処理を実行するため、リレーショナル・データベース機能を含んで構成することができ、SQL(Structured Query Language)を使用して、設定されたタイムウィンドウごとにネットワーク行動をモニタして、ユーザをインフォバブルに帰属し、インフォバブルの時間的進化を分析する。また、インフォバブル生成部220は、生成したインフォバブル・データを、インフォバブル記憶部260に登録し、後述するインフォバブルのクラスタリングなどのために利用する。
The info
インフォバブル記憶部260に登録されたインフォバブル・データは、適切なAPI(Application Programming Interface)230を介してネットワーク行動分析部240に送付される。ネットワーク行動分析部240は、インフォバブル・データを特定のタイムウィンドウ内について分析することにより、インフォバブルを構成するユーザのついての情報を取得し、インフォバブルを構成する特徴パラメータについてのユーザ分析などを実行する。
The info bubble data registered in the info
また、ネットワーク行動分析部240は、タイムウィンドウごとのインフォバブルの変化などの時間進化を取得して、特徴パラメータについてのインフォバブルの形成期間、種類などを分析する。さらに、ネットワーク行動分析部240は、インフォバブルに関連してインフォバブルを、特定のユーザ属性などを使用してクラスタリングし、より、大域的なネットワーク行動の分析を実行する。なお、インフォバブル生成部220およびネットワーク行動分析部240の詳細な処理については、詳細に後述する。
In addition, the network
ネットワーク行動分析部240の分析結果は、テーブル、リスト、またはグラフなどの適切な表現形式でネットワーク行動分析結果出力部250に送付され、出力が行われる。なお、ネットワーク行動分析結果出力部250は、情報処理装置122がローカルに管理する出力デバイスとすることもできるし、ネットワーク・アダプタ280を介して管理者端末などにデータをアップロードする例えば、FTPモジュール、HTTPモジュールとして構成することができる。
The analysis result of the network
<セクション2:インフォバブル定義づけ>
図3は、本実施形態のインフォバブル300の例示的な実施形態を示す。インフォバブル300は、複数のユーザ320、310のリンクについて、特定の特徴パラメータについてのアクセス頻度が一定以上のユーザ310を登録することにより生成される。以下、本実施形態では、特定の情報Iに対するアクセス頻度に対して、ユーザ関わり度gおよびスコア関数f(u,I,T)を定義して定式化する。図3に示した実施形態では、インフォバブル境界330が定義され、その中に、情報Iについて知っているユーザが多く含まれている。
<Section 2: Defining Info Bubble>
FIG. 3 shows an exemplary embodiment of the
また、インフォバブル境界330の内側には、情報Iについて知らない(アクセスしない)ユーザも少数含まれる。この情報Iを知らないユーザは、可能性として、当該情報Iにまだアクセスしていないだけの可能性もあるので、インフォバブル300を構成するインフォバブル境界330内の他のユーザとの関係でインフォバブル300の要素ユーザとして登録される。なお、インフォバブル境界330の内側のユーザは、インフォバブル・データを構成するユーザ集合として、そのユーザID、ハンドルネーム、IPアドレスなどをCSV、スペース区切り、カンマ区切りなどのフォーマットで、リストに登録される。
In addition, a small number of users who do not know (do not access) the information I are included inside the
また、ユーザ320は、情報Iに関連してアクセス頻度が高くないので、図3に示した実施形態では、インフォバブル境界330の外側に示されている。なお、時間経過に対応して、ユーザ320が情報Iについてもアクセス頻度がしきい値を超えるようになる場合、インフォバブル境界330がユーザ320を含むように拡張される。
Further, since the
図3に示すユーザ・リンクは、予めインフォバブル生成部220が管理する。ユーザ・リンクは、ユーザがノードとされ、ノード間のリンクは、ノード間のネットワーク行動に関連する関わり合いの存在を示すものである。ユーザ間のリンクを生成する処理は、種々想定でき、第1の実施形態としては、情報処理装置122がSNSサービスを提供する場合には、個々のユーザにより登録された登録関係を使用して、リンクを生成し、適切な記憶領域に記憶させておくことができる。なお、このリンクは、例えば、ユーザ情報記憶部130に登録しておき、インフォバブル生成部220がインフォバブルを生成する処理に応じてアクセスすることができる。また、ユーザ・リンクは、ネットワーク・データとして、ネットワーク・データ記憶部124に格納することもできる。
The user bubble shown in FIG. 3 is managed in advance by the info
また、第2の実施形態では、ユーザ間で送受信された情報の行動を分析するための行動マトリックスを定義し、行動マトリックス特定のキーワードといった特徴パラメータの共有割合の高いユーザ間にリンクを定義する方法を採用することができる。行動マトリックスを使用する詳細な処理は、特願2007−336919号明細に記載されているが、本明細書においてその処理の概略を説明する。 In the second embodiment, a method of defining a behavior matrix for analyzing behavior of information transmitted and received between users, and defining a link between users having a high sharing ratio of feature parameters such as behavior matrix specific keywords Can be adopted. Detailed processing using the behavior matrix is described in Japanese Patent Application No. 2007-336919, and the outline of the processing will be described in this specification.
図4は、行動マトリックスのデータ構成およびその生成処理を示した概略図である。ユーザ402は、例えばオンライン・コミュニティ・サービスにおいて、行動404として示した、「メッセージを書く」404a、「掲示板に書き込む」404b、「ブログを書く」404c・・・「メッセージを読む」404i、「掲示板を読む」404j、「ブログを読む」404k、「ニュースを読む」404l・・などの行動(活動)を行う。
FIG. 4 is a schematic diagram showing the data structure of the behavior matrix and its generation process. For example, in the online community service, the
このような、ユーザがオンライン・コミュニティ・サービス内でとり得る行動の種類は、情報処理装置122の適切な処理モジュール、例えば、パラメータ制御部210などに予め設定されている。上述した活動の各々に対して、ある一定期間に、ユーザ402が、メッセージとして読み書きしたテキスト406a、掲示板に読み書きしたテキスト406b、ブログとして読み書きしたテキスト406c、ニュースとして読んだテキスト406d・・・を、テキスト情報406として、情報処理装置122が管理するテキスト・データ記憶部126に一旦保存する。
The types of actions that the user can take in the online community service are preset in an appropriate processing module of the
図4では、情報を、読書きしたテキスト406aのように一括して参照するが、読んだテキストおよび書いたテキストは、別個に識別可能に保存される。これは、掲示板やブログについても、同様である。そこで、特開2001−84250、特開2002−251402、特開2004−246440などから周知の構文解析技術などにより、情報が含むキーワードや特定表現の頻度を、TF−IDF(Term Frequency−Invert Document Frequency)などの手法を使用してパラメータ制御部210などが解析する。解析結果を使用して、情報処理装置122は、ことにより実行し、当該ユーザ402に対する行動マトリクス408を生成する。
In FIG. 4, information is collectively referred to as read / written text 406a, but the read text and the written text are stored separately and identifiable. The same applies to bulletin boards and blogs. Therefore, the frequency of keywords and specific expressions included in the information is changed to TF-IDF (Term Frequency-Invert Document Frequency) using a syntax analysis technique known from JP-A-2001-84250, JP-A-2002-251402, and JP-A-2004-246440. The
図4に示した特定の実施形態では、本発明の行動マトリクス408は、行をキーワード、列を行動種別として定義されている。行動マトリックス408は、キーワードなどの特徴パラメータを登録する行が多くの場合数千行であり、行動種類は、ネットワーク行動に関連して多くの場合それよりも少なく、列が数十程度であり、矩形行列を構成する。また、行に現れるキーワードは、テキスト情報406として保存されたすべてのテキストから構文解析により抽出されたキーワードのすべてを網羅する。そして、行動マトリックスの要素は、特定のキーワードなどの特徴パラメータの行の、特定行動の列の成分の値として、当該行動に関連するテキストから取得された、当該する特徴パラメータの出現頻度を設定する。
In the specific embodiment shown in FIG. 4, the
上述した行動マトリクスの値は、ユーザごとに、個別のファイルとして、適切な記憶部、例えば行動履歴記憶部128に保存される。このとき、保存する形式は、例えば、CSV、HTML、XMLなど、行と列の値として、C、C++、C#、Java(登録商標)、Perl、Ruby、PHPなどのプログラミング・ツールによって識別可能な任意の形式とすることができる。
The behavior matrix values described above are stored in an appropriate storage unit, for example, the behavior
上述のように作成された行動マトリックスは、Hausholder法などによる特異値計算により、特定のネットワーク行動においてその時点で送受信される特徴パラメータを取得するためにも使用することができる。また、上述のようにして生成された行動マトリックス408は、本発明においては、特徴パラメータに関連したユーザ間のリンクを生成するために使用することができる。例えば、行動マトリックス408の要素値は、特徴パラメータの出現頻度なので、特徴パラメータの出現頻度についてしきい値を設定し、しきい値を超えた特徴パラメータを共有するユーザ間にリンクを割当てることにより図3のユーザ・リンクを生成させ、登録しておくことができる。
The behavior matrix created as described above can also be used to acquire feature parameters that are transmitted / received at that time in a specific network behavior by singular value calculation by Hausholder method or the like. In addition, the
この際、トランザクションが直接行われたユーザ間についてまずリンクを生成し、トランザクションのノードとなったユーザから、同一の特徴パラメータの出現頻度について設定される第2のしきい値以上を有するリンクを当該ノードについての子ノードとして設定するなどの処理を使用してユーザ・リンクを拡張する。 At this time, a link is first generated between users who have directly performed the transaction, and a link having a second threshold value or higher set for the appearance frequency of the same feature parameter is determined from the user who has become the node of the transaction. Extend the user link using a process such as setting it as a child node for the node.
図5は、本実施形態のインフォバブルの時間進化を説明する説明図である。インフォバブル生成部220は、周期的に、行動履歴記憶部128などにアクセスして、設定されたタイムウィンドウ間の行動履歴を抽出し、抽出した行動履歴に含まれるユーザについて、インフォバブルを生成する。例えば、インフォバブル生成部は、サンプリングタイムT=t0で、タイムウィンドウT0540の期間についての行動履歴をサンプリングして、ユーザ・リンク510に登録されたユーザに対してインフォバブル512、514、516を生成し、インフォバブル記憶部260に登録する。
FIG. 5 is an explanatory diagram for explaining the time evolution of the info bubble according to the present embodiment. The info
その後、インフォバブル生成部220は、サンプリング周期が経過したサンプリングタイムT=t1でタイムウィンドウT1550の期間にわたり、同所の処理を実行して、ユーザ・リンク520についてインフォバブル522、524、526を生成する。この時、特徴パラメータに関連してユーザの興味や話題が変化する場合、インフォバブル512に対応するインフォバブル522のサイズ、すなわち要素ユーザ数が変化する。インフォバブルの時間進化は、それぞれインフォバブル514、524、インフォバブル516、526についても生成することができる。同様に、サンプリングタイムT=t2においてもタイムウィンドウT2が設定され、インフォバブルを生成するために利用される。
After that, the info
インフォバブル生成部220は、サンプリングタイムT=T3となった場合、再度、タイムウィンドウ560の間の行動履歴を取得して、インフォバブル532、534、536を生成し、ユーザ・リンク530に各インフォバブルをインフォバブル・シーケンスとして生成させて行くことにより、特徴パラメータに関連付けられたインフォバブルの時間進化を分析することが可能となる。なお、インフォバブル生成部220は、行動履歴記憶部128にすでに登録されたデータを参照してインフォバブルを生成することができるし、行動履歴記憶部128に登録されるアクセスログをサンプリングタイムが到来した段階で、タイムウィンドウの期間だけ取得して、インフォバブルを生成してもよい。また、サンプリングウィンドウTm、サンプリング周期(tm+1−tm)の比率は、適切な精度でインフォバブルを生成することができる限り、特に限定はない。
When the sampling time T = T 3 , the info
<セクション3:インフォバブル生成処理>
インフォバブル生成部220は、インフォバブルを生成するためのタイムウィンドウの期間にわたり、特徴パラメータに関連する情報について、ユーザ関わり度gを計算する。ユーザ関わり度gは、情報Iに対して何度ユーザが書き込みアクセスを行い、また読み込みアクセスを行ったかを、行動履歴から取得し、書き込みアクセスがある場合については、下記式(1)で、書き込みアクセスはないが、読み込みアクセスがある場合については、下記式(2)で与えられる値g(u,I,Tm,Tm+1)で定義される。また、情報Iに対して書き・読み込みアクセス両方がないユーザに対しては、対応するそのユーザ関わり度をゼロとする。なお、Tmは、タイムウィンドウの時系列順序を示すための識別値であり、mは、0以上の整数である。
<Section 3: Info bubble generation processing>
The info
また、本実施形態では、ユーザがアクセスする可能性のある関連事項例えば、「日本アイ・ビー・エム」、「IBM」などについては、特徴パラメータに関連付けられるものとして、小さな定数を導入し、上記式(1)、(2)の右辺の係数として設定し、ユーザ関わり度の計算に含ませることができる。 Further, in the present embodiment, related items that the user may access, such as “Japan IBM”, “IBM”, etc., are introduced as a small constant as being associated with the feature parameter, and It can be set as a coefficient on the right side of the equations (1) and (2) and included in the calculation of the user relation.
さらに、インフォバブル生成部220は、インフォバブル境界を、現時点で登録されている、インフォバブル境界から膨張させるか、または収縮させるかを判断するためのスコア関数f(u,I,T)を実装する。スコア関数f(u,I,T)は、説明する実施形態では、下記式(3)として実装することができる。
Further, the info
上記式(3)中、αは、0<α<1の実数である。ただし、減少の場合、時系列的になめらかな関数であって、アクセス回数に関連して値を増減することができる関数であれば、関数の型式に特に限定はない。なお、特定のインフォバブル内でのスコア値の平均値を、以下、バブル平均スコア(Average Info Bubble Scoreであり、以後、これを略してAvgInfoBubbleとする。)と定義し、インフォバブルの膨張・収縮判断のために提供する。 In the above formula (3), α is a real number of 0 <α <1. However, in the case of a decrease, the function type is not particularly limited as long as it is a smooth function in time series and can increase or decrease a value in relation to the number of accesses. The average score value in a specific info bubble is hereinafter defined as the bubble average score (Average Info Bubble Score, hereinafter abbreviated as AvgInfoBubble). Provide for judgment.
図6は、ユーザ関わり度gを使用して生成されるスコア関数f(u,I,T)の実施形態および、インフォバブルの膨張・収縮判断について説明した図である。図6に示すように、上記式(1)〜(3)を使用して、各時刻のスコア関数f(u,I,T)は直前の時刻からのタイムウィンドウに関連して計算される。図6に示したスコア・ポイント610は、各タイムウィンドウで計算されたスコア値を示すものである。各スコア・ポイントの間は、スプライン関数や各種補間関数などを使用してなめらかに接続されるように計算されてもよい。インフォバブル生成部220は、スコア値に対して、膨張しきい値および収縮しきい値を設定し、スコア値と各しきい値とを比較して、インフォバブル境界の膨張・収縮処理を実行する。
FIG. 6 is a diagram illustrating an embodiment of a score function f (u, I, T) generated using the user relation g and info bubble expansion / contraction determination. As shown in FIG. 6, using the above equations (1) to (3), the score function f (u, I, T) at each time is calculated in relation to the time window from the immediately preceding time. The score points 610 shown in FIG. 6 indicate the score values calculated in each time window. Each score point may be calculated so as to be smoothly connected using a spline function, various interpolation functions, or the like. The info
インフォバブル境界の膨張とは、特定のインフォバブルを構成するインフォバブル・データに、ユーザ・リンクで隣接し、他のインフォバブルに含まれるか隣接するか、またはインフォバブルに含まれていないユーザを追加する処理を意味する。また、インフォバブルの収縮とは、膨張の逆の処理に対応し、インフォバブル・データに含まれる要素ユーザを、インフォバブル・データから削除する処理を意味する。例えば、図6に示したスコア値では、ポイント620では、インフォバブルの収縮処理を実行し、ポイント630では、インフォバブルの膨張処理を実行する。なお、膨張処理および収縮処理については、より詳細に後述する。
The expansion of an info bubble boundary refers to the info bubble data that constitutes a specific info bubble, which is adjacent to the user link by a user link, is included in another info bubble, is adjacent, or is not included in an info bubble. Means processing to be added. The contraction of the info bubble corresponds to a process opposite to the expansion, and means a process of deleting the element user included in the info bubble data from the info bubble data. For example, in the score value shown in FIG. 6, the info bubble contraction process is executed at
図7は、本実施形態で生成されるインフォバブル・データ700のデータ構造を示す。図7に示すインフォバブル・データ700は、変数名と、当該変数に対して登録する変数のデータ内容とを含む構成として示す。図7に示すように、フィールド710は、変数名=Infoとしてインフォバブルを定義するための情報内容が登録される。この値としては、例えば特徴パラメータなどを使用することができる。また、フィールド720には、サンプリングした時刻を、例えばサンプリングについてのタイムウィンドウの終点のTm+1の値を代表させるなどして、タイムスタンプとして使用する。
FIG. 7 shows a data structure of the
また、フィールド730は、Peopleとして、インフォバブル700に含まれるユーザ集合を、ユーザIDを列記する型式などで、登録する。さらに、フィールド750は、当該インフォバブルが含むユーザのユーザ関わり度の平均値AvgInfoScoreを登録するフィールドである。なお、AvgInfoScoreは、0≦AvgInfoScore≦1を満たす実数である。図7に示したインフォバブル・データ700は、例えば、B(I,T,P,AIS)として固有に識別され、インフォデータ記憶部260に登録される。
<セクション3:インフォバブル生成部の処理>
以下、本実施形態の各処理について説明するが、使用するパラメータ値の定義および内容は、以下の通り、
○I=Infoの値
○T=時刻・タイムスタンプの値
○P=Peopleの値
○AIS=AvgInfoScoreの値
○膨張しきい値=ExpandThreshold
○収縮しきい値=ShrinkThreshold
○インフォバブル=B
○インフォバブル集合=IBSet
である。
In the
<Section 3: Processing of Info Bubble Generation Unit>
Hereinafter, each process of the present embodiment will be described. Definitions and contents of parameter values to be used are as follows:
○ I = Info value ○ T = Time / time stamp value ○ P = People value ○ AIS = AvgInfoScore value ○ Expansion threshold = ExpandThreshold
○ Shrink threshold = ShrinkThreshold
○ Info Bubble = B
○ Info bubble set = IBSet
It is.
図8は、インフォバブル生成処理の実施形態のフローチャートである。なお、図8の処理では、時刻TNまでデータが登録されているものとする。図8の処理は、ステップS800から開始し、ステップS801で、時刻のカウンタおよびIBSetを、それぞれi=1、IBSet=φ(空集合)として初期化する。ステップS802では、インフォバブルを初期化し、ステップS803で、時刻が時刻の最大値TN以下であるか否かを判断する。時刻のカウンタ値がNを超える場合(No)、処理をステップS806に分岐させて処理を終了させる。ステップS803で、i≦Nの場合(Yes)、ステップS804で、時刻Tiのインフォバブルの生成処理を実行する。ステップS805では、時刻のカウンタiをインクリメントし、処理をステップS803に戻し、時刻のカウンタがNを超えるまで、インフォバブルの生成処理を反復させる。 FIG. 8 is a flowchart of an embodiment of the info bubble generation process. In the process of FIG. 8, it is assumed that data is registered until time TN . The processing in FIG. 8 starts from step S800, and in step S801, the time counter and IBSet are initialized as i = 1 and IBSet = φ (empty set), respectively. In step S802, the info bubble is initialized, and in step S803, it is determined whether or not the time is equal to or less than the maximum time value TN . If the time counter value exceeds N (No), the process branches to step S806 and the process is terminated. In step S803, when the i ≦ N (Yes), at step S804, the executing the generation processing of the info bubble time T i. In step S805, the time counter i is incremented, the process returns to step S803, and the info bubble generation process is repeated until the time counter exceeds N.
図9は、図8のステップS802のインフォバブル初期化処理の実施形態についてのフローチャートである。処理は、ステップS900から開始し、ステップS901で、処理対象のユーザがまだ残っているか否かを判断し、処理対象のユーザが残っていない場合(No)、処理をステップS905に分岐させる。 FIG. 9 is a flowchart of an embodiment of the info bubble initialization process in step S802 of FIG. The process starts from step S900. In step S901, it is determined whether or not a user to be processed still remains. If no user to be processed remains (No), the process branches to step S905.
ステップS901で、処理対象のユーザがまだ残っていると判断された場合(Yes)ステップS902で、未処理のユーザuを選択し、スコア値f(u,I,T)を計算する。ステップS903では、スコア値f(u,I,T)が収縮しきい値ShrinkThresholdよりも大きいか否かを判断し、スコア値が収縮しきい値以下の場合(No)、処理をステップS901に戻し、処理を反復させる。 If it is determined in step S901 that there are still users to be processed (Yes), an unprocessed user u is selected in step S902, and a score value f (u, I, T) is calculated. In step S903, it is determined whether or not the score value f (u, I, T) is larger than the shrinkage threshold ShrinkThreshold. If the score value is equal to or smaller than the shrinkage threshold (No), the process returns to step S901. Repeat the process.
ステップS903で、スコア値が収縮しきい値よりも大きいと判断された場合(Yes)、ステップS904でIBSetの要素として、インフォバブル・データを登録する。ステップS905では、時刻T1(つまり、時刻T0からT1までのタイムウィンドウ)のインフォバブル膨張処理を実行させ、ステップS906で、生成したインフォバブルのIB識別値を修正して付け直しステップS907で処理を終了させる。 If it is determined in step S903 that the score value is larger than the contraction threshold (Yes), info bubble data is registered as an element of IBSet in step S904. In step S905, the info bubble expansion process at time T 1 (that is, the time window from time T 0 to T 1 ) is executed. In step S906, the IB identification value of the generated info bubble is corrected and reattached. To end the process.
図10は、タイムウィンドウTi(i>0)におけるインフォバブル生成処理の実施形態のフローチャートを示す。図10の処理は、ステップS1000から開始し、ステップS1001で各B∈IBSetに対するAISの再計算を実行する。ステップS1002では、時刻Tiにおけるインフォバブル収縮処理を実行し、ステップS1003では、時刻Ti−1のインフォバブルに関わらないユーザ集合のインフォバブルを初期化する。ステップS1004では、時刻Tiにおけるインフォバブル膨張処理を実行して、処理をステップS1005で終了させる。 FIG. 10 shows a flowchart of an embodiment of the info bubble generation process in the time window T i (i> 0). The process of FIG. 10 starts from step S1000, and recalculates the AIS for each BεIBSet in step S1001. In step S1002, an info bubble contraction process at time T i is executed, and in step S1003, an info bubble of a user set not related to the info bubble at time T i-1 is initialized. In step S1004, the info bubble expansion process at time T i is executed, and the process ends in step S1005.
図11は、時刻Tiでのインフォバブル膨張処理の実施形態についてのフローチャートを示す。図11の処理は、ステップS1100から開始し、ステップS1101で、インフォバブルが変更されたか否かを示す変更識別値isChanged=falseに設定する。ステップS1102は、統合可能なインフォバブルB1、B2がIBSetの要素として存在するか否かを判断するステップである。S1102の判断で統合可能なインフォバブルB1、B2がない場合には(No)、処理をステップS1104に分岐させる。 Figure 11 shows a flowchart of an embodiment of the info bubble expansion process at the time T i. The processing in FIG. 11 starts from step S1100, and in step S1101, a change identification value isChanged = false indicating whether or not the info bubble has been changed. Step S1102 is a step of determining whether or not the info bubbles B1 and B2 that can be integrated exist as elements of the IBSet. If there is no info bubble B1, B2 that can be integrated in the determination in S1102 (No), the process branches to step S1104.
一方、ステップS1102で統合可能なB1、B2が存在する場合(Yes)、ステップS1103で、統合可能なB1、B2の組を1つ選択し、集合和を計算し、その和集合をB1、B2の値を削除したIBSetと統合し、新しいIBSetを得る。その後、変更識別値isChanged=trueに変更する。 On the other hand, if B1 and B2 that can be integrated exist in step S1102 (Yes), one set of B1 and B2 that can be integrated is selected in step S1103, a set sum is calculated, and the union is calculated as B1 and B2. Is integrated with the deleted IBSet to obtain a new IBSet. After that, the change identification value isChanged = true.
ステップS1104では、追加可能なユーザuとインフォバブルBの組み合わせが存在するか否かを判断し、存在しない場合(No)、処理をステップS1106に分岐させ、変更識別値isChangedがtrueであるか否かを判断し、isChanged=falseである場合(No)、処理をステップS1107で終了させる。一方、ステップS1106で変更識別値isChangedがtrueである場合(Yes)、処理をステップS1101に分岐させ、統合可能なB1、B2がIBSet内に存在しなくなるまで、処理を反復する。図11の処理によって、時刻Tiに対応するインフォバブルが生成される。 In step S1104, it is determined whether there is a combination of user u and info bubble B that can be added. If there is no combination (No), the process branches to step S1106, and whether the change identification value isChanged is true. If isChanged = false (No), the process ends in step S1107. On the other hand, if the change identification value isChanged is true in step S1106 (Yes), the process branches to step S1101, and the process is repeated until there is no B1 and B2 that can be integrated in the IBSet. The info bubble corresponding to the time T i is generated by the process of FIG.
なお、以下の、ステップS1103の統合処理およびステップS1105の追加処理の処理プロセスを説明する。 Note that the following processing process of the integration process in step S1103 and the additional process in step S1105 will be described.
[統合処理]
例えば、インフォバブルB1、B2が統合可能であるということは、u∈B1、v∈B2であり、u∈N(v) を満たすu、vが存在することと同値である。ここで、N(v)とは、ユーザ・リンクを構成するユーザ集合の中からユーザvと直接的に接続される、または隣接する、ユーザ集合のことである。統合処理は、インフォバブルB1(I,T,P1,AIS1)およびインフォバブルB2(I,T,P2,AIS2) に対し、merge(B1,B2):=(I,T,P1∪P2,AIS)で指定されるインフォバブルを生成する処理に対応する。ここで、統合されたインフォバブルのAISについては重付き平均を使用して計算し、AIS:=p1×AIS1+p2×AIS2,p1=|P1|/|P1∪P2|,p2=|P2|/|P1∪P2|で与えるものとする。
[Integration processing]
For example, the fact that info bubbles B1 and B2 can be integrated is equivalent to the existence of u and v satisfying uεN (v) because uεB1 and vεB2. Here, N (v) is a user set that is directly connected to or adjacent to the user v from among the user sets constituting the user link. Integration process is merge (B1, B2): = (I, T, P1∪P2, AIS) for info bubble B1 (I, T, P1, AIS1) and info bubble B2 (I, T, P2, AIS2) This corresponds to the process of generating the info bubble specified by). Here, the AIS of the integrated info bubble is calculated using a weighted average, and AIS: = p1 × AIS1 + p2 × AIS2, p1 = | P1 | / | P1∪P2 |, p2 = | P2 | / | P1∪P2 |.
[追加処理]
ユーザuは、インフォバブルBに追加可能であるとは、インフォバブルBのAISがExpandThreshold値以上であって、かつuがどのインフォバブルの要素ではなく、かつ、merge(B,{u})のAISがShrinkThresholdよりも大きいことを要件として実行される。
[Additional processing]
The user u can be added to the info bubble B when the info bubble B's AIS is equal to or greater than the ExpandThreshold value, u is not an info bubble element, and merge (B, {u}) It is implemented with the requirement that AIS is greater than ShrinkThreshold.
図12は、図10のステップS1002で説明したインフォバブル収縮処理の実施形態についてのフローチャートを示す。図12の処理は、ステップS1200から開始し、ステップS1201で未処理のインフォバブルがまだ残っているか否かを判断し、残っていない場合(No)、処理をステップS1205に分岐させ、IBSetを更新し、処理をステップS1206で終了させる。 FIG. 12 shows a flowchart of the embodiment of the info bubble contraction process described in step S1002 of FIG. The process in FIG. 12 starts from step S1200. In step S1201, it is determined whether or not an unprocessed info bubble still remains. If not (No), the process branches to step S1205 to update IBSet. Then, the process ends in step S1206.
一方、ステップS1201で未処理のインフォバブルが残っていると判断された場合(Yes)、ステップS1202で、未処理のインフォバブルBをIBSetから選択し、ステップS1203で、インフォバブルBのAISが収縮しきい値ShrinkThreshold以上か否かを判断する。ステップS1203で、インフォバブルBのAISが収縮しきい値ShrinkThreshold以上ではないと判断された場合(No)、ステップS1204でBに対して、ユーザの削除および分離を実行し、新に生成されたインフォバブルに処理済みのマークを付けて、IBSetに登録する。 On the other hand, if it is determined in step S1201 that an unprocessed info bubble remains (Yes), an unprocessed info bubble B is selected from IBSet in step S1202, and the AIS of the info bubble B contracts in step S1203. It is determined whether or not the threshold value is equal to or greater than ShrinkThreshold. If it is determined in step S1203 that the AIS of the info bubble B is not greater than or equal to the shrinkage threshold ShrinkThreshold (No), the user is deleted and separated from B in step S1204, and the newly generated info Mark the bubble as processed and register it in the IBSet.
一方、ステップS1203で、インフォバブルBのAISが収縮しきい値ShrinkThereshold以上と判断された場合(yes)、処理をステップS1201に分岐させ、未処理のインフォバブルがなくなるまで、処理を反復させる。 On the other hand, if it is determined in step S1203 that the AIS of the info bubble B is equal to or greater than the shrinkage threshold ShrinkThereshold (yes), the process branches to step S1201, and the process is repeated until there is no unprocessed info bubble.
以下、図12のステップS1204の削除・分離処理についての処理プロセスを説明する。 Hereinafter, a processing process for the deletion / separation processing in step S1204 of FIG. 12 will be described.
[削除処理]
インフォバブルB(I,T,P,AIS)から、P∋uであって、f(u,I,T)が最も小さいuを順に選択し、削除後のインフォバブルのAISの値がShrinkThreshold以上となるようにユーザuを次々にインフォバブルBから取り除く処理である。この処理は、削除された全ユーザのfが必ずShrinkThreshold以下で、かつ削除された後のインフォバブルBのAISを必ずShrinkThreshold以上とする処理であり、細切れのインフォバブルの生成を最小化させるための処理である。
[Delete processing]
From info bubble B (I, T, P, AIS), select u that has P∋u and the smallest f (u, I, T), and AIS value of info bubble after deletion is equal to or greater than ShrinkThreshold In this process, the user u is removed from the info bubble B one after another. This process is a process in which f of all deleted users is always equal to or less than ShrinkThreshold, and the AIS of the deleted info bubble B is always equal to or greater than ShrinkThreshold, and is for minimizing the generation of shredded info bubbles. It is processing.
[分離処理]
削除を行ったインフォバブルB(I,T,P,AIS)が連結できない場合、インフォバブルBの各統合・連結成分を新たにインフォバブルとして生成する処理である。I、T、その他のバブル情報は、元のインフォバブルBから継承するが、Pと、AISとを新しく計算して登録する。
[Separation process]
When the deleted info bubble B (I, T, P, AIS) cannot be connected, it is a process of newly generating each integrated / connected component of the info bubble B as an info bubble. I, T, and other bubble information are inherited from the original info bubble B, but P and AIS are newly calculated and registered.
図13は、図10〜図12に説明したインフォバブルの膨張・収縮処理について、グラフ表現1300を使用して説明する図である。図13に示す膨張収縮処理では、インフォバブル1310は、インフォバブル1310をバブルA、バブルB、バブルCを統合して生成される。統合前のバブルA、バブルB、バブルCは、それぞれ破線で示したものであり、図11の処理を使用して、統合が実行されている。また、インフォバブル1320は、AISの値が膨張しきい値ExpansionThreshold以上の場合に、インフォバブル境界を拡張させ、インフォバブル1320を構成する要素ユーザをインフォバブル1320に追加登録することにより実行される。
FIG. 13 is a diagram illustrating the expansion / contraction process of the info bubble described with reference to FIGS. In the expansion / contraction process shown in FIG. 13, the
また、インフォバブル1330は、AISが収縮しきい値以下となって、インフォバブル1330が収縮される。この例では、ユーザ1340のスコア関数が同じインフォバブルに属するユーザの中で最小であるため、ユーザ1340がインフォバブル1330から削除されている。インフォバブルの収縮とユーザの削除を併用することにより、インフォバブル1330のAISがShrinkThreshold以上になるような、最適なサイズのインフォバブルが残ることになる。
Further, in the
図14は、インフォバブルを初期化した段階で与えられるインフォバブル1410、1420、1430、1440を、グラフ表現で示したものである。図14で示した初期化では、収縮しきい値:ShrinkThreshold=0.55、膨張しきい値:ExpandThreshold=0.75を使用した。図14に示すように、インフォバブル生成部220は、定義されたユーザ・リンクに含まれるユーザに対して最小単位のインフォバブルを割当てている。図14でインフォバブルが割当てられているユーザは、スコア値f(u,I,T0)が、設定以上の値を有するユーザであり、図14に示した実施形態では、スコア値f(u,I,T0)が、0.55以上のユーザについてインフォバブルを割り当てている。
FIG. 14 is a graph representation of info bubbles 1410, 1420, 1430, and 1440 given at the stage of initializing the info bubble. In the initialization shown in FIG. 14, the shrinkage threshold: ShrinkThreshold = 0.55 and the expansion threshold: ExpandThreshold = 0.75 were used. As shown in FIG. 14, the info
なお、初期にインフォバブルを割当てるための値は、適宜設定することができる。図14でインフォバブルが割当てられていないユーザは、当該特徴パラメータを含む情報Iについてアクセスしていない、または、充分にアクセスしていないためである。初期化された図14の状態から、インフォバブル生成部220は、インフォバブルを可能か限り膨張させる処理を実行する。これが、図9のステップS905が実行する時刻T1での膨張処理に対応する。図ではユーザに対応するノード・節点には、ユーザを固有に識別するためのハンドルネームおよび当該ユーザのスコア値を併せて示す。
Note that a value for assigning an info bubble in the initial stage can be set as appropriate. This is because a user who is not assigned an info bubble in FIG. 14 does not access the information I including the characteristic parameter or does not access it sufficiently. From the initialized state of FIG. 14, the info
図15は、図14に示した初期膨張処理によって生成されたインフォバブルの実施形態を示す。図15に示した実施形態では、インフォバブル1510は、ハンドルネーム=Harry(0.61)のユーザのみを含んでおり、またインフォバブル1520には、ハンドルネーム=Fumio(0.58)のユーザのみを含んでいる。そして、それぞれハンドルネーム=Harryのインフォバブル1510は、IBSet集合において、識別値=3として登録され、ハンドルネーム=Fumioのインフォバブル1520は、識別値=2として登録されている。
FIG. 15 shows an embodiment of an info bubble generated by the initial expansion process shown in FIG. In the embodiment shown in FIG. 15, the
さらに、図15を参照すると、ハンドルネーム=Harryのスコア値がExpandThreshold=0.75より低いので、インフォバブル1510は、初期膨張処理では、変化しない。この状況は、ハンドルネーム=Fumio(0.58)についても同様であるため、ハンドルネーム=Fumioについてもインフォバブルは変化しない。
Further, referring to FIG. 15, since the score value of handle name = Harry is lower than ExpandThreshold = 0.75, the
一方、ハンドルネーム=Hitoshi(0.75)、ハンドルネーム=Akiko(0.98)については、それぞれのスコア値がExpandThreshold=0.75よりも大きい。初期設定時にはインフォバブル1430、1440がそれぞれ割当てられていたものである。初期膨張処理では、このインフォバブルが隣接するために、両方をまず統合する。統合後のインフォバブル1530の要素ユーザのスコア値の平均AISが、膨張しきい値を超える限り、インフォバブルを統合するとともに、直隣接するユーザの中でスコア関数が一番高いユーザの追加の可能性を判断し、可能である場合、すなわち、追加後のAISの値が収縮しきい値以上である場合には、インフォバブルにユーザの追加を実行する。このため、図14のインフォバブル1430、1440が統合され、さらに、ハンドルネーム=Akikoに隣接するハンドルネーム=Isseiのユーザが統合されたインフォバブルに直隣接するユーザの中からスコア関数が最大であることと、ハンドルネーム=Isseiのユーザを含めた場合でもAIS=0.68、つまり、ShrinkThresholdの0.55以上であるので、統合後のインフォバブル1530には、ハンドルネーム=Isseiが追加されている。
On the other hand, for handle name = Hitoshi (0.75) and handle name = Akiko (0.98), the respective score values are larger than ExpandThreshold = 0.75. Info bubbles 1430 and 1440 were assigned at the time of initial setting. In the initial expansion process, since the info bubbles are adjacent, both are first integrated. As long as the average AIS of the score values of the element users of the
その後、インフォバブル1530のAISがExpandThreshold=0.75よりも小さい(0.68)値をとることから、ユーザ・リンク上で隣接してハンドルネーム=Hideo(0.28)のユーザとハンドルネーム=Risa(0.05)のユーザが存在しても、インフォバブル1530には追加されず、初期膨張処理は、インフォバブル1730の要素ユーザとして、ユーザ=Hitoshi、Akiko、Isseiを登録し、各インフォバブルの識別値を割当て直して、統合後のインフォバブル1530を、IBSetにおいて、識別値=1として登録する。
After that, since the AIS of the
図16は、インフォバブルの時間的進化に対応するインフォバブル生成処理1600の実施形態を示す。図16に示すように、時刻Tmで生成されたIBSet1610には、インフォバブル1620およびインフォバブル1630が登録されている。図16に示した実施形態では、ユーザ=Harryが形成するインフォバブル1620は、識別値=7で示される値が付され、インフォバブル1630には、識別値=1.5が付されている。
FIG. 16 shows an embodiment of an info
識別値1.5は、インフォバブルの時間的進化を追跡することを可能とするため、初期膨張処理で与えられた識別値を、時刻Tmごとに当該インフォバブルが存在している場合、統合された側のインフォバブルの識別値を昇順にピリオドで区切り、識別値=V0.V1.V2.・・・.Vmとして生成し、インフォバブルに割り当てて登録する。例えば、IBSet1610では、インフォバブル1630は、ユーザ=Hitoshiがインフォバブルの識別値1から削除され、ユーザ=Risaが追加されているものの、初期膨張時からインフォバブル1が存在し、図16に示した実施形態での時刻Tmでは、識別値Vm=5に割当てられたインフォバブルと統合されることによって、新しくインフォバブルの識別値1.5ができたことを示している。
Identification value 1.5, in order to make it possible to track the temporal evolution of the info bubble, if the identification value given in the initial expansion process, the info bubble is present for each time T m, integrated The identification values of the information bubbles on the side that have been assigned are separated by periods in ascending order, and the identification value = V 0 . V 1 . V 2 . .... V m is generated and assigned to the info bubble and registered. For example, in the
ここで、さらに時間が経過して、時刻Tm+1について、インフォバブル生成部220がインフォバブルの生成処理を実行した結果がIBSet1650で示されている。IBSet1650には、さらに複数のインフォバブルが登録されており、IBSet1610で生成されたインフォバブル7がさらに拡大してインフォバブル1660として生成され、その識別値=7.10が割り当てられている。なお、インフォバブル1660は、膨張処理前には、インフォバブル10およびインフォバブル7として登録されていたものが統合処理によって、生成されたものである。
Here,
一方、IBSet1650には、さらに他のインフォバブル1690も登録される。インフォバブル1690は、初期のインフォバブルである識別値=1から進化したものであり、その識別値=1.5.13であり、それ以前には、識別値=1.5として参照されていたインフォバブル1630とインフォバブル1695(識別値=13)とが統合され生成されたものである。図16に示した実施形態では、時刻Tmから時刻Tm+1の間に、ユーザ=Harryを起源とするインフォバブルが拡大し、一方、ユーザ=Fumioを起源とするインフォバブルが再度、ユーザ=Hitoshiのインフォバブル1695を吸収して拡大して行くのが示されている。以上のように、時刻ごとにインフォバブルを生成することにより、初期に生成したインフォバブルの時間的進化を追跡することが可能となり、特定の特徴パラメータを含む情報のユーザ間での共有または関心の拡大または縮小を追跡することが可能となる。
On the other hand, another
したがって、例えばSNSなどで特徴パラメータを有する情報についての情報伝播が、どのユーザを起源とするものであるかを追跡することが可能となる。また、特徴パラメータに関連する情報についての時間発展を追跡できることから、特定時刻の直後から、情報処理装置122に現にアクセスしているユーザに対するバナー広告などの表示制御や広告内容などの選択にフィードバックすることが可能となる。
Therefore, for example, it is possible to track which user originates information propagation for information having characteristic parameters in SNS or the like. In addition, since it is possible to track the time development of information related to the characteristic parameter, the feedback to the display control such as the banner advertisement and the selection of the advertisement content for the user who is currently accessing the
<インフォバブルを使用したネットワーク行動解析>
以上説明したインフォバブル生成処理は、ユーザ・リンクを使用し、特徴パラメータに関心を有するユーザ集合を生成するものである。このことは、逆に、特徴パラメータに関心を有するユーザ集合を構成するユーザのユーザ属性と特徴パラメータとを対応付け、ユーザ属性ごとにクラスタリングすることを可能とする。クラスタリングのために、インフォバブル生成に使用しないユーザの属性(例えば年齢、職業、趣味など)を用いることができ、その類似度を見ることにより,ある情報に関するインフォバブルのユーザが、そのユーザ属性に関連する多様性、分布、性向があるかを分析することができる。
<Network behavior analysis using info bubbles>
The info bubble generation process described above uses a user link to generate a user set that is interested in feature parameters. On the contrary, this makes it possible to associate the user attributes of the users constituting the user set interested in the feature parameters with the feature parameters and perform clustering for each user attribute. For clustering, user attributes that are not used for generating information bubbles (for example, age, occupation, hobbies, etc.) can be used. Analyzes whether there is diversity, distribution and propensity related.
図17は、本実施形態で、インフォバブルをクラスタリングする処理の実施形態を示す。時刻Tで生成されたユーザ・リンク1710内には、特徴パラメータに関連して複数のインフォバブル、例えばインフォバブル1720〜インフォバブル1740が生成されている。ユーザ・リンク1710を対象とし、インフォバブルを構成するユーザのユーザ属性の類似性を使用して、インフォバブルをクラスタ・リストなどとして登録することにより、インフォバブル1720〜1740をユーザ属性の類似性に基づいてクラスタリングすることができる。ユーザ属性の類似性を判定するためには、ユーザ属性について属性類似リストを提供し、属性類似リストの同一レコードに分類されるユーザ属性を類似として判断することが好ましい。下記表1に、属性類似リストの実施形態を示す。下記表1の属性類似リストのエントリ項目は、列の属性それぞれを使用して類似判断に利用することもできるし、複数列の属性を組み合わせて、より詳細な類似判断を行うことができる。
FIG. 17 shows an embodiment of a process for clustering info bubbles in this embodiment. In the
クラスタリング処理は、情報処理装置122のネットワーク行動分析部240の特定モジュールとして構成することができ、適切なAPI230を介して、インフォバブル・データを取得し、登録されたユーザのユーザ属性を上記表1にマッピングして、ユーザ・リンク1750に対してインフォバブル1720〜1740を含むクラスタ1760、1770、1780などを、ユーザ属性に対応付けて生成する。さらに、タイムウィンドウごとにクラスタリング処理を実行することで、クラスタの時間進化を分析することができる。以下、クラスタリング処理についてさらに詳細に説明する。
The clustering process can be configured as a specific module of the network
[クラスタ生成処理]
クラスタ生成処理は、種々の方法で行うことができ、例えばK−meansや
agglomerative clusteringなど既存手法のうち、いかなるものでも用いることができる。クラスタ生成処理では、入力は、時刻Tにおけるインフォバブルの集合IBSetの要素集合:IB(T)={IB1, IB2, …, IBm }および実装するクラスタリング・アルゴリズムに与えるパラメータ、例えばK−meansの場合には、クラスタの個数kである。また、出力は、例えばK-means
の場合は、IB(T)の分割IB(T)1,IB(T)2,…, IB(T)kであって、IB(T)i ∩IB(T)j=φ(if i ≠ j)、∪i=1 k
IB(T)i=IB(T)の条件を満たすものである。また、i,jに対して IB(T)iとIB(T)jの類似度を出力しても良い。
[Cluster generation processing]
The cluster generation process can be performed by various methods. For example, any of existing methods such as K-means and aggregate clustering can be used. In the cluster generation process, the input is an element set of an info bubble set IBSet at time T: IB (T) = {IB1, IB2,..., IBm} and a parameter given to the clustering algorithm to be implemented, for example, K-means Is the number of clusters k. The output is, for example, K-means
IB (T) is divided into IB (T) 1, IB (T) 2, ..., IB (T) k, and IB (T) i ∩IB (T) j = φ (if i ≠ j), ∪ i = 1 k
The condition of IB (T) i = IB (T) is satisfied. Also, the similarity between IB (T) i and IB (T) j may be output for i and j.
また、本実施形態では、クラスタ生成は、サンプリング周期ごとの時刻Tmについて生成される。このため、時刻Tm(m≧0の整数)ごとに生成されたクラスタの類似度を使用してネットワーク行動分析を行うことが可能となる。図18は、生成されたクラスタの異なる時刻TmおよびTm+1の間におけるクラスタの類似判断処理の概略図である。 In the present embodiment, the cluster generation is performed for the time T m for each sampling period. For this reason, it becomes possible to perform network behavior analysis using the similarity of the clusters generated at each time T m (m ≧ 0). FIG. 18 is a schematic diagram of cluster similarity determination processing between different times T m and T m + 1 of the generated cluster.
図18に示す実施形態に示すように、時刻Tmに対応するユーザ・リンク1810内には、クラスタ1830、1840などが生成されている。その後時間が経過し、時刻Tm+1に対応する時点では、ユーザ・リンク1820内には、クラスタ1830、1850などが生成されている。図18に示した実施形態では、クラスタ1830は、そのまま生存しているものの、クラスタ1840は、他のクラスタを吸収してクラスタ1850として生成されている。ネットワーク行動解析部240は、上述した時刻Tm、Tm+1において生成された各クラスタについてクラスタ間の対応付けを行う。
As shown in the embodiment shown in FIG. 18, the
クラスタの類似度判断処理は、類似度1860を使用して計算することができる。図18に示すように、類似度1860は、本実施形態では、クラスタXおよびクラスタYに帰属されるユーザの共通性を使用して計算することが好ましい。より具体的には、類似度1860は、クラスタXに含まれるユーザと、クラスタYに含まれるユーザの要素数を重複を排除して合計する。そしてクラスタXおよびクラスタYのユーザ集合の重複要素数を合計し、Sm+1=(重複要素数)/(クラスタXとクラスタYの重複を除いた要素数)として、類似度を計算する。図18に示した実施形態では、クラスタXと、クラスタYとの間の類似度S=0.4が与えられる。クラスタが時間進化により***した場合や統合された場合は、クラスタの対応付けは、各クラスタが含むインフォバブルの識別子をトレースし、クラスタ間の対応付けを行ない、類似度を計算することができる。なお、ここに示した以外の、クラスタ間に定義される任意の類似度を用いることもできる。
The cluster similarity determination process can be calculated using the
図19は、クラスタの類似度計算の実施形態についてのフローチャートを示す。処理は、ステップS1900から開始し、ステップS1901で、カウンタiをi=0に初期設定する。ステップS1902では、時刻Tiのインフォバブルを生成し、ステップS1903で、i<Nであるか否かを判断し、i<Nでない場合(No)、次にクラスタ計算するべきインフォバブルがまだ生成されていないので、ステップS1907に分岐させて処理を終了させる。 FIG. 19 shows a flowchart for an embodiment of cluster similarity calculation. The process starts from step S1900, and in step S1901, a counter i is initialized to i = 0. In step S1902, an info bubble at time T i is generated. In step S1903, whether i <N is determined. If i <N is not satisfied (No), an info bubble to be clustered next is still generated. Since it has not been done, the process branches to step S1907 to end the process.
ステップS1903で、i<Nであると判断された場合(Yes)、ステップS1904で、時刻Ti+1のインフォバブルを生成する。その後、ステップS1905では、TiとTi+1のクラスタについて類似度を計算し、適切な記憶領域に類似度を保存する。ステップS1906では、カウンタiを、i=i+1としてインクリメントし、処理をステップS1903に戻し、ステップS1903の判断が否定的な値を返すまで、処理を反復させ、クラスタの時間進化に対応する類似度シーケンスを生成する。生成した類似度シーケンスは、インフォバブル・データ、クラスタ・データなどとともにネットワーク行動分析結果出力部250に送られて、以後の処理において利用される。
If it is determined in step S1903 that i <N (Yes), an info bubble at time T i + 1 is generated in step S1904. After that, in step S1905, the similarity is calculated for the clusters of T i and T i + 1 , and the similarity is stored in an appropriate storage area. In step S 1906, the counter i is incremented as i = i + 1, the process returns to step S 1903, and the process is repeated until the determination in step S 1903 returns a negative value, and the similarity sequence corresponding to the time evolution of the cluster Is generated. The generated similarity sequence is sent to the network behavior analysis
図20は、図19に示したステップS1905の類似度計算処理の実施形態のフローチャートである。図20の処理は、ステップS2000から開始し、ステップS2001で、時刻Tiのクラスタがまだ残っているか否かを判断し、残されていない場合(No)には、ステップS2008に処理を分岐させて処理を終了させる。 FIG. 20 is a flowchart of an embodiment of the similarity calculation process in step S1905 shown in FIG. The process in FIG. 20 starts from step S2000. In step S2001, it is determined whether or not the cluster at time T i still remains. If not (No), the process branches to step S2008. To end the process.
一方、ステップS2001で、未処理のクラスタが残っている場合(Yes)、ステップS2002で未処理の時刻TiのクラスタXを選択しScoreを0に初期化し、Y(X)を空集合に初期化する。ステップS2003で時刻Ti+1のクラスタXに対応付けられたクラスタが残っているか否かを判断し、残っている場合(Yes)、ステップS2004で未処理の時刻Ti+1のクラスタYを選択し、類似度スコアS(X、Y)を計算する。ステップS2005では、Score<S(X、Y)か否かを判断し、S(X、Y)がScoreを超える場合(Yes)、ステップS2006で、Score=S(X、Y)に設定し、Y(X)=Yとする。 On the other hand, if an unprocessed cluster remains in step S2001 (Yes), an unprocessed cluster X at time T i is selected in step S2002, Score is initialized to 0, and Y (X) is initialized to an empty set. Turn into. In step S2003, it is determined whether or not there is a cluster associated with the cluster X at time T i + 1. If so (Yes), an unprocessed cluster Y at time T i + 1 is selected in step S2004 and similar. A degree score S (X, Y) is calculated. In step S2005, it is determined whether or not Score <S (X, Y). If S (X, Y) exceeds Score (Yes), in step S2006, Score = S (X, Y) is set. Let Y (X) = Y.
その後、処理をステップS2003に戻し、クラスタXに対応付けされるクラスタYが存在しなくなるまで(ステップS2003でNo)、処理を反復させ、ステップS2003の判断が否定的な結果を返す場合(No)、処理をステップS2007に分岐させ、クラスタXに対して最も高いScoreの値を返すクラスタY(X)を最も類似度の高いクラスタとして出力する。その後、処理をステップS2001に戻し、時刻TiのクラスタXの全部について類似度計算を終了させる。 Thereafter, the process returns to step S2003, and the process is repeated until the cluster Y associated with the cluster X does not exist (No in step S2003), and the determination in step S2003 returns a negative result (No). Then, the process is branched to step S2007, and the cluster Y (X) that returns the highest Score value for the cluster X is output as the cluster having the highest similarity. Thereafter, the process returns to step S2001, and the similarity calculation is completed for all the clusters X at time T i .
以上の処理を使用することにより、特徴パラメータを含む情報のユーザ・リンク内での情報伝播を追跡することが可能となるとともに、タイムウィンドウごとに生成されるインフォバブルのユーザ集合を解析することによって、特徴パラメータに関連したユーザのネットワーク行動を、特定のユーザについてのミクロな追跡ではなく、マクロな追跡を使用して解析することが可能となる。 By using the above processing, it is possible to track information propagation within the user link of information including feature parameters, and by analyzing the user set of info bubbles generated for each time window The user's network behavior associated with the feature parameters can be analyzed using macro tracking rather than micro tracking for a particular user.
さらにインフォバブルのクラスタ化を可能とするので、インフォバブルを構成するユーザ集団の特性を分析することが可能となり、ネットワーク行動解析の結果表示、バナー広告制御、流行予測などのソリューション、または情報伝播分析などのために利用することが可能となる。 In addition, info bubbles can be clustered, so it is possible to analyze the characteristics of the user groups that make up the info bubble, display network behavior analysis results, banner advertisement control, trend prediction solutions, or information propagation analysis. It can be used for such purposes.
本実施形態の上記機能は、C++、Java(登録商標)、Java(登録商標)Beans、Java(登録商標)Applet、Java(登録商標)Script、Perl、Rubyなどのオブジェクト指向プログラミング言語などで記述された装置実行可能なプログラムにより実現でき、当該プログラムは、ハードディスク装置、CD−ROM、MO、フレキシブルディスク、EEPROM、EPROMなどの装置可読な記録媒体に格納して頒布することができ、また他装置が可能な形式でネットワークを介して伝送することができる。 The functions of this embodiment are described in an object-oriented programming language such as C ++, Java (registered trademark), Java (registered trademark) Beans, Java (registered trademark) Applet, Java (registered trademark) Script, Perl, and Ruby. The program can be realized by a program executable by the apparatus, and the program can be stored in a device-readable recording medium such as a hard disk device, CD-ROM, MO, flexible disk, EEPROM, EPROM, and distributed. It can be transmitted over the network in a possible format.
これまで本実施形態につき説明してきたが、本発明は、上述した実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。 Although the present embodiment has been described so far, the present invention is not limited to the above-described embodiment, and other embodiments, additions, changes, deletions, and the like can be conceived by those skilled in the art. It can be changed, and any aspect is within the scope of the present invention as long as the effects and effects of the present invention are exhibited.
100…分析システム、112、114…ユーザ・コンピュータ、116…ネットワーク、120…サーバ機能部、122…情報処理装置、124…ネットワーク・データ記憶部、126…テキスト・データ記憶部、128…行動履歴記憶部、130…ユーザ情報記憶部、200…機能ブロック(情報処理装置)、210…パラメータ制御部、220…インフォバブル生成部、230…API、240…ネットワーク行動分析部、250…ネットワーク行動分析結果出力部、260…インフォバブル記憶部、270…アプリケーション提供部、280…ネットワーク・アダプタ
DESCRIPTION OF
Claims (17)
ネットワークを介してユーザ・コンピュータから情報に対するアクセスを受付け、前記ユーザ・コンピュータに対して前記情報に対する前記ネットワーク行動を生成するアプリケーション提供部と、
前記ネットワーク行動の行動履歴を格納する行動履歴記憶部と、
特徴パラメータを含む情報を抽出し、抽出した前記情報に対するネットワーク行動を取得して、前記ユーザ・コンピュータをノードとするユーザ・リンクのユーザから、前記抽出した情報に対するネットワークでのユーザ関わり度を使用して少なくとも1つのユーザを、特徴付けされたユーザ集団であるインフォバブルに登録し、インフォバブルを生成する、インフォバブル生成部と、
前記インフォバブルを読み出して、前記ユーザのネットワーク行動を分析する、ネットワーク行動分析部と
を含み、
前記インフォバブル生成部は、前記インフォバブルを設定されたサンプリング周期ごとに前記ユーザ関わり度により計算されるスコア値を累積計算し、直前生成したインフォバブルを拡張するか、または直前生成したインフォバブルを収縮させるかを決定し、時系列的に複数の異なるユーザを含むインフォバブル・シーケンスを生成する、情報処理装置。 An information processing apparatus for analyzing network behavior, wherein the information processing apparatus includes:
An application providing unit that receives access to information from a user computer via a network and generates the network behavior for the information to the user computer;
An action history storage unit for storing an action history of the network action;
Information including feature parameters is extracted, network behavior is acquired for the extracted information, and the degree of user involvement in the network for the extracted information is obtained from a user link user having the user computer as a node. Registering at least one user in an info bubble that is a characterized user group, and generating an info bubble;
To read the info bubble, to analyze the network behavior of the user, look at including a network behavior analysis unit,
The info bubble generation unit cumulatively calculates a score value calculated according to the degree of user involvement for each sampling period in which the info bubble is set, and expands the info bubble generated immediately before or the info bubble generated immediately before An information processing apparatus that determines whether to contract and generates an info bubble sequence including a plurality of different users in time series.
ネットワークを介してユーザ・コンピュータから情報に対するアクセスを受付け、前記ユーザ・コンピュータに対して前記情報に対する前記ネットワーク行動を生成するアプリケーション提供部と、
前記ネットワーク行動の行動履歴を格納する行動履歴記憶部と、
特徴パラメータを含む情報を抽出し、抽出した前記情報に対するネットワーク行動を取得して、前記ユーザ・コンピュータをノードとするユーザ・リンクのユーザから、前記抽出した情報に対するネットワークでのユーザ関わり度を使用して少なくとも1つのユーザを、特徴付けされたユーザ集団である、インフォバブルに登録し、インフォバブルを生成する、インフォバブル生成部と、
前記インフォバブルを読み出して、前記ユーザのネットワーク行動を分析する、ネットワーク行動分析部と
を含み、
前記インフォバブル生成部は、前記インフォバブルを設定されたサンプリング周期ごとに前記ユーザ関わり度により計算されるスコア値を累積計算し、直前生成したインフォバブルを拡張するか、または直前生成したインフォバブルを収縮させるかを決定し、時系列的に複数の異なるユーザを含むインフォバブル・シーケンスを生成する、分析システム。 An analysis system including an information processing apparatus for analyzing network behavior between a user and a computer, wherein the information processing apparatus includes:
An application providing unit that receives access to information from a user computer via a network and generates the network behavior for the information to the user computer;
An action history storage unit for storing an action history of the network action;
Information including feature parameters is extracted, network behavior is acquired for the extracted information, and the degree of user involvement in the network for the extracted information is obtained from a user link user having the user computer as a node. An at least one user is registered in an info bubble, which is a characterized user group, and an info bubble is generated,
To read the info bubble, to analyze the network behavior of the user, look at including a network behavior analysis unit,
The info bubble generation unit cumulatively calculates a score value calculated according to the degree of user involvement for each sampling period in which the info bubble is set, and expands the info bubble generated immediately before or the info bubble generated immediately before An analysis system that determines whether to contract and generates an info bubble sequence that includes multiple different users over time.
ネットワークを介して前記ユーザ・コンピュータから情報に対するアクセスを受付け、前記ユーザ・コンピュータに対して前記情報に対する前記ネットワーク行動を生成するステップと、
前記ネットワーク行動の行動履歴を格納するステップと、
特徴パラメータを含む情報を抽出し、抽出した前記情報に対するネットワーク行動を取得して、前記ユーザ・コンピュータをノードとするユーザ・リンクのユーザから、前記抽出した情報に対するネットワークでのユーザ関わり度を計算するステップと、
前記ユーザ関わり度を累積計算してスコア値を生成し、前記スコア値を参照して直前生成した、特徴付けされたユーザ集団である、インフォバブルを拡張するか、または直前生成したインフォバブルを収縮させるかを決定するステップと、
使用して少なくとも1つのユーザをインフォバブルに追加または削除することにより、時系列的に複数の異なるユーザを含むインフォバブル・シーケンスを生成するステップと、
前記インフォバブルを読み出して、前記ユーザのネットワーク行動を分析するステップと
を実行する方法。 An analysis method executed by an information processing apparatus for network behavior of a user computer, wherein the analysis method includes:
Receiving access to information from the user computer over a network and generating the network behavior for the information to the user computer;
Storing an action history of the network action;
Information including feature parameters is extracted, network behavior for the extracted information is acquired, and the degree of user involvement in the network for the extracted information is calculated from a user link user whose node is the user computer. Steps,
Generate a score value by accumulatively calculating the degree of user involvement, expand the info bubble that is the characterized user group generated immediately before referring to the score value, or contract the info bubble generated immediately before A step of determining whether to
Generating an info bubble sequence including a plurality of different users in time series by using or adding at least one user to or removing from the info bubble;
Reading the info bubble and analyzing the network behavior of the user.
ネットワークを介して前記ユーザ・コンピュータから情報に対するアクセスを受付け、前記ユーザ・コンピュータに対して前記情報に対する前記ネットワーク行動を生成する手段と、
前記ネットワーク行動の行動履歴を格納する手段と、
特徴パラメータを含む情報を抽出し、抽出した前記情報に対するネットワーク行動を取得して、前記ユーザ・コンピュータをノードとするユーザ・リンクのユーザから、前記抽出した情報に対するネットワークでのユーザ関わり度を計算する手段と、
前記ユーザ関わり度を累積計算してスコア値を生成し、前記スコア値を参照して直前生成した、特徴づけされたユーザ集団である、インフォバブルを拡張するか、または直前生成したインフォバブルを収縮させるかを決定する手段と、
使用して少なくとも1つのユーザをインフォバブルに追加または削除することにより、時系列的に複数の異なるユーザを含むインフォバブル・シーケンスを生成する手段と、
前記インフォバブルを読み出して、前記ユーザのネットワーク行動を分析する手段と して機能させる、情報処理装置実行可能なプログラム。 An information processing apparatus executable program for executing an analysis method for network behavior of a user computer, the program comprising:
Means for accepting access to information from the user computer over a network and generating the network behavior for the information to the user computer;
Means for storing an action history of the network action;
Information including feature parameters is extracted, network behavior for the extracted information is acquired, and the degree of user involvement in the network for the extracted information is calculated from a user link user whose node is the user computer. Means,
Cumulative calculation of the degree of user involvement to generate a score value, which is a characterized user group generated immediately before referring to the score value, expands an info bubble, or contracts an info bubble generated immediately before A means of deciding whether to
Means for generating an info bubble sequence comprising a plurality of different users in time series by using or adding or removing at least one user to the info bubble;
An information processing apparatus executable program that reads the info bubble and causes it to function as a means for analyzing the network behavior of the user.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008155237A JP5159451B2 (en) | 2008-06-13 | 2008-06-13 | Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008155237A JP5159451B2 (en) | 2008-06-13 | 2008-06-13 | Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009301334A JP2009301334A (en) | 2009-12-24 |
JP5159451B2 true JP5159451B2 (en) | 2013-03-06 |
Family
ID=41548153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008155237A Expired - Fee Related JP5159451B2 (en) | 2008-06-13 | 2008-06-13 | Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5159451B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110225170A1 (en) * | 2010-03-11 | 2011-09-15 | Microsoft Corporation | Adaptable relevance techniques for social activity streams |
JP5656254B2 (en) * | 2010-12-28 | 2015-01-21 | 日本電気株式会社 | Communication event log creation system, communication event log creation method and program |
JP5525470B2 (en) * | 2011-03-24 | 2014-06-18 | Kddi株式会社 | Influence calculation device, influence calculation method, and program |
JPWO2013011728A1 (en) * | 2011-07-19 | 2015-02-23 | 日本電気株式会社 | Communication support device, communication support method, and program |
DE112012005307T5 (en) | 2011-12-19 | 2014-10-02 | International Business Machines Corporation | Method, computer program and computer for recognizing communities in a social medium |
US20140172541A1 (en) * | 2012-12-13 | 2014-06-19 | Facebook, Inc. | Generating Metrics Based on Client Device Ownership |
WO2016147944A1 (en) * | 2015-03-18 | 2016-09-22 | 日本電信電話株式会社 | Device for detecting terminal infected by malware, system for detecting terminal infected by malware, method for detecting terminal infected by malware, and program for detecting terminal infected by malware |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4892896B2 (en) * | 2005-09-05 | 2012-03-07 | 富士ゼロックス株式会社 | Communication analysis apparatus and method |
JP2007102657A (en) * | 2005-10-07 | 2007-04-19 | Fuji Xerox Co Ltd | Community analysis system, community analysis method, and computer program |
JP2008107867A (en) * | 2006-10-23 | 2008-05-08 | Hitachi Ltd | Community extraction method, community extraction processing apparatus |
JP2009193465A (en) * | 2008-02-15 | 2009-08-27 | Ntt Communications Kk | Information processor, information providing system, information processing method, and program |
-
2008
- 2008-06-13 JP JP2008155237A patent/JP5159451B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009301334A (en) | 2009-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10546006B2 (en) | Method and system for hybrid information query | |
JP5230421B2 (en) | Extensive user clustering based on set similarity | |
JP5159451B2 (en) | Information processing apparatus, analysis system, network behavior analysis method and program for analyzing network behavior | |
Tyagi et al. | An algorithmic approach to data preprocessing in web usage mining | |
US20160188604A1 (en) | Social media impact assessment | |
US20140101134A1 (en) | System and method for iterative analysis of information content | |
US20170270210A1 (en) | Data Infrastructure and Method for Ingesting and Updating A Continuously Evolving Social Network | |
Sisodia et al. | Fast prediction of web user browsing behaviours using most interesting patterns | |
US20130198240A1 (en) | Social Network Analysis | |
Jagan et al. | A survey on web personalization of web usage mining | |
CN111177481B (en) | User identifier mapping method and device | |
Xu | Cultural communication in double-layer coupling social network based on association rules in big data | |
Kafeza et al. | Behavioral and migration analysis of the dynamic customer relationships on Twitter | |
Nguyen et al. | Analyzing and visualizing web server access log file | |
Bhat et al. | Browser simulation-based crawler for online social network profile extraction | |
Santhanakumar et al. | Web usage based analysis of web pages using rapidminer | |
JP2020529777A (en) | Systems and methods for extracting structures from large, high density, high noise networks | |
JP2014016916A (en) | Social graph expanding method, program and system | |
Suguna et al. | User interest level based preprocessing algorithms using web usage mining | |
Arun et al. | Building Applications with Social Networking API's | |
US20030160609A9 (en) | Method and facility for storing and indexing web browsing data | |
JP2010198223A (en) | Relevance analysis system and relevance analysis method | |
Bakariya et al. | An inclusive survey on data preprocessing methods used in web usage mining | |
JP5535787B2 (en) | Classification device, classification method, and classification program | |
Jain et al. | A survey paper on techniques and applications of web usage mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120814 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121211 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |