JP2008276512A - 共感度判定方法、及びシステム - Google Patents

共感度判定方法、及びシステム Download PDF

Info

Publication number
JP2008276512A
JP2008276512A JP2007119361A JP2007119361A JP2008276512A JP 2008276512 A JP2008276512 A JP 2008276512A JP 2007119361 A JP2007119361 A JP 2007119361A JP 2007119361 A JP2007119361 A JP 2007119361A JP 2008276512 A JP2008276512 A JP 2008276512A
Authority
JP
Japan
Prior art keywords
document
player
created
sensitivity
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007119361A
Other languages
English (en)
Inventor
Toshio Ikeda
利夫 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kansai Electric Power Co Inc
Original Assignee
Kansai Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kansai Electric Power Co Inc filed Critical Kansai Electric Power Co Inc
Priority to JP2007119361A priority Critical patent/JP2008276512A/ja
Publication of JP2008276512A publication Critical patent/JP2008276512A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ブログサイト等において互いに共感できる人物同士を特定することが可能な共感度判定方法、及びシステムを提供する。
【解決手段】ブログサイトにおいて既に出会っている第1プレイヤと第2プレイヤ(共感している人)を対象とした解析処理を行い(ステップS1−0〜S1−12)、多変量解析を行って共感度判定式が求められる(ステップS2−1〜S2−4)。次いで、ブログサイトにおいてまだ出会っていない第3プレイヤと第4プレイヤとを対象とした解析処理が行われ(ステップS3−0〜S3−12)、得られた共感度判定式を適用して第3プレイヤと第4プレイヤとのペアについての共感度が判定される(ステップS4−1〜S4−2)。
【選択図】図3

Description

本発明は、例えばブログサイト等において、互いに共感できる人物をマッチングさせることを可能とするための、共感度判定方法、及びシステムに関する。
昨今、インターネット上のブログサイト、SNS(Social Networking Service)等の利用者は爆発的に増加している。ブログ等のユーザの多くは、日記文書の公開を通して他人の共感を得ること、乃至は日記文書を閲覧して自分が共感できる他人と出会うことを望んでいると言うことができる。ブログ等は、日常問題や時事問題に関する体験、感想、意見等を含む日記文書等の投稿、その日記文書に対するコメント文書の投稿の機会を通して、人々に共感や安心感、問題解決の糸口を提供するといったような、社会的貢献の役割をいまや担っていると言える。
ところで、ブログサイト等において自分が共感できる他人を見つけるためには、何らかの検索を行う必要がある。このような検索の従来手法としては、無作為検索、カテゴリ検索、属性・キーワード検索を挙げることができる。無作為検索は、投稿日や投稿者を指定する程度の検索を行い手動でWebページを閲覧する手法である。カテゴリ検索は、「子育て」、「ボランティア」といったテーマ分類を活用して検索する手法である。属性・キーワード検索は、投稿者の年齢や性別、キーワードを利用して検索する手法である。ブログサイトのキーワード検索の手法として、例えば特許文献1を例示することができる。
特開2007−11651号公報
ところで、ブロガーの大量発生により、ブログサイトやSNSは巨大化する傾向があり、現に数百万人規模の会員を擁するサイトも存在する。このような巨大サイトにおいて、従来の検索手法に依拠して検索を行っても、ユーザは、自分が共感する人物を効率良く、また精度良く見つけ出すのは困難である。すなわち、無作為検索やカテゴリ検索では、検索がラフすぎてなかなか共感先を見つけられない。一方キーワード検索では、適切なキーワードを選択し複雑な検索設定を行わないと、的確な検索結果は得られない。或いは、複雑な検索設定を行ったとしても、ヒット件数が膨大になることがある。
このように、なかなか自分が共感できる人物が発見できない結果、ブログサイトの日記文書に対してのコメント投稿が停滞し、サイトの活性度が低下する懸念がある。サイト運営者においてこのような事態は望ましいことではない。
本発明は、上記の問題点に鑑みてなされたもので、ブログサイト等において互いに共感できる人物同士を特定することが可能な共感度判定方法、及びシステムを提供することを目的とする。
本発明の一の局面に係る共感度判定方法は、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤと、文書交信の実績をもたない第3プレイヤ及び第4プレイヤとを選定し、第1プレイヤ又は第2プレイヤにより作成された第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書とを抽出し、前記第1文書及び第2文書を文書解析して所定のデータを抽出し、該データに基づいて数量化された複数の変数からなる第1変数群を導出し、前記第1変数群を用いて多変量解析を行うことで、プレイヤ間の共感度を数値判定するための判定式を求め、第3プレイヤ又は第4プレイヤにより作成された第3文書と、第3プレイヤ又は第4プレイヤにより作成され、任意のプレイヤの作成に係る文書に呼応して作成された第4文書とを抽出し、前記第3文書及び第4文書を文書解析して所定のデータを抽出し、該データに基づいて数量化された複数の変数からなる第2変数群を導出し、この第2変数群を前記判定式に適用することで、第3プレイヤと第4プレイヤとの共感度を判定することを特徴とする(請求項1)。
この方法によれば、先ず相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤの作成に係る第1文書及び第2文書を文書解析し、そこから第1変数群を導出して多変量解析を行って、プレイヤ間の共感度を数値判定するための判定式を求められる。この判定式は、文書交信の実績をもつプレイヤ間で現に交信された文書から導き出されたものであるため、他のプレイヤ間における共感度を数値的に評価する判定式となり得る。次に、文書交信の実績をもたない第3プレイヤ及び第4プレイヤの作成に係る第3文書及び第4文書を文書解析し、そこから第2変数群を導出される。そして、これを前記判定式に適用することで、まだ出会っていない第3プレイヤと第4プレイヤとの共感度を評価することが可能となる。
上記構成において、前記第1文書〜第4文書は、インターネット上の特定のウエブサイトから選定されることが望ましい(請求項2)。特に、前記ウエブサイトがブログサイトであって、前記第1文書及び第3文書が日記文書であり、前記第2文書及び第4文書が日記文書に対するコメント文書であることが望ましい(請求項3)。
本発明は、プレイヤ間で交信された文書データが存在すれば適用可能であり、例えば電子メール上の文書や、音声データのテキスト化文書にも適用可能である。しかし、本発明の適用用途としては、多数人の文書が存在するインターネット上の特定のウエブサイト文書に適用することが好適である。特にブログサイトには、交信文書が多数存在し、また「共感してほしいプレイヤ」、「共感する人を見つけたいプレイヤ」が多数潜在していると考えられることから、特に好ましい用途である。
上記構成において、前記所定のデータには、前記日記文書の数、文字数及び書き込み時間、並びに前記コメント文書の数、文字数及び書き込み時間が含まれていることが望ましい(請求項4)。一般に、共感度が高いほど、日記文書やコメント文書の数や文字数は増加し、また日記文書が掲載された後の短い時間内にコメント文書が投稿される傾向があると言える。従って、これらデータを用いて多変量解析のための変数群を導出することで、より実情に即した判定式を求めることが可能となる。
上記いずれかの構成において、前記所定のデータには、第1プレイヤ〜第4プレイヤの属性情報が含まれていることが望ましい(請求項5)。この構成によれば、プレイヤの属性を変数群に加えることで、より実情に即した判定式を求めることが可能となる。
本発明の他の局面に係る共感度判定システムは、インターネット上の特定のウエブサイトにおいて、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤと、文書交信の実績をもたない第3プレイヤ及び第4プレイヤとを選定する選定手段と、第1プレイヤ又は第2プレイヤにより作成された第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書と、第3プレイヤ又は第4プレイヤにより作成された第3文書と、第3プレイヤ又は第4プレイヤにより作成され、任意のプレイヤの作成に係る文書に呼応して作成された第4文書とを少なくとも抽出する文書抽出手段と、前記第1文書〜第4文書を文書解析して所定のデータを抽出する文書解析手段と、前記第1文書及び第2文書の解析データに基づいて数量化された複数の変数を含む第1多変量解析対象ファイルと、前記第3文書及び第4文書の解析データに基づいて数量化された複数の変数を含む第2多変量解析対象ファイルとを作成するファイル作成手段と、前記第1多変量解析対象ファイルに含まれる変数群を用いて多変量解析を行うことで、プレイヤ間の共感度を数値判定するための判定式を設定する判定式設定手段と、前記第2多変量解析対象ファイルに含まれる変数群を前記判定式に適用することで、第3プレイヤと第4プレイヤとの共感度を判定する共感度判定手段と、を備えることを特徴とする(請求項6)。
本発明によれば、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤの作成に係る第1文書及び第2文書を文書解析し、多変量解析して得られた判定式を用いて、まだ交信実績のない第3プレイヤと第4プレイヤとの共感度を評価することができる。従って、ブログサイト等において共感できる可能性のあるプレイヤ同士を的確に抽出し、これらプレイヤに情報を提供することができる。そして、共感者が高効率且つ高精度に検索できることでブログサイト等への投稿を促進でき、サイト運営者にとっても当該サイトが活性化されるという利点がある。
以下、図面に基づいて、本発明の実施形態につき説明する。図1は、本発明に係る共感度判定システムが適用されるネットワークシステムSのハードウェア構成を概略的に示す構成図である。このネットワークシステムSは、解析処理装置10(共感度判定システム)と、ネットワークシステムSのユーザである第1〜第4プレイヤに保有されている第1〜第4端末装置21〜24と、ブログサイト30(ブログサーバ31)とが、インターネットINを介してデータ通信可能に接続されてなる。
第1〜第4プレイヤは、例えばブログサイト30のサイト運営者に対して自身の属性情報を開示し、ブログサイト30の会員として登録されている者である。第1〜第4プレイヤは、第1〜第4端末装置21〜24を介して、ブログサイト30に日記文書を投稿したり、その日記文書に対してコメント文書を書き込んだり、或いはこれら文書を閲覧したりすることが可能とされている。第1〜第4端末装置21〜24は、代表的には、インターネット接続されたパーソナルコンピュータ、携帯電話機、携帯情報端末機等である。
なお、ここでは第1〜第4プレイヤのみを例示しているが、実際は多数のプレイヤが存在している。また、以下の説明では、第1プレイヤと第2プレイヤとが、相互間で文書交信の実績をもつプレイヤ同士(既に出会っている人々)であり、第3プレイヤと第4プレイヤとが、相互間で文書交信の実績をもたないプレイヤ同士(まだ出会っていない人々)であるものとする。
解析処理装置10は、相互間で文書交信の実績をもつプレイヤの属性、基本情報及びこれらプレイヤ間で作成されブログサイト30に投稿された文書を文書解析して得られたデータに基づいて多変量解析行い、その結果として得られた判定式を用いて、まだ交信実績のないプレイヤ同士の共感度を評価するための装置である。この解析処理装置10は、例えば上記解析処理等を行うCPU(中央演算処理装置)を備えた大型のコンピュータ装置である。
図2は、解析処理装置10の機能構成を示す機能ブロック図である。前記CPU等は、共感度判定を行うべくプログラミングされたソフトウェアが実行されることで、図2に示す機能部を具備するように動作する。解析処理装置10は、機能的に、選定部11、解析部12、評価部13、表示部14及び記憶部15を備える。この解析処理装置10には、会員サーバ100及びブログサーバ31が接続されている。
会員サーバ100は、ブログサイト30に会員登録されているプレイヤの属性情報(氏名、住所、アドレス、年齢、性別、興味関心事など)が蓄積されたサーバである。ブログサーバ31は、ブログサイト30に書き込まれた文書の文書データ、その文書の投稿日時、投稿者等の各種データを蓄積するサーバである。
解析処理装置10の選定部11は、解析すべき対象を特定するための機能部であり、プレイヤ選定部111と、データ抽出部112とを備える。プレイヤ選定部111は、ブログサーバ31の記録に基づいて、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤと、文書交信の実績をもたない第3プレイヤ及び第4プレイヤとを選定する。
データ抽出部112は、会員サーバ100及びブログサーバ31から、プレイヤ選定部111で選定されたプレイヤに関連付けて、解析パラメータとして利用されるデータを抽出する処理を行う。データ抽出部112は、プレイヤの属性情報や、ブログサイト30への書き込みに関する基本情報から、数値化可能なデータを抽出する。具体的にはデータ抽出部112は、会員サーバ100から、例えば属性合致率というパラメータを算出するために第1〜第4プレイヤの属性情報を抽出する。また、ブログサーバ31から、例えば書き込み回数というパラメータを算出するために、第1プレイヤと第2プレイヤとの間で交信された文書の数を抽出する。
解析部12は、多変量解析に用いられる各種の数量化された変数を生成する機能部である。解析部12は、文書抽出部121と、文書解析部122と、パラメータ算出部123とを含む。
文書抽出部121は、選定部11において、相互間で文書交信の実績をもつプレイヤとして選定された第1プレイヤ及び第2プレイヤに関し、第1プレイヤ又は第2プレイヤにより作成された(すなわち、第1端末装置21又は第2端末装置22を通してブログサイト30に書き込まれた;以下同じ)第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書をブログサーバ31から抽出する。
ここで、第1文書は、例えば日記文書であり、ブログサイト30においてプレイヤの共感を引きつける「共感先」となる文書である。また、第2文書は、例えばブログ公開された日記文書に対して書き込まれたコメント文書であり、プレイヤが共感を示した「共感元」の文書である。なお、コメント文書に対する再コメント文書が投稿された場合は、コメント文書が「共感先文書」、再コメント文書が「共感元文書」となる。
また、文書抽出部121は、選定部11において、相互間で文書交信の実績をもたないプレイヤとして選定された第3プレイヤ及び第4プレイヤに関し、第3プレイヤ又は第4プレイヤにより作成された第3文書と、第3プレイヤ又は第4プレイヤにより作成され、任意のプレイヤの作成に係る文書に呼応して作成された第4文書とを抽出する。ここで、第3文書は、例えば第3プレイヤ又は第4プレイヤの作成に係る日記文書(共感先文書)である。また、第4文書は、例えば任意のプレイヤの日記文書に対して投稿された、第3プレイヤ又は第4プレイヤの作成に係るコメント文書(共感元文書)である。
文書解析部122は、第1文書〜第4文書を文書解析して所定のデータを抽出する処理を行う。具体的には文書解析部122は、第1文書〜第4文書の正規化処理、文書構造解析処理、及び文書構造解析の結果に基づくデータ抽出処理などを行う。
正規化処理は、文書構造解析を正常に行い得るようにするために、第1文書〜第4文書から解析に不要な文字、記号等を削除すると共に、全角・半角文字の統一等を行う処理である。文書構造解析処理は、正規化処理後の第1文書〜第4文書に対しそれぞれ、例えば形態素解析を実施して文書を単語単位に分割する処理、構文解析処理を実施して単語間の係り受け(名詞と動詞との関係付け等)を特定する処理などである。このような文書構造解析処理のため、文書解析部122は、同義語及び表記の揺れを吸収するシソーラス(同義語辞書)を活用する。前記データ抽出処理は、例えばプレイヤ毎に共感先文書、共感元文書の単位で品詞の出現頻度や係り受けの出現頻度を求める等、数値化できるデータを抽出する処理である。なお、上記正規化処理の際に文書に含まれる顔文字や絵文字を抽出し、これらの出現頻度やカテゴリをデータ化するようにしても良い。
パラメータ算出部123は、データ抽出部112にてプレイヤの属性情報や、ブログサイト30への書き込みに関する基本情報から抽出されたデータ、文書解析部122での解析結果から得られたデータをベースにして、プレイヤのペア間における相関性を示す候補となりうる複数のパラメータ(数量化された複数の変数)を算出する。本実施形態では、前記ペアは、第1プレイヤと第2プレイヤとのペア、第3プレイヤと第4プレイヤとのペアである。
文書解析結果から得られるパラメータの例としては、文書中の品詞(名詞、形容詞、動詞)出現頻度の合致率、同一名詞の登場率、係り受けの合致率、文書意図(「〜しない」、「〜できる」のような意図句)の合致率等を例示することができる。また、属性情報や基本情報から得られるパラメータの例としては、年齢、性別、趣味等の属性合致率、書き込み文字平均数、書き込み回数、書き込み応答時間(例えば、日記文書が投稿された後にコメントが投稿されるまでの時間)等を例示することができる。一般に、書き込み文字平均数、回数が多いほど、書き込み応答時間が短いほど共感度が高いと推定できる。なお、品詞合致率等は、共感度の高さと相関性があるのか否か一概に言えないが、ここでのパラメータとしては相関性の確かさは必須ではなく、何らかの相関性を持ち得るものであれば、パラメータとして採用できる。
評価部13は、パラメータ算出部123にて得られたパラメータを用い、共感度を評価するための判定式の設定、及びこの判定式を用いて共感度を判定する機能部である。評価部13は、ファイル作成部131、多変量解析部132及び共感度判定部133を備えている。
ファイル作成部131は、第1プレイヤ及び第2プレイヤの各共感先文書、共感元文書の解析データに基づいて数量化された複数のパラメータ、第1プレイヤ及び第2プレイヤの属性情報や基本情報から得られたパラメータを含む、多変量解析のためのファイル(第1多変量解析対象ファイル)を作成する。また、ファイル作成部131は、第3プレイヤ及び第4プレイヤの各共感先文書、共感元文書の解析データに基づいて数量化された複数のパラメータ、第3プレイヤ及び第4プレイヤの属性情報や基本情報から得られたパラメータを含む、多変量解析のためのファイル(第2多変量解析対象ファイル)を作成する。
多変量解析部132は、前記第1多変量解析対象ファイルに含まれるパラメータ群を用いて多変量解析を行うことで、第1プレイヤと第2プレイヤとの間の共感度を数値判定するための判定式を設定する。多変量解析の手法としては、例えば重回帰分析、判別分析、数量化I類、数量化II類を採用することができる。ファイル作成部131は、これらの解析を実行可能とするために、上記パラメータを適宜「目的変数」、「説明変数」として設定する。例えば、上記の書き込み回数等は目的変数として、品詞合致率等は説明変数として設定される。
いずれの多変量解析手法を採用するかについては、判定目的に応じて定めることが望ましい。例えば目的が、「ある人に対して、最も共感できる人を見つける」、「共感度合いを具体的に数値で予測する(例:共感人物ランキングを求める)」といったものである場合は、重回帰分析又は数量化I類が適している。さらに、説明変数が全て数量変数である場合は重回帰分析、説明変数が全てカテゴリ変数である場合は数量化I類が選定される。一方、目的が「ある人に対して、共感できる人と共感できない人とを判別する」といったものである場合は、判別分析又は数量化II類が適している。さらに、説明変数が全て数量変数である場合は判別分析、説明変数が全てカテゴリ変数である場合は数量化II類が選定される。
このような多変量解析が実行された後、その解析精度が判定される。この解析精度判定は、上記多変量解析手法において一般的に用いられている精度判定手法を採用することができる。例えば重回帰分析の場合は次の通りである。先ず、解析結果から多重共腺性が発生していない目的変数と説明変数の組を抽出し、その組の中から例えばP値(危険率)が一定値以下の組を抽出する。その組の中から、例えば自由度修正済み決定係数が一定値以上で、最も数値が高い組を抽出する。この高数値の組の目的変数を左辺係数、説明変数と切片係数とを右辺係数に設定した回帰式を共感度の判定式と決定する。なお、P値若しくは自由度修正済み決定係数が一定値未満の場合は、低精度結果と判定し、この重回帰分析に基づいた判定式は用いないようにする。
また、判別分析の場合は、同様に解析結果から多重共腺性が発生していない目的変数と説明変数の組を抽出し、その組の中から、ボックスのM検定により、1群と2群との母分散共分散行列が異なっていない組(判別関数を抽出可能な組)を抽出する。その組の中から、判別的中率が一定値以上で、最も数値が高い組を抽出する。この高数値の組の目的変数を左辺係数、説明変数と切片係数とを右辺係数に設定した回帰式を共感度の判定式と決定する。なお、ボックスのM検定若しくは判別的中率が一定値未満の場合は、低精度結果と判定し、この判別分析に基づいた判定式は用いないようにする。以上のようにして決定された共感度判定式は、記憶部15に格納される。
共感度判定部133は、記憶部15に格納されている共感度判定式に、ファイル作成部131で作成された前記第2多変量解析対象ファイルに含まれるパラメータ群を代入して、第3プレイヤと第4プレイヤとの共感度を数値判定する処理を行う。その判定結果は、表示部14に表示される。或いは、第3、第4端末装置23、24へ向けて送信し、適宜な形態にてブログサイト30の入力画面等に表示させるようにしても良い。
判定結果の具体例は、重回帰分析又は数量化I類が用いられた場合、例えば目的変数が「コメント書き込み回数」である場合、特定のプレイヤのペアが日記文書投稿者とコメント書き込み者の関係になったと仮定したときの書き込み回数が予測数値として得られる。また、このような予測数値に基づき、特定のプレイヤに対しコメントを沢山書いてくれると予想されるプレイヤをランキング表示することも可能である。
また、判別分析又は数量化II類が用いられた場合、例えば目的変数が「第1群=コメント書き込み回数が1回、第2群=コメント書き込み回数が2回以上」と分類されているとき、特定のプレイヤのペアが日記文書投稿者とコメント書き込み者の関係になったと仮定したとき、前記第1群又は第2群のいずれに分類されるかを判定することができる。
以上説明した解析処理装置10の動作を、図3に示すフローチャートに基づいて説明する。大略的には、先ずブログサイト30において既に出会っている人々(共感している人)を対象とした解析処理を行い(ステップS1−0〜S1−12)、多変量解析を行って共感度判定式を求め(ステップS2−1〜S2−4)、次いでブログサイト30においてまだ出会っていない人々を対象とした解析処理を行い(ステップS3−0〜S3−12)、得られた共感度判定式を適用して出会っていない人々のペアについての共感度を判定する(ステップS4−1〜S4−2)というフローとなる。以下、これらのフローを順次説明する。
先ず、プレイヤ選定部111により、ブログサーバ31の記録等に基づいて、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤが選定される(ステップS1−0)。そして、データ抽出部112により、選定された第1プレイヤ及び第2プレイヤについての属性情報が会員サーバ100から抽出される(ステップS1−1、S1−2)。
次に、文書抽出部121により、第1プレイヤと第2プレイヤとの間で交わされた文書をブログサーバ31から抽出し、これら文書を「共感先文書」(第1文書)と「共感元文書」(第2文書)とに分類し、これら文書をプレイヤ毎に集約する処理が行われる(ステップS1−3)。
図4は、ステップS1−3の処理の具体例を模式的に示した図である。いま、ブログサイト30において、図4に示すように、第1プレイヤ又は第2プレイヤにより作成された第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書とからなる文書ペアP1〜P4が存在するものとする。文書ペアP1、P2は、第1プレイヤの日記文書d1、d3と、これに対する第2プレイヤのコメント文書d2、d4とからなるペアである。また、文書ペアP3は、第2プレイヤの日記文書d5と、これに対する第1プレイヤのコメント文書d6とからなるペアである。さらに、文書ペアP4は、第2プレイヤのコメント文書d4と、これに対する第1プレイヤの再コメント文書d7とからなるペアである。
この場合、文書ペアP1、P2が第2プレイヤから第1プレイヤに向けた文書群Q1として集約され、また、文書ペアP3、P4が第1プレイヤから第2プレイヤに向けた文書群Q2として集約される。そして、文書群Q1について、日記文書d1、d3が「共感先文書」、コメント文書d2、d4が「共感元文書」と分類される。また、文書群Q2について、コメント文書d4及び日記文書d5が「共感先文書」、コメント文書d6及び再コメント文書d7が「共感元文書」と分類されるものである。これらの文書は、分類、集約された状態で記憶部15に一時的に格納される。以後、ここで分類、集約された「共感先文書」、「共感元文書」についての文書解析が行われるのであるが、文書群Q1又は文書群Q2のいずれか、或いは文書群Q1及び文書群Q2の両方の「共感先文書」、「共感元文書」を用いることができる。
この後、「共感先文書」について、文書解析部122により、上述した正規化処理(ステップS1−4)、文書構造解析処理(ステップS1−5)、及びデータ抽出処理(ステップS1−6)が順次実行される。また、データ抽出部112により「共感先文書」のブログサイト30への書き込みに関する基本情報から、数値化可能なデータが抽出される(ステップS1−7)。
同様に、「共感元文書」について、文書解析部122により、正規化処理(ステップS1−8)、文書構造解析処理(ステップS1−9)、及びデータ抽出処理(ステップS1−10)が順次実行される。また、データ抽出部112により「共感元文書」のブログサイト30への書き込みに関する基本情報から、数値化可能なデータが抽出される(ステップS1−11)。
続いて、パラメータ算出部123により、ステップS1−1〜S1−11の処理で得られたデータから、第1プレイヤと第2プレイヤとの間における相関性を示す候補となりうる複数のパラメータが算出される(ステップS1−12)。このパラメータは、多変量解析の目的変数又は説明変数となるパラメータである。図5〜図7に、このようなパラメータの算出例を示す。
図5は、ステップS1−1、S1−2で抽出された属性情報から求められる「興味関心合致率」というパラメータの算出例を示す模式図である。ここでは、会員サーバ100に、第1プレイヤの興味関心項目51として“健康・医療”、“介護・福祉”、“暮らし”という3項目にチェック印が与えられた状態で登録されており、また第2プレイヤの興味関心項目52として“介護・福祉”、“住まい”、“暮らし”、“子育て・教育”、“趣味・教養”という5項目にチェック印が与えられた状態で登録されているものとする。かかるチェックデータは、データ抽出部112にて抽出される。
この場合、第1プレイヤから見ると、チェックした3項目のうち“介護・福祉”、“暮らし”という2項目で第2プレイヤと合致していることとなる。一方、第2プレイヤから見ると、チェックした5項目のうち上記の2項目が第1プレイヤと合致していることとなる。このようなデータから、例えば、
興味関心合致率=(2/3+2/5)/2=53%
というようなパラメータを算出することができる。このようなパラメータは、説明変数として利用される。
図6は、ステップS1−3〜S1−10で抽出された文書解析結果から求められる「名詞合致率」というパラメータの算出例を示す模式図である。この場合、第1プレイヤの日記文書53(共感先文書)及び第2プレイヤのコメント文書54(共感元文書)について、文書解析部122により求められた名詞の出現頻度のデータが使用される。かかるデータは、日記文書53の形態素解析処理(ステップS1−5)の後、全品詞の出現個数に対する名詞の出現個数の比を求める処理(ステップS1−6)を実行することで導出できる。同様に、コメント文書54についても、形態素解析処理(ステップS1−9)の後、全品詞の出現個数に対する名詞の出現個数の比を求める処理(ステップS1−10)を実行することで導出できる。
図6では、日記文書53について、名詞の出現個数=4000個、全品詞の出現個数=10000個であって、名詞の出現率=40%というデータが取得され、コメント文書54について、名詞の出現個数=2500個、全品詞の出現個数=5000個であって、名詞の出現率=50%というデータが取得されている例を示している。このようなデータから、例えば、
名詞合致率=(40%+50%)/2=45%
というようなパラメータを算出することができる。このようなパラメータも、説明変数として利用される。
図7は、ステップS1−7、S1−11で抽出された基本情報から求められる「コメント書き込み文字数平均」というパラメータの算出例を示す模式図である。この場合、ブログサーバ31から、第2プレイヤが投稿したコメント文書の文字数のカウント値が、データ抽出部112により抽出される。ここでは、1回目のコメント文書の文字数=30文字、2回目=20文字、3回目=10文字、4回目=40文字というデータが取得されている例を示している。このようなデータから、例えば、
コメント書き込み文字数平均=(30+20+10+40)/4=25
というようなパラメータを算出することができる。このようなパラメータは、目的変数として利用されることになる。
その後、ファイル作成部131により、パラメータ算出部123にて求められたパラメータを、その性質に応じて目的変数、説明変数に設定した多変量解析のためのファイル(第1多変量解析対象ファイル)が作成される(ステップS2−1)。
図8は、多変量解析に先立ち、ファイル作成部131にて作成される多変量解析対象ファイル55を模式的に示す表形式の図である。図8に示すように、「共感先」と「共感元」との組み合わせ毎に、目的変数及び説明変数が設定される。ここでは、目的変数として“書き込み回数”、“書き込み文字数”・・・が、説明変数として“名詞合致率”、“形容詞合致率”、“興味関心合致率”・・・が各々設定されている例を示している。なお、解析手法によっては、これら変数が“0”又は“1”等のカテゴリ変数とされる。
次に、判定目的に応じて解析手法が選定される(ステップS2−2)。選択されるのは、例えば重回帰分析、判別分析、数量化I類、数量化II類のいずれかである。そして選択された解析手法にて、多変量解析部132により多変量解析が実行される(ステップS2−3)。しかる後、解析精度(予測性能)が上記のような方法で判定され、所定の要件を満たす共感度判定式が確定される(ステップS2−4)。
ここで導出される共感度判定式は、図8の多変量解析対象ファイル55が用いられた場合、例えば、
書き込み回数=(名詞合致率×n1)+(形容詞合致率×n2)+(興味関心合致率×n3)・・・
但し、n1、n2、n3・・・は解析の結果得られる数値
というような式となる。この共感度判定式は記憶部15に格納される。
続いて、プレイヤ選定部111により、ブログサーバ31の記録等に基づいて、相互間で文書交信の実績をもたない第3プレイヤ及び第4プレイヤが選定される(ステップS3−0)。そして、データ抽出部112により、選定された第3プレイヤ及び第4プレイヤについての属性情報が会員サーバ100から抽出される(ステップS3−1、S3−2)。
そして、文書抽出部121により、例えば第3プレイヤの日記文書と、第4プレイヤが他のプレイヤの日記文書に対して投稿したコメント文書とが、ブログサーバ31から抽出される。勿論、第3プレイヤが他のプレイヤの日記文書に対して投稿したコメント文書や第4プレイヤの日記文書、第3プレイヤ及び第4プレイヤの再コメント文書も併せて抽出するようにしても良い。これら抽出された文書は、上記ステップS1−3と同様にして、「共感先文書」(第3文書)と「共感元文書」(第4文書)とに分類され、これら文書をプレイヤ毎に集約される(ステップS3−3)。
この後、「共感先文書」及び「共感元文書」について各々、文書解析部122により、正規化処理(ステップS3−4、S3−8)、文書構造解析処理(ステップS3−5、S3−9)、及びデータ抽出処理(ステップS3−6、S3−10)が順次実行される。また、データ抽出部112により「共感先文書」及び「共感元文書」のブログサイト30への書き込みに関する基本情報から、数値化可能なデータが抽出される(ステップS3−7、S3−11)。
続いて、パラメータ算出部123により、ステップS3−1〜S3−11の処理で得られたデータから、複数のパラメータが算出される(ステップS3−12)。このパラメータは、ステップS1−12において、第1プレイヤと第2プレイヤとの関係において求められたものと同じ種類のパラメータである。当該パラメータは、その性質に応じて目的変数、説明変数に区分され、ファイル作成部131により多変量解析のためのファイル(第2多変量解析対象ファイル)が作成される。
その後、共感度判定部133により、記憶部15に格納されている共感度判定式が読み出され、その共感度判定式に前記第2多変量解析対象ファイルに含まれるパラメータ群の数値が入力される(ステップS4−1)。そして、演算が実行され、共感度判定式の数値結果が出力される(ステップS4−2)。上記に例示した共感度判定式であれば、右辺の説明変数の“名詞合致率”、“形容詞合致率”、“興味関心合致率”・・・が入力され、これによって左辺の目的変数“書き込み回数”の数値結果が求められることとなる。この数値結果に基づいて、第3プレイヤと第4プレイヤとの共感度が判定される。以後、この第3プレイヤ及び第4プレイヤを別のプレイヤの組み合わせに置換して、同様な共感度判定処理が行われるものである。
この場合、一般に書き込み回数や書き込み文字数は、共感度が高いほど増加する傾向があることから、数値結果が高い値であるほど、両者の共感度が高いと予想することが可能である。つまり、高数値が出た第3プレイヤと第4プレイヤとが出会うと、当該ブログサイト30において互いに文書交信を頻繁に行う可能性が高いと評価することができる。従って、このような共感度が高いと推定されるがまだ出会っていないプレイヤのペアに対し、適宜な方法で情報を提供して出会いを誘導することで、結果的にブログサイト30を活性化させることができる。
具体的には、第3、第4プレイヤに関連付けられた第3、第4端末装置23、24へ向けて共感度情報を送信し、適宜な形態、例えば第3、第4端末装置23、24にてブログサイト30が開かれたときに、入力画面の側方に、共感度が高いと数値評価されたプレイヤのアドレスをランキング表示する方法が例示できる。
以上説明した本実施形態に係る解析処理装置10によれば、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤの作成に係る第1文書及び第2文書を文書解析し、多変量解析して得られた判定式を用いて、まだ交信実績のない第3プレイヤと第4プレイヤとの共感度を評価することができる。従って、ブログサイト30において共感できる可能性のあるプレイヤ同士を的確に抽出し、これらプレイヤに情報を提供することができる。これにより終局的にブログサイト30への投稿を促進でき、サイト運営者は当該サイトが活性化されるという利点を享受することができる。
以上、本発明の具体的実施形態につき説明したが、これらは本発明の一例であり、発明の趣旨を逸脱しない範囲において上記実施形態とは異なる態様で実施することができる。例えば、上記実施形態では、ブログサイト30へ投稿される日記文書及びコメント文書を例示したが、本発明はプレイヤ間で交信された文書データが存在すれば適用可能であり、例えば電子メール上の文書や、音声データのテキスト化文書にも適用することができる。また、上記実施形態で具体的に示したパラメータ以外にも、様々なデータを用いて算出される各種パラメータを採用することができる。
本発明に係る共感度判定システムが適用されるネットワークシステムSのハードウェア構成を概略的に示す構成図である。 解析処理装置の機能構成を示す機能ブロック図である。 解析処理装置の動作を示すフローチャートである。 文書の分類・集約処理の具体例を示す模式図である。 パラメータの算出例を示す模式図である。 パラメータの算出例を示す模式図である。 パラメータの算出例を示す模式図である。 多変量解析対象ファイルの例を模式的に示す表形式の図である。
符号の説明
10 解析処理装置(共感度判定システム)
11 選定部
12 解析部
13 評価部
14 表示部
15 記憶部
21〜24 第1〜第4端末装置
30 ブログサイト(ウエブサイト)
31 ブログサーバ
100 会員サーバ
111 プレイヤ選定部(選定手段)
112 データ抽出部
121 文書抽出部(文書抽出手段)
122 文書解析部(文書解析手段)
123 パラメータ算出部
131 ファイル作成部(ファイル作成手段)
132 多変量解析部(判定式設定手段)
133 共感度判定部(共感度判定手段)

Claims (6)

  1. 相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤと、文書交信の実績をもたない第3プレイヤ及び第4プレイヤとを選定し、
    第1プレイヤ又は第2プレイヤにより作成された第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書とを抽出し、
    前記第1文書及び第2文書を文書解析して所定のデータを抽出し、該データに基づいて数量化された複数の変数からなる第1変数群を導出し、
    前記第1変数群を用いて多変量解析を行うことで、プレイヤ間の共感度を数値判定するための判定式を求め、
    第3プレイヤ又は第4プレイヤにより作成された第3文書と、第3プレイヤ又は第4プレイヤにより作成され、任意のプレイヤの作成に係る文書に呼応して作成された第4文書とを抽出し、
    前記第3文書及び第4文書を文書解析して所定のデータを抽出し、該データに基づいて数量化された複数の変数からなる第2変数群を導出し、
    この第2変数群を前記判定式に適用することで、第3プレイヤと第4プレイヤとの共感度を判定することを特徴とする共感度判定方法。
  2. 前記第1文書〜第4文書は、インターネット上の特定のウエブサイトから選定されることを特徴とする請求項1に記載の共感度判定方法。
  3. 前記ウエブサイトがブログサイトであって、前記第1文書及び第3文書が日記文書であり、前記第2文書及び第4文書が日記文書に対するコメント文書であることを特徴とする請求項2に記載の共感度判定方法。
  4. 前記所定のデータには、前記日記文書の数、文字数及び書き込み時間、並びに前記コメント文書の数、文字数及び書き込み時間が含まれていることを特徴とする請求項3に記載の共感度判定方法。
  5. 前記所定のデータには、第1プレイヤ〜第4プレイヤの属性情報が含まれていることを特徴とする請求項1〜4のいずれかに記載の共感度判定方法。
  6. インターネット上の特定のウエブサイトにおいて、相互間で文書交信の実績をもつ第1プレイヤ及び第2プレイヤと、文書交信の実績をもたない第3プレイヤ及び第4プレイヤとを選定する選定手段と、
    第1プレイヤ又は第2プレイヤにより作成された第1文書と、第2プレイヤ又は第1プレイヤにより作成され、前記第1文書に呼応して作成された第2文書と、第3プレイヤ又は第4プレイヤにより作成された第3文書と、第3プレイヤ又は第4プレイヤにより作成され、任意のプレイヤの作成に係る文書に呼応して作成された第4文書とを少なくとも抽出する文書抽出手段と、
    前記第1文書〜第4文書を文書解析して所定のデータを抽出する文書解析手段と、
    前記第1文書及び第2文書の解析データに基づいて数量化された複数の変数を含む第1多変量解析対象ファイルと、前記第3文書及び第4文書の解析データに基づいて数量化された複数の変数を含む第2多変量解析対象ファイルとを作成するファイル作成手段と、
    前記第1多変量解析対象ファイルに含まれる変数群を用いて多変量解析を行うことで、プレイヤ間の共感度を数値判定するための判定式を設定する判定式設定手段と、
    前記第2多変量解析対象ファイルに含まれる変数群を前記判定式に適用することで、第3プレイヤと第4プレイヤとの共感度を判定する共感度判定手段と、
    を備えることを特徴とする共感度判定システム。
JP2007119361A 2007-04-27 2007-04-27 共感度判定方法、及びシステム Pending JP2008276512A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007119361A JP2008276512A (ja) 2007-04-27 2007-04-27 共感度判定方法、及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007119361A JP2008276512A (ja) 2007-04-27 2007-04-27 共感度判定方法、及びシステム

Publications (1)

Publication Number Publication Date
JP2008276512A true JP2008276512A (ja) 2008-11-13

Family

ID=40054388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007119361A Pending JP2008276512A (ja) 2007-04-27 2007-04-27 共感度判定方法、及びシステム

Country Status (1)

Country Link
JP (1) JP2008276512A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160719A (ja) * 2009-01-09 2010-07-22 Kansai Electric Power Co Inc:The 評価度合いデータの表示方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259572A (ja) * 1999-03-08 2000-09-22 Fuji Xerox Co Ltd 情報リンク生成装置及び記録媒体
JP2001338100A (ja) * 2000-05-26 2001-12-07 Ec Watch.Com:Kk 評価装置及び評価方法並びに評価用ソフトウェアを記録した記録媒体
JP2002140489A (ja) * 2000-11-02 2002-05-17 Oyomisha:Kk 感動共感システム
WO2002082339A1 (fr) * 2001-04-04 2002-10-17 Mitsuharu Watanabe Systeme et procede de traitement de donnees
JP2003076639A (ja) * 2001-09-04 2003-03-14 Matsushita Electric Ind Co Ltd データ表示指示方法
JP2003085433A (ja) * 2001-09-06 2003-03-20 Matsushita Electric Ind Co Ltd 情報評価システムおよびそのプログラム
JP2003162491A (ja) * 2001-11-22 2003-06-06 Nippon Telegr & Teleph Corp <Ntt> 電子メッセージ交換方法、電子メッセージ交換システム、サーバ装置、クライアント装置、並びに、電子メッセージ交換プログラム及びその記録媒体
JP2004094942A (ja) * 2002-08-13 2004-03-25 Tm System Kikaku:Kk コミュニケーションシステムおよび単語・情報検索システム
JP2005092579A (ja) * 2003-09-18 2005-04-07 Matsushita Electric Works Ltd メッセージ送信処理装置及びメッセージ送信処理方法
JP2005174149A (ja) * 2003-12-12 2005-06-30 Nippon Telegr & Teleph Corp <Ntt> インターネット上の情報解析システムおよび公開サーバ
JP2005293245A (ja) * 2004-03-31 2005-10-20 Takuo Munesawa テキスト文章データの概要を明示的に表示する方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259572A (ja) * 1999-03-08 2000-09-22 Fuji Xerox Co Ltd 情報リンク生成装置及び記録媒体
JP2001338100A (ja) * 2000-05-26 2001-12-07 Ec Watch.Com:Kk 評価装置及び評価方法並びに評価用ソフトウェアを記録した記録媒体
JP2002140489A (ja) * 2000-11-02 2002-05-17 Oyomisha:Kk 感動共感システム
WO2002082339A1 (fr) * 2001-04-04 2002-10-17 Mitsuharu Watanabe Systeme et procede de traitement de donnees
JP2003076639A (ja) * 2001-09-04 2003-03-14 Matsushita Electric Ind Co Ltd データ表示指示方法
JP2003085433A (ja) * 2001-09-06 2003-03-20 Matsushita Electric Ind Co Ltd 情報評価システムおよびそのプログラム
JP2003162491A (ja) * 2001-11-22 2003-06-06 Nippon Telegr & Teleph Corp <Ntt> 電子メッセージ交換方法、電子メッセージ交換システム、サーバ装置、クライアント装置、並びに、電子メッセージ交換プログラム及びその記録媒体
JP2004094942A (ja) * 2002-08-13 2004-03-25 Tm System Kikaku:Kk コミュニケーションシステムおよび単語・情報検索システム
JP2005092579A (ja) * 2003-09-18 2005-04-07 Matsushita Electric Works Ltd メッセージ送信処理装置及びメッセージ送信処理方法
JP2005174149A (ja) * 2003-12-12 2005-06-30 Nippon Telegr & Teleph Corp <Ntt> インターネット上の情報解析システムおよび公開サーバ
JP2005293245A (ja) * 2004-03-31 2005-10-20 Takuo Munesawa テキスト文章データの概要を明示的に表示する方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160719A (ja) * 2009-01-09 2010-07-22 Kansai Electric Power Co Inc:The 評価度合いデータの表示方法

Similar Documents

Publication Publication Date Title
Holtzman et al. Linguistic markers of grandiose narcissism: A LIWC analysis of 15 samples
Mohammad et al. Using hashtags to capture fine emotion categories from tweets
Han et al. Knowledge of words: An interpretable approach for personality recognition from social media
González-Bailón et al. Signals of public opinion in online communication: A comparison of methods and data sources
Montejo-Ráez et al. Ranked wordnet graph for sentiment polarity classification in twitter
Guellil et al. Social big data mining: A survey focused on opinion mining and sentiments analysis
US10642975B2 (en) System and methods for automatically detecting deceptive content
Lin et al. Personality-based refinement for sentiment classification in microblog
Li et al. Contextual recommendation based on text mining
Shen et al. Emotion mining research on micro-blog
Zhang et al. Gender classification for web forums
Bellot et al. INEX Tweet Contextualization task: Evaluation, results and lesson learned
Badugu et al. Emotion detection on twitter data using knowledge base approach
Wang et al. Leverage social media for personalized stress detection
Shin et al. What’s vs. how’s in online hotel reviews: Comparing information value of content and writing style with machine learning
Chen et al. Semantic Space models for classification of consumer webpages on metadata attributes
Al-Khatib et al. Authorship verification of opinion articles in online newspapers using the idiolect of author: a comparative study
Bilal Comparing ***'s readability of search results to the flesch readability formulae: A preliminary analysis on children's search queries
JP2009211280A (ja) オンラインページ分析方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
Waldhör et al. etBlogAnalysis—Mining virtual communities using statistical and linguistic methods for quality control in tourism
van der Sluis et al. Using complexity measures in information retrieval
Shrestha et al. Multi-modal analysis of misleading political news
Shafaee et al. Aspect-based sentiment analysis of amazon reviews for fitness tracking devices
Momeni et al. Sifting useful comments from Flickr Commons and YouTube
Rosso et al. Author profiling tracks at fire

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120328

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130226