JP5836902B2 - Event comment text detection device, program and method for detecting only comment text related to an event - Google Patents

Event comment text detection device, program and method for detecting only comment text related to an event Download PDF

Info

Publication number
JP5836902B2
JP5836902B2 JP2012193650A JP2012193650A JP5836902B2 JP 5836902 B2 JP5836902 B2 JP 5836902B2 JP 2012193650 A JP2012193650 A JP 2012193650A JP 2012193650 A JP2012193650 A JP 2012193650A JP 5836902 B2 JP5836902 B2 JP 5836902B2
Authority
JP
Japan
Prior art keywords
event
keyword
comment text
comment
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012193650A
Other languages
Japanese (ja)
Other versions
JP2014049052A (en
Inventor
昌美 中澤
昌美 中澤
池田 和史
和史 池田
小野 智弘
智弘 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012193650A priority Critical patent/JP5836902B2/en
Publication of JP2014049052A publication Critical patent/JP2014049052A/en
Application granted granted Critical
Publication of JP5836902B2 publication Critical patent/JP5836902B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、多数のコメント文章から、特定のイベントに関連するコメント文章のみを検出する技術に関する。   The present invention relates to a technique for detecting only a comment sentence related to a specific event from a large number of comment sentences.

近年、インターネットを介して、ブログ(Web log)やミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトに対して、不特定多数の第三者からのコメント文章が、活発に発信されている。これらコメント文章は、単に発信するだけでなく、共通の話題に対して議論し合うこともできることに特徴がある。これは、多数のユーザと話題を共有しているという感覚が得られる。例えばtwitterによれば、投稿者は、固有のハッシュタグを含むコメント文章を発信し、閲覧者は、このハッシュタグを含むコメント文章全体を閲覧することができる。例えば、ある地域でお祭りのような地域イベントが開催されている場合、そのお祭りに紐付けられたハッシュタグを用いてコメント文章を発信することができる。一方で、閲覧者は、このハッシュタグを用いて閲覧することによって、そのお祭りに関するtweets全体を閲覧することができる。   In recent years, comment texts from an unspecified number of third parties have become active over sites such as blogs (Web log) and mini blogs (for example, twitter (registered trademark)) via the Internet. Has been sent to. These comment sentences are characterized not only by sending them but also by discussing common topics. This gives the feeling that the topic is shared with many users. For example, according to twitter, a contributor sends a comment sentence including a unique hash tag, and a viewer can browse the entire comment sentence including the hash tag. For example, when a local event such as a festival is held in a certain area, the comment text can be transmitted using a hashtag linked to the festival. On the other hand, the viewer can browse the entire tweets about the festival by browsing using this hashtag.

これに対し、例えばtwitterにおけるジオタグ付きtweetsを用いて、地域イベントを発見することができる技術がある(例えば非特許文献1参照)。ジオタグ付きtweetsとは、GPS(Global Positioning System)機能を用いて、現在位置情報がコメント文章(つぶやき)に自動的に付加されたものをいう。この技術によれば、多くの人々の活動が活発となるお祭りのような地域イベントについて、普段と異なる特別な動向が見られる地域を検知することができる。   On the other hand, for example, there is a technology that can discover a local event using tweets with geotags in twitter (see, for example, Non-Patent Document 1). The geo-tagged tweets means that current position information is automatically added to a comment sentence (tweet) using a GPS (Global Positioning System) function. According to this technology, it is possible to detect a region where a special trend different from usual is observed for a local event such as a festival where many people are active.

藤坂達也、李龍、角谷和俊、「Twitterユーザの集合経験知を用いた地域的ノーマル状態に基づく地域イベントの発見」、WebDBForum 2010、[online]、[平成23年12月27日検索]、インターネット<URL:http://www.shse.u-hyogo.ac.jp/sumiya/japanese/kenkyuu_jyusyou.html>Tatsuya Fujisaka, Ryu Li, Kazutoshi Kakutani, “Discovering regional events based on regional normal conditions using collective experience knowledge of Twitter users”, WebDBForum 2010, [online], [December 27, 2011 search], Internet <URL: http://www.shse.u-hyogo.ac.jp/sumiya/japanese/kenkyuu_jyusyou.html>

しかしながら、従来技術によれば、例えばtwitterの場合、共通の話題となるイベントに対して、予めハッシュタグを決定した後、投稿者全員がこのハッシュタグを用いる必要がある。また、非特許文献1に記載の技術によれば、イベント位置を検出することはできるものの、そのイベントの内容までは検出することができない。即ち、イベント名や、カテゴリ(スポーツ、花火、事故など)、その詳細内容(イベント関連Web情報など)を検出することはできない。特にジオタグ付きtweetsの場合、その位置情報のみがコメント文章に付加されているだけであって、そのイベントの内容まで特定するものではない。結果的に、イベントに基づくコメント文章は、ハッシュタグによって収集する必要がある。   However, according to the prior art, for example, in the case of twitter, it is necessary for all the posters to use this hash tag after determining a hash tag in advance for an event that is a common topic. Further, according to the technique described in Non-Patent Document 1, although the event position can be detected, the contents of the event cannot be detected. That is, the event name, category (sports, fireworks, accidents, etc.), and detailed contents (event related Web information, etc.) cannot be detected. In particular, in the case of tweets with geotags, only the position information is added to the comment text, and the content of the event is not specified. As a result, comment sentences based on events need to be collected by hashtags.

これに対し、発明者らは、本来、イベントとは、当該イベントが開催される前の時間帯が重要であると考えた。そのイベントが開催される日時及び場所が告知され、そのイベントに期待する話題に関するコメント文章が多数投稿され、その後、イベントが開催される。そのために、イベントの開催を告知するコメント文章を検出することによって、そのイベントに関する多数のコメント文章を抽出し、それらコメント文章からそのイベントに関する前評判を分析することもできる。特に、前評判が高いイベントのみを検出することもできる。   In contrast, the inventors originally thought that an event is important for a time zone before the event is held. The date and place where the event will be held is announced, and many comment sentences on the topic expected for the event are posted, and then the event is held. Therefore, by detecting a comment sentence that announces the event, it is possible to extract a large number of comment sentences related to the event and to analyze the previous reputation related to the event from the comment sentences. In particular, it is also possible to detect only events with a high prior reputation.

そこで、本発明によれば、多数のコメント文章から、今後開催されるであろうイベントに関するコメント文章のみを検出すると共に、当該イベントにおける過去に注目されたコメント文章も検出することができるイベントコメント文章検出装置、プログラム及び方法を提供することを目的とする。   Therefore, according to the present invention, an event comment text that can detect only a comment text related to an event that will be held in the future from a large number of comment texts, and can also detect a comment text noted in the past in the event. An object is to provide a detection apparatus, a program, and a method.

本発明によれば、不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積手段を有し、位置及び日時に基づくイベントに関連するコメント文章を検出するイベントコメント文章検出装置であって、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶手段と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶手段と、
コメント文章から複数のキーワードを抽出するキーワード抽出手段と、
コメント文章が、イベントキーワード記憶手段に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定するイベント判定手段と、
イベント判定手段によって真と判定された場合、コメント文章が、位置情報記憶手段に記憶された第3のキーワードを含むか否かを判定する位置情報判定手段と、
位置情報判定手段によって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶するイベント記憶手段と、
「イベント」の各キーワードをキーとして、コメント文章蓄積手段を用いて、他のコメント文章を検索するコメント文章検索手段と、
「イベント」毎に、コメント文章検索手段によって検索された他のコメント文章を対応付けて記憶するイベントコメント文章蓄積手段と
を有することを特徴とする。
According to the present invention, there is provided an event comment sentence detection device that has a comment sentence storage unit that accumulates comment sentences posted by an unspecified number of third parties and detects a comment sentence related to an event based on a position and a date and time. There,
Event keyword storage means for storing in advance a first group of keywords representing a notice of an event and a second group of keywords representing a date and time;
For each third keyword group representing a place, position information storage means for storing position information in association with each other,
A keyword extraction means for extracting a plurality of keywords from the comment text;
Event determination means for determining whether or not the comment text includes both the first keyword and the second keyword stored in the event keyword storage means;
Position information determination means for determining whether or not the comment text includes a third keyword stored in the position information storage means when determined to be true by the event determination means;
When determined to be true by the position information determination means, the position information based on the third keyword, the date and time based on the second keyword, and one or more keywords included in the comment text are handled as “events”. Event storage means for storing information;
Comment text search means for searching for other comment text using comment text storage means with each keyword of “event” as a key,
For each “event”, there is an event comment text storage unit that stores another comment text searched by the comment text search unit in association with each other.

本発明のイベントコメント文章検出装置における他の実施形態によれば、イベントコメント文章蓄積手段は、「イベント」の日時から、所定の前後時間帯に含まれる他のコメント文章のみを対応付けて記憶することも好ましい。   According to another embodiment of the event comment text detection device of the present invention, the event comment text storage means stores only other comment text included in a predetermined period before and after the “event” date and time. It is also preferable.

本発明のイベントコメント文章検出装置における他の実施形態によれば、イベントコメント文章蓄積手段は、コメント文章検索手段によって検索された他のコメント文章の数が、所定数以上検索された「イベント」についてのみ、記憶することも好ましい。   According to another embodiment of the event comment text detection device of the present invention, the event comment text storage means is configured to search for “events” in which the number of other comment texts searched by the comment text search means is a predetermined number or more. It is also preferable to memorize only.

本発明のイベントコメント文章検出装置における他の実施形態によれば、
イベントコメント文章蓄積手段に蓄積された「イベント」毎に対応付けられた他のコメント文章の群からキーワードを抽出し、該キーワード毎に出現頻度を計数し、出現頻度が所定数以上となるコメント文章キーワードを抽出するコメント文章キーワード抽出手段を更に有し、
イベント記憶手段は、コメント文章キーワードをタグとして更に対応付けて記憶することも好ましい。
According to another embodiment of the event comment text detection device of the present invention,
A comment text that extracts keywords from a group of other comment texts associated with each “event” stored in the event comment text storage means, counts the appearance frequency for each keyword, and the appearance frequency is a predetermined number or more. Comment text keyword extracting means for extracting keywords,
It is also preferable that the event storage means further stores the comment sentence keyword as a tag.

本発明のイベントコメント文章検出装置における他の実施形態によれば、コメント文章キーワード抽出手段は、出現頻度が所定閾値以上となるキーワードが1語も存在しない場合、イベント記憶手段に対して当該「イベント」を除外するべく指示することも好ましい。   According to another embodiment of the event comment text detection device of the present invention, the comment text keyword extraction unit is configured to perform the “event” on the event storage unit when there is no keyword whose appearance frequency is equal to or higher than a predetermined threshold. It is also preferable to instruct to exclude “

本発明のイベントコメント文章検出装置における他の実施形態によれば、イベント記憶手段によって記憶された「イベント」の位置を指し示す地図情報と、その地図上の当該イベントの位置の部分に記述すべきコメント文章キーワードとを、ユーザ操作可能な端末へ送信する地図情報送信手段を更に有することも好ましい。   According to another embodiment of the event comment text detection device of the present invention, the map information indicating the position of the “event” stored by the event storage means and the comment to be described in the position of the event on the map It is also preferable to further include a map information transmitting means for transmitting the text keyword to a terminal operable by the user.

本発明のイベントコメント文章検出装置における他の実施形態によれば、コメント文章キーワード抽出手段は、複数のコメント文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:キーワードの出現頻度−逆出現頻度)によって特徴的キーワードを抽出する
ことも好ましい。
According to another embodiment of the event comment text detection device of the present invention, the comment text keyword extracting means extracts a keyword from a plurality of comment texts by morphological analysis, and also uses a TF-IDF (Term Frequency-Inverse Document Frequency: keyword). It is also preferable to extract characteristic keywords based on (appearance frequency-reverse appearance frequency).

本発明のイベントコメント文章検出装置における他の実施形態によれば、
コメント文章蓄積手段に蓄積されたコメント文章は、ブログ(Web log)サーバ又は掲示板サイトサーバから取得されたものであり、
ブログサーバ又は掲示板サイトサーバから、コメント文章を収集するコメント文章収集手段を更に有することも好ましい。
According to another embodiment of the event comment text detection device of the present invention,
The comment text stored in the comment text storage means is obtained from a blog (Web log) server or a bulletin board site server,
It is also preferable to further include comment text collecting means for collecting comment text from the blog server or the bulletin board site server.

本発明によれば、不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積手段を有し、位置及び日時に基づくイベントに関連するコメント文章を検出する装置に搭載されたコンピュータを機能させるイベントコメント文章検出プログラムであって、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶手段と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶手段と、
コメント文章から複数のキーワードを抽出するキーワード抽出手段と、
コメント文章が、イベントキーワード記憶手段に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定するイベント判定手段と、
イベント判定手段によって真と判定された場合、コメント文章が、位置情報記憶手段に記憶された第3のキーワードを含むか否かを判定する位置情報判定手段と、
位置情報判定手段によって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶するイベント記憶手段と、
「イベント」の各キーワードをキーとして、コメント文章蓄積手段を用いて、他のコメント文章を検索するコメント文章検索手段と、
「イベント」毎に、コメント文章検索手段によって検索された他のコメント文章を対応付けて記憶するイベントコメント文章蓄積手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, there is provided a computer mounted on an apparatus for detecting a comment text related to an event based on a position and a date and time, which has comment text storage means for storing comment text posted from an unspecified number of third parties Is an event comment sentence detection program that functions as follows:
Event keyword storage means for storing in advance a first group of keywords representing a notice of an event and a second group of keywords representing a date and time;
For each third keyword group representing a place, position information storage means for storing position information in association with each other,
A keyword extraction means for extracting a plurality of keywords from the comment text;
Event determination means for determining whether or not the comment text includes both the first keyword and the second keyword stored in the event keyword storage means;
Position information determination means for determining whether or not the comment text includes a third keyword stored in the position information storage means when determined to be true by the event determination means;
When determined to be true by the position information determination means, the position information based on the third keyword, the date and time based on the second keyword, and one or more keywords included in the comment text are handled as “events”. Event storage means for storing information;
Comment text search means for searching for other comment text using comment text storage means with each keyword of “event” as a key,
The computer is caused to function as an event comment sentence storage unit that stores another comment sentence searched by the comment sentence search unit in association with each “event”.

本発明によれば、不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積部を有し、位置及び日時に基づくイベントに関連するコメント文章を検出する装置イベントコメント文章検出方法であって、
装置は、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶部と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶部と
を有し、
装置は、
コメント文章から複数のキーワードを抽出する第1のステップと、
コメント文章が、イベントキーワード記憶に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定する第2のステップと、
第2のステップによって真と判定された場合、コメント文章が、位置情報記憶に記憶された第3のキーワードを含むか否かを判定する第3のステップと、
第3のステップによって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶する第4のステップと、
「イベント」の各キーワードをキーとして、コメント文章蓄積部を用いて、他のコメント文章を検索する第5のステップと、
「イベント」毎に、第5のステップによって検索された他のコメント文章を対応付けて記憶する第6のステップと
実行することを特徴とする。
According to the present invention, there is provided a comment sentence storage unit for accumulating comment sentences posted by an unspecified number of third parties, and an event comment sentence detection device for detecting a comment sentence related to an event based on a position and a date and time. A method,
The device
An event keyword storage unit that stores in advance a first keyword group that represents an event notice and a second keyword group that represents a date and time;
For each third keyword group representing a place, a positional information storage unit that stores positional information in advance in association with each other,
The device
A first step of extracting a plurality of keywords from the comment text;
A second step of determining whether the comment text includes both the first keyword and the second keyword stored in the event keyword storage unit ;
A third step for determining whether or not the comment text includes a third keyword stored in the position information storage unit when it is determined to be true by the second step;
If it is determined to be true by the third step, position information based on the third keyword, date and time based on the second keyword, and one or more keywords included in the comment text are handled as “events”. And a fourth step of storing
A fifth step of searching for other comment sentences using the comment sentence storage unit using each keyword of “event” as a key;
For each “event”, a sixth step is executed in which the other comment sentences searched in the fifth step are stored in association with each other.

本発明のイベントコメント文章検出装置、プログラム及び方法によれば、多数のコメント文章から、今後開催されるであろうイベントに関するコメント文章のみを検出すると共に、当該イベントにおける過去に注目されたコメント文章も検出することができる。   According to the event comment text detection device, program and method of the present invention, only a comment text related to an event that will be held in the future is detected from a large number of comment texts, and a comment text that has attracted attention in the past in the event is also detected. Can be detected.

本発明におけるシステム構成図である。It is a system configuration diagram in the present invention. 本発明におけるイベントコメント文章検出装置の機能構成図である。It is a functional block diagram of the event comment text detection apparatus in this invention. 本発明におけるイベントコメント文章検出装置のフローチャートである。It is a flowchart of the event comment text detection apparatus in this invention. 本発明における地図上のイベント位置にコメント文章キーワードを表示した画面図である。It is the screen figure which displayed the comment text keyword at the event position on the map in the present invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明におけるシステム構成図である。   FIG. 1 is a system configuration diagram according to the present invention.

図1によれば、不特定多数の第三者から投稿されたコメント文章を公開するミニブログ(mini Web log)サーバ2が、インターネットに接続されている。ミニブログサーバ2は、例えばtwitterサーバであるのが好ましいが、勿論、ブログサーバやSNS(Social
Networking Service)サーバ、掲示板サーバであってもよい。
According to FIG. 1, a mini blog (mini Web log) server 2 that publishes comment text posted by an unspecified number of third parties is connected to the Internet. The mini blog server 2 is preferably a twitter server, for example, but of course, a blog server or SNS (Social
Networking Service) server and bulletin board server.

ここで、図1によれば、特定の地域範囲で、地域イベントが開催される予定があるとする。地域イベントとは、普段と異なる特別な動向が見られる地域、即ち、お祭りのようにその場所で且つその日時間帯だけ、人が集中するような地域であるとする。このようなイベントに興味を持つ多数のユーザは、自ら所持する端末3を用いて、ミニブログサーバ2へコメント文章を投稿することができる。尚、端末3は、携帯電話機やスマートフォンのような携帯端末であってもよいし、パーソナルコンピュータのような固定端末であってもよい。   Here, according to FIG. 1, it is assumed that a local event is scheduled to be held in a specific region. A local event is a region where a special trend different from usual is seen, that is, a region where people are concentrated only at the place and day and time like a festival. Many users who are interested in such an event can post a comment sentence to the miniblog server 2 using the terminal 3 that the user owns. The terminal 3 may be a mobile terminal such as a mobile phone or a smartphone, or a fixed terminal such as a personal computer.

また、図1によれば、本発明におけるイベントコメント文章検出装置1が、インターネットに更に接続されている。イベントコメント文章検出装置1は、ミニブログサーバ2から多数のコメント文章を収集する。勿論、ミニブログサーバ2と通信することは必須の構成要素ではなく、イベントコメント文章検出装置1が、多数のコメント文章を予め蓄積したものであってもよい。   Moreover, according to FIG. 1, the event comment text detection apparatus 1 in the present invention is further connected to the Internet. The event comment text detection apparatus 1 collects a large number of comment texts from the miniblog server 2. Of course, communicating with the mini-blog server 2 is not an essential component, and the event comment text detection device 1 may store a large number of comment texts in advance.

イベントコメント文章検出装置1は、多数のコメント文章から、イベントの開催を告知するコメント文章のみを検出する。また、そのイベントに関する他のコメント文章を更に検索することによって、当該イベントに関する前評判を分析することができる。更に、一定以上の前評判が得られたイベントについて、そのイベント位置に、他のコメント文章から得られたリアルタイムなキーワードをタグ付けすることもできる。これによって、他のユーザは、端末4を用いてイベントコメント文章検出装置1へアクセスし、地図上のイベント位置に重畳されたそのキーワードを閲覧することによって、イベントの開催を直感的に認識することができる。   The event comment text detection device 1 detects only a comment text that announces the event from a large number of comment texts. Moreover, the previous reputation regarding the event can be analyzed by further searching for other comment texts regarding the event. Furthermore, for an event for which a pre-reputation of a certain level or more is obtained, a real-time keyword obtained from another comment text can be tagged at the event position. Thereby, other users access the event comment text detection device 1 using the terminal 4 and intuitively recognize the event by browsing the keyword superimposed on the event position on the map. Can do.

図2は、本発明におけるイベントコメント文章検出装置の機能構成図である。
図3は、本発明におけるイベントコメント文章検出装置のフローチャートである。
FIG. 2 is a functional configuration diagram of the event comment text detection apparatus according to the present invention.
FIG. 3 is a flowchart of the event comment text detection apparatus according to the present invention.

図2によれば、イベントコメント文章検出装置1は、インターネットに接続された通信インタフェース部10と、コメント文章蓄積部100と、イベントキーワード記憶部101と、位置情報記憶部102と、コメント文章収集部111と、キーワード抽出部112と、イベント判定部113と、位置情報判定部114と、イベント記憶部115と、コメント文章検索部116と、イベントコメント文章蓄積部117と、コメント文章キーワード抽出部118と、地図情報送信部119とを有する。これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。   According to FIG. 2, the event comment text detection device 1 includes a communication interface unit 10 connected to the Internet, a comment text storage unit 100, an event keyword storage unit 101, a position information storage unit 102, and a comment text collection unit. 111, a keyword extraction unit 112, an event determination unit 113, a position information determination unit 114, an event storage unit 115, a comment text search unit 116, an event comment text storage unit 117, and a comment text keyword extraction unit 118. And a map information transmission unit 119. These functional components are realized by executing a program that causes a computer installed in the apparatus to function.

[コメント文章収集部111]
コメント文章収集部111は、ミニブログサーバ(例えばtwitterサーバ)からコメント文章を収集する(図3のS111参照)。コメント文章収集部111は、例えばtwitterサーバに対して、StreamingAPIを用いることも好ましい。twitterのAPIは基本的にpull型であるのに対し、StreamingAPIは、クライアントが、twitterサーバへ接続を開き、リクエストを送信した後、切断されるまで接続を維持することできる。その間、サーバは、レスポンス(投稿されたコメント文章)をリアルタイムに、クライアント(イベントコメント文章検出装置1)へ送信し続けることができる。そして、コメント文章収集部111によって収集されたコメント文章は、コメント文章蓄積部100へ出力される。
[Comment text collection unit 111]
The comment text collection unit 111 collects comment text from a miniblog server (for example, a twitter server) (see S111 in FIG. 3). It is also preferable that the comment text collection unit 111 uses the Streaming API for a twitter server, for example. The Twitter API is basically a pull type, whereas the Streaming API allows a client to open a connection to a twitter server, send a request, and maintain the connection until disconnected. Meanwhile, the server can continue to send the response (posted comment text) to the client (event comment text detection device 1) in real time. Then, the comment text collected by the comment text collection unit 111 is output to the comment text storage unit 100.

[コメント文章蓄積部100]
コメント文章蓄積部100は、不特定多数の第三者から投稿されたコメント文章を蓄積する。例えば以下のようなコメント文章が含まれているとする。
”[告知]OSC 2012 Tokyo 2012年3月30日10時〜 @都庁西新宿”
”[開催]AAA店の年末sell! 2012年3月30日11時〜 新宿駅前”
尚、本発明によれば、イベントコメント文章検出装置1が、多数のコメント文章を予め蓄積していればよく、必ずしもコメント文章収集部111を必須の構成要素とするものではない。
[Comment sentence storage unit 100]
The comment text storage unit 100 stores comment text posted by an unspecified number of third parties. For example, assume that the following comment text is included.
“[Notice] OSC 2012 Tokyo March 30, 2012, 10: 00 ~ @Tokyo Metropolitan Nishi-Shinjuku”
“[Announcement] The year-end sell at AAA! March 30, 2012, 11:00-in front of Shinjuku Station”
In addition, according to this invention, the event comment text detection apparatus 1 should just accumulate | store many comment texts beforehand, and the comment text collection part 111 is not necessarily an essential component.

[イベントキーワード記憶部101]
イベントキーワード記憶部101は、イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶する。例えば以下のような第1のキーワード及び第2のキーワードが記憶されているとする。
第1のキーワード:”告知” ”開催” ・・・
第2のキーワード:”*年*月*日*時” ”?/?/?/?” ・・・
[Event keyword storage unit 101]
The event keyword storage unit 101 stores in advance a first keyword group representing an event notice and a second keyword group representing a date and time. For example, it is assumed that the following first keyword and second keyword are stored.
First keyword: “Notification” “Hold”
Second keyword: "* Year * Month * Day * Time""? /? /? /?" ...

[位置情報記憶部102]
位置情報記憶部102は、場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶する。例えば以下のような第3のキーワードに、位置情報が対応付けて記憶されているとする。
第3のキーワード:”都庁西新宿”<->緯度経度(xx1,yy1)
:”新宿駅前” <->緯度経度(xx2,yy2)
[Position information storage unit 102]
The position information storage unit 102 stores the position information in advance in association with each third keyword group representing a place. For example, it is assumed that position information is stored in association with the following third keyword.
Third keyword: “Tokyo Metropolitan Government Nishi-Shinjuku” <-> Latitude / Longitude (xx1, yy1)
: “Shinjuku Station” <-> Latitude / Longitude (xx2, yy2)

[キーワード抽出部112]
キーワード抽出部112は、コメント文章蓄積部100に蓄積されたコメント文章から複数のキーワードを抽出する(図3のS112参照)。具体的には、キーワード抽出部112は、コメント文章毎に、形態素解析によってキーワード(単語)を抽出する。抽出されたキーワードは、コメント文章毎に、イベント判定部113へ出力される。
[Keyword extraction unit 112]
The keyword extraction unit 112 extracts a plurality of keywords from the comment text stored in the comment text storage unit 100 (see S112 in FIG. 3). Specifically, the keyword extraction unit 112 extracts a keyword (word) for each comment sentence by morphological analysis. The extracted keywords are output to the event determination unit 113 for each comment sentence.

「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。ここで、形態素解析には、例えばオープンソースの形態素解析エンジン「MeCab」を用いることができる。このエンジンによれば、階層化された品詞体系を有し、形態素の品詞も解析することができる。形態素毎に、「名詞」「固有名詞」「組織」「地域」「一般」・・・等の品詞も出力される。   “Morphological analysis” refers to a technique in which sentences are divided into meaningful words and the part of speech and contents are discriminated using a dictionary. The “morpheme” means the smallest unit having meaning among the elements of the sentence. Here, for example, an open source morphological analysis engine “MeCab” can be used for the morphological analysis. This engine has a hierarchical part-of-speech system and can also analyze morpheme part-of-speech. For each morpheme, parts of speech such as “noun”, “proprietary noun”, “organization”, “region”, “general”, etc. are also output.

[イベント判定部113]
イベント判定部113は、コメント文章が、イベントキーワード記憶部101に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定する(図3のS113参照)。具体的には、当該コメント文章に、予め記憶された”告知”と”*年*月*日*時”との両方を含むか否かを判定する。例えば、以下のコメント文章は、イベント判定部113によって真と判定される。
”[告知]OSC 2012 Tokyo 2012年3月30日10時〜 @都庁西新宿”
第1のキーワード:”告知” 有り
第2のキーワード:”*年*月*日*時” 有り
”[開催]AAA店の年末sell! 2012年3月30日11時〜 新宿駅前”
第1のキーワード:”開催” 有り
第2のキーワード:”*年*月*日*時” 有り
この判定結果は、位置情報判定部114へ出力される。
[Event determination unit 113]
The event determination unit 113 determines whether the comment text includes both the first keyword and the second keyword stored in the event keyword storage unit 101 (see S113 in FIG. 3). Specifically, it is determined whether or not the comment text includes both “notification” and “* year * month * date * hour” stored in advance. For example, the following comment text is determined to be true by the event determination unit 113.
“[Notice] OSC 2012 Tokyo March 30, 2012, 10: 00 ~ @Tokyo Metropolitan Nishi-Shinjuku”
First keyword: “Notification” Yes
Second keyword: “* Year * Month * Day * Time” Yes ”[Holding] AAA store year-end sell! March 30, 2012 11: 00 ~ Shinjuku Station”
First keyword: “held”
Second keyword: “* year * month * date * hour” Yes This determination result is output to the position information determination unit 114.

[位置情報判定部114]
位置情報判定部114は、イベント判定部113によって真と判定された場合、コメント文章が、位置情報記憶部102に記憶された第3のキーワードを含むか否かを判定する(図3のS114参照)。具体的には、当該コメント文章に、予め記憶された”都庁西新宿”や”新宿駅前”を含むか否かを判定する。例えば、以下のコメント文章は、位置情報判定部114によって真と判定される。
”[告知]OSC 2012 Tokyo 2012年3月30日10時〜 @都庁西新宿”
第3のキーワード:”都庁西新宿” 有り
”[開催]AAA店の春売りsell 2012年3月30日11時〜 新宿駅前”
第3のキーワード:”新宿駅前” 有り
この判定結果と、真の場合の緯度経度とは、イベント記憶部115へ出力される。
[Position information determination unit 114]
When the event determination unit 113 determines that the position information determination unit 114 is true, the position information determination unit 114 determines whether the comment text includes the third keyword stored in the position information storage unit 102 (see S114 in FIG. 3). ). Specifically, it is determined whether or not the comment sentence includes “Town Office Nishi-Shinjuku” or “Shinjuku Station” stored in advance. For example, the following comment text is determined to be true by the position information determination unit 114.
“[Notice] OSC 2012 Tokyo March 30, 2012, 10: 00 ~ @Tokyo Metropolitan Nishi-Shinjuku”
3rd keyword: “Tokyo Metropolitan Nishi-Shinjuku” Yes ”[Holding] AAA store spring sale sell March 30, 2012 11:00-Shinjuku station square”
Third keyword: “Shinjuku station square” Yes This determination result and the latitude and longitude in the case of true are output to the event storage unit 115.

[イベント記憶部115]
イベント記憶部115は、位置情報判定部114によって真と判定された場合、第3のキーワードに基づく位置情報(緯度経度)と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶する(図3のS115参照)。例えば以下のように、「イベント」として記憶される。
(位置情報)−−−−−−−−−−(日時)−−−−−−−−(キーワード)
[イベント1]:
(都庁西新宿の)緯度経度−−2012年3月30日10時−−”OSC 2012 Tokyo”
[イベント2]:
(新宿駅前の)緯度経度−−−2012年3月30日11時−−”sell”
・・・・・
尚、イベント記憶部115は、各イベントに、後述するコメント文章キーワード抽出部118によって抽出されたコメント文章キーワードも対応付けて記憶する。
[Event storage unit 115]
The event storage unit 115, when determined to be true by the position information determination unit 114, includes position information (latitude and longitude) based on the third keyword, date and time based on the second keyword, and one included in the comment text. The above keywords are stored in association with each other as “events” (see S115 in FIG. 3). For example, it is stored as “event” as follows.
(Location information) ---------- (Date) -------- (Keyword)
[Event 1]:
Latitude and longitude (of Tokyo Metropolitan Government Nishi-Shinjuku)-10:00 March 30, 2012-"OSC 2012 Tokyo"
[Event 2]:
Latitude and longitude (in front of Shinjuku Station) --- March 30, 2012 11:00 --- "sell"
...
The event storage unit 115 also stores each event in association with a comment text keyword extracted by a comment text keyword extraction unit 118 described later.

[コメント文章検索部116]
コメント文章検索部116は、「イベント」の各キーワードをキーとして、コメント文章蓄積部100を用いて、他のコメント文章を検索する(図3のS116参照)。具体的には、[イベント1]に対して、以下のように”OSC 2012 Tokyo”を含む他のコメント文章が検索される。
”OSC 2012 Tokyoに参加するつもりです。楽しくなるかなあ?#osc11tk”
”いやぁしかし、広いなぁ。A大学。OSC 2012 Tokyoに参加。”
”さっきの学生さん達は、A大学でした。 @OSC 2012 Tokyo #osc11tk”
・・・・・
[Comment text search unit 116]
The comment text search unit 116 searches for another comment text using the comment text storage unit 100 using each keyword of “event” as a key (see S116 in FIG. 3). Specifically, other comment sentences including “OSC 2012 Tokyo” are searched for [Event 1] as follows.
“I'm going to participate in OSC 2012 Tokyo. Will it be fun? # Osc11tk”
"No, but it's wide. University A. Participated in OSC 2012 Tokyo."
“The previous students were University A. @OSC 2012 Tokyo # osc11tk”
...

また、コメント文章検索部116は、コメント文章収集部111からtwitterサーバに対するStreamingAPIを用いて、所定のキーワード”OSC 2012 Tokyo”を含むコメント文章のみを収集することもできる。   Also, the comment text search unit 116 can collect only comment texts including the predetermined keyword “OSC 2012 Tokyo” using the Streaming API for the twitter server from the comment text collection unit 111.

例えばtwitterサーバよれば、以下のように指定したキーワード”OSC 2012 Tokyo”を含むコメント文章(tweets)を検索することができる。例えば、以下のURL(Uniform Resource Locator)を指定する。
http://search.twitter.com/search.atom?phrase=”OSC 2012 Tokyo”
For example, the twitter server can search for comments containing the keyword “OSC 2012 Tokyo” specified as follows. For example, the following URL (Uniform Resource Locator) is specified.
http://search.twitter.com/search.atom?phrase=”OSC 2012 Tokyo ”

また、例えばtwitterによれば、ハッシュタグ(#)が付加されたコメント文章tweetsのみを収集することもできる。twitterの場合、ハッシュタグを用いることで、話題を共通化することできる。例えば、ハッシュタグ"#osc11tk"が付加されたtweetを検索する場合、以下のURLを指定する。
http://search.twitter.com/search.atom?q=%23osc11tk
また、日付を指定することによって、一定の期間分のtweetsを検索することもできる。
For example, according to twitter, it is also possible to collect only comment text tweets with a hash tag (#) added. In the case of twitter, the topic can be made common by using a hash tag. For example, when searching for a tweet to which the hash tag “# osc11tk” is added, the following URL is specified.
http://search.twitter.com/search.atom?q=%23osc11tk
You can also search for tweets for a certain period by specifying a date.

このように、コメント文章検索部116は、今後開催されるであろうイベントにおける過去に注目されたコメント文章も検出することができる。例えば、毎年実施される花火大会や、場所を変えて開催されるコンサートのように、以前に同様に開催されたイベントに関するコメント文章も検出することができる。   In this manner, the comment text search unit 116 can also detect comment texts that have attracted attention in the past in events that will be held in the future. For example, it is also possible to detect comment text relating to previously held events, such as a fireworks display held every year and concerts held at different locations.

[イベントコメント文章蓄積部117]
イベントコメント文章蓄積部117は、「イベント」毎に、コメント文章検索部116によって検索された他のコメント文章を対応付けて記憶する(図3のS117参照)。例えば、[イベント1]には、前述した3つのコメント文章が対応付けて記憶される。
[イベント1]<->
”OSC 2012 Tokyoに参加するつもりです。楽しくなるかなあ?#osc11tk”
”いやぁしかし、広いなぁ。A大学。OSC 2012 Tokyoに参加。”
”さっきの学生さん達は、A大学でした。 @OSC 2012 Tokyo #osc11tk”
・・・・・
[Event comment text storage unit 117]
The event comment text storage unit 117 stores the other comment text searched by the comment text search unit 116 in association with each “event” (see S117 in FIG. 3). For example, the above-mentioned three comment sentences are stored in association with [Event 1].
[Event 1] <->
“I'm going to participate in OSC 2012 Tokyo. Will it be fun? # Osc11tk”
"No, but it's wide. University A. Participated in OSC 2012 Tokyo."
“The previous students were University A. @OSC 2012 Tokyo # osc11tk”
...

ここで、イベントコメント文章蓄積部117は、「イベント」の日時から、「所定の前後時間帯」に含まれる他のコメント文章のみを対応付けて記憶するものであってもよい。例えば、「所定の前後時間帯」を、以下のように設定したとする。
「所定の前後時間帯」->「イベント開催日時から1週間前」
この場合、[イベント1]の開催日時が「2012年3月30日10時」であれば、以下のような時間帯に投稿されたコメント文章のみが記憶される。
2012年3月23日10時〜2012年3月30日10時
イベントの場合、開催前の前評判が重要であって、開催後はその意味をなさないためである。
Here, the event comment text storage unit 117 may store only other comment texts included in the “predetermined time zone” in association with each other from the date and time of the “event”. For example, it is assumed that the “predetermined time period” is set as follows.
"Predetermined time zone"->"One week before the event date"
In this case, if the date and time of [Event 1] is “March 30, 2012, 10:00”, only the comment text posted in the following time zone is stored.
This is because, in the case of an event from March 23, 2012, 10:00 to March 30, 2012, 10:00, the pre-reputation before the event is important and does not make sense after the event.

また、イベントコメント文章蓄積部117は、コメント文章検索部116によって検索された他のコメント文章の数が、所定数以上検索された「イベント」についてのみ記憶するものであってもよい。例えば所定数を100と設定した場合、[イベント1]について、コメント文章検索部116によって検索されたコメント文章が100個以上検索された場合にのみ、当該[イベント1]が記憶される。所定数よりも少ない数のコメント文章しか検索できなかったイベントは、不特定多数の第三者にとって興味が低いことを意味するために、排除する。   Further, the event comment text storage unit 117 may store only “events” in which the number of other comment texts searched by the comment text search unit 116 is a predetermined number or more. For example, when the predetermined number is set to 100, [Event 1] is stored only when 100 or more comment sentences searched by the comment sentence search unit 116 are searched for [Event 1]. An event in which only a smaller number of comment texts than the predetermined number can be searched is excluded because it means that the interest is low for an unspecified number of third parties.

[コメント文章キーワード抽出部118]
コメント文章キーワード抽出部118は、イベントコメント文章蓄積部117に蓄積された「イベント」毎に対応付けられた他のコメント文章の群からキーワードを抽出する(図3のS118参照)。キーワードの抽出は、前述したキーワード抽出部112と同様に、複数のコメント文章から形態素解析によってキーワードを抽出する。更に、TF−IDF(Term Frequency - Inverse Document Frequency:キーワードの出現頻度−逆出現頻度)によって特徴的キーワードを、コメント文章キーワードとして抽出する。「TF−IDF」とは、各単語に重みを付けて、クエリから文書をベクトル空間で表し、文書とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。尚、単に、キーワード毎に出現頻度を計数し、出現頻度が所定数以上となるコメント文章キーワードのみを抽出するものであってもよい。
[Comment text keyword extraction unit 118]
The comment text keyword extraction unit 118 extracts keywords from a group of other comment texts associated with each “event” stored in the event comment text storage unit 117 (see S118 of FIG. 3). Similar to the keyword extraction unit 112 described above, keywords are extracted from a plurality of comment sentences by morphological analysis. Furthermore, a characteristic keyword is extracted as a comment sentence keyword by TF-IDF (Term Frequency-Inverse Document Frequency: keyword appearance frequency-reverse appearance frequency). “TF-IDF” is a technique that weights each word, expresses a document from a query in a vector space, and ranks the documents based on the similarity between the query and the query. The higher the ranked value, the more important keywords are recognized. Note that the appearance frequency may be simply counted for each keyword, and only the comment text keywords whose appearance frequency is a predetermined number or more may be extracted.

ここで、コメント文章キーワード抽出部118は、例えばtwitterサーバから収集したコメント文章については、ハッシュタグ(#)は必ず、コメント文章キーワードとして抽出することも好ましい。ハッシュタグは、共通の話題についてコメント文章同士を紐付けるものであるからである。   Here, it is also preferable that the comment text keyword extraction unit 118 always extracts the hash tag (#) as a comment text keyword for comment text collected from a twitter server, for example. This is because the hash tag is used to link comment sentences on a common topic.

そして、コメント文章キーワード抽出部118は、抽出したコメント文章キーワードをイベント記憶部115へ出力する。イベント記憶部115は、イベント毎に、コメント文章キーワードをタグとして更に対応付けて記憶する。イベント記憶部115は、例えば以下のようにコメント文章キーワードをタグ付けする。
[イベント1]: -> ”#osc11tk” ”A大学”
(都庁西新宿の)緯度経度−−2012年3月30日10時−−”OSC 2012 Tokyo”
[イベント2]: -> ”AAA店” ”春売り”
(新宿駅前の)緯度経度−−−2012年3月30日11時−−”sell”
・・・・・
Then, the comment text keyword extraction unit 118 outputs the extracted comment text keyword to the event storage unit 115. The event storage unit 115 further stores the comment sentence keyword as a tag for each event. The event storage unit 115 tags the comment text keyword as follows, for example.
[Event 1]:->“# osc11tk” “University A”
Latitude and longitude (of Tokyo Metropolitan Nishi-Shinjuku)-March 30, 2012, 10:00-"OSC 2012 Tokyo"
[Event 2]:->"AAAstore""Springsale"
Latitude and longitude (in front of Shinjuku Station) --- March 30, 2012 11:00 --- "sell"
...

更に、コメント文章キーワード抽出部118は、出現頻度が所定閾値以上となるキーワードが1語も存在しない場合、イベント記憶部115に対して当該「イベント」を除外するべく指示することも好ましい。そのイベントの内容に応じて、一定以上の出現頻度のキーワードが必ず検出されると考えられる。即ち、そのキーワードは、そのイベントの内容を表すに適切なものである場合が多い。一方で、一定以上の出現頻度のキーワードが検出されないということは、特定のイベントが開催されていないと考えられる。従って、そのようなイベント位置の候補は、除外する。   Further, the comment text keyword extraction unit 118 preferably instructs the event storage unit 115 to exclude the “event” when there is no keyword whose appearance frequency is equal to or higher than a predetermined threshold. It is considered that a keyword having an appearance frequency of a certain level or more is always detected according to the contents of the event. That is, the keyword is often appropriate for expressing the contents of the event. On the other hand, if a keyword with an appearance frequency of a certain level or more is not detected, it is considered that a specific event is not held. Therefore, such event position candidates are excluded.

[地図情報送信部119]
地図情報送信部119は、イベント記憶部115によって記憶された「イベント」の位置を指し示す地図情報と、当該イベント位置(緯度経度)に記述すべきコメント文章キーワードとを、ユーザが閲覧する端末4へ送信する(図3のS119参照)。端末4は、受信した地図情報をディスプレイに表示すると共に、そのイベント位置にコメント文章キーワードを重畳的に描画する。
[Map information transmission unit 119]
The map information transmission unit 119 sends the map information indicating the position of the “event” stored in the event storage unit 115 and the comment text keyword to be described in the event position (latitude / longitude) to the terminal 4 where the user browses. Transmit (see S119 in FIG. 3). The terminal 4 displays the received map information on the display and draws the comment text keyword in a superimposed manner at the event position.

図4は、本発明における地図上のイベント位置にコメント文章キーワードを表示した画面図である。   FIG. 4 is a screen diagram in which comment text keywords are displayed at event positions on a map according to the present invention.

図4(a)によれば、地図上のイベント位置に、特徴的なコメント文章キーワードが表示されている。ここでは、2012年3月30日10時〜11時の地図上で、都庁西新宿のイベント位置に、コメント文章キーワード「#osc11tk」「OSC2012 Tokyo」「A大学」が表示されている。閲覧者は、この地図を見ることによって、2012年3月30日10時〜11時に、都庁西新宿のこの位置で、コメント文章キーワードに基づくイベントが開催されることを、直感的に認識することができる。   According to FIG. 4A, characteristic comment text keywords are displayed at event positions on the map. Here, the comment text keywords “# osc11tk”, “OSC2012 Tokyo”, and “University A” are displayed at the event location of the Tokyo Metropolitan Government Office in Shinjuku on March 30, 2012 from 10:00 to 11:00. By viewing this map, the viewer will intuitively recognize that an event based on the comment text keyword will be held at this location in the Tokyo Metropolitan Government Nishi-Shinjuku on March 30, 2012. Can do.

図4(b)によれば、2012年3月30日10時〜11時の地図上で、新宿駅前のイベント位置に、コメント文章キーワード「sell」「AAA店」「春売り」が表示されている。閲覧者は、この地図を見ることによって、2012年3月30日11時〜12時に、新宿駅前のこの位置で、コメント文章キーワードに基づくイベントが開催されることを、直感的に認識することができる。   According to FIG. 4B, comment text keywords “sell”, “AAA store”, and “spring sale” are displayed at the event location in front of Shinjuku station on the map from March 1st to 10th 10:00. Yes. By viewing this map, the viewer can intuitively recognize that an event based on the comment text keyword will be held at this position in front of Shinjuku Station on March 30, 2012 from 11:00 to 12:00. it can.

また、他の実施形態として、コメント文章キーワードの意味を表すカテゴリを、地図上に更に付与することも好ましい。図4によれば、”OSC 2012 Tokyo”と記述されているが、例えば「OSC2012 Tokyo(学会)」とカテゴリも加えて記述する。このような記述を実現するためには、イベント毎に、予め準備しておいたイベント関連語リストを作成しておく必要がある。イベント関連語リストには、例えば「OSC -> 学会」が記憶されており、「OSC」を含むことよって、カテゴリ「学会」が検索される。このように、コメント文章キーワードに加えて、カテゴリも付加することによって、閲覧者に、更に直感的に理解させることができる。   Moreover, as another embodiment, it is also preferable to further add a category representing the meaning of the comment text keyword on the map. According to FIG. 4, “OSC 2012 Tokyo” is described. For example, “OSC2012 Tokyo (academic society)” and a category are also described. In order to realize such a description, it is necessary to create an event-related word list prepared in advance for each event. For example, “OSC-> society” is stored in the event-related word list, and the category “society” is searched by including “OSC”. In this way, by adding a category in addition to the comment text keyword, the viewer can be made to understand more intuitively.

以上、詳細に説明したように、本発明のイベントコメント文章検出装置、プログラム及び方法によれば、多数のコメント文章から、今後開催されるであろうイベントに関するコメント文章のみを検出すると共に、当該イベントにおける過去に注目されたコメント文章も検出することができる。また、それらコメント文章から特徴的なコメント文章キーワードを抽出することによって、そのコメント文章キーワードを当該イベントに対応付けることができる。更に、地図上のイベント位置に、そのコメント文章キーワードを重畳的に描画することによって、閲覧者は、その地域で何が起きているかを直感的に認識することができる。更に、その地図上で、開催されるイベント及びそのコメント文章キーワードを、時間経過に応じて切り替えて表示することによって、閲覧者は、イベントの開催日時も直感的に認識することができる。   As described above in detail, according to the event comment text detection device, program, and method of the present invention, only a comment text related to an event that will be held in the future is detected from a number of comment texts, and the event It is also possible to detect comment sentences that have attracted attention in the past. Further, by extracting characteristic comment sentence keywords from the comment sentences, the comment sentence keywords can be associated with the event. Furthermore, by drawing the comment text keyword in a superimposed manner at the event position on the map, the viewer can intuitively recognize what is happening in the area. Furthermore, the viewer can intuitively recognize the date and time of the event by switching the event to be held and the comment text keyword in accordance with the passage of time on the map.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。   Various changes, modifications, and omissions of the above-described various embodiments of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The invention is limited only as defined in the following claims and the equivalents thereto.

1 イベントコメント文章検出装置
10 通信インタフェース部
100 コメント文章蓄積部
101 イベントキーワード記憶部
102 位置情報記憶部
111 コメント文章収集部
112 キーワード抽出部
113 イベント判定部
114 位置情報判定部
115 イベント記憶部
116 コメント文章検索部
117 イベントコメント文章蓄積部
118 コメント文章キーワード抽出部
119 地図情報送信部
2 ミニブログサーバ
3 投稿者用端末
4 閲覧者用端末
DESCRIPTION OF SYMBOLS 1 Event comment text detection apparatus 10 Communication interface part 100 Comment text storage part 101 Event keyword memory | storage part 102 Location information storage part 111 Comment text collection part 112 Keyword extraction part 113 Event determination part 114 Position information determination part 115 Event storage part 116 Comment text Search part 117 Event comment sentence storage part 118 Comment sentence keyword extraction part 119 Map information transmission part 2 Miniblog server 3 Terminal for contributors 4 Terminal for viewers

Claims (10)

不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積手段を有し、位置及び日時に基づくイベントに関連するコメント文章を検出するイベントコメント文章検出装置であって、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶手段と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶手段と、
前記コメント文章から複数のキーワードを抽出するキーワード抽出手段と、
前記コメント文章が、前記イベントキーワード記憶手段に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定するイベント判定手段と、
前記イベント判定手段によって真と判定された場合、前記コメント文章が、前記位置情報記憶手段に記憶された第3のキーワードを含むか否かを判定する位置情報判定手段と、
前記位置情報判定手段によって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶するイベント記憶手段と、
前記「イベント」の各キーワードをキーとして、前記コメント文章蓄積手段を用いて、他のコメント文章を検索するコメント文章検索手段と、
前記「イベント」毎に、前記コメント文章検索手段によって検索された他のコメント文章を対応付けて記憶するイベントコメント文章蓄積手段と
を有することを特徴とするイベントコメント文章検出装置。
An event comment sentence detection device that has comment sentence storage means for accumulating comment sentences posted from an unspecified number of third parties, and detects comment sentences related to events based on position and date and time,
Event keyword storage means for storing in advance a first group of keywords representing a notice of an event and a second group of keywords representing a date and time;
For each third keyword group representing a place, position information storage means for storing position information in association with each other,
Keyword extracting means for extracting a plurality of keywords from the comment text;
Event determination means for determining whether or not the comment text includes both the first keyword and the second keyword stored in the event keyword storage means;
Position information determination means for determining whether or not the comment text includes a third keyword stored in the position information storage means when determined to be true by the event determination means;
When the position information determination unit determines that the position is true, the position information based on the third keyword, the date and time based on the second keyword, and one or more keywords included in the comment text are defined as an “event”. Event storage means for storing in association with each other;
Comment text search means for searching for other comment text using the comment text storage means with each keyword of the “event” as a key,
An event comment sentence storage unit that stores, for each “event”, other comment sentences retrieved by the comment sentence retrieval unit in association with each other.
前記イベントコメント文章蓄積手段は、前記「イベント」の日時から、所定の前後時間帯に含まれる他のコメント文章のみを対応付けて記憶することを特徴とする請求項1に記載のイベントコメント文章検出装置。   2. The event comment text detection unit according to claim 1, wherein the event comment text storage unit stores only another comment text included in a predetermined time period from the date and time of the “event” in association with each other. apparatus. 前記イベントコメント文章蓄積手段は、前記コメント文章検索手段によって検索された他のコメント文章の数が、所定数以上検索された前記「イベント」についてのみ、記憶することを特徴とする請求項1又は2に記載のイベントコメント文章検出装置。   3. The event comment text storage means stores only the “event” in which the number of other comment texts searched by the comment text search means is searched for a predetermined number or more. Event comment text detector described in 1. 前記イベントコメント文章蓄積手段に蓄積された前記「イベント」毎に対応付けられた前記他のコメント文章の群からキーワードを抽出し、該キーワード毎に出現頻度を計数し、出現頻度が所定数以上となるコメント文章キーワードを抽出するコメント文章キーワード抽出手段を更に有し、
前記イベント記憶手段は、前記コメント文章キーワードをタグとして更に対応付けて記憶する
ことを特徴とする請求項1から3のいずれか1項に記載のイベントコメント文章検出装置。
A keyword is extracted from the group of other comment texts associated with each “event” stored in the event comment text storage means, the appearance frequency is counted for each keyword, and the appearance frequency is a predetermined number or more. Comment text keyword extracting means for extracting the comment text keyword
The event comment sentence detection apparatus according to claim 1, wherein the event storage unit further stores the comment sentence keyword as a tag in association with each other.
前記コメント文章キーワード抽出手段は、前記出現頻度が所定閾値以上となるキーワードが1語も存在しない場合、前記イベント記憶手段に対して当該「イベント」を除外するべく指示することを特徴とする請求項4に記載のイベントコメント文章検出装置。   The comment text keyword extraction unit instructs the event storage unit to exclude the “event” when no keyword having the appearance frequency equal to or higher than a predetermined threshold exists. 4. The event comment sentence detection device according to 4. 前記イベント記憶手段によって記憶された「イベント」の位置を指し示す地図情報と、その地図上の当該イベントの位置の部分に記述すべき前記コメント文章キーワードとを、ユーザ操作可能な端末へ送信する地図情報送信手段を更に有することを特徴とする請求項4又は5に記載のイベントコメント文章検出装置。   Map information for transmitting the map information indicating the position of the “event” stored by the event storage means and the comment text keyword to be described in the position of the event position on the map to a user operable terminal 6. The event comment text detection apparatus according to claim 4, further comprising a transmission unit. 前記コメント文章キーワード抽出手段は、複数のコメント文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:キーワードの出現頻度−逆出現頻度)によって特徴的キーワードを抽出する
ことを特徴とする請求項4から6のいずれか1項に記載のイベントコメント文章検出装置。
The comment sentence keyword extracting means extracts a keyword from a plurality of comment sentences by morphological analysis and extracts a characteristic keyword by TF-IDF (Term Frequency-Inverse Document Frequency). The event comment sentence detection device according to claim 4, wherein
前記コメント文章蓄積手段に蓄積された前記コメント文章は、ブログ(Web log)サーバ又は掲示板サイトサーバから取得されたものであり、
前記ブログサーバ又は掲示板サイトサーバから、コメント文章を収集するコメント文章収集手段を更に有することを特徴とする請求項1から7のいずれか1項に記載のイベントコメント文章検出装置。
The comment text stored in the comment text storage means is acquired from a blog (Web log) server or a bulletin board site server,
8. The event comment text detection device according to claim 1, further comprising comment text collection means for collecting comment text from the blog server or bulletin board site server.
不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積手段を有し、位置及び日時に基づくイベントに関連するコメント文章を検出する装置に搭載されたコンピュータを機能させるイベントコメント文章検出プログラムであって、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶手段と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶手段と、
前記コメント文章から複数のキーワードを抽出するキーワード抽出手段と、
前記コメント文章が、前記イベントキーワード記憶手段に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定するイベント判定手段と、
前記イベント判定手段によって真と判定された場合、前記コメント文章が、前記位置情報記憶手段に記憶された第3のキーワードを含むか否かを判定する位置情報判定手段と、
前記位置情報判定手段によって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶するイベント記憶手段と、
前記「イベント」の各キーワードをキーとして、前記コメント文章蓄積手段を用いて、他のコメント文章を検索するコメント文章検索手段と、
前記「イベント」毎に、前記コメント文章検索手段によって検索された他のコメント文章を対応付けて記憶するイベントコメント文章蓄積手段と
してコンピュータを機能させることを特徴とするイベントコメント文章検出プログラム。
Event comment text that has a comment text storage means that accumulates comment text posted by an unspecified number of third parties and that functions as a computer installed in a device that detects comment text related to events based on location and date / time A detection program,
Event keyword storage means for storing in advance a first group of keywords representing a notice of an event and a second group of keywords representing a date and time;
For each third keyword group representing a place, position information storage means for storing position information in association with each other,
Keyword extracting means for extracting a plurality of keywords from the comment text;
Event determination means for determining whether or not the comment text includes both the first keyword and the second keyword stored in the event keyword storage means;
Position information determination means for determining whether or not the comment text includes a third keyword stored in the position information storage means when determined to be true by the event determination means;
When the position information determination unit determines that the position is true, the position information based on the third keyword, the date and time based on the second keyword, and one or more keywords included in the comment text are defined as an “event”. Event storage means for storing in association with each other;
Comment text search means for searching for other comment text using the comment text storage means with each keyword of the “event” as a key,
An event comment text detection program that causes a computer to function as event comment text storage means for storing another comment text searched by the comment text search means in association with each “event”.
不特定多数の第三者から投稿されたコメント文章を蓄積したコメント文章蓄積部を有し、位置及び日時に基づくイベントに関連するコメント文章を検出する装置イベントコメント文章検出方法であって、
前記装置は、
イベントの予告を表す第1のキーワードの群と、日時を表す第2のキーワードの群とを予め記憶したイベントキーワード記憶部と、
場所を表す第3のキーワード群毎に、位置情報を対応付けて予め記憶した位置情報記憶部と
を有し、
前記装置は、
前記コメント文章から複数のキーワードを抽出する第1のステップと、
前記コメント文章が、前記イベントキーワード記憶に記憶された第1のキーワード及び第2のキーワードの両方を含むか否かを判定する第2のステップと、
第2のステップによって真と判定された場合、前記コメント文章が、前記位置情報記憶に記憶された第3のキーワードを含むか否かを判定する第3のステップと、
第3のステップによって真と判定された場合、第3のキーワードに基づく位置情報と、第2のキーワードに基づく日時と、当該コメント文章に含まれる1つ以上のキーワードとを、「イベント」として対応付けて記憶する第4のステップと、
前記「イベント」の各キーワードをキーとして、前記コメント文章蓄積部を用いて、他のコメント文章を検索する第5のステップと、
前記「イベント」毎に、第5のステップによって検索された他のコメント文章を対応付けて記憶する第6のステップと
実行することを特徴とする装置のイベントコメント文章検出方法。
Has a comment sentence storage unit that accumulates the comment text posted by an unspecified number of the third party, a event comment sentence method for detecting apparatus for detecting the comment text associated with the event based on the position and the date and time,
The device is
An event keyword storage unit that stores in advance a first keyword group that represents an event notice and a second keyword group that represents a date and time;
For each third keyword group representing a place, a positional information storage unit that stores positional information in advance in association with each other,
The device is
A first step of extracting a plurality of keywords from the comment text;
A second step of determining whether or not the comment text includes both the first keyword and the second keyword stored in the event keyword storage unit ;
A third step of determining whether or not the comment text includes a third keyword stored in the position information storage unit when determined to be true by the second step;
If it is determined to be true by the third step, position information based on the third keyword, date and time based on the second keyword, and one or more keywords included in the comment text are handled as “events”. And a fourth step of storing
A fifth step of searching for other comment sentences using the comment sentence storage unit using each keyword of the “event” as a key;
An event comment text detection method for an apparatus, comprising: executing , for each “event”, a sixth step of storing another comment text searched in the fifth step in association with each other.
JP2012193650A 2012-09-04 2012-09-04 Event comment text detection device, program and method for detecting only comment text related to an event Active JP5836902B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012193650A JP5836902B2 (en) 2012-09-04 2012-09-04 Event comment text detection device, program and method for detecting only comment text related to an event

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012193650A JP5836902B2 (en) 2012-09-04 2012-09-04 Event comment text detection device, program and method for detecting only comment text related to an event

Publications (2)

Publication Number Publication Date
JP2014049052A JP2014049052A (en) 2014-03-17
JP5836902B2 true JP5836902B2 (en) 2015-12-24

Family

ID=50608615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012193650A Active JP5836902B2 (en) 2012-09-04 2012-09-04 Event comment text detection device, program and method for detecting only comment text related to an event

Country Status (1)

Country Link
JP (1) JP5836902B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6411800B2 (en) * 2014-07-17 2018-10-24 株式会社Nttドコモ Information management apparatus, information management system, and information management program
JP6659429B2 (en) * 2016-03-31 2020-03-04 アルパイン株式会社 Event information presentation device, method and program

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3574551B2 (en) * 1997-09-22 2004-10-06 日本電信電話株式会社 Information extraction method, information extraction device, and recording medium recording information extraction program
JP4018322B2 (en) * 2000-06-08 2007-12-05 凸版印刷株式会社 Document information classification / distribution system and method
US20030200192A1 (en) * 2002-04-18 2003-10-23 Bell Brian L. Method of organizing information into topical, temporal, and location associations for organizing, selecting, and distributing information
JP4496900B2 (en) * 2004-09-10 2010-07-07 日本電信電話株式会社 Event information extraction apparatus and program
JP2007199768A (en) * 2006-01-23 2007-08-09 Fuji Xerox Co Ltd Document management apparatus, document management method, and computer program
JP5556100B2 (en) * 2009-09-17 2014-07-23 富士通株式会社 Information providing apparatus, information providing method, and computer program
JP5102883B2 (en) * 2011-02-01 2012-12-19 株式会社エヌ・ティ・ティ・ドコモ User utterance extraction apparatus, method and program

Also Published As

Publication number Publication date
JP2014049052A (en) 2014-03-17

Similar Documents

Publication Publication Date Title
US10223465B2 (en) Customizable, real time intelligence channel
US11153253B2 (en) System and method for determining and delivering breaking news utilizing social media
US10567325B2 (en) System and method for email message following from a user&#39;s inbox
US10798193B2 (en) System and method for automatic storyline construction based on determined breaking news
US10409873B2 (en) Searching for content by key-authors on online social networks
US9299059B1 (en) Generating a summary of social media content
JP2019071068A (en) Push of suggested retrieval queries to mobile devices
JP5725619B2 (en) Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences
Xu et al. Building the multi-modal storytelling of urban emergency events based on crowdsensing of social media analytics
US10176265B2 (en) Awareness engine
US10489472B2 (en) Context-based search suggestions on online social networks
US8099430B2 (en) Computer method and apparatus of information management and navigation
US10977289B2 (en) Automatic electronic message content extraction method and apparatus
Troudi et al. A new mashup based method for event detection from social media
JP5836892B2 (en) Apparatus, program, and method for tagging identification name of geographical feature to event location
JP6147629B2 (en) Page site server, program, and method for immediately displaying a point of interest for page content
JP5836902B2 (en) Event comment text detection device, program and method for detecting only comment text related to an event
Xu et al. Crowd sensing of urban emergency events based on social media big data
JP2015095181A (en) Apparatus, server, program, and method for clearly specifying abstract word corresponding to media content
Sangameswar et al. Building a Natural Disaster Management System based on Blogging Platforms.
Wang et al. Location-based microblog viewing system synchronized with web pages
Putri et al. Public facilities recommendation system based on structured and unstructured data extraction from multi-channel data sources
Kao Toward the Design of Smart Travel Guard
JP6240565B2 (en) Program, apparatus, and server for estimating simple sentence symbolizing target sentence according to position name
Li A Study of Volunteered Geographic Information and Social Media

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150918

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151014

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151104

R150 Certificate of patent or registration of utility model

Ref document number: 5836902

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150