WO2013094361A1 - ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ - Google Patents

ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ Download PDF

Info

Publication number
WO2013094361A1
WO2013094361A1 PCT/JP2012/080320 JP2012080320W WO2013094361A1 WO 2013094361 A1 WO2013094361 A1 WO 2013094361A1 JP 2012080320 W JP2012080320 W JP 2012080320W WO 2013094361 A1 WO2013094361 A1 WO 2013094361A1
Authority
WO
WIPO (PCT)
Prior art keywords
message
partial
similarity
computer
community
Prior art date
Application number
PCT/JP2012/080320
Other languages
English (en)
French (fr)
Inventor
美紀 榎
ルディー・レイモンド・ハリー・プテラ
洋平 伊川
Original Assignee
インターナショナル・ビジネス・マシーンズ・コーポレーション
日本アイ・ビー・エム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インターナショナル・ビジネス・マシーンズ・コーポレーション, 日本アイ・ビー・エム株式会社 filed Critical インターナショナル・ビジネス・マシーンズ・コーポレーション
Priority to CN201280062988.3A priority Critical patent/CN103999082B/zh
Priority to DE112012005307.9T priority patent/DE112012005307T5/de
Priority to US14/363,161 priority patent/US9659098B2/en
Priority to JP2013550188A priority patent/JP5893050B2/ja
Publication of WO2013094361A1 publication Critical patent/WO2013094361A1/ja
Priority to US15/430,767 priority patent/US10068009B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles

Definitions

  • the present invention relates to an information processing technique, and more particularly, to a technique for more accurately detecting a community in social media (a set of social media users who share attributes such as interest and interest).
  • a clustering technique is used as a technique for extracting a community and its interests. That is, a word is extracted from each information, a feature vector is calculated, and clustering is performed based on the vector.
  • the present invention has been made in view of such problems, and one of its purposes is to provide a technique capable of detecting a community in social media with higher accuracy.
  • the present invention is a method of clustering a plurality of users by a computer in social media in which a plurality of users each send a message.
  • the method includes: extracting a plurality of partial communities from the plurality of users based on the relationship between the messages; and a user belonging to one partial community among the plurality of partial communities and another partial community. On the condition that the first similarity indicating the similarity between both partial communities is calculated based on the relationship with the user to which the user belongs, and the first similarity is higher than a predetermined first threshold.
  • a step of calculating a second similarity indicating the similarity between the two partial communities, and the second similarity is determined from a predetermined second threshold value.
  • a step of integrating the two partial communities to generate an integrated community is determined from a predetermined second threshold value.
  • the message includes another message sent by another user in response to the one message sent by one user
  • the extracting step includes the step of extracting the messages from the one message and the one message.
  • a plurality of partial communities can be extracted from the plurality of users based on whether or not the message corresponds to the other message transmitted in response to the message.
  • the extracting step may be ⁇ strongly connected component> or ⁇ p clique>.
  • the social media stores user profile information
  • the step of calculating the first similarity includes profile information of users belonging to the one partial community and users belonging to the other partial communities.
  • the first similarity may be calculated based on the relationship with the profile information.
  • the social media provides a function of following a specific user sent by a specific user
  • the step of calculating the first similarity includes the step of calculating the first similarity with the user belonging to the one partial community, and the other
  • the first similarity can also be calculated based on the follow and follow-up relationship with users belonging to the partial community.
  • the first similarity indicates how many users the users belonging to the one partial community and the users belonging to the other partial communities are in a follow-and-follow relationship
  • the step of calculating the degree may include calculating the second similarity on the condition that a user belonging to the one partial community and a user belonging to the other partial community are in a direct follow and follow relationship. it can.
  • the step of calculating the second similarity includes a characteristic term in a message transmitted by a user belonging to one partial community, and a characteristic term in a message transmitted by a user belonging to another partial community.
  • the second similarity can also be calculated based on whether or not are similar.
  • the characteristic term can be extracted by a feature vector ⁇ tf * idf> of a community message.
  • the message may be a message sampled under a predetermined condition from a message posted on the social media.
  • the message may be a message sampled under a condition including a predetermined keyword among messages posted to the social media within a predetermined period.
  • the social media may be a microblog.
  • a computer that hosts the social media and a computer that clusters the plurality of users are connected via a network, and the computer that hosts the computer in response to the predetermined conditional request from the clustering computer
  • the message sent from can be further received by the clustering computer.
  • the received message may further be stored in a storage unit of the clustering computer.
  • the method may further include outputting the integrated community using a graphical user interface.
  • the integrated community can be output together with the characteristic terminology.
  • a community in social media can be detected with higher accuracy.
  • FIG. 1 is a conceptual diagram illustrating a microblogging system as an example of social media.
  • This system includes a microblog server 2 and a user terminal, which are connected to each other via the Internet 4 so as to communicate with each other.
  • the user terminal any form of computer having a communication function can be adopted.
  • a personal data assistant PDA, personal digital assistant
  • on-vehicle computer netbook, etc. (not shown) can be employed. .
  • FIG. 2 is a conceptual diagram for explaining the follow / follow relationship of a microblog.
  • the microblog user can register in advance friends, acquaintances, and other users who have common interests and interests, and can automatically receive messages sent by them. Such registration is referred to as “follow”, and the follow relationship includes a relationship in which users follow each other and a relationship in which one user unilaterally follows another user.
  • follow the follow relationship includes a relationship in which users follow each other and a relationship in which one user unilaterally follows another user.
  • the arrows in FIG. 2 indicate that the user AAA and the user BBB are following each other, the user BBB is unilaterally following the user CCC, and the user CCC is unilaterally following the user AAA. It shows that.
  • FIG. 3 illustrates a smartphone 31 as a user terminal and its screen display as an example.
  • a microblog application screen is displayed, and the application screen is divided into a home portion 311, a timeline portion 312, and an operation portion 313 from the top.
  • the home portion displays a menu button and that the timeline portion 312 is the user AAA timeline.
  • message portions 312a and 312b of the user AAA and a message portion 312c of the user BBB are displayed in order from the top.
  • These message parts 312a to 3c are displayed in time series. That is, the uppermost remark part 312a corresponds to the latest message.
  • FIG. 4 explains the data structure of data stored in the hard disk devices 20, 21, and 22 in the microblog server 2.
  • the transmission date and time (created_at) indicating the date and time when each message was transmitted
  • the message ID (id) specifying each message
  • the message is stored. It includes a user ID (user_id) that identifies the user who made the call and a text that is the content of the message. Note that the text can have a character limit (for example, 140 characters or less).
  • the user relationship table FIG. 4A
  • the profile table (FIG. 4C) stored in the hard disk device 22 includes a user ID (user_id) for identifying each user, a name (not shown) of each user, and location information (location) indicating the location. ), URL information (url) which is an address of a related web page.
  • FIG. 5 explains the types of messages to be transmitted.
  • FIG. 5A illustrates a normal message.
  • the user AAA sends a message to his / her timeline, and these messages are displayed on the timeline of the user AAA and the user following the user AAA (user BBB and user CCC in the example of FIG. 2). Is done.
  • FIG. 5B illustrates the reply message.
  • the reply message is a reply to a specific message, and is displayed on the timeline of the user who is following him / her and the user who is the reply destination.
  • the user BBB is, as a reply to the user AAA of the message, "Hi, hello.” Originated the reply message, the reply message to another user BBB person, the user (FIG. 2, which are following the user BBB In the example, it is displayed on the timeline of the user AAA).
  • FIG. 5C and FIG. 5D both illustrate the reprint message, and the user CCC's original message “Started microblogging” of the user AAA displayed on his timeline.
  • a re-transmission message is shown as a re-transmission.
  • the reprint message is displayed on the timeline of the user who is following the user CCC (user BBB in the example of FIG. 2).
  • the name is displayed with the name of the user CCC to be transferred.
  • FIG. 5E illustrates the quote message.
  • User CCC quotes user AAA's original message “I started microblogging” as displayed on his timeline, and then enters his comment “Welcome!” Show. This quote message is displayed on the timeline of the user following the user CCC.
  • FIG. 6 is a block diagram illustrating the hardware configuration of the personal computer 1.
  • the hardware configuration of the computer 1 includes a (low-speed and high-speed) bus 10, a CPU (arithmetic control device) 11 connected to the bus 10, a RAM (random access memory: storage device) 12, a ROM (read-only memory).
  • a memory (storage device) 13, an HDD (hard disk drive: storage device) 14, a communication interface 15, and an input / output interface 16 are provided.
  • a mouse 17 connected to the input / output interface 16, a flat panel display (display device) 18, a keyboard 19 and the like are provided.
  • the computer 1 has been described as adopting a general personal computer architecture, for example, the CPU 11 and the HDD 14 can be multiplexed in order to obtain higher data processing capability and availability. In addition to the desktop type, various types of computer systems can be employed.
  • the software configuration of the computer 1 includes an operating system (OS) that provides basic functions, application software that uses the functions of the OS, and driver software for input / output devices. These pieces of software are loaded onto the RAM 12 together with various data and executed by the CPU 11 or the like, and the computer 1 executes the processing shown in FIG. 7 as a whole.
  • OS operating system
  • driver software driver software for input / output devices.
  • FIG. 7 is a flowchart for explaining processing executed by the computer 1.
  • a condition is transmitted from the computer 1 to the microblog server 2 (S1).
  • the condition may be, for example, one that specifies the period during which the message is sent, one that specifies a specific keyword in the message, or one that specifies only the reply or re-sent message. These may be combined.
  • the computer 1 receives data of a message group that meets the above conditions from the microblog server 2 (S2).
  • message group data see FIG. 4A
  • user data associated with those messages see FIG. 4B
  • user profiles associated with the messages see FIG. 4). 4 (c)
  • These received data are stored in the HDD 14 of the computer 1.
  • a plurality of partial communities are extracted from a plurality of users based on the relationship between messages (S3).
  • the message is another message sent by another user in response to one message sent by one user, that is, a reply message (FIG. 5B), a reprint message (FIG. 5C), Suppose that it is one of the quote messages (FIG. 5 (d)) (FIG. 5 (e)).
  • a partial network that is a strongly connected component is extracted by performing a depth-first search from the user network defined by the relationship between one message transmitted by one user and another message.
  • FIG. 8A shows that G1 and G2 have been extracted as partial networks. Circles in G1 and G2 indicate individual users, and arrows indicate message exchange.
  • FIG. 8 (b) shows that the partial networks G1 and G2 are connected via a third user (one person) and a follow / followed relationship between a user belonging to one partial community and a third user, It shows that both partial communities can be linked in two steps of the follow / followed relationship between the user and a user belonging to another partial community.
  • the similarity is 1/2 (reciprocal of 2).
  • the first similarity may be calculated based on the relationship between the profile information of a user belonging to one partial community and the profile information of a user belonging to another partial community. For example, the similarity between users with the same country and administrative district indicated by the location information is set higher, or the similarity between users whose URLs match part or all indicated by the web page information is set higher. can do.
  • both partial communities are based on terms in messages transmitted by users belonging to both partial communities.
  • a second similarity indicating the similarity is calculated (S5).
  • Characteristic terms are obtained by extracting a partial network that is a strongly connected component by performing a depth-first search. Further, tf * idf may be performed.
  • FIG. 8C shows a state where the partial networks G1 and G2 are integrated and an integrated community G1G2 is generated.
  • the integrated community G1G2 can be output on the flat panel display 18 using a graphical user interface, and can be output together with characteristic terms.
  • the invention can take the form of an entirely hardware embodiment, an entirely software embodiment or an embodiment containing both hardware and software elements.
  • the invention is implemented in software, including but not limited to firmware, resident software, microcode, parsing picocode, and the like.
  • the present invention can also take the form of a computer program or computer-readable medium comprising program code for use by or in connection with a computer or any instruction execution system.
  • a computer-readable medium is any apparatus that can contain, store, communicate, propagate, or transmit a program for use by or in connection with any instruction execution system, apparatus, or device. It can be.
  • the syntax analysis control module described above constitutes an instruction execution system or “computer” in this sense.
  • the medium can be an electronic, magnetic, optical, electromagnetic, infrared, or semiconductor system (or apparatus or device) or a propagation medium.
  • Examples of computer readable media include semiconductor or solid state memory, magnetic tape, removable computer diskette, random access memory (RAM), read-only memory (ROM), rigid magnetic disk. And optical discs. Current examples of optical disks include compact disk read only memory (CD-ROM: compact disk read only memory), compact disk read / write (CD-R / W) memory, DVD Is included.
  • a data processing system suitable for storing and / or executing program code may include at least one processor coupled directly or indirectly to memory elements through a system bus. This memory element contains at least some of the local memory used in the actual execution of the program code, the bulk storage, and the number of times it must be read from the bulk storage during execution.
  • the program code can include a cache memory that provides temporary storage.
  • I / O devices can be coupled to the system either directly or via an intermediary I / O controller.
  • a network adapter to the system so that the data processing system can be connected to other data processing systems or remote printers or storage devices via an intermediary private or public network.
  • Modems, cable modems, and Ethernet cards are just a few of the currently available network adapters.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 ソーシャル・メディアにおけるコミュニティをより精度良く検出する。 複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、複数のユーザをクラスタリングする方法である。この方法は、メッセージ同士の関係に基づいて、複数のユーザから複数の部分コミュニティを抽出するステップと、複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップとを備える。

Description

[規則26に基づく補充 11.12.2012] ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
本発明は、情報処理技術に関係し、より詳しくは、ソーシャル・メディアにおけるコミュニティ(興味・関心等の属性を共通にするソーシャル・メディアのユーザの集合)をより精度良く検出する技術に係る。
ソーシャル・メディアが広範に利用されるに従い、ソーシャル・メディア上で各ユーザーが発信する情報から、コミュニティ及びその共通の興味・関心等を抽出したい、とのビジネス上の要請が存在する。ソーシャル・メディアの情報すべてを対象としては、様々なコストが高いため、ソーシャル・メディアのサンプリングされた情報から、コミュニティとその興味・関心等を抽出するのが一般的である。コミュニティとその興味・関心等を抽出する技術としては、一般に、クラスタリングの手法が用いられる。すなわち、各情報内の単語を抽出して特徴ベクトルを計算し、そのベクトルをもとにクラスタリングを行うものである。
特許第4369104号公報 特開2009-301334号公報
しかし、このような従来手法は、サンプリングされた情報であることと相まって、以下の理由により、本来なら同一コミュニティだったかもしれないノードも分断されてしまうおそれがある。すなわち、第一に、クラスタと無関係な単語が特徴ベクトルの主要部分と認定されてしまう。第二に、言い回しの異なる単語の出現頻度が少ないことから、クラスタリングへの影響少なく、拾われない可能性が高い。第三に、とりわけマイクロブログの場合は特に挨拶や日常生活などに関する記述が多く、意図した目的に一致しないも単語が特徴ベクトルに含まれる。
本発明はこのような課題に鑑みてなされたものであり、その目的の一つは、ソーシャル・メディアにおけるコミュニティをより精度良く検出することができる技術を提供することにある。
本発明は、複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、前記複数のユーザをクラスタリングする方法である。この方法は、前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出するステップと、前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップとを備える。
ここで、前記メッセージには、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージを含み、前記抽出するステップは、前記メッセージ同士が前記一のメッセージと前記一のメッセージに応答して発信された前記他のメッセージに該当するか否かに基づいて、前記複数のユーザから複数の部分コミュニティを抽出することができる。また、前記抽出するステップは、<強連結成分>であってもよいし、<pクリーク>であってもよい。
また、前記ソーシャル・メディアは、ユーザのプロフィール情報を記憶しており、前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザのプロフィール情報と、前記他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算することもできる。
さらに、前記ソーシャル・メディアは、ある特定のユーザが発信するある特定のユーザをフォローする機能を提供し、前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとのフォロー及び被フォロー関係に基づいて、前記第一類似度を演算することもできる。また、前記第一類似度は、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとが何人のユーザを介してフォロー及び被フォロー関係にあるかを示し、前記第二類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとが直接フォロー及び被フォロー関係にあることを条件に、前記第二類似度を演算することもできる。
また、前記第二類似度を演算するステップは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、前記第二類似度を演算することもできる。ここで、前記特徴的な用語は、コミュニティのメッセージの特徴ベクトル<tf*idf>により抽出することができる。
なお、前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージとすることができる。また、前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージとすることもできる。また、前記ソーシャル・メディアがマイクロブログであってもよい。
さらに、前記ソーシャル・メディアをホストするコンピュータと、前記複数のユーザをクラスタリングするコンピュータとがネットワークを介して接続され、前記クラスタリングするコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記クラスタリングするコンピュータが受信するステップを更に備えることができる。また、前記受信した前記メッセージを、前記クラスタリングするコンピュータの記憶手段に記憶するステップを更に備えることもできる。
また、前記統合コミュニティをグラフィカル・ユーザ・インターフェイスを用いて出力するステップを更に備えることもできる。この際、前記統合コミュニティを前記特徴的な用語とともに出力することもできる。
本発明をこれらコンピュータ・プログラム、コンピュータ・システムとして把握した場合にも、上述した本発明を方法として把握した場合と実質的に同一の技術的特徴を備える事ができるのは当然である。
 本発明によれば、ソーシャル・メディアにおけるコミュニティをより精度良く検出することができる。
マイクロブログのシステムを説明する概念図 マイクロブログのフォロー・被フォロー関係を説明する概念図 ユーザ端末としてのスマートフォンとその画面表示の説明図 マイクロブログ・サーバ内のハードディスク装置内に記憶されているデータのデータ構造の説明図 発信されるメッセージの種類の説明図 コンピュータのハードウェア構成を説明するブロック図 このコンピュータが実行する処理を説明するフローチャート 部分コミュニティから統合コミュニティを生成する過程の説明図
実施形態
以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。また、本発明は多くの異なる態様で実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。また、実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須とは限らないことに留意されたい。実施の形態の説明の全体を通じて(特段の断りのない限り)同じ要素には同じ番号を付している。
図1は、ソーシャル・メディアの一例として、マイクロブログのシステムを説明する概念図である。本システムは、マイクロブログ・サーバ2と、ユーザ端末とを含み、これらはインタネット4を介して互いに通信可能に接続されている。また、ユーザ端末としては、通信機能を備えたあらゆる形態のコンピュータを採用することができる。例えば、図示するスマートフォン31、タブレット32、(ノート型)パーソナル・コンピュータ33の他にも、図示しないパーソナル・データ・アシスタント(PDA、携帯情報端末)、車載コンピュータ、ネットブック等を採用することができる。
図2は、マイクロブログのフォロー・被フォロー関係を説明する概念図である。マイクロブログのユーザは、友人、知人、興味や関心の共通する他のユーザを予め登録しておくことができ、彼らの発信するメッセージを自動的に受信することができる。このような登録を“フォロー”と呼び、フォローの関係は、ユーザ同士が相互にフォローし合う関係、一のユーザが他のユーザを一方的にフォローする関係が存在する。例えば、図2における矢印は、ユーザAAAとユーザBBBとは相互にフォローし合っており、ユーザBBBはユーザCCCを一方的にフォローしており、ユーザCCCはユーザAAAを一方的にフォローしていることを示す。
図3は、一例として、ユーザ端末としてのスマートフォン31とその画面表示を説明するものである。このスマートフォン31のタッチスクリーンには、マイクロブログ・アプリケーションの画面が表示されており、当該アプリケーション画面は、上から順に、ホーム部分311、タイムライン部分312、操作部分313に分かれている。ホーム部分には、メニューボタンと、タイムライン部分312がユーザAAAのタイムラインである旨が表示されている。タイムライン部分312には、上から順に、ユーザAAAのメッセージ部分312a、312b、ユーザBBBのメッセージ部分312cが表示されている。これらのメッセージ部分312a~cは、時系列沿って表示されている。つまり、最上部の発言部分312aが最新のメッセージに対応している。
図4は、マイクロブログ・サーバ2内のハードディスク装置20、21、22内に記憶されているデータのデータ構造を説明するものである。ハードディスク装置20に記憶されているメッセージテーブル(図4(a))には、各メッセージが発信された日時を示す発信日時(created_at)、各メッセージを特定するメッセージID(id)と、そのメッセージを発信したユーザを特定するユーザID(user_id)と、メッセージの内容であるテキスト(text)を備えている。なお、テキストには文字数制限(例えば、140文字以内等)を設けることができる。一方、ハードディスク装置21に記憶されているユーザ関係テーブル(図4(b))には、フォロー関係を登録した日時を示す登録日時(registered_at)、フォロー元のユーザを特定するフォロー元ユーザID(following_user_id)、フォロー先のユーザを特定するフォロー先ユーザID(followed_user_id)を備えている。他方、ハードディスク装置22に記憶されているプロフィールテーブル(図4(c))には、各ユーザを特定するユーザID(user_id)、各ユーザの名前(図示せず)、場所を示すロケーション情報(location)、関連するウェブページのアドレスであるURL情報(url)を備えている。
図5は、発信されるメッセージの種類を説明するものである。図5(a)は、通常のメッセージを説明するものである。ここでは、ユーザAAAが自らのタイムラインにメッセージを発信しており、ユーザAAAとユーザAAAをフォローしているユーザ(図2の例ではユーザBBB及びユーザCCC)のタイムラインにこれらのメッセージが表示される。図5(b)は、リプライメッセージを説明するものである。リプライメッセージは、特定のメッセージに対する返事であり、自分と、自分と返信先のユーザ両方をフォローしているユーザのタイムラインに表示される。ここでは、ユーザBBBが、ユーザAAAのメッセージに対する返事として、「やあ、こんにちは。」というリプライメッセージを発信し、そのリプライメッセージはユーザBBB本人の他、ユーザBBBをフォローしているユーザ(図2の例ではユーザAAA)のタイムラインに表示される。
図5(c)及び図5(d)は、いずれも転載メッセージを説明するものであり、ユーザCCCが自分のタイムラインに表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」を転載メッセージとして、再発信する様子を示している。いずれの場合も、ユーザCCCをフォローしているユーザ(図2の例ではユーザBBB)のタイムラインに転載メッセージが表示されるが、図5(c)に示す第一態様の場合は、元のユーザAAAの名前でユーザCCCをフォローしているユーザのタイムラインへ表示されるが、図5(d)に示す第二態様の場合は、転送するユーザCCCの名前で表示される。図5(e)は、引用メッセージを説明するものである。ユーザCCCが自分のタイムライン表示されているユーザAAAの元メッセージ「マイクロブログ始めました。」をそのまま引用し、更に自分のコメント「ようこそ!」を入力して引用メッセージとして、再発信する様子を示している。この引用メッセージは、ユーザCCCをフォローしているユーザのタイムラインに表示される。
 図6は、パーソナル・コンピュータ1のハードウェア構成を説明するブロック図である。コンピュータ1のハードウェア構成は、(低速及び高速の)バス10、バス10に接続されるCPU(演算制御装置)11、RAM(ランダム・アクセス・メモリ:記憶装置)12、ROM(リード・オンリ・メモリ:記憶装置)13、HDD(ハード・ディスク・ドライブ:記憶装置)14、通信インタフェース15、入出力インタフェース16を備えている。さらに、入出力インタフェース16に接続されるマウス17、フラット・パネル・ディスプレイ(表示装置)18、キーボード19等を備えている。なお、コンピュータ1は一般的なパーソナル・コンピュータ・アーキテクチャを採用するものとして説明したが、例えば、より高いデータ処理能力や可用性を求めて、CPU11やHDD14等を多重化することができる。また、デスクトップ型の他、様々なタイプのコンピュータ・システムを採用することができる。
このコンピュータ1のソフトウェア構成は、基本的な機能を提供するオペレーティング・システム(OS)と、OSの機能を利用するアプリケーション・ソフトウェアと、入出力装置のドライバ・ソフトウェアとを備えている。これらの各ソフトウェアは、各種データと共にRAM12上にロードされ、CPU11等により実行され、コンピュータ1は全体として、図7に示す処理を実行する。
図7は、このコンピュータ1が実行する処理を説明するフローチャートである。まずコンピュータ1からマイクロブログ・サーバ2に対して、条件を送信する(S1)。条件としては、例えば、メッセージが発信された期間を指定するものでもよいし、メッセージ中に特定のキーワードを含むものを指定するものでもよいし、リプライ、再発信されたメッセージのみを指定するものでもよいし、これらを組み合わせても良い。次に、コンピュータ1はマイクロブログ・サーバ2から上記条件に適合するメッセージ群のデータを受信する(S2)。この際、上記条件に適合するメッセージ群のデータ(図4(a)参照)の他、それらのメッセージに関連付けられるユーザのデータ(図4(b)参照)およびメッセージに関連付けられるユーザのプロフィール(図4(c)参照)を併せて受信してもよい。これら受信したデータは、コンピュータ1のHDD14に記憶される。
次に、メッセージ同士の関係に基づいて、複数のユーザから複数の部分コミュニティを抽出する(S3)。ここで、メッセージは、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージ、つまり、リプライメッセージ(図5(b))、転載メッセージ(図5(c)、図5(d))引用メッセージ(図5(e))のいずれかであるとする。そして、この抽出は、一のユーザの発信した一のメッセージと他のメッセージとの関係から定義されるユーザのネットワークから、深さ優先探索を行うことで,強連結成分となる部分ネットワークを抽出することにより行う。図8(a)は、部分ネットワークとして、G1とG2が抽出されたことを示す。各G1、G2内の丸印は個々のユーザを示し、矢印はメッセージのやり取りを示す。
 次に、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算する(S4)。ここでは、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとが、何ステップのフォロー及び被フォロー関係により結びつけることが出来るか、という観点から、そのステップ数を演算し、例えば、その逆数を類似度としている。図8(b)は、部分ネットワークG1とG2とが、(一人の)第三のユーザを介して、一の部分コミュニティに属するユーザと第三のユーザとのフォロー・被フォロー関係、第三のユーザと他の部分コミュニティに属するユーザとのフォロー・被フォロー関係の2ステップで両部分コミュニティを結びつけることができることを示している。また、その類似度は(2の逆数の)1/2となる。なお、一の部分コミュニティに属するユーザのプロフィール情報と、他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算してもよい。例えば、ロケーション情報が示す、国、行政区が同一であるユーザ同士の類似度をより高く設定したり、ウェブページ情報が示す、URLの一部又は全部が一致するユーザ同士の類似度をより高く設定することができる。
次に、第一類似度が予め定められた第一閾値(例えば、1/3)よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、両部分コミュニティ同士の類似性を示す第二類似度を演算する(S5)。ここでは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、第二類似度を演算する。また、特徴的な用語は、深さ優先探索を行うことで,強連結成分となる部分ネットワークを抽出することにより行う。なお、さらにtf*idfを実施してもよい。
 次に、第二類似度が予め定められた第二閾値よりも高いことを条件に、両部分コミュニティ同士を統合して統合コミュニティを生成する(S6)。図8(c)は、部分ネットワークG1とG2とが統合され、統合コミュニティG1G2が生成された状態を示す。なお、統合コミュニティG1G2をフラット・パネル・ディスプレイ18上にグラフィカル・ユーザ・インターフェイスを用いて出力し、併せて、特徴的な用語とともに出力することができる。
本発明は、全体がハードウェアの実施形態、全体がソフトウェアの実施形態、またはハードウェアおよびソフトウェア両方のエレメントを包含する実施形態の形を取ることができる。ある好適な実施形態において、本発明は、以下に限らないが、ファームウェア、常駐ソフトウェア、マイクロコード、構文解析ピココードなどを含めた、ソフトウェアに実装される。
 さらに、本発明は、コンピュータまたは任意の命令実行システムによってまたはこれに関連させて使用するプログラム・コードを備えるコンピュータ・プログラム、コンピュータ可読媒体の形態を採ることもできる。本説明目的の上で、コンピュータ可読媒体は、任意の命令実行システム、装置、またはデバイスによってまたはこれに関連させて使用するためのプログラムを、収容、格納、通信、伝搬、または伝送できる任意の装置であり得る。具体的には、前述の構文解析制御モジュールは、この意味で命令実行システム、または「コンピュータ」を構成する。
 媒体は、電子的、磁気的、光学的、電磁気的、赤外的、または半導体のシステム(もしくは装置もしくはデバイス)または伝搬媒体とすることができる。コンピュータ可読媒体の例には、半導体または固体メモリ、磁気テープ、着脱可能コンピュータ・ディスケット、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、剛体磁気ディスク、および光ディスクが含まれる。光ディスクの現時点での例には、コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disk read only memory)、コンパクト・ディスク読み取り/書き込み(CD-R/W:compact disk read/write)メモリ、およびDVDが含まれる。
 プログラム・コードを格納もしくは実行またはその両方を行うのに適したデータ処理システムは、システム・バスを介して直接的または間接的にメモリ・エレメントに連結された少なくとも一つのプロセッサを含み得る。このメモリ・エレメントには、プログラム・コードの実際の実行の過程で使われるローカル・メモリ、バルク記憶装置、および、実行中にバルク記憶装置から読み出さねばならない回数を低減するために、少なくとも一部のプログラム・コードに一時的保管を提供するキャッシュ・メモリを含めることができる。
 直接に、あるいは仲介I/Oコントローラを介して、入力/出力またはI/Oデバイス(以下に限らないが、キーボード、ディスプレイ、ポインティング・デバイスなどを含む)をシステムに連結することができる。
 また、ネットワーク・アダプタをシステムに連結し、データ処理システムが、仲介の私有または公衆ネットワークを介して、他のデータ処理システムあるいは遠隔のプリンタまたは記憶デバイスに繋がるようにすることができる。モデム、ケーブル・モデム、およびイーサネット(R)カードは、現在入手可能なネットワーク・アダプタのごく一部である。
1…パーソナル・コンピュータ、
11…CPU(演算制御装置)
12…RAM(ランダム・アクセス・メモリ:記憶装置)
13…ROM(リード・オンリ・メモリ:記憶装置)
14…HDD(ハード・ディスク・ドライブ:記憶装置)
15…通信インタフェース
16…入出力インタフェース
17…マウス
18…フラット・パネル・ディスプレイ(表示装置)
2…マイクロブログ・サーバ
20、21…ハード・ディスク・ドライブ
31…スマートフォン
32…タブレット
33…(ノート型)パーソナル・コンピュータ

Claims (17)

  1.  複数のユーザがそれぞれメッセージを発信するソーシャル・メディアにおいて、コンピュータにより、前記複数のユーザをクラスタリングする方法であり、
    前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出するステップと、
     前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算するステップと、
     前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算するステップと、
     前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成するステップと
     を備える方法。
  2.  前記メッセージには、一のユーザの発信した一のメッセージに応答して他のユーザが発信する他のメッセージを含み、
     前記抽出するステップは、前記メッセージ同士が前記一のメッセージと前記一のメッセージに応答して発信された前記他のメッセージに該当するか否かに基づいて、前記複数のユーザから複数の部分コミュニティを抽出する請求項1に記載の方法。
  3.  前記抽出するステップは、<強連結成分>である請求項1に記載の方法。
  4.  前記ソーシャル・メディアは、ユーザのプロフィール情報を記憶しており、
    前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザのプロフィール情報と、前記他の部分コミュニティに属するユーザのプロフィール情報との関係に基づいて、前記第一類似度を演算する請求項1に記載の方法。
  5.  前記ソーシャル・メディアは、ある特定のユーザが他の特定のユーザをフォローする機能を提供し、
    前記第一類似度を演算するステップは、前記一の部分コミュニティに属するユーザと、前記他の部分コミュニティに属するユーザとのフォロー及び被フォロー関係に基づいて、前記第一類似度を演算する請求項1に記載の方法。
  6.  前記第二類似度を演算するステップは、一の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語と、他の部分コミュニティに属するユーザが発信するメッセージ中に特徴的な用語とが類似するか否かに基づいて、前記第二類似度を演算する請求項1に記載の方法。
  7.  前記特徴的な用語は、メッセージの特徴ベクトル生成により抽出される請求項6に記載の方法。
  8.  前記メッセージは、前記ソーシャル・メディアに投稿されたメッセージから所定の条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  9.  前記メッセージは、前記ソーシャル・メディアに所定の期間内に投稿されたメッセージのうち、所定のキーワードを含む条件の下にサンプリングされたメッセージである請求項1に記載の方法。
  10.  前記ソーシャル・メディアをホストするコンピュータと、前記複数のユーザをクラスタリングするコンピュータとがネットワークを介して接続され、
    前記クラスタリングするコンピュータからの前記所定の条件付き要求に応答して、前記ホストするコンピュータから送信される前記メッセージを前記クラスタリングするコンピュータが受信するステップを更に備える請求項8に記載の方法。
  11.  前記受信した前記メッセージを、前記クラスタリングするコンピュータの記憶手段に記憶するステップを更に備える請求項10に記載の方法。
  12.  前記ソーシャル・メディアがマイクロブログである請求項1に記載の方法。
  13.  前記統合コミュニティをグラフィカル・ユーザ・インターフェイスを用いて出力するステップを更に備える請求項1に記載の方法。
  14.  前記統合コミュニティを前記特徴的な用語とともに出力する請求項6に記載の方法。
  15.  コンピュータに実行されることで、請求項1乃至14のいずれかに記載の方法のすべてのステップを前記コンピュータに実行させるコンピュータ・プログラム。
  16.  複数のユーザがそれぞれメッセージを発信するソーシャル・メディアに対し、前記複数のユーザをクラスタリングするコンピュータであり、
     前記コンピュータの記憶手段には、前記メッセージが記憶されており、
     前記コンピュータの演算制御制御手段が、
    前記メッセージ同士の関係に基づいて、前記複数のユーザから複数の部分コミュニティを抽出し、
     前記複数の部分コミュニティのうち、一の部分コミュニティに属するユーザと、他の部分コミュニティに属するユーザとの関係に基づいて、両部分コミュニティ同士の類似性を示す第一類似度を演算し、
     前記第一類似度が予め定められた第一閾値よりも高いことを条件に、両部分コミュニティに属するユーザが発信するメッセージ中の用語に基づいて、前記両部分コミュニティ同士の類似性を示す第二類似度を演算し、
     前記第二類似度が予め定められた第二閾値よりも高いことを条件に、前記両部分コミュニティ同士を統合して統合コミュニティを生成する
    コンピュータ。
  17.  前記記憶手段に記憶されるメッセージは、前記ソーシャル・メディアに投稿されるメッセージからサンプリングされたメッセージである請求項16に記載のコンピュータ。
PCT/JP2012/080320 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ WO2013094361A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201280062988.3A CN103999082B (zh) 2011-12-19 2012-11-22 用于检测社交媒体中的社区的方法、计算机程序和计算机
DE112012005307.9T DE112012005307T5 (de) 2011-12-19 2012-11-22 Verfahren, Computerprogramm und Computer zum Erkennen von Gemeinschaften in einem sozialen Medium
US14/363,161 US9659098B2 (en) 2011-12-19 2012-11-22 Method, computer program and computer for detecting communities in social media
JP2013550188A JP5893050B2 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
US15/430,767 US10068009B2 (en) 2011-12-19 2017-02-13 Method, computer program and computer for detecting communities in social media

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011276995 2011-12-19
JP2011-276995 2011-12-19

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US14/363,161 A-371-Of-International US9659098B2 (en) 2011-12-19 2012-11-22 Method, computer program and computer for detecting communities in social media
US15/430,767 Continuation US10068009B2 (en) 2011-12-19 2017-02-13 Method, computer program and computer for detecting communities in social media

Publications (1)

Publication Number Publication Date
WO2013094361A1 true WO2013094361A1 (ja) 2013-06-27

Family

ID=48668260

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/080320 WO2013094361A1 (ja) 2011-12-19 2012-11-22 ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ

Country Status (5)

Country Link
US (2) US9659098B2 (ja)
JP (1) JP5893050B2 (ja)
CN (1) CN103999082B (ja)
DE (1) DE112012005307T5 (ja)
WO (1) WO2013094361A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015164008A (ja) * 2014-02-28 2015-09-10 株式会社日立製作所 解析装置及び解析方法
US10068009B2 (en) 2011-12-19 2018-09-04 International Business Machines Corporation Method, computer program and computer for detecting communities in social media
CN117785973A (zh) * 2023-12-11 2024-03-29 深圳鹏程未来技术有限公司 社区用户信息集成方法、装置、设备及存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106709800B (zh) * 2016-12-06 2020-08-11 ***股份有限公司 一种基于特征匹配网络的社团划分方法和装置
KR101810864B1 (ko) * 2017-02-06 2017-12-20 한양대학교 산학협력단 하이브리드 방식의 영향력 평가 방법 및 장치
CN110070287A (zh) * 2019-04-19 2019-07-30 西北工业大学 一种基于相似聚类及平均思想的动态任务分配方法
CN110674290B (zh) * 2019-08-09 2023-03-10 国家计算机网络与信息安全管理中心 一种用于重叠社区发现的关系预测方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218353A (ja) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd クラスタリング装置およびクラスタリング方法
JP2010286868A (ja) * 2009-06-09 2010-12-24 Nec Corp コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001014349A (ja) 1999-06-28 2001-01-19 Nippon Telegr & Teleph Corp <Ntt> 協調情報フィルタリング用レイティングシステム
US8117281B2 (en) * 2006-11-02 2012-02-14 Addnclick, Inc. Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content
US7644144B1 (en) * 2001-12-21 2010-01-05 Microsoft Corporation Methods, tools, and interfaces for the dynamic assignment of people to groups to enable enhanced communication and collaboration
JP4369104B2 (ja) 2002-10-07 2009-11-18 みずほ情報総研株式会社 コミュニティ形成支援システム、その端末、サーバ及びプログラム
US7406459B2 (en) 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US7958120B2 (en) * 2005-05-10 2011-06-07 Netseer, Inc. Method and apparatus for distributed community finding
JP2008107867A (ja) * 2006-10-23 2008-05-08 Hitachi Ltd コミュニティ抽出方法、コミュニティ抽出処理装置
JP2008140174A (ja) 2006-12-01 2008-06-19 Tmf Create:Kk コミュニケーションサービスシステム
JP2008257512A (ja) 2007-04-05 2008-10-23 Hitachi Ltd 情報提供装置およびプログラム
BRPI0811634A2 (pt) * 2007-05-15 2017-08-08 Social Project Inc Sistema e método para criar uma comunidade online de rede de comunicação social
US9384186B2 (en) * 2008-05-20 2016-07-05 Aol Inc. Monitoring conversations to identify topics of interest
JP5159451B2 (ja) 2008-06-13 2013-03-06 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワーク行動を分析する情報処理装置、分析システム、ネットワーク行動の分析方法およびプログラム
JP2009301335A (ja) 2008-06-13 2009-12-24 Ricoh Co Ltd 画像処理装置、画像処理方法及びコンピュータプログラム
US8838601B2 (en) * 2011-08-31 2014-09-16 Comscore, Inc. Data fusion using behavioral factors
CN103999082B (zh) 2011-12-19 2017-09-12 国际商业机器公司 用于检测社交媒体中的社区的方法、计算机程序和计算机

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218353A (ja) * 2009-03-18 2010-09-30 Oki Electric Ind Co Ltd クラスタリング装置およびクラスタリング方法
JP2010286868A (ja) * 2009-06-09 2010-12-24 Nec Corp コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NORINOBU HATAMOTO ET AL.: "Microblog ni Okeru User no Clustering to Sono Cluster no Tokuchogo Chushutsu", PROCEEDINGS OF THE 17TH ANNUAL MEETING OF THE ASSOCIATION FOR NATURAL LANGUAGE PROCESSING, TUTORIAL, HONKAIGI, WORKSHOP, 7 March 2011 (2011-03-07), pages 280 - 283 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068009B2 (en) 2011-12-19 2018-09-04 International Business Machines Corporation Method, computer program and computer for detecting communities in social media
JP2015164008A (ja) * 2014-02-28 2015-09-10 株式会社日立製作所 解析装置及び解析方法
CN117785973A (zh) * 2023-12-11 2024-03-29 深圳鹏程未来技术有限公司 社区用户信息集成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
US9659098B2 (en) 2017-05-23
US10068009B2 (en) 2018-09-04
DE112012005307T5 (de) 2014-10-02
JPWO2013094361A1 (ja) 2015-04-27
CN103999082A (zh) 2014-08-20
JP5893050B2 (ja) 2016-03-23
US20140337343A1 (en) 2014-11-13
US20170154106A1 (en) 2017-06-01
CN103999082B (zh) 2017-09-12

Similar Documents

Publication Publication Date Title
US10218657B2 (en) Method and system for providing private chat within a group chat
US11703999B2 (en) Changing visual aspects of a graphical user interface to bring focus to a message
JP5893050B2 (ja) ソーシャル・メデイアにおけるコミュニティを検出する方法、コンピュータ・プログラム、コンピュータ
US9838347B2 (en) Tags in communication environments
US8838564B2 (en) Method to increase content relevance using insights obtained from user activity updates
US20180060312A1 (en) Providing ideogram translation
US8788342B2 (en) Intelligent feature expansion of online text ads
US20100114938A1 (en) Search results for a topic that include a list of messaging users that have previously searched on that topic
US20190005023A1 (en) Automatically assisting conversations using graph database
US20130159847A1 (en) Dynamic Personal Dictionaries for Enhanced Collaboration
JP5961320B2 (ja) ソーシャル・メデイアにおけるユーザの分類方法、コンピュータ・プログラム及びコンピュータ
US9596205B2 (en) System and method for mailing list identification and representation
JP2013190847A (ja) ソーシャル・メデイアにおける悪評を検出する方法、コンピュータ・プログラム、コンピュータ。
US20230259890A1 (en) Systems and methods for future event recommendation
CN104657406A (zh) 用于社会协作环境中的条目的交互分割的方法和***
JP5602958B2 (ja) ソーシャル・メデイアにおけるトレンドを検出する方法、コンピュータ・プログラム、コンピュータ。
JP2013122630A (ja) 識別情報管理支援システム、識別情報管理支援方法およびプログラム
US11138208B2 (en) Contextual insight system
US10873554B2 (en) Determining consensus among message participants based on message content
US20160283912A1 (en) Changing Meeting Type Depending on Audience Size

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12858833

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013550188

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14363161

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 112012005307

Country of ref document: DE

Ref document number: 1120120053079

Country of ref document: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12858833

Country of ref document: EP

Kind code of ref document: A1