WO2013037256A1 - 数据匹配方法和装置 - Google Patents

数据匹配方法和装置 Download PDF

Info

Publication number
WO2013037256A1
WO2013037256A1 PCT/CN2012/080017 CN2012080017W WO2013037256A1 WO 2013037256 A1 WO2013037256 A1 WO 2013037256A1 CN 2012080017 W CN2012080017 W CN 2012080017W WO 2013037256 A1 WO2013037256 A1 WO 2013037256A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
microblog
weibo
category
microblog user
Prior art date
Application number
PCT/CN2012/080017
Other languages
English (en)
French (fr)
Inventor
张健
范禹
金伟键
赵林
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201110270246.7A external-priority patent/CN102999509B/zh
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Priority to EP12830968.9A priority Critical patent/EP2757489A4/en
Priority to JP2014530083A priority patent/JP5823047B2/ja
Priority to US14/344,849 priority patent/US20140379806A1/en
Publication of WO2013037256A1 publication Critical patent/WO2013037256A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Definitions

  • the present invention relates to the field of Internet technologies, and in particular, to a data matching method and apparatus. Background of the invention
  • the celebrity recommendation method is specifically: randomly selecting some celebrities to recommend to the ordinary users who log in to Weibo (the general Weibo users), wherein the so-called celebrities refer to the verified true identity, And the verified true identity has a certain influence on the user, when the celebrity speaks on the microblog, it represents that the celebrity is speaking to the public. Ordinary Weibo users do not need to verify their true identity.
  • the present application provides a data matching method and apparatus to achieve targeted recommendation of a source of interest to a user.
  • a data matching method including:
  • microblog users are marked based on the feature information of each Weibo user in the first type of Weibo users and the category to which they belong;
  • a data matching device includes:
  • a marking unit configured to mark the dedicated users based on the feature information of each Weibo user in the first type of Weibo users and the category to which they belong;
  • An obtaining unit configured to acquire feature information of the second microblog user and a category to which the second microblog user is located
  • a recommendation unit configured to select, from the marked first type of microblog users, the microblog user that matches the acquired feature information and the category Recommended for the second Weibo user.
  • the dedicated users are marked by the feature information of each special user in the first type of Weibo users and the category to which they belong, and the second Weibo user for the registered Weibo is marked. , obtaining the feature information of the second Weibo user and the class to which it belongs And selecting, from the marked first-type Weibo users, the Weibo users matching the acquired feature information and categories and recommending to the second Weibo users, instead of randomly recommending the famous ones to the second method in the existing method. Weibo users, this can achieve targeted recommendation of the source of interest to the user.
  • Figure 1 shows a flow chart of the method provided by the present invention
  • FIG. 2 is a flowchart of acquiring second microblog user feature information in step 101 according to an embodiment of the present invention
  • FIG. 3 is a flowchart showing an implementation of step 102 provided by an embodiment of the present invention.
  • FIG. 4 is a flowchart of a device for recommending a microblog according to an embodiment of the present invention
  • FIG. 5 is a structural diagram of a device according to an embodiment of the present invention. Mode for carrying out the invention
  • the present invention provides a data matching method.
  • Figure 1 there is shown a flow chart of a data matching method provided by the present invention.
  • the microblog user belonging to the first type of microblog user is first marked, wherein the first type of microblog user includes at least one that needs to verify the real identity, and the verified real identity has influence.
  • Weibo users Preferably, as an embodiment of the present invention, the microblog user in the first type of microblog user may be a public figure having a certain influence in real life, such as a star in an entertainment, a business manager, a national government official. Wait.
  • marking Weibo users is mainly based on the following dimensions:
  • the category to which the microblog user belongs where the category to which the microblog user belongs may be carried according to the registration information submitted by the microblog user at the time of authentication.
  • the categories here can be industry, For example, entertainment, sports, news, etc.
  • the characteristic information of the microblog user itself also called the personal tag, can be determined according to the specific situation of the microblog user.
  • the process may include the following steps:
  • Step 101 Acquire feature information of the second Weibo user and a category to which it belongs.
  • the second Weibo user is a Weibo user who does not need to verify the real identity, and generally has no influence compared to the first Weibo user.
  • the category to which the second microblog user belongs is obtained as follows: The category to which the second microblog user is currently located is obtained.
  • Step 102 Select a microblog user that matches the feature information and the category acquired in step 101 from the marked first type of microblog users and recommend the microblog user to the second microblog user.
  • Steps 101 and 102 shown in Fig. 1 are respectively described below:
  • FIG. 2 is a flowchart of acquiring second microblog user feature information in step 101 according to an embodiment of the present invention. As shown in FIG. 2, the process may include the following steps: Step 201: Determine whether a behavioral portrait of the second microblog user has been constructed, and if yes, perform step 202, otherwise, perform step 203.
  • the behavioral image of the second microblog user is used to record the feature information of the second microblog user.
  • the behavior image of the second microblog user exists, it is easy to acquire the feature of the second microblog user according to the behavior image. information.
  • the specific behavior image analysis method and how to obtain the feature information of the second microblog user according to the behavior pattern of the second microblog user are not the focus of the present invention, and therefore, details are not described herein again.
  • Step 202 Acquire feature information of the second microblog user from the behavior image of the second microblog user.
  • the acquired feature information may be the hobby and concern of the second Weibo user.
  • Step 203 Determine whether the preset condition for constructing the behavior image of the second microblog user is currently satisfied. If yes, go to step 204. Otherwise, go to step 205.
  • the preset condition may be the number of previous records of the second Weibo user, such as a page access record and/or a microblog write record. When the quantity reaches the preset value, it is determined that the second microblog user is currently satisfied.
  • the preset condition of the behavioral portrait otherwise, determines that the preset condition for constructing the behavioral portrait of the second Weibo user is not currently satisfied.
  • Step 204 Construct a behavioral portrait of the second Weibo user, and return to step 202.
  • Step 205 Acquire feature information of the second microblog user according to a category to which the second user of the second user belongs, or a category to which the current page belongs and a previous record of the second microblog user.
  • the step 205 is also directly replaced by: randomly extracting the first type of microblog that matches the previous attention record of the second microblog user and the category to which the second microblog user is currently located.
  • the Weibo user in the user is recommended to the second Weibo user. It can be seen that the replacement operation no longer acquires the feature information of the second Weibo user, but directly extracts the Weibo user in the first type of Weibo users and recommends to the second Weibo user.
  • step 102 in the flow shown in Figure 1:
  • FIG. 3 is a flowchart of implementing step 102 according to an embodiment of the present invention.
  • feature information and categories marked by each of the first type of microblog users are available as indexes of the respective microblog users.
  • the process may include the following steps: Step 301: Search for a microblog user indexed as the keyword in the first type of microblog user by using a category to which the second microblog user is currently located as a keyword, according to the found microblog user in the category. Importance generates candidate recommended users.
  • the candidate recommendation user may include all the microblog users found, and may also include all the microblog users in the category that are relatively high in the category.
  • the specific value of N is not limited. As for the importance of Weibo users in the category, it is described below.
  • Step 302 Search for the microblog user indexed as the keyword from the candidate recommended users by using the feature information of the second microblog user obtained by using the behavior image of the second microblog user as a keyword;
  • Step 303 The microblog user found in step 302 is used as a microblog user that needs to be recommended to the second microblog user, and is recommended to the second microblog user.
  • step 303 all the dedicated users found in step 302 or the meager users found in step 302 and having higher importance in the category of the page where the second microblog user is currently located may be recommended as needed.
  • the Weibo user of the second Weibo user may be recommended as needed.
  • the step 303 may record the microblog user that needs to be recommended to the second microblog user to the matching object recommendation list.
  • the recommendation in the step 303 to the second microblog user may include: The Weibo user in the matching object recommendation list is recommended to the second Weibo user.
  • recommending the microblog user in the matching object recommendation list to the second microblog user may be: filtering out the microblog user that the second microblog user has listened to from the matching object recommendation list and remaining The Weibo user is recommended to the second Weibo user.
  • the fourth embodiment can be further executed.
  • the process shown includes:
  • Step 401 Record whether the second microblog user has listened to and analyze the recommended microblog user. Step 402, when the second microblog user performs a refresh action, select not yet recommended from the matching object recommendation list. A meager user is recommended to the second Weibo user.
  • step 401 may further include: positively feeding back the analysis result to the server or the back end, and optimizing the above-mentioned matching object recommendation list by the server or the back end.
  • step 402 when the refreshing action is performed by the second microblog user, the meager user who has not been recommended is selected from the matching object recommendation list and recommended to the second microblog user, so as to implement the matching object recommendation table. Match objects for filtering. This achieves a positive closed loop effect.
  • marking the Weibo user in the first type of Weibo users further includes: marking the importance of the Weibo user in the category to which the Weibo user belongs, wherein the Weibo user is important in the category to which the Weibo user belongs.
  • the degree is determined by the total amount of all Weibo users in the category.
  • recommending the microblog user to the second microblog user includes: recommending the microblog user to the second microblog user according to the importance degree in the category to which the second microblog user belongs.
  • the page size of the microblog user is recommended to be limited. Based on this, in this implementation, when the microblog user is recommended to the second microblog user according to the importance degree in the category to which the second microblog user belongs, The microblog user corresponding to the size of the recommended page is recommended to the second microblog user, and the remaining unrecommended microblog users can be recommended at the set time or when the second microblog user performs the refresh operation to update Microblog users who have previously recommended to the second Weibo user.
  • FIG. 5 is a structural diagram of a device according to an embodiment of the present invention. As shown in FIG. 5, the apparatus may include:
  • a marking unit configured to mark the microblog users according to the feature information of each microblog user in the first type of microblog users, and the category to which the microblog user needs to verify the real identity, and the real identity At least one Weibo user with influence;
  • An acquiring unit configured to acquire feature information of the second microblog user and a category to which the second microblog user is a microblog user who does not need to verify the real identity
  • a recommendation unit configured to select a microblog user that matches the acquired feature information and category from the marked first type of microblog users and recommend to the second microblog user.
  • the acquiring unit specifically includes the following subunits:
  • a determining subunit configured to determine whether a behavioral portrait of the second microblog user has been constructed, and the behavioral portrait is used to record feature information of the second microblog user;
  • a obtaining sub-unit configured to acquire feature information of the second microblog user from the behavior image of the second microblog user when the determining result of the determining subunit is YES.
  • the apparatus further includes:
  • a first processing unit configured to: when the determining result of the determining subunit is negative, trigger the acquiring subunit according to a category to which the second microblog user is currently located, or a category to which the currently located page belongs and The previous microblog user's previous attention record, obtaining the feature information of the second microblog user; or
  • a second processing unit configured to record whether the second microblog user listens to and analyzes the recommended microblog user, and triggers the recommending unit when the second microblog user performs a refresh action Selecting a meager user who has not been recommended from the selected microblog users whose feature information and category acquired by the acquiring unit are selected and recommending to the second microblog user.
  • the marking unit further marks the importance of the Weibo user in the category to which the Weibo user belongs, and the importance of the Weibo user in the category to which the Weibo user belongs is determined according to the total amount of all Weibo users in the category;
  • the recommending unit recommending the microblog user to the second microblog user includes: recommending the microblog user to the second microblog user according to the importance degree in the category to which the second microblog user belongs.
  • the dedicated users are marked by the feature information of each special user in the first type of Weibo users and the category to which they belong, and the second Weibo user for the registered Weibo is marked.
  • the celebrity is randomly recommended to the second microblog user, which can achieve the targeted recommendation of the source of interest to the user; further, in the present invention, by the first category from the marked Selecting the microblog user matching the acquired feature information and category and recommending to the second microblog user, the user can maximize the screening of the microblog user, and the correlation with the second microblog user is stronger.
  • the Weibo users aggregate and recommend to the second Weibo users to maximize the supply of more valuable sources. At the same time, using the refreshed technical means, the recommended microblog users can display the maximum amount and achieve better results.
  • the remaining microblog users are recommended to the second by filtering out the microblog users that the second microblog user has listened to from the selected microblog users that match the acquired feature information and categories.
  • Weibo users can enable the second Weibo users to obtain several times of information, which effectively improves the user experience and raises the threshold for competition.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了数据匹配方法和装置,其中,该方法包括:基于第一类微博用户中各微博用户的特征信息以及所属的类别来标记该各微博用户;获取第二微博用户的特征信息和所属的类别;从已标记的第一类微博用户中选择出与获取的特征信息和类别匹配的微博用户并推荐给所述第二微博用户。采用本发明,实现了有针对性地向用户推荐感兴趣的消息源。

Description

数据匹配方法和装置 本申请要求于 2011年 09月 13 日提交中国专利局、 申请号为 201110270246.7、 发明名称为 "信息匹配方法和装置" 的中国专利申请 的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及互联网技术领域, 特别涉及数据匹配方法和装置。 发明背景
随着网络技术的发展, 微博在中国也有了迅速的发展, 目前, 有些 微博的用户量已超过千万,相应地,用户产生的消息量每日也都在千万 级以上。
用户在进入 專以后, 面对海量的数据,必须通过某种方式筛选出 自己感兴趣的内容进行阅读, 否则, 海量的数据只会对用户造成困扰。 目前常见的筛选方式主要有以下两种:以用户为检索依据和以内容点为 检索依据。 其中以用户为检索依据, 能够获取某个(或某些)用户发表 的所有消息,这只是粗略地获得用户发表的消息,是目前用户获得消息 的主要方式。 而以内容点为检索依据, 能够获取发表了有关该内容点的 某个(或某些)用户, 进而获取该某个(或某些)用户发表的所有消息。
但是,上述两种方式并不能实现用户在众多用户中找到更适合自己 的消息源, 或者是不能快速地找到自身更感兴趣的用户。 因此, 如何保 证用户在众多用户中找到更适合自身的消息源是亟待解决的技术问题。
随着微博的不断发展, 目前提出了一种新的方法: 名人推荐方法。 该名人推荐方法具体为:随机抽取一些名人推荐给登录了微博的普通用 户 (筒称普通微博用户), 其中, 所谓的名人是指经过验证真实身份、 且该验证出的真实身份具有一定的影响力的用户, 当该名人在微博发 言,代表着该名人在对公众讲话。而普通微博用户不需要验证真实身份。
但是, 上述的名人推荐方法只是随机抽取名人, 这样, 就会造成推 荐的名人可能很难引起用户收听兴趣的可能,并没有从本质上匹配出用 户感兴趣的用户。 发明内容
本申请提供了数据匹配方法和装置, 以实现有针对性地向用户推荐 感兴趣的消息源。
本申请提供的技术方案包括:
一种数据匹配方法, 包括:
基于第一类微博用户中各微博用户的特征信息以及所属的类别来标 记该各微博用户;
获取第二微博用户的特征信息和所属的类别;
从已标记的第一类微博用户中选择出与获取的特征信息和类别匹配 的微博用户并推荐给所述第二微博用户。
一种数据匹配装置, 包括:
标记单元, 用于基于第一类微博用户中各微博用户的特征信息以及 所属的类别来标记该各 專用户;
获取单元, 用于获取第二微博用户的特征信息和所属的类别; 推荐单元, 用于从已标记的第一类微博用户中选择出与获取的特征 信息和类别匹配的微博用户并推荐给所述第二微博用户。
由以上技术方案可以看出, 本发明中, 通过基于第一类微博用户中 各 專用户的特征信息以及所属的类别来标记该各 專用户, 并针对已 登录微博的第二微博用户, 获取第二微博用户的特征信息和所属的类 别, 从已标记的第一类微博用户中选择出与获取的特征信息和类别匹配 的微博用户并推荐给所述第二微博用户, 而非现有方法中随机推荐名人 给第二微博用户, 这能实现有针对性地向用户推荐感兴趣的消息源。 附图简要说明
图 1示出了本发明提供的方法流程图;
图 2示出了本发明实施例提供的步骤 101中获取第二微博用户特征 信息的流程图;
图 3示出了本发明实施例提供的步骤 102实现流程图;
图 4示出了本发明实施例提供的推荐微博用户后的流程图; 图 5示出了本发明实施例提供的装置结构图。 实施本发明的方式
为了使本发明的目的、 技术方案和优点更加清楚, 下面结合附图和 具体实施例对本发明进行详细描述。
本发明提供了一种数据匹配方法。 参见图 1 , 图 1示出了本发明提 供的数据匹配方法的流程图。 在该流程中, 首先对属于第一类微博用户 的微博用户进行标记, 其中, 所述第一类微博用户包含需要验证真实身 份、 且该验证出的真实身份具有影响力的至少一个微博用户。 优选地, 作为本发明的一个实施例, 所述第一类微博用户中的微博用户可为在现 实生活中具有一定影响的公众人物比如娱乐圏中的明星、 企业管理者、 国家政府人员等。
其中, 对微博用户进行标记, 主要依据以下维度:
1 , 微博用户所属的类别, 其中, 该微博用户所属的类别可根 据该微博用户在认证时提交的登记信息中携带。 这里的类别可为行业, 比如, 娱乐、 体育、 新闻等。
2, 微博用户本身的特征信息, 也称为个人标签, 其可根据 微博用户的具体情况确定。
基于上述对 專用户进行的标记, 如图 1所示, 该流程可包括以下 步骤:
步骤 101 , 获取第二微博用户的特征信息和所属的类别。
这里, 第二微博用户为不需要验证真实身份的微博用户, 其相比第 一类微博用户, 一般没有影响力。
本步骤 101中, 获取第二微博用户所属的类别具体为: 获取第二微 博用户当前所处页面所属的类别。
至于本步骤 101中获取第二 專用户的特征信息, 可通过图 2所示 流程进行描述。
步骤 102, 从已标记的第一类微博用户中选择出与步骤 101获取的 特征信息和类别匹配的微博用户并推荐给所述第二微博用户。
至此, 完成图 1所示的流程。 下面分别对图 1所示的步骤 101和步 骤 102进行描述:
参见图 2, 图 2示出了本发明实施例提供的步骤 101中获取第二微 博用户特征信息的流程图。 如图 2所示, 该流程可包括以下步骤: 步骤 201 , 判断第二微博用户的行为画像是否已被构建, 如果是, 执行步骤 202, 否则, 执行步骤 203。
这里, 第二微博用户的行为画像用于记录第二微博用户的特征信 息, 当存在该第二微博用户的行为画像时, 很容易依据该行为画像获取 该第二微博用户的特征信息。 需要说明的是, 本实施例中, 具体的行为 画像分析方法、 以及如何依据第二微博用户的行为画像获取第二微博用 户的特征信息不是本发明的重点, 因此, 这里不再赘述。 步骤 202, 从该第二微博用户的行为画像中获取该第二微博用户的 特征信息。
这里, 获取的特征信息可为第二微博用户的爱好和关注。
步骤 203 , 判断当前是否满足构建该第二微博用户的行为画像的预 设条件, 如果是, 执行步骤 204, 否则, 执行步骤 205。
该预设条件可为第二微博用户之前的关注记录比如页面访问记录 和 /或微博写记录的数量, 当该数量在当前达到预设值时, 确定当前满足 构建该第二微博用户的行为画像的预设条件, 否则, 确定当前未满足构 建该第二微博用户的行为画像的预设条件。
步骤 204, 构建该第二微博用户的行为画像, 并返回步骤 202。 步骤 205 , 根据第二敫博用户当前所处页面所属的类别, 或者当前 所处页面所属的类别和该第二微博用户之前的关注记录, 获取该第二微 博用户的特征信息。
优选地, 本发明中, 该步骤 205还可直接替换为: 随机抽取与该第 二微博用户之前的关注记录以及该第二微博用户当前所处页面所属的 类别匹配的第一类微博用户中的微博用户并推荐给所述第二微博用户。 可以看出, 该替换操作不再获取第二微博用户的特征信息, 而是直接抽 取第一类微博用户中的微博用户并推荐给第二微博用户。
至此, 完成图 2所示的流程。 通过图 2, 能够获取第二微博用户的 特征信息。
下面对图 1所示流程中的步骤 102进行描述:
参见图 3 , 图 3为本发明实施例提供的步骤 102实现流程图。 在该 图 3中, 上述第一类微博用户中各个微博用户被标记的特征信息和类别 可作为各微博用户的索引。 基于此, 如图 3所示, 该流程可包括以下步 骤: 步骤 301 , 以第二微博用户当前所处页面所属的类别为关键词在第 一类微博用户中查找索引为该关键词的微博用户, 依据查找到的微博用 户在所述类别的重要度生成候选推荐用户。
本步骤 301中, 候选推荐用户可包含查找到的所有微博用户, 也可 包含查找到的所有微博用户中 N 个在所述类别的重要度比较高的微博 用户。 其中, N的具体取值并不限定。 至于微博用户在类别中的重要度 具体在下文进行描述。
步骤 302, 以利用第二微博用户的行为画像获取的该第二微博用户 的特征信息为关键词从所述候选推荐用户中查找索引为该关键词的微 博用户;
步骤 303 , 将步骤 302查找到的微博用户作为需要推荐给第二微博 用户的微博用户, 并推荐给第二微博用户。
优选地, 本步骤 303中, 可将步骤 302查找到的所有 專用户或者 步骤 302查找到的、 且在第二微博用户当前所处页面所属类别中重要度 比较高的微薄用户作为需要推荐给第二微博用户的微博用户。
作为本发明的一个实施例, 本步骤 303可将需要推荐给第二微博用 户的微博用户记录至匹配对象推荐列表, 如此, 本步骤 303中的推荐给 第二微博用户可包括: 将匹配对象推荐列表中的微博用户推荐给第二微 博用户。
优选地, 本发明中, 将匹配对象推荐列表中的微博用户推荐给第二 微博用户可为: 从匹配对象推荐列表过滤掉所述第二微博用户已收听的 微博用户并将剩余的微博用户推荐给所述第二微博用户。
如此, 通过上述步骤 301至 303即可实现有针对性地推荐 專用户 给第二微博用户。
其中, 在推荐微博用户给第二微博用户后, 还可进一步执行图 4所 示的流程, 具体包括:
步骤 401 ,记录第二微博用户是否对推荐的微博用户有收听并分析; 步骤 402, 在所述第二微博用户执行刷新动作时, 从所述匹配对象 推荐列表中选择还未推荐的微薄用户并推荐给第二微博用户。
至此, 完成图 4所示的流程。
在上面描述中, 图 1、 图 2、 图 3、 以及图 4所示的流程中均有服务 端或后端执行。 并且, 优选地, 在图 4中, 步骤 401可进一步包括: 将 分析结果正反馈给服务端或后端, 由该服务端或后端优化上述的匹配对 象推荐列表。 而在步骤 402中, 通过第二微博用户执行刷新动作时, 从 所述匹配对象推荐列表中选择还未推荐的微薄用户并推荐给第二微博 用户, 以实现对匹配对象推荐表中的匹配对象进行过滤。 这样可达到正 向闭环的效果。
需要说明的是, 本发明中, 标记第一类微博用户中的微博用户还包 括: 标记该微博用户在其所属类别的重要度, 其中, 所述微博用户在其 所属类别的重要度是根据该类别内所有微博用户的总量决定。 基于此, 上面描述中, 推荐微博用户给所述第二微博用户包括: 按照在第二微博 用户所属类别中的重要度推荐微博用户给所述第二微博用户。
通常, 推荐微博用户的页面尺寸是有限制的, 基于此, 本实施中, 在按照在第二微博用户所属类别中的重要度推荐微博用户给所述第二 微博用户时, 可将数量与推荐页面的尺寸对应的微博用户推荐给第二微 博用户, 剩余的未被推荐的微博用户可在设定时间到达或者第二微博用 户执行刷新操作时再推荐, 以更新之前已推荐给第二微博用户的微博用 户。
至此, 完成本发明提供的方法描述。
下面对本发明提供的装置进行描述: 参见图 5 , 图 5示出了本发明实施例提供的装置结构图。 如图 5所 示, 该装置可包括:
标记单元, 用于基于第一类微博用户中各微博用户的特征信息以及 所属的类别来标记该各微博用户, 所述第一类微博用户包含需要验证真 实身份、 且该真实身份具有影响力的至少一个微博用户;
获取单元, 用于获取第二微博用户的特征信息和所属的类别, 所述 第二微博用户为不需要验证真实身份的微博用户;
推荐单元, 用于从已标记的第一类微博用户中选择出与获取的特征 信息和类别匹配的微博用户并推荐给所述第二微博用户。
优选地, 本实施例中, 如图 5所示, 所述获取单元具体包括以下子 单元:
判断子单元, 用于判断该第二微博用户的行为画像是否已被构建, 所述行为画像用于记录第二微博用户的特征信息;
获取子单元, 用于在所述判断子单元的判断结果为是时, 从该第二 微博用户的行为画像中获取该第二微博用户的特征信息。
本实施例中, 该装置进一步包括:
第一处理单元, 用于在所述判断子单元的判断结果为否时, 触发所述获取子单元根据第二微博用户当前所处页面所属的类别, 或者当前所处页面所属的类别和该第二微博用户之前的关注记录, 获取 该第二微博用户的特征信息; 或者,
触发所述推荐单元随机抽取与该第二微博用户之前的关注记录以 及该第二微博用户当前所处页面所属的类别匹配的第一类微博用户中 的微博用户并推荐给所述第二微博用户;
第二处理单元, 用于记录第二微博用户是否对推荐的微博用户有收 听并分析, 并在所述第二微博用户执行刷新动作时, 触发所述推荐单元 从已选择的与所述获取单元获取的特征信息和类别匹配的微博用户中 选择还未推荐的微薄用户并推荐给第二微博用户。
优选地, 本发明中, 所述标记单元进一步标记微博用户在其所属类 别的重要度, 所述微博用户在其所属类别的重要度是根据该类别内所有 微博用户的总量决定;
基于此, 所述推荐单元推荐微博用户给所述第二微博用户包括: 按 照在第二微博用户所属类别中的重要度推荐微博用户给所述第二微博 用户。
至此, 完成图 5所示的装置。
由以上技术方案可以看出, 本发明中, 通过基于第一类微博用户中 各 專用户的特征信息以及所属的类别来标记该各 專用户, 并针对已 登录微博的第二微博用户, 获取第二微博用户的特征信息和所属的类 别, 从已标记的第一类微博用户中选择出与获取的特征信息和类别匹配 的微博用户并推荐给所述第二微博用户, 而非现有方法中随机推荐名人 给第二微博用户, 这能实现有针对性地向用户推荐感兴趣的消息源; 更进一步地, 本发明中, 通过从已标记的第一类 專用户中选择出 与获取的特征信息和类别匹配的微博用户并推荐给所述第二微博用户, 能够实现最大限度地筛选出微博用户, 将与普第二微博用户相关性更强 的微博用户聚合并推荐给第二微博用户, 最大化地提供更有价值的消息 源。 同时, 使用刷新的技术手段, 使推荐的微博用户最大量的展现, 达 到更好的效果。
还有, 本发明中, 通过从选择出的与获取的特征信息和类别匹配的 微博用户中过滤掉第二微博用户已收听的微博用户, 而将剩余的微博用 户推荐给第二微博用户, 能够使第二微博用户获取若干倍的信息量, 有 效提高了用户体验, 提高了竟争门槛。 以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡 在本发明的精神和原则之内, 所做的任何修改、 等同替换、 改进等, 均 应包含在本发明保护的范围之内。

Claims

权利要求书
1、 一种数据匹配方法, 其特征在于, 该方法包括:
基于第一类微博用户中各微博用户的特征信息以及所属的类别来标 记该各微博用户;
获取第二微博用户的特征信息和所属的类别;
从已标记的第一类微博用户中选择出与获取的特征信息和类别匹 配的微博用户并推荐给所述第二微博用户。
2、 根据权利要求 1 所述的方法, 其特征在于, 所述第一类微博用 户包含需要验证真实身份、 且该真实身份具有影响力的至少一个微博用 户;
所述第二微博用户为不需要验证真实身份的微博用户。
3、 根据权利要求 1或 2所述的方法, 其特征在于, 所述从已标记 的第一类微博用户中选择出与获取的特征信息和类别匹配的微博用户 并推荐给所述第二微博用户包括:
从已标记的第一类微博用户中选择出与获取的特征信息和类别匹 配的微博用户;
从选择出的微博用户中过滤掉所述第二微博用户已收听的微博用 户并将剩余的微博用户推荐给所述第二微博用户。
4、 根据权利要求 1或 2所述的方法, 其特征在于, 所述获取第二 微博用户的特征信息包括:
判断第二微博用户的行为画像是否已被构建, 所述第二微博用户的 行为画像用于记录第二微博用户的特征信息,
如果是, 从该第二微博用户的行为画像中获取该第二微博用户的特 征信息。
5、 根据权利要求 4 所述的方法, 其特征在于, 如果第二微博用户 的行为画像还未被构建, 所述方法进一步包括:
根据第二微博用户当前所处页面所属的类别, 或者当前所处页面所 属的类别和该第二微博用户之前的关注记录, 获取该第二微博用户的特 征信息; 或者,
随机抽取与该第二微博用户之前的关注记录以及该第二微博用户 当前所处页面所属的类别匹配的第一类微博用户中的微博用户并推荐 给所述第二微博用户。
6、 根据权利要求 5所述的方法, 其特征在于, 该方法进一步包括: 当满足构建所述第二微博用户的行为画像的预设条件时, 构建所述 第二微博用户的行为画像。
7、 根据权利要求 1或 2所述的方法, 其特征在于, 该方法进一步 包括:
记录第二微博用户是否对推荐的微博用户有收听并分析;
在所述第二微博用户执行刷新动作时, 从已选择的与第二微博用户 的特征信息和类别所匹配的微博用户中选择还未推荐的微薄用户并推 荐给第二微博用户。
8、 根据权利要求 7 所述的方法, 其特征在于, 标记微博用户还包 括: 标记该微博用户在其所属类别的重要度, 所述微博用户在其所属类 别的重要度是根据该类别内所有微博用户的总量决定;
推荐微博用户给所述第二微博用户包括: 按照在第二微博用户所属 类别中的重要度推荐微博用户给所述第二微博用户。
9、 根据权利要求 8 所述的方法, 其特征在于, 所述按照在第二微 博用户所属类别中的重要度推荐微博用户给所述第二微博用户包括: 按照在第二微博用户所属类别中的重要度将数量与推荐页面的尺 寸对应的微博用户推荐给第二微博用户。
10、 一种数据匹配装置, 其特征在于, 该装置包括:
标记单元, 用于基于第一类微博用户中各微博用户的特征信息以及 所属的类别来标记该各 專用户;
获取单元, 用于获取第二微博用户的特征信息和所属的类别; 推荐单元, 用于从已标记的第一类微博用户中选择出与获取的特征 信息和类别匹配的微博用户并推荐给所述第二微博用户。
11、根据权利要求 10所述的装置, 其特征在于, 所述第一类微博用 户包含需要验证真实身份、 且该真实身份具有影响力的至少一个微博用 户;
所述第二微博用户为不需要验证真实身份的微博用户。
12、 根据权利要求 10或 11所述的装置, 其特征在于, 所述获取单 元包括:
判断子单元, 用于判断该第二微博用户的行为画像是否已被构建, 所述行为画像用于记录第二微博用户的特征信息;
获取子单元, 用于在所述判断子单元的判断结果为是时, 从该第二 微博用户的行为画像中获取该第二微博用户的特征信息。
13、 根据权利要求 12所述的装置, 其特征在于, 该装置进一步包 括:
第一处理单元, 用于在所述判断子单元的判断结果为否时, 触发所述获取子单元根据第二微博用户当前所处页面所属的类别, 或者当前所处页面所属的类别和该第二微博用户之前的关注记录, 获取 该第二微博用户的特征信息; 或者,
触发所述推荐单元随机抽取与该第二微博用户之前的关注记录以 及该第二微博用户当前所处页面所属的类别匹配的第一类微博用户中 的微博用户并推荐给所述第二微博用户;
第二处理单元, 用于记录第二微博用户是否对推荐的微博用户有收 听并分析, 并在所述第二微博用户执行刷新动作时, 触发所述推荐单元 从已选择的与所述获取单元获取的特征信息和类别匹配的微博用户中 选择还未推荐的微薄用户并推荐给第二微博用户。
14、 根据权利要求 10或 12所述的装置, 其特征在于, 所述标记单 元进一步标记微博用户在其所属类别的重要度, 所述微博用户在其所属 类别的重要度是根据该类别内所有微博用户的总量决定;
所述推荐单元推荐微博用户给所述第二微博用户包括: 按照在第二 微博用户所属类别中的重要度推荐微博用户给所述第二微博用户。
PCT/CN2012/080017 2011-09-13 2012-08-13 数据匹配方法和装置 WO2013037256A1 (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP12830968.9A EP2757489A4 (en) 2011-09-13 2012-08-13 METHOD AND DEVICE FOR DATA MATCHING
JP2014530083A JP5823047B2 (ja) 2011-09-13 2012-08-13 データ整合の方法および装置
US14/344,849 US20140379806A1 (en) 2011-09-13 2012-08-13 Data matching method and device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110270246.7 2011-09-13
CN201110270246.7A CN102999509B (zh) 2011-09-13 信息匹配方法和装置

Publications (1)

Publication Number Publication Date
WO2013037256A1 true WO2013037256A1 (zh) 2013-03-21

Family

ID=47882599

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/080017 WO2013037256A1 (zh) 2011-09-13 2012-08-13 数据匹配方法和装置

Country Status (4)

Country Link
US (1) US20140379806A1 (zh)
EP (1) EP2757489A4 (zh)
JP (1) JP5823047B2 (zh)
WO (1) WO2013037256A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995820A (zh) * 2014-03-06 2014-08-20 吉林大学 用户个人品性预测方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239587B (zh) * 2014-10-17 2017-09-12 北京字节跳动网络技术有限公司 新闻列表刷新的方法及装置
CN104572982B (zh) * 2014-12-31 2017-10-31 东软集团股份有限公司 基于问题引导的个性化推荐方法及***
US10223429B2 (en) * 2015-12-01 2019-03-05 Palantir Technologies Inc. Entity data attribution using disparate data sets

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079714A (zh) * 2006-12-13 2007-11-28 腾讯科技(深圳)有限公司 一种sns社区中推荐朋友的方法及***
US20100005105A1 (en) * 2008-07-02 2010-01-07 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
CN101847226A (zh) * 2009-12-17 2010-09-29 广州市盈海文化传播有限公司 一种社会性网络sns社区中推荐异性朋友的方法及***
CN101968818A (zh) * 2010-11-08 2011-02-09 北京开心人信息技术有限公司 一种社交网站中向用户推荐好友的方法及***
US20110145719A1 (en) * 2009-12-14 2011-06-16 International Business Machines Corporation People recommendation indicator method and apparatus in a social networking site

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7269590B2 (en) * 2004-01-29 2007-09-11 Yahoo! Inc. Method and system for customizing views of information associated with a social network user
JP2009099088A (ja) * 2007-10-19 2009-05-07 Kddi R & D Laboratories Inc Snsユーザプロファイル摘出装置、摘出方法並びに摘出プログラム、及び該ユーザプロファイルを利用する装置
JP5190252B2 (ja) * 2007-11-27 2013-04-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 嗜好マッチング・システム、方法及びプログラム
US7971146B2 (en) * 2007-12-13 2011-06-28 International Business Machines Corporation Method for visual depiction of audiences for viewing items in blogs and other electronic repositories
EP2441010A4 (en) * 2009-06-09 2016-12-28 Ebh Entpr Inc METHODS, APPARATUS AND SOFTWARE FOR ANALYZING THE CONTENT OF MICROBLOGUE MESSAGES
US8825759B1 (en) * 2010-02-08 2014-09-02 Google Inc. Recommending posts to non-subscribing users
US9049259B2 (en) * 2011-05-03 2015-06-02 Onepatont Software Limited System and method for dynamically providing visual action or activity news feed

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079714A (zh) * 2006-12-13 2007-11-28 腾讯科技(深圳)有限公司 一种sns社区中推荐朋友的方法及***
US20100005105A1 (en) * 2008-07-02 2010-01-07 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
US20110145719A1 (en) * 2009-12-14 2011-06-16 International Business Machines Corporation People recommendation indicator method and apparatus in a social networking site
CN101847226A (zh) * 2009-12-17 2010-09-29 广州市盈海文化传播有限公司 一种社会性网络sns社区中推荐异性朋友的方法及***
CN101968818A (zh) * 2010-11-08 2011-02-09 北京开心人信息技术有限公司 一种社交网站中向用户推荐好友的方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2757489A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995820A (zh) * 2014-03-06 2014-08-20 吉林大学 用户个人品性预测方法

Also Published As

Publication number Publication date
US20140379806A1 (en) 2014-12-25
JP2014526747A (ja) 2014-10-06
JP5823047B2 (ja) 2015-11-25
CN102999509A (zh) 2013-03-27
EP2757489A4 (en) 2015-04-22
EP2757489A1 (en) 2014-07-23

Similar Documents

Publication Publication Date Title
CN104281622B (zh) 一种社交媒体中的信息推荐方法和装置
Ghosh et al. Entropy-based classification of’retweeting’activity on twitter
WO2018036272A1 (zh) 新闻内容的推送方法、电子装置及计算机可读存储介质
US20150242497A1 (en) User interest recommending method and apparatus
US8527450B2 (en) Apparatus and methods for analyzing and using short messages from commercial accounts
CN106940732A (zh) 一种面向微博的疑似水军发现方法
CN106202155B (zh) 一种信息处理方法及装置
WO2013026325A1 (zh) 一种人物搜索方法、装置及存储介质
CN110990683B (zh) 一种基于地域与情感特征的微博谣言集成识别方法及装置
WO2008116424A1 (fr) Procédé de classification d'utilisateur, et procédé, dispositif et système de distribution de publicité orientée
KR101559719B1 (ko) 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법
Bosagh Zadeh et al. On the precision of social and information networks
US20140344276A1 (en) Method and System for Generating Evaluation Information, and Computer Storage Medium
WO2014029314A1 (zh) 信息聚合归类的显示方法及***
Chaudhary et al. Contextual feature based one-class classifier approach for detecting video response spam on youtube
WO2013037256A1 (zh) 数据匹配方法和装置
Lo et al. Identifying the high-value social audience from Twitter through text-mining methods
CN112989824A (zh) 信息推送方法及装置、电子设备及存储介质
US9544384B2 (en) Method and system for pushing associated users in social networking service network
Cui et al. Personalized microblog recommendation using sentimental features
Lo et al. Use of a high-value social audience index for target audience identification on Twitter
WO2008131698A1 (fr) Procédé de recherche d'informations et dispositif correspondant
Singh Predicting the popularity of online news using social features
CN102999509B (zh) 信息匹配方法和装置
Gao et al. User profiling with campus Wi-Fi access trace and network traffic

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12830968

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014530083

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14344849

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2012830968

Country of ref document: EP