CN101202966B - 一种用户信息的收集方法、***及设备 - Google Patents

一种用户信息的收集方法、***及设备 Download PDF

Info

Publication number
CN101202966B
CN101202966B CN2007101965666A CN200710196566A CN101202966B CN 101202966 B CN101202966 B CN 101202966B CN 2007101965666 A CN2007101965666 A CN 2007101965666A CN 200710196566 A CN200710196566 A CN 200710196566A CN 101202966 B CN101202966 B CN 101202966B
Authority
CN
China
Prior art keywords
user
waiting
collect
keyword
short message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101965666A
Other languages
English (en)
Other versions
CN101202966A (zh
Inventor
吴学启
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101965666A priority Critical patent/CN101202966B/zh
Priority to BRPI0808132A priority patent/BRPI0808132B1/pt
Priority to PCT/CN2008/070998 priority patent/WO2009070990A1/zh
Publication of CN101202966A publication Critical patent/CN101202966A/zh
Priority to AT08165995T priority patent/ATE492858T1/de
Priority to ES08165995T priority patent/ES2355634T3/es
Priority to DE602008004065T priority patent/DE602008004065D1/de
Priority to EP08165995A priority patent/EP2065850B1/en
Application granted granted Critical
Publication of CN101202966B publication Critical patent/CN101202966B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种用户信息的收集***,该***包括:保存待收集用户特征信息的用户特征单元;内容分析单元,获取用户发送或接收的短消息以及待收集用户特征信息;将短消息内容与待收集用户特征进行匹配,如果用户符合待收集用户特征,将用户信息收集并保存在用户存储单元中;内容分析单元还用于将短消息及其匹配成功的待收集用户特征信息中的关键词输出并保存;关联词汇分析单元,查找关键词相同的多条短消息,将其中重复出现的词汇作为关键词对应的关联词汇保存在关联内容存储单元中;按照特征分类存储用户信息的用户存储单元。本发明实施例还公开了一种用户信息的收集方法及装置。采用本发明,可以大大提高用户信息收集的效率。

Description

一种用户信息的收集方法、***及设备 
技术领域
本发明涉及移动通信技术领域,尤其涉及一种用户信息的收集方法、***及设备。 
背景技术
随着手机的普及,短消息成为了信息和广告的发布传播手段。 
但是,手机用户经常收到与自己无关或不感兴趣的短信,几乎不看消息详细内容就删除短信,甚至向运营商投诉这些“垃圾”短信,同时这种漫无目的的推送业务使信息发布者付出较高的成本,但真正命中用户的短信比例却非常低。因此,信息发布者要达到好的信息发布效果,就要掌握用户的兴趣点所在,根据不同的兴趣点有针对性的向用户发布消息,而不是向所有用户都发布。 
目前,信息发布者为了掌握用户的兴趣点,提高发布消息的命中率,所采取的方法是向用户发放调查表或在用户订购某些商品时请求其登记相关信息,信息发布者根据用户的反馈信息收集用户的兴趣点。 
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题: 
根据调查表或登记表中的用户反馈信息来收集用户兴趣点的整个过程,效率低下,成本高,并且许多潜在的用户也很难被发现,命中率低。 
发明内容
本发明实施例提供一种用户信息的收集方法、***及设备,用以解决现有技术中收集用户信息的效率低下问题。 
本发明实施例提供一种用户信息的收集方法,该方法包括: 
获取用户发送或接收的短消息; 
接收输入的待收集用户特征的关键词信息;在保存的关键词及对应的关联词汇信息中,查找所述待收集用户特征的关键词对应的关联词汇;如果查找到,则将所述待收集用户特征的关键词及查找到的关联词汇作为所述待收集用户的特征信息;否则,将所述待收集用户特征的关键词作为所述待收集用户的特征信息; 
将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征; 
在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并按照特征进行分类保存; 
查找关键词相同的多条符合所述待收集用户特征的短消息,确定所述多条短消息中重复出现的词汇,将该词汇作为所述关键词的关联词汇进行保存。 
本发明实施例提供一种用户信息的收集***,该***包括: 
用户特征单元,用于保存待收集用户的特征信息; 
内容分析单元,用于获取用户发送或接收的短消息,以及所述待收集用户的特征信息;将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;在确定所述用户符合所述待收集用户的特征时,将所述用户的信息收集并保存在用户存储单元中;所述内容分析单元进一步用于:将短消息及该短消息对应的关键词输出并保存,所述短消息对应的关键词为所述短消息匹配成功的待收集用户特征信息中的关键词; 
关联词汇分析单元,用于查找关键词相同的多条短消息,确定所述多条短消息中重复出现的词汇,将该词汇作为所述关键词对应的关联词汇保存在所述关联内容存储单元中; 
用户存储单元,用于按照特征分类存储所述用户的信息。 
本发明的有益效果在于: 
通过分析用户发送或接收的短消息,确定用户是否符合待收集用户的特征,在符合时收集并保存该用户的信息,大大提高了收集用户信息的效率。 
附图说明
图1为本发明实施例提供的***结构示意图; 
图2为本发明实施例提供的方法流程示意图; 
图3为本发明实施例一的方法流程示意图; 
图4为本发明实施例二的方法流程示意图; 
图5为本发明实施例提供的设备结构示意图。 
具体实施方式
为了提高收集用户信息的效率,本发明实施例提供一种用户信息的收集***,本***通过分析用户发送或接收的短信内容,确定用户是否符合待收集用户的特征,在符合时收集该用户的信息。 
下面结合附图1对本发明实施例提供的用户信息的收集***进行说明: 
本发明实施例提供的用户信息的收集***具体包括用户特征单元10、内容分析单元11和用户存储单元12,其中: 
用户特征单元10,用于保存待收集用户的特征信息; 
内容分析单元11,用于获取用户发送或接收的短消息,以及所述待收集用户的特征信息;将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;在确定所述用户符合所述待收集用户的特征时,将所述用户的信息收集并保存在用户存储单元中; 
这里,可以是将用户发送或接收的一条短消息与所述待收集用户的特征进行匹配,在匹配成功时即可确定所述用户符合所述待收集用户的特征;也可以是,将用户发送或接收的多条短信与所述待收集用户的特征进行匹配,在所有短信与所述待收集用户的特征相匹配时,或者大于预定数量的短信与所述待收集用户的特征相匹配时才可确定所述用户符合所述待收集用户的特征,用户发送或接收的多条短信可以是用户一段时间内接收或发送的短信。 
同时,所收集的用户的信息包括但不限于:用户标识(号码)、用户所在区域等。 
用户存储单元12,用于按照特征分类存储所述用户的信息。 
这里,按照特征分类存储是指,将所述用户的信息作为符合所述待收集用户特征的用户信息进行存储,具体的,可以在用户存储单元中保存有不同用户 特征的数据表,每个数据表以对应用户特征的关键词进行标识,在存储时,将所述用户的信息保存在其所符合的待收集用户特征对应的数据表中;还可以是将用户信息与其对应的关键词进行保存,该关键词为所述待收集用户特征中的关键词。 
用户特征单元10具体包括特征收集接口单元20、关联内容存储单元21、匹配条件生成单元22和匹配条件存储单元23,其中: 
特征收集接口单元20,用于接收输入的待收集用户特征的关键词信息; 
关联内容存储单元21,用于存储关键词及其对应的关联词汇信息;存储的关键词及其对应的关联词汇信息来源于用户或其它单元的输入,所述用户可以包括***操作员、采集人员,其他单元可以包括查询用户信息的请求单元,如内容服务器等。 
匹配条件生成单元22,用于在所述关联内容存储单元中,查找所述待收集用户特征的关键词对应的关联词汇;如果查找到,将所述待收集用户特征的关键词及查找的关联词汇作为所述待收集用户的特征信息保存在匹配条件存储单元中;否则,将所述待收集用户特征的关键词作为所述待收集用户的特征信息保存在匹配条件存储单元中; 
匹配条件存储单元23,用于存储所述待收集用户的特征信息。 
内容分析单元11包括获取单元、分析单元和收集单元,其中: 
获取单元,用于获取用户发送或接收的短消息,以及所述待收集用户的特征信息; 
分析单元,用于将所述短消息的内容与所述待收集用户的特征信息进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;具体的,分析单元将所述短消息所包含词汇的统一字符编码与所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码进行匹配,在匹配成功时,即所述短消息所包含词汇的统一字符编码包含所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码时,确定所述用户符合所述待收集用户的特 征;否则,确定所述用户不符合所述待收集用户的特征。 
收集单元,用于在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并保存。 
内容分析单元11进一步用于将所述短消息及其对应的关键词输出并保存,所述短消息对应的关键词为所述待收集用户的特征信息中的关键词,具体可以将所述短消息及其对应的关键词输出并保存在匹配信息表中,该匹配信息表可以保存在内容分析单元、关联词汇分析单元或任何其他能够访问的实体中;该***进一步包括关联词汇分析单元13,用于从所述匹配信息表中查找关键词相同的多条短消息,确定所述多条短消息中重复出现的词汇,将该词汇作为所述关键词对应的关联词汇保存在所述关联内容存储单元中。 
匹配条件生成单元22进一步用于:利用所述关联内容存储单元保存的信息更新所述匹配条件存储单元保存的信息,可以是定时更新,也可以是实时更新。具体的,在关联内容存储单元中新增加了关键词或关联词汇时,将增加的内容保存到匹配条件存储单元,比如,用户将关键词“旅游”及其对应的关联词汇“登山服”输入到关联内容存储单元,关联内容存储单元保存输入的内容,并为该内容设置新增标记,匹配条件生成单元将关联内容存储单元中具有新增标记的内容更新到匹配条件存储单元中;再比如,关联词汇分析单元通过分析匹配信息表中的短信内容找到了关键词“旅游”的关联词汇“滑雪具”,并将“滑雪具”输入到关联内容存储单元,关联内容存储单元将输入内容作为关键词“旅游”的关联词汇进行保存,并为该内容设置刷新标记,匹配条件生成单元将关联内容存储单元中具有刷新标记的内容更新到匹配条件存储单元中。 
该***进一步包括:短消息存储单元14,用于从短消息中心获取用户发送或接收的短消息,并保存获取到的短消息,那么,内容分析单元可以从该短消息存储单元获取用户发送或接收的短消息。 
该***进一步包括:结果浏览单元15,用于接收外部查询请求,从所述用户存储单元按照特征分类保存的用户信息中查找符合所述查询请求中包含的 用户特征的用户信息,并提供查找到的用户信息,这里提供用户信息的方式有多种,可以是将查找到的用户信息输出并显示,供查询者浏览;也可以将查找的用户信息以消息发送的方式提供给查询者。进一步的,在从保存的用户信息中未查找到符合所述查询请求中包含的用户特征的用户信息时,可以临时获取用户发送和/或接收的短信息,将所获得的短信息与所述用户特征(如查询请求方输入的关键词和/或关联词)进行匹配,将匹配的短信息对应的用户信息提供给查询者。 
本发明实施例还提供一种用户信息的收集方法,如图2所示,具体包括: 
步骤20:获取用户发送或接收的短消息,以及保存的待收集用户的特征信息; 
这里,待收集用户的特征信息可以通过如下方式生成: 
接收外部应用输入的待收集用户特征的关键词信息;在保存的关键词及对应的关联词汇信息中,查找所述待收集用户特征的关键词对应的关联词汇;如果查找到,则将所述待收集用户特征的关键词及查找到的关联词汇作为所述待收集用户的特征信息进行保存;否则,将所述待收集用户特征的关键词作为所述待收集用户的特征信息进行保存。所述保存的关键词及对应的关联词汇信息可以通过用户输入获得,所述用户包括***操作员、采集人员等。并且,在关键词及对应的关联词汇信息变化时,例如对于某一关键词增加了新的关联词汇,可以根据新增加的关联词汇更新所述保存的待收集用户的特征信息,使得该特征信息也包含增加的关联词汇,以提高匹配率,从而收集到更多符合条件的用户信息。 
当然,也可以直接将外部应用输入的关键词作为待收集用户的特征信息。 
步骤21:将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征; 
这里,具体实现方式如下: 
待收集用户的特征信息为查找到的关键词及其对应的关联词汇时,通过分 析所述短消息内容,确定短消息中是否包含一个或多个所述关键词及其对应的关联词汇中的词汇,如果包含,则可确定所述用户符合所述待收集用户的特征。具体实现时,将待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码(unicode)以哈希表的形式进行存储;然后,通过查找哈希表,将短消息所包含词汇的统一字符编码与所述特征信息中的关键词和/或关联词汇的统一字符编码进行匹配,查看短消息词汇的统一字符编码中是否包含特征信息中的关键词和/或关联词汇的统一字符编码,如果包含,则可确定所述用户符合所述待收集用户的特征,否则,用户不符合所述待收集用户的特征。 
由于哈希表的查找效率很高,因此对每条短消息的匹配是切实可行的,考虑到短消息处理能力的要求,可以建立多个线程同时对多条短消息进行处理。 
步骤22:在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并按照特征进行分类保存。 
在收集用户信息的同时,还可以从短消息中获取更多的关联词汇,具体如下:将短消息及该短消息对应的关键词输出并保存,所述短消息对应的关键词为所述短消息匹配成功的待收集用户的特征信息中的关键词;然后,从所述输出并保存的短消息中查找关键词相同的多条短消息,确定所述多条短消息的内容中重复出现的词汇,将该词汇作为所述关键词的关联词汇进行保存。 
外部用户通过浏览器等方式向***发送查询请求,该请求中包含需要查询的用户的特征信息,所述外部用户包括信息内容提供商、服务提供商、发布商、***操作员等;***接收到查询请求时,在收集保存的用户信息中,查找符合查询请求中用户特征的用户,并提供查找到的用户信息,这里提供用户信息的方式有多种,可以是将查找到的用户信息输出并显示,供查询者浏览;也可以将查找的用户信息以消息发送的方式提供给查询者。进一步的,在从保存的用户信息中未查找到符合所述查询请求中包含的用户特征的用户信息时,可以临时获取短信息,将短信息与所述用户特征进行匹配,将匹配成功的短信息对应的用户信息提供给查询者。 
下面结合本发明实施例提供的用户信息的收集***对所述方法进行说明: 
实施例一: 
参见图3,具体包括以下步骤: 
步骤S01:特征收集接口单元接收到外部用户输入的待收集用户特征的关键词信息,将该关键词信息送给匹配条件生成单元; 
步骤S02~S03:匹配条件生成单元从关联内容存储单元获取所述关键词对应的关联词汇; 
步骤S04:匹配条件生成单元将所述关键词和关联词汇作为待收集用户的特征信息保存在匹配条件存储单元中; 
步骤S05~S06:内容分析单元从匹配条件存储单元中读取待收集用户的特征信息; 
步骤S07:内容分析单元将用户发送或接收的短消息与读取的待收集用户的特征进行匹配,检查所述短消息内容中是否包含所述待收集用户特征信息中的关键词和/或关联词汇,如果包含,则确定该用户符合所述待收集用户的特征;否则,确定该用户不符合所述待收集用户的特征; 
步骤S08:内容分析单元将符合所述待收集用户特征的用户信息及其对应的关键词输出并保存在用户存储单元中; 
步骤S09:结果浏览单元接收到来自信息发布者的包含待查询用户特征的关键词的查询请求时,从用户存储单元查找所述关键词对应的用户信息; 
步骤S10:结果浏览单元将查找到的用户信息进行输出显示。 
实施例二: 
实施例一中,内容分析单元输出的内容是用户及其对应的特征信息,还可以将分析过的短消息及其对应的关键词输出并保存在匹配信息表中,以便关联词汇分析器根据匹配信息表的内容更新关联内容存储单元保存的信息,下面同样说明完整流程,如图4所示: 
步骤S11:特征收集接口单元接收到外部用户输入的待收集用户特征的关 键词信息,将该关键词信息送给匹配条件生成单元; 
步骤S12~S13:匹配条件生成单元从关联内容存储单元获取所述关键词对应的关联词汇; 
步骤S14:匹配条件生成单元将所述关键词和关联词汇作为待收集用户的特征信息保存在匹配条件存储单元中; 
步骤S15~S16:内容分析单元从匹配条件存储单元中读取待收集用户的特征信息; 
步骤S17:内容分析单元将用户发送或接收的短消息与读取的待收集用户的特征进行匹配,检查所述短消息内容中是否包含所述待收集用户特征信息中的关键词和/或关联词汇,如果包含,则确定该用户是否符合所述待收集用户的特征;否则,确定该用户不符合所述待收集用户的特征; 
步骤S18:内容分析单元将符合所述待收集用户特征的用户信息及其对应的关键词输出并保存在用户存储单元中; 
步骤S19:内容分析单元将短消息及其关键词保存在匹配信息表中; 
步骤S20~S21:关联词汇分析单元读取匹配信息表中关键词与所述关键词相同的多条短消息; 
步骤S22:分析所述多条短消息,将多条短消息中重复出现的词汇作为所述关键词对应的关联词汇; 
步骤S23:将新生成的关联词汇保存在关联内容存储单元中; 
步骤S24:结果浏览单元接收到来自信息发布者的包含待查询用户特征的关键词的查询请求时,从用户存储单元查找所述关键词对应的用户信息; 
步骤S25:结果浏览单元将查找到的用户信息进行输出显示。 
参见图5,本发明实施例还提供一种短信内容分析设备,该设备包括: 
获取单元,用于获取用户发送或接收的短消息,以及保存的待收集用户的特征信息; 
分析单元,用于将所述短消息的内容与所述待收集用户的特征进行匹配, 根据匹配结果确定所述用户是否符合所述待收集用户的特征; 
收集单元,用于在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并按照特征进行分类保存。 
所述分析单元用于:将所述短消息所包含词汇的统一字符编码与所述待收集用户的特征信判断息中的关键词和/或关联词汇的统一字符编码进行匹配;在匹配成功时,即所述短消息所包含词汇的统一字符编码包含所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码时,确定所述用户符合所述待收集用户的特征;否则,确定所述用户不符合所述待收集用户的特征。 
所述短信内容分析设备进一步包括输出单元,用于输出短消息及该短消息对应的关键词,所述短消息对应的关键词为所述短消息匹配成功的待收集用户的特征信息中的关键词。 
综上,本发明实施例可以取得如下有益效果: 
本发明实施例提供的方案中,通过分析用户发送的短消息,确定用户是否符合待收集用户的特征,如果符合,则收集并保存该用户的信息,大大提高了收集用户信息的效率,节省了成本。 
进一步的,待收集用户的特征信息包括关键词及其对应的关联词汇,由于关联词汇可以通过用户或关联词汇分析单元进行不断的补充和更新,因此,可以收集到更多符合待收集用户的特征的用户,发现更多的符合条件的***。 
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。 

Claims (11)

1.一种用户信息的收集方法,其特征在于,该方法包括:
获取用户发送或接收的短消息;
接收输入的待收集用户特征的关键词信息;在保存的关键词及对应的关联词汇信息中,查找所述待收集用户特征的关键词对应的关联词汇;如果查找到,则将所述待收集用户特征的关键词及查找到的关联词汇作为所述待收集用户的特征信息;否则,将所述待收集用户特征的关键词作为所述待收集用户的特征信息;
将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;
在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并按照特征进行分类保存;
查找关键词相同的多条符合所述待收集用户特征的短消息,确定所述多条短消息中重复出现的词汇,将该词汇作为所述关键词的关联词汇进行保存。
2.如权利要求1所述的方法,其特征在于,所述将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征包括:
判断所述短消息的内容是否包含所述待收集用户的特征信息中的关键词和/或关联词汇;如果是,则确定所述用户符合所述待收集用户的特征。
3.如权利要求2所述的方法,其特征在于,所述判断所述短消息的内容是否包含所述关键词和/或关联词汇包括:
将所述短消息所包含词汇的统一字符编码与所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码进行匹配,如果所述短消息所包含词汇的统一字符编码包含所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码,则确定所述短消息的内容包含所述关键词和/或关联词汇;否则,确定所述短消息的内容不包含所述关键词和/或关联词汇。
4.如权利要求1所述的方法,其特征在于,该方法进一步包括:
利用所述保存的关键词及对应的关联词汇信息更新所述保存的待收集用户的特征信息。
5.如权利要求1所述的方法,其特征在于,该方法进一步包括:
接收外部查询请求,从所述分类保存的用户信息中查找符合所述查询请求中包含的用户特征的用户信息,并提供查找到的用户信息。
6.一种用户信息的收集***,其特征在于,该***包括:
用户特征单元,包括特征收集接口单元、关联内容存储单元、匹配条件生成单元以及匹配条件存储单元;所述特征收集接口单元,用于接收输入的待收集用户特征的关键词信息;所述关联内容存储单元,用于存储关键词及其对应的关联词汇信息;所述匹配条件生成单元,用于在所述关联内容存储单元中,查找所述待收集用户特征的关键词对应的关联词汇;如果查找到,将所述待收集用户特征的关键词及查找的关联词汇作为所述待收集用户的特征信息保存在匹配条件存储单元中;否则,将所述待收集用户特征的关键词作为所述待收集用户的特征信息保存在匹配条件存储单元中;所述匹配条件存储单元,用于存储所述待收集用户的特征信息;
内容分析单元,用于获取用户发送或接收的短消息,以及所述待收集用户的特征信息;将所述短消息的内容与所述待收集用户的特征进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;在确定所述用户符合所述待收集用户的特征时,将所述用户的信息收集并保存在用户存储单元中;所述内容分析单元进一步用于:将短消息及该短消息对应的关键词输出并保存,所述短消息对应的关键词为所述短消息匹配成功的待收集用户特征信息中的关键词;
关联词汇分析单元,用于查找关键词相同的多条短消息,确定所述多条短消息中重复出现的词汇,将该词汇作为所述关键词对应的关联词汇保存在所述关联内容存储单元中;
用户存储单元,用于按照特征分类存储所述用户的信息。
7.如权利要求6所述的***,其特征在于,所述内容分析单元包括:
获取单元,用于获取用户发送或接收的短消息,以及所述待收集用户的特征信息;
分析单元,用于将所述短消息的内容与所述待收集用户的特征信息进行匹配,根据匹配结果确定所述用户是否符合所述待收集用户的特征;
收集单元,用于在确定所述用户符合所述待收集用户的特征时,将所述用户的信息进行收集并保存。
8.如权利要求7所述的***,其特征在于,所述分析单元用于:
将所述短消息所包含词汇的统一字符编码与所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码进行匹配;如果所述短消息所包含词汇的统一字符编码包含所述待收集用户的特征信息中的关键词和/或关联词汇的统一字符编码,则确定所述用户符合所述待收集用户的特征;否则,确定所述用户不符合所述待收集用户的特征。
9.如权利要求6所述的***,其特征在于,所述匹配条件生成单元进一步用于:
利用所述关联内容存储单元保存的信息更新所述匹配条件存储单元保存的信息。
10.如权利要求6所述的***,其特征在于,该***进一步包括:
短消息存储单元,与所述内容分析单元相连,用于存储从短消息中心获得的短消息;
所述内容分析单元用于:从所述短消息存储单元获取所述用户发送或接收的短消息。
11.如权利要求6所述的***,其特征在于,该***进一步包括:
结果浏览单元,用于接收外部查询请求,从所述用户存储单元按照特征分类保存的用户信息中查找符合所述查询请求中包含的用户特征的用户信息,并提供查找到的信息。
CN2007101965666A 2007-11-29 2007-11-29 一种用户信息的收集方法、***及设备 Expired - Fee Related CN101202966B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN2007101965666A CN101202966B (zh) 2007-11-29 2007-11-29 一种用户信息的收集方法、***及设备
PCT/CN2008/070998 WO2009070990A1 (fr) 2007-11-29 2008-05-16 Procédé, système et dispositif pour recueillir des informations d'utilisateur
BRPI0808132A BRPI0808132B1 (pt) 2007-11-29 2008-05-16 método e sistema para coletar informações de usuário
AT08165995T ATE492858T1 (de) 2007-11-29 2008-10-07 Verfahren, system und vorrichtung zum erfassen von benutzerinformationen
ES08165995T ES2355634T3 (es) 2007-11-29 2008-10-07 Método, sistema y dispositivo para recoger información del usuario.
DE602008004065T DE602008004065D1 (de) 2007-11-29 2008-10-07 Verfahren, System und Vorrichtung zum Erfassen von Benutzerinformationen
EP08165995A EP2065850B1 (en) 2007-11-29 2008-10-07 Method, system and apparatus for collecting user information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101965666A CN101202966B (zh) 2007-11-29 2007-11-29 一种用户信息的收集方法、***及设备

Publications (2)

Publication Number Publication Date
CN101202966A CN101202966A (zh) 2008-06-18
CN101202966B true CN101202966B (zh) 2011-03-30

Family

ID=39517885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101965666A Expired - Fee Related CN101202966B (zh) 2007-11-29 2007-11-29 一种用户信息的收集方法、***及设备

Country Status (7)

Country Link
EP (1) EP2065850B1 (zh)
CN (1) CN101202966B (zh)
AT (1) ATE492858T1 (zh)
BR (1) BRPI0808132B1 (zh)
DE (1) DE602008004065D1 (zh)
ES (1) ES2355634T3 (zh)
WO (1) WO2009070990A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101917471B (zh) * 2010-08-09 2013-08-14 宇龙计算机通信科技(深圳)有限公司 一种资讯推送方法及服务器
CN101963976A (zh) * 2010-09-16 2011-02-02 宇龙计算机通信科技(深圳)有限公司 一种用于移动终端的信息搜索方法及移动终端
CN103842989A (zh) * 2011-09-29 2014-06-04 诺基亚公司 用于基于情境数据回想内容的方法和装置
CN102609460B (zh) * 2012-01-13 2015-02-04 中国科学院计算技术研究所 微博客数据采集方法及***
CN102546886B (zh) * 2012-01-17 2015-05-06 深圳市优利麦克科技开发有限公司 通话记录处理方法及装置
CN102831160B (zh) * 2012-07-17 2015-09-09 小米科技有限责任公司 一种保存短消息的方法及***
CN103365986A (zh) * 2013-07-05 2013-10-23 百度在线网络技术(北京)有限公司 移动终端中的短信收藏方法及移动终端
CN103631949B (zh) * 2013-12-11 2016-01-27 中国科学院计算技术研究所 一种社交网络数据采集方法及***
CN103795613B (zh) * 2014-01-16 2017-02-01 西北工业大学 一种在线社交网络中朋友关系预测的方法
CN105101182A (zh) * 2014-04-18 2015-11-25 可牛网络技术(北京)有限公司 一种短信的处理方法及装置
CN105095292B (zh) * 2014-05-15 2019-08-09 中兴通讯股份有限公司 语音邮箱***的信息获取方法及装置
CN106162584B (zh) * 2015-01-27 2020-04-24 北京奇虎科技有限公司 识别垃圾短信的方法、客户端、云端服务器和***
CN107003930B (zh) * 2017-01-25 2020-07-28 深圳前海达闼云端智能科技有限公司 用户信息记录方法、装置及电子设备
CN109003117A (zh) * 2018-06-14 2018-12-14 万翼科技有限公司 问卷的生成方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1713574A (zh) * 2004-06-25 2005-12-28 深圳市傲天通信有限公司 互联网网页信息推送***
CN1808475A (zh) * 2005-01-18 2006-07-26 威知资讯股份有限公司 智能资产分析管理方法
CN1878202A (zh) * 2005-06-11 2006-12-13 乐金电子(中国)研究开发中心有限公司 一种分析所收短信的方法
EP1819130A1 (en) * 2006-02-14 2007-08-15 Lycos Europe GmbH Method and system for evaluating data in a data network

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1395206A (zh) * 2002-08-23 2003-02-05 北京大学 一种收集、分析和提供网上信息的方法和***
CN1244876C (zh) * 2003-06-06 2006-03-08 腾讯科技(深圳)有限公司 在即时通信工具中的信息推送方法和***
US20060224682A1 (en) * 2005-04-04 2006-10-05 Inmon Data Systems, Inc. System and method of screening unstructured messages and communications
CN100583921C (zh) * 2005-10-17 2010-01-20 华为技术有限公司 一种收集用户通信特征信息的方法和装置
US7873584B2 (en) * 2005-12-22 2011-01-18 Oren Asher Method and system for classifying users of a computer network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1713574A (zh) * 2004-06-25 2005-12-28 深圳市傲天通信有限公司 互联网网页信息推送***
CN1808475A (zh) * 2005-01-18 2006-07-26 威知资讯股份有限公司 智能资产分析管理方法
CN1878202A (zh) * 2005-06-11 2006-12-13 乐金电子(中国)研究开发中心有限公司 一种分析所收短信的方法
EP1819130A1 (en) * 2006-02-14 2007-08-15 Lycos Europe GmbH Method and system for evaluating data in a data network

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
明书第2页第3段,第3段,第4页第2-5段.

Also Published As

Publication number Publication date
ATE492858T1 (de) 2011-01-15
ES2355634T3 (es) 2011-03-29
CN101202966A (zh) 2008-06-18
EP2065850B1 (en) 2010-12-22
EP2065850A1 (en) 2009-06-03
WO2009070990A1 (fr) 2009-06-11
BRPI0808132B1 (pt) 2019-02-05
BRPI0808132A2 (pt) 2014-06-17
DE602008004065D1 (de) 2011-02-03

Similar Documents

Publication Publication Date Title
CN101202966B (zh) 一种用户信息的收集方法、***及设备
CN109614402B (zh) 多维数据查询方法和装置
CN105988996B (zh) 一种索引文件生成方法及装置
CN105574051B (zh) 更新用户所满足的规则的方法及处理***
CN103368992A (zh) 一种信息推送方法及装置
CN102915373A (zh) 一种数据存储方法和装置
CN201111143Y (zh) 一种商品成交价格信息采集和查询***
CN109669980B (zh) 数据跨库访问方法及装置
CN103198067A (zh) 一种业务搜索方法及***
CN109033281B (zh) 一种知识资源库的智能推送***
CN110110196A (zh) 一种消息推送方法和装置
CN101365190A (zh) 手机终端的用户手机信息字符串的检索匹配方法和装置
CN102104613A (zh) 一种在手机客户端实现的商品个性化推荐的技术
CN106933864A (zh) 一种搜索引擎***及其搜索方法
CN109145092B (zh) 一种数据库更新、智能问答管理方法、装置及其设备
KR20120087220A (ko) 온라인 고객 응대 방법 및 시스템
US20200233867A1 (en) Backend data aggregation system and method
CN110062112A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN109474653A (zh) 一种购物网站访客访问监控统计及站外推送***及方法
CN111159213A (zh) 一种数据查询方法、装置、***和存储介质
CN108647333A (zh) 一种信息共享方法、装置及设备
CN111061783B (zh) 数据查询方法、相关装置和介质
CN110069753A (zh) 一种生成相似度信息的方法和装置
CN104331452B (zh) 一种处理脏数据的方法及***
CN102868981A (zh) 基于移动终端的网络业务推送方法、设备和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200210

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee after: HUAWEI TECHNOLOGIES Co.,Ltd.

Address before: Kokusai Hotel No. 11 Nanjing Avenue in the flora of 210012 cities in Jiangsu Province

Patentee before: HUAWEI SOFTWARE TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110330

CF01 Termination of patent right due to non-payment of annual fee