CN103312584B - 一种在网络社区中发布信息的方法与设备 - Google Patents

一种在网络社区中发布信息的方法与设备 Download PDF

Info

Publication number
CN103312584B
CN103312584B CN201210057478.9A CN201210057478A CN103312584B CN 103312584 B CN103312584 B CN 103312584B CN 201210057478 A CN201210057478 A CN 201210057478A CN 103312584 B CN103312584 B CN 103312584B
Authority
CN
China
Prior art keywords
community
information
released
web community
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210057478.9A
Other languages
English (en)
Other versions
CN103312584A (zh
Inventor
李彦宏
刘露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210057478.9A priority Critical patent/CN103312584B/zh
Priority to BR112014021842-0A priority patent/BR112014021842B1/pt
Priority to PCT/CN2012/076863 priority patent/WO2013131335A1/zh
Publication of CN103312584A publication Critical patent/CN103312584A/zh
Application granted granted Critical
Publication of CN103312584B publication Critical patent/CN103312584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种在网络社区中发布信息的方法与设备。首先,获取网络社区的社区属性;根据所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;随后,将所述一个或多个待发布信息发布至所述网络社区。与现有技术相比,本发明通过多维度的网络社区的社区属性对待发布信息进行准确匹配,提高了待发布信息与网络社区的社区属性的相关度,从而实现了在网络社区中高效地自动发布信息的目的,同时降低人工发布信息的成本。

Description

一种在网络社区中发布信息的方法与设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种在网络社区中发布信息的技术。
背景技术
现有技术在搜索引擎或个人主页中,可根据单个用户输入的查询序列和/或所述用户的属性信息,在待发布信息库中进行匹配查询,以获得与查询序列和/或属性信息相匹配的待发布信息,从而向用户提供该(等)待发布信息。但在多用户的网络社区中,如网络论坛(电子公告板)、网络贴吧、公告栏、群组讨论等,由于采用多用户参与的交互形式,因而不能仅根据单一用户输入的查询序列和/或该用户的属性信息进行信息的匹配以确定待发布信息;进而无法实现在多用户参与的网络社区中自动发布有用信息的目的。
因此,如何在网络社区中准确地确定并发布一个或多个待发信息,是目前亟待解决的问题之一。
发明内容
本发明的目的是提供一种在网络社区中发布信息的方法与设备。
根据本发明的一个方面,提供了一种计算机实现的在网络社区中发布信息的方法,该方法包括以下步骤:
a获取网络社区的社区属性;
其中,该方法还包括:
x根据所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;
y将所述一个或多个待发布信息发布至所述网络社区。
根据本发明的另一方面,还提供了一种用于在网络社区中发布信息的设备,该设备包括:
第一获取装置,用于获取网络社区的社区属性;
其中,该设备还包括:
第一确定装置,用于根据所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;
发布装置,用于将所述一个或多个待发布信息发布至所述网络社区。
与现有技术相比,本发明根据网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;接着将所述一个或多个待发布信息发布至所述网络社区;即通过多维度的网络社区的社区属性对待发布信息进行准确匹配,提高了待发布信息与网络社区的社区属性的相关度,从而实现了在网络社区中高效地自动发布信息的目的,同时降低人工发布信息的成本。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的发布信息的网络设备的示意图;
图2示出根据本发明一个优选实施例的发布信息的网络设备的示意图;
图3示出根据本发明另一优选实施例的发布信息的网络设备的示意图;
图4示出根据本发明另一个方面的在网络社区中发布信息的方法的流程图;
图5示出根据本发明一个优选实施例的在网络社区中发布信息的方法的流程图;
图6示出根据本发明另一优选实施例的在网络社区中发布信息的方法的流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的用于发布信息的网络设备的示意图。
在此,所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在此,根据本发明的用于存储网络社区的数据信息的设备可以是与网络设备1通过网络进行通信连接的独立的设备,包括但不限于普通计算机、服务器、主机等;也可以是与网络设备1成一体,为简明起见,以下以与网络设备1成一体为例进行描述。
如图1所示,网络设备1包括第一获取装置111、第一确定装置112和发布装置113。
以下参照图1来对网络设备1实现信息发布的过程进行详细描述:
首先,第一获取装置111获取网络社区的社区属性。
在此,所述网络社区包括但不限于任何可适用于本发明的多用户参与的网上交流空间,如网络论坛(电子公告板)、网络贴吧、公告栏、群组讨论等;同一网络社区中有多个用户参与,该等多个用户可能对一个或多个特定或非特定的主题进行讨论,其中,讨论的方式包括但不限于,独立发贴、对在先的贴子进行评论等。本领域技术人员应能理解上述网络社区仅为举例,其他现有的或今后可能出现的网络社区如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,所述获取网络社区的社区属性的方式包括以下至少任一项:
1)获取所述网络社区的预设信息;根据所述预设信息,确定所述网络社区的社区属性;该等内容将在下述实施例中进行详述;
2)获取所述网络社区中的来自多个用户的多个贴子;通过自然语言分析规则对所述多个贴子进行分析识别,以提取其各自的内容特征;根据所述内容特征,确定所述网络社区的社区属性;该等内容将在下述实施例中进行详述。
在此,获取网络社区的社区属性的过程可以是实时进行的,在满足触发条件时,如接收到来自第三方设备的社区属性获取请求时,即对网络社区的社区属性进行获取操作;也可以是一个预处理过程,以供后续对多条待发布信息进行匹配操作。
本领域技术人员应能理解上述获取网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
第一确定装置112通过第一获取装置111获取的所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息。
在此,所述多条待发布信息的预存方式包括但不限于以下任一项:
1)预存于待发布信息库中;其中,所述待发布信息库可位于网络设备1,也可位于第三方设备;其包括但不限于关系数据库、Key-Value存储***、文件***等;
2)预存于信息查询表中。
在此,所述匹配的方式包括但不限于以下任一项:
1)根据已获取的网络社区的社区属性,其中,该等社区属性可用特征关键词表征,在此用A代表网络社区的社区属性,如下式1)所示:
其中,矢量分别为代表该网络社区的社区属性的第1-n个特征关键词,a1-an分别为代表该网络社区的社区属性的第1-n个特征关键词权重;
以及预知的待发布信息的信息属性,该等信息属性可用信息关键词表征,用B代表一个待发布信息的信息属性,如下式2)所示:
其中,矢量分别为代表该待发布信息的信息属性的第1-m个信息关键词,b1-bm分别为代表该待发布信息的信息属性的第1-m个信息关键词权重;
并预知每一特征关键词与每一信息关键词之间的相关度,如下式3)所示:
则可通过下式4)计算获取的网络社区的社区属性A与待发布信息的信息属性B的相关度R:
在此,确定与该社区属性相匹配的待发布信息的方式包括但不限于以下任一项:
1)相关度R大于预定相关度阈值的待发布信息;
2)在多条待发布信息中的相关度R较大的预定数目的待发布信息。
在此,所述特征关键词的权重确定方式包括但不限于以下任一项:
1)特征关键词是否为网络社区的社区名称、社区类型、社区归属地址等预设信息;例如,若特征关键词即为网络社区的预设信息,则该特征关键词的权重较高;
2)特征关键词在网络社区的多个贴子中出现频度;例如,某一特征关键词在网络社区的多个贴子中出现频度越高,则该特征关键词的权重越高;
3)在某一网络社区中发布某一贴子的用户在该网络社区中的用户等级;例如,某用户的用户等级越高,则出现在该用户发布的贴子中的特征关键词的权重越高;
4)在网络社区中发布某一贴子的时间与当前时间的距离;例如,时间距离越小,则出现在该贴子中的特征关键词的权重越高。
本领域技术人员应能理解上述确定特征关键词的权重的方式仅为举例,其他现有的或今后可能出现的确定特征关键词的权重的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在一示例中,网络社区的社区属性A由式1)表示,且一个待发布信息的信息属性B由式2)表示;网络社区的社区属性A的2个特征关键词与一个待发布信息的信息属性B的2个信息关键词之间的相关度如下表所示:
表1)
已知社区属性A的特征关键词“美甲”的权重a1为0.7且特征关键词“韩剧”的权重a2为0.3;信息属性B的信息关键词“减肥”的权重b1为0.8且信息关键词“视频”的权重b2为0.2;则可通过4)式计算获取的网络社区的社区属性A与待发布信息的信息属性B的相关度R为0.317(=((0.7×0.8×0.8+0.7×0.2×0+0.3×0.8×0+0.3×0.2×0.9)/((0.72+0.32)1/2+(0.82+0.22)1/2)),该相关度R大于预定相关度阈值0.3,则确定该待发送信息为与该网络社区的社区属性相匹配的待发布信息;据上所述,将该网络社区的社区属性与多个待发送信息分别进行匹配,以确定一个或多个待发送信息。
2)根据已获取的网络社区的社区属性,如代表该网络社区的社区属性的特征关键词,在倒排索引库(如表2所示)中进行匹配查询,以确定该(等)特征关键词对应的一个或多个待发送信息标识信息;进而根据该等待发送信息标识信息,在待发送信息库中提取其各自对应的待发送信息。
在此,所述倒排索引库中包括关键词与包含该关键词的所有待发送信息的对应关系;如下表所示:
表2:
关键词 待发送信息标识信息
K1 T1、T2
K2 T2、T3
K3 T3
例如,在表2中,对应关系示出待发送信息标识信息T1和T2对应的待发送信息中包含关键词K1。
优选地,还可通过4)式计算网络社区的社区属性与通过倒排索引库匹配查询以确定的多个待发送信息的相关度,根据相关度从高到低的顺序进行排序,从而将排序前预定数量的待发送信息作为需要发布至该网络社区的待发布信息。
在此,需要说明的是,上述举例中的各项数值仅为说明作用的示例,以供读者理解本发明,并非实际应用时的真实数据,不应视为对本专利申请保护范围的任何限制。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述。
本领域技术人员应能理解上述确定相关度的方式和/或确定与社区属性相匹配的一个或多个待发布信息的方式仅为举例,其他现有的或今后可能出现的确定相关度的方式和/或确定与社区属性相匹配的一个或多个待发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,发布装置113将第一确定装置112确定的一个或多个待发布信息发布至所述网络社区。
在此,确定发布一个或多个待发布信息至网络社区的顺序的方式包括但不限于以下任一项:
1)待发布信息与该网络社区的社区属性之间的相关度;
2)预定的待发布信息的价值分数;
3)历史发布过程中用户对待发布信息的好评度。
具体地,发布装置113将第一确定装置112确定的一个或多个待发布信息,发布至网络社区以作为该网络社区的一个新贴,也可作为网络社区某一贴子的回贴;例如,将某一待发布信息作为网络社区的一个新贴,通过约定的通信方式发布至该网络社区中;在此,所述约定的通信方式包括通过诸如总线等介质的网络设备的内部通信协议,所述内部通信协议包括但不限于存在于计算机中的各种形式通信,例如:面向对象编程中对象之间的通信协议;操作***内不同程序或计算机不同模块之间的消息传送协议。
本领域技术人员应能理解上述发布待发布信息的方式仅为举例,其他现有的或今后可能出现的发布待发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
进一步,网络设备1还可通过页面技术,如JSP、ASP或PHP等,将该网络社区中的信息以屏幕显示的方式提供至用户设备,以供该网络社区的多个用户进行浏览、回复等操作。
优选地,第一获取装置111、第一确定装置112和发布装置113之间是持续不断地工作。具体地,第一获取装置111持续地获取网络社区的社区属性;第二获取装置112也持续地通过所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;发布装置113也持续地将所述一个或多个待发布信息发布至所述网络社区。在此,本领域技术人员应理解“持续”是指各装置不断进行上述网络社区的社区属性的获取、待发布信息的确定、待发布信息的发布,直至满足预定停止条件,例如第一确定装置112在较长时间内停止对待发布信息的确定。
图2示出根据本发明一个优选实施例的发布信息的网络设备的示意图。其中,网络设备1包括第一获取装置211、第一确定装置212和发布装置213,其中,第一获取装置211还包括第二获取单元2111和第二确定单元2112。
在此,图2中所示网络设备1中的第一确定装置212和发布装置213所执行的功能和操作与前面参照图1所描述的网络设备1中的第一确定装置112和发布装置113所执行的功能和操作的内容相同,为简明起见,将其以引用方式包含于此,而不做赘述。
具体地,第二获取单元2111获取网络社区的预设信息;第二确定单元2112根据第二获取单元2111获取该网络社区的预设信息,确定该网络社区的社区属性。
在此,所述网络社区的预设属性包括但不限于:
1)社区名称;
2)社区类型;
3)社区归属地址;
4)社区预定的话题关键词。
本领域技术人员应能理解上述网络社区的预设属性仅为举例,其他现有的或今后可能出现的网络社区的预设属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在一示例中,第二获取单元2111可通过扫描存储于网络设备1中的网络社区的数据信息,以获得该网络社区的名称为“北京美食吧”;则第二确定单元2112通过分词技术,将该网络社区的名称分为关键词“北京”和“美食”,即可确定特征关键词“北京”和“美食”表征该网络社区的社区属性。其中,该分词技术包括但不限于正向最大匹配法,反向最大匹配法,双向最大匹配法,语言模型方法,或最短路径算法。
本领域技术人员应能理解上述获取网络社区的预设信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取网络社区的预设信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
图3示出根据本发明另一优选实施例的发布信息的网络设备的示意图。其中,网络设备1包括第一获取装置311、第一确定装置312和发布装置313,其中,第一获取装置311还包括第三获取单元3111、提取单元3112和第三确定单元3113。
在此,图3中所示网络设备1中的第一确定装置312和发布装置313所执行的功能和操作与前面参照图1所描述的网络设备1中的第一确定装置112和发布装置113所执行的功能和操作的内容相同,为简明起见,将其以引用方式包含于此,而不做赘述。
具体地,第三获取单元3111获取网络社区中的来自多个用户的多个贴子;提取单元3112通过自然语言分析规则对第三获取单元3111获取的多个贴子进行分析识别,以提取其各自的内容特征;第三确定单元3113根据提取单元3112提取的内容特征,确定该网络社区的社区属性。
在此,通过所述自然语言分析规则实现人机之间自然语言的通信,即实现计算机对自然语言的理解,其可通过OpenNLP、FudanNLP、Standford NLP、语言技术平台(LTP)等自然语言处理工具来实现。
在一示例中,第三获取单元3111通过约定的通信方式,诸如总线等介质的网络设备的内部通信协议,获取位于网络设备1的网络社区中预定数量的来自多个用户的多个贴子的数据信息,如该网络社区中排位前3位的贴子;接着,提取单元3112通过诸如句子切分、部分词性标注、名称抽取、组块、解析等自然语言分析规则,对该多个贴子的文本内容进行分析识别,以提取各个贴子各自的内容特征,如贴子的主题关键词。优选地,提取单元3112可利用自然语言处理工具,如OpenNLP,来执行上述分析识别过程。
在一示例中,排位前3位的贴子分别对应的贴子的主题关键词为“北京租房难”、“哪里租房”和“北京租房价格”;则第三确定单元3113可将有重复的主题关键词“北京”和“租房”确定为代表该网络社区的社区属性的特征关键词。
本领域技术人员应能理解上述获取来自多个用户的多个贴子的方式和/或提取内容特征的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取来自多个用户的多个贴子的方式和/或提取内容特征的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,还可以将根据网络社区的预设信息获取网络社区的社区属性的方式,和通过自然语言分析规则对来自多个用户的多个贴子进行分析识别以提取其各自的内容特征,进而确定网络社区的社区属性的方式相结合,通过对上述两种方式赋予不同权重,进行加权计算以获取表征该网络社区的社区属性的特征关键词;从而提高确定网络社区的社区属性的准确性,进一步,使得确定相关度高的一个或多个待发布信息可为可能。
参阅图3,在本发明的一个优选实施例中,网络设备1还包括第四获取单元(未示出)。其中,第三获取单元3111获取网络社区中的来自多个用户的多个贴子;接着,提取单元3112通过自然语言分析规则对第三获取单元3111获取的多个贴子进行分析识别,以提取其各自的内容特征;第四获取单元获取所述多个贴子的时间属性;第三确定单元3113根据提取单元3112提取的多个贴子的内容特征,结合第四获取单元获取的多个贴子所对应的时间属性,确定所述网络社区的社区属性;随后,第一确定装置312通过第三确定单元3113确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,发布装置313将第一确定装置312确定的一个或多个待发布信息发布至所述网络社区。
在此,所述多个贴子的时间属性可为多个贴子各自的创建时间,也可为网络设备对多个贴子设定的时间标签等。
在此,网络设备中贴子的创建时间距离当前时间越近,则从该贴子中提取的内容特征的权重越高;例如,预定时间权重规则为贴子的创建时间距离当前时间为1小时,则该贴子包含的内容特征的权重为0.7;贴子的创建时间距离当前时间为1天,则该贴子包含的内容特征的权重为0.5;贴子的创建时间距离当前时间为3天,则该贴子包含的内容特征的权重为0.3。
在一示例中,第三获取单元3111获取网络社区中的来自多个用户的3个贴子,提取单元3112提取该3个贴子的内容特征,如贴子的主题关键词,其分别为“北京、租房”、“租房”和“北京、美食”,且该等主题关键词的权值均为1;首先,第四获取单元通过提取该3个贴子的数据信息中的属性信息,以获得其各自的发贴时间分别距离当前时间为1小时、1天和3天;第三确定单元3113根据预定时间权重规则,加权计算以确定对主题关键词“北京”的加权结果为1(=1×0.7+1×0.3),对主题关键词“租房”的加权结果为1.2(=1×0.7+1×0.5)且对主题关键词“美食”的加权结果为0.3(=1×0.3);随后,可根据例如预定判断规则以确定网络社区的社区属性,例如,预定判断规则示出将加权结果大于阈值0.8的主题关键词作为该网络社区的特征关键词,以代表该网络社区的社区属性,则第三确定单元3113可确定该网络社区的特征关键词为“北京”和“租房”。
本领域技术人员应能理解上述获取多个贴子的时间属性的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取多个贴子的时间属性的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
参阅图3,在本发明的另一个优选实施例中,网络设备1还包括第五获取单元(未示出)。其中,第三获取单元3111获取网络社区中的来自多个用户的多个贴子;接着,提取单元3112通过自然语言分析规则对第三获取单元3111获取的多个贴子进行分析识别,以提取其各自的内容特征;第五获取单元获取所述多个贴子所对应多个用户的用户相关信息;第三确定单元3113根据提取单元3112提取的多个贴子的内容特征,结合所述多个贴子所对应多个用户的用户相关信息,确定所述网络社区的社区属性;随后,第一确定装置312通过第三确定单元3113确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,发布装置313将第一确定装置312确定的一个或多个待发布信息发布至所述网络社区。
在此,所述用户相关信息包括但不限于以下任一项:
1)用户等级信息;其中,用户等级越高表明该用户的信誉度越高,故从来自该用户的贴子中提取的内容特征权重越高;例如,预定用户等级权重规则为用户等级为10级以上,则其发布的贴子的内容特征的权重为0.8,用户等级为9级至7级时,则其发布的贴子的内容特征的权重为0.6,用户等级为6级至4级时,则其发布的贴子的内容特征的权重为0.4,用户等级为3级至1级时,则其发布的贴子的内容特征的权重为0.2。
在此,所述用户等级信息意指由***根据用户在该网络社区注册的时间长短、发贴次数、贴子内容质量等多项因素确定的该用户在该网络社区的等级信息。其中,每一用户可以针对一个网络社区具有用户等级信息,也可针对多个网络社区具有不同的用户等级信息,例如,某一用户同时是网络社区“湖人吧”的3级用户和网络社区“巴塞罗那吧”的6级用户。
2)用户历史行为记录;其中,对多个用户历史行为记录进行统计分析,可确定该多个用户的共同需求,进而可将该共同需求作为网络社区的一个社区属性;当多个用户的共同需求与从来自该多个用户的多个贴子中提取的内容特征相匹配时,则提高该内容特征的权重。
在此,所述用户历史行为记录意指由***来记录和统计用户先前的发贴和点击浏览历史,从而可判断或预测用户的需求。其中,当用户为登录用户时,网络设备1可通过该用户的ID在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时,可通过检测该用户使用本网络设备的网络社区过程中的动作,或通过向用户设备询问并获取该用户的Cookie信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用户特征库,将此次搜索过程中用户的历史记录保存与该临时用户特征库中。
3)用户地理位置信息;其中,当多个贴子所对应多个用户的用户地理位置信息示出该多个用户均位于同一归属地址时,则可将该归属地址作为网络社区的社区属性。
在此,获取所述用户地理位置信息的方式可为通过读取用户在网络社区中的注册信息以获取;也可通过网络设备1实时检测用户设备以获取该用户设备的IP地址。
在一示例中,网络设备1对网络社区中的贴子A、贴子B和贴子C进行分析,提取该3个贴子的内容特征,如贴子的主题关键词,其分别为“电影、蓝精灵”、“蓝精灵”和“蓝精灵、玩具”,且该等主题关键词的权值均为1;第五获取单元在网络设备1的用户信息库中获取该3个贴子所对应3个用户的用户等级信息分别为10级、5级和1级;第三确定单元3113根据预定用户等级权重规则,确定对主题关键词“电影”的加权结果为0.8(=1×0.8),对主题关键词“蓝精灵”的加权结果为1.4(=1×0.8+1×0.4+1×0.2)且对主题关键词“玩具”的加权结果为0.1(=1×0.1);随后,可根据例如预定判断规则以确定网络社区的社区属性,例如,预定判断规则示出将加权结果大于阈值0.8的主题关键词作为该网络社区的特征关键词,以代表该网络社区的社区属性,则第三确定单元3113可确定该网络社区的特征关键词为“蓝精灵”和“电影”。
本领域技术人员应能理解上述获取多个贴子所对应多个用户的用户相关信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取多个贴子所对应多个用户的用户相关信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,还可以将获取多个贴子的时间属性的方式和获取多个贴子所对应多个用户的用户相关信息的方式相结合,通过对上述两种方式赋予不同权重,进行加权计算以确定网络社区的社区属性。
参阅图3,在本发明的又一个优选实施例中,网络设备1还包括第六获取单元(未示出)。其中,第三获取单元3111获取网络社区中的来自多个用户的多个贴子;接着,提取单元3112通过自然语言分析规则对第三获取单元3111获取的多个贴子进行分析识别,以提取其各自的内容特征;第六获取单元获取所述多个用户对已发布至所述网络社区中的所述一个或多个待发布信息的操作信息;第三确定单元3113根据提取单元3112提取的多个贴子的内容特征,结合第六获取单元获取的操作信息,确定所述网络社区的社区属性;随后,第一确定装置312通过第三确定单元3113确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,发布装置313将第一确定装置312确定的一个或多个待发布信息发布至所述网络社区。
在此,所述操作信息包括但不限于:
1)浏览操作;在此,获取所述浏览操作的方式可为实时地获取用户通过用户设备进入点击进入某一已发布的所述待发布信息页面时间以及关闭该页面的时间,记录进入时间与关闭时间的时间间隔,当该时间间隔大于预定间隔阈值时,则可确定用户对该页面进行了浏览操作;
2)回复操作;即用户通过用户设备输入针对某一已发布的所述待发布信息的回复信息,并将该回复信息发布至网络设备1;
3)好评操作;例如,用户通过用户设备对某一已发布的待发布信息点击“顶”、“赞”、“好评”等进行好评的按钮;
4)收藏操作;例如,用户将某一已发布的待发布信息收藏至网络收藏库中。
在一示例中,待发布信息Ia和待发布信息Ib已发布至网络社区,且该两个待发布信息对应的网络社区的社区属性可用特征关键词“北京”、“美食”和“北京”、“租房”进行分别表征;第六获取单元获取多个用户对已发布至该网络社区中的待发布信息Ia的操作信息为浏览操作20次且回复操作8次,但该多个用户对已发布至该网络社区中的待发布信息Ib无浏览及回复操作,即该多个用户对待发布信息Ib的兴趣较低,进一步,可判断待发布信息Ib所对应的网络社区的社区属性与该多个用户的用户需求不相符合;则当提取单元3112再一次提取得到来自该多个用户的多个贴子的内容特征,且可用特征关键词“北京”、“美食”和“北京”、“租房”分别表示,则第三确定单元3113将不再使用特征关键词“租房”代表该网络社区的社区属性,即确定代表该网络社区的社区属性的特征关键词仅为“北京”、“美食”。
本领域技术人员应能理解上述获取操作信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取操作信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,获取多个用户的操作行为可为仅获取多个用户的一次操作行为,也可为获取多个用户的多次操作行为,从而使得对多个用户的操作行为分析判断结果更加准确。
优选地(参照图3),网络设备1还包括更新装置(未示出)。其中,该更新装置根据第六获取单元获取的操作信息,更新所述多个用户的所述用户相关信息。
具体地,更新装置将在第六获取单元获取的操作信息,写入到多个用户其各自对应的用户特征库中,以更新该多个用户的用户相关信息;若检测到某一用户的用户特征库尚未建立,则先行初始化该用户的用户特征库,然后将该用户的操作信息写入到该用户特征库中。
本领域技术人员应能理解上述更新多个用户的用户相关信息的方式仅为举例,其他现有的或今后可能出现的更新多个用户的用户相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
进一步,还可根据多个用户的操作信息,对待发送信息的重要度进行更新;例如,多个用户对某一已发送至网络社区的待发送信息的回复次数操作预定次数阈值,则提高该待发送信息的重要度。再进一步,还可根据多个用户的操作信息,对网络社区的社区属性进行更新;例如,多个用户对某一已发送至网络社区的待发送信息无浏览、回复等操作,则可将待发送信息的信息关键词与该网络社区的社区属性的特征关键词的相关度降低。
图4示出根据本发明另一个方面的在网络社区中发布信息的方法的流程图。
在此,所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
在此,根据本发明的用于存储网络社区的数据信息的设备可以是与网络设备1通过网络进行通信连接的独立的设备,包括但不限于普通计算机、服务器、主机等;也可以是与网络设备1成一体,为简明起见,以下以与网络设备1成一体为例进行描述。
如图4所示,该过程包括步骤S401、步骤S402和步骤S402。
以下参照图4来对网络设备1实现信息发布的过程进行详细描述:
首先,在步骤S401中,网络设备1获取网络社区的社区属性。
在此,所述网络社区包括但不限于任何可适用于本发明的多用户参与的网上交流空间,如网络论坛(电子公告板)、网络贴吧、公告栏、群组讨论等;同一网络社区中有多个用户参与,该等多个用户可能对一个或多个特定或非特定的主题进行讨论,其中,讨论的方式包括但不限于,独立发贴、对在先的贴子进行评论等。本领域技术人员应能理解上述网络社区仅为举例,其他现有的或今后可能出现的网络社区如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,所述获取网络社区的社区属性的方式包括以下至少任一项:
1)获取所述网络社区的预设信息;根据所述预设信息,确定所述网络社区的社区属性;该等内容将在下述实施例中进行详述;
2)获取所述网络社区中的来自多个用户的多个贴子;通过自然语言分析规则对所述多个贴子进行分析识别,以提取其各自的内容特征;根据所述内容特征,确定所述网络社区的社区属性;该等内容将在下述实施例中进行详述。
在此,获取网络社区的社区属性的过程可以是实时进行的,在满足触发条件时,如接收到来自第三方设备的社区属性获取请求时,即对网络社区的社区属性进行获取操作;也可以是一个预处理过程,以供后续对多条待发布信息进行匹配操作。
本领域技术人员应能理解上述获取网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S402中,网络设备1通过其在步骤S401中获取的所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息。
在此,所述多条待发布信息的预存方式包括但不限于以下任一项:
1)预存于待发布信息库中;其中,所述待发布信息库可位于网络设备1,也可位于第三方设备;其包括但不限于关系数据库、Key-Value存储***、文件***等;
2)预存于信息查询表中。
在此,所述匹配的方式包括但不限于以下任一项:
1)根据已获取的网络社区的社区属性,其中,该等社区属性可用特征关键词表征,在此用A代表网络社区的社区属性,如下式1)所示:
其中,矢量分别为代表该网络社区的社区属性的第1-n个特征关键词,a1-an分别为代表该网络社区的社区属性的第1-n个特征关键词权重;
以及预知的待发布信息的信息属性,该等信息属性可用信息关键词表征,用B代表一个待发布信息的信息属性,如下式2)所示:
其中,矢量分别为代表该待发布信息的信息属性的第1-m个信息关键词,b1-bm分别为代表该待发布信息的信息属性的第1-m个信息关键词权重;
并预知每一特征关键词与每一信息关键词之间的相关度,如下式3)所示:
则可通过下式4)计算获取的网络社区的社区属性A与待发布信息的信息属性B的相关度R:
在此,确定与该社区属性相匹配的待发布信息的方式包括但不限于以下任一项:
1)相关度R大于预定相关度阈值的待发布信息;
2)在多条待发布信息中的相关度R较大的预定数目的待发布信息。
在此,所述特征关键词的权重确定方式包括但不限于以下任一项:
1)特征关键词是否为网络社区的社区名称、社区类型、社区归属地址等预设信息;例如,若特征关键词即为网络社区的预设信息,则该特征关键词的权重较高;
2)特征关键词在网络社区的多个贴子中出现频度;例如,某一特征关键词在网络社区的多个贴子中出现频度越高,则该特征关键词的权重越高;
3)在某一网络社区中发布某一贴子的用户在该网络社区中的用户等级;例如,某用户的用户等级越高,则出现在该用户发布的贴子中的特征关键词的权重越高;
4)在网络社区中发布某一贴子的时间与当前时间的距离;例如,时间距离越小,则出现在该贴子中的特征关键词的权重越高。
本领域技术人员应能理解上述确定特征关键词的权重的方式仅为举例,其他现有的或今后可能出现的确定特征关键词的权重的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在一示例中,网络社区的社区属性A由式1)表示,且一个待发布信息的信息属性B由式2)表示;网络社区的社区属性A的2个特征关键词与一个待发布信息的信息属性B的2个信息关键词之间的相关度如下表所示:
表1)
已知社区属性A的特征关键词“美甲”的权重a1为0.7且特征关键词“韩剧”的权重a2为0.3;信息属性B的信息关键词“减肥”的权重b1为0.8且信息关键词“视频”的权重b2为0.2;则可通过4)式计算获取的网络社区的社区属性A与待发布信息的信息属性B的相关度R为0.317(=((0.7×0.8×0.8+0.7×0.2×0+0.3×0.8×0+0.3×0.2×0.9)/((0.72+0.32)1/2+(0.82+0.22)1/2)),该相关度R大于预定相关度阈值0.3,则确定该待发送信息为与该网络社区的社区属性相匹配的待发布信息;据上所述,将该网络社区的社区属性与多个待发送信息分别进行匹配,以确定一个或多个待发送信息。
2)根据已获取的网络社区的社区属性,如代表该网络社区的社区属性的特征关键词,在倒排索引库(如表2所示)中进行匹配查询,以确定该(等)特征关键词对应的一个或多个待发送信息标识信息;进而根据该等待发送信息标识信息,在待发送信息库中提取其各自对应的待发送信息。
在此,所述倒排索引库中包括关键词与包含该关键词的所有待发送信息的对应关系;如下表所示:
表2:
关键词 待发送信息标识信息
K1 T1、T2
K2 T2、T3
K3 T3
例如,在表2中,对应关系示出待发送信息标识信息T1和T2对应的待发送信息中包含关键词K1。
优选地,还可通过4)式计算网络社区的社区属性与通过倒排索引库匹配查询以确定的多个待发送信息的相关度,根据相关度从高到低的顺序进行排序,从而将排序前预定数量的待发送信息作为需要发布至该网络社区的待发布信息。
在此,需要说明的是,上述举例中的各项数值仅为说明作用的示例,以供读者理解本发明,并非实际应用时的真实数据,不应视为对本专利申请保护范围的任何限制。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述。
本领域技术人员应能理解上述确定相关度的方式和/或确定与社区属性相匹配的一个或多个待发布信息的方式仅为举例,其他现有的或今后可能出现的确定相关度的方式和/或确定与社区属性相匹配的一个或多个待发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
随后,在步骤S403中,网络设备1将其在步骤S402中确定的一个或多个待发布信息发布至所述网络社区。
在此,确定发布一个或多个待发布信息至网络社区的顺序的方式包括但不限于以下任一项:
1)待发布信息与该网络社区的社区属性之间的相关度;
2)预定的待发布信息的价值分数;
3)历史发布过程中用户对待发布信息的好评度。
具体地,在步骤S403中,网络设备1将其在步骤S402中确定的一个或多个待发布信息,发布至网络社区以作为该网络社区的一个新贴,也可作为网络社区某一贴子的回贴;例如,将某一待发布信息作为网络社区的一个新贴,通过约定的通信方式发布至该网络社区中;在此,所述约定的通信方式包括通过诸如总线等介质的网络设备的内部通信协议,所述内部通信协议包括但不限于存在于计算机中的各种形式通信,例如:面向对象编程中对象之间的通信协议;操作***内不同程序或计算机不同模块之间的消息传送协议。
本领域技术人员应能理解上述发布待发布信息的方式仅为举例,其他现有的或今后可能出现的发布待发布信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
进一步,网络设备1还可通过页面技术,如JSP、ASP或PHP等,将该网络社区中的信息以屏幕显示的方式提供至用户设备,以供该网络社区的多个用户进行浏览、回复等操作。
优选地,网络设备1在步骤S401、步骤S402和步骤S403中是持续不断地工作。具体地,在步骤S401中,网络设备1持续地获取网络社区的社区属性;在步骤S402中,网络设备1也持续地通过所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;在步骤S403中,网络设备1也持续地将所述一个或多个待发布信息发布至所述网络社区。在此,本领域技术人员应理解“持续”是指各网络设备1在各步骤中不断进行上述网络社区的社区属性的获取、待发布信息的确定、待发布信息的发布,直至满足预定停止条件,例如网络设备1在较长时间内停止对待发布信息的确定。
图5示出根据本发明一个优选实施例的在网络社区中发布信息的方法的流程图。其中,该过程包括步骤S501、步骤S502和步骤S503,其中,步骤S501包括步骤S5011和步骤S5012。
在此,图5中所示网络设备1在步骤S502和步骤S503中所执行的功能和操作与前面参照图4所描述的网络设备1在步骤S402和步骤S403中所执行的功能和操作的内容相同,为简明起见,将其以引用方式包含于此,而不做赘述。
具体地,在步骤S5011中,网络设备1获取网络社区的预设信息;在步骤S5012中,网络设备1根据其在步骤S5011中获取该网络社区的预设信息,确定该网络社区的社区属性。
在此,所述网络社区的预设属性包括但不限于:
1)社区名称;
2)社区类型;
3)社区归属地址;
4)社区预定的话题关键词。
本领域技术人员应能理解上述网络社区的预设属性仅为举例,其他现有的或今后可能出现的网络社区的预设属性如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在一示例中,在步骤S5011中,网络设备1可通过扫描存储于网络设备1中的网络社区的数据信息,以获得该网络社区的名称为“北京美食吧”;则在步骤S5012中,网络设备1通过分词技术,将该网络社区的名称分为关键词“北京”和“美食”,即可确定特征关键词“北京”和“美食”表征该网络社区的社区属性。其中,该分词技术包括但不限于正向最大匹配法,反向最大匹配法,双向最大匹配法,语言模型方法,或最短路径算法。
本领域技术人员应能理解上述获取网络社区的预设信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取网络社区的预设信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
图6示出根据本发明另一优选实施例的在网络社区中发布信息的方法的流程图。其中,该过程包括步骤S601、步骤S602和步骤S603,其中,步骤S601包括步骤S6011、步骤S6012和步骤S6013。
在此,图6中所示网络设备1在步骤S602和步骤S603中所执行的功能和操作与前面参照图4所描述的网络设备1在步骤S402和步骤S403中所执行的功能和操作的内容相同,为简明起见,将其以引用方式包含于此,而不做赘述。
具体地,在步骤S6011中,网络设备1获取网络社区中的来自多个用户的多个贴子;在步骤S6012中,网络设备1通过自然语言分析规则对其在步骤S6011中获取的多个贴子进行分析识别,以提取其各自的内容特征;在步骤S6013中,网络设备1根据其在步骤S6012中提取的内容特征,确定该网络社区的社区属性。
在此,通过所述自然语言分析规则实现人机之间自然语言的通信,即实现计算机对自然语言的理解,其可通过OpenNLP、FudanNLP、Standford NLP、语言技术平台(LTP)等自然语言处理工具来实现。
在一示例中,在步骤S6011中,网络设备1通过约定的通信方式,诸如总线等介质的网络设备的内部通信协议,获取位于网络设备1的网络社区中预定数量的来自多个用户的多个贴子的数据信息,如该网络社区中排位前3位的贴子;接着,在步骤S6012中,网络设备1通过诸如句子切分、部分词性标注、名称抽取、组块、解析等自然语言分析规则,对该多个贴子的文本内容进行分析识别,以提取各个贴子各自的内容特征,如贴子的主题关键词。优选地,在步骤S6012中,网络设备1可利用自然语言处理工具,如OpenNLP,来执行上述分析识别过程。
在一示例中,排位前3位的贴子分别对应的贴子的主题关键词为“北京租房难”、“哪里租房”和“北京租房价格”;则在步骤S6013中,网络设备1可将有重复的主题关键词“北京”和“租房”确定为代表该网络社区的社区属性的特征关键词。
本领域技术人员应能理解上述获取来自多个用户的多个贴子的方式和/或提取内容特征的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取来自多个用户的多个贴子的方式和/或提取内容特征的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,还可以将根据网络社区的预设信息获取网络社区的社区属性的方式,和通过自然语言分析规则对来自多个用户的多个贴子进行分析识别以提取其各自的内容特征,进而确定网络社区的社区属性的方式相结合,通过对上述两种方式赋予不同权重,进行加权计算以获取表征该网络社区的社区属性的特征关键词;从而提高确定网络社区的社区属性的准确性,进一步,使得确定相关度高的一个或多个待发布信息可为可能。
参阅图6,在本发明的一个优选实施例中,该过程还包括步骤S604(未示出)。其中,在步骤S6011中,网络设备1获取网络社区中的来自多个用户的多个贴子;接着,在步骤S6012中,网络设备1通过自然语言分析规则对其在步骤S6011中获取的多个贴子进行分析识别,以提取其各自的内容特征;在步骤S604中,网络设备1获取所述多个贴子的时间属性;在步骤S6013中,网络设备1根据其在步骤S6012中提取的多个贴子的内容特征,结合其在步骤S604中获取的多个贴子所对应的时间属性,确定所述网络社区的社区属性;随后,在步骤S602中,网络设备1通过其在步骤S6013中确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,在步骤S603中,网络设备1将其在步骤S602中确定的一个或多个待发布信息发布至所述网络社区。
在此,所述多个贴子的时间属性可为多个贴子各自的创建时间,也可为网络设备对多个贴子设定的时间标签等。
在此,网络设备中贴子的创建时间距离当前时间越近,则从该贴子中提取的内容特征的权重越高;例如,预定时间权重规则为贴子的创建时间距离当前时间为1小时,则该贴子包含的内容特征的权重为0.7;贴子的创建时间距离当前时间为1天,则该贴子包含的内容特征的权重为0.5;贴子的创建时间距离当前时间为3天,则该贴子包含的内容特征的权重为0.3。
在一示例中,在步骤S6011中,网络设备1获取网络社区中的来自多个用户的3个贴子,在步骤S6012中,网络设备1提取该3个贴子的内容特征,如贴子的主题关键词,其分别为“北京、租房”、“租房”和“北京、美食”,且该等主题关键词的权值均为1;首先,在步骤S604中,网络设备1通过提取该3个贴子的数据信息中的属性信息,以获得其各自的发贴时间分别距离当前时间为1小时、1天和3天;在步骤S6013中,网络设备1根据预定时间权重规则,加权计算以确定对主题关键词“北京”的加权结果为1(=1×0.7+1×0.3),对主题关键词“租房”的加权结果为1.2(=1×0.7+1×0.5)且对主题关键词“美食”的加权结果为0.3(=1×0.3);随后,可根据例如预定判断规则以确定网络社区的社区属性,例如,预定判断规则示出将加权结果大于阈值0.8的主题关键词作为该网络社区的特征关键词,以代表该网络社区的社区属性,则网络设备1可确定该网络社区的特征关键词为“北京”和“租房”。
本领域技术人员应能理解上述获取多个贴子的时间属性的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取多个贴子的时间属性的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
参阅图6,在本发明的另一个优选实施例中,该过程还包括步骤S605(未示出)。其中,在步骤S6011中,网络设备1获取网络社区中的来自多个用户的多个贴子;接着,在步骤S6012中,网络设备1通过自然语言分析规则对其在步骤S6011中获取的多个贴子进行分析识别,以提取其各自的内容特征;在步骤S605中,网络设备1获取所述多个贴子所对应多个用户的用户相关信息;在步骤S6013中,网络设备1根据其在步骤S6012中提取的多个贴子的内容特征,结合所述多个贴子所对应多个用户的用户相关信息,确定所述网络社区的社区属性;随后,在步骤S602中,网络设备1通过其在步骤S6013中确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,在步骤S603中,网络设备1将其在步骤S602中确定的一个或多个待发布信息发布至所述网络社区。
在此,所述用户相关信息包括但不限于以下任一项:
1)用户等级信息;其中,用户等级越高表明该用户的信誉度越高,故从来自该用户的贴子中提取的内容特征权重越高;例如,预定用户等级权重规则为用户等级为10级以上,则其发布的贴子的内容特征的权重为0.8,用户等级为9级至7级时,则其发布的贴子的内容特征的权重为0.6,用户等级为6级至4级时,则其发布的贴子的内容特征的权重为0.4,用户等级为3级至1级时,则其发布的贴子的内容特征的权重为0.2。
在此,所述用户等级信息意指由***根据用户在该网络社区注册的时间长短、发贴次数、贴子内容质量等多项因素确定的该用户在该网络社区的等级信息。其中,每一用户可以针对一个网络社区具有用户等级信息,也可针对多个网络社区具有不同的用户等级信息,例如,某一用户同时是网络社区“湖人吧”的3级用户和网络社区“巴塞罗那吧”的6级用户。
2)用户历史行为记录;其中,对多个用户历史行为记录进行统计分析,可确定该多个用户的共同需求,进而可将该共同需求作为网络社区的一个社区属性;当多个用户的共同需求与从来自该多个用户的多个贴子中提取的内容特征相匹配时,则提高该内容特征的权重。
在此,所述用户历史行为记录意指由***来记录和统计用户先前的发贴和点击浏览历史,从而可判断或预测用户的需求。其中,当用户为登录用户时,网络设备1可通过该用户的ID在网络端保存有该用户相关信息的用户特征库中进行查询;当用户为非登录用户时,可通过检测该用户使用本网络设备的网络社区过程中的动作,或通过向用户设备询问并获取该用户的Cookie信息来获得,优选地,可赋予该用户一个临时ID并为其建立一个用户特征库,将此次搜索过程中用户的历史记录保存与该临时用户特征库中。
3)用户地理位置信息;其中,当多个贴子所对应多个用户的用户地理位置信息示出该多个用户均位于同一归属地址时,则可将该归属地址作为网络社区的社区属性。
在此,获取所述用户地理位置信息的方式可为通过读取用户在网络社区中的注册信息以获取;也可通过网络设备1实时检测用户设备以获取该用户设备的IP地址。
在一示例中,网络设备1对网络社区中的贴子A、贴子B和贴子C进行分析,提取该3个贴子的内容特征,如贴子的主题关键词,其分别为“电影、蓝精灵”、“蓝精灵”和“蓝精灵、玩具”,且该等主题关键词的权值均为1;在步骤S605中,网络设备1在网络设备1的用户信息库中获取该3个贴子所对应3个用户的用户等级信息分别为10级、5级和1级;在步骤S6013中,网络设备1根据预定用户等级权重规则,确定对主题关键词“电影”的加权结果为0.8(=1×0.8),对主题关键词“蓝精灵”的加权结果为1.4(=1×0.8+1×0.4+1×0.2)且对主题关键词“玩具”的加权结果为0.1(=1×0.1);随后,可根据例如预定判断规则以确定网络社区的社区属性,例如,预定判断规则示出将加权结果大于阈值0.8的主题关键词作为该网络社区的特征关键词,以代表该网络社区的社区属性,则网络设备1可确定该网络社区的特征关键词为“蓝精灵”和“电影”。
本领域技术人员应能理解上述获取多个贴子所对应多个用户的用户相关信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取多个贴子所对应多个用户的用户相关信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
优选地,还可以将获取多个贴子的时间属性的方式和获取多个贴子所对应多个用户的用户相关信息的方式相结合,通过对上述两种方式赋予不同权重,进行加权计算以确定网络社区的社区属性。
参阅图6,在本发明的又一个优选实施例中,该过程还包括步骤S606(未示出)。其中,在步骤S6011中,网络设备1获取网络社区中的来自多个用户的多个贴子;接着,在步骤S6012中,网络设备1通过自然语言分析规则对其在步骤S6011中获取的多个贴子进行分析识别,以提取其各自的内容特征;在步骤S606中,网络设备1获取所述多个用户对已发布至所述网络社区中的所述一个或多个待发布信息的操作信息;在步骤S6013中,网络设备1根据其在步骤S6012中提取的多个贴子的内容特征,结合其在步骤S606中获取的操作信息,确定所述网络社区的社区属性;随后,在步骤S602中,网络设备1通过其在步骤S6013中确定的所述网络社区的社区属性,对预存的多条待发布信息进行匹配查询,以确定与所述社区属性相匹配的一个或多个待发布信息;随后,在步骤S603中,网络设备1将其在步骤S602中确定的一个或多个待发布信息发布至所述网络社区。
在此,所述操作信息包括但不限于:
1)浏览操作;在此,获取所述浏览操作的方式可为实时地获取用户通过用户设备进入点击进入某一已发布的所述待发布信息页面时间以及关闭该页面的时间,记录进入时间与关闭时间的时间间隔,当该时间间隔大于预定间隔阈值时,则可确定用户对该页面进行了浏览操作;
2)回复操作;即用户通过用户设备输入针对某一已发布的所述待发布信息的回复信息,并将该回复信息发布至网络设备1;
3)好评操作;例如,用户通过用户设备对某一已发布的待发布信息点击“顶”、“赞”、“好评”等进行好评的按钮;
4)收藏操作;例如,用户将某一已发布的待发布信息收藏至网络收藏库中。
在一示例中,待发布信息Ia和待发布信息Ib已发布至网络社区,且该两个待发布信息对应的网络社区的社区属性可用特征关键词“北京”、“美食”和“北京”、“租房”进行分别表征;在步骤S606中,网络设备1获取多个用户对已发布至该网络社区中的待发布信息Ia的操作信息为浏览操作20次且回复操作8次,但该多个用户对已发布至该网络社区中的待发布信息Ib无浏览及回复操作,即该多个用户对待发布信息Ib的兴趣较低,进一步,可判断待发布信息Ib所对应的网络社区的社区属性与该多个用户的用户需求不相符合;则当网络设备1在步骤S6012中再一次提取得到来自该多个用户的多个贴子的内容特征,且可用特征关键词“北京”、“美食”和“北京”、“租房”分别表示,则在步骤S6013中,网络设备1将不再使用特征关键词“租房”代表该网络社区的社区属性,即确定代表该网络社区的社区属性的特征关键词仅为“北京”、“美食”。
本领域技术人员应能理解上述获取操作信息的方式和/或确定网络社区的社区属性的方式仅为举例,其他现有的或今后可能出现的获取操作信息的方式和/或确定网络社区的社区属性的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在此,获取多个用户的操作行为可为仅获取多个用户的一次操作行为,也可为获取多个用户的多次操作行为,从而使得对多个用户的操作行为分析判断结果更加准确。
优选地(参照图6),该过程还包括步骤S607(未示出)。其中,在步骤S607中,网络设备1根据其在步骤S606中获取的操作信息,更新所述多个用户的所述用户相关信息。
具体地,在步骤S607中,网络设备1将其在步骤S606中获取的操作信息,写入到多个用户其各自对应的用户特征库中,以更新该多个用户的用户相关信息;若检测到某一用户的用户特征库尚未建立,则先行初始化该用户的用户特征库,然后将该用户的操作信息写入到该用户特征库中。
本领域技术人员应能理解上述更新多个用户的用户相关信息的方式仅为举例,其他现有的或今后可能出现的更新多个用户的用户相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
进一步,还可根据多个用户的操作信息,对待发送信息的重要度进行更新;例如,多个用户对某一已发送至网络社区的待发送信息的回复次数操作预定次数阈值,则提高该待发送信息的重要度。再进一步,还可根据多个用户的操作信息,对网络社区的社区属性进行更新;例如,多个用户对某一已发送至网络社区的待发送信息无浏览、回复等操作,则可将待发送信息的信息关键词与该网络社区的社区属性的特征关键词的相关度降低。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (16)

1.一种计算机实现的在网络社区中发布信息的方法,该方法包括以下步骤:
a获取网络社区的社区属性,其中,所述社区属性可用特征关键词表示;同一网络社区中有多个用户参与,该多个用户可能对一个或多个特定或非特定的主题进行讨论;
其中,该方法还包括:
x根据所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;其中,可计算获取网络社区的社区属性与待发布信息的信息属性的相关度,并基于以下任一项确定与该社区属性相匹配的待发布信息的方式:
-相关度大于预定相关度阈值的待发布信息;
-在多条待发布信息中的相关度较大的预定数目的待发布信息;
y将所述一个或多个待发布信息发布至所述网络社区。
2.根据权利要求1所述的方法,其中,所述步骤a包括:
-获取所述网络社区的预设信息;
-根据所述预设信息,确定所述网络社区的社区属性。
3.根据权利要求1所述的方法,其中,所述步骤a包括:
a1获取所述网络社区中的来自多个用户的多个贴子;
a2通过自然语言分析规则对所述多个贴子进行分析识别,以提取其各自的内容特征;
a3根据所述内容特征,确定所述网络社区的社区属性。
4.根据权利要求3所述的方法,其中,该方法还包括:
-获取所述多个贴子的时间属性;
其中,所述步骤a3包括:
-根据所述多个贴子的内容特征,结合所述多个贴子所对应的时间属性,确定所述网络社区的社区属性。
5.根据权利要求3或4所述的方法,其中,该方法还包括:
-获取所述多个贴子所对应多个用户的用户相关信息;
其中,所述步骤a3包括:
-根据所述多个贴子的内容特征,结合所述多个贴子所对应多个用户的用户相关信息,确定所述网络社区的社区属性。
6.根据权利要求5所述的方法,其中,所述用户相关信息包括以下至少任一项:
-用户等级信息;
-用户历史行为记录;
-用户地理位置信息。
7.根据权利要求6所述的方法,其中,该方法还包括:
-获取所述多个用户对已发布至所述网络社区中的所述一个或多个待发布信息的操作信息;
其中,所述步骤a3包括:
-根据所述内容特征,并结合所述操作信息,确定所述网络社区的社区属性。
8.根据权利要求7所述的方法,其中,该方法还包括:
-根据所述操作信息,更新所述多个用户的所述用户相关信息。
9.一种用于在网络社区中发布信息的设备,该设备包括:
第一获取装置,用于获取网络社区的社区属性,其中,所述社区属性可用特征关键词表示;同一网络社区中有多个用户参与,该多个用户可能对一个或多个特定或非特定的主题进行讨论;
其中,该设备还包括:
第一确定装置,用于根据所述网络社区的社区属性,对预存的多个待发布信息进行匹配查询,以确定与所述网络社区的社区属性相匹配的一个或多个待发布信息;其中,可计算获取网络社区的社区属性与待发布信息的信息属性的相关度,并基于以下任一项确定与该社区属性相匹配的待发布信息的方式:
-相关度大于预定相关度阈值的待发布信息;
-在多条待发布信息中的相关度较大的预定数目的待发布信息;
发布装置,用于将所述一个或多个待发布信息发布至所述网络社区。
10.根据权利要求9所述的设备,其中,所述第一获取装置包括:
第二获取单元,用于获取所述网络社区的预设信息;
第二确定单元,用于根据所述预设信息,确定所述网络社区的社区属性。
11.根据权利要求9所述的设备,其中,所述第一获取装置包括:
第三获取单元,用于获取所述网络社区中的来自多个用户的多个贴子;
提取单元,用于通过自然语言分析规则对所述多个贴子进行分析识别,以提取其各自的内容特征;
第三确定单元,用于根据所述内容特征,确定所述网络社区的社区属性。
12.根据权利要求11所述的设备,其中,该设备还包括:
第四获取单元,用于获取所述多个贴子的时间属性;
其中,所述第三确定单元用于根据所述多个贴子的内容特征,结合所述多个贴子所对应的时间属性,确定所述网络社区的社区属性。
13.根据权利要求11或12所述的设备,其中,该设备还包括:
第五获取单元,用于获取所述多个贴子所对应多个用户的用户相关信息;
其中,所述第三确定单元用于根据所述多个贴子的内容特征,结合所述多个贴子所对应多个用户的用户相关信息,确定所述网络社区的社区属性。
14.根据权利要求13所述的设备,其中,所述用户相关信息包括以下至少任一项:
-用户等级信息;
-用户历史行为记录;
-用户地理位置信息。
15.根据权利要求14所述的设备,其中,该设备还包括:
第六获取单元,用于获取所述多个用户对已发布至所述网络社区中的所述一个或多个待发布信息的操作信息;
其中,所述第三确定单元用于根据所述内容特征,并结合所述操作信息,确定所述网络社区的社区属性。
16.根据权利要求15所述的设备,其中,该设备还包括:
更新装置,用于根据所述操作信息,更新所述多个用户的所述用户相关信息。
CN201210057478.9A 2012-03-06 2012-03-06 一种在网络社区中发布信息的方法与设备 Active CN103312584B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210057478.9A CN103312584B (zh) 2012-03-06 2012-03-06 一种在网络社区中发布信息的方法与设备
BR112014021842-0A BR112014021842B1 (pt) 2012-03-06 2012-06-13 Método implementado por computador e dispositivo para a emissão de informações em uma comunidade de rede
PCT/CN2012/076863 WO2013131335A1 (zh) 2012-03-06 2012-06-13 一种在网络社区中发布信息的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210057478.9A CN103312584B (zh) 2012-03-06 2012-03-06 一种在网络社区中发布信息的方法与设备

Publications (2)

Publication Number Publication Date
CN103312584A CN103312584A (zh) 2013-09-18
CN103312584B true CN103312584B (zh) 2019-03-19

Family

ID=49115908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210057478.9A Active CN103312584B (zh) 2012-03-06 2012-03-06 一种在网络社区中发布信息的方法与设备

Country Status (3)

Country Link
CN (1) CN103312584B (zh)
BR (1) BR112014021842B1 (zh)
WO (1) WO2013131335A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899462B (zh) * 2015-06-17 2017-09-29 北京奇虎科技有限公司 确定信息发布位置的价值度的方法及装置
CN105354748A (zh) * 2015-10-15 2016-02-24 百度在线网络技术(北京)有限公司 网络社区数据处理方法和装置
US10916243B2 (en) * 2016-12-27 2021-02-09 Amazon Technologies, Inc. Messaging from a shared device
CN113162839B (zh) * 2021-02-18 2023-03-24 深圳向量之美科技有限公司 网络社区及互动方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101083545A (zh) * 2007-06-26 2007-12-05 腾讯科技(深圳)有限公司 一种在聊天室内发布信息的***及方法
CN101098264A (zh) * 2006-06-27 2008-01-02 唐晨辉 开放即时通信***
CN101339637A (zh) * 2007-07-04 2009-01-07 上海易米信息科技有限公司 通过个人简历发布博客广告的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101098264A (zh) * 2006-06-27 2008-01-02 唐晨辉 开放即时通信***
CN101083545A (zh) * 2007-06-26 2007-12-05 腾讯科技(深圳)有限公司 一种在聊天室内发布信息的***及方法
CN101339637A (zh) * 2007-07-04 2009-01-07 上海易米信息科技有限公司 通过个人简历发布博客广告的方法

Also Published As

Publication number Publication date
CN103312584A (zh) 2013-09-18
BR112014021842B1 (pt) 2021-11-09
BR112014021842A2 (pt) 2017-06-20
WO2013131335A1 (zh) 2013-09-12

Similar Documents

Publication Publication Date Title
Ratkiewicz et al. Detecting and tracking political abuse in social media
US8725717B2 (en) System and method for identifying topics for short text communications
US8689098B2 (en) System and method for organizing recorded events using character tags
CN103038769B (zh) 用于将内容导引到社交网络引擎用户的***和方法
CN105912669B (zh) 用于补全搜索词及建立个体兴趣模型的方法及装置
CN103425670B (zh) 一种向用户提供内容推荐信息的方法、装置和设备
US20090077065A1 (en) Method and system for information searching based on user interest awareness
CN109983455A (zh) 在在线社交网络上多样化媒体搜索结果
US20100058202A1 (en) Method system and program product for providing enabling an interactive and social search engine
CN107562875A (zh) 一种模型的更新方法、装置及***
US9361583B1 (en) Merged recommendations of real estate listings
US20130144860A1 (en) System and Method for Automatically Identifying Classified Websites
CN109325179A (zh) 一种内容推广的方法及装置
US20110082803A1 (en) Business flow retrieval system, business flow retrieval method and business flow retrieval program
US20140365868A1 (en) Method, server, browser, and system for recommending text information
CN107735829A (zh) 用于评价构想创造力的联机测试方法及联机测试服务器
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
US11836169B2 (en) Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
CN108170731A (zh) 数据处理方法、装置、计算机存储介质及服务器
CN103312584B (zh) 一种在网络社区中发布信息的方法与设备
CN107563715A (zh) 外贸集客营销***及方法
CN102053960B (zh) 依群需特征构建物联互联双网快准搜索引擎的方法及***
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其***
CN108781223A (zh) 用于内容项选择的数据的数据分组传输优化
CN110264283A (zh) 一种推广资源展示方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant