CN104331429B - 对网络对象进行多特征维度量化的方法及装置 - Google Patents
对网络对象进行多特征维度量化的方法及装置 Download PDFInfo
- Publication number
- CN104331429B CN104331429B CN201410564598.7A CN201410564598A CN104331429B CN 104331429 B CN104331429 B CN 104331429B CN 201410564598 A CN201410564598 A CN 201410564598A CN 104331429 B CN104331429 B CN 104331429B
- Authority
- CN
- China
- Prior art keywords
- data
- characteristic dimension
- network object
- feature
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013139 quantization Methods 0.000 title claims abstract description 29
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000011002 quantification Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 241000408529 Libra Species 0.000 description 2
- 241000406668 Loxodonta cyclotis Species 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241000475699 Euphaedusa digonoptyx comes Species 0.000 description 1
- 241000171154 Nematus <genus> Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种对网络对象进行多特征维度量化的方法及装置,该方法包括:确定一网络对象,获得与该网络对象相对应的特征描述数据;根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重;依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。采用本发明的方法,通过对网络对象的特征描述数据进行处理,形成该网络对象各个特征维度的量化值,直观地反应网络对象的各个维度的特征。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种对网络对象进行多特征维度量化的方法及装置。
背景技术
随着互联网技术的飞速发展,在网络上存在着越来越多的网络对象,例如视频文件、音频文件、文本文件等,供广大用户去浏览或下载。另一方面,通过网络爬虫等搜索技术,针对不同的网络对象,可以在网络上搜索获取到大量相关的信息,例如针对这些网络对象的评论、推荐或标签数据等,这些信息很多都是基于UGC(User Generated Content,用户生成内容)的方式生成的。
然而,针对网络对象的大量相关信息,特别是UGC数据信息,由于不同网站对不同网络对象的主观划分,以及用户在不同网站上的结构性的输入限制,造成了这些数据只能孤立的存在于不同网站中,并散落在不同网站的不同网页上,相互之间并不能产生很大的参考意义,尽管有些网站也可能会对其中的一些信息数据进行整合和量化,但鉴于不同网站对同一网络对象的信息标准并不统一,因此一般也仅仅局限于对本站内的相关信息进行整合,而且这种整合后的量化数据在结构上是非常单一和难以扩展的,同时也造成了在量化数据的展示方式上非常受限制。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的对网络对象进行多特征维度量化的方法和相应的装置。
根据本发明的一个方面,提供了一种对网络对象进行多特征维度量化的方法,包括:确定一网络对象,获得与该网络对象相对应的特征描述数据;根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重;依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
其中,获得与该网络对象相对应的特征描述数据的步骤,包括:根据所述网络对象的类型,预先确定一个或多个网络搜索地址;通过该网络搜索地址获取与该网络对象相对应的特征描述数据。
其中,获得与该网络对象相对应的特征描述数据的步骤,包括:将来自于不同网络地址的特征描述数据进行重合度匹配;将重合度低于阈值的描述数据删除,生成最终的特征描述数据集合。
其中,获得与该网络对象相对应的特征描述数据的步骤,包括:将来自于不同网络地址的特征描述数据进行重合度匹配;根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高;将重复的特征描述数据删除,生成带权重的特征描述数据集合。
其中,获得与该网络对象相对应的特征描述数据的步骤,进一步包括:根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
其中,所述特征维度是根据所述网络对象的类型确定的。
其中,根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤,包括:根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配;根据匹配结果确定对各特征维度的命中次数的比例;根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
其中,根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤,包括:根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配;根据匹配结果确定对各特征维度的命中次数的比例;根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整;根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
其中,依据所述各特征维度权重,得到该网络对象的各特征维度的量化值的步骤,包括:获取与该网络对象对应的分值描述数据;将与该网络对象相对应的分值描述数据与所述各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
其中,获取与该网络对象对应的分值描述数据的步骤,包括:获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。
其中,所述描述数据包括标签数据、评论数据,和/或关键字数据。
其中,进一步包括:从所述与该网络对象相对应的各特征维度中选取至少部分特征维度;根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
其中,进一步包括:根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示。
根据本发明的另一方面,提供了一种对网络对象进行多特征维度量化的装置,获得模块,用于确定一网络对象,获得与该网络对象相对应的特征描述数据;匹配模块,用于根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重;量化模块,用于依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
其中,所述获得模块包括:确定模块,用于根据所述网络对象的类型,预先确定一个或多个网络搜索地址;获取模块,用于通过该网络搜索地址获取与该网络对象相对应的特征描述数据。
其中,所述获得模块包括:第一重合度匹配模块,用于将来自于不同网络地址的特征描述数据进行重合度匹配;第一生成模块,用于将重合度低于阈值的描述数据删除,生成最终的特征描述数据集合。
其中,所述获得模块包括:第二重合度匹配模块,用于将来自于不同网络地址的特征描述数据进行重合度匹配;权重分配模块,用于根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高;第二生成模块,用于将重复的特征描述数据删除,生成带权重的特征描述数据集合。
其中,所述获得模块进一步包括:权重调整模块,用于根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
其中,所述特征维度是根据所述网络对象的类型确定的。
其中,所述匹配模块包括:第一匹配模块,用于根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配;第一比例确定模块,用于根据匹配结果确定对各特征维度的命中次数的比例;第一权重获得模块,用于根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
其中,所述匹配模块包括:第二匹配模块,用于根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配;第二比例确定模块,用于根据匹配结果确定对各特征维度的命中次数的比例;比例调整模块,用于根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整;第二权重获得模块,用于根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
其中,所述量化模块,包括:分值获取模块,用于获取与该网络对象对应的分值描述数据;量化处理模块,用于将与该网络对象相对应的分值描述数据与所述各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
其中,所述分值获取模块,进一步用于:获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。
其中,所述描述数据包括标签数据、评论数据,和/或关键字数据。
其中,进一步包括:选取模块,用于从所述与该网络对象相对应的各特征维度中选取至少部分特征维度;第一展示模块,用于根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
其中,第二展示模块,用于根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示。
根据本发明的技术方案,存在以下技术效果:
本发明根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将网络对象对应的特征描述数据与特征维度进行匹配,获得与该网络对象对应的各特征维度权重,进而根据各特征维度的权重得到网络对象各个特征维度的量化值,能够直观地反应网络对象的各个特征维度的特征,同时,由于可以根据不同的网络对象类型而对特征维度进行增加或减少,并进而对描述数据与特征维度之间的对应关系随时进行调整,因此,本发明提供的技术方案针对不同网络对象的相关信息在整合后的量化数据的结构上是非常富有弹性并容易扩展的,这也为提供更多样化的展示方式提供了可能。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本发明的实施例的对网络对象进行多特征维度量化的方法的总流程图;
图2是根据本发明一个实施例的获得与该网络对象相对应的特征描述数据的步骤的流程图;
图3是根据本发明一个实施例的根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤的流程图;
图4是根据本发明一个实施例的依据所述各特征维度权重,得到该网络对象的各特征维度的量化值的步骤的流程图;
图5是根据本发明另一实施例的获得与该网络对象相对应的特征描述数据的步骤的流程图;
图6是根据本发明另一实施例的根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤的流程图;
图7是根据本发明一个实施例的对网络对象进行多特征维度量化的装置的结构框图;以及
图8是根据本发明一个实施例的对一部电影的各个特征维度的量化值以多维图的方式进行展示时的展示界面示例图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,图1是根据本发明一个实施例的对网络对象进行多特征维度量化的方法的总流程图。
在步骤S110处,确定一网络对象,获得与该网络对象相对应的特征描述数据。
具体地,可以根据用户的搜索确定网络对象,如,根据用户输入的搜索请求确定用户搜索的网络对象;或者可以根据用户对预置链接的访问确定网络对象,如,用户对预置链接的点击等。
其中,网络对象可以包括:互联网上的资源,可以包括视频文件、音频文件、文本文件等,如,电影、电视、音乐、文章、书籍等。与该网络对象相对应的特征描述数据可以包括:该网络对象的标签数据、评论数据,和/或关键字数据等。其中,标签数据例如可以为用户生成的用于对该网络对象进行推荐、介绍、评论的标签,例如,可以在网络上搜索到大量的电影标签;评论数据可以为用户对该网络对象进行的评论;关键字数据可以为对网络对象的推荐、评论数据进行特定的处理(如,对评论文字进行分词处理)获取到的该网络对象的关键字。本领域技术人员应当理解,本发明的实施例不限于此。
根据本发明的一个实施例,可以利用下面的子步骤来获得与该网络对象相对应的特征描述数据。
首先,根据所述网络对象的类型,预先确定一个或多个网络搜索地址。例如,互联网上有许多专门的网站或者一些网站的专门的子版块,供用户发布或者搜索特定类型的网络对象的特征描述数据,如,针对电影、电视、书刊、杂志等提供发布或搜索资讯的网站或网站子版块等,因此,可以根据网络对象的类型,预先确定搜索特征描述数据的网站,即确定一个或多个网络搜索地址。
然后,通过该网络搜索地址获取与该网络对象相对应的特征描述数据。即,通过确定的该一个或多个网络搜索地址获取该网络对象的特征描述数据。根据网络对象的类型预先确定网络搜索地址,能够使搜索更具方向性,避免从不相关的网站进行搜索,提高搜索效率。并且,从不同的网络地址获取网络对象的特征描述数据,可以将来自不同网站的与网络对象对应的特征描述数据进行比较全面、统一的整合,并根据不同特征描述数据之间的数量关系以及特征描述数据与特征维度之间的对应关系对网络对象的特征进行量化。
在一个具体实施例中,可以通过网络爬虫技术实现上述的子步骤,即,通过程序或脚本自动获取与该网络对象对应的特征描述数据。
参考图2,图2是根据本发明的一个实施例的获得与该网络对象相对应的特征描述数据的步骤的流程图。
如图2所示,获得与该网络对象相对应的特征描述数据的步骤,可以包括以下步骤:
步骤S210,将来自于不同网络地址的特征描述数据进行重合度匹配。
来自于不同网络地址的特征描述数据中可能存在许多重复的(相同的)数据,即,同一特征描述数据出现多次,其中,相似的数据(意义相同或相近的数据)也可以看做重复的(相同的)数据。具体而言,某一特征描述数据重复出现的次数越多,或者该特征描述数据以及与其相似的特征描述数据出现的次数(重合次数)越多,则可认为该特征描述数据的重合度越高。例如,针对某一部电影,存在来自各个不同网站的大量的标签(tag),这些标签中可能包括许多相同的标签或相似的标签,则可以将获取到的该电影的标签进行重合度匹配,某一标签重复出现的次数(重合次数)越多,或者该标签以及与其相似的标签出现的次数越多,则其重合度越高。
步骤S220,将重合度低于阈值的特征描述数据删除,生成最终的特征描述数据集合。
具体地,可以根据预先设置的重合度阈值,将重合度低于该阈值的特征描述数据删除,生成最终的特征描述数据集合。例如,可以根据预先设置的重合次数阈值。删除与该网络对象对应的特征描述数据中重合次数低于该重合次数阈值的数据,生成最终的特征描述数据集合。通过删除重合度低于阈值的特征描述数据,能够减少后续过程需要处理的数据数量,使后续过程中的数据处理更加简便。
应当注意,生成的最终的特征描述数据集合中,可以包括删除重合度低于该阈值的特征描述数据后剩余的该网络对象的全部特征描述数据,也即是说,其中包括重复的或相似的特征描述数据。
返回图1,在获得了与该网络对象相对应的特征描述数据之后,接下来,在步骤S120处,根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重。
具体而言,可以先根据该网络对象的类型确定所述网络对象对应的特征维度,再根据预先建立的不同特征描述数据与不同特征维度之间的对应关系将该网络对象对应的特征描述数据与特征维度进行匹配。例如,若该网络对象为电影,则可以确定电影相关的特征维度为该网络对象对应的特征维度,例如,电影相应的特征维度可以包括:视听、情节、思想、氛围等特征维度,或者还可以包括其他属性的特征维度,如,观众性别、年龄、星座等维度。并且,还可以根据不同的网络对象的类型、用户的需求等方面,对网络对象对应的特征维度进行增加或减少,极具灵活性。
其中,不同特征描述数据与不同特征维度之间的对应关系可以通过以下步骤预先建立:
首先,获取多个特征描述数据,并确定多个特征维度。其中,所述多个特征维度可以分别包括一个或多个特征维度类别中的每一个所包含的多个特征维度。也即是说,所述多个特征维度包括一个或多个特征维度类别,其中每一个特征维度类别包含多个特征维度。
然后,确定所述多个特征描述数据与所述多个特征维度的对应关系,例如,可以根据对大量历史数据进行统计分析的结果确定特征描述数据与特征维度是否具有对应关系。并且,还可以将不同特征描述数据与不同特征维度之间的对应关系配置为一对应关系表。
以电影标签为例,配置各个电影标签(特征描述数据)与各个特征维度之间的对应关系表可以如表1所示:
表1
其中,对于每个标签(特征描述数据),对与其具有对应关系的特征维度进行标记,即,标记该标签与该特征维度具有对应关系,例如,表1中用“1”作为具有对应关系的标记,例如,标签“喜剧”与特征维度“情节”具有对应的关系,则对“喜剧”的“情节”维度进行标记。需要说明的是,表1中只示出了部分特征描述数据与部分特征维度的对应关系。
应当注意,本发明中预先建立不同特征描述数据与不同特征维度之间的对应关系的方式不限于此。并且,由于该不同特征描述数据与不同特征维度之间的对应关系是预先进行配置的,因此,在实际的应用中,可以根据不同的需求进行维度扩展,即,增加新的特征维度,并且,进行维度扩展时,不需要针对新增维度收集相关的特征描述数据,只需根据已有的特征描述数据,补充特征描述数据与新增特征维度的对应关系进行调整,维度的扩展相当灵活。
参考图3,图3是根据本发明的一个实施例根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤(步骤S120)的流程图。
如图3所示,步骤S120可以进一步包括以下步骤:
步骤S310,根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配。
具体而言,可以根据该预先建立的不同特征描述数据与不同特征维度之间的对应关系,将获得的与该网络对象对应的全部特征描述数据分别与特征维度进行匹配,也就是将该网络对象的特征描述数据集合中的各特征描述数据分别与特征维度进行匹配。其中,如果全部的特征描述数据中存在重复的特征描述数据(即,相同或相似的特征描述数据),则进行重复匹配,也就是说,不论存在多少相同或相似的特征描述数据,都分别与特征维度进行匹配,使得不同特征描述数据的重复次数对最终的量化值结果产生影响。
更具体而言,可以确定该网络对象的全部特征描述数据中在该预先建立的特征描述数据与不同特征维度时间的对应关系中存在的特征描述数据,并将存在的特征描述数据分别与该对应关系中的各特征维度进行匹配,若一个特征描述数据在预先建立的特征描述数据与不同特征维度时间的对应关系中存在,则根据该对应关系确定与该特征描述数据具有对应关系的一个或多个特征维度,并记录该网络对象对该一个或多个特征维度分别命中一次,如果有重复的特征描述数据,则将重复的特征描述数据与各特征维度进行重复匹配。
步骤S320,根据匹配结果确定对各特征维度的命中次数的比例。
具体地,可以根据各个特征维度在该网络对象对应的全部特征描述数据中的命中次数,确定各特征维度的命中次数比例,也就是说,累积该网络对象的全部特征描述数据对各个特征维度的命中次数,并根据各特征维度的命中次数确定该网络对象对各特征维度的命中次数比例。
步骤S330,根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
也就是说,根据各特征维度的命中次数比例,确定该网络对象对应的各特征维度的权重。具体地,命中次数越多对应的特征维度的权重越大,因此可以根据命中次数比例从大到小的顺序,以权重依次递减的方式确定各特征维度的权重,或者可以直接将各特征维度的命中次数比例作为各特征维度的权重。并且其中,如果该多个特征维度包含多个特征维度类别,则可以按照特征维度类别分别确定各个特征维度在各自所属的类别中的权重,其中,任意一个特征维度类别中各个特征维度的权重之和等于1。
通过上述步骤S310~S330可以获得与该网络对象对应的各特征维度对应的权重,在获得了与该网络对象对应的各特征维度权重后,接下来返回图1,进行步骤S130。
在步骤S130处,依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
为了更清楚地解释该步骤,以下参考图4来描述该步骤的一种可选的具体实施例。图4为根据本发明一个实施例的依据所述各特征维度权重,得到该网络对象的各特征维度的量化值的步骤的流程图。
步骤S410,获取与该网络对象对应的分值描述数据。
具体地,可以获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。也就是说,将来自不同网络地址的分值描述数据的加权平均值作为该网络对象最终的分值描述数据。例如,对于某一部电影,可以获取来自于不同网络地址的该电影的用户评分分值,并根据预先针对不同网络地址设置的权重将来自不同网络地址的用户评分分值进行加权求和,将得到的加权平均值作为该电影最终的分值。
上述根据网络地址的权重对来自不同网络地址的分值描述数据进行加权,而得到的最终的分值描述数据的将会更加客观和准确。其中,针对不同网络地址设置的权重,可以预先进行设置,例如,根据用户对网站的喜好程度或关注程度设置该网站的权重,也就是说,设置该网站的网络地址的权重,对于用户喜好程度越高或关注程度越高的网络地址,其所对应的权重可以设置得越高。
步骤S420,将与该网络对象相对应的分值描述数据与各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
也就是说,以该网络对象的分值描述数据为基础,将该网络对象相对应的分值描述数据分别与该网络对象的各特征维度权重相乘,得到的结果分别作为各特征维度的量化值,即,该网络对象的各特征维度对应的分值。
以上结合图1~图4详述了根据本发明实施例的对网络对象进行多特征维度量化的方法的具体流程。
下面结合图1、图5和图6对根据本发明另一实施例的对网络对象进行多特征维度量化的方法进行详细描述。
如图1所示,在步骤S110处,确定一网络对象,获得与该网络对象相对应的特征描述数据。
具体而言,可以根据用户的搜索确定网络对象,如,根据用户输入的搜索query中的关键字确定网络对象;或者可以根据用户对预置链接的访问确定网络对象,如,用户对预置的访问按钮的点击等。确定网络对象后,获得与该网络对象相对应的特征描述数据,例如,可以通过网络爬虫技术,使用爬虫程序或脚本自动获取与该网络对象相对应的特征描述数据。
图5为根据本发明另一实施例的获得与该网络对象相对应的特征描述数据的步骤的流程图。如图5所示,在本实施例中,获得与该网络对象相对应的特征描述数据的步骤可以进一步包括以下步骤:
步骤S510,将来自于不同网络地址的特征描述数据进行重合度匹配。
具体而言,可以根据该网络对象所对应的来自于不同网络地址的特征描述数据中各数据重复出现的次数,确定各特征描述数据的重合度高低,即,在该网络对象对应的来自于不同网络的特征描述数据中,相同的特征描述数据重复出现的次数,其中,相似的数据(意义相同或相近的数据)也可以看做重复的(相同的)数据。某一特征描述数据重复出现的次数越多,或者该特征描述数据以及与其相似的特征描述数据出现的次数(重合次数)越多,则可认为该特征描述数据的重合度越高。
步骤S520,根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高。
也就是说,根据特征描述数据的重合度高低,为各个特征描述数据分配相应的权重,重合度越高的特征描述数据,则为其分配的权重越高。在一个具体实施例中,可以根据与该网络对象对应的特征描述数据中的各个特征描述数据的重合度从高到低排名,以权重依次递减的方式为各个特征描述数据分配相应的权重,其中,相同的或相似的特征描述数据可以看作同一数据,为其分配相同的权重。
步骤S530,将重复的特征描述数据删除,生成带权重的特征描述数据集合。
具体而言,可以将该网络对象对应的特征描述数据中重复的特征描述数据(包括相同的或相似的特征描述数据)只留其中一个,删除其他重复的数据,生成带权重的特征描述数据集合,也就是说,将该网络对象对应的特征描述数据中相同或相似的特征描述数据只取其中一个,其余的删除,即,生成的特征描述数据集中不存在相同或相似的特征描述数据。这样,就将不同的特征描述数据重复出现的次数,转化为不同特征描述数据的权重,简化了后续的数据处理过程。
可选地,在步骤S530之后还可以包括步骤S540,根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
具体地,可以预先针对不同网络地址设置权重,例如,可以根据用户对网站的喜好程度或关注程度设置不同的网站的权重,也就是说,设置不同的网络地址的权重,对于用户喜好程度越高或关注程度越高的网络地址,其所对应的权重可以设置得越高。根据不同网络地址的权重对各特征描述数据的权重进行调整,综合考虑了用户对网站的喜好程度或关注程度对量化结果的影响,能够使得最终得到的各特征维度的量化值更加准确。
根据预先确定的针对不同网络地址设置的权重,可以进一步对来自于不同网络地址的特征描述数据的权重进行调整,也即是说,根据各个特征描述数据来自的不同的网络地址所对应的权重,对各个特征描述数据的权重进行调整,具体而言,可以根据各个特征描述数据的不同网络地址所对应的权重之间的比例/比值关系,调整各个特征描述数据的权重。
在步骤S120处,根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重。
基于上述的实施例,步骤S120可以进一步包括以下的步骤:
如图6所示,为根据本发明另一个实施例的根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤(步骤S120)的流程图。
步骤S610,根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配。
具体而言,可以根据该预先建立的不同特征描述数据与不同特征维度之间的对应关系,将获得的与该网络对象对应的不同的特征描述数据分别与特征维度进行匹配。更具体而言,可以确定该网络对象的特征描述数据集合中在该预先建立的特征描述数据与不同特征维度时间的对应关系中存在的特征描述数据,并将存在的特征描述数据分别与该对应关系中的各特征维度进行匹配,若一个特征描述数据在预先建立的特征描述数据与不同特征维度时间的对应关系中存在,则根据该对应关系确定与该特征描述数据具有对应关系的一个或多个特征维度,并记录该网络对象对该一个或多个特征维度分别命中一次,从而确定该网络对象对应的不同的特征描述数据对各特征维度的命中次数。
步骤S620,根据匹配结果确定对各特征维度的命中次数的比例。
也就是说,根据该网络对象对应的不同的特征描述数据对各特征维度的命中次数,确定该网络对象对各特征维度的命中次数比例。
步骤S630,根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整。
在前面的步骤S530或步骤S530~S540中,已经将重复的特征描述数据删除生成带权重的特征描述数据集合,也就是说,该网络对象的特征描述数据集合中不存在重复的数据,并且每个特征描述数据都具有对应的权重,因此,可以根据不同特征描述数据对应的权重,将对特征维度的命中次数的比例进行调整。具体而言,可以根据各个不同特征描述数据的权重之间的比例关系/比值关系,调整对各个特征维度的命中次数比例。
步骤S640,根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
也就是说,根据调整后的对各特征维度的命中次数比例,确定该网络对象对应的各特征维度的权重。具体地,可以根据调整后的对各特征维度命中次数比例的从大到小的顺序,以权重依次递减的方式确定各特征维度的权重,或者可以直接将调整后各特征维度的命中次数比例作为各特征维度的权重。并且其中,如果该网络对象对应的特征维度包含多个特征维度类别,则可以按照特征维度类别分别确定各个特征维度在各自所属的类别中的权重。
在步骤S130处,依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
具体地,可以获取与该网络对象相对应的分值描述数据,并将与该网络对象相对应的分值描述数据与各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。也就是说,以该网络对象的分值描述数据为基础,将该网络对象相对应的分值描述数据分别与该网络对象的各特征维度权重相乘,得到的结果分别作为各特征维度的量化值。
通过上述步骤S110~S130,能够得到网络对象各个特征维度的量化值,从而更直观的反应网络对象的某个维度的特征。同时,可以根据不同的网络对象类型而对特征维度进行增加或减少,并进而对描述数据与特征维度之间的对应关系随时进行调整。因此,针对不同网络对象的相关信息在整合后的量化数据的结构上是非常富有弹性并容易扩展的,为提供更多样化的展示方式提供了可能。
根据本发明的一个实施例,该对网络对象进行多特征维度量化的方法还可以进一步包括根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示的步骤。
具体而言,可以根据得到的该网络对象的各特征维度的量化值,从中选取部分较优的特征维度(例如,量化值较高的特征维度)进行展示,例如,对于某部电影,其“情节”维度的分值较高,则可以对“情节”维度进行突出展示,例如,以文字、图像等进行说明。
根据本发明的另一个实施例,该对网络对象进行多特征维度量化的方法还可以进一步包括以下步骤:
首先,从所述与该网络对象相对应的各特征维度中选取至少部分特征维度。例如,若该网络对象对应的各特征维度包括一个或多个特征维度类别,则可以从中选取至少一个特征维度类别,即,选取至少一个特征维度类别所包含的各个特征维度。
然后,根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
根据本发明的一个实施例,可以根据选取的特征维度的数量,生成相应数量的从同一个原点发出但方向不同的射线,再根据选取的各个特征维度对应的量化值,确定各个量化值在对应的射线上的位置,并连接相邻的射线之间量化值对应的位置,生成展示该网络对象的各特征维度的量化值的多维图。其中,相邻射线之间的夹角相等,以使得生成的多维图更加直观的反映出各个量化值的大小关系。
具体而言,可以根据单位长度与量化值的对应关系,确定各个特征维度的量化值在对应的射线上相应的位置,再连接相邻的射线之间量化值对应的位置,以生成展示该网络对象的各特征维度的量化值的多维图。其中,单位长度与量化值的对应关系可以预先设置,例如,如果量化值为分值,则可以设置单位长度对应的分值。
更具体而言,可以根据单位长度与量化值的对应关系,确定各个特征维度的量化值对应的单位长度的数量,即,确定各个特征维度的量化值分别对应多少个单位长度,然后,根据确定的各个特征维度的量化值对应的单位长度的数量,确定各个量化值在对应的射线上的位置。可选地,还可以在每条射线上设置多个点,其中,在每条射线上,每两个相邻的点之间距离相等,也即是说,每条射线上相邻两个点之间的线段长度均相同,且每两个相邻的点之间的线段的长度均等于所述单位长度。根据确定的各个特征维度的量化值对应的单位长度的数量,即可确定各个特征维度的量化值在其对应的射线上所对应的点,该对应的点即是该特征维度的量化值在对应的射线上的位置。确定各个量化值在对应的射线上的位置后,连接相邻射线之间的量化值所对应的位置,即可生成展示该网络对象的各特征维度的量化值的多维图。其中,连接相邻射线之间的量化值所对应的位置后可以合围成一个多边形,多边形的边的数量与选取的特征维度的数量相同,例如,若选取的特征维度数量为N,则生成的射线数量为N,若将每两条相邻射线上量化值所对应的位置连接起来可以围合形成一个N边形。通过该合围成的多边形,能够反应网络对象的各个特征维度的特征。
可选地,可以设置连接起来围合形成的区域用前景色进行展示,也就是说,将N条射线上量化值所对应的位置连线所围合形成的N边形用前景色进行显示。通过这种显示方式,可以鲜明的表示出各个特征维度量化值的大小关系,并反映出该网络对象某个维度的特征。图8是根据本发明一个实施例的对一部电影的各个特征维度的量化值以多维图的方式进行展示时的展示界面示例图,从图8中可以看出,该电影的情节演绎较为突出。
根据本发明的一个实施例,还可以在生成的每条射线中选取M个单位长度,将相邻射线之间的相同单位长度对应的位置连接起来,并用背景色进行展示。
具体地,若生成的射线数量为N,则在N条射线的每条射线上分别选取M个单位长度,从生成的射线共同的原点起,每隔一个单位长度,将每两条相邻射线上相同单位长度对应的位置连接起来,形成由内至外面积逐渐增大的M个N边形(边的数量与选取的特征维度的数量相同),该M个N边形,形成一个网状结构的图形,可以将形成的该图形用背景色显示,以使得用户能够更加直观的判断出各特征维度对应量化值的大小关系,从而获知该网络对象的较为突出的特征维度。
根据本发明的一个实施例,还可以在生成的射线的侧方(包括上、下、左、右侧),展示有多个图形,其中每个图形对应一个未由所述射线表征的特征维度。也就是说,将未用射线展示的特征维度,用其他图形进行展示,其中每个图形对应一个特征维度。从而使用户还能了解该网络对象其他的特征维度。
可选地,每个图形对应的特征维度可以为该特征维度所属的特征维度类别中较优的特征维度,即,每个图形对应展示一个特征维度类别中较优的维度,例如,可以如图8所示,在生成的射线下方所展示的图形中,“天秤座最爱”的图形表示在以星座作为特征维度的维度类别中,天秤座的用户可能为最喜欢该电影的用户,“男性观众居多”的图形表示在以性别作为特征维度的维度类别中,喜欢该电影的用户中可能以男性观众居多。这种方式能够体现出网络对象在其他各个不同维度类别中的较为突出的维度,从而能够从多种不同角度,为用户提供选择网络对象的决策信息。
基于此,还可以根据接收到的控制指令,将所述多个图形沿排列方向在展示界面中滚动展示。也就是说,根据接收到的控制指令,在展示界面中将多个展示其他特征维度的图形沿排列的方向(例如从上到下方向或从左到右方向)进行滚动显示,其中,接收到的控制指令,可以为用户输入的指令,也可以为预先设置的控制指令,例如,预先设置当用户选择查看网络对象的多特征维度展示图形时,即进行滚动显示,或者,每隔预定时间进行一次滚动显示。
通过上述的多维图的展示方式对网络对象各特征维度的量化值进行展示,能够直观地反应网络对象的各个特征维度的特征,从而作为用户获取网络对象的决策信息。
本发明还提供了一种对网络对象进行多特征维度量化的装置。如图7所示,图7是根据本发明一个实施例的对网络对象进行多特征维度量化的装置700的结构框图。
装置700包括:获得模块710、匹配模块720以及量化模块730。
获得模块710可以用于确定一网络对象,获得与该网络对象相对应的特征描述数据。匹配模块720可以用于根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述与该网络对象对应的特征描述数据与特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重。量化模块730可以用于依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
在根据本发明的装置700中,所述获得模块710可以包括:确定模块和获取模块。
其中,确定模块可以用于根据所述网络对象的类型,预先确定一个或多个网络搜索地址。获取模块可以用于通过该网络搜索地址获取与该网络对象相对应的特征描述数据。
根据本发明的另一个实施例,所述获得模块710可以包括:第一重合度匹配模块和第一生成模块。
其中,第一重合度匹配模块可以用于将来自于不同网络地址的特征描述数据进行重合度匹配。第一生成模块可以用于将重合度低于阈值的描述数据删除,生成最终的特征描述数据集合。
根据本发明的一个实施例,所述匹配模块720可以包括:第一匹配模块、第一比例确定模块以及第一权重获得模块。
具体地,第一匹配模块可以用于根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配。第一比例确定模块可以用于根据匹配结果确定对各特征维度的命中次数的比例。第一权重获得模块可以用于根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
根据本发明的另一个实施例,所述获得模块710可以包括:第二重合度匹配模块权重分配模块和第二生成模块。
其中,第二重合度匹配模块可以用于将来自于不同网络地址的特征描述数据进行重合度匹配。权重分配模块可以用于根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高。第二生成模块可以用于将重复的特征描述数据删除,生成带权重的特征描述数据集合。
进一步地,在根据本发明的装置700中,所述获得模块710还可以进一步包括:权重调整模块,该模块可以用于根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
根据本发明的另一个实施例,所述匹配模块可以包括:第二匹配模块、第二比例确定模块、比例调整模块以及第二权重获得模块。
其中,第二匹配模块可以用于根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配。第二比例确定模块可以用于根据匹配结果确定对各特征维度的命中次数的比例。比例调整模块可以用于根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整。第二权重获得模块,用于根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
在根据本发明的装置700中,所述特征维度是根据所述网络对象的类型确定的。
在根据本发明的装置700中,所述量化模块730可以包括:分值获取模块和量化处理模块。
其中,分值获取模块可以用于获取与该网络对象对应的分值描述数据;量化处理模块可以用于将与该网络对象相对应的分值描述数据与所述各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
分值获取模块可以进一步用于获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。
在根据本发明的装置700中,所述特征描述数据可以包括标签数据、评论数据,和/或关键字数据。
在根据本发明的装置700中,还可以进一步包括:选取模块和第一展示模块。
具体地,选取模块可以用于从所述与该网络对象相对应的各特征维度中选取至少部分特征维度。第一展示模块可以用于根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
在根据本发明的装置700中,还可以进一步包括:第二展示模块,用于根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示。
在根据本发明的装置700中,第二展示模块可以进一步用于:设置连接起来围合形成的区域用前景色进行展示。
在根据本发明的装置700中,第二展示模块可以进一步包括:选取子模块与连接及展示子模块。其中,选取子模块可以用于在生成的每条射线中选取M个单位长度。连接及展示模块可以用于将相邻射线之间的相同单位长度对应的位置连接起来,并用背景色进行展示。
在根据本发明的装置700中,所述相邻射线之间的夹角相同。
在根据本发明的装置700中,第二展示模块还可以进一步包括:图形展示子模块,用于在生成的射线的侧方,展示有多个图形,其中每个图形对应一个未由所述射线表征的特征维度。
根据本发明的一个实施例,所述图形展示子模块还可以进一步用于:根据接收到的控制指令,所述多个图形沿排列方向在展示界面中滚动展示。
以上描述的对网络对象进行多特征维度量化的装置与之前描述的对网络对象进行多特征维度量化的方法的处理是对应的,因此,关于更详细的技术细节,可以参见之前描述的方法。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的对网络对象进行多特征维度量化的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (26)
1.一种对网络对象进行多特征维度量化的方法,包括:
确定一网络对象,获得与该网络对象相对应的特征描述数据;
根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述该网络对象对应的特征描述数据与所述该网络对象对应的特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重;
依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
2.如权利要求1所述的方法,其特征在于,获得与该网络对象相对应的特征描述数据的步骤,包括:
根据所述网络对象的类型,预先确定一个或多个网络搜索地址;
通过该网络搜索地址获取与该网络对象相对应的特征描述数据。
3.如权利要求1所述的方法,其特征在于,获得与该网络对象相对应的特征描述数据的步骤,包括:
将来自于不同网络地址的特征描述数据进行重合度匹配;
将重合度低于阈值的描述数据删除,生成最终的特征描述数据集合。
4.如权利要求1所述的方法,其特征在于,获得与该网络对象相对应的特征描述数据的步骤,包括:
将来自于不同网络地址的特征描述数据进行重合度匹配;
根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高;
将重复的特征描述数据删除,生成带权重的特征描述数据集合。
5.如权利要求4所述的方法,其特征在于,获得与该网络对象相对应的特征描述数据的步骤,进一步包括:
根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
6.如权利要求1所述的方法,其特征在于,所述特征维度是根据所述网络对象的类型确定的。
7.如权利要求1或3所述的方法,其特征在于,
根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述该网络对象对应的特征描述数据与所述该网络对象对应的特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤,包括:
根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配;
根据匹配结果确定对各特征维度的命中次数的比例;
根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
8.如权利要求4所述的方法,其特征在于,
根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述该网络对象对应的特征描述数据与所述该网络对象对应的特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重的步骤,包括:
根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配;
根据匹配结果确定对各特征维度的命中次数的比例;
根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整;
根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
9.如权利要求1所述的方法,其特征在于,依据所述各特征维度权重,得到该网络对象的各特征维度的量化值的步骤,包括:
获取与该网络对象对应的分值描述数据;
将与该网络对象相对应的分值描述数据与所述各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
10.如权利要求9所述的方法,其特征在于,获取与该网络对象对应的分值描述数据的步骤,包括:
获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。
11.如权利要求1所述的方法,其特征在于,所述描述数据包括标签数据、评论数据,和/或关键字数据。
12.如权利要求1所述的方法,其特征在于,进一步包括:
从所述与该网络对象相对应的各特征维度中选取至少部分特征维度;
根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
13.如权利要求1所述的方法,其特征在于,进一步包括:
根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示。
14.一种对网络对象进行多特征维度量化的装置,包括:
获得模块,用于确定一网络对象,获得与该网络对象相对应的特征描述数据;
匹配模块,用于根据预先建立的不同特征描述数据与不同特征维度之间的对应关系,将所述该网络对象对应的特征描述数据与所述该网络对象对应的特征维度进行匹配,并根据匹配结果获得与该网络对象对应的各特征维度权重;
量化模块,用于依据所述各特征维度权重,得到该网络对象的各特征维度的量化值。
15.如权利要求14所述的装置,其特征在于,所述获得模块包括:
确定模块,用于根据所述网络对象的类型,预先确定一个或多个网络搜索地址;
获取模块,用于通过该网络搜索地址获取与该网络对象相对应的特征描述数据。
16.如权利要求14所述的装置,其特征在于,所述获得模块包括:
第一重合度匹配模块,用于将来自于不同网络地址的特征描述数据进行重合度匹配;
第一生成模块,用于将重合度低于阈值的描述数据删除,生成最终的特征描述数据集合。
17.如权利要求14所述的装置,其特征在于,所述获得模块包括:
第二重合度匹配模块,用于将来自于不同网络地址的特征描述数据进行重合度匹配;
权重分配模块,用于根据重合度的高低为所述特征描述数据分配相应的权重,重合度越高则权重越高;
第二生成模块,用于将重复的特征描述数据删除,生成带权重的特征描述数据集合。
18.如权利要求17所述的装置,其特征在于,所述获得模块进一步包括:
权重调整模块,用于根据预先确定的针对不同网络地址设置的权重,进一步对来自于不同网络地址的特征描述数据的权重进行调整。
19.如权利要求14所述的装置,其特征在于,所述特征维度是根据所述网络对象的类型确定的。
20.如权利要求14或16所述的装置,其特征在于,所述匹配模块包括:
第一匹配模块,用于根据所述对应关系,将全部特征描述数据分别与特征维度进行匹配,如果有重复的特征描述数据则进行重复匹配;
第一比例确定模块,用于根据匹配结果确定对各特征维度的命中次数的比例;
第一权重获得模块,用于根据所述命中次数的比例,获得与该网络对象对应的各特征维度权重。
21.如权利要求17所述的装置,其特征在于,所述匹配模块包括:
第二匹配模块,用于根据所述对应关系,将不同的特征描述数据分别与特征维度进行匹配;
第二比例确定模块,用于根据匹配结果确定对各特征维度的命中次数的比例;
比例调整模块,用于根据不同特征描述数据的权重,将对特征维度的命中次数比例进行调整;
第二权重获得模块,用于根据调整后的命中次数的比例,获得与该网络对象对应的各特征维度权重。
22.如权利要求14所述的装置,其特征在于,所述量化模块,包括:
分值获取模块,用于获取与该网络对象对应的分值描述数据;
量化处理模块,用于将与该网络对象相对应的分值描述数据与所述各特征维度权重分别相乘,得到该网络对象的各特征维度的量化值。
23.如权利要求22所述的装置,其特征在于,所述分值获取模块,进一步用于:
获取来自于不同网络地址的与该网络对象对应的分值描述数据,并根据预先确定的针对不同网络地址设置的权重,将来自于不同网络地址的分值描述数据进行加权求和,作为最终的分值描述数据。
24.如权利要求14所述的装置,其特征在于,所述描述数据包括标签数据、评论数据,和/或关键字数据。
25.如权利要求14所述的装置,其特征在于,进一步包括:
选取模块,用于从所述与该网络对象相对应的各特征维度中选取至少部分特征维度;
第一展示模块,用于根据得到的与该选取的特征维度对应的量化值,以多维图的方式将所述量化值进行展示。
26.如权利要求14所述的装置,其特征在于,进一步包括:
第二展示模块,用于根据得到的该网络对象的各特征维度的量化值,从中选取至少部分特征维度进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410564598.7A CN104331429B (zh) | 2014-10-21 | 2014-10-21 | 对网络对象进行多特征维度量化的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410564598.7A CN104331429B (zh) | 2014-10-21 | 2014-10-21 | 对网络对象进行多特征维度量化的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104331429A CN104331429A (zh) | 2015-02-04 |
CN104331429B true CN104331429B (zh) | 2018-04-27 |
Family
ID=52406156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410564598.7A Active CN104331429B (zh) | 2014-10-21 | 2014-10-21 | 对网络对象进行多特征维度量化的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104331429B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106033457B (zh) * | 2015-03-18 | 2019-10-18 | 阿里巴巴集团控股有限公司 | 一种确定水果目标属性的属性信息的方法与装置 |
CN106897208A (zh) * | 2015-12-18 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 一种应用软件用户体验的量化方法和装置 |
CN107749006A (zh) * | 2017-11-01 | 2018-03-02 | 广州爱九游信息技术有限公司 | 游戏评估方法、装置及设备 |
CN111177515B (zh) * | 2019-12-25 | 2023-07-21 | 中国平安财产保险股份有限公司 | 产品标签匹配方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211339A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 基于用户行为的智能网页分类器 |
WO2010044780A1 (en) * | 2008-10-14 | 2010-04-22 | Hewlett-Packard Development Company, L.P. | Dynamic content sorting using tags |
CN102902790A (zh) * | 2012-09-29 | 2013-01-30 | 北京奇虎科技有限公司 | 网页分类***及方法 |
CN102955813A (zh) * | 2011-08-29 | 2013-03-06 | ***通信集团四川有限公司 | 一种信息搜索方法和*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101551806B (zh) * | 2008-04-03 | 2012-04-18 | 北京搜狗科技发展有限公司 | 一种个性化网址导航的方法和*** |
CN103886090B (zh) * | 2014-03-31 | 2018-01-02 | 北京搜狗科技发展有限公司 | 基于用户喜好的内容推荐方法及装置 |
-
2014
- 2014-10-21 CN CN201410564598.7A patent/CN104331429B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211339A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 基于用户行为的智能网页分类器 |
WO2010044780A1 (en) * | 2008-10-14 | 2010-04-22 | Hewlett-Packard Development Company, L.P. | Dynamic content sorting using tags |
CN102955813A (zh) * | 2011-08-29 | 2013-03-06 | ***通信集团四川有限公司 | 一种信息搜索方法和*** |
CN102902790A (zh) * | 2012-09-29 | 2013-01-30 | 北京奇虎科技有限公司 | 网页分类***及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104331429A (zh) | 2015-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020094A (zh) | 一种搜索结果的展示方法和相关装置 | |
CN102306171B (zh) | 一种用于提供网络访问建议和网络搜索建议的方法与设备 | |
CN107423355A (zh) | 信息推荐方法及装置、电子设备 | |
CN102968413B (zh) | 一种用于提供搜索结果的方法与设备 | |
CN107229666B (zh) | 一种基于推荐***的兴趣探索方法及装置 | |
CN104331429B (zh) | 对网络对象进行多特征维度量化的方法及装置 | |
CN106688215A (zh) | 针对内容效能优化的自动点击类型选择 | |
CN102354315A (zh) | 一种网址导航页面生成方法和装置 | |
CN102831117B (zh) | 选择字体、字体的确定、推荐、生成方法及其设备 | |
CN105874449A (zh) | 用于提取和生成用于显示内容的图像的***和方法 | |
CN106484766A (zh) | 基于人工智能的搜索方法和装置 | |
CN110267097A (zh) | 基于分类特征的视频推送方法、装置及电子设备 | |
CN103514282A (zh) | 一种视频搜索结果展示方法及装置 | |
CN105224657B (zh) | 一种基于搜索引擎的信息推荐方法及电子设备 | |
CN110110201A (zh) | 一种内容推荐方法和*** | |
CN103473282B (zh) | 一种生成热点内容页面的装置和方法 | |
CN106354855A (zh) | 一种推荐方法及*** | |
CN104699844B (zh) | 为广告确定视频标签的方法及装置 | |
CN104199865B (zh) | 提供内容提供方的定制结果的搜索方法、客户端和*** | |
CN102073670A (zh) | 一种用于调试在线网页模板的方法、设备及*** | |
CN110278447A (zh) | 基于连续特征的视频推送方法、装置及电子设备 | |
CN105139233A (zh) | 广告投放方法、装置及*** | |
CN109075987A (zh) | 优化数字组件分析*** | |
CN110688578A (zh) | 锁屏壁纸的推荐方法、装置及电子设备 | |
CN109509051A (zh) | 一种物品推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220803 Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015 Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park) Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd. Patentee before: Qizhi software (Beijing) Co.,Ltd. |
|
TR01 | Transfer of patent right |