CN104484372A - 一种业务对象投放信息的检测方法和装置 - Google Patents
一种业务对象投放信息的检测方法和装置 Download PDFInfo
- Publication number
- CN104484372A CN104484372A CN201410737885.3A CN201410737885A CN104484372A CN 104484372 A CN104484372 A CN 104484372A CN 201410737885 A CN201410737885 A CN 201410737885A CN 104484372 A CN104484372 A CN 104484372A
- Authority
- CN
- China
- Prior art keywords
- business object
- putting person
- cluster
- information
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种业务对象投放信息的检测方法和装置。其中,方法包括:预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;接收携带有投放者标识的检测请求;依据业务对象投放信息的检测模型,对投放者标识对应的投放者上传的业务对象投放信息进行检测。本发明的业务对象投放信息的检测模型结合大量的历史信息分析生成,因此能够更加客观、准确地对投放者上传的业务对象投放信息进行检测,并且根据该检测模型进行检测时无需再对检测的投放者的投放效果进行分析统计,检测过程更加简便,提高了检测效率。
Description
技术领域
本发明涉及网络技术领域,具体涉及一种业务对象投放信息的检测方法和装置。
背景技术
随着互联网的不断发展,网络用户越来越多,因此投放者越来越多地将业务对象投放到互联网业务对象投放平台上,以将业务对象推荐给这些网络用户,使得用户可以实时地了解到最新的信息。
投放者通过购买关键词并出价参与竞争以尽可能多的覆盖流量、增加点击量,依据业务的结构、地域、时间等需求制定业务对象投放信息,并将该业务对象投放信息上传至业务对象投放平台,业务对象投放平台根据该业务对象投放信息进行业务对象的投放。
业务对象投放信息的优劣情况会对投放者的覆盖流量、点击量等有直接的影响,如果业务对象投放信息质量较差,则将会导致投放者投放业务对象的效果较差,影响收益。特别是对于一些经验少的投放者,由于其对制定业务对象投放信息及关键词竞价等方面缺乏经验,因此常常导致竞价排名靠后的情况或者过高竞价扰乱竞价排名环境的情况。因此,如果能够对投放者上传的业务对象投放信息进行检测,则对提醒投放者业务对象投放信息存在的问题及制定更优化的业务对象投放信息有很大意义。
目前对投放者上传的业务对象投放信息进行检测的方法,主要是单独对该投放者上传的业务对象投放信息的历史投放效果进行分析,并生成对应的分析报告,如分别分析不同地域、不同兴趣、不同关键词的历史投放效果,从而生成地域报告、兴趣报告、关键词报告等。
但是,采用上述单独对该投放者上传的业务对象投放信息的历史投放效果进行分析的业务对象投放信息检测方式,检测结果不准确,检测效率较低,无法满足用户的需求。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的业务对象投放信息的检测方法和相应的业务对象投放信息的检测装置。
依据本发明的一个方面,提供了一种业务对象投放信息的检测方法,包括:
预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收携带有投放者标识的检测请求;
依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
根据本发明的另一方面,提供了一种业务对象投放信息的检测装置,包括:
生成模块,适于预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收模块,适于接收携带有投放者标识的检测请求;
检测模块,适于依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
根据本发明的业务对象投放信息的检测方案,预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型,后续在接收到携带有投放者标识的检测请求后,即可依据生成的业务对象投放信息的检测模型对投放者标识对应的投放者上传的业务对象投放信息进行检测。上述业务对象投放信息的检测模型结合大量的历史信息分析生成,因此能够更加客观、准确地对投放者上传的业务对象投放信息进行检测,并且根据该检测模型进行检测时无需再对检测的投放者的投放效果进行分析统计,检测过程更加简便,提高了检测效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一中的一种业务对象投放信息的检测方法的步骤流程图;
图2示出了本发明实施例二中的一种业务对象投放信息的检测方法的步骤流程图;
图3示出了本发明实施例三中的一种业务对象投放信息的检测装置的结构框图;
图4示出了本发明实施例四中的一种业务对象投放信息的检测装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一:
参照图1,示出了本发明实施例一中的一种业务对象投放信息的检测方法的步骤流程图。该方法可以包括以下步骤:
步骤100,预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型。
本发明实施例中,首先可以获取基于多个历史上传业务对象投放信息的投放者的属性信息,然后基于这些属性信息生成业务对象投放信息的检测模型,后续即可根据该业务对象投放信息的检测模型对投放者上传的业务对象投放信息进行检测。
步骤102,接收携带有投放者标识的检测请求。
当某个投放者请求检测其上传的业务对象投放信息时,可以执行相应操作,这些操作可以触发生成检测请求,该检测请求中可以包括请求检测的投放者的投放者标识。
步骤104,依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
在接收到上述携带有投放者标识的检测请求后,即可依据预先生成的业务对象投放信息的检测模型,对该投放者标识对应的投放者上传的业务对象投放信息进行检测,从而得到该业务对象投放信息的评分值,为定位业务对象投放信息存在的问题及制定更优化的业务对象投放信息提供依据。
本发明实施例中,业务对象投放信息的检测模型结合大量的历史信息分析生成,因此能够更加客观、准确地对投放者上传的业务对象投放信息进行检测,并且根据该检测模型进行检测时无需再对检测的投放者的投放效果进行分析统计,检测过程更加简便,提高了检测效率。
实施例二:
参照图2,示出了本发明实施例二中的一种业务对象投放信息的检测方法的步骤流程图。该方法可以包括以下步骤:
步骤200,预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型。
投放者在需要向网络用户推荐业务对象时,首先制定推广计划、划分推广组、购买关键词、设置创意等,然后根据这些因素生成业务对象投放信息,最后登录业务对象投放平台,将该业务对象投放信息上传至业务对象投放平台中。后续业务对象投放平台即可根据该业务对象投放信息进行业务对象的投放。
本发明实施例中,可以基于多个历史上传业务对象投放信息的投放者的属性信息生成业务对象投放信息的检测模型,因此该检测模型结合了大量投放者的属性信息的特点,能够更客观地对业务对象投放信息进行检测。
在本发明的一种优选实施例中,该步骤200可以包括以下子步骤a1~子步骤a3:
子步骤a1,预先采集浏览器中的多条展示日志和多条点击日志;
当用户在浏览器中浏览网页时,输入关键词进行搜索后,搜索引擎将参考不同业务对象对该关键词的竞价等信息对该关键词对应的业务对象进行排序,并决定是否推左,然后将这些业务对象展示在搜索结果网页中。展示网页时,浏览器中将生成展示日志,展示日志描述展示网页的行为。该展示日志中可以包括:展示的业务对象的标识、展示的业务对象属于的投放者的标识、展示的业务对象是否被推左的信息、展示的业务对象的质量分数(通过搜索引擎计算得到)等展示的业务对象相关信息,当然展示日志中还可以包括展示的其他信息,例如展示的关键词的相关信息、展示的图片的相关信息等等。
当用户点击网页中展示的业务对象时,浏览器中将生成点击日志,点击日志描述点击业务对象的行为。该点击日志中可以包括:点击的业务对象的标识、所述点击的业务对象属于的投放者的标识、所述点击的业务对象是否被推左的信息、所述点击的业务对象的消耗值等点击的业务对象相关信息。
子步骤a2,根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息;
其中,投放者的属性信息可以包括:浏览量,和/或左侧浏览量,和/或点击量,和/或左侧点击量,和/或质量分数,和/或消耗值,和/或点击率,即投放者的属性信息可以包括浏览量、左侧浏览量、点击量、左侧点击量、质量分数、消耗值、点击率中的任意一个或多个。
因此,该子步骤a2可以包括以下子步骤:
步骤a21,统计所有展示日志中属于同一个投放者的、展示的业务对象的数量,将该数量作为所述投放者的浏览量;和/或,
步骤a22,统计所有展示日志中属于同一个投放者、并且被推左的展示的业务对象的数量,将该数量作为所述投放者的左侧浏览量;和/或,
步骤a23,统计所有点击日志中属于同一个投放者的、点击的业务对象的数量,将该数量作为所述投放者的点击量;和/或,
步骤a24,统计所有点击日志中属于同一个投放者、并且被推左的点击的业务对象的数量,将该数量作为所述投放者的左侧点击量;和/或,
步骤a25,统计所有展示日志中同一个展示的业务对象的数量,将该数量作为所述业务对象的浏览量;统计所有点击日志中同一个点击的业务对象的数量,将该数量作为所述业务对象的点击量;分别计算每个业务对象的点击量与浏览量的商值,将所述商值作为所述业务对象的点击率;计算属于同一个投放者的所有业务对象的点击率的平均值,作为所述投放者的点击率;和/或,
步骤a26,计算所有展示日志中属于同一个投放者的、展示的业务对象的质量分数的平均值,将该平均值作为所述投放者的质量分数;和/或,
步骤a27,计算所有点击日志中属于同一个投放者的、点击的业务对象的消耗值的总和,将该总和作为所述投放者的消耗值。
根据投放者的属性信息包括的内容,从上述子步骤a21~子步骤a27中选择对应的子步骤执行。例如,当投放者的属性信息包括浏览量、左侧浏览量、点击量和左侧点击量时,则执行步骤a21~子步骤a24,等等。再执行上述步骤a21~子步骤a27中的全部或部分子步骤时,对于各个子步骤的执行顺序并不加以限制,可以先后执行,也可以同时执行。
在分别统计每个历史上传业务对象投放信息的投放者的属性信息之后,还可以将这些投放者的属性信息写入数据库,以供后续查询使用。
子步骤a3,基于所述多个投放者的属性信息生成业务对象投放信息的检测模型。
在获取到上述各个投放者的属性信息之后,即可基于上述多个投放者的属性信息生成业务对象投放信息的检测模型。
在本发明的一种优选实施例中,该子步骤a3可以包括以下子步骤a31~子步骤a34:
步骤a31,针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;
统计了多个投放者的属性信息,每个投放者又包括一个或多个属性信息,因此针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值。例如,对于其中一个投放者的浏览量,计算该投放者的浏览量在所有投放者的浏览量中的排名评分值;对于其中一个投放者的点击量,计算该投放者的点击量在所有投放者的点击量中的排名评分值。计算之后,即可得到每个投放者的每个属性信息的排名评分值。
其中,排名评分值可以为标准化的百分制,可以按照当前属性信息的排名所占投放者总个数的比例计算该排名评分值。例如,当前属性信息的排名为100,投放者的总个数为1000,则当前属性信息的排名所占投放者总个数的比例为10%,当前属性信息的排名评分值为90分。
步骤a32,以一个投放者的所有属性信息的排名评分值作为一个对象,对所有对象进行聚类;
以一个投放者的所有属性信息的排名评分值作为一个对象,每个对象可以对应一个特征向量,该特征向量为由该投放者的所有属性信息的排名评分值组成的特征向量。
该子步骤a32可以包括以下子步骤a321~子步骤a326:
子步骤a321,对所有对象进行层次聚类,确定目标数量的初始聚类;
该子步骤a321可以包括以下子步骤a3211~子步骤a3215:
子步骤a3211,以一个对象作为一个初始聚类,分别计算每两个初始聚类之间的距离;
计算两个初始聚类之间的距离,即为计算两个初始聚类对应的特征向量之间的距离。
如果一个对象为一个初始聚类,则每两个初始聚类之间的距离即为该两个对象对应的特征向量之间的距离。本发明实施例中,计算两个特征向量之间的距离可以为计算两个特征向量之间的欧氏距离、曼哈顿距离、余弦相似度、汉明距离、明氏距离等。欧氏距离源自欧氏空间中两点间的距离公式,两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离为:也可以用表示成向量运算的形式:曼哈顿距离也称为城市街区距离,两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的曼哈顿距离为:对于其余距离的计算过程,本发明实施例在此不再一一论述。
子步骤a3212,将距离最小的两个初始聚类合并为一个初始聚类;
子步骤a3213,利用以下公式计算所述初始聚类对应的B(k)值:
其中,interDis为每两个初始聚类之间的距离,intraDis为初始聚类内部每两个对象之间的距离之和,k为初始聚类的数量;
通过该子步骤a3213即可计算得出每个初始聚类对应的B(k)值。
子步骤a3214,计算合并后的初始聚类与其他每个初始聚类之间的距离,并返回所述将距离最小的两个初始聚类合并为一个初始聚类的步骤,直至初始聚类的个数为1为止;
如果一个初始聚类中包括至少两个对象,则在计算该初始聚类与其他初始聚类之间的距离时,该初始聚类对应的特征向量为该初始聚类的中心点,即为该初始聚类中包括的所有对象对应的特征向量的平均值。
经过该子步骤a3214后,即可在每次合并后,针对当前的初始聚类的情况得到一个对应的B(k)值。
子步骤a3215,查找所有B(k)值中的最小B(k)值,将所述最小B(k)值对应的k个初始聚类确定为目标数量的初始聚类。
子步骤a322,随机选取每个初始聚类的质心;
针对每个初始聚类,从该初始聚类包括的对象中随机选取该初始聚类的质心,该质心即为随机选取的对象对应的特征向量。
子步骤a323,针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中;
当前对象与质心之间的距离,即为当前对象对应的特征向量与质心之间的距离。例如,确定的目标数量的初始聚类为6个,则对应有6个质心,分别计算当前对象与上述6个质心之间的距离,将当前对象归类到与该对象之间距离最小的质心对应的聚类中。
子步骤a324,判断得到的每个质心对应的聚类是否满足收敛条件;若否,则执行子步骤a325;若是,则执行子步骤a326;
该子步骤a324可以包括以下子步骤a3241~子步骤a3243:
子步骤a3241,利用以下公式计算所述得到的每个质心对应的聚类所对应的A值:
其中,I为聚类的数量,Ci为第i个聚类中对象的组合,xj为第i个聚类中的第j个对象,center(i)为第i个聚类的中心,第i个聚类的中心为第i个聚类中的所有对象的平均值;
dist(center(i),xj)为第i个聚类的中心center(i)与第i个聚类中的第j个对象xj之间的距离,即为第i个聚类中所有对象对应的特征向量的平均值与第i个聚类中的第j个对象对应的特征向量之间的距离。
子步骤a3242,获取前预设次数计算的A值,并将本次计算的A值与前预设次数计算的A值中每两个相邻的A值进行比较;
子步骤a3243,如果每两个相邻的A值的变化幅度均在预设范围内,则确定得到的每个质心对应的聚类满足收敛条件。
其中,对于预设次数和预设范围的具体数值,本发明实施例并不加以限制。
子步骤a325,重新计算每个初始聚类的质心,并返回子步骤a323;
如果子步骤a324中判断出不满足收敛条件,则重新计算每个初始聚类的质心。此处重新计算初始聚类的质心可以为计算该初始聚类中包括的所有对象的平均值,即包括的所有对象对应的特征向量的平均值。然后返回执行子步骤a323。
子步骤a326,确定得到的每个质心对应的聚类为聚类结果。
子步骤a33,针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数;
经过上述子步骤a32,得到每个质心对应的聚类,然后针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数。
该子步骤a33可以包括以下子步骤a331~子步骤a332:
子步骤a331,针对每个聚类,分别确定当前聚类中的每个对象对应的以下公式:
Yn=β0+β1X1+β2X2+…+βmXm+e
其中,β0~βm为回归参数,X1~Xm分别为第n个对象的属性信息的排名评分值,Yn为第n个对象的消耗值的排名评分值,m为第n个对象的属性信息的数量,e为随机误差;
子步骤a332,根据当前聚类中的每个对象对应的公式组成的方程组计算当前聚类对应的回归参数β0~βm的值。
当前聚类中的每个对象都对应有一个上述公式,针对当前聚类,根据这些方式组成的方程组即可计算出其中的β0~βm的值,在计算过程中,随机误差e即可被删除。
根据该子步骤a33,即可确定出每个聚类对应的回归参数。
本发明实施例中,该子步骤a33可以采用SPSS(Statistical Product andService Solutions,统计产品与服务解决方案)软件针对聚类结果进行线性回归分析。当然,还可以采用其他方式,本发明实施例对此并不加以限制。
步骤a34,针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型。
该子步骤a34可以包括以下子步骤a341~子步骤a342:
子步骤a341,针对每个聚类,分别利用当前聚类对应的回归参数β0~βm的值计算以下公式:
子步骤a342,将计算出的公式确定为该聚类对应的业务对象投放信息的检测模型。
因此,即可得到每个聚类对应的业务对象投放信息的检测模型。
在本发明的一种优选实施例中,在执行完上述子步骤a33之后,还可以进一步针对每个聚类,对当前聚类对应的回归参数进行显著性检验,和/或,回代检验。即可以仅进行显著性检验,也可以仅进行回代检验,还可以既进行显著性检验又进行回代检验。
显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(备则假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。在上述子步骤a33中针对每个聚类,分别进行线性回归分析后,还可以自动得到可决系数和修正的可决系数,显著性检验的过程即为:判断可决系数和修正的可决系数是否均大于预设阈值;若是,则确定通过显著性检验;若否,则确定未通过显著性检验。
回代检验的过程为:统计至少一个上传业务对象投放信息的投放者的属性信息(可以按照上述走步骤a1~子步骤a2的方式统计),并针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;将至少一个投放者的属性信息的排名评分值分别代入上述子步骤a331中的公式(此时,β0~βm是已知的,并且e删除),计算出对应的Y值(消耗值的排名评分值);计算上述Y值与该对象的实际消耗值的排名评分值的方差;判断所述方差是否在预设范围内;若是,则确定通过回代检验;若否,则确定未通过回代检验。
如果针对某个聚类对应的回归参数未通过显著性检验或回代检验,则可以删除该聚类,或者重新返回执行子步骤a32;如果通过显著性检验和回代检验,则执行该子步骤a4。
步骤202,接收携带有投放者标识的检测请求。
本发明实施例中,可以在浏览器中预先设置一个检测控件,当某个投放者需要对自身上传的业务对象投放信息进行检测时,通过点击该检测控件即可触发生成检测请求,该检测请求中可以包括该投放者的投放者标识。
步骤204,依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
在接收到携带有投放者标识的检测请求后,依据业务对象投放信息的检测模型对该投放者标识对应的投放者上传的业务对象投放信息进行检测。
在本发明的一种优选实施例中,该步骤204可以包括以下子步骤b1~子步骤b4:
子步骤b1,获取所述投放者标识对应的投放者的属性信息;
首先,可以采集浏览器中的多条展示日志和多条点击日志;然后,根据所述展示日志和点击日志统计该投放者标识对应的投放者的属性信息。对于具体的过程,参照上述子步骤a1~子步骤a2的相关描述即可。
子步骤b2,确定所述标识对应的投放者的属性信息所属的聚类;
该步骤b2可以包括以下子步骤b21~子步骤b23:
子步骤b21,针对所述标识对应的投放者的每个属性信息,分别计算当前属性信息的排名评分值;
该子步骤b21中,首先,可以基于上述子步骤b1中获取的展示日志和点击日志,分别统计每个投放者的属性信息;然后,针对所述标识对应的投放者的每个属性信息,分别计算当前属性信息的排名评分值。对于具体的过程,参照上述子步骤a2~子步骤a3的相关描述即可。
子步骤b22,以所述投放者的属性信息的排名评分值作为一个对象,分别计算该对象与每个聚类对应的质心之间的距离;
子步骤b23,确定与所述对象之间距离最小的质心对应的聚类为所述标识对应的投放者的属性信息所属的聚类。
子步骤b3,将所述标识对应的投放者的属性信息的排名评分值作为确定的聚类对应的业务对象投放信息的检测模型的输入;
在确定出该标识对应的投放者的属性信息所属的聚类之后,即可得到该剧类对应的业务对象投放信息的检测模型,即以下公式:
然后将标识对应的投放者的属性信息的排名评分值作为该业务对象投放信息的检测模型的输入,即X1~Xm。
子步骤b4,将所述业务对象投放信息的检测模型的输出作为所述投放者标识对应的投放者上传的业务对象投放信息的评分值。
经过业务对象投放信息的检测模型的计算,最终该业务对象投放信息的检测模型的输出即为投放者标识对应的投放者上传的业务对象投放信息的评分值。
步骤206,展示所述投放者标识对应的投放者上传的业务对象投放信息的检测结果。
在得到上述检测结果之后,即可在浏览器中展示该投放者标识对应的投放者上传的业务对象投放信息的检测结果,即上传的业务对象投放信息的评分值。
步骤208,获取所述投放者标识对应的投放者的属性信息,并展示所述属性信息。
在本发明的一种优选实施例中,还可以进一步获取所述投放者标识对应的投放者的属性信息,并展示所述属性信息。
对于具体的展示方式,本发明实施例并不加以限制,例如,可以采用加载提示框的方式展示,提示框中包括评分值等等。
通过将该投放者对应的业务对象投放信息的评分值和属性信息展示给投放者,使投放者可以更加清楚地了解其业务对象的投放效果,为定位业务对象投放信息存在的问题及制定更优化的业务对象投放信息提供依据。
步骤206和步骤208并不限定于上述执行顺序,可以先执行步骤206,再执行步骤208;也可以先执行步骤208,再执行步骤206;还可以同时执行步骤206和步骤208,本发明实施例对此并不加以限制。
本发明实施例中的业务对象可以为广告,业务对象投放平台为广告投放平台,投放者为广告主,业务对象投放信息为广告投放策略。
本发明实施例中,首先,综合了投放者的属性信息等指标客观做出健康评分,为后续制定优化建议提供了主要依据;其次,结合大量投放者的投放效果,提高了整体竞价环境的活跃度,有利于业务对象投放平台的整体收益;最后,、使用多元线性回归分析构建检测模型,可以较为精确地描述投放者健康分数与各个指标的关系。
实施例三:
参照图3,示出了本发明实施例三中的一种业务对象投放信息的检测装置的结构框图。
生成模块300,适于预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收模块302,适于接收携带有投放者标识的检测请求;
检测模块304,适于依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
本发明实施例中,预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型,后续在接收到携带有投放者标识的检测请求后,即可依据生成的业务对象投放信息的检测模型对投放者标识对应的投放者上传的业务对象投放信息进行检测。上述业务对象投放信息的检测模型结合大量的历史信息分析生成,因此能够更加客观、准确地对投放者上传的业务对象投放信息进行检测,并且根据该检测模型进行检测时无需再对检测的投放者的投放效果进行分析统计,检测过程更加简便,提高了检测效率。
实施例四:
参照图4,示出了本发明实施例四中的一种业务对象投放信息的检测装置的结构框图。
生成模块400,适于预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收模块402,适于接收携带有投放者标识的检测请求;
检测模块404,适于依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
结果展示模块406,适于展示所述投放者标识对应的投放者上传的业务对象投放信息的检测结果;
属性展示模块408,适于获取所述投放者标识对应的投放者的属性信息,并展示所述属性信息。
在本发明的一种优选实施例中,生成模块可以包括以下子模块:
日志采集子模块,适于预先采集浏览器中的多条展示日志和多条点击日志;
属性统计子模块,适于根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息;
模型生成子模块,适于基于所述多个投放者的属性信息生成业务对象投放信息的检测模型。
其中,所述展示日志包括:展示的业务对象的标识、所述展示的业务对象属于的投放者的标识、所述展示的业务对象是否被推左的信息、所述展示的业务对象的质量分数;所述点击日志包括:点击的业务对象的标识、所述点击的业务对象属于的投放者的标识、所述点击的业务对象是否被推左的信息、所述点击的业务对象的消耗值;所述投放者的属性信息包括:浏览量,和/或左侧浏览量,和/或点击量,和/或左侧点击量,和/或质量分数,和/或消耗值,和/或点击率。
属性统计子模块可以包括以下单元:
浏览量统计单元,适于统计所有展示日志中属于同一个投放者的、展示的业务对象的数量,将该数量作为所述投放者的浏览量;和/或,
左侧浏览量统计单元,适于统计所有展示日志中属于同一个投放者、并且被推左的展示的业务对象的数量,将该数量作为所述投放者的左侧浏览量;和/或,
点击量统计单元,适于统计所有点击日志中属于同一个投放者的、点击的业务对象的数量,将该数量作为所述投放者的点击量;和/或,
左侧点击量统计单元,适于统计所有点击日志中属于同一个投放者、并且被推左的点击的业务对象的数量,将该数量作为所述投放者的左侧点击量;和/或,
点击率统计单元,适于统计所有展示日志中同一个展示的业务对象的数量,将该数量作为所述业务对象的浏览量;统计所有点击日志中同一个点击的业务对象的数量,将该数量作为所述业务对象的点击量;分别计算每个业务对象的点击量与浏览量的商值,将所述商值作为所述业务对象的点击率;计算属于同一个投放者的所有业务对象的点击率的平均值,作为所述投放者的点击率;和/或,
分数统计单元,适于计算所有展示日志中属于同一个投放者的、展示的业务对象的质量分数的平均值,将该平均值作为所述投放者的质量分数;和/或,
消耗统计单元,适于计算所有点击日志中属于同一个投放者的、点击的业务对象的消耗值的总和,将该总和作为所述投放者的消耗值。
模型生成子模块可以包括以下单元:
计算单元,适于针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;
聚类单元,适于以一个投放者的所有属性信息的排名评分值作为一个对象,对所有对象进行聚类;
分析单元,适于针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数;
确定单元,适于针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型。
其中,聚类单元可以包括一下子单元:
层次聚类子单元,适于对所有对象进行层次聚类,确定目标数量的初始聚类;
选取子单元,适于随机选取每个初始聚类的质心;
归类子单元,适于针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中;
判断子单元,适于判断得到的每个质心对应的聚类是否满足收敛条件;若否,则重新计算每个初始聚类的质心,并调用所述归类子单元;若是,则确定得到的每个质心对应的聚类为聚类结果。
层次聚类子单元,具体适于:
以一个对象作为一个初始聚类,分别计算每两个初始聚类之间的距离;
将距离最小的两个初始聚类合并为一个初始聚类;
利用以下公式计算所述初始聚类对应的B(k)值:
其中,interDis为每两个初始聚类之间的距离,intraDis为初始聚类内部每两个对象之间的距离之和,k为初始聚类的数量;
计算合并后的初始聚类与其他每个初始聚类之间的距离,并返回所述将距离最小的两个初始聚类合并为一个初始聚类的步骤,直至初始聚类的个数为1为止;
查找所有B(k)值中的最小B(k)值,将所述最小B(k)值对应的k个初始聚类确定为目标数量的初始聚类。
判断子单元,具体适于:
利用以下公式计算所述得到的每个质心对应的聚类所对应的A值:
其中,I为聚类的数量,Ci为第i个聚类中对象的组合,xj为第i个聚类中的第j个对象,center(i)为第i个聚类的中心,第i个聚类的中心为第i个聚类中的所有对象的平均值;
获取前预设次数计算的A值,并将本次计算的A值与前预设次数计算的A值中每两个相邻的A值进行比较;
如果每两个相邻的A值的变化幅度均在预设范围内,则确定得到的每个质心对应的聚类满足收敛条件。
分析单元可以包括以下子单元:
公式确定子单元,适于针对每个聚类,分别确定当前聚类中的每个对象对应的以下公式:
Yn=β0+β1X1+β2X2+…+βmXm+e
其中,β0~βm为回归参数,X1~Xm分别为第n个对象的属性信息的排名评分值,Yn为第n个对象的消耗值的排名评分值,m为第n个对象的属性信息的数量,e为随机误差;
参数计算子单元,适于根据当前聚类中的每个对象对应的公式组成的方程组计算当前聚类对应的回归参数β0~βm的值。
确定单元可以包括以下子单元:
公式计算子单元,适于针对每个聚类,分别利用当前聚类对应的回归参数β0~βm的值计算以下公式:
聚类模型确定子单元,适于将计算出的公式确定为该聚类对应的业务对象投放信息的检测模型。
检测模块可以包括以下子模块:
属性获取子模块,适于获取所述投放者标识对应的投放者的属性信息;
聚类确定子模块,适于确定所述标识对应的投放者的属性信息所属的聚类;
信息评分子模块,适于将所述标识对应的投放者的属性信息的排名评分值作为确定的聚类对应的业务对象投放信息的检测模型的输入;将所述业务对象投放信息的检测模型的输出作为所述投放者标识对应的投放者上传的业务对象投放信息的评分值。
聚类确定子模块可以包括以下单元:
评分计算单元,适于针对所述标识对应的投放者的每个属性信息,分别计算当前属性信息的排名评分值;
距离计算单元,适于以所述投放者的属性信息的排名评分值作为一个对象,分别计算该对象与每个聚类对应的质心之间的距离;
聚类确定单元,适于确定与所述对象之间距离最小的质心对应的聚类为所述标识对应的投放者的属性信息所属的聚类。
上述业务对象投放信息的检测模型结合大量的历史信息分析生成,因此能够更加客观、准确地对投放者上传的业务对象投放信息进行检测,并且根据该检测模型进行检测时无需再对检测的投放者的投放效果进行分析统计,检测过程更加简便,提高了检测效率。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的业务对象投放信息的检测设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
A1、一种业务对象投放信息的检测方法,其中,包括:
预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收携带有投放者标识的检测请求;
依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
A2、如A1所述的方法,其中,所述预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型的步骤包括:
预先采集浏览器中的多条展示日志和多条点击日志;
根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息;
基于所述多个投放者的属性信息生成业务对象投放信息的检测模型。
A3、如A2所述的方法,其中,
所述展示日志包括:展示的业务对象的标识、所述展示的业务对象属于的投放者的标识、所述展示的业务对象是否被推左的信息、所述展示的业务对象的质量分数;
所述点击日志包括:点击的业务对象的标识、所述点击的业务对象属于的投放者的标识、所述点击的业务对象是否被推左的信息、所述点击的业务对象的消耗值;
所述投放者的属性信息包括:浏览量,和/或左侧浏览量,和/或点击量,和/或左侧点击量,和/或质量分数,和/或消耗值,和/或点击率。
A4、如A3所述的方法,其中,所述根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息的步骤包括:
统计所有展示日志中属于同一个投放者的、展示的业务对象的数量,将该数量作为所述投放者的浏览量;和/或,
统计所有展示日志中属于同一个投放者、并且被推左的展示的业务对象的数量,将该数量作为所述投放者的左侧浏览量;和/或,
统计所有点击日志中属于同一个投放者的、点击的业务对象的数量,将该数量作为所述投放者的点击量;和/或,
统计所有点击日志中属于同一个投放者、并且被推左的点击的业务对象的数量,将该数量作为所述投放者的左侧点击量;和/或,
统计所有展示日志中同一个展示的业务对象的数量,将该数量作为所述业务对象的浏览量;统计所有点击日志中同一个点击的业务对象的数量,将该数量作为所述业务对象的点击量;分别计算每个业务对象的点击量与浏览量的商值,将所述商值作为所述业务对象的点击率;计算属于同一个投放者的所有业务对象的点击率的平均值,作为所述投放者的点击率;和/或,
计算所有展示日志中属于同一个投放者的、展示的业务对象的质量分数的平均值,将该平均值作为所述投放者的质量分数;和/或,
计算所有点击日志中属于同一个投放者的、点击的业务对象的消耗值的总和,将该总和作为所述投放者的消耗值。
A5、如A2所述的方法,其中,所述基于所述多个投放者的属性信息生成业务对象投放信息的检测模型的步骤包括:
针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;
以一个投放者的所有属性信息的排名评分值作为一个对象,对所有对象进行聚类;
针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数;
针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型。
A6、如A5所述的方法,其中,所述对所有对象进行聚类的步骤包括:
对所有对象进行层次聚类,确定目标数量的初始聚类;
随机选取每个初始聚类的质心;
针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中;
判断得到的每个质心对应的聚类是否满足收敛条件;
若否,则重新计算每个初始聚类的质心,并返回所述针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中的步骤;
若是,则确定得到的每个质心对应的聚类为聚类结果。
A7、如A6所述的方法,其中,所述对所有对象进行层次聚类,确定目标数量的初始聚类的步骤包括:
以一个对象作为一个初始聚类,分别计算每两个初始聚类之间的距离;
将距离最小的两个初始聚类合并为一个初始聚类;
利用以下公式计算所述初始聚类对应的B(k)值:
其中,interDis为每两个初始聚类之间的距离,intraDis为初始聚类内部每两个对象之间的距离之和,k为初始聚类的数量;
计算合并后的初始聚类与其他每个初始聚类之间的距离,并返回所述将距离最小的两个初始聚类合并为一个初始聚类的步骤,直至初始聚类的个数为1为止;
查找所有B(k)值中的最小B(k)值,将所述最小B(k)值对应的k个初始聚类确定为目标数量的初始聚类。
A8、如A6所述的方法,其中,所述判断得到的每个质心对应的聚类是否满足收敛条件的步骤包括:
利用以下公式计算所述得到的每个质心对应的聚类所对应的A值:
其中,I为聚类的数量,Ci为第i个聚类中对象的组合,xj为第i个聚类中的第j个对象,center(i)为第i个聚类的中心,第i个聚类的中心为第i个聚类中的所有对象的平均值;
获取前预设次数计算的A值,并将本次计算的A值与前预设次数计算的A值中每两个相邻的A值进行比较;
如果每两个相邻的A值的变化幅度均在预设范围内,则确定得到的每个质心对应的聚类满足收敛条件。
A9、如A5所述的方法,其中,所述属性信息包括消耗值,
所述针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数的步骤包括:
针对每个聚类,分别确定当前聚类中的每个对象对应的以下公式:
Yn=β0+β1X1+β2X2+…+βmXm+e
其中,β0~βm为回归参数,X1~Xm分别为第n个对象的属性信息的排名评分值,Yn为第n个对象的消耗值的排名评分值,m为第n个对象的属性信息的数量,e为随机误差;
根据当前聚类中的每个对象对应的公式组成的方程组计算当前聚类对应的回归参数β0~βm的值。
A10、如A9所述的方法,其中,所述针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型的步骤包括:
针对每个聚类,分别利用当前聚类对应的回归参数β0~βm的值计算以下公式:
将计算出的公式确定为该聚类对应的业务对象投放信息的检测模型。
A11、如A6所述的方法,其中,所述依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测的步骤包括:
获取所述投放者标识对应的投放者的属性信息;
确定所述标识对应的投放者的属性信息所属的聚类;
将所述标识对应的投放者的属性信息的排名评分值作为确定的聚类对应的业务对象投放信息的检测模型的输入;
将所述业务对象投放信息的检测模型的输出作为所述投放者标识对应的投放者上传的业务对象投放信息的评分值。
A12、如A11所述的方法,其中,所述确定所述标识对应的投放者的属性信息所属的聚类的步骤包括:
针对所述标识对应的投放者的每个属性信息,分别计算当前属性信息的排名评分值;
以所述投放者的属性信息的排名评分值作为一个对象,分别计算该对象与每个聚类对应的质心之间的距离;
确定与所述对象之间距离最小的质心对应的聚类为所述标识对应的投放者的属性信息所属的聚类。
A13、如A1所述的方法,其中,还包括:
展示所述投放者标识对应的投放者上传的业务对象投放信息的检测结果。
A14、如A1所述的方法,其中,还包括:
获取所述投放者标识对应的投放者的属性信息,并展示所述属性信息。
B15、一种业务对象投放信息的检测装置,其中,包括:
生成模块,适于预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收模块,适于接收携带有投放者标识的检测请求;
检测模块,适于依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
B16、如B15所述的装置,其中,所述生成模块包括:
日志采集子模块,适于预先采集浏览器中的多条展示日志和多条点击日志;
属性统计子模块,适于根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息;
模型生成子模块,适于基于所述多个投放者的属性信息生成业务对象投放信息的检测模型。
B17、如B16所述的装置,其中,
所述展示日志包括:展示的业务对象的标识、所述展示的业务对象属于的投放者的标识、所述展示的业务对象是否被推左的信息、所述展示的业务对象的质量分数;
所述点击日志包括:点击的业务对象的标识、所述点击的业务对象属于的投放者的标识、所述点击的业务对象是否被推左的信息、所述点击的业务对象的消耗值;
所述投放者的属性信息包括:浏览量,和/或左侧浏览量,和/或点击量,和/或左侧点击量,和/或质量分数,和/或消耗值,和/或点击率。
B18、如B17所述的装置,其中,所述属性统计子模块包括:
浏览量统计单元,适于统计所有展示日志中属于同一个投放者的、展示的业务对象的数量,将该数量作为所述投放者的浏览量;和/或,
左侧浏览量统计单元,适于统计所有展示日志中属于同一个投放者、并且被推左的展示的业务对象的数量,将该数量作为所述投放者的左侧浏览量;和/或,
点击量统计单元,适于统计所有点击日志中属于同一个投放者的、点击的业务对象的数量,将该数量作为所述投放者的点击量;和/或,
左侧点击量统计单元,适于统计所有点击日志中属于同一个投放者、并且被推左的点击的业务对象的数量,将该数量作为所述投放者的左侧点击量;和/或,
点击率统计单元,适于统计所有展示日志中同一个展示的业务对象的数量,将该数量作为所述业务对象的浏览量;统计所有点击日志中同一个点击的业务对象的数量,将该数量作为所述业务对象的点击量;分别计算每个业务对象的点击量与浏览量的商值,将所述商值作为所述业务对象的点击率;计算属于同一个投放者的所有业务对象的点击率的平均值,作为所述投放者的点击率;和/或,
分数统计单元,适于计算所有展示日志中属于同一个投放者的、展示的业务对象的质量分数的平均值,将该平均值作为所述投放者的质量分数;和/或,
消耗统计单元,适于计算所有点击日志中属于同一个投放者的、点击的业务对象的消耗值的总和,将该总和作为所述投放者的消耗值。
B19、如B16所述的装置,其中,所述模型生成子模块包括:
计算单元,适于针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;
聚类单元,适于以一个投放者的所有属性信息的排名评分值作为一个对象,对所有对象进行聚类;
分析单元,适于针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数;
确定单元,适于针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型。
B20、如B19所述的装置,其中,所述聚类单元包括:
层次聚类子单元,适于对所有对象进行层次聚类,确定目标数量的初始聚类;
选取子单元,适于随机选取每个初始聚类的质心;
归类子单元,适于针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中;
判断子单元,适于判断得到的每个质心对应的聚类是否满足收敛条件;若否,则重新计算每个初始聚类的质心,并调用所述归类子单元;若是,则确定得到的每个质心对应的聚类为聚类结果。
B21、如B20所述的装置,其中,所述层次聚类子单元,具体适于:
以一个对象作为一个初始聚类,分别计算每两个初始聚类之间的距离;
将距离最小的两个初始聚类合并为一个初始聚类;
利用以下公式计算所述初始聚类对应的B(k)值:
其中,interDis为每两个初始聚类之间的距离,intraDis为初始聚类内部每两个对象之间的距离之和,k为初始聚类的数量;
计算合并后的初始聚类与其他每个初始聚类之间的距离,并返回所述将距离最小的两个初始聚类合并为一个初始聚类的步骤,直至初始聚类的个数为1为止;
查找所有B(k)值中的最小B(k)值,将所述最小B(k)值对应的k个初始聚类确定为目标数量的初始聚类。
B22、如B20所述的装置,其中,所述判断子单元,具体适于:
利用以下公式计算所述得到的每个质心对应的聚类所对应的A值:
其中,I为聚类的数量,Ci为第i个聚类中对象的组合,xj为第i个聚类中的第j个对象,center(i)为第i个聚类的中心,第i个聚类的中心为第i个聚类中的所有对象的平均值;
获取前预设次数计算的A值,并将本次计算的A值与前预设次数计算的A值中每两个相邻的A值进行比较;
如果每两个相邻的A值的变化幅度均在预设范围内,则确定得到的每个质心对应的聚类满足收敛条件。
B23、如B19所述的装置,其中,所述属性信息包括消耗值,所述分析单元包括:
公式确定子单元,适于针对每个聚类,分别确定当前聚类中的每个对象对应的以下公式:
Yn=β0+β1X1+β2X2+…+βmXm+e
其中,β0~βm为回归参数,X1~Xm分别为第n个对象的属性信息的排名评分值,Yn为第n个对象的消耗值的排名评分值,m为第n个对象的属性信息的数量,e为随机误差;
参数计算子单元,适于根据当前聚类中的每个对象对应的公式组成的方程组计算当前聚类对应的回归参数β0~βm的值。
B24、如B23所述的装置,其中,所述确定单元包括:
公式计算子单元,适于针对每个聚类,分别利用当前聚类对应的回归参数β0~βm的值计算以下公式:
聚类模型确定子单元,适于将计算出的公式确定为该聚类对应的业务对象投放信息的检测模型。
B25、如B20所述的装置,其中,所述检测模块包括:
属性获取子模块,适于获取所述投放者标识对应的投放者的属性信息;
聚类确定子模块,适于确定所述标识对应的投放者的属性信息所属的聚类;
信息评分子模块,适于将所述标识对应的投放者的属性信息的排名评分值作为确定的聚类对应的业务对象投放信息的检测模型的输入;将所述业务对象投放信息的检测模型的输出作为所述投放者标识对应的投放者上传的业务对象投放信息的评分值。
B26、如B25所述的装置,其中,所述聚类确定子模块包括:
评分计算单元,适于针对所述标识对应的投放者的每个属性信息,分别计算当前属性信息的排名评分值;
距离计算单元,适于以所述投放者的属性信息的排名评分值作为一个对象,分别计算该对象与每个聚类对应的质心之间的距离;
聚类确定单元,适于确定与所述对象之间距离最小的质心对应的聚类为所述标识对应的投放者的属性信息所属的聚类。
B27、如B15所述的装置,其中,还包括:
结果展示模块,适于展示所述投放者标识对应的投放者上传的业务对象投放信息的检测结果。
B28、如B15所述的装置,其中,还包括:
属性展示模块,适于获取所述投放者标识对应的投放者的属性信息,并展示所述属性信息。
Claims (10)
1.一种业务对象投放信息的检测方法,其特征在于,包括:
预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收携带有投放者标识的检测请求;
依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
2.如权利要求1所述的方法,其特征在于,所述预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型的步骤包括:
预先采集浏览器中的多条展示日志和多条点击日志;
根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息;
基于所述多个投放者的属性信息生成业务对象投放信息的检测模型。
3.如权利要求2所述的方法,其特征在于,
所述展示日志包括:展示的业务对象的标识、所述展示的业务对象属于的投放者的标识、所述展示的业务对象是否被推左的信息、所述展示的业务对象的质量分数;
所述点击日志包括:点击的业务对象的标识、所述点击的业务对象属于的投放者的标识、所述点击的业务对象是否被推左的信息、所述点击的业务对象的消耗值;
所述投放者的属性信息包括:浏览量,和/或左侧浏览量,和/或点击量,和/或左侧点击量,和/或质量分数,和/或消耗值,和/或点击率。
4.如权利要求3所述的方法,其特征在于,所述根据所述展示日志和所述点击日志分别统计每个历史上传业务对象投放信息的投放者的属性信息的步骤包括:
统计所有展示日志中属于同一个投放者的、展示的业务对象的数量,将该数量作为所述投放者的浏览量;和/或,
统计所有展示日志中属于同一个投放者、并且被推左的展示的业务对象的数量,将该数量作为所述投放者的左侧浏览量;和/或,
统计所有点击日志中属于同一个投放者的、点击的业务对象的数量,将该数量作为所述投放者的点击量;和/或,
统计所有点击日志中属于同一个投放者、并且被推左的点击的业务对象的数量,将该数量作为所述投放者的左侧点击量;和/或,
统计所有展示日志中同一个展示的业务对象的数量,将该数量作为所述业务对象的浏览量;统计所有点击日志中同一个点击的业务对象的数量,将该数量作为所述业务对象的点击量;分别计算每个业务对象的点击量与浏览量的商值,将所述商值作为所述业务对象的点击率;计算属于同一个投放者的所有业务对象的点击率的平均值,作为所述投放者的点击率;和/或,
计算所有展示日志中属于同一个投放者的、展示的业务对象的质量分数的平均值,将该平均值作为所述投放者的质量分数;和/或,
计算所有点击日志中属于同一个投放者的、点击的业务对象的消耗值的总和,将该总和作为所述投放者的消耗值。
5.如权利要求2所述的方法,其特征在于,所述基于所述多个投放者的属性信息生成业务对象投放信息的检测模型的步骤包括:
针对每个投放者的每个属性信息,分别计算当前属性信息在所有投放者与该属性信息相同的属性信息中的排名评分值;
以一个投放者的所有属性信息的排名评分值作为一个对象,对所有对象进行聚类;
针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数;
针对每个聚类,分别利用当前聚类对应的回归参数确定该聚类对应的业务对象投放信息的检测模型。
6.如权利要求5所述的方法,其特征在于,所述对所有对象进行聚类的步骤包括:
对所有对象进行层次聚类,确定目标数量的初始聚类;
随机选取每个初始聚类的质心;
针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中;
判断得到的每个质心对应的聚类是否满足收敛条件;
若否,则重新计算每个初始聚类的质心,并返回所述针对每个对象,分别计算当前对象与每个质心之间的距离,并将当前对象归类到与该对象之间距离最小的质心对应的聚类中的步骤;
若是,则确定得到的每个质心对应的聚类为聚类结果。
7.如权利要求6所述的方法,其特征在于,所述对所有对象进行层次聚类,确定目标数量的初始聚类的步骤包括:
以一个对象作为一个初始聚类,分别计算每两个初始聚类之间的距离;
将距离最小的两个初始聚类合并为一个初始聚类;
利用以下公式计算所述初始聚类对应的B(k)值:
其中,interDis为每两个初始聚类之间的距离,intraDis为初始聚类内部每两个对象之间的距离之和,k为初始聚类的数量;
计算合并后的初始聚类与其他每个初始聚类之间的距离,并返回所述将距离最小的两个初始聚类合并为一个初始聚类的步骤,直至初始聚类的个数为1为止;
查找所有B(k)值中的最小B(k)值,将所述最小B(k)值对应的k个初始聚类确定为目标数量的初始聚类。
8.如权利要求6所述的方法,其特征在于,所述判断得到的每个质心对应的聚类是否满足收敛条件的步骤包括:
利用以下公式计算所述得到的每个质心对应的聚类所对应的A值:
其中,I为聚类的数量,Ci为第i个聚类中对象的组合,xj为第i个聚类中的第j个对象,center(i)为第i个聚类的中心,第i个聚类的中心为第i个聚类中的所有对象的平均值;
获取前预设次数计算的A值,并将本次计算的A值与前预设次数计算的A值中每两个相邻的A值进行比较;
如果每两个相邻的A值的变化幅度均在预设范围内,则确定得到的每个质心对应的聚类满足收敛条件。
9.如权利要求5所述的方法,其特征在于,所述属性信息包括消耗值,
所述针对每个聚类,分别进行线性回归分析,得到当前聚类对应的回归参数的步骤包括:
针对每个聚类,分别确定当前聚类中的每个对象对应的以下公式:
Yn=β0+β1X1+β2X2+…+βmXm+e
其中,β0~βm为回归参数,X1~Xm分别为第n个对象的属性信息的排名评分值,Yn为第n个对象的消耗值的排名评分值,m为第n个对象的属性信息的数量,e为随机误差;
根据当前聚类中的每个对象对应的公式组成的方程组计算当前聚类对应的回归参数β0~βm的值。
10.一种业务对象投放信息的检测装置,其特征在于,包括:
生成模块,适于预先基于多个历史上传业务对象投放信息的投放者的属性信息,生成业务对象投放信息的检测模型;
接收模块,适于接收携带有投放者标识的检测请求;
检测模块,适于依据所述业务对象投放信息的检测模型,对所述投放者标识对应的投放者上传的业务对象投放信息进行检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410737885.3A CN104484372A (zh) | 2014-12-04 | 2014-12-04 | 一种业务对象投放信息的检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410737885.3A CN104484372A (zh) | 2014-12-04 | 2014-12-04 | 一种业务对象投放信息的检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104484372A true CN104484372A (zh) | 2015-04-01 |
Family
ID=52758913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410737885.3A Pending CN104484372A (zh) | 2014-12-04 | 2014-12-04 | 一种业务对象投放信息的检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104484372A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256883A (zh) * | 2016-12-28 | 2018-07-06 | 北京奇虎科技有限公司 | 一种流量请求分发方法、装置和设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101390118A (zh) * | 2005-12-30 | 2009-03-18 | 谷歌公司 | 预测广告质量 |
CN102110265A (zh) * | 2009-12-23 | 2011-06-29 | 深圳市腾讯计算机***有限公司 | 一种预估网络广告效果的方法及*** |
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
CN103440584A (zh) * | 2013-07-31 | 2013-12-11 | 北京亿赞普网络技术有限公司 | 一种广告投放方法和*** |
CN104091276A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机***有限公司 | 在线分析点击流数据的方法和相关装置及*** |
-
2014
- 2014-12-04 CN CN201410737885.3A patent/CN104484372A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101390118A (zh) * | 2005-12-30 | 2009-03-18 | 谷歌公司 | 预测广告质量 |
CN102110265A (zh) * | 2009-12-23 | 2011-06-29 | 深圳市腾讯计算机***有限公司 | 一种预估网络广告效果的方法及*** |
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
CN103440584A (zh) * | 2013-07-31 | 2013-12-11 | 北京亿赞普网络技术有限公司 | 一种广告投放方法和*** |
CN104091276A (zh) * | 2013-12-10 | 2014-10-08 | 深圳市腾讯计算机***有限公司 | 在线分析点击流数据的方法和相关装置及*** |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256883A (zh) * | 2016-12-28 | 2018-07-06 | 北京奇虎科技有限公司 | 一种流量请求分发方法、装置和设备 |
CN108256883B (zh) * | 2016-12-28 | 2024-05-14 | 北京奇虎科技有限公司 | 一种流量请求分发方法、装置和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11710054B2 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
US8447747B1 (en) | System for generating behavior-based associations for multiple domain-specific applications | |
US7660792B2 (en) | System and method for spam identification | |
US8346782B2 (en) | Method and system of information matching in electronic commerce website | |
US8515937B1 (en) | Automated identification and assessment of keywords capable of driving traffic to particular sites | |
CN109190043A (zh) | 推荐方法及装置,存储介质,电子设备及推荐*** | |
CN102841946B (zh) | 商品数据检索排序及商品推荐方法和*** | |
CN107122980B (zh) | 识别商品所属类目的方法和装置 | |
CN103902597B (zh) | 确定目标关键词所对应的搜索相关性类别的方法和设备 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN106600372A (zh) | 一种基于用户行为的商品推荐方法及*** | |
CN111523976A (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
US9218615B2 (en) | Automated optimization of an advertisement placement engine | |
CN105447730A (zh) | 目标用户定向方法及装置 | |
CN109064293B (zh) | 商品推荐方法、装置、计算机设备及存储介质 | |
CN105989004A (zh) | 一种信息投放的预处理方法和装置 | |
CN107066476A (zh) | 一种基于物品相似度的实时推荐方法 | |
CN105138690B (zh) | 确定关键词的方法和装置 | |
CN111461841A (zh) | 物品推荐方法、装置、服务器及存储介质 | |
CN107704485A (zh) | 一种职位推荐方法及计算设备 | |
CN104933100A (zh) | 关键词推荐方法和装置 | |
CN102682153A (zh) | 信息处理和呈现装置、终端装置、评估得分计算法和程序 | |
US20150254680A1 (en) | Utilizing product and service reviews | |
CN111488385B (zh) | 基于人工智能的数据处理方法、装置和计算机设备 | |
CN116823409B (zh) | 一种基于目标搜索数据的智能筛选方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150401 |