CN104462392A - 分享回流量的统计方法和装置 - Google Patents

分享回流量的统计方法和装置 Download PDF

Info

Publication number
CN104462392A
CN104462392A CN201410758301.0A CN201410758301A CN104462392A CN 104462392 A CN104462392 A CN 104462392A CN 201410758301 A CN201410758301 A CN 201410758301A CN 104462392 A CN104462392 A CN 104462392A
Authority
CN
China
Prior art keywords
sharing
anchor chain
url
capacity
returns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410758301.0A
Other languages
English (en)
Other versions
CN104462392B (zh
Inventor
冯鸳鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201410758301.0A priority Critical patent/CN104462392B/zh
Publication of CN104462392A publication Critical patent/CN104462392A/zh
Application granted granted Critical
Publication of CN104462392B publication Critical patent/CN104462392B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种分享回流量的统计方法和装置。其中,该分享回流量的统计方法包括:获取与本次访问相对应的网站地址URL,URL为用于访问被分享网站的地址;判断URL中是否存在携带有被分享网站的分享标识信息的锚链;以及如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则将本次访问统计为一次分享回流量。通过本发明,解决了相关技术中无法统计到真正的分享回流量的问题。

Description

分享回流量的统计方法和装置
技术领域
本发明涉及数据统计领域,具体而言,涉及一种分享回流量的统计方法和装置。
背景技术
目前,所有为用户提供分享功能的网站都具有分享回流量统计功能。在相关技术中,一般采用以下方式来统计分享回流量:只要是从社交媒体跳转到被分享网站的访问量都被统计为该被分享网站的分享回流量,也即,只要访问的来源为社交媒体,则该次访问就被认为是该被分享网站的分享回流,其中,所谓被分享网站即为被分享的网站。
由于目前能够为被分享网站提供分享功能的分享产品很多,因此能够实现将客户网站分享到社交媒体的手段也有很多,如果单纯判断本次访问所涉及的被分享网站的地址的来源来区分本次访问是否属于被分享网站的分享回流量,则会将所有访问带来的回流都统计为特定分享产品的分享所带来的分享回流量。因而,上述技术方案存在以下缺陷:(1)无法统计到真正的分享回流量;(2)分享回流量的统计粒度粗,无法精确地分析出分享回流量与某次分享的关联度。因此,在相关技术中,分享回流量的统计结果是虚假的,对分享产品的分析没有帮助,因为它会将很多不属于被分享网站的分享内容所带来的回流量也统计为该被分享网站的分享回流量:
例如,用户A通过点击用户B在社交媒体上以手写或者拷贝粘贴方式发布的被分享网站的地址来访问被分享网站。此时,虽然用户B在社交媒体上发布的内容中包含了被分享网站的地址,但是由于该被分享网站的地址是用户B通过直接手写或者拷贝粘贴方式产生的,而不是通过应用被分享网站的分享功能分享的,因此,即使用户B的朋友圈中的好友(如,用户A)能够通过用户B所发布的内容中的被分享网站的地址对该被分享网站进行访问,这种访问也不是真正的分享回流,然而,在相关技术中,这样的访问却会被统计为该被分享网站的分享回流量。
再例如,由于社交媒体的访问量大,因此有很多社交媒体上都投放有广告。如果用户A通过点击社交媒体上的广告来访问被分享网站,在相关技术中,这样的访问也会被统计为该被分享网站的分享回流量。
又例如,用户B通过某一社交媒体分享被分享网站的内容,而用户A通过点击其他社交媒体上记载的该被分享网站的地址来访问该被分享网站,在相关技术中,这样的访问也会被统计为该被分享网站的分享回流量。
另外,上述分享回流量的统计方式的统计粒度粗,只能统计到每个社交媒体的总分享回流量和每天的分享回流量,而无法统计某次分享所带来的分享回流量,更无法统计某段时间内该某次分享所带来的分享回流量。
针对相关技术中无法统计到真正的分享回流量的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种分享回流量的统计方法和装置,以解决无法统计到真正的分享回流量的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种分享回流量的统计方法。该方法包括:获取与本次访问相对应的网站地址统一资源定位符URL,上述URL为用于访问被分享网站的地址;判断上述URL中是否存在携带有上述被分享网站的分享标识信息的锚链;以及如果判断出上述URL中存在携带有上述被分享网站的分享标识信息的上述锚链,则将本次访问统计为一次分享回流量。
进一步地,在将本次访问统计为一次分享回流量之前,上述统计方法还包括:如果判断出上述URL中存在携带有上述被分享网站的分享标识信息的上述锚链,则验证上述锚链是否正确,其中,如果验证出上述锚链正确,则执行将本次访问统计为一次分享回流量的步骤。
进一步地,验证上述锚链是否正确包括:获取与本次访问相对应的当前网站的关键字且获取用于提供上述URL的社交媒体的关键字;根据上述当前网站的关键字、上述用于提供上述URL的社交媒体的关键字和上述URL生成待验证哈希值;以及验证上述待验证哈希值与预设哈希值是否一致,其中,若上述待验证哈希值与上述预设哈希值一致,则上述锚链正确,若上述待验证哈希值与上述预设哈希值不一致,则上述锚链错误。
进一步地,通过以下方式生成上述预设哈希值:获取上述被分享网站的关键字、目标社交媒体的关键字和上述URL,上述目标社交媒体为用于分享上述被分享网站的内容的社交媒体;以及根据上述被分享网站的关键字、上述目标社交媒体的关键字和上述URL生成上述预设哈希值。
进一步地,上述锚链还携带有本次分享上述被分享网站的时间戳,在将本次访问统计为一次分享回流量的同时,上述统计方法还包括:获取上述锚链所携带的本次分享上述被分享网站的上述时间戳;根据获取的上述时间戳确定本次访问与本次分享的关联度;以及根据上述关联度统计与本次分享相对应的分享回流量。
进一步地,通过以下方式将上述锚链添加至上述URL中:判断上述URL中是否存在原始锚链;如果判断出上述URL中存在上述原始锚链,则先删除上述原始锚链,再将上述携带有上述被分享网站的分享标识信息的锚链添加至上述URL中。
为了实现上述目的,根据本发明的另一方面,提供了一种分享回流量的统计装置。该装置包括:第一获取单元,用于获取与本次访问相对应的网站地址统一资源定位符URL,上述URL为用于访问被分享网站的地址;判断单元,用于判断上述URL中是否存在携带有上述被分享网站的分享标识信息的锚链;以及第一统计单元,用于在判断出上述URL中存在携带有上述被分享网站的分享标识信息的上述锚链时,将本次访问统计为一次分享回流量。
进一步地,上述统计装置还包括:验证单元,用于在将本次访问统计为一次分享回流量之前,在判断出上述URL中存在携带有上述被分享网站的分享标识信息的上述锚链时,验证上述锚链是否正确,其中,在验证出上述锚链正确时,则执行上述第一统计单元的功能。
进一步地,上述验证单元包括:获取模块,用于获取与本次访问相对应的当前网站的关键字且获取用于提供上述URL的社交媒体的关键字;生成模块,用于根据上述当前网站的关键字、上述用于提供上述URL的社交媒体的关键字和上述URL生成待验证哈希值;以及验证模块,用于验证上述待验证哈希值与预设哈希值是否一致,其中,若上述待验证哈希值与上述预设哈希值一致,则上述锚链正确,若上述待验证哈希值与上述预设哈希值不一致,则上述锚链错误。
进一步地,上述统计装置还包括:生成单元,上述生成单元通过以下方式生成上述预设哈希值:获取上述被分享网站的关键字、目标社交媒体的关键字和上述URL,上述目标社交媒体为用于分享上述被分享网站的内容的社交媒体;以及根据上述被分享网站的关键字、上述目标社交媒体的关键字和上述URL生成上述预设哈希值。
进一步地,上述锚链还携带有本次分享上述被分享网站的时间戳,上述统计装置还包括:第二获取单元,用于在将本次访问统计为一次分享回流量的同时,获取上述锚链所携带的本次分享上述被分享网站的上述时间戳;确定单元,用于根据获取的上述时间戳确定本次访问与本次分享的关联度;以及第二统计单元,用于根据上述关联度统计与本次分享相对应的分享回流量。
进一步地,上述统计装置还包括:添加单元,上述添加单元用于通过以下方式将上述锚链添加至上述URL中:判断上述URL中是否存在原始锚链;如果判断出上述URL中存在上述原始锚链,则先删除上述原始锚链,再将上述携带有上述被分享网站的分享标识信息的锚链添加至上述URL中。
通过本发明,采用获取与本次访问相对应的网站地址URL,URL为用于访问被分享网站的地址;判断URL中是否存在携带有被分享网站的分享标识信息的锚链;以及如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则将本次访问统计为一次分享回流量,解决了相关技术中无法统计到真正的分享回流量的问题,进而达到了能够统计到真正的分享回流量的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的分享回流量的统计方法的流程图;以及
图2是根据本发明实施例的分享回流量的统计装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明的实施例,提供了一种分享回流量的统计方法。该分享回流量的统计方法可以运行在计算机处理设备上。
图1是根据本发明实施例的分享回流量的统计方法的流程图。如图1所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,获取与本次访问相对应的网站地址URL。
URL(Uniform Resource Locator,统一资源定位符)为用于访问被分享网站的地址。例如,如果本次访问的是“中华人民共和国中央人民政府”的官网,则获取的与本次访问相对应的网站地址URL为“www.gov.cn”,其中,“www.gov.cn”为用于访问“中华人民共和国中央人民政府”的官网的地址,并且“中华人民共和国中央人民政府”网站为分享产品分享的被分享网站。分享产品包括前端的插件和后端的服务器。在前端的插件被触发之后,后端的服务器执行相应的分享和分享回流量统计处理。需要说明的是,分享产品的前端的插件设置在所有待分享的网站上。
步骤S104,判断URL中是否存在携带有被分享网站的分享标识信息的锚链。
在实际中,当用户通过分享产品的前端的插件触发分享功能,对当前页面实施分享时,则该分享产品的后端的服务器可以先在被分享网站的页面路径URL后添加一个携带有该被分享网站的分享标识信息的锚链。其中,分享标识信息为锚链的唯一性标识信息,并且其中包含有URL被分享到的目标社交媒体的信息。这样,当有用户访问当前页面时,可以通过判断访问的页面路径URL后面是否携带有标识本次分享的锚链来确定是否将本次访问统计为分享回流量。
步骤S106,如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则将本次访问统计为一次分享回流量。
如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则认为本次访问为本次分享所带来的分享回流,从而将本次访问统计为一次分享回流量;如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则认为本次访问为其他分享所带来的分享回流,从而不将本次访问统计为一次分享回流量。
通过本发明实施例,由于可以针对用户的每一次分享做一个唯一的标识,并将该标识的相关信息添加至各次分享所对应的URL中,因此,只要是通过该添加了标识信息的URL进行的回流访问就被统计为该次分享带来的分享回流量,达到了能够统计到真正的分享回流量的效果。
优选地,在本发明实施例中,在步骤S106将本次访问统计为一次分享回流量之前,该统计方法还可以包括:
S2,如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则验证锚链是否正确,其中,如果验证出锚链正确,则执行将本次访问统计为一次分享回流量的步骤;如果验证出锚链错误,则不执行将本次访问统计为一次分享回流量的步骤。
由于被分享网站的相关内容通过本次分享分享至目标社交媒体之后,该目标社交媒体上的用户可以将其转发至其他的社交媒体上,这样,其他的社交媒体上的用户又可以访问被分享网站,这种访问的来源由于不是目标社交媒体,因此不是本次分享的分享回流量。例如,用户A将“中华人民共和国中央人民政府”官网的相关内容通过第N次分享分享至自己的新浪微博之后,用户A在新浪微博的朋友圈中的用户B又将“中华人民共和国中央人民政府”官网的相关内容的微博转发至腾讯微博,此时,用户B在腾讯微博的朋友圈中的用户C根据“中华人民共和国中央人民政府”官网的相关内容所对应的URL进行访问,这种访问的来源是腾讯微博,而不是新浪微博,因此不是用户A的第N次分享所带来的分享回流量。
通过本发明实施例,可以得到更加准确的分享回流量的统计结果。
进一步优选地,在本发明实施例中,S2验证锚链是否正确可以包括:
S22,获取与本次访问相对应的当前网站的关键字且获取用于作为URL的来源的社交媒体的关键字;
S24,根据当前网站的关键字、用于作为URL的来源的社交媒体的关键字和URL生成待验证哈希值;以及
S26,验证待验证哈希值与预设哈希值是否一致,其中,待验证哈希值与预设哈希值一致,则锚链正确,待验证哈希值与预设哈希值不一致,则锚链错误。进一步地,在锚链正确时,将本次访问统计为一次分享回流量;在锚链错误时,不对本次访问进行分享回流量统计。
由于在分享时已经为分享链接(即,URL)添加了唯一的锚链,因此在统计回流量时需要先验证分享链接(即,URL)中是否含有锚链。如果含有锚链,则进一步验证锚链是否正确。如果不含有锚链,则无需进一步验证锚链是否正确,因为如果没有锚链,则肯定不能将本次访问统计为分享回流量。
由于URL中含有锚链,而在验证锚链是否准确时,需要通过锚链中的信息进行验证,因此在统计分享回流量时,可以从本次访问(即,当前访问)的URL中含有锚链解析当前网站的关键字(如,当前网站名称的关键字)、URL和作为该URL的来源的社交媒体的关键字(如,作为该URL的来源的社交媒体的名称的关键字),并根据解析结果生成待验证哈希值。
由于锚链错误时,有可能是模拟的分享回流,而并非真正的分享回流,通过本发明实施例,可以防止某些分享产品恶意模拟的分享回流,导致统计结果虚高。
优选地,在本发明实施例中,可以通过以下方式生成前述的预设哈希值:
S4,获取被分享网站的关键字、目标社交媒体的关键字和URL,目标社交媒体为用于分享被分享网站的内容的社交媒体;以及
S6,根据被分享网站的关键字、目标社交媒体的关键字和URL生成预设哈希值。
具体地,可以在分享时执行本实施例中的上述步骤,这样,可以在分享时为每个被分享的URL添加一个唯一的锚链。由于URL具有长度限制,因此在添加URL后面的锚链时,通过上述关键字可以精简的表示被分享网站和目标社交媒体的关键的分享信息,从而生成一个简短的哈希值,并且将该哈希值作为锚链的一部分。
优选地,在本发明实施例中,锚链除了携带有被分享网站的分享标识信息之外,还携带有本次分享中被分享网站的时间戳,这样,在执行将本次访问统计为一次分享回流量步骤的同时,该统计方法还可以包括:
S8,获取锚链所携带的本次分享被分享网站的时间戳;
S10,根据获取的时间戳确定本次访问与本次分享的关联度;以及
S12,根据关联度统计与本次分享相对应的分享回流量。
由于***会记录本次分享的具体时间点,而锚链中所携带的本次分享被分享网站的时间戳上的时间点正是***记录的本次分享的具体时间点,因此锚链与本次分享之间存在一个时间关联关系,即,关联度。这样,在本次访问产生时,可以根据与本次访问相关联的锚链和本次分享之间的关联度来确定本次访问是否是由本次分享所带来的。其中,如果确定本次访问是由本次分享所带来的,则将本次访问作为本次分享的一次分享回流量进行统计;否则,则不作统计。
需要说明的是,可以将上述实施例中的哈希值和本实施例中的时间戳同时添加至即将被分享的URL中,并将它们作为该URL的唯一的锚链。
由于锚链中的时间戳能够准确地关联到具体的分享中,因此,通过本发明实施例,可以实现分享回流量的统计粒度精细化的目的,从而不仅能统计到每个社交媒体的总分享回流量和每天的分享回流量,而且能够统计某次分享所带来的分享回流量,以及某段时间内该某次分享所带来的分享回流量。
优选地,在本发明实施例中,可以通过以下方式将锚链添加至URL中:
S14,判断URL中是否存在原始锚链;以及
S16,如果判断出URL中存在原始锚链,则先删除原始锚链,再将携带有被分享网站的分享标识信息的锚链添加至URL中。
也即,如果分享链接自身原本就有锚链,则先去掉分享链接中自身原本就有的锚链,在将前述实施例中生成的预设锚链添加到分享链接的后面,进而完成分享。
由于有些URL自身带有锚链,这样,如果直接在这些URL的后面添加新的锚链,则会导致这些URL不可用。并且这些URL自身带有的锚链只是对页面起定位的作用,因此,在分享这些URL时,需要先删掉原有的锚链,再将前述实施例中生成的具有标志作用的锚链添加这些URL的后面,并最终完成分享。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明的实施例,提供了一种分享回流量的统计装置。需要说明的是,本发明实施例所提供的分享回流量的统计方法可以通过本发明实施例的分享回流量的统计装置来执行,本发明实施例的分享回流量的统计装置也可以用于执行本发明实施例的分享回流量的统计方法。
图2是根据本发明实施例的分享回流量的统计装置的示意图。如图2所示,该装置包括:第一获取单元10、判断单元20和第一统计单元30。第一获取单元10用于获取与本次访问相对应的网站地址URL,URL为用于访问被分享网站的地址;判断单元20用于判断URL中是否存在携带有被分享网站的分享标识信息的锚链;以及第一统计单元30用于在判断出URL中存在携带有被分享网站的分享标识信息的锚链时,将本次访问统计为一次分享回流量。
URL为用于访问被分享网站的地址。例如,如果本次访问的是“中华人民共和国中央人民政府”的官网,则获取的与本次访问相对应的网站地址URL为“www.gov.cn”,其中,“www.gov.cn”为用于访问“中华人民共和国中央人民政府”的官网的地址,并且“中华人民共和国中央人民政府”网站为分享产品分享的被分享网站。分享产品包括前端的插件和后端的服务器。在前端的插件被触发之后,后端的服务器执行相应的分享和分享回流量统计处理。需要说明的是,分享产品的前端的插件设置在所有待分享的网站上。
在实际中,当用户通过分享产品的前端的插件触发分享功能,对当前页面实施分享时,则该分享产品的后端的服务器可以先在被分享网站的页面路径URL后添加一个携带有该被分享网站的分享标识信息的锚链。其中,分享标识信息为锚链的唯一性标识信息,并且其中包含有URL被分享到的目标社交媒体的信息。这样,当有用户访问当前页面时,可以通过判断访问的页面路径URL后面是否携带有标识本次分享的锚链来确定是否将本次访问统计为分享回流量。
如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则认为本次访问为本次分享所带来的分享回流,从而将本次访问统计为一次分享回流量;如果判断出URL中存在携带有被分享网站的分享标识信息的锚链,则认为本次访问为其他分享所带来的分享回流,从而不将本次访问统计为一次分享回流量。
通过本发明实施例,由于可以针对用户的每一次分享做一个唯一的标识,并将该标识的相关信息添加至各次分享所对应的URL中,因此,只要是通过该添加了标识信息的URL进行的回流访问就被统计为该次分享带来的分享回流量,达到了能够统计到真正的分享回流量的效果。
优选地,在本发明实施例中,该统计装置还包括:验证单元。验证单元用于在将本次访问统计为一次分享回流量之前,在判断出URL中存在携带有被分享网站的分享标识信息的锚链时,验证锚链是否正确,其中,在验证出锚链正确时,则执行第一统计单元的功能。
由于被分享网站的相关内容通过本次分享分享至目标社交媒体之后,该目标社交媒体上的用户可以将其转发至其他的社交媒体上,这样,其他的社交媒体上的用户又可以访问被分享网站,这种访问的来源由于不是目标社交媒体,因此不是本次分享的分享回流量。例如,用户A将“中华人民共和国中央人民政府”官网的相关内容通过第N次分享分享至自己的新浪微博之后,用户A在新浪微博的朋友圈中的用户B又将“中华人民共和国中央人民政府”官网的相关内容的微博转发至腾讯微博,此时,用户B在腾讯微博的朋友圈中的用户C根据“中华人民共和国中央人民政府”官网的相关内容所对应的URL进行访问,这种访问的来源是腾讯微博,而不是新浪微博,因此不是用户A的第N次分享所带来的分享回流量。
通过本发明实施例,可以得到更加准确的分享回流量的统计结果。
进一步优选地,在本发明实施例中,验证单元可以包括:获取模块、生成模块和验证模块。获取模块用于获取与本次访问相对应的当前网站的关键字且获取用于作为URL的来源的社交媒体的关键字;生成模块用于根据当前网站的关键字、用于作为URL的来源的社交媒体的关键字和URL生成待验证哈希值;以及验证模块用于验证待验证哈希值与预设哈希值是否一致,其中,待验证哈希值与预设哈希值一致,则锚链正确,待验证哈希值与预设哈希值不一致,则锚链错误。进一步地,在锚链正确时,将本次访问统计为一次分享回流量;在锚链错误时,不对本次访问进行分享回流量统计。
由于在分享时已经为分享链接(即,URL)添加了唯一的锚链,因此在统计回流量时需要先验证分享链接(即,URL)中是否含有锚链。如果含有锚链,则进一步验证锚链是否正确。如果不含有锚链,则无需进一步验证锚链是否正确,因为如果没有锚链,则肯定不能将本次访问统计为分享回流量。
由于URL中含有锚链,而在验证锚链是否准确时,需要通过锚链中的信息进行验证,因此在统计分享回流量时,可以从本次访问(即,当前访问)的URL中含有锚链解析当前网站的关键字(如,当前网站名称的关键字)、URL和作为该URL的来源的社交媒体的关键字(如,作为该URL的来源的社交媒体的名称的关键字),并根据解析结果生成待验证哈希值。
由于锚链错误时,有可能是模拟的分享回流,而并非真正的分享回流,通过本发明实施例,可以防止某些分享产品恶意模拟的分享回流,导致统计结果虚高。
优选地,在本发明实施例中,该统计装置还可以包括:生成单元。该生成单元可以用于通过以下方式生成预设哈希值:获取被分享网站的关键字、目标社交媒体的关键字和URL,目标社交媒体为用于分享被分享网站的内容的社交媒体;以及根据被分享网站的关键字、目标社交媒体的关键字和URL生成预设哈希值。
具体地,可以在分享时执行本实施例中的上述步骤,这样,可以在分享时为每个被分享的URL添加一个唯一的锚链。由于URL据有长度限制,因此在添加URL后面的锚链时,通过上述关键字可以精简的表示被分享网站和目标社交媒体的关键的分享信息,从而生成一个简短的哈希值,并且将该哈希值作为锚链的一部分。
优选地,在本发明实施例中,锚链除了携带有被分享网站的分享标识信息之外,还携带有本次分享被分享网站的时间戳,这样,该统计装置还可以包括:第二获取单元、确定单元和第二统计单元。第二获取单元用于在将本次访问统计为一次分享回流量的同时,获取锚链所携带的本次分享被分享网站的时间戳;确定单元用于根据获取的时间戳确定本次访问与本次分享的关联度;以及第二统计单元用于根据关联度统计与本次分享相对应的分享回流量。
需要说明的是,可以将上述实施例中的哈希值和本实施例中的时间戳同时添加至即将被分享的URL中,并将它们作为该URL的唯一的锚链。
由于锚链中的时间戳能够准确地关联到具体的分享中,因此,通过本发明实施例,可以实现分享回流量的统计粒度精细化的目的,从而不仅能统计到每个社交媒体的总分享回流量和每天的分享回流量,而且能够统计某次分享所带来的分享回流量,以及某段时间内该某次分享所带来的分享回流量。
优选地,在本发明实施例中,该统计装置还可以包括:添加单元。添加单元可以用于通过以下方式将锚链添加至URL中:判断URL中是否存在原始锚链;如果判断出URL中存在原始锚链,则先删除原始锚链,再将携带有被分享网站的分享标识信息的锚链添加至URL中。
也即,如果分享链接自身原本就有锚链,则先去掉分享链接中自身原本就有的锚链,在将前述实施例中生成的预设锚链添加到分享链接的后面,进而完成分享。
由于有些URL自身带有锚链,这样,如果直接在这些URL的后面添加新的锚链,则会导致这些URL不可用。并且这些URL自身带有的锚链只是对页面起定位的作用,因此,在分享这些URL时,需要先删掉原有的锚链,再将前述实施中生成的具有标志作用的锚链添加这些URL的后面,并最终完成分享。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种分享回流量的统计方法,其特征在于,包括:
获取与本次访问相对应的网站地址统一资源定位符URL,所述URL为用于访问被分享网站的地址;
判断所述URL中是否存在携带有所述被分享网站的分享标识信息的锚链;以及
如果判断出所述URL中存在携带有所述被分享网站的分享标识信息的所述锚链,则将本次访问统计为一次分享回流量。
2.根据权利要求1所述的分享回流量的统计方法,其特征在于,在将本次访问统计为一次分享回流量之前,所述统计方法还包括:
如果判断出所述URL中存在携带有所述被分享网站的分享标识信息的所述锚链,则验证所述锚链是否正确,
其中,如果验证出所述锚链正确,则执行将本次访问统计为一次分享回流量的步骤。
3.根据权利要求2所述的分享回流量的统计方法,其特征在于,验证所述锚链是否正确包括:
获取与本次访问相对应的当前网站的关键字且获取用于提供所述URL的社交媒体的关键字;
根据所述当前网站的关键字、所述用于提供所述URL的社交媒体的关键字和所述URL生成待验证哈希值;以及
验证所述待验证哈希值与预设哈希值是否一致,其中,若所述待验证哈希值与所述预设哈希值一致,则所述锚链正确,若所述待验证哈希值与所述预设哈希值不一致,则所述锚链错误。
4.根据权利要求3所述的分享回流量的统计方法,其特征在于,通过以下方式生成所述预设哈希值:
获取所述被分享网站的关键字、目标社交媒体的关键字和所述URL,所述目标社交媒体为用于分享所述被分享网站的内容的社交媒体;以及
根据所述被分享网站的关键字、所述目标社交媒体的关键字和所述URL生成所述预设哈希值。
5.根据权利要求1所述的分享回流量的统计方法,其特征在于,所述锚链还携带有本次分享所述被分享网站的时间戳,在将本次访问统计为一次分享回流量的同时,所述统计方法还包括:
获取所述锚链所携带的本次分享所述被分享网站的所述时间戳;
根据获取的所述时间戳确定本次访问与本次分享的关联度;以及
根据所述关联度统计与本次分享相对应的分享回流量。
6.根据权利要求1所述的分享回流量的统计方法,其特征在于,通过以下方式将所述锚链添加至所述URL中:
判断所述URL中是否存在原始锚链;
如果判断出所述URL中存在所述原始锚链,则先删除所述原始锚链,再将所述携带有所述被分享网站的分享标识信息的锚链添加至所述URL中。
7.一种分享回流量的统计装置,其特征在于,包括:
第一获取单元,用于获取与本次访问相对应的网站地址统一资源定位符URL,所述URL为用于访问被分享网站的地址;
判断单元,用于判断所述URL中是否存在携带有所述被分享网站的分享标识信息的锚链;以及
第一统计单元,用于在判断出所述URL中存在携带有所述被分享网站的分享标识信息的所述锚链时,将本次访问统计为一次分享回流量。
8.根据权利要求7所述的分享回流量的统计装置,其特征在于,所述统计装置还包括:
验证单元,用于在将本次访问统计为一次分享回流量之前,在判断出所述URL中存在携带有所述被分享网站的分享标识信息的所述锚链时,验证所述锚链是否正确,
其中,在验证出所述锚链正确时,则执行所述第一统计单元的功能。
9.根据权利要求8所述的分享回流量的统计装置,其特征在于,所述验证单元包括:
获取模块,用于获取与本次访问相对应的当前网站的关键字且获取用于提供所述URL的社交媒体的关键字;
生成模块,用于根据所述当前网站的关键字、所述用于提供所述URL的社交媒体的关键字和所述URL生成待验证哈希值;以及
验证模块,用于验证所述待验证哈希值与预设哈希值是否一致,其中,若所述待验证哈希值与所述预设哈希值一致,则所述锚链正确,若所述待验证哈希值与所述预设哈希值不一致,则所述锚链错误。
10.根据权利要求9所述的分享回流量的统计装置,其特征在于,所述统计装置还包括:生成单元,所述生成单元通过以下方式生成所述预设哈希值:
获取所述被分享网站的关键字、目标社交媒体的关键字和所述URL,所述目标社交媒体为用于分享所述被分享网站的内容的社交媒体;以及
根据所述被分享网站的关键字、所述目标社交媒体的关键字和所述URL生成所述预设哈希值。
11.根据权利要求7所述的分享回流量的统计装置,其特征在于,所述锚链还携带有本次分享所述被分享网站的时间戳,所述统计装置还包括:
第二获取单元,用于在将本次访问统计为一次分享回流量的同时,获取所述锚链所携带的本次分享所述被分享网站的所述时间戳;
确定单元,用于根据获取的所述时间戳确定本次访问与本次分享的关联度;以及
第二统计单元,用于根据所述关联度统计与本次分享相对应的分享回流量。
12.根据权利要求7所述的分享回流量的统计装置,其特征在于,所述统计装置还包括:添加单元,所述添加单元用于通过以下方式将所述锚链添加至所述URL中:
判断所述URL中是否存在原始锚链;
如果判断出所述URL中存在所述原始锚链,则先删除所述原始锚链,再将所述携带有所述被分享网站的分享标识信息的锚链添加至所述URL中。
CN201410758301.0A 2014-12-10 2014-12-10 分享回流量的统计方法和装置 Active CN104462392B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410758301.0A CN104462392B (zh) 2014-12-10 2014-12-10 分享回流量的统计方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410758301.0A CN104462392B (zh) 2014-12-10 2014-12-10 分享回流量的统计方法和装置

Publications (2)

Publication Number Publication Date
CN104462392A true CN104462392A (zh) 2015-03-25
CN104462392B CN104462392B (zh) 2017-11-21

Family

ID=52908427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410758301.0A Active CN104462392B (zh) 2014-12-10 2014-12-10 分享回流量的统计方法和装置

Country Status (1)

Country Link
CN (1) CN104462392B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611007A (zh) * 2015-10-26 2017-05-03 北京国双科技有限公司 转载回流数据的检测方法和装置
CN108259207A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 流量统计方法、客户端、服务器及***
WO2018153207A1 (zh) * 2017-02-23 2018-08-30 腾讯科技(深圳)有限公司 数据处理方法、服务器、终端及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101163045A (zh) * 2007-11-16 2008-04-16 北京金山软件有限公司 统计网页访问数据的方法及***
JP2008171233A (ja) * 2007-01-12 2008-07-24 Nec Corp リソース関係情報共有システム、方法およびプログラム
CN102682094A (zh) * 2012-04-26 2012-09-19 腾讯科技(深圳)有限公司 传播健康度的统计方法、***和装置
CN103688513A (zh) * 2013-06-29 2014-03-26 华为技术有限公司 内容分享方法和社交同步装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008171233A (ja) * 2007-01-12 2008-07-24 Nec Corp リソース関係情報共有システム、方法およびプログラム
CN101163045A (zh) * 2007-11-16 2008-04-16 北京金山软件有限公司 统计网页访问数据的方法及***
CN102682094A (zh) * 2012-04-26 2012-09-19 腾讯科技(深圳)有限公司 传播健康度的统计方法、***和装置
CN103688513A (zh) * 2013-06-29 2014-03-26 华为技术有限公司 内容分享方法和社交同步装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611007A (zh) * 2015-10-26 2017-05-03 北京国双科技有限公司 转载回流数据的检测方法和装置
CN106611007B (zh) * 2015-10-26 2020-02-07 北京国双科技有限公司 转载回流数据的检测方法和装置
CN108259207A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 流量统计方法、客户端、服务器及***
CN108259207B (zh) * 2016-12-29 2021-04-27 北京国双科技有限公司 流量统计方法、客户端、服务器及***
WO2018153207A1 (zh) * 2017-02-23 2018-08-30 腾讯科技(深圳)有限公司 数据处理方法、服务器、终端及***
CN108471376A (zh) * 2017-02-23 2018-08-31 腾讯科技(深圳)有限公司 数据处理方法、装置及***
CN108471376B (zh) * 2017-02-23 2020-11-10 腾讯科技(深圳)有限公司 数据处理方法、装置及***

Also Published As

Publication number Publication date
CN104462392B (zh) 2017-11-21

Similar Documents

Publication Publication Date Title
US11176573B2 (en) Authenticating users for accurate online audience measurement
Bujlow et al. A survey on web tracking: Mechanisms, implications, and defenses
CN109067541B (zh) 基于区块链的数据验证方法及装置、电子设备
ES2679286T3 (es) Distinguir usuarios válidos de robots, OCR y solucionadores de terceras partes cuando se presenta CAPTCHA
Gugelmann et al. An automated approach for complementing ad blockers’ blacklists
Rahman et al. Efficient and scalable socware detection in online social networks
US10078743B1 (en) Cross identification of users in cyber space and physical world
CN104184713B (zh) 终端识别方法、机器识别码注册方法及相应***、设备
KR20180082504A (ko) 애플리케이션 정보 위험 관리를 위한 방법 및 장치
Bujlow et al. Web tracking: Mechanisms, implications, and defenses
CN107483563A (zh) 防爬虫的数据查询方法和装置以及客户端和服务器
CN107241292B (zh) 漏洞检测方法及装置
CN110677384B (zh) 钓鱼网站的检测方法及装置、存储介质、电子装置
CN105141605B (zh) 会话方法、网站服务器及浏览器
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
US20130179421A1 (en) System and Method for Collecting URL Information Using Retrieval Service of Social Network Service
CN103095693A (zh) 定位访问数据库用户主机信息的方法
Serketzis et al. Actionable threat intelligence for digital forensics readiness
US10049231B2 (en) Method and system for obfuscating the properties of a web browser
CN110309669A (zh) 一种数据标注方法、装置及设备
Tongaonkar A look at the mobile app identification landscape
Farooqi et al. Canarytrap: Detecting data misuse by third-party apps on online social networks
CN106067879A (zh) 信息的检测方法及装置
CN104462392A (zh) 分享回流量的统计方法和装置
CN103188208B (zh) 网页访问的权限控制方法、***和呼叫中心

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Statistical method and statistical device for sharing return traffic

Effective date of registration: 20190531

Granted publication date: 20171121

Pledgee: Shenzhen Black Horse World Investment Consulting Co.,Ltd.

Pledgor: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Registration number: 2019990000503

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Patentee after: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Patentee before: BEIJING GRIDSUM TECHNOLOGY Co.,Ltd.

PP01 Preservation of patent right

Effective date of registration: 20240604

Granted publication date: 20171121