CN109388686A - 一种用户标识方法及装置 - Google Patents

一种用户标识方法及装置 Download PDF

Info

Publication number
CN109388686A
CN109388686A CN201710681882.6A CN201710681882A CN109388686A CN 109388686 A CN109388686 A CN 109388686A CN 201710681882 A CN201710681882 A CN 201710681882A CN 109388686 A CN109388686 A CN 109388686A
Authority
CN
China
Prior art keywords
user
domain
page
url
parameter preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710681882.6A
Other languages
English (en)
Inventor
包佳杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710681882.6A priority Critical patent/CN109388686A/zh
Publication of CN109388686A publication Critical patent/CN109388686A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种用户标识方法及装置,涉及计算机技术领域,主要目的在于提高用户统计结果的准确率,本发明的主要技术方案为:从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。本发明主要用于对用户进行标识。

Description

一种用户标识方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户标识方法及装置。
背景技术
随着互联网的普及与快速发展,人们的生活越来越多的依赖网络。Web站点为人们提供越来越多网络服务的同时,Web数据库存储的用户访问信息也急剧膨胀。用户访问的增加使企业决策人员难以把握用户的行为习惯,主流的Web Analytics工具使用JavaScript监控代码在网页端收集访问者行为数据和***信息数据,发送至数据仓库服务器。
当数据仓库服务器接收到数据后,会通过JavaScript监控代码来持久化用户标识,以统计用户数量。目前在很多网络应用场景下,服务器在用户访问网站时,会通过对用户标识的方式来进一步收集不同用户的行为数据,通常使用Cookie来进行用户标识,每个用户对应一个固定的Cookie标识,当标识过的用户再次访问网站时,通过Cookie标识能够读取该用户的特定信息。然而,同一个用户在访问不同网站时可能存在不同的主域,为了保证用户信息的安全性,当更换主域后,该用户对应的Cookie标识会失效,并且重新生成一个Cookie标识,这样就使得同一用户被统计为多个用户,导致用户统计结果不准确。
发明内容
有鉴于此,本发明提供一种用户标识方法及装置,主要目的在于提高用户统计结果的准确率。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明实施例提供了一种用户标识方法,包括:
从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;
将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;
当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
进一步地,所述从用户访问第一个页面生成的用户标识中提取预设参数包括:
从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;
对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
进一步地,在所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中之前,所述方法还包括:
建立目标域名库,所述目标域名库中记录有用户访问不同页面对应的主域名;
对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名。
进一步地,所述对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名包括:
获取用户访问所述第一个页面对应的主域名;
从所述目标域名库中过滤掉所述第一个页面对应的主域名,得到需要跨域的主域名。
进一步地,所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中包括:
将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
进一步地,所述当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识包括:
当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出user id和/或session id;
通过对所述user id和/或session id进行URL解码,得到预设参数;
根据所述预设参数对用户进行标识。
为了实现上述目的,根据本发明的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的用户标识方法。
为了实现上述目的,根据本发明的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的用户标识方法。
另一方面,本发明实施例还提供了一种用户标识装置,包括:
提取单元,用于从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;
添加单元,用于将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;
标识单元,用于当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
进一步地,所述提取单元包括:
第一提取模块,用于从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;
编码模块,用于对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
进一步地,所述装置还包括:
建立单元,用于建立目标域名库,所述目标域名库中记录有用户访问不同页面对应的主域名;
过滤单元,用于对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名。
进一步地,所述过滤单元包括:
获取模块,用于获取用户访问所述第一个页面对应的主域名;
过滤模块,用于从所述目标域名库中过滤掉所述第一个页面对应的主域名,得到需要跨域的主域名。
进一步地,所述添加单元,具体用于将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
进一步地,所述标识单元包括:
第二提取模块,用于当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出user id和/或session id;
解码模块,用于通过对所述user id和/或session id进行URL解码,得到预设参数;
标识模块,用于根据所述预设参数对用户进行标识。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例提供的一种用户标识方法及装置,通过将用户访问的第一个页面生成的用户标识中的预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL,由于该预设参数用于唯一标识用户信息,从而当用户访问某个跨域的主域名对应的页面时,通过从该页面的改写后的URL中提取出预设参数,对用户进行标识,保证用户标识的唯一性,避免出现一个用户对应多个用户标识的现象。与现有技术中直接采用Cookie标识作为用户标识的方法相比,本发明实施例通过提取用户标识中的预设参数,并将该预设参数添加至需要跨域的主域名所对应的各个页面的URL中,实现跨主域对用户进行标识,当用户访问某个跨主域对应的页面时,通过从跨域对应页面的URL中提取预设参数来对用户进行标识,保证在跨域情况下不会对用户进行多次统计,提高了用户统计结果的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的一种用户标识方法流程图;
图2为本发明实施例提供的另一种用户标识方法流程图;
图3为本发明实施例提供的一种用户标识装置的组成框图;
图4为本发明实施例提供的另一种用户标识装置的组成框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种用户标识方法,如图1所示,该方法通过将用户标识中提取的预设参数添加需要跨域的主域名所对应的各个页面的URL中,实现了跨主域对用户进行标识,对此本发明实施例提供以下具体步骤:
101、从用户访问第一个页面生成的用户标识中提取预设参数。
其中,第一个页面为用户浏览的任一网页,如淘宝网页、百度网页或者新浪新闻网页等,本发明实施例不进行限定。这里的用户标识为用户在访问页面过程中页面为了对不同用户进行区分而生成的用户标识,如Cookie标识、用户登陆ID或者用户设备编号等,对于本发明实施例,以Cookie标识为例,Cookie标识是存储在用户主机浏览器中的一小段文本信息,它不包含任何可执行代码,当用户访问第一个页面时,服务器一旦从网络连接上无法获知用户身份,会向客户端颁发一个通行证Cookie标识,当用户再次访问该页面时,服务器通过Cookie标识确认用户身份。
其中,Cookie标识的预设参数用于唯一标识用户信息,可以为Cookie标识中用户登陆名、用户登陆密码等用户标识,可以为浏览器与服务器交互的会话标识,还可以为用户标识与会话标识相结合后的标识,本发明实施例不进行限定。
102、将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL。
通常情况下,很多网站都会使用Cookie标识作为用户标识,由于不同网站对应主域名有所不同,使得同一用户在使用Cookie标识对用户进行标识的过程中会产生多个用户标识,例如Google会向客户端颁发Cookie标识,Baidu也会向客户端颁发Cookie标识,由于Google与Baidu的主域名不同,在浏览器访问Google时并不会携带浏览器访问Baidu颁发的Cookie标识,同理,在浏览器访问Baidu时也不会携带浏览器访问Google颁发的Cookie标识,而此时同一用户会存在两个不同的Cookie标识,使得通过Cookie标识作为用户标识无法保证用户标识的唯一性。
对于本发明实施例,由于预设参数能够标识用户信息,通过将预设参数添加至需要跨域的主域名所对应的各个页面的URL中,使得在跨主域页面访问时,浏览器能够通过预设参数来标识用户,保证用户标识唯一。
103、当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
对于本发明实施例,当用户访问第一个页面时,客户端会得到第一个页面对应服务器发送的Cookie标识,当用户访问某个跨域的主域名对应的页面时,由于该页面与第一个页面对应的主域名不同,用户页面访问行为属于跨域访问,由于预先在需要跨域的主域名对应的页面URL中添加有预设参数,客户端会从该页面的URL中提取出预设参数,通过预设参数对用户进行标识,即使用户在访问不同主域名对应的Cookie标识是不一样的,而只要从Cookie标识中提取出的预设参数是相同的,这里当用户在进行跨域访问页面时,不会使用在客户端保存的多个Cookie标识对用户进行标识,而是使用从Cookie标识中提取出的唯一的预设参数对用户进行标识,保证用户标识的唯一性,同时也提高了用户统计结果的准确性。
针对本发明的实施例提供的一种用户标识方法,通过将用户访问的第一个页面生成的用户标识中的预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL,由于该预设参数用于唯一标识用户信息,从而当用户访问某个跨域的主域名对应的页面时,通过从该页面的改写后的URL中提取出预设参数,对用户进行标识,保证用户标识的唯一性,避免出现一个用户对应多个用户标识的现象。与现有技术中直接采用Cookie标识作为用户标识的方法相比,本发明实施例通过提取用户标识中的预设参数,并将该预设参数添加至需要跨域的主域名所对应的各个页面的URL中,实现跨主域对用户进行标识,当用户访问某个跨主域对应的页面时,通过从跨域对应页面的URL中提取预设参数来对用户进行标识,保证在跨域情况下不会对用户进行多次统计,提高了用户统计结果的准确性。
以下为了更加详细地说明本发明提出的一种用户标识方法,特别是针对当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识的步骤,本发明实施例还提供了另一种用户标识方法,如图2所示,该方法的具体的步骤包括:
201、从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id。
对于数据统计或者数据挖掘而言,用户是非常重要的维度,通过识别用户能够挖掘出用户对应的行为数据。一般而言,为了准确识别用户,当用户在浏览页面过程中,服务器会向客户端发送Cookie标识,以便根据Cookie标识来标识用户对应的行为数据。由于Cookie是服务器端生成的,并通过请求相应发送给用户浏览器端,浏览器会将Cookie标识保存到某个目录下的文本文件内,当下次请求同一主域名网站时就将该Cookie标识发送给服务器,进而对用户进行标识。
其中,Cookie标识记录有服务器在客户端保存一小段文本信息,该文本信息中记录有不同的用来标识用户的信息,比如用户标识符user id、用户密码、会话标识符sessionid等。
上述的user id和session id为Cookie标识中的一部分标识信息,能够唯一标识用户信息,本发明实施例通过从用户访问第一页面生成的Cookie标识中提取user id和/或session id,进一步将提取到的一个或多个标识信息来替代Cookie标识作为用户标识,以便当用户进行跨域的页面访问时,通过识别替代的标识作为用户标识。
202、对所述user id和/或session id进行URL编码,得到所述Cookie标识的预设参数。
其中,URL编码是一种浏览器用来打包表单输入的格式。浏览器从表单中获取所有的name和其中的值,将它们以name/value参数编码(移去那些不能传送的字符,将数据排行等等)作为URL的一部分或者分离地发给服务器。相应地,JavaScript中也提供有相应的URL编码函数,如escape、encodeURI或encodeURIComponent。
通常情况下,浏览器会自动将输入到地址栏的非数字字母转换为URL编码,对于本发明实施例,为了将从Cookie标识中提取出的标识信息添加至页面的URL中,需要对参数进行URL编码,进而将参数转换为符合URL格式的字符串,得到Cookie标识的预设参数,该预设参数用于唯一标识用户信息。
203、建立目标域名库。
其中,目标域名库中记录有用户访问不同页面对应的主域名,如淘宝页面对应的主域名为taobao.com、百度页面对应的主域名为***.com,本发明实施例对目标域名库中记录的主域名数量不进行限定,当然还可以随时更新域名库中的主域名。
本发明实施例通过建立目标域名库,收集不同页面的主域名,以便于在后续页面访问时,能够根据目标域名库判断页面访问是否为跨主域,并且根据目标域名库中的主域名对需要跨域的主域名所对应的各个页面的URL中附加预设参数。
204、对所述目标域名库中的主域名进行过滤。
由于目标域名库中记录有多个不同页面的主域名,可以包括第一个页面的主域名,而用户在访问第一个页面时已经记录了该用户的Cookie标识,即便再次访问第一页面服务器也会根据Cookie标识来识别用户,因此,目标域名库中无需再次记录该页面的主域名。
对于本发明实施例,对目标域名库中的主域名进行过滤也就是对目标域名库中第一个页面的主域名进行过滤,进而保留需要跨域的主域名,首先获取用户访问第一个页面对应的主域名,具体可以通过提取第一个页面对应的URL来获取第一页面对应的主域名,如taobao.com,然后从目标域名库中将主域名为taobao.com的主域名进行过滤,保留其他不同页面的主域名,即为需要跨域到的主域名。
205、将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
由于用户在访问不同主域名对应的页面的时候,为了保证用户隐私安全,不同主域名对应的服务器会生成自己Cookie标识,此时通过Cookie标识是无法表明跨主域用户的唯一性,对于本发明实施例,通过将预先从Cookie标识中提取的预设参数附加在需要跨域的主域名所对应的各个页面的URL末尾,例如,预设参数为xxx,需要跨域的主域名所对应的页面为www.a.com,则附加预设参数后该页面的URL可以为www.a.com=xxx。
需要说明的是,由于使用该预设参数替代Cookie标识来标识用户具有唯一性,以便于后续用户访问跨域的主域名所对应的页面时,采用替代的预设参数来标识用户,保证了用户标识的唯一性。
206、当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出user id和/或session id。
对于本发明实施例,当用户访问第一个页面时,客户端会得到第一个页面对应服务器发送的Cookie标识,当用户访问某个跨域的主域名对应的页面时,由于该页面与第一个页面对应的主域名不同,用户页面访问行为属于跨域访问,并且在跨域的主域名对应的页面的URL中预先添加的user id和/或session id,在访问某个跨域的主域名对应的页面时,由于该页面对应服务器发送的Cookie标识无法保证用户标识的唯一性,客户端会通过页面监测代码从跨域的主域名对应的页面的URL中提取出user id和/或session id,通过提取出的user id和/或session id进一步保证用户标识的唯一性。
207、通过对所述user id和/或session id进行URL解码,得到预设参数。
其中,URL解码是URL编码的逆过程,通过对user id和/或session id进行URL解码,能够提取出URL中的name/value参数编码。相应地,JavaScript中也提供有相应的URL解码函数,如unescape、decodeURI或decodeURIComponent。
208、根据所述预设参数对用户进行标识。
由于一个用户访问不同页面时服务器会生成不同主域对应的Cookie标识,而不同主域对应的Cookie标识无法共用,这样对用户识造成不便,导致一个用户有多个Cookie标识,而本发明实施例当用户访问某个跨域的主域名对应的页面时,通过从该页面的URL中提取预先附加的预设参数,该预设参数相当于用户首次访问页面生成的Cookie标识,进一步将该预设参数作为用户标识,保证了用户标识的唯一性,实现了跨主域的Cookie标识能够标识同一用户。
需要说明的是,在用户访问第一个页面后,如果用户再次访问其他页面时并未跨域,由于用户在访问第一个页面的时候生成有Cookie标识,并且在第一个页面的URL中也没有附加任何预设参数,则可直接采用用户访问第一个页面时生成的Cookie标识,来对用户进行标识。
对于本发明实施例,具体的应用场景可以包括但不局限于下述实现方式,当用户访问A页面时,服务器会向浏览器发送Cookie标识,以便后续根据该Cookie标识来识别用户,然后从Cookie标识中提取用户user id和session id,并对user id和session id进行编码,得到预设参数,进一步建立目标域名库,该目标域名库中记录有不同页面对应的主域名,包括A页面对应的主域名以及其他跨域的主域名,如页面B、页面C的主域名,由于A页面对应的主域名已存在用户的Cookie标识,进一步从目标域名库中过滤掉A页面对应的主域名,保留需要跨域的主域名,以节省后续操作,将预设参数附加在需要跨域的主域名所对应的各个页面的URL末尾,当用户访问B页面或者C页面等其他跨域的主域名对应的页面时,并非将跨域的主域名对应的页面服务器发送的Cookie标识作为用户标识,而是通过监测代码优先从页面B或者页面C等其他跨域的主域名所对应的URL中获取user id和session id,并且进行URL解码,得到预设参数,将该预设参数作为用户标识,从而保证即使用户访问跨域的主域名所对应的页面时,该用户对应用户标识仍然具有唯一性。
针对本发明实施例提供的另一种用户标识方法,通过将用户访问的第一个页面生成的用户标识中的预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL,由于该预设参数用于唯一标识用户信息,从而当用户访问某个跨域的主域名对应的页面时,通过从该页面的改写后的URL中提取出预设参数,对用户进行标识,保证用户标识的唯一性,避免出现一个用户对应多个用户标识的现象。与现有技术中直接采用Cookie标识作为用户标识的方法相比,本发明实施例通过提取用户标识中的预设参数,并将该预设参数添加至需要跨域的主域名所对应的各个页面的URL中,实现跨主域对用户进行标识,当用户访问某个跨主域对应的页面时,通过从跨域对应页面的URL中提取预设参数来对用户进行标识,保证在跨域情况下不会对用户进行多次统计,提高了用户统计结果的准确性。
另外,通过将目标域名库中第一个页面的主域名进行过滤,使得用户在访问第一个页面的主域名对应的其他页面时无需从页面URL中提取预设参数来标识用户,由于该页面与第一个页面所对应的主域名相同,可以直接将第一个页面生成的Cookie标识作为用户标识即可,节省了后续在访问与第一个页面主域名相同的其他页面时不必要的操作。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述所述的用户标识方法。
为了实现上述目的,根据本发明的另一方面,本发明实施例还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述所述的用户标识方法。
进一步的,作为对上述图1及图2所示方法的实现,本发明另一实施例还提供了一种用户标识装置。该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。该装置能够跨主域对用户进行标识,提高了用户统计结果的准确率,具体如图3所示,该装置包括:
提取单元31,可以用于从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;
添加单元32,可以用于将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;
标识单元33,可以用于当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
针对本发明的实施例提供了一种用户标识装置,通过将用户访问的第一各页面生成的用户标识中的预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL,由于该预设参数用于唯一标识用户信息,从而当用户访问某个跨域的主域名对应的页面时,通过从该页面的改写后的URL中提取出预设参数,对用户进行标识,保证用户标识的唯一性,避免出现一个用户对应多个用户标识的现象。与现有技术中直接采用Cookie标识作为用户标识的方法相比,本发明实施例通过提取用户标识中的预设参数,并将该预设参数添加至需要跨域的主域名所对应的各个页面的URL中,实现跨主域对用户进行标识,当用户访问某个跨主域对应的页面时,通过从跨域对应页面的URL中提取预设参数来对用户进行标识,保证在跨域情况下不会对用户进行多次统计,提高了用户统计结果的准确性。
进一步的,如图4所示,所述装置还包括:
建立单元34,可以用于建立目标域名库,所述目标域名库中记录有用户访问不同页面对应的主域名;
过滤单元35,可以用于对所述目标域名库中的主域名进行过滤。
进一步地,所述提取单元31包括:
第一提取模块311,可以用于从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;
编码模块312,可以用于对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
进一步地,所述添加单元32,具体可以用于将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
进一步地,所述标识单元33包括:
第二提取模块331,可以用于当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出user id和/或session id;
解码模块332,可以用于通过对所述user id和/或session id进行URL解码,得到预设参数;
标识模块333,可以用于根据所述预设参数对用户进行标识。
进一步地,所述过滤单元35包括:
获取模块351,可以用于获取用户访问所述第一个页面对应的主域名;
过滤模块352,可以用于从所述目标域名库中过滤掉所述第一个页面对应的主域名,得到需要跨域的主域名。
针对本发明实施例提供的另一种用户标识装置,通过将用户访问的第一各页面生成的用户标识中的预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL,由于该预设参数用于唯一标识用户信息,从而当用户访问某个跨域的主域名对应的页面时,通过从该页面的改写后的URL中提取出预设参数,对用户进行标识,保证用户标识的唯一性,避免出现一个用户对应多个用户标识的现象。与现有技术中直接采用Cookie标识作为用户标识的方法相比,本发明实施例通过提取用户标识中的预设参数,并将该预设参数添加至需要跨域的主域名所对应的各个页面的URL中,实现跨主域对用户进行标识,当用户访问某个跨主域对应的页面时,通过从跨域对应页面的URL中提取预设参数来对用户进行标识,保证在跨域情况下不会对用户进行多次统计,提高了用户统计结果的准确性。
另外,通过将目标域名库中第一个页面的主域名进行过滤,使得用户在访问第一个页面的主域名对应的其他页面时无需从页面URL中提取预设参数来标识用户,由于该页面与第一个页面所对应的主域名相同,可以直接将第一个页面生成的Cookie标识作为用户标识即可,节省了后续在访问与第一个页面主域名相同的其他页面时不必要的操作。
所述用户标识装置包括处理器和存储器,上述提取单元31、添加单元32和标识单元33等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高用户统计结果的准确率。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述用户标识方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述用户标识方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种用户标识方法,包括:从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
进一步地,所述从用户访问第一个页面生成的用户标识中提取预设参数包括:从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
进一步地,在所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中之前,所述方法还包括:建立目标域名库,所述目标域名库中记录有用户访问不同页面对应的主域名;对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名。
进一步地,所述对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名包括:获取用户访问所述第一个页面对应的主域名;从所述目标域名库中过滤掉所述第一个页面对应的主域名,得到需要跨域的主域名。
进一步地,所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中包括:将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
进一步地,所述当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识包括:当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出user id和/或session id;通过对所述user id和/或session id进行URL解码,得到预设参数;根据所述预设参数对用户进行标识。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种用户标识方法,其特征在于,包括:
从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;
将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;
当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
2.根据权利要求1所述的方法,其特征在于,所述从用户访问第一个页面生成的用户标识中提取预设参数包括:
从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;
对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
3.根据权利要求1所述的方法,其特征在于,在所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中之前,所述方法还包括:
建立目标域名库,所述目标域名库中记录有用户访问不同页面对应的主域名;
对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标域名库中的主域名进行过滤,得到需要跨域的主域名包括:
获取用户访问所述第一个页面对应的主域名;
从所述目标域名库中过滤掉所述第一个页面对应的主域名,得到需要跨域的主域名。
5.根据权利要求1所述的方法,其特征在于,所述将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中包括:
将所述预设参数附加在所述需要跨域的主域名所对应的各个页面的URL末尾。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识包括:
当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出userid和/或session id;
通过对所述user id和/或session id进行URL解码,得到预设参数;
根据所述预设参数对用户进行标识。
7.一种用户标识装置,其特征在于,包括:
提取单元,用于从用户访问第一个页面生成的用户标识中提取预设参数,所述预设参数用于唯一标识用户信息;
添加单元,用于将所述预设参数添加至需要跨域的主域名所对应的各个页面的URL中,得到改写后的URL;
标识单元,用于当用户访问某个跨域的主域名对应的页面时,从该页面的改写后的URL中提取出预设参数,对用户进行标识。
8.根据权利要求7所述的装置,其特征在于,所述提取单元包括:
第一提取模块,用于从用户访问第一个页面生成的Cookie标识中提取用户的用户标识符user id和/或会话标识符session id;
编码模块,用于对所述用户的user id和/或session id进行URL编码,得到用户标识中的预设参数。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求6中任意一项所述的用户标识方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至权利要求6中任意一项所述的用户标识方法。
CN201710681882.6A 2017-08-10 2017-08-10 一种用户标识方法及装置 Pending CN109388686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710681882.6A CN109388686A (zh) 2017-08-10 2017-08-10 一种用户标识方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710681882.6A CN109388686A (zh) 2017-08-10 2017-08-10 一种用户标识方法及装置

Publications (1)

Publication Number Publication Date
CN109388686A true CN109388686A (zh) 2019-02-26

Family

ID=65414421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710681882.6A Pending CN109388686A (zh) 2017-08-10 2017-08-10 一种用户标识方法及装置

Country Status (1)

Country Link
CN (1) CN109388686A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110062342A (zh) * 2019-03-28 2019-07-26 山西智网科技有限公司 用于统计含链接网址的短信打开的用户及阅读时间的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101222348A (zh) * 2007-01-10 2008-07-16 阿里巴巴公司 统计网站真实用户的方法及***
CN103051637A (zh) * 2012-12-31 2013-04-17 北京亿赞普网络技术有限公司 用户识别方法与装置
CN103237094A (zh) * 2013-04-17 2013-08-07 北京亿赞普网络技术有限公司 一种识别用户的方法及装置
US20130246630A1 (en) * 2012-03-14 2013-09-19 International Business Machines Corporation Dynamic web session clean-up
CN104486458A (zh) * 2014-12-15 2015-04-01 北京国双科技有限公司 跨域会话的数据处理方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101222348A (zh) * 2007-01-10 2008-07-16 阿里巴巴公司 统计网站真实用户的方法及***
US20130246630A1 (en) * 2012-03-14 2013-09-19 International Business Machines Corporation Dynamic web session clean-up
CN103051637A (zh) * 2012-12-31 2013-04-17 北京亿赞普网络技术有限公司 用户识别方法与装置
CN103237094A (zh) * 2013-04-17 2013-08-07 北京亿赞普网络技术有限公司 一种识别用户的方法及装置
CN104486458A (zh) * 2014-12-15 2015-04-01 北京国双科技有限公司 跨域会话的数据处理方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110062342A (zh) * 2019-03-28 2019-07-26 山西智网科技有限公司 用于统计含链接网址的短信打开的用户及阅读时间的方法

Similar Documents

Publication Publication Date Title
US11768802B2 (en) Method and system for applying data retention policies in a computing platform
US9659105B2 (en) Methods and apparatus to track web browsing sessions
CN103607385B (zh) 基于浏览器进行安全检测的方法和装置
CN105446750B (zh) WebApp启动运行、生成镜像文件的方法和装置
KR102504075B1 (ko) 사용자 디바이스 이벤트의 매칭 및 속성
CN109194671B (zh) 一种异常访问行为的识别方法及服务器
US10885466B2 (en) Method for performing user profiling from encrypted network traffic flows
CN110968760A (zh) 网页数据的爬取方法、装置、网页登录方法及装置
CN109241733A (zh) 基于Web访问日志的爬虫行为识别方法及装置
CN108429785A (zh) 一种爬虫识别加密串的生成方法、爬虫识别方法及装置
CN108156118A (zh) 用户身份标识方法及装置
CN110020339A (zh) 基于无埋点的网页数据采集方法及装置
CN105159992A (zh) 一种应用程序的页面内容及网络行为的检测方法及装置
CN105528352B (zh) 建立移动通信用户与其网络账户信息的对应关系的方法
US11557005B2 (en) Addressing propagation of inaccurate information in a social networking environment
CN111241547B (zh) 一种越权漏洞的检测方法、装置及***
CN109388686A (zh) 一种用户标识方法及装置
CN104811418A (zh) 病毒检测的方法及装置
CN110633432A (zh) 一种获取数据的方法、装置、终端设备及介质
CN108255878A (zh) 用户信息处理方法及相关装置
CN106657184B (zh) 日志信息的解析方法及装置
CN111818038A (zh) 一种网络数据获取识别方法以及装置
CN107968997A (zh) 一种移动终端识别方法、装置、网关设备及存储介质
CN109561121A (zh) 监控部署的方法及装置
Hilts et al. Half Baked: The opportunity to secure cookie-based identifiers from passive surveillance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20190226

RJ01 Rejection of invention patent application after publication