CN112948226B - 一种用户画像绘制方法和装置 - Google Patents

一种用户画像绘制方法和装置 Download PDF

Info

Publication number
CN112948226B
CN112948226B CN202110163487.5A CN202110163487A CN112948226B CN 112948226 B CN112948226 B CN 112948226B CN 202110163487 A CN202110163487 A CN 202110163487A CN 112948226 B CN112948226 B CN 112948226B
Authority
CN
China
Prior art keywords
data
user
analysis
interface
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110163487.5A
Other languages
English (en)
Other versions
CN112948226A (zh
Inventor
袁潇锋
肖群
王进
关宇坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202110163487.5A priority Critical patent/CN112948226B/zh
Publication of CN112948226A publication Critical patent/CN112948226A/zh
Application granted granted Critical
Publication of CN112948226B publication Critical patent/CN112948226B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及用户行为数据采集和分析技术领域,具体涉及一种用户画像绘制方法和装置。所述方法包括:利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;监听目标程序运行时界面的行为事件获取埋点数据;根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。本申请提供的用户画像绘制方案相较现有技术提高了用户画像绘制的准确性。

Description

一种用户画像绘制方法和装置
技术领域
本发明涉及用户行为数据采集和分析技术领域,具体涉及一种用户画像绘制方法和装置。
背景技术
用户画像又称用户角色,它作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域得到了广泛的应用,基本所有的APP经都需要并进行着用户画像的绘制从而为用户提供有针对性的服务,提升用户对APP的使用体验和用户粘度。可以说为了应对日益激烈的市场竞争,并在竞争中获得更多的用户资源,如何准确的把握客户,精准刻画用户画像并以此提升用户体验成为了一个在不断深入研究的话题。用户行为数据的采集和分析是用户画像绘制的至关重要的前提。目前互联网用户行为数据的采集主流均采用是埋点技术,也有很多埋点方案,但是目前的埋点技术方案在埋点过程中会出现对应用代码的侵入性较大的问题,对后续应用管理和应用维护造成影响,以及增加了埋点过程中的资源消耗,降低埋点效率的问题。
发明内容
本申请的目的旨在至少能解决上述的技术缺陷之一。本申请所采用的技术方案如下:
第一方面,本申请实施例公开了一种用户画像绘制方法,所述方法包括:
利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
监听目标程序运行时界面的行为事件获取埋点数据;
根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。
进一步地,在目标程序中进行埋点包括:采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
进一步地,采用代码埋点技术在目标程序中进行埋点包括:
选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。
进一步地,,所述采用代码埋点技术在目标程序中进行埋点还包括:
在埋点代码中写入自调函数;
将所述埋点代码文件的运行使能状态设置为开启状态;或,将目标程序的运行使能参数与埋点代码文件的使能参数设置为同一参数。
进一步地,所述界面的行为事件获取埋点数据包括但不限于:点击事件、曝光事件、页面停留时间。
进一步地,所述预设的数据筛选规则包括以下至少之一:
剔除或修正超出预设频率的界面上下滑动事件;
剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;
剔除或修正其他超出预设频率的界面行为事件。
进一步地,所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件。
进一步地,将按照预设数据筛选和清洗规则处理后的埋点数据进行保存后再传递至服务器进行分析。
进一步地,所述分析所述埋点数据并绘制目标用户画像包括:按照预设维度分析所述获取的埋点数据,其中预设的维度包括:社会属性、生活习惯、消费行为。
进一步地,在按照预设维度分析所述获取的埋点数据之后,所述方法还包括:对所述获取的埋点数据进行以下至少一种方式的分析:流量统计分析、行为路径构建分析、用户设备管理分析。
另一方面本申请实施例提供了一种数据埋点装置,所述装置包括:埋点模块、监听模块、存储模块、处理模块、分析模块和绘制模块,其中,
所述埋点模块,用于利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
所述监听模块,用于监听目标程序运行时界面的行为事件获取埋点数据;
所述存储模块用于,存储预设的数据筛选和清洗规则;
所述处理模块,用于根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
所述分析模块,用于分析所述埋点数据;
所述绘制模块,用于绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。
进一步地,所述埋点模块具体用于采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
进一步地,所述埋点模块进一步包括:选取单元和接口单元;其中,
所述选取单元,用于选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
所述接口单元,用于通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。
进一步地,所述预设的数据筛选规则包括:剔除或修正超出预设频率的界面上下滑动事件,和/或,剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;和/或,剔除或修正其他超出预设频率的界面行为事件;
所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行上述任一实施例中所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
本申请实施例提供的数据埋点方案,利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;监听目标程序运行时界面的行为事件获取埋点数据;根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。本申请实施例提供的技术方案带来的有益效果是至少包括以下之一:
(1)本申请实施例中埋点代码文件与目标程序业务文件双方相对独立,互不影响、互不干扰,解决了目前各种埋点代码对原有页面和业务代码入侵较大的问题。
(2)本申请实施例中通过对数据处理后的埋点数据进行临时保存可以避免埋点数据的丢失,解决了目前现有技术中一些方案存在的用户网络或者设备出现故障导致埋点数据无法实时传输到服务器端的问题。
(3)本申请实施例通过对埋点数据进行预设规则的筛选和清洗,解决了目前现有技术埋点代码中出现的因在客户端上传数据过程中没有进行数据过滤,进而将很多无效数据上传到服务端,最终导致服务端收到大量冗余数据,影响数据分析准确性的情况。
(4)本申请实施例的方案相较现有技术提高了用户画像绘制的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种用户画像绘制方法的流程示意图;
图2为本申请实施例提供的一种数据埋点装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式,其中的“第一”“第二”等只是为了介绍清楚方案而进行的对象区分定义,并不对对象本身进行限制,当然“第一”和“第二”限定的对象可能是同一个终端、设备和用户等,也可能是同一种终端、设备和用户。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
此外应理解,本申请实施例中“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A、B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一(项)个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,或a、b和c,其中a、b、c可以是单个,也可以是多个。
为了更清楚地介绍本申请的技术方案,以下介绍一些下述实施例可能涉及到的概念、术语或装置,以帮助理解本申请公开的数据埋点方案:
用户画像又称用户角色,它作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域得到了广泛的应用。用户画像是真实用户的虚拟代表,首先它是基于真实的,它不是一个具体的人,另外一个是根据目标的行为观点的差异,来区分成为不同类型,丛而将这些类型迅速组织在一起,然后把新得出的类型提炼出来,形成一个类型的用户画像。针对于一个具体需求,大概需要4-8种类型的用户画像来分析。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。
SDK(Software Development Kit,软件开发工具包)一般都是一些软件工程师为特定的软件包、软件框架、硬件平台、操作***等建立应用软件时的开发工具的集合。
所谓“埋点”指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。根据埋点技术可分为:代码埋点和可视化埋点。在应用的测试阶段或应用线上运行阶段,埋点都是必不可少的环节,尤其是在运行阶段各种APP需要将埋点获取的用户每个操作行为进行具体分析,并将这些信息抽象成标签,然后利用这些标签来将用户形象更加具体化,从而为用户提供有针对性的服务。本申请实施例就提供一种基于埋点技术的用户画像绘制方案。
IMEI(International Mobile Equipment Identity):国际移动设备身份码
IMSI(International Mobile Subscriber Identification Number):国际移动用户识别码
UUID(Universally Unique Identifier):通用唯一识别码
MAC(Media Access Control Address):媒体访问控制地址
placeholder属性提供可描述输入字段预期值的提示信息,该提示会在输入字段为空时显示,并会在字段获得焦点时消失。
图1示出了本申请实施例提供的一种数据埋点的流程示意图,如图1所示,该方法主要可以包括:
S101、利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
在进一步的可选实施例中,在目标程序中进行埋点包括:采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
在优选实施例中,采用代码埋点技术在目标程序中进行埋点的实现流程包括:
步骤1、选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
步骤2、通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。本申请实施例中埋点代码文件与目标程序业务文件双方相对独立,互不影响、互不干扰,解决了目前各种埋点代码对原有页面和业务代码入侵较大的问题。
具体地,所述采用代码埋点技术在目标程序中进行埋点还包括:
步骤1、在埋点代码中写入自调函数;即实现在目标程序中加载该代码文件时自动运行埋点代码。
步骤2-1、将所述埋点代码文件的运行使能状态设置为开启状态,即使得埋点代码一直处于运行状态来监控用户终端的界面,获取界面行为事件;或者,可选地采用步骤2-2的方式;
步骤2-2、将目标程序的运行使能参数与埋点代码文件的使能参数设置为同一参数,即当目标程序运行时,其相关的埋点代码也同步运行开始监听目标程序运行界面的行为事件,同理当目标程序处结束运行时,相关的埋点代码也停止加载和运行。
进一步地,在埋点代码文件中采用绑定全局点击事件的方法来获取用户的界面操作行为,当用户进入程序运行界面进行界面滑动浏览、点击内容等操作时,会根据用户点击界面中不同的元素DOM属性,分别来进行处理。例如:
(1)用户点击了界面中<b></b>、<p></p>、<span></span>、<text></text>、<view></view>等标签时需要通过元素的innerText属性来获取被点击元素的内容。
(2)用户点击了界面中<img/>标签时,需要通过元素的currentSrc属性来获取被点击元素的网络地址,通过元素的title属性来获取该图片的title值。此外,还可以根据该元素中的其他属性获取图片大小、点击位置等信息。
(3)用户点击了界面中<button>标签时,需要通过元素的innerText属性来获取被点击元素的内容,通过type属性来获取被点击元素的类型。
(4)还可以通过用户点击界面中开发者自定义的页面元素标签,来获取相应内容。
S102、监听目标程序运行时界面的行为事件获取埋点数据;在进一步的可选实施例中,所述界面的行为事件获取埋点数据包括但不限于:点击事件、曝光事件、页面停留时间等界面操作行为事件来实时获取用户的操作行为信息。同时根据用户的操作行为来分析受访页面属性,其中包括当前界面路径、进入时间、离开时间、停留时间、来源渠道、是否是首访页、是否是退出页。
S103、根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
在进一步的可选实施例中,所述预设的数据筛选规则包括以下至少之一:
(1)剔除或修正超出预设频率的界面上下滑动事件;
(2)剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;例如:按钮、图片、文字、页面空白区域等。
(3)剔除或修正其他超出预设频率的界面行为事件。例如,用户频繁滑动页面中banner广告轮播图,或者频繁点击下一页等情况,或频繁点击页面元素进行跳转或者频繁进行跳转、返回等操作。
在进一步的可选实施例中,所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件,即检查分析处理数据是否属于一个行为闭环,例如:界面打开、界面浏览、界面关闭(或者界面跳转)等行为。举例来说,在用户使用过程中,埋点代码监听到如下行为信息:
(1)用户在2020-6-28 14:52:28打开了界面A,并在界面A中停留了13秒,期间还触发了一次界面滑动事件,通过行为分析我们认定用户是在浏览界面A。
(2)用户在2020-6-28 14:52:41点击了界面A中某个广告图片B,并跳转到界面B中,我们就会记录该点击和界面跳转行为。
(3)假如此时用户网络或者硬件设备出现问题,导致埋点代码并没有获取到用户在界面A中点击图片B的具体行为和离开界面A的具体时间,而只获取到了进入界面B的具体时间。通过接口将缺失数据传递到服务端之前,会按照逻辑将缺失数据进行部分补全、重写甚至覆盖,并做好该条数据的异常标记工作。
本申请实施例通过对埋点数据进行预设规则的筛选和清洗,解决了目前现有技术埋点代码中出现的因在客户端上传数据过程中没有进行数据过滤,进而将很多无效数据上传到服务端,最终导致服务端收到大量冗余数据,影响数据分析准确性的情况。
进一步的可选实施例中,将按照预设数据筛选和清洗规则处理后的埋点数据进行保存后再传递至服务器进行分析,可以避免埋点数据的丢失,解决了目前现有技术中一些方案存在的用户网络或者设备出现故障导致埋点数据无法实时传输到服务器端的问题。
通过上述方式进行数据处理后通过相关接口将处理后的埋点数据传递到服务端进行汇总和分析,即进行步骤S104的操作。
S104、分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。
在进一步的可选实施例中,所述分析所述埋点数据并绘制目标用户画像的分析步骤包括:
步骤1、对汇总的埋点数据进行常规数据统计的处理、分析和建模;
步骤2、按照预设维度分析所述获取的埋点数据,其中预设的维度包括:社会属性、生活习惯、消费行为,其中三个维度的具体信息如下:
社会属性可以包括年龄,性别,地域,学历,职业,婚姻状况,住房车辆等。
生活习惯可以包括运动,休闲,旅游,饮食起居,购物,游戏,体育,文化等。
消费行为(基于产品)可以包括消费金额、消费次数、消费时间、消费频次等。
在进一步的可选实施例中,在按照预设维度分析所述获取的埋点数据之后,所述方法还包括:对所述获取的埋点数据进行以下至少一种方式的分析:流量统计分析、行为路径构建分析、用户设备管理分析。三种分析方式的具体分析内容如下:
1、流量统计分析
(1)按在线情况分析
在线情况分析分别记录在线用户的活动信息,包括:来访时间、访客地域、来路页面、当前停留页面等,这些功能对企业实时掌握自身网站流量有很大的帮助。
(2)按时段分析
时段分析会提供网站(或者APP)在任意时间段内的流量变化情况,或者某一段时间到某一段时间的流量变化情况,比如小时段分布、日访问量分布,对于企业了解用户浏览网页的的时间段有一个很好的分析。
(3)按来源分析
来源分析能够为企业提供来路域名带来的来访次数、IP、独立访客、新访客、新访客浏览次数、站内总浏览次数等数据。这个数据可以直接让企业了解推广成效的来路,从而分析出通过哪些途径,或者网站投放的广告效果更明显。
2、行为路径构建分析
通过对处理后的信息进行关联,获取用户的整条行为链路。例如:用户A在首页通过点击banner第三张图片,进入活动页H,在活动页H点击导航第三排第四个推广位进入某个商品D页面,最后用户浏览三十秒后将其加入购物车,并下单付款。
3、用户设备管理分析包括但不限于使用以下几种数据对用户设备进行管理:
国际手机唯一标识IMEI、国际移动用户识别码IMSI、Android ID、设备ID、UUID(在程序安装后第一次运行时生成一个ID,用来标识每一份应用程序的唯一ID,即Installation ID,可以用来跟踪应用的安装数量等)、MAC地址、下载渠道Channel、APP版本、用户行为参数(可以在APP或页面设计是对用户行为进行分类并给与分类参数定义)等。
通过以上数据分析后可以得到一个完整的用户信息数据库,可以通过各种各样的标签进行用户筛选,进一步通过用户筛选可以实现精准推送短信、App消息推送、个性化广告等内容,指导产品优化,甚至做到产品功能的私人定制等。单看数据难以找到数据之间微妙的联系,还可以利用图表,如折线图、柱形图、饼图和散点图等,进行分析和研究。
基于图1所示的用户画像绘制方法,另一方面本申请实施例提供了一种数据埋点装置,如图2所示,装置可以包括:201埋点模块、202监听模块、203存储模块、204处理模块、205分析模块和206绘制模块,其中,
所述201埋点模块,用于利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
所述202监听模块,用于监听目标程序运行时界面的行为事件获取埋点数据;
所述203存储模块用于,存储预设的数据筛选和清洗规则;
所述204处理模块,用于根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
所述205分析模块,用于分析所述埋点数据;
所述206绘制模块,用于绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。
进一步地,所述201埋点模块具体用于采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
进一步地,所述201埋点模块进一步包括:2011选取单元和2012接口单元;其中,
所述2011选取单元,用于选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
所述2012接口单元,用于通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。
进一步地,所述预设的数据筛选规则包括:剔除或修正超出预设频率的界面上下滑动事件,和/或,剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;和/或,剔除或修正其他超出预设频率的界面行为事件;
所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件。
可以理解的是,本实施例中的数据埋点装置的上述各组成设备具有实现图1中所示的实施例中的方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块或装置。上述模块和装置可以是软件和/或硬件,上述各模块和装置可以单独实现,也可以多个模块和装置集成实现。对于上述各模块和装置的功能描述具体可以参见图1中所示实施例中的方法的对应描述,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
可以理解的是,本发明实施例示意的结构并不构成对数据埋点装置的具体结构的具体限定。在本申请另一些实施例中,数据埋点装置可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
本申请实施例提供了一种电子设备,包括处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本申请任一实施方式中所提供的用户画像绘制方法。
作为一个示例,图3示出了本申请实施例所适用的一种电子设备的结构示意图,如图3所示,该电子设备300包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。可选的,电子设备300还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一个。可以理解的是,本发明实施例示意的结构并不构成对电子设备300的具体结构的具体限定。在本申请另一些实施例中,电子设备300可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实。可选地,电子设备还可以包括显示屏305,用于显示图像,或需要时接收用户的操作指令。
其中,处理器301应用于本申请实施例中,用于实现上述方法实施例所示的方法。收发器304可以包括接收机和发射机,收发器304应用于本申请实施例中,用于执行时实现本申请实施例的电子设备与其他设备通信的功能。
处理器301可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
处理器301也可以包括一个或多个处理单元,例如:处理器301可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphicsprocessingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(Neural-network Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是电子设备300的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器301中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器301中的存储器为高速缓冲存储器。该存储器可以保存处理器301刚用过或循环使用的指令或数据。如果处理器301需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器301的等待时间,因而提高了***的效率。
处理器301可以运行本申请实施例提供的用户画像绘制方法,以便于降低用户的操作复杂度、提高终端设备的智能化程度,提升用户的体验。处理器301可以包括不同的器件,比如集成CPU和GPU时,CPU和GPU可以配合执行本申请实施例提供的用户画像绘制方法,比如用户画像绘制方法中部分算法由CPU执行,另一部分算法由GPU执行,以得到较快的处理效率。
总线302可包括一通路,在上述组件之间传送信息。总线302可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器303可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘),也可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flashstorage,UFS),或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选的,存储器303用于存储执行本申请方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现本申请任一实施方式中所提供的用户画像绘制方法。
存储器303可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器301通过运行存储在存储器303的指令,从而执行电子设备300的各种功能应用以及数据处理。存储器303可以包括存储程序区和存储数据区。其中,存储程序区可存储操作***,应用程序的代码等。存储数据区可存储电子设备300使用过程中所创建的数据(比如相机应用采集的图像、视频等)等。
存储器303还可以存储本申请实施例提供的用户画像绘制方法对应的一个或多个计算机程序。该一个或多个计算机程序被存储在上述存储器303中并被配置为被该一个或多个处理器301执行,该一个或多个计算机程序包括指令,上述指令可以用于执行上述相应实施例中的各个步骤。
当然,本申请实施例提供的用户画像绘制方法的代码还可以存储在外部存储器中。这种情况下,处理器301可以通过外部存储器接口运行存储在外部存储器中的用户画像绘制方法的代码,处理器301可以控制运行数据埋点流程。
显示屏305包括显示面板。显示面板可以采用液晶显示屏(liquid crystaldisplay,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备300可以包括1个或N个显示屏305,N为大于1的正整数。显示屏305可用于显示由用户输入的信息或提供给用户的信息以及各种图形用户界面(graphical userinterface,GUI)。例如,显示屏305可以显示照片、视频、网页、或者文件等。
本申请实施例提供的电子设备,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的用户画像绘制方法。
本申请实施例提供的计算机可读存储介质,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的方法。本申请实施例提供的计算机程序产品,适用于上述方法任一实施例,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
本申请实施例提供的数据埋点方案,包括利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;监听目标程序运行时界面的行为事件获取埋点数据;根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表。本申请实施例中埋点代码文件与目标程序业务文件双方相对独立,互不影响、互不干扰,解决了目前各种埋点代码对原有页面和业务代码入侵较大的问题。此外本申请实施例解决了目前现有技术中一些方案存在的用户网络或者设备出现故障导致埋点数据无法实时传输到服务器端的问题,还解决了目前现有技术埋点代码中出现的因在客户端上传数据过程中没有进行数据过滤,进而将很多无效数据上传到服务端,最终导致服务端收到大量冗余数据,影响数据分析准确性的情况,相较现有技术提高了用户画像绘制的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块或单元的划分,仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以丢弃,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上内容,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,还可以做出若干改进和润饰,这些变化、替换、改进和润饰也应视为都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种用户画像绘制方法,其特征在于,所述方法包括:
利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
监听目标程序运行时界面的行为事件获取埋点数据;
根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
分析所述埋点数据并绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表;
所述预设的数据筛选规则包括以下至少之一:剔除或修正超出预设频率的界面上下滑动事件;剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;剔除或修正其他超出预设频率的界面行为事件;
所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件;
所述预设的数据清洗规则还包括:当用户网络或硬件设备出现问题导致获取的埋点数据缺失时,通过接口将缺失数据传递到服务端之前,按照逻辑将所述缺失数据进行部分补全、重写甚至覆盖,并做好所述缺失数据的异常标记工作;
所述分析所述埋点数据并绘制目标用户画像包括:按照预设维度分析所述获取的埋点数据,其中预设的维度包括:社会属性、生活习惯、消费行为;
在按照预设维度分析所述获取的埋点数据之后,所述用户画像绘制方法方法还包括:对所述获取的埋点数据进行以下至少一种方式的分析:流量统计分析、行为路径构建分析、用户设备管理分析;
所述流量统计分析包括按在线情况分析、按时段分析、按来源分析;按在线情况分析是指分别记录在线用户的活动信息,包括来访时间、访客地域、来路页面、当前停留页面;按时段分析是指提供网站或移动端应用程序在任意时间段内的流量变化情况,或者某一段时间到某一段时间的流量变化情况,包括小时段分布、日访问量分布;按来源分析是指提供来路域名带来的数据,包括来访次数、IP、独立访客、新访客、新访客浏览次数、站内总浏览次数;
所述行为路径构建分析包括通过对处理后的信息进行关联,获取用户的整条行为链路;
所述用户设备管理分析对用户设备进行管理使用的数据类型包括国际手机唯一标识IMEI、国际移动用户识别码IMSI、AndroidID、设备ID、UUID、MAC地址、下载渠道Channel、APP版本、用户行为参数。
2.根据权利要求1所述的用户画像绘制方法,其特征在于,在目标程序中进行埋点包括:
采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
3.根据权利要求2所述的用户画像绘制方法,其特征在于,采用代码埋点技术在目标程序中进行埋点包括:
选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。
4.根据权利要求3所述的用户画像绘制方法,其特征在于,所述采用代码埋点技术在目标程序中进行埋点还包括:
在埋点代码中写入自调函数;
将所述埋点代码文件的运行使能状态设置为开启状态;或,将目标程序的运行使能参数与埋点代码文件的使能参数设置为同一参数。
5.根据权利要求4所述的用户画像绘制方法,其特征在于,所述界面的行为事件获取埋点数据包括但不限于:
点击事件、曝光事件、页面停留时间。
6.根据权利要求1或5所述的用户画像绘制方法,其特征在于,将按照预设数据筛选和清洗规则处理后的埋点数据进行保存后再传递至服务器进行分析。
7.一种数据埋点装置,其特征在于,所述装置包括:埋点模块、监听模块、存储模块、处理模块、分析模块和绘制模块,其中,
所述埋点模块,用于利用SDK在目标程序中进行埋点;其中目标程序包括网页程序和/或APP程序;
所述监听模块,用于监听目标程序运行时界面的行为事件获取埋点数据;
所述存储模块用于,存储预设的数据筛选和清洗规则;
所述处理模块,用于根据预设的数据筛选和清洗规则,处理并传递获取到的埋点数据;
所述分析模块,用于分析所述埋点数据;
所述绘制模块,用于绘制目标用户画像;其中所述目标用户为使用所述目标程序的至少一个用户的代表;
所述预设的数据筛选规则包括:剔除或修正超出预设频率的界面上下滑动事件,和/或,剔除或修正对界面中对不涉及跳转操作的页面元素的点击事件;和/或,剔除或修正其他超出预设频率的界面行为事件;
所述预设的数据清洗规则包括:剔除或修正非闭环行为操作事件;
所述预设的数据清洗规则还包括:当用户网络或硬件设备出现问题导致获取的埋点数据缺失时,通过接口将缺失数据传递到服务端之前,按照逻辑将所述缺失数据进行部分补全、重写甚至覆盖,并做好所述缺失数据的异常标记工作;
所述分析所述埋点数据包括:按照预设维度分析所述获取的埋点数据,其中预设的维度包括:社会属性、生活习惯、消费行为;
所述绘制目标用户画像包括:对所述获取的埋点数据进行以下至少一种方式的分析:流量统计分析、行为路径构建分析、用户设备管理分析;
所述流量统计分析包括按在线情况分析、按时段分析、按来源分析;按在线情况分析是指分别记录在线用户的活动信息,包括来访时间、访客地域、来路页面、当前停留页面;按时段分析是指提供网站或移动端应用程序在任意时间段内的流量变化情况,或者某一段时间到某一段时间的流量变化情况,包括小时段分布、日访问量分布;按来源分析是指提供来路域名带来的数据,包括来访次数、IP、独立访客、新访客、新访客浏览次数、站内总浏览次数;
所述行为路径构建分析包括通过对处理后的信息进行关联,获取用户的整条行为链路;
所述用户设备管理分析对用户设备进行管理使用的数据类型包括国际手机唯一标识IMEI、国际移动用户识别码IMSI、AndroidID、设备ID、UUID、MAC地址、下载渠道Channel、APP版本、用户行为参数。
8.根据权利要求7所述的数据埋点装置,其特征在于,所述埋点模块具体用于采用代码埋点和/或可视化埋点技术在目标程序中进行埋点。
9.根据权利要求8所述的数据埋点装置,其特征在于,所述埋点模块进一步包括:选取单元和接口单元;其中,
所述选取单元,用于选定一种计算机语言完成埋点代码;其中计算机语言包括但不限于以下任意一种:HTML、CSS、JavaScript;
所述接口单元,用于通过目标程序接口将完成的埋点代码文件嵌入在目标程序中;其中所述埋点代码文件或目标程序中的文件保持独立。
10.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器,用于存储操作指令;
所述处理器,用于通过调用所述操作指令,执行权利要求1-6中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。
CN202110163487.5A 2021-02-05 2021-02-05 一种用户画像绘制方法和装置 Active CN112948226B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110163487.5A CN112948226B (zh) 2021-02-05 2021-02-05 一种用户画像绘制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110163487.5A CN112948226B (zh) 2021-02-05 2021-02-05 一种用户画像绘制方法和装置

Publications (2)

Publication Number Publication Date
CN112948226A CN112948226A (zh) 2021-06-11
CN112948226B true CN112948226B (zh) 2024-04-02

Family

ID=76242739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110163487.5A Active CN112948226B (zh) 2021-02-05 2021-02-05 一种用户画像绘制方法和装置

Country Status (1)

Country Link
CN (1) CN112948226B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114051167B (zh) * 2021-10-28 2023-09-26 北京金堤科技有限公司 视频处理方法、装置及处理器
CN113986954B (zh) * 2021-12-30 2022-04-08 深圳市明源云科技有限公司 用户事件获取方法、装置、智能终端及可读存储介质
CN115757980A (zh) * 2022-12-21 2023-03-07 北京政务科技有限公司 一种政务服务的用户画像方法、装置、设备和介质
CN116502054A (zh) * 2023-05-12 2023-07-28 上海邮电设计咨询研究院有限公司 一种流量数据分析方法、***、介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145489A (zh) * 2016-03-01 2017-09-08 阿里巴巴集团控股有限公司 一种基于云平台的客户端应用的信息统计方法和装置
CN108492224A (zh) * 2018-03-09 2018-09-04 上海开放大学 基于深度学习在线教育学生综合画像标签管理***
CN109255640A (zh) * 2017-07-13 2019-01-22 阿里健康信息技术有限公司 一种确定用户分组的方法、装置及***
CN111553729A (zh) * 2020-04-27 2020-08-18 广州探途网络技术有限公司 一种电商用户画像数据生成方法、装置和计算设备
CN111597422A (zh) * 2020-05-14 2020-08-28 腾讯科技(深圳)有限公司 埋点映射方法、装置、计算机设备和存储介质
WO2020252639A1 (zh) * 2019-06-17 2020-12-24 深圳市欢太科技有限公司 内容推送方法及相关产品
WO2020257990A1 (zh) * 2019-06-24 2020-12-30 深圳市欢太科技有限公司 设备推荐方法及相关产品

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145489A (zh) * 2016-03-01 2017-09-08 阿里巴巴集团控股有限公司 一种基于云平台的客户端应用的信息统计方法和装置
CN109255640A (zh) * 2017-07-13 2019-01-22 阿里健康信息技术有限公司 一种确定用户分组的方法、装置及***
CN108492224A (zh) * 2018-03-09 2018-09-04 上海开放大学 基于深度学习在线教育学生综合画像标签管理***
WO2020252639A1 (zh) * 2019-06-17 2020-12-24 深圳市欢太科技有限公司 内容推送方法及相关产品
WO2020257990A1 (zh) * 2019-06-24 2020-12-30 深圳市欢太科技有限公司 设备推荐方法及相关产品
CN111553729A (zh) * 2020-04-27 2020-08-18 广州探途网络技术有限公司 一种电商用户画像数据生成方法、装置和计算设备
CN111597422A (zh) * 2020-05-14 2020-08-28 腾讯科技(深圳)有限公司 埋点映射方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN112948226A (zh) 2021-06-11

Similar Documents

Publication Publication Date Title
CN112948226B (zh) 一种用户画像绘制方法和装置
US8997081B1 (en) Analytics for mobile applications
US7305622B2 (en) Graphical user interface and web site evaluation tool for customizing web sites
US8725794B2 (en) Enhanced website tracking system and method
US10853837B2 (en) Integrated testing, targeting and measuring of web site components
US20110137737A1 (en) Systems and methods for capturing and reporting metrics regarding user engagement including a canvas model
US20170013085A1 (en) Method of website optimisation
US20140229271A1 (en) System and method to analyze and rate online advertisement placement quality and potential value
US20140074622A1 (en) Systems and methods for rule based inclusion of pixel retargeting in campaign management
KR20150130282A (ko) 실시간 비딩용 지능형 플랫폼
US20150302466A1 (en) Data determination method and device for a thermodynamic chart
CN107357903B (zh) 用户行为数据整合方法、装置及电子设备
CN103606094A (zh) 一种移动互联网广告监测方法和***
US11893076B2 (en) Systems and methods for managing an online user experience
US11727082B2 (en) Machine-learning based personalization
CN109428776A (zh) 一种网站流量的监控方法及装置
CN108984070B (zh) 用于热力图成像的方法、装置、电子设备及可读介质
CN113626624B (zh) 一种资源识别方法和相关装置
CN105450460B (zh) 网络操作记录方法及***
CN111200639A (zh) 基于用户操作行为的信息推送方法、装置和电子设备
Percival HTML5 advertising
CN107979779B (zh) 社交媒体服务上的媒体内容分组的组合交互监测
WO2018147954A1 (en) Automatic generation of interactive web page content
CN118012432B (zh) 端智能体验实现方法、装置、介质及设备
US20240143698A1 (en) Electronic information extraction using a machine-learned model architecture method and apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant