CN110737690A - 用户标签挖掘方法、装置、计算机设备和存储介质 - Google Patents

用户标签挖掘方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110737690A
CN110737690A CN201810718993.4A CN201810718993A CN110737690A CN 110737690 A CN110737690 A CN 110737690A CN 201810718993 A CN201810718993 A CN 201810718993A CN 110737690 A CN110737690 A CN 110737690A
Authority
CN
China
Prior art keywords
user
determining
stay
target
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810718993.4A
Other languages
English (en)
Inventor
闻波
康建峰
彭继东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810718993.4A priority Critical patent/CN110737690A/zh
Publication of CN110737690A publication Critical patent/CN110737690A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出一种用户标签挖掘方法、装置、计算机设备和存储介质,其中,方法包括:获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段,根据用户在各位置的各停留时间段,确定用户对应的用户标签。该方法通过根据用户的历史位置信息,确定用户在各位置的各停留时间段,进而根据各位置的各停留时间段,确定用户对应的用户标签,从而实现了从用户的历史位置信息中,挖掘出用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。

Description

用户标签挖掘方法、装置、计算机设备和存储介质
技术领域
本申请涉及大数据技术领域,尤其涉及一种用户标签挖掘方法、装置、计算机设备和存储介质。
背景技术
相关技术中,多是通过问卷调查的形式,获取用户的个人信息,例如,获取用户的姓名、年龄、身份证号、职业等信息。
在实际应用中,在填写调查问卷时,用户对于比较隐私的信息填写真实信息的意愿比较低,导致调查问卷获得的个人信息可能不够真实。并且,收集问卷后再提取用户个人信息比较繁琐。可见,上述获取个人信息的方式效率低、且获取的结果可信度较差。
发明内容
本申请提出一种用户标签挖掘方法、装置、计算机设备和存储介质,用于解决相关技术中获取用户个人信息的方式效率低、且获取的结果可信度较差的问题。
本申请一方面实施例提出了一种用户标签挖掘方法,包括:
获取用户的历史位置信息,其中,所述历史位置信息包括用户在各位置的停留时间;
根据所述用户在各位置的停留时间,确定所述用户在各位置的各停留时间段;
根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签。
本申请实施例的用户标签挖掘方法,通过获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段,根据用户在各位置的各停留时间段,确定用户对应的用户标签。由此,通过根据用户的历史位置信息,确定用户在各位置的各停留时间段,进而根据各位置的各停留时间段,确定用户对应的用户标签,从而实现了从用户的历史位置信息中,挖掘出用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。
本申请另一方面实施例提出了一种用户标签挖掘装置,包括:
获取模块,用于获取用户的历史位置信息,其中,所述历史位置信息包括用户在各位置的停留时间;
第一确定模块,用于根据所述用户在各位置的停留时间,确定所述用户在各位置的各停留时间段;
第二确定模块,用于根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签。
本申请实施例的用户标签挖掘装置,通过获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段,根据用户在各位置的各停留时间段,确定用户对应的用户标签。由此,通过根据用户的历史位置信息,确定用户在各位置的各停留时间段,进而根据各位置的各停留时间段,确定用户对应的用户标签,从而实现了从用户的历史位置信息中,挖掘出用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。
本申请另一方面实施例提出了一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述一方面实施例所述的用户标签挖掘方法。
本申请另一方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面实施例所述的用户标签挖掘方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例提供的一种用户标签挖掘方法的流程示意图;
图2为本申请实施例提供的另一种用户标签挖掘方法的流程示意图;
图3为本申请实施例提供的另一种用户标签挖掘方法的流程示意图;
图4为本申请实施例提供的另一种用户标签挖掘方法的流程示意图;
图5为本申请实施例提供的一种用户标签挖掘装置的结构示意图;
图6为本申请实施例提供的另一种用户挖掘装置的结构示意图;
图7示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的用户标签挖掘方法、装置、计算机设备和存储介质。
本申请实施例针对相关技术中,获取个人信息的方式效率低、且获取的结果可信度较差的问题,提出一种用户标签挖掘方法。
本申请实施例的种用户标签挖掘方法,通过先根据用户的历史位置信息,确定用户在各位置的各停留时间段,进而根据各位置的各停留时间段,确定用户对应的用户标签,从而实现了从用户的历史位置信息中,挖掘出用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。
图1为本申请实施例提供的一种用户标签挖掘方法的流程示意图。
本申请实施例的用户标签挖掘方法,可由本申请提供的用户标签挖掘装置执行,上述装置可配置于计算机设备中。
本实施例中,计算机设备可以是手机、掌上电脑等具有操作***的设备。
如图1所示,该用户标签挖掘方法可包括:
步骤101,获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间。
在实际使用中,手机、掌上电脑等设备具有定位功能,可根据这些设备记录的用户的位置信息,获取用户在过去一定时间段内的历史位置信息。例如,获取用户在过去四年内的历史位置信息。
由于用户可能会在一个或者多个地方停留,所以历史位置信息可包括用户在各个位置的停留时间。
其中,位置可以是城市、地区、县等,例如,用户在北京市朝阳区的停留时间为2016年5月1日至2016年5月20日、2017年12月10日到2017年12月11日。
步骤102,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段。
在实际应用中,用户在某个地方的停留时间段,具有一定的特点。例如,学生在寒假或者暑假的一般停留在家乡,在寒假和暑假以外的时间,一般停留在学校中。又如,对于在职人员,通常在春节期间停留在家乡。
本实施例中,可根据用户在各位置的停留时间,对用户在各个位置的各停留时间段进行划分。其中,停留时间段包含了停留时长。
例如,用户在过去一年中,在A市的停留时间为1月、7月下旬、8月,在B市的停留时间为2月到7月上旬、9月到12月。
步骤103,根据用户在各位置的各停留时间段,确定用户对应的用户标签。
其中,用户标签包括但不限于身份标签、年龄标签、家乡标签等。其中,身份标签是指用户的身份,例如学生、上班族等等。
在实际应用中,停留时间段可以根据需要进行划分。例如,停留时间段为寒假或暑假,或者停留时间为节假日等。基于此,根据在各位置的停留时间段,可以确定用户的用户标签。
例如,用户在A市的停留时间段为1月、7月下旬、8月,而1月通常是寒假时间,7月下旬到8月通常为暑假时间,可以确定用户的家乡为A市。
在实际应用中,可根据停留时间段对应的节日属性,确定用户的身份标签或年龄标签,或者身份标签和年龄标签。下面结合图2进行详细说明,图2为本申请实施例提供的另一种用户标签挖掘方法的流程示意图。
如图2所示,该用户标签挖掘方法包括:
步骤201,获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间。
步骤202,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段。
本实施例中,步骤201-步骤202与上述步骤101-步骤102类似,故在此不再赘述。
步骤203,确定用户在任一停留位置的各停留时间段分别对应的节日属性。
其中,节日属性,是指该时间段具有的普遍意义信息,比如,某年的阴历1月初一至初六对应的节日属性为“春节假期”,或者,某年的阳历7月15至9月1日对应的节日属性为“暑假”等等。
本实施例中,针对用户每个停留位置,将其对应的各停留时间段与所有的节日进行匹配,以确定各停留时间段分别对应的节日属性。
比如,用户在A市的停留时间段分别为1月和7月上旬、8月,1月对应的节日属性为寒假,7月上旬和8月对应的节日属性为暑假,用户在B市的停留时间为2月到7月上旬、9月到12月没有对应的节日属性。
步骤204,根据任一停留位置的各停留时间段分别对应的节日属性,确定用户的身份标签或年龄标签。
由于节日期间用户出行的可能性比较大,例如,春节期间大多数人会选择回家乡过春节,寒假和暑假期间学生大多待在家乡。
基于此,可根据确定的任一停留位置的各停留时间段分别对应的节日属性,确定用户的身份标签或者年龄标签。
例如,用户a在A市的两个停留时间段对应的节日属性为寒假和暑假,可以确定用户的身份为学生,年龄为15-28岁之间。
又如,用户b在A市的停留时间段为春节期间,可以确定用户b的身份标签为在职人员。
可以理解的是,根据停留时间段分别对应的节日属性,可以确定用户的身份标签或年龄标签,或者是身份标签和年龄标签。
本申请实施例的用户标签挖掘方法,通过根据用户在任一位置的停留时间段分别对应的节日属性,确定用户的身份标签和/年龄标签,相比利用调查问卷的形式,获取用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。
在实际应用中,可根据用户在寒假或者暑假、春节等时间段内的停留位置和停留次数,确定用户的家乡标签,下面结合图3进行说明。图3为本申请实施例提供的另一种用户标签挖掘方法的流程示意图。
如图3所示,该用户标签挖掘方法包括:
步骤301,获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间。
步骤302,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段。
本实施例中,步骤301-步骤302与上述实施例中步骤101-步骤102类似,故在此不再赘述。
步骤303,根据用户在各位置的各停留时间段,确定用户在第一预设时间段内的各第一目标停留位置及在各第一目标停留位置的停留次数。
其中,第一预设时间段可以为具有普适性的时间段,比如为寒假、暑假、春节等假期。
本实施例中,针对每个位置,将各停留时间段与第一预设时间段进行比较,以确定用户在第一预设时间段内的停留位置,作为第一目标停留位置,以及在各第一停留位置的停留次数。
比如,在过去的3年里,用户a停留过的城市为A市、B市和C市,而暑假和寒假期间,用户a在A市的停留次数为5次,在C市的停留次数为1次。
又如,在过去的4年里,用户c停留过的城市有A市、C市和D市,用户c春节期间在D市停留3次,在A市的停留次数为1次。
步骤304,根据各第一目标停留位置及在各第一目标停留位置的停留次数,确定用户的家乡标签。
由于第一预设时间段内,用户在家乡停留的可能性较大,由此根据用户在第一预设时间段内的停留位置和停留次数,可以确定用户的家乡标签。
本实施例中,可根据用户在第一预设时间段内,在各第一目标停留位置的停留次数,确定用户的家乡标签。
作为一种可能的实现方式,可将第一目标停留位置中停留次数等于或者大于预设次数的停留位置,确定为用户的家乡标签。
例如,预设次数为3次,在过去的3年里,用户a暑假和寒假期间在A市的停留次数为5次,在C市的停留次数为1次,可以确定用户a的家乡为A市。
又如,在过去的4年里,用户c春节期间在D市停留3次,在A市的停留次数为1次,可以确定用户c的家乡为D市。
作为另一种可能的是实现方式,可先根据用户在各第一目标停留位置的停留次数,确定各第一目标停留位置的可信度。之后,将各第一目标停留位置中可信度最大的第一目标停留位置,作为第一停留位置,并将第一停留位置作为用户的家乡标签。
具体地,可预先建立停留次数与可信度的对应关系,即可根据在各第一目标停留位置的停留次数,确定各第一目标停留位置的可信度,之后根据可信度确定第一停留位置,将第一停留位置作为用户的家乡标签。其中,停留次数越多,可信度越大。
作为再一种可能的实现方式,可据用户在各位置的各停留时间段,确定用户在第二预设时间段内、停留时长大于第一阈值的各第二目标停留位置。
其中,第二预设时间段是一年中除第一预设时间段以外的时间段。例如,第一预设时间段包括所有的假期,则第二预设时间段为一年中除假期以外的时间段。第一阈值可以是3个月,具体地可根据需要进行设定。由此,各第二目标停留位置可以理解为用户的常驻城市。
之后,从各第一目标停留位置中选取停留时长大于第二阈值的停留位置,并将未在各第二目标停留位置内的停留位置,称为第二停留位置,并将第二停留位置确定为用户的家乡标签。
其中,第二阈值可以根据第一预设时间段的长度确定。例如,计算一年中寒假、暑假等所有假期,得到第一预设时间段的长度为100天,那么第二阈值可以为10天。具体地,可以根据实际需要设定。
例如,用户d的两个第二目标停留位置为A市、B市,第一目标停留位置为B市、C市、D市,其中,第一目标停留位置中只有在C市的停留时长大于第二阈值,且未在各第二目标停留位置中,可以确定用户d的家乡标签为C市。
本申请实施例的用户标签挖掘方法,通过根据用户在第一预设时间段的各第一目标停留位置和在各第一目标停留位置的停留次数,确定用户的家乡标签,从而根据假期期间用户停留过的城市和停留的次数,确定出用户的家乡,大大提高了获取用户的家乡标签和家乡标签的可信度。
在实际应用中,用户在假期期间可能会外出旅游,而在旅游地用户的移动轨迹通常与旅游路线匹配。基于此,可从假期期间用户停留的停留位置中筛除用户因旅游停留过的停留位置,进而确定用户的家乡标签。下面结合图4进行说明,图4为本申请实施例提供的另一种用户标签挖掘方法的流程示意图。
如图4所示,该用户标签挖掘方法包括:
步骤401,获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间和用户在各位置的移动轨迹。
本实施例中,获取用户的历史位置信息的方法,与上述步骤101中记载的方法类似,故在此不再赘述。
其中,历史位置信息包括用户在在各位置的停留时间,以及用户在各位置的移动轨迹。移动轨迹可以理解为在各位置中停留过的标志性的地点或者是景点。
步骤402,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段。
本实施例中,步骤402与上述步骤102类似,故在此不再赘述。
步骤403,根据用户在各位置的各停留时间段,确定用户在第一预设时间段内的各第一目标停留位置及在各第一目标停留位置的移动轨迹。
在确定用户在各位置的停留时间段后,将各停留时间段与第一预设时间段进行比较,以确定用户在第一预设时间段内的各第一目标停留位置,及在第一目标停留位置的移动轨迹。
例如,根据用户在各位置的停留时间段,确定用户在春节期间的停留位置,以及在停留位置的移动轨迹。
步骤404,根据用户在各第一目标停留位置的移动轨迹,确定用户的家乡标签。
本实施例中,可根据各第一目标停留位置的标识,获取各第一目标停留位置的参考移动轨迹。其中,标识可以城市的名称,参考移动轨迹可以是第一目标停留位置的旅游路线。
在实际应用中,一个城市可能会有多条旅游路线,所以参考移动轨迹可以一个也可以是多个。
具体地,可预先建立各城市标识与参考移动轨迹之间的对应关系,根据各第一目标停留位置的标识,即可确定各第一目标停留位置对应的参考移动轨迹。
针对每个第一目标停留位置,将第一目标停留位置的移动轨迹,与参考移动轨迹进行比对,以确定第一目标停留位置的移动轨迹与参考移动轨迹的匹配度。进一步地,将匹配度小于第三阈值的停留位置,称为第三停留位置,并将第三停留位置确定为用户的家乡标签。
例如,第三阈值为20%,用户e的各第一目标停留位置包括A市、B市、D市,其中,在B市的移动轨迹与参考移动轨迹中只有两个位置一致,确定匹配度为15%,其小于第三阈值20%,可以确定用户e的家乡标签为B市。
或者,也可将各第一目标停留位置中匹配度最小的停留位置,确定为用户的家乡标签。
作为另一种可能的实现方式,也可根据用户在各第一目标停留位置的移动轨迹变化频率,确定第一目标停留位置是否为家乡标签。
在实际应用中,通常在旅游地用户的移动轨迹变化频率较快,而在家乡用户的移动轨迹变化频率较慢,则可将移动轨迹变化频率小于第四阈值,或者移动轨迹变化频率最小的第一目标停留位置,确定为用户的家乡标签。
本申请实施例的用户标签挖掘方法,通过根据用户在各第一目标停留位置的移动轨迹,与各第一目标停留位置对应的参考移动轨迹,筛选出与参考移动轨迹匹配度较小的停留位置,作为用户的家乡标签,从而排除了假期期间用户因旅游停留过的城市,进而确定用户的家乡,获取用户标签的效率和用户标签的可信度。
进一步地,在确定用户对应的用户标签后,可向用户推送与用户标签对应的目标信息。
例如,用户的身份标签为学生,则可为用户推送与学习相关的信息。又如,用户的家乡标签为西安,则可为用户推送与西安相关的新闻,以便于用户了解自己的家乡。
本实施例中,由于获取的用户标签的可信度较高,由此向用户推送与用标签对应的目标信息,大大提高了信息推送的精准度。
为了实现上述实施例,本申请实施例还提出一种用户标签挖掘装置。图5为本申请实施例提供的一种用户标签挖掘装置的结构示意图。
如图5所示,该用户标签挖掘装置包括:获取模块510、第一确定模块520、第二确定模块530。
获取模块510用于获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间。
第一确定模块520用于根据用户在各位置的停留时间,确定用户在各位置的各停留时间段。
第二确定模块530用于根据用户在各位置的各停留时间段,确定用户对应的用户标签。
在本实施例一种可能的实现方式中,第二确定模块530还用于:
确定用户在任一停留位置的各停留时间段分别对应的节日属性;
根据任一停留位置的各停留时间段分别对应的节日属性,确定用户的身份标签和/或年龄标签。
图6为本申请实施例提供的另一种用户挖掘装置的结构示意图。
在本实施例一种可能的实现方式中,如图6所示,第二确定模块530可包括:
第一确定单元531,用于根据用户在各位置的各停留时间段,确定用户在第一预设时间段内的各第一目标停留位置及在各第一目标停留位置的停留次数;
第二确定单元532,用于根据各第一目标停留位置及在各第一目标停留位置的停留次数,确定用户的家乡标签。
在本实施例一种可能的实现方式中,第二确定单元532还用于:
根据在各第一目标停留位置的停留次数,确定各第一目标停留位置的可信度;
将各第一目标停留位置中可信度最大的第一停留位置,确定为用户的家乡标签。
在本实施例一种可能的实现方式中,第二确定单元532还用于:
根据用户在各位置的各停留时间段,确定用户在第二预设时间段内、停留时长大于第一阈值的各第二目标停留位置;
将各第一目标停留位置中停留时长大于第二阈值、且未在各第二目标停留位置内的第二停留位置,确定为用户的家乡标签。
在本实施例一种可能的实现方式中,历史位置信息还包括用户在各位置的移动轨迹;该装置还包括:
第三确定模块,用于在确定用户在各位置的各停留时间段之后,根据用户在各位置的各停留时间段,确定用户在第一预设时间段内的各第一目标停留位置及在各第一目标停留位置的移动轨迹;
第四确定模块,用于根据用户在各第一目标停留位置的移动轨迹,确定用户的家乡标签。
在本实施例一种可能的实现方式中,第四确定模块还用于:
根据各第一目标停留位置的标识,获取各第一目标停留位置对应的参考移动轨迹;
确定用户在任一第一目标停留位置的移动轨迹,与任一第一目标停留位置的参考移动轨迹间的匹配度;
将匹配度小于第三阈值的第三停留位置,确定为用户的家乡标签。
在本实施例一种可能的实现方式中,该装置还可包括:
推送模块,用于在确定用户对应的用户标签之后,向用户推送与用户标签对应的目标信息。
需要说明的是,前述对用户标签挖掘方法实施例解释说明,也适用于该实施例的用户标签挖掘装置,故在此不再赘述。
本申请实施例的用户标签挖掘装置,通过获取用户的历史位置信息,其中,历史位置信息包括用户在各位置的停留时间,根据用户在各位置的停留时间,确定用户在各位置的各停留时间段,根据用户在各位置的各停留时间段,确定用户对应的用户标签。由此,通过根据用户的历史位置信息,确定用户在各位置的各停留时间段,进而根据各位置的各停留时间段,确定用户对应的用户标签,从而实现了从用户的历史位置信息中,挖掘出用户的用户标签,大大提高了获取用户标签的效率和用户标签的可信度。
为了实现上述实施例,本申请实施例还提出一种计算机设备,包括处理器和存储器;
其中,处理器通过读取存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述实施例所述的用户标签挖掘方法。
图7示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图7显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及***组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
为了实现上述实施例,本申请实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的用户标签挖掘方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (11)

1.一种用户标签挖掘方法,其特征在于,包括:
获取用户的历史位置信息,其中,所述历史位置信息包括用户在各位置的停留时间;
根据所述用户在各位置的停留时间,确定所述用户在各位置的各停留时间段;
根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签。
2.如权利要求1所述的方法,其特征在于,所述根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签,包括:
确定所述用户在任一停留位置的各停留时间段分别对应的节日属性;
根据所述任一停留位置的各停留时间段分别对应的节日属性,确定所述用户的身份标签和/或年龄标签。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签,包括:
根据所述用户在各位置的各停留时间段,确定所述用户在第一预设时间段内的各第一目标停留位置及在各第一目标停留位置的停留次数;
根据所述各第一目标停留位置及在各第一目标停留位置的停留次数,确定所述用户的家乡标签。
4.如权利要求3所述的方法,其特征在于,所述确定所述用户的家乡标签,包括:
根据所述在各第一目标停留位置的停留次数,确定所述各第一目标停留位置的可信度;
将所述各第一目标停留位置中可信度最大的第一停留位置,确定为所述用户的家乡标签。
5.如权利要求3所述的方法,其特征在于,所述确定所述用户的家乡标签,包括:
根据所述用户在各位置的各停留时间段,确定所述用户在第二预设时间段内、停留时长大于第一阈值的各第二目标停留位置;
将所述各第一目标停留位置中停留时长大于第二阈值、且未在所述各第二目标停留位置内的第二停留位置,确定为所述用户的家乡标签。
6.如权利要求1-5任一所述的方法,其特征在于,所述历史位置信息,还包括所述用户在各位置的移动轨迹;
所述确定所述用户在各位置的各停留时间段之后,还包括:
根据所述用户在各位置的各停留时间段,确定所述用户在第一预设时间段内的各第一目标停留位置及在所述各第一目标停留位置的移动轨迹;
根据所述用户在所述各第一目标停留位置的移动轨迹,确定所述用户的家乡标签。
7.如权利要求6所述的方法,其特征在于,所述根据所述用户在所述各第一目标停留位置的移动轨迹,确定所述用户的家乡标签,包括:
根据所述各第一目标停留位置的标识,获取所述各第一目标停留位置对应的参考移动轨迹;
确定所述用户在任一第一目标停留位置的移动轨迹,与所述任一第一目标停留位置的参考移动轨迹间的匹配度;
将匹配度小于第三阈值的第三停留位置,确定为所述用户的家乡标签。
8.如权利要求1-5任一所述的方法,其特征在于,所述确定所述用户对应的用户标签之后,还包括:
向所述用户推送与所述用户标签对应的目标信息。
9.一种用户标签挖掘装置,其特征在于,包括:
获取模块,用于获取用户的历史位置信息,其中,所述历史位置信息包括用户在各位置的停留时间;
第一确定模块,用于根据所述用户在各位置的停留时间,确定所述用户在各位置的各停留时间段;
第二确定模块,用于根据所述用户在各位置的各停留时间段,确定所述用户对应的用户标签。
10.一种计算机设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-8中任一所述的用户标签挖掘方法。
11.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的用户标签挖掘方法。
CN201810718993.4A 2018-07-03 2018-07-03 用户标签挖掘方法、装置、计算机设备和存储介质 Pending CN110737690A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810718993.4A CN110737690A (zh) 2018-07-03 2018-07-03 用户标签挖掘方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810718993.4A CN110737690A (zh) 2018-07-03 2018-07-03 用户标签挖掘方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110737690A true CN110737690A (zh) 2020-01-31

Family

ID=69234257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810718993.4A Pending CN110737690A (zh) 2018-07-03 2018-07-03 用户标签挖掘方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110737690A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611436A (zh) * 2020-06-24 2020-09-01 腾讯科技(深圳)有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN112906848A (zh) * 2021-03-29 2021-06-04 上海华兴数字科技有限公司 作业计量***及方法
CN113610568A (zh) * 2021-07-26 2021-11-05 建信金融科技有限责任公司 一种潜在标签挖掘方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103052022A (zh) * 2011-10-17 2013-04-17 ***通信集团公司 基于移动行为的用户稳定点发现方法和***
CN104933157A (zh) * 2015-06-26 2015-09-23 百度在线网络技术(北京)有限公司 用于获取用户属性信息的方法、装置及服务器
CN107092629A (zh) * 2017-01-18 2017-08-25 北京小度信息科技有限公司 推荐方法及装置
CN107704586A (zh) * 2017-10-09 2018-02-16 陈包容 一种基于用户活动地址的用户画像的方法、装置和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103052022A (zh) * 2011-10-17 2013-04-17 ***通信集团公司 基于移动行为的用户稳定点发现方法和***
CN104933157A (zh) * 2015-06-26 2015-09-23 百度在线网络技术(北京)有限公司 用于获取用户属性信息的方法、装置及服务器
CN107092629A (zh) * 2017-01-18 2017-08-25 北京小度信息科技有限公司 推荐方法及装置
CN107704586A (zh) * 2017-10-09 2018-02-16 陈包容 一种基于用户活动地址的用户画像的方法、装置和***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611436A (zh) * 2020-06-24 2020-09-01 腾讯科技(深圳)有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN111611436B (zh) * 2020-06-24 2023-07-11 深圳市雅阅科技有限公司 一种标签数据处理方法、装置以及计算机可读存储介质
CN112906848A (zh) * 2021-03-29 2021-06-04 上海华兴数字科技有限公司 作业计量***及方法
CN113610568A (zh) * 2021-07-26 2021-11-05 建信金融科技有限责任公司 一种潜在标签挖掘方法和装置

Similar Documents

Publication Publication Date Title
CN107656913B (zh) 地图兴趣点地址提取方法、装置、服务器和存储介质
US10281284B2 (en) Hybrid road network and grid based spatial-temporal indexing under missing road links
US9134886B2 (en) Providing indoor facility information on a digital map
US20110185020A1 (en) System and method for social networking
CN105988988A (zh) 文本地址处理方法及装置
CN110737690A (zh) 用户标签挖掘方法、装置、计算机设备和存储介质
CN107220308B (zh) Poi的合理性的检测方法及装置、设备及可读介质
CN110765280B (zh) 地址识别方法和装置
CN108182240B (zh) 兴趣点新增率预测模型训练及预测方法、装置及存储介质
CN110309432B (zh) 基于兴趣点的同义词确定方法、地图兴趣点处理方法
WO2017016122A1 (zh) 一种信息推送方法及装置
CN104615673A (zh) 一种客户端界面的展现方法及装置
EP3244166B1 (en) System and method for identifying socially relevant landmarks
CN110609879B (zh) 兴趣点判重方法、装置、计算机设备及存储介质
CN112132654A (zh) 一种房源信息展示的方法、装置和存储介质
US9858294B2 (en) Image search for a location
CN106469205B (zh) 一种确定用户的地理位置信息的方法与装置
US20220415365A1 (en) Smart summarization, indexing, and post-processing for recorded document presentation
US20160335573A1 (en) Describing a paradigmatic member of a task directed community in a complex heterogeneous environment based on non-linear attributes
CN107016495A (zh) 城市区域相关性的确定方法、装置和终端设备
US11976935B2 (en) Route recommendation method, electronic device, and storage medium
CN111126120B (zh) 城市区域分类方法、装置、设备和介质
CN104750792A (zh) 一种用户特征的获取方法及装置
CN110580270B (zh) 地址输出方法及***、计算机***和计算机可读存储介质
CN113449055A (zh) 地图检索方法、***及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200131