CN109523237A - 基于用户偏好的众包任务推送方法及相关装置 - Google Patents

基于用户偏好的众包任务推送方法及相关装置 Download PDF

Info

Publication number
CN109523237A
CN109523237A CN201811364711.1A CN201811364711A CN109523237A CN 109523237 A CN109523237 A CN 109523237A CN 201811364711 A CN201811364711 A CN 201811364711A CN 109523237 A CN109523237 A CN 109523237A
Authority
CN
China
Prior art keywords
task
user
historical
data
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811364711.1A
Other languages
English (en)
Other versions
CN109523237B (zh
Inventor
黄夕桐
李佳琳
王健宗
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811364711.1A priority Critical patent/CN109523237B/zh
Publication of CN109523237A publication Critical patent/CN109523237A/zh
Priority to PCT/CN2019/088796 priority patent/WO2020098251A1/zh
Application granted granted Critical
Publication of CN109523237B publication Critical patent/CN109523237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/101Collaborative creation, e.g. joint development of products or services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了基于用户偏好的众包任务推送方法及相关装置,其中,所述方法包括:针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;分别获取各个任务响应活跃用户的历史推送数据集;根据历史推送数据集,建立接受概率逻辑回归模型;利用接受概率逻辑回归模型,根据活跃用户数据和历史任务数据估算历史任务接受概率;根据历史任务接受概率和响应结果标签数据,估算任务响应活跃用户的用户似然程度;根据第一预设数量的任务响应活跃用户各自对应的用户似然程度从第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给第一高偏好目标用户。采用本发明的方案,可以提高众包任务的交付效率。

Description

基于用户偏好的众包任务推送方法及相关装置
技术领域
本发明涉及计算机领域,尤其涉及基于用户偏好的众包任务推送方法及相关装置。
背景技术
近年来,越来越多的企业开始尝试将一定技术性的工作任务通过互联网渠道委托给外部的个体或组织完成,这种新兴的基于互联网的开放式协作创新模式被称为众包。众包模式一般包含三个主体:发包方、众包平台和接包方,一般由发包方将众包任务发布在众包平台上,然后由接包方从众包平台上承接任务并按约定完成任务并获得相应的报酬。常见的众包任务包含设计、管理咨询、方案策划、影视制作、信息收集、图片识别、软件开发等。在众包任务分配时,众包平台将发包方的任务需求广泛传播,同时在互联网上寻找到能力、兴趣等与相应的众包任务匹配的人才进行分配,才能保证众包任务顺利高效地完成。
然而,在当前众包作业场景中,大多数情况下发布任务时,未考虑接包者个体对任务的偏好,因此导致部分任务派发下去后,用户没有及时接受任务或不接受任务、任务需要重新派发的问题。用户对任务的响应程度不高,直接影响任务的完成程度和交付效率。
发明内容
本发明提供基于用户偏好的众包任务推送方法及相关装置,可以提高众包任务的交付效率。
第一方面,本发明实施了提供了一种基于用户偏好的众包任务的推送方法,包括:
针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;
分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据;
根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率;
利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率;
根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度;
根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
结合第一方面,在一种可能的实现方式中,所述历史任务数据包括所述历史推送任务的至少一个任务属性特征数据,所述活跃用户数据包括所述任务响应活跃用户的至少一个用户属性特征数据;
所述根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型包括:
若所述第二预设数量为m,m为正整数,用事件A1表示任务响应活跃用户u接受m个历史推送任务中的第i个历史推送任务,i为正整数,i∈[1,m],则所述任务响应活跃用户u对第i个历史推送任务的历史任务接受概率为:
其中,向量xi为第i个历史推送任务对应的任务属性特征数据构成的任务特征值向量;向量wu为所述任务响应活跃用户u针对第i个历史推送任务的用户属性特征数据构成的用户特征权值向量,所述用户特征权值向量中各个用户属性特征数据的用户特征权重,根据全部第一预设数量的任务响应活跃用户各自的用户属性特征数据和所述任务响应活跃用户对应历史推送数据集的响应结果标签数据统计得到。
结合第一方面,在一种可能的实现中,所述根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度包括:
若所述第二预设数量为m,m为正整数,针对任务响应活跃用户u推送的m个历史推送任务和所述m个历史推送任务的响应结果标签数据对应的响应结果,构成了所述任务响应活跃用户u的采样样本集,则任务响应活跃用户u关于所述采样样本集的似然程度为:
其中,Pu(A1|xuj)表示任务响应活跃用户u对m个历史推送任务中第j个历史推送任务的历史任务接受概率;yuj为所述任务响应活跃用户u对m个历史推送任务中的第j个历史推送任务的响应结果标签数据,j为正整数,j∈[1,m],yuj∈{0,1}。
结合第一方面,在一种可能的实现中,所述根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户包括:
将所述第一预设数量的任务响应活跃用户按照各自对应的用户似然程度从高到低排序;
将排序最靠前的第三预设数量的任务响应活跃用户确定为第一高偏好目标用户,所述第三预设数量小于或等于所述第一预设数量,且大于或等于所述目标推送任务的数量。
结合第一方面,在一种可能的实现中,所述方法还包括:
从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户;
当接收到所述第一高偏好目标用户针对所述目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户;
将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
结合第一方面,在一种可能的实现中,所述将目标任务类型的目标推送任务推送给所述第一高偏好目标用户包括:
根据所述第一高偏好目标用户的历史推送数据集,确定所述第一高偏好目标用户的高偏好接受时间数据;
在所述高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。
第二方面,本发明实施例提供了一种基于用户偏好的众包任务推送装置,包括:
活跃用户确定单元,用于针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;
数据集获取单元,用于分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据;
模型建立单元,用于根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率;
估算单元,用于利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率;
所述估算单元,还用于根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度;
任务推送单元,用于根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
结合第二方面,在一种可能的实现方式中,所述装置还包括:
二级筛选单元,用于从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户;
所述二级筛选单元,还用于当接收到所述第一高偏好目标用户针对目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户;
所述任务推送单元,还用于将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
第三方面,本发明实施例提供了另一种基于用户偏好的众包任务推送装置,包括处理器、存储器以及通信接口,所述处理器、存储器和通信接口相互连接,其中,所述通信接口用于接收和发送数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行上述第一方面和第一方面各种可能的实现方式中的任意一种方法。
第四方面,本发明实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行上述第一方面和第一方面各个可能的实现方式中的任意一种方法。
本发明实施例中,根据各个任务响应活跃用户的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,并根据利用所述接受概率逻辑回归模型估算的历史任务接受概率和所述各个任务响应活跃用户对各自的历史推送任务的响应结果标签数据,分别估算所述各个任务响应活跃用户关于各自的历史推送任务及各自的响应结果标签数据对应的响应结果的用户似然程度,进而向根据所述用户似然程度从所述任务响应活跃用户中确定的第一高偏好目标用户推送目标任务类型的目标推送任务,可以实现根据用户的偏好进行差异化推送众包任务,提高了用户对众包任务的响应程度,进而提高了众包任务的交付效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于用户偏好的众包任务推送方法的流程示意图;
图2为本发明实施例提供的另一种基于用户偏好的众包任务推送方法的流程示意图;
图3为本发明实施例提供的一种基于用户偏好的众包任务推送装置的结构示意图;
图4为本发明实施例提供的另一种基于用户偏好的众包任务推送装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种基于用户偏好的众包任务推送方法的流程示意图,如图所示,所述方法包括:
S101,针对目标任务类型的任务确定第一预设数量的任务响应活跃用户。
具体的,所述任务主要指互联网上出现的众包任务,涉及信息检索、人工智能、视频分析、知识挖掘、图像质量评估等领域。所述任务的任务类型可以有多种,例如,语义判断类、语音识别类、信息收集类等,所述目标任务类型可以是其中的一种。所述第一预设数量可以根据所述目标任务类型的任务的不同进行调整,可以理解的是,上述第一预设数量越大,即采样的任务响应活跃用户的数量越多,通过该基于用户偏好的众包任务推送方法确定出的针对所述目标任务类型的任务的第一高偏好目标用户越准确。
可选的,所述第一预设数量的任务响应活跃用户可以通过以下步骤确定:
11)、分别获取针对所述目标任务类型的任务所有的历史用户。
12)、分别计算每个历史用户的目标类型任务接受比例,上述目标类型任务接受比例为每个历史用户对上述目标任务类型的任务的接受次数与其被推送所述目标任务类型的次数的比值。
13)、将所述历史用户按照各自的目标类型任务接受比例从高到低的顺序进行排序,将排序靠前的第一预设数量的历史用户确定为所述任务响应活跃用户。
S102,分别获取各个任务响应活跃用户的历史推送数据集。
具体的,针对步骤S101中确定的第一数量的任务响应活跃用户,分别采集每个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据,即所述任务响应活跃用户每被推送一个所述历史推送任务就产生一组历史推送数据。可以理解的是,上述第二预设数量越大,即针对每个任务响应活跃用户采样的历史推送数据越多,通过该基于用户偏好的众包任务推送方法确定出的针对所述目标任务类型的任务的第一高偏好目标用户越准确。
可选的,分别获取各个任务响应活跃用户的历史推送信息集,将所述历史推送信息集中的每个历史推送信息进行量化处理,得到各个任务响应活跃用户对应的历史推送数据集。例如,获取到的任务响应活跃用户A的历史推送信息集中有一个历史推送信息为任务接受时间为17点,则该历史推送信息可以量化为历史推送数据17。又如,获取到的任务响应活跃用户B的历史推送信息集中有一个历史推送信息为任务接受地点为家里,可预先定义本次基于用户偏好的众包任务推送中,任务接受地点中家里、公司、通勤路上、户外、其他分别和标号1、2、3、4、5对应,则可将该历史推送信息量化为历史推送数据1。
S103,根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型。
这里,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率。所述接受概率逻辑回归模型是根据全部第一预设数量的任务响应活跃用户的历史推送数据集建立的,利用此接受概率逻辑回归模型可以估算出任何一个所述任务响应活跃用户对任何一个所述历史推送任务的历史任务接受概率。
可选的,所述历史任务数据包括所述历史推送任务的至少一个任务属性特征数据,所述活跃用户数据包括所述任务响应活跃用户的至少一个用户属性特征数据。若所述第二预设数量为m,m为正整数,用事件A1表示任务响应活跃用户u接受m个历史推送任务中的第i个历史推送任务,i为正整数,i∈[1,m],则所述任务响应活跃用户u对第i个历史推送任务的历史任务接受概率用公式(1)表示为:
其中,向量xi为第i个历史推送任务对应的任务属性特征数据构成的任务特征值向量;向量wu为所述任务响应活跃用户u针对第i个历史推送任务的用户属性特征数据构成的用户特征权值向量,所述用户特征权值向量中各个用户属性特征数据的用户特征权重,根据全部第一预设数量的任务响应活跃用户各自的用户属性特征数据和所述任务响应活跃用户对应历史推送数据集的响应结果标签数据统计得到。
S104,利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率。
具体的,利用上述接受概率逻辑回归模型,根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集中包含的活跃用户数据和历史任务数据,估算出各个历史活跃用户在自身曾被推送过的历史推送任务时,对所述历史推送任务的历史任务接受概率。
例如,用户A的历史推送数据集中包含两组历史推送数据,这两组历史推送数据对应用户A被推送了两次目标任务类型的历史推送任务,用户A在被推送第一历史推送任务时产生了活跃用户数据1,第一历史推送任务的历史任务数据为历史任务数据1,用户A在被推送第二历史推送任务时产生了活跃用户数据2,第二历史推送任务的历史任务数据为历史任务数据2,则该步骤中利用所述接受概率逻辑回归模型,根据活跃用户数据1和历史任务数据1,估算用户A曾被推送第一历史推送任务时,对第一历史推送任务的历史任务接受概率,根据活跃用户数据2和历史任务数据2,估算用户A曾被推送第二历史推送任务时,对第二历史推送任务的历史任务接受概率。
S105,根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度。
具体的,根据步骤S104中估算的所述任务响应活跃用户在自身曾被推送过的历史推送任务时对所述历史推送任务的历史任务接受概率,和针对所述历史推送任务的响应结果标签数据,利用似然函数估算所述任务响应活跃用户的用户似然程度,所述用户似然程度是所述任务响应活跃用户关于自身采样样本集的似然程度,所述采样样本集包括所述任务响应活跃用户自身的历史推送数据集中包含的所有历史任务数据对应的历史推送任务和所述任务响应活跃用户自身的历史推送数据集中包含的所有响应结果标签数据对应的响应结果。由于所述采样样本集为针对任务响应活跃用户的较为活跃的采样样本集,即该采样样本集中对应的历史推送任务曾被对应历史活跃用户接受的数量较多,因此可以用所述任务响应活跃用户关于自身采样样本集的用户似然程度来近似表示所述任务响应活跃用户针对所述目标任务类型的任务的偏好程度。
可选的,若所述第二预设数量为m,m为正整数,针对任务响应活跃用户u推送的m个历史推送任务和所述m个历史推送任务的响应结果标签数据对应的响应结果,构成了所述任务响应活跃用户u的采样样本集,则任务响应活跃用户u关于所述采样样本集的似然程度用公式(2)表示为:
其中,Pu(A1|xuj)表示任务响应活跃用户u对m个历史推送任务中第j个历史推送任务的历史任务接受概率;yuj为所述任务响应活跃用户u对m个历史推送任务中的第j个历史推送任务的响应结果标签数据,j为正整数,j∈[1,m],yuj∈{0,1}。
S106,根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
具体的,由于所述用户似然程度可以表示所述任务响应活跃用户针对该目标任务类型的任务的偏好程度,所以步骤S105中估算的用户似然程度越高的任务响应活跃用户对该目标任务类型的任务的偏好程度越高,因此可以将所述用户似然程度最高的一定数量或一定比例的任务响应活跃用户确定为第一高偏好目标用户,当有目标任务类型的目标推送任务待推送时,可以将其推送给所述第一高偏好目标用户。
可选的,所述根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户的具体步骤可以如下:
21)、将所述第一预设数量的任务响应活跃用户按照各自对应的用户似然程度从高到低排序。
22)、将排序最靠前的第三预设数量的任务响应活跃用户确定为第一高偏好目标用户,所述第三预设数量小于或等于所述第一预设数量,且大于或等于所述目标推送任务的数量。
在一种可选的实施方式中,所述方法还可以包括以下步骤:
31)、从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户。
32)、当接收到所述第一高偏好目标用户针对所述目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户。
33)、将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
通过上述步骤31)、步骤32)和步骤33),当被推送了所述目标推送任务的所述第一高偏好目标用户中有发出任务拒绝指令的用户时,可以从所述任务响应活跃用户中所述第一高偏好目标用户以外的用户中筛选出偏好程度较高的第二高偏好目标用户,将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户,既可以保证为所述任务拒绝指令对应的目标推送任务匹配偏好程度较高的用户进行推送,又可以避免所述第一高偏好目标用户被重复推送上述目标任务类型对应的目标推送任务而降低所述第一偏好目标用户对所述目标任务类型的任务的偏好程度,还可以提高所述目标任务类型的任务的曝光度,使所述第一高偏好目标用户以外的更多第二高偏好目标用户被推送所述目标任务类型的任务,提高所述第二高偏好目标用户与所述目标任务类型任务的粘合度。
本发明实施例中,根据各个任务响应活跃用户的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,并根据利用所述接受概率逻辑回归模型估算的历史任务接受概率和所述各个任务响应活跃用户对各自的历史推送任务的响应结果标签数据,分别估算所述各个任务响应活跃用户关于各自的历史推送任务及各自的响应结果标签数据对应的响应结果的用户似然程度,由于所述用户似然程度可以表示所述任务响应活跃用户对所述目标任务类型的任务的偏好程度,因此可以根据所述用户似然程度确定所述第一高偏好目标用户,进而向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。实现了根据用户的偏好进行差异化推送众包任务,提高了用户对众包任务的响应程度,进而提高了众包任务的交付效率。
参见图2,图2是本发明实施例提供的另一种基于用户偏好的众包任务推送方法的流程示意图,如图所示,所述方法包括:
S201,分别获取针对所述目标任务类型的任务的所有的历史用户。
例如,所述目标任务类型为信息采集类,则获取被推送过信息采集类任务的所有历史用户。
S202,分别计算每个历史用户的目标类型任务接受比例,并将所述历史用户按照各自的目标类型任务接受比例从高到低的顺序进行排序,将排序靠前的第一预设数量的历史用户确定为任务响应活跃用户。
这里,上述目标类型任务接受比例为每个历史用户对上述目标任务类型的任务的接受次数与其被推送所述目标任务类型的次数的比值。例如,假设步骤S201中针对信息采集类的任务确定的历史用户有100个,这100个历史用户中的一个用户A曾被推送过信息采集类任务的次数有15次,用户A针对被推送过的信息采集类任务的接受次数为10次,则用户A的目标类型任务接受比例为10/15=2/3,按照上述计算方法,依次计算这100个历史用户各自的目标类型任务接受比例,若所述第一预设数量为50,则将所述100个历史用户中目标类型任务接受比例最高的50个用户确定为所述任务响应活跃用户。
S203,分别获取各个任务响应活跃用户的历史推送信息集,并将所述历史推送信息集中的每个历史推送信息进行量化处理,得到各个任务响应活跃用户对应的历史推送数据集。
具体的,每个任务响应活跃用户的历史推送信息集都包括第二预设数量组的历史推送信息,每一组历史推送信息包含所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户信息、所述历史推送任务对应的历史任务信息和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果。所述历史任务信息包括所述历史推送任务的至少一个任务属性特征信息,所述活跃用户信息包括所述任务响应活跃用户的至少一个用户属性特征信息。通过将每个任务属性特征信息和每个用户属性特征信息进行量化处理,进而完成对的历史推送信息集的量化处理。
举例来说,若所述目标任务类型为信息采集类,所述第一预设数量为50,所述第二预设数量为30,步骤S203中获取到的50个任务响应活跃用户中用户B的历史推送信息集,如表1所示:
表1
表1中的采集时间、采集渠道和信息类型为历史任务信息包括的3个任务特征属性信息,年龄、被推送时所在地点和熟练程度为活跃用户信息包括的3个用户属性特征信息,分别将上述各个任务特征属性信息和各个用户属性特征信息进行量化处理,将采集时间量化为时间对应的数字,将采集渠道量化为:电话采集、互联网采集和实地采集分别对应数字1、2和3,将信息类型量化为:娱乐类型、饮食类型和医疗类型分别对应数字1、2和3,将年龄量化为和年龄对应的数字,将被推送时所在的地点量化为:家里、户外和公司分别对应数字1、2和3,将熟练程度量化为:非常熟练、较熟练、熟练、不太熟练和不熟练分别对应数字5、4、3、2和1,将响应结果接受量化为响应结果标签1,将响应结果拒绝或忽略量化为响应结果标签0,得到用户B的历史推送数据集,如表2所示:
表2
S204,根据全部第一预设数量的任务响应活跃用户各自的历史推送数据集中包含的用户属性特征数据和响应结果标签数据,统计由用户属性特征数据组成的用户特征权值向量中各个用户属性特征数据的用户特征权重。
具体的,所述用户特征权重表示对应的用户属性特征数据对所述任务响应活跃用户接受所述历史推送任务的影响程度,所述用户特征权重可以通过SPSS(StatisticalProduct and Service Solutions,统计产品与服务解决方案)或SAS(StatisticsAnalysis System,统计分析***)等统计软件来计算。
可选的,为了提高计算效率、降低计算成本,可以将所述用户属性特征数据中对应用户特征权重绝对值较小的用户属性特征数据舍去,筛选出用户特征权重较大的用户属性特征数据参与计算。例如,假如利用统计软件SPSS统计计算得到性别、年龄、被推送时所在地点和熟练程度的用户特征权重分别为:0.002、0.335、0.114和0.219,则可以将性别对应的用户属性特征数据舍去,不参与计算。
S205,根据所述用户特征权重,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型。
基于步骤S203中的例子,若步骤S204中得到的年龄、被推送时所在地点和熟练程度的用户特征权重分别为:0.335、0.114和0.219,定义采集时间、采集渠道、采集类型分别用变量t、c、k表示,年龄、被推送时所在地点、熟练程度分别用变量a、s、l表示,用事件A1表示50个任务响应活跃用户中第u个用户接收30个历史推送任务中第i个历史推送任务,则第u个用户对第i个历史推送任务的历史任务接受概率用公式(3)表示为:
其中,向量xi为第i个历史推送任务对应的任务属性特征数据采集时间ti、采集渠道ci、信息类型ki构成的任务特征值向量,向量xi=(ti,ci,ki);向量wu为第u个用户针对第i个历史推送任务的用户属性特征数据年龄au、被推送时所在地点su、熟练程度lu构成的用户特征权值向量,向量wu=(0.335*au,0.114*su,0.219*lu)。
S206,利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率。
这里,所述历史任务接受概率为所述任务响应活跃用户在曾被推送所述历史任务数据对应的历史推送任务时,接受所述历史任务数据对应的历史推送任务的概率。
基于步骤S203中的例子,若步骤S204中统计软件SPSS统计计算得到的年龄、被推送时所在地点和熟练程度的用户特征权重分别为:0.335、0.114和0.219,根据表2对应的历史推送数据集,标号为3对应的历史推送任务的任务特征值向量为x3=(12,3,3),用户B针对标号为3对应的历史推送任务的用户特征权值向量为wB=(0.335*20,0.114*3,0.219*4),将x3和wB代入步骤S205中的公式(3)中计算就得到用户B在曾被推送标号为3对应的历史推送任务时,对标号为3对应的历史推送任务的历史任务接受概率PB(A1|x3)。按照上述方法,可以依次估算出用户B在分别被推送标号为1、2、3、…、30对应的历史推送任务时,对标号为1、2、3、…、30对应的历史推送任务的历史任务接受概率PB(A1|x1)、PB(A1|x2)、PB(A1|x3)、…、PB(A1|x30)。进而可以估算出每个任务响应活跃用户在曾被推送相应的历史推送任务时,对相应的历史推送任务的历史任务接受概率。
S207,根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度。
基于步骤S203中的例子,若步骤S206中得到用户B在分别被推送标号为1、2、3、…、30对应的历史推送任务时,对标号为1、2、3、…、30对应的历史推送任务的历史任务接受概率PB(A1|x1)、PB(A1|x2)、PB(A1|x3)、…、PB(A1|x30),用户B的采样样本集为[(标号为1对应的历史推送任务,接受),(标号为2对应的历史推送任务,拒绝),(标号为3对应的历史推送任务,接受),(标号为4对应的历史推送任务,忽略),……,(标号为30对应的历史推送任务,接受)],用户B对自身采样样本集的用户似然程度可以利用公式(4)计算:
P(yB|wB)=PB(A1|x1)*[1-PB(A1|x2)]*[1-PB(A1|x3)]*…*PB(A1|x30)……公式(4)
按照上述方法依次计算出50个任务响应活跃用户对自身采样样本集的似然程度。
S208,将所述第一预设数量的任务响应活跃用户按照各自对应的用户似然程度从高到低排序,并将排序最靠前的第三预设数量的任务响应活跃用户确定为第一高偏好目标用户。
这里,所述第三预设数量为所述第一高偏好目标用户的数量,所述第三预设数量的值可以是预设的固定值,也可以是设定的所述第一预设数量的值的固定百分比,所述固定值和所述固定百分比可以根据目标推送任务的紧急情况等属性信息的不同进行不同的设定,但所述固定值或固定百分比的设定要保证所述第三预设数量小于或等于所述第一预设数量,且大于或等于目标推送任务的数量。
例如,若步骤S207中50个任务响应活跃用户按照各自的用户似然程度从高到低进行排序,得到序列如表3所示:
排序标号 用户 用户似然程度
1 用户20 0.0835
2 用户8 0.0762
3 用户44 0.0754
4 用户6 0.0733
5 用户29 0.0689
6 用户12 0.0687
7 用户3 0.0644
8 用户1 0.0621
9 用户46 0.0584
…… …… ……
50 用户39 0.0014
表3
若所述第三预设数量为6,则将用户20、用户8、用户44、用户6、用户29、用户12确定为所述第一高偏好目标用户。
S209,根据所述第一高偏好目标用户的历史推送数据集,确定所述第一高偏好目标用户的高偏好接受时间数据,并在所述高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。
具体的,所述高偏好接受时间数据对应的时刻为所述第一高偏好目标用户在一天的24小时中接受所述目标推送任务可能性最大的时刻,在第一高偏好目标用户接受所述目标推送任务可能性最大的时刻进行推送,可以进一步提高所述第一高偏好目标用户对所述目标推送任务接受的可能性,进而提高所述目标推送任务的交付效率。
这里,可以确定一个所述第一高偏好目标用户共同的高偏好接受时间数据,在所述高偏好接受时间对应的时刻统一向所述第一高偏好目标用户推送所述目标推送任务,也可以确定各个第一高偏好目标用户各自的高偏好接受时间数据,在各个第一高偏好目标用户各自的高偏好接受时间数据对应的时刻分别向对应的第一高偏好目标用户推送所述目标推送任务,进而,确定所述第一高偏好目标用户的高偏好接受时间数据的方法也有多种。
在一种可选的实施方式中,可以对全部第一高偏好目标用户各自的历史推送数据集进行统计计算,得到在0点-1点、1点-2点、2点-3点、…、23点-24点进行推送的历史推送任务被接受的数量最多的一个接受高峰时间段,可以将所述接受高峰时间段确定为所述高偏好接受时间数据,例如,经过统计计算得到在17点-18点时间段内推送的历史推送任务被接受的数量最多,则可以在17点-18点之间随机的时间点分别向所述第一高偏好目标用户推送所述目标推送任务。
也可以对所述第一高偏好目标用户各自的历史推送数据集进行分别统计计算,得到各个第一高偏好目标用户各自的接受高峰时间段,分别在各个第一高偏好目标用户各自的接受高峰时间段向对应的第一高偏好目标用户推送所述目标推送任务。
在另一种可选的实施方式中,获取全部第一高偏好目标用户的历史任务接受概率中最高的第四预设数量的历史任务接受概率,将所述最高的第四预设数量的历史任务接受概率对应的历史推送任务的推送时间数据确定为所述高偏好接受时间数据,将所述目标任务类型的目标推送任务分配给第四预设数量的推送批次,分别在所述第四预设数量的高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送对应推送批次的目标推送任务。所述推送时间数据可以存在于所述历史推送数据集包含的活跃用户数据中,也可以存在于所述历史推送数据集包含的历史任务数据中。
例如,若所述第四预设数量为3,全部第一高偏好目标用户的历史任务接受概率中最高的3个历史任务接受概率分别为用户A对自身曾被推送的第3个所述目标任务类型的历史推送任务的历史任务接受概率PA(A1|x3)、用户M对自身曾被推送的第12个所述目标任务类型的历史推送任务的历史任务接受概率PM(A1|x12)、用户G对自身曾被推送的第29个所述目标任务类型的历史推送任务的历史任务接受概率PG(A1|x29),进一步,可以根据用户A的历史推送数据集确定到用户A曾被推送所述第3个历史推送任务的时刻为17点,根据用户M的历史推送数据集确定到用户M曾被推送所述第12个历史推送任务的时刻为11点,根据用户G的历史推送数据集确定到用户G曾被推送所述第29个历史推送任务的时刻为15点,若所述目标推送任务一共有15个,将这15个目标推送任务随机分给3个推送批次,例如可以分别随机分配5个目标推送任务给各个推送批次,然后分别在11点、15点和17点向所述第一高偏好目标用户推送所述3个推送批次的目标推送任务。
也可以分别获取所述第一高偏好目标用户各自最高的历史任务接受概率,进一步确定所述第一高偏好目标用户各自最高的历史任务接受概率对应的历史推送任务的推送时刻,并分别在所述第一高偏好目标用户各自最高的历史任务接受概率对应的历史推送任务的推送时刻,将所述目标推送任务推送给所述第一高偏好目标用户。
可选的,若接收到所述第一高偏好目标用户针对所述目标推送任务的任务拒绝指令时,为所述任务拒绝指令对应的目标推送任务确定第二高偏好目标用户,进一步确定所述第二高偏好目标用户的高偏好接受时间数据,在所述第二高偏好目标用户的高偏好接受时间数据对应的时刻,将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
基于步骤S208中的例子,若将6个目标任务类型的目标推送任务推送给用户20、用户8、用户44、用户6、用户29、用户12后,接收到了用户44和用户12的任务拒绝指令,则可以将用户3和用户1确定为第二高偏好目标用户,然后进一步获取到用户3和用户1各自最高的历史任务接受概率分别为用户3对自身曾被推送的第18个所述目标任务类型的历史推送任务的历史任务接受概率和用户1对自身曾被推送的第5个所述目标任务类型的历史推送任务的历史任务接受概率,用户3曾被推送所述第18个历史推送任务的时刻为3点,用户1曾被推送所述第5个历史推送任务的时刻为10点,则分别将用户44和用户12各自发送的任务拒绝指令对应的历史推送任务在3点和10点推送给用户3和用户1。
本发明实施例中,首先从所述目标任务类型的任务的历史用户中确定出任务响应活跃用户,然后通过对所述任务响应活跃用户的历史推送信息集进行量化处理得到所述任务响应活跃用户的历史推送数据集,并根据所述历史推送数据集和建立的接受概率逻辑回归模型估算所述任务响应活跃用户的用户似然程度,进而根据所述用户似然程度从所述任务响应活跃用户中确定第一高偏好目标用户,并在所述第一高偏好目标用户的高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送所述目标类型的目标推送任务。不仅实现了根据用户的偏好进行差异化推送众包任务,而且在用户接受任务可能性大的时刻向进行任务推送,进一步提高了用户对众包任务的响应程度,提高了众包任务的交付效率。
参见图3,图3为本发明实施例提供的一种基于用户偏好的众包任务推送装置的结构示意图,如图所示,所述基于用户偏好的众包任务推送装置30可以包括:
活跃用户确定单元301,用于针对目标任务类型的任务确定第一预设数量的任务响应活跃用户。
具体的,所述任务主要指互联网上出现的众包任务,涉及信息检索、人工智能、视频分析、知识挖掘、图像质量评估等领域。所述任务的任务类型可以有多种,例如,语义判断类、语音识别类、信息收集类等,所述目标任务类型可以是其中的一种。所述第一预设数量可以根据所述目标任务类型的任务的不同进行调整,可以理解的是,上述第一预设数量越大,即采样的任务响应活跃用户的数量越多,该基于用户偏好的众包任务推送装置确定出的针对所述目标任务类型的任务的第一高偏好目标用户越准确。
可选的,所述活跃用户确定单元301具体可以用于:分别获取针对所述目标任务类型的任务所有的历史用户;分别计算每个历史用户的目标类型任务接受比例,上述目标类型任务接受比例为每个历史用户对上述目标任务类型的任务的接受次数与其被推送所述目标任务类型的次数的比值;将所述历史用户按照各自的目标类型任务接受比例从高到低的顺序进行排序,将排序靠前的第一预设数量的历史用户确定为所述任务响应活跃用户。
数据集获取单元302,用于分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据。
具体的,针对活跃用户确定单元301确定的第一数量的任务响应活跃用户,分别采集每个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据,即所述任务响应活跃用户每被推送一个所述历史推送任务就产生一组历史推送数据。可以理解的是,上述第二预设数量越大,即针对每个任务响应活跃用户采样的历史推送数据越多,该基于用户偏好的众包任务推送装置确定出的针对所述目标任务类型的任务的第一高偏好目标用户越准确。
可选的,所述数据集获取单元302具体可以分别获取各个任务响应活跃用户的历史推送信息集,将所述历史推送信息集中的每个历史推送信息进行量化处理,得到各个任务响应活跃用户对应的历史推送数据集。
模型建立单元303,用于根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型。
这里,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率。所述接受概率逻辑回归模型是所述模型建立单元303根据全部第一预设数量的任务响应活跃用户的历史推送数据集建立的,利用此接受概率逻辑回归模型可以估算出任何一个所述任务响应活跃用户对任何一个所述历史推送任务的历史任务接受概率。
可选的,所述历史任务数据包括所述历史推送任务的至少一个任务属性特征数据,所述活跃用户数据包括所述任务响应活跃用户的至少一个用户属性特征数据。若所述第二预设数量为m,m为正整数,用事件A1表示任务响应活跃用户u接受m个历史推送任务中的第i个历史推送任务,i为正整数,i∈[1,m],则所述模型建立单元303建立接受概率逻辑回归模型,所述任务响应活跃用户u对第i个历史推送任务的历史任务接受概率用公式(5)表示为:
其中,向量xi为第i个历史推送任务对应的任务属性特征数据构成的任务特征值向量;向量wu为所述任务响应活跃用户u针对第i个历史推送任务的用户属性特征数据构成的用户特征权值向量,所述用户特征权值向量中各个用户属性特征数据的用户特征权重,所述模型建立单元303根据全部第一预设数量的任务响应活跃用户各自的用户属性特征数据和所述任务响应活跃用户对应历史推送数据集的响应结果标签数据统计得到。
估算单元304,用于利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率。
具体的,所述估算单元304利用上述接受概率逻辑回归模型,根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集中包含的活跃用户数据和历史任务数据,估算出各个历史活跃用户在自身曾被推送过的历史推送任务时,对所述历史推送任务的历史任务接受概率。
所述估算单元304,还用于根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度。
具体的,所述估算单元304根据估算的所述任务响应活跃用户在自身曾被推送过的历史推送任务时对所述历史推送任务的历史任务接受概率,和针对所述历史推送任务的响应结果标签数据,利用似然函数估算所述任务响应活跃用户的用户似然程度,所述用户似然程度是所述任务响应活跃用户关于自身采样样本集的似然程度,所述采样样本集包括所述任务响应活跃用户的历史推送数据集中包含的所有历史任务数据对应的历史推送任务和所述任务响应活跃用户的历史推送数据集中包含的所有响应结果标签数据对应的响应结果。由于所述采样样本集为针对任务响应活跃用户的较为活跃的采样样本集,即该采样样本集中对应的历史推送任务曾被对应历史活跃用户接受的数量较多,因此可以用所述任务响应活跃用户关于自身采样样本集的用户似然程度来近似表示所述任务响应活跃用户针对所述目标任务类型的任务的偏好程度。
可选的,若所述第二预设数量为m,m为正整数,针对任务响应活跃用户u推送的m个历史推送任务和所述m个历史推送任务的响应结果标签数据对应的响应结果,构成了所述任务响应活跃用户u的采样样本集,则所述估算单元304将任务响应活跃用户u关于所述采样样本集的似然程度用公式(6)表示为:
其中,Pu(A1|xuj)表示任务响应活跃用户u对m个历史推送任务中第j个历史推送任务的历史任务接受概率;yuj为所述任务响应活跃用户u对m个历史推送任务中的第j个历史推送任务的响应结果标签数据,j为正整数,j∈[1,m],yuj∈{0,1}。
任务推送单元305,用于根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
具体的,由于所述用户似然程度可以表示所述任务响应活跃用户针对该目标任务类型的任务的偏好程度,所以所述估算单元304估算的用户似然程度越高的任务响应活跃用户对该目标任务类型的任务的偏好程度越高,因此可以将所述用户似然程度最高的一定数量或一定比例的任务响应活跃用户确定为第一高偏好目标用户,当有目标任务类型的目标推送任务待推送时,可以将其推送给所述第一高偏好目标用户。
可选的,所述任务推送单元305可以具体用于:将所述第一预设数量的任务响应活跃用户按照各自对应的用户似然程度从高到低排序;将排序最靠前的第三预设数量的任务响应活跃用户确定为第一高偏好目标用户,所述第三预设数量小于或等于所述第一预设数量,且大于或等于所述目标推送任务的数量。
进一步可选的,所述基于用户偏好的众包任务推送装置30还可以包括:
二级筛选单元306,用于从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户。
所述二级筛选单元306,还用于当接收到所述第一高偏好目标用户针对目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户。
所述任务推送单元305,还用于将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
当被推送了所述目标推送任务的所述第一高偏好目标用户中有发出任务拒绝指令的用户时,所述二级筛选单元306可以从所述任务响应活跃用户中所述第一高偏好目标用户以外的用户中筛选出偏好程度较高的第二高偏好目标用户,所述任务推送单元305将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户,既可以保证为所述任务拒绝指令对应的目标推送任务匹配偏好程度较高的用户进行推送,又可以避免所述第一高偏好目标用户被重复推送上述目标任务类型对应的目标推送任务而降低所述第一偏好目标用户对所述目标任务类型的任务的偏好程度,还可以提高所述目标任务类型的任务的曝光度,使所述第一高偏好目标用户以外的更多第二高偏好目标用户被推送所述目标任务类型的任务,提高所述第二高偏好目标用户与所述目标任务类型任务的粘合度。
进一步可选的,所述任务推送单元305具体可以用于:根据所述第一高偏好目标用户的历史推送数据集,确定所述第一高偏好目标用户的高偏好接受时间数据;在所述高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。
具体的,所述高偏好接受时间数据对应的时刻为所述第一高偏好目标用户在一天的24小时中接受所述目标推送任务概率最大的时刻,所述任务推送单元305在第一高偏好目标用户接受所述目标推送任务概率最大的时刻进行推送,可以进一步提高所述第一高偏好目标用户对所述目标推送任务接受的可能性,进而提高所述目标推送任务的交付效率。这里,所述任务推送单元305可以确定一个所述第一高偏好目标用户共同的高偏好接受时间数据,在所述高偏好接受时间对应的时刻统一向所述第一高偏好目标用户推送所述目标推送任务,也可以确定各个第一高偏好目标用户各自的高偏好接受时间数据,在各个第一高偏好目标用户各自的高偏好接受时间数据对应的时刻分别向对应的第一高偏好目标用户推送所述目标推送任务。
本发明实施例中,模型建立单元根据各个任务响应活跃用户的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,估算单元根据利用所述接受概率逻辑回归模型估算的历史任务接受概率和所述各个任务响应活跃用户对各自的历史推送任务的响应结果标签数据,分别估算所述各个任务响应活跃用户关于各自的历史推送任务及各自的响应结果标签数据对应的响应结果的用户似然程度,由于所述用户似然程度可以表示所述任务响应活跃用户对所述目标任务类型的任务的偏好程度,因此可以根据所述用户似然程度确定所述第一高偏好目标用户,进而向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。实现了根据用户的偏好进行差异化推送众包任务,提高了用户对众包任务的响应程度,进而提高了众包任务的交付效率。
参见图4,图4为本发明实施例提供的另一种基于用户偏好的众包任务推送装置的结构示意图,如图所示,所述基于用户偏好的众包任务推送装置40包括处理器401、存储器402以及通信接口403。处理器401连接到存储器402和通信接口403,例如处理器401可以通过总线连接到存储器402和通信接口403。
处理器401被配置为支持所述基于用户偏好的众包任务推送装置执行图1-图2所述的基于用户偏好的众包任务推送方法中相应的功能。该处理器401可以是中央处理器(Central Processing Unit,CPU),网络处理器(Network Processor,NP),硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(Application-Specific IntegratedCircuit,ASIC),可编程逻辑器件(Programmable Logic Device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD),现场可编程逻辑门阵列(Field-Programmable Gate Array,FPGA),通用阵列逻辑(Generic Array Logic,GAL)或其任意组合。
存储器402用于存储程序代码等。存储器402包括内部存储器,内部存储器可以包括以下至少一项:易失性存储器(例如动态随机存取存储器(DRAM)、静态RAM(SRAM)、同步动态RAM(SDRAM)等)和非易失性存储器(例如一次性可编程只读存储器(OTPROM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)。存储器402还可以包括外部存储器,外部存储器可以包括以下至少一项:硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD)、闪驱,例如高密度闪存(CF)、安全数字(SD)、微型SD、迷你型SD、极限数字(xD)、存储棒等。
所述通信接口403用于接收或发送数据。
处理器401可以调用所述程序代码以执行以下操作:
针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;
分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据;
根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率;
利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率;
根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度;
根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
需要说明的是,各个操作的实现还可以对应参照图1-图2所示的方法实施例的相应描述;所述处理器401还可以用于执行上述方法实施例中的其他操作。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的基于用户偏好的众包任务推送装置的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种基于用户偏好的众包任务推送方法,其特征在于,包括:
针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;
分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据;
根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率;
利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率;
根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度;
根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
2.如权利要求1所述的方法,其特征在于,所述历史任务数据包括所述历史推送任务的至少一个任务属性特征数据,所述活跃用户数据包括所述任务响应活跃用户的至少一个用户属性特征数据;
所述根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型包括:
若所述第二预设数量为m,m为正整数,用事件A1表示任务响应活跃用户u接受m个历史推送任务中的第i个历史推送任务,i为正整数,i∈[1,m],则所述任务响应活跃用户u对第i个历史推送任务的历史任务接受概率为:
其中,向量xi为第i个历史推送任务对应的任务属性特征数据构成的任务特征值向量;向量wu为所述任务响应活跃用户u针对第i个历史推送任务的用户属性特征数据构成的用户特征权值向量,所述用户特征权值向量中各个用户属性特征数据的用户特征权重,根据全部第一预设数量的任务响应活跃用户各自的用户属性特征数据和所述任务响应活跃用户对应历史推送数据集的响应结果标签数据统计得到。
3.如权利要求1所述的方法,其特征在于,所述根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度包括:
若所述第二预设数量为m,m为正整数,针对任务响应活跃用户u推送的m个历史推送任务和所述m个历史推送任务的响应结果标签数据对应的响应结果,构成了所述任务响应活跃用户u的采样样本集,则任务响应活跃用户u关于所述采样样本集的似然程度为:
其中,Pu(A1|xuj)表示任务响应活跃用户u对m个历史推送任务中第j个历史推送任务的历史任务接受概率;yuj为所述任务响应活跃用户u对m个历史推送任务中的第j个历史推送任务的响应结果标签数据,j为正整数,j∈[1,m],yuj∈{0,1}。
4.如权利要求1所述的方法,其特征在于,所述根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户包括:
将所述第一预设数量的任务响应活跃用户按照各自对应的用户似然程度从高到低排序;
将排序最靠前的第三预设数量的任务响应活跃用户确定为第一高偏好目标用户,所述第三预设数量小于或等于所述第一预设数量,且大于或等于所述目标推送任务的数量。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户;
当接收到所述第一高偏好目标用户针对所述目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户;
将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
6.如权利要求1所述的方法,其特征在于,所述将目标任务类型的目标推送任务推送给所述第一高偏好目标用户包括:
根据所述第一高偏好目标用户的历史推送数据集,确定所述第一高偏好目标用户的高偏好接受时间数据;
在所述高偏好接受时间数据对应的时刻向所述第一高偏好目标用户推送所述目标任务类型的目标推送任务。
7.一种基于用户偏好的众包任务推送装置,其特征在在于,包括:
活跃用户确定单元,用于针对目标任务类型的任务确定第一预设数量的任务响应活跃用户;
数据集获取单元,用于分别获取各个任务响应活跃用户的历史推送数据集,所述历史推送数据集包括第二预设数量的历史推送数据,所述历史推送数据包括所述任务响应活跃用户被推送目标任务类型的历史推送任务所产生的活跃用户数据、所述历史推送任务对应的历史任务数据和所述历史推送任务是否被所述任务响应活跃用户接受的响应结果标签数据;
模型建立单元,用于根据所述第一预设数量的任务响应活跃用户各自的历史推送数据集,建立历史任务接受概率关于所述历史任务数据和所述活跃用户数据的接受概率逻辑回归模型,所述历史任务接受概率为所述任务响应活跃用户对各个历史推送任务的接受概率;
估算单元,用于利用所述接受概率逻辑回归模型,根据所述活跃用户数据和所述历史任务数据估算所述历史任务接受概率;
所述估算单元,还用于根据所述历史任务接受概率和所述响应结果标签数据,估算所述任务响应活跃用户关于所述历史推送任务及所述历史推送任务的响应结果标签数据对应的响应结果的用户似然程度;
任务推送单元,用于根据所述第一预设数量的任务响应活跃用户各自对应的用户似然程度从所述第一预设数量的任务响应活跃用户中确定第一高偏好目标用户,并将目标任务类型的目标推送任务推送给所述第一高偏好目标用户。
8.如权利要求7所述的基于用户偏好的众包任务推送装置,其特征在于,所述装置还包括:
二级筛选单元,用于从所述第一预设数量的任务响应活跃用户中删除所述第一高偏好目标用户,并将删除所述第一高偏好目标用户后的任务响应活跃用户确定为二级筛选活跃用户;
所述二级筛选单元,还用于当接收到所述第一高偏好目标用户针对目标推送任务的任务拒绝指令时,根据所述二级筛选活跃用户各自对应的用户似然程度,从所述二级筛选活跃用户中确定第二高偏好目标用户;
所述任务推送单元,还用于将所述任务拒绝指令对应的目标推送任务推送给所述第二高偏好目标用户。
9.一种基于用户偏好的众包任务推送装置,其特征在于,包括处理器、存储器以及通信接口,所述处理器、存储器和通信接口相互连接,其中,所述通信接口用于接收和发送数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1-6任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-6任一项所述的方法。
CN201811364711.1A 2018-11-15 2018-11-15 基于用户偏好的众包任务推送方法及相关装置 Active CN109523237B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811364711.1A CN109523237B (zh) 2018-11-15 2018-11-15 基于用户偏好的众包任务推送方法及相关装置
PCT/CN2019/088796 WO2020098251A1 (zh) 2018-11-15 2019-05-28 基于用户偏好的众包任务推送方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811364711.1A CN109523237B (zh) 2018-11-15 2018-11-15 基于用户偏好的众包任务推送方法及相关装置

Publications (2)

Publication Number Publication Date
CN109523237A true CN109523237A (zh) 2019-03-26
CN109523237B CN109523237B (zh) 2023-08-04

Family

ID=65777956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811364711.1A Active CN109523237B (zh) 2018-11-15 2018-11-15 基于用户偏好的众包任务推送方法及相关装置

Country Status (2)

Country Link
CN (1) CN109523237B (zh)
WO (1) WO2020098251A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059297A (zh) * 2019-04-22 2019-07-26 上海乂学教育科技有限公司 适用于自适应学习的知识点学习时长预测方法及其应用
CN110188977A (zh) * 2019-04-10 2019-08-30 阿里巴巴集团控股有限公司 项目审核成员调度方法以及装置
CN110414862A (zh) * 2019-08-05 2019-11-05 中国工商银行股份有限公司 基于分类模型的任务调整方法及装置
CN111027838A (zh) * 2019-12-04 2020-04-17 杨剑峰 一种众包任务推送方法、装置、设备及其存储介质
WO2020098251A1 (zh) * 2018-11-15 2020-05-22 平安科技(深圳)有限公司 基于用户偏好的众包任务推送方法及相关装置
CN112200607A (zh) * 2020-09-30 2021-01-08 中国银行股份有限公司 一种推广信息的推送方法、装置、设备及介质
CN113536186A (zh) * 2021-07-30 2021-10-22 贵阳高新数通信息有限公司 一种网页信息标注及提取***

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858807B (zh) * 2020-07-16 2024-03-05 北京百度网讯科技有限公司 一种任务处理方法、装置、设备以及存储介质
CN112532692A (zh) * 2020-11-09 2021-03-19 北京沃东天骏信息技术有限公司 一种信息推送方法及装置、存储介质
CN113762695A (zh) * 2021-01-18 2021-12-07 北京京东乾石科技有限公司 一种任务单分配方法和装置
CN117422266B (zh) * 2023-11-01 2024-04-30 烟台大学 基于工人偏好的任务分配方法、***、装置、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649774A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于人工智能的对象推送方法及装置
CN106997358A (zh) * 2016-01-22 2017-08-01 中移(杭州)信息技术有限公司 信息推荐方法及装置
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
CN108304656A (zh) * 2018-02-01 2018-07-20 三峡大学 一种劳务众包平台的任务接受情况仿真方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8626545B2 (en) * 2011-10-17 2014-01-07 CrowdFlower, Inc. Predicting future performance of multiple workers on crowdsourcing tasks and selecting repeated crowdsourcing workers
CN106327090A (zh) * 2016-08-29 2017-01-11 安徽慧达通信网络科技股份有限公司 一种应用于带偏好众包***的真实任务分配方法
CN106570639A (zh) * 2016-10-28 2017-04-19 西北大学 众包***中兼顾用户异质性与用户偏好的任务分配方法
CN108647216A (zh) * 2017-03-16 2018-10-12 上海交通大学 基于开发人员社交网络的软件众包任务推荐***及方法
CN109523237B (zh) * 2018-11-15 2023-08-04 平安科技(深圳)有限公司 基于用户偏好的众包任务推送方法及相关装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997358A (zh) * 2016-01-22 2017-08-01 中移(杭州)信息技术有限公司 信息推荐方法及装置
CN106649774A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于人工智能的对象推送方法及装置
CN107730389A (zh) * 2017-09-30 2018-02-23 平安科技(深圳)有限公司 电子装置、保险产品推荐方法及计算机可读存储介质
CN108304656A (zh) * 2018-02-01 2018-07-20 三峡大学 一种劳务众包平台的任务接受情况仿真方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020098251A1 (zh) * 2018-11-15 2020-05-22 平安科技(深圳)有限公司 基于用户偏好的众包任务推送方法及相关装置
CN110188977A (zh) * 2019-04-10 2019-08-30 阿里巴巴集团控股有限公司 项目审核成员调度方法以及装置
CN110059297A (zh) * 2019-04-22 2019-07-26 上海乂学教育科技有限公司 适用于自适应学习的知识点学习时长预测方法及其应用
CN110414862A (zh) * 2019-08-05 2019-11-05 中国工商银行股份有限公司 基于分类模型的任务调整方法及装置
CN111027838A (zh) * 2019-12-04 2020-04-17 杨剑峰 一种众包任务推送方法、装置、设备及其存储介质
CN111027838B (zh) * 2019-12-04 2024-03-26 杨剑峰 一种众包任务推送方法、装置、设备及其存储介质
CN112200607A (zh) * 2020-09-30 2021-01-08 中国银行股份有限公司 一种推广信息的推送方法、装置、设备及介质
CN113536186A (zh) * 2021-07-30 2021-10-22 贵阳高新数通信息有限公司 一种网页信息标注及提取***

Also Published As

Publication number Publication date
WO2020098251A1 (zh) 2020-05-22
CN109523237B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN109523237A (zh) 基于用户偏好的众包任务推送方法及相关装置
Schumann et al. We need fairness and explainability in algorithmic hiring
CN110162717B (zh) 一种推荐好友的方法和设备
WO2018126953A1 (zh) 种子人群扩散方法、装置、信息投放***以及存储介质
US8930378B2 (en) Labeling samples in a similarity graph
US11816727B2 (en) Credit scoring method and server
EP3471374A1 (en) Method and device for identifying type of geographic location at where user is located
CN111177473B (zh) 人员关系分析方法、装置和可读存储介质
WO2020102093A1 (en) System and method of assigning customer service tickets
WO2022105136A1 (zh) 案件分配方法、装置及介质
US20220261591A1 (en) Data processing method and apparatus
CN113538070B (zh) 用户生命价值周期检测方法、装置和计算机设备
US20160034705A1 (en) Stochastic privacy
EP3905162A2 (en) Schedule management service system and method
US20210357553A1 (en) Apparatus and method for option data object performance prediction and modeling
CN110427620B (zh) 基于社群***的服务质量优化管理***
Li et al. When user interest meets data quality: A novel user filter scheme for mobile crowd sensing
CN114581130A (zh) 基于客户画像的银行网点派号方法及装置、存储介质
CN110674330B (zh) 表情管理的方法、装置、电子设备及存储介质
WO2022253454A2 (en) Dimensioning of telecommunication infrastructure
CN113158037A (zh) 一种面向对象的信息推荐方法和装置
CN112365189A (zh) 案件分配方法及装置
CN113065880A (zh) 群体不满意用户识别方法、装置、设备及存储介质
Saito et al. An Analytical Model of Response Interval Between Employees on Business Chat Systems Based on Latent Class Model
Brintha et al. Privacy Enabled Dynamic Regimentation of Photo Posting on Online Social Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant