CN104462187B - 基于最大似然比的群智数据有效性验证方法 - Google Patents

基于最大似然比的群智数据有效性验证方法 Download PDF

Info

Publication number
CN104462187B
CN104462187B CN201410568300.XA CN201410568300A CN104462187B CN 104462187 B CN104462187 B CN 104462187B CN 201410568300 A CN201410568300 A CN 201410568300A CN 104462187 B CN104462187 B CN 104462187B
Authority
CN
China
Prior art keywords
mrow
data
msub
msup
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410568300.XA
Other languages
English (en)
Other versions
CN104462187A (zh
Inventor
闻于天
张奇
田晓华
杨峰
王新兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201410568300.XA priority Critical patent/CN104462187B/zh
Publication of CN104462187A publication Critical patent/CN104462187A/zh
Application granted granted Critical
Publication of CN104462187B publication Critical patent/CN104462187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种基于最大似然比的群智数据有效性验证方法,包括步骤:实验获取一个未经训练的普通人将某个观测分量判断错的先验概率;服务器对已经积累的所有数据按观测值归类;对同一测量值的所有数据,使用核密度估计计算概率密度函数,计算置信概率;服务器等待用户上传新的数据;测量者使用其移动终端进行多次测量,获得一组数据,连同测量者自己观察得到的观测分量一同上传给服务器;服务器将用户提供的数据与数据库相比较,使用一种基于最大似然比的群智数据有效性验证方法计算这组数据的似然可靠度;服务器决定是否接受这组数据,根据可靠性支付报酬,更新这个测量值的数据库,重新计算概率密度函数和置信概率。

Description

基于最大似然比的群智数据有效性验证方法
技术领域
本发明涉及通信技术领域,具体地,涉及一种基于最大似然比的群智数据有效性验证方法。
背景技术
群智(crowdsourcing)在智能手机的应用中有十分广阔的前景。随着互联网技术的飞速发展,网络中个体的数量飞速增长,个体相互之间的联系也越来越紧密。在这样的大环境下,群智服务应运而生。如何有效的构建群智服务平台,促进社会中的资源共享,是下一代互联网研究需要解决的重要问题。
如今,信息提供商往往采用群智激励机制(Crowdsourcing IncentiveMechanism),将采集信息的工作交由分散的用户来做,并为他们提供的信息或服务给予一定的回报。例如有人想知道某段道路的拥堵情况,由正在该路段上的用户提供的信息不仅比提供商派人去勘察得到的信息更快也更准确。如今手机传感技术(Mobile PhoneSensing)正在蓬勃的发展之中,多种多样的传感设备正在被安装到智能手机上,例如加速传感器,GPS,距离传感器,相机等。利用这些分散的用户的智能手机传感技术获取到所需的信息并上传给提供商是现阶段逐渐流行的手段。
尽管群智有众多优点,但是其弊端也是不可避免的。由于数据的测量者没有经过专业训练,测量的数据的观测误差总体来说会比较大,而且,由于测量者未经训练,不同数据的有效性的差异也会比通过传统方法获得的数据更大。极端情况下,如果测量者对测试对象非常陌生,甚至误操作,导致数据严重偏离了正常水平,采用这个数据将会对样本的有效性造成一定损害。
这是群智场景中特有的一种误差,以下称为观测误差;其余的称为测量误差。这两种误差通常都可以用更大的样本量来弥补,但是我们的目的在于通过概率论的方法对群智数据进行定量评价与比较。进一步地,目的在于能从中筛选出相对有效性更高的一部分,也就是观测误差较小的一部分。
经过对现有技术文献的检索发现,M.Ramadan等2008年在InternationalSymposium on Personal,Indoor and Mobile Radio Communications发表的“Implementation and evaluation of cooperative video streaming for mobiledevices”中提出了基于合作下载的视频分享机制,但该机制要求所有参与用户都相互认识并主动组成无线局域网,因而应用场景受到了极大限制。L.Keller等2012年在International Conference on Mobile Systems,Applications,and Services发表的“MicroCast:cooperative video streaming on smartphones”中提出了一种利用手机之间无线通信实现的视频协作下载加速机制。但该机制要求所有参与用户都希望下载同一个视频,该条件在大部分情况下都得不到满足,因而有很大的局限性。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于最大似然比的群智数据有效性验证方法,通过利用服务器数据库中已经积累的大量数据内容更好地筛选有效的数据,减少录入错误数据造成的判断偏差。
根据本发明提供的一种基于最大似然比的群智数据有效性验证方法,包括如下步骤:
步骤1:实验获取先验概率plj,其中,plj表示对于某个观测分量j,一个未经训练的测量者将该观测分量j判断为l的概率;
步骤2:服务器对已经积累的所有数据按观测值归类;对同一测量值j的所有数据,使用核密度估计计算概率密度函数,计算置信概率αj
步骤3:服务器等待用户上传新的数据;
步骤4:测量者i使用其移动终端进行多次测量,获得一组数据,这组数据连同测量者自己观察得到的观测分量一同上传给服务器;
步骤5:服务器将用户提供的数据与数据库相比较,计算这组数据的似然可靠度;
步骤6:服务器决定是否接受这组数据,根据可靠性支付报酬;如果服务器接受这组数据,返回步骤2,更新这个测量值j的数据库,重新使用步骤2中的方法计算概率密度函数和置信概率αj
优选地,所述步骤1包括如下步骤:
步骤1.1:对于基于Wi-Fi信号强度的室内定位的训练过程中,测量者需要确定自已所处室内的位置,产生观测误差;测量者的观测误差被抽象为其处于房间中一点时对于房间最近的两个墙壁的距离的估计误差;
步骤1.2:通过预先的一次实验确定先验概率plj并将先验概率plj应用于所有室内定位的活动中,具体为,令多个测量者在一个没有距离参照物的房间里某些固定点j判断自己的位置l,收集该多个测量者的判断结果分布情况即作为plj
步骤1.3:对于不能通过预先的一次实验确定的plj,可取克罗内克函数:
其中,δlj表示克罗内克函数。
优选地,所述步骤2包括如下步骤:
步骤2.1:服务器的数据库中的每个观测分量对应积累数据集Dj,j=1,2,3,...,N,N表示观测分量的总数,Dj中的各个元素Dj k,k=1,2,3,...T,服从fj(x)分布,T表示每个观测分量的数据总数,fj(x)表示观测分量j所服从的概率密度函数;T=|Dj|>>M,M表示测量者一次上传的数据总数,则
其中,Kh表示核密度函数,x表示数据变量;
步骤2.2:设即ns(x)表示[x-h,x+h]内数据库中已存在数据个数,h表示核密度函数Kh的带宽;
ns(x)可能有T+1个取值,服从分布:
其中,P(·)表示ns(x)的概率质量函数,ns(x)表示表示[x-h,x+h]内数据库中已存在数据个数,ns表示可能的取值,可取0,1,...,T,T+1中的任一值,表示从T个不同元素中取出ns个的组合数,h表示表示核密度函数Kh的带宽;
步骤2.3:通过数据库大小确定ril的期望,将这个期望作为置信概率α,其中,ril表示观测者i所上传的数据属于观测分量l的概率密度;显然,不同观测值对应的积累数据量是不同的,因此对于不同观测值有不同的置信概率αj
优选地,所述步骤4包括如下步骤:
步骤4.1:测量者获得一组M个数据记作下式
其中,表示测量者i对同一观测分量进行多次测量获得的一组数据,j表示这组M个数据的一个需要观测的分量的真实值,j∈{1,2,3,...,N},N表示观测分量的总数;xt i服从分量j对应分布fj(x),xt i表示测量者i上传的第t个数据;
步骤4.2:观测误差体现为测量者将j判断为j′上报给服务器,即
优选地,所述步骤5包括如下步骤:
步骤5.1:服务器取得数据后计算所有{ril}:
其中,M表示测量者一次上传的数据总数,f(·)表示观测分量所服从的概率密度函数,l表示可能的观测分量编号,xt ij′表示观测者i上传的第t个数据,并将其判断为观测分量j′,N表示观测分量的总数,ril的物理意义为属于观测分量l的概率密度;显然,当l=j时最大;
步骤5.2:定义参数
其中αj称为置信概率,plj′表示对于观测分量j′,测量者将该观测分量j′判断为观测分量l的概率;当αj=1时的意义为测量数据的最大可能概率密度的对数;显然对于相同长度的一组数据,较大者更可信;
步骤5.3:通过能够对所有群智数据的有效性进行排序,根据需要取其中的前若干个。
优选地,
在步骤2.1中,取核密度函数为均匀核函数:h足够小使得数据在带宽范围内近似均匀分布,落到这个区域内的概率Ps=P(|x-Dj k|<h)=f(x)2h;
在步骤2.3中,所有的数据都具有采用的价值,下面是一种计算ril的期望E{ril}的方法:
其中,fl(xt)表示观测分量l取值为xt的概率密度,l表示第l个观测分量,t表示观测者上传的第t个数据,M表示测量者一次上传的数据总数,!表示阶乘,e表示自然底数,Ps=P(|x-Dj k|<h)=f(xi)2h,f(xi)用核密度估计得出;上式中不存在T以外的变量,故确定了置信概率αj与数据库大小T的关系。
与现有技术相比,本发明具有如下的有益效果:
1、本发明可以通过预先实验矫正群智数据观测者的判断误差;
2、本发明可以基于现有的可靠数据集,评价新进群智数据的有效性,从而合理对新进群智数据做出有效取舍。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的步骤流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本发明提供了一种基于最大似然比的群智数据有效性验证方法,包括步骤:实验获取一个未经训练的普通人将某个观测分量判断错的先验概率;服务器对已经积累的所有数据按观测值归类;对同一测量值的所有数据,使用核密度估计计算概率密度函数,计算置信概率;服务器等待用户上传新的数据;测量者使用其移动终端进行多次测量,获得一组数据,连同测量者自己观察得到的观测分量一同上传给服务器;服务器将用户提供的数据与数据库相比较,使用一种基于最大似然比的群智数据有效性验证方法计算这组数据的似然可靠度;服务器决定是否接受这组数据,根据可靠性支付报酬,更新这个测量值的数据库,重新计算概率密度函数和置信概率。
具体地,本发明提供一种基于最大似然比的群智数据有效性验证方法,通过利用服务器数据库中已经积累的大量数据内容更好地筛选有效的数据,减少录入错误数据造成的判断偏差。
参见附图1,本发明是通过以下技术方案实现的,本发明包括如下步骤:
第一步:实验获取先验概率plj,表示对于某个观测分量j,一个未经训练的普通人将之判断为l的概率。
第二步:服务器对已经积累的所有数据按观测值归类。对同一测量值j的所有数据,使用核密度估计计算概率密度函数,计算置信概率αj
第三步:服务器等待用户上传新的数据。
第四步:测量者i使用其移动终端进行多次测量,获得一组数据,连同测量者自己观察得到的观测分量一同上传给服务器。
第五步:服务器将用户提供的数据与数据库相比较,使用一种基于最大似然比的群智数据有效性验证方法计算这组数据的似然可靠度。
第六步:服务器决定是否接受这组数据,根据可靠性支付报酬;如果服务器接受这组数据,返回步骤2,更新这个测量值j的数据库,重新使用步骤2中的方法计算概率密度函数和置信概率αj
下面更详细地将本发明的实施过程进行阐述。
步骤一,假设服务器需要通过群智数据对某测量值进行测量,该测量值包含若干个观测分量。受观测误差的影响,测量者以概率plj将某个观测分量j误判为另一个观测分量l。实验首先获取先验概率plj
例如,对于基于Wi-Fi信号强度的室内定位的训练过程中,测量者需要确定自己所处室内的位置,产生观测误差。测量者的观测误差可以被抽象为其处于房间中一点时对于房间最近的两个墙壁的距离的估计误差。通过预先的一次实验就可以确定这个分布plj并将其应用于所有室内定位的活动中。招募大量志愿者在一个没有显著距离参照物的房间里某些固定点j判断自己的位置l,收集他们的判断结果分布情况即可视作plj
若不能通过预先的一次实验确定的plj,可以取Kronecker Delta函数。
步骤二,服务器的数据库中的每个观测分量对应积累数据集Dj,j=1,2,3,...,N,其中各个元素Dj k,k=1,2,3,...T,服从fj(x)分布,T=|Dj|为数据集的大小。假设可以对其通过核密度估计足够精确地恢复出fj(x)。则
核密度函数可以取其他的任意形式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。例如,取核密度函数为均匀核函数:h足够小使得数据在带宽范围内近似均匀分布,落到这个区域内的概率Ps=P(|x-Dj k|<h)=fj(x)2h。
即[x-h,x+h]内数据库中已存在数据个数。ns(x)可能有T个取值,其分布满足
由于不同的观测分量积累不同的数据量,因此不同的观测分量有不同的置信概率αj。置信概率αj用于衡量用户上传数据的采用价值其中表示用户i上传数据,且该用户将其判断为观测分量j′。若用ril表示属于观测分量l的概率密度,则ril的期望就可以作为置信概率α。下面是一种计算E{ril}的方法。
其中Ps=P(|x-Dj k|<h)=f(xi)2h,f(xi)用核密度估计得出。式中不存在T以外的变量,故确定了置信概率αj与数据库大小T的关系。
步骤三,服务器等待用户上传新的数据。
步骤四,测量者i对某个测量分量获得一组M个数据记作下式
j表示这组数据测量分量的真实值,j∈{1,2,3,...,N}。xt i服从分量j对应分布fj(x)。观测误差体现为测量者将观测分量j判断为j′,并上报给服务器,即
步骤五,服务器取得数据后计算所有{ril}:
显然,当l=j时最大。定义参数
通过***可以对所有群智数据的有效性进行排序,根据需要取其中的前若干个。
本实施例的环境参数为:
移动终端设备:六部Android智能手机,都是Nexus 4,每部智能手机都配置有1.5GHz Snapdragon APQ8064 CPU和2 G RAM六部智能手机的操作***都是Android JellyBean(4.2)。这六部智能手机并列作为测试手机进行室内定位。
服务器:宏基4930G笔记本电脑,酷睿双核处理器,2G的内存,2G的主频。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (6)

1.一种基于最大似然比的群智数据有效性验证方法,其特征在于,包括如下步骤:
步骤1:实验获取先验概率plj,其中,plj表示对于某个观测分量j,一个未经训练的测量者将该观测分量j判断为观测分量l的概率;
步骤2:服务器对已经积累的所有数据按观测值归类;对同一观测分量j的所有数据,使用核密度估计计算概率密度函数,计算置信概率αj
步骤3:服务器等待用户上传新的数据;
步骤4:测量者i使用其移动终端进行多次测量,获得一组数据,这组数据连同测量者自己观察得到的观测分量一同上传给服务器;
步骤5:服务器将用户提供的数据与数据库相比较,计算这组数据的似然可靠度;
步骤6:服务器决定是否接受这组数据,根据可靠性支付报酬;如果服务器接受这组数据,返回步骤2,更新这个观测分量j的数据库,重新使用步骤2中的方法计算概率密度函数和置信概率αj
2.根据权利要求1所述的基于最大似然比的群智数据有效性验证方法,其特征在于,所述步骤1包括如下步骤:
步骤1.1:对于基于Wi-Fi信号强度的室内定位的训练过程中,测量者需要确定自己所处室内的位置,产生观测误差;测量者的观测误差被抽象为其处于房间中一点时对于房间最近的两个墙壁的距离的估计误差;
步骤1.2:通过预先的一次实验确定先验概率plj并将先验概率plj应用于所有室内定位的活动中;具体为,令多个测量者在一个没有距离参照物的房间里某些观测分量j判断观测分量l,收集该多个测量者的判断结果分布情况即作为plj
步骤1.3:对于不能通过预先的一次实验确定的plj,取克罗内克函数:
<mrow> <msub> <mi>p</mi> <mrow> <mi>l</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>&amp;delta;</mi> <mrow> <mi>l</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>l</mi> <mo>&amp;NotEqual;</mo> <mi>j</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>l</mi> <mo>=</mo> <mi>j</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中,δlj表示克罗内克函数。
3.根据权利要求1所述的基于最大似然比的群智数据有效性验证方法,其特征在于,所述步骤2包括如下步骤:
步骤2.1:服务器的数据库中的每个观测分量对应积累数据集Dj,j=1,2,3,…,N,N表示观测分量的总数,Dj中的各个元素Dj k,k=1,2,3,…T,服从fj(x)分布,T表示每个观测分量的数据总数,fj(x)表示观测分量j所服从的概率密度函数;T=|Dj|>>M,M表示测量者一次上传的数据总数,则
<mrow> <msup> <mi>f</mi> <mi>j</mi> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>T</mi> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>T</mi> </munderover> <msub> <mi>K</mi> <mi>h</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>-</mo> <msup> <msub> <mi>D</mi> <mi>j</mi> </msub> <mi>k</mi> </msup> <mo>)</mo> </mrow> </mrow>
其中,Kh表示核密度函数,x表示数据变量;
步骤2.2:设即ns(x)表示[x-h,x+h]内数据库中已存在数据个数,h表示核密度函数Kh的带宽;
ns(x)可能有T+1个取值,服从分布:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mi>s</mi> </msub> <mo>(</mo> <mi>x</mi> <mo>)</mo> <mo>=</mo> <msub> <mi>n</mi> <mi>s</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>C</mi> <mi>T</mi> <msub> <mi>n</mi> <mi>s</mi> </msub> </msubsup> <mi>P</mi> <msup> <mrow> <mo>(</mo> <mo>|</mo> <mi>x</mi> <mo>-</mo> <msup> <msub> <mi>D</mi> <mi>j</mi> </msub> <mi>k</mi> </msup> <mo>|</mo> <mo>&lt;</mo> <mi>h</mi> <mo>)</mo> </mrow> <msub> <mi>n</mi> <mi>s</mi> </msub> </msup> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>P</mi> <mo>(</mo> <mrow> <mo>|</mo> <mi>x</mi> <mo>-</mo> <msup> <msub> <mi>D</mi> <mi>j</mi> </msub> <mi>k</mi> </msup> <mo>|</mo> <mo>&lt;</mo> <mi>h</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mrow> <mi>T</mi> <mo>-</mo> <msub> <mi>n</mi> <mi>s</mi> </msub> </mrow> </msup> </mrow> 1
其中,P(·)表示ns(x)的概率质量函数,ns(x)表示表示[x-h,x+h]内数据库中已存在数据个数,ns取0,1,…,T,T+1中的一值,表示从T个不同元素中取出ns个的组合数,h表示表示核密度函数Kh的带宽;
步骤2.3:通过数据库大小确定ril的期望,将这个期望作为置信概率α,其中,ril表示观测者i所上传的数据属于观测分量l的概率密度;显然,不同观测值对应的积累数据量是不同的,因此对于不同观测值有不同的置信概率αj
4.根据权利要求3所述的基于最大似然比的群智数据有效性验证方法,其特征在于,所述步骤4包括如下步骤:
步骤4.1:测量者获得一组M个数据记作下式
其中,表示测量者i对同一观测分量进行多次测量获得的一组数据,j表示这组M个数据的一个需要观测的分量的真实值,j∈{1,2,3,…,N},N表示观测分量的总数;xt i服从分量j对应分布fj(x),xt i表示测量者i上传的第t个数据;
步骤4.2:观测误差体现为测量者将j判断为j′上报给服务器,即
5.根据权利要求4所述的基于最大似然比的群智数据有效性验证方法,其特征在于,所述步骤5包括如下步骤:
步骤5.1:服务器取得数据后计算所有{ril}:
<mrow> <msub> <mi>r</mi> <mrow> <mi>i</mi> <mi>l</mi> </mrow> </msub> <mo>=</mo> <munderover> <mi>&amp;Pi;</mi> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msup> <mi>f</mi> <mi>l</mi> </msup> <mrow> <mo>(</mo> <msub> <msup> <mi>x</mi> <mi>t</mi> </msup> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> <mi>l</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mn>3</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> </mrow>
其中,M表示测量者一次上传的数据总数,f(·)表示观测分量所服从的概率密度函数,l表示观测分量编号,xt ij′表示观测者i上传的第t个数据,并将其判断为观测分量j′,N表示观测分量的总数,ril的物理意义为属于观测分量l的概率密度;显然,当l=j时最大;
步骤5.2:定义参数
其中αj称为置信概率,plj′表示对于观测分量j′,测量者将该观测分量j′判断为观测分量l的概率;当αj=1时的意义为测量数据的最大可能概率密度的对数;显然对于相同长度的一组数据,较大者更可信;
步骤5.3:通过能够对所有群智数据的有效性进行排序,取其中的前若干个。
6.根据权利要求5所述的基于最大似然比的群智数据有效性验证方法,其特征在于,
在步骤2.1中,取核密度函数为均匀核函数:h足够小使得数据在带宽范围内近似均匀分布,落到这个区域内的概率Ps=P(|x-Dj k|<h)=f(x)2h;
在步骤2.3中,所有的数据都具有采用的价值,下面是一种计算ril的期望E{ril}的方法:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>&amp;alpha;</mi> <mi>j</mi> </msub> <mo>=</mo> <mi>E</mi> <mo>{</mo> <msub> <mi>r</mi> <mrow> <mi>i</mi> <mi>l</mi> </mrow> </msub> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mi>E</mi> <mo>{</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <msup> <mi>f</mi> <mi>l</mi> </msup> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>t</mi> </msup> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> <mi>M</mi> </msup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>x</mi> <mo>=</mo> <mo>-</mo> <mi>&amp;infin;</mi> </mrow> <mi>&amp;infin;</mi> </munderover> <mo>{</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>n</mi> <mi>s</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow> <mi>T</mi> </munderover> <msup> <mrow> <mo>(</mo> <mfrac> <msub> <mi>n</mi> <mi>s</mi> </msub> <mi>T</mi> </mfrac> <mo>)</mo> </mrow> <mi>M</mi> </msup> <mrow> <mo>(</mo> <mfrac> <mrow> <msup> <msub> <mi>P</mi> <mi>s</mi> </msub> <msub> <mi>n</mi> <mi>s</mi> </msub> </msup> </mrow> <mrow> <msub> <mi>n</mi> <mi>s</mi> </msub> <mo>!</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msub> <mi>P</mi> <mi>s</mi> </msub> </mrow> </msup> <mo>}</mo> <msub> <mi>P</mi> <mi>s</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中,fl(xt)表示观测分量l取值为xt的概率密度,l表示第l个观测分量,t表示观测者上传的第t个数据,M表示测量者一次上传的数据总数,!表示阶乘,e表示自然底数,Ps=P(|x-Dj k|<h)=f(xi)2h,f(xi)用核密度估计得出;上式中不存在T以外的变量,故确定了置信概率αj与每个观测分量的数据总数T的关系。
CN201410568300.XA 2014-10-22 2014-10-22 基于最大似然比的群智数据有效性验证方法 Active CN104462187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410568300.XA CN104462187B (zh) 2014-10-22 2014-10-22 基于最大似然比的群智数据有效性验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410568300.XA CN104462187B (zh) 2014-10-22 2014-10-22 基于最大似然比的群智数据有效性验证方法

Publications (2)

Publication Number Publication Date
CN104462187A CN104462187A (zh) 2015-03-25
CN104462187B true CN104462187B (zh) 2017-09-08

Family

ID=52908223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410568300.XA Active CN104462187B (zh) 2014-10-22 2014-10-22 基于最大似然比的群智数据有效性验证方法

Country Status (1)

Country Link
CN (1) CN104462187B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105187139B (zh) * 2015-09-30 2018-01-23 中国人民解放军后勤工程学院 一种基于群智感知的室外无线信号接收强度地图构建方法
CN111865332B (zh) * 2020-08-04 2021-07-27 北京航空航天大学 适用于星基ads-b的低置信度矩阵可靠提取方法和检错纠错高性能方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7278028B1 (en) * 2003-11-05 2007-10-02 Evercom Systems, Inc. Systems and methods for cross-hatching biometrics with other identifying data
CN100391255C (zh) * 2002-08-19 2008-05-28 纳格拉影像股份有限公司 数字家庭网络密钥有效性验证方法
CN101345601A (zh) * 2007-07-13 2009-01-14 华为技术有限公司 一种译码方法和译码器
CN102546972A (zh) * 2010-12-28 2012-07-04 ***通信集团公司 一种广告投放反馈信息有效性验证方法、设备和***
CN103312698A (zh) * 2013-05-24 2013-09-18 成都秦川科技发展有限公司 离线数据有效性验证方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100391255C (zh) * 2002-08-19 2008-05-28 纳格拉影像股份有限公司 数字家庭网络密钥有效性验证方法
US7278028B1 (en) * 2003-11-05 2007-10-02 Evercom Systems, Inc. Systems and methods for cross-hatching biometrics with other identifying data
CN101345601A (zh) * 2007-07-13 2009-01-14 华为技术有限公司 一种译码方法和译码器
CN102546972A (zh) * 2010-12-28 2012-07-04 ***通信集团公司 一种广告投放反馈信息有效性验证方法、设备和***
CN103312698A (zh) * 2013-05-24 2013-09-18 成都秦川科技发展有限公司 离线数据有效性验证方法

Also Published As

Publication number Publication date
CN104462187A (zh) 2015-03-25

Similar Documents

Publication Publication Date Title
US10153955B2 (en) Network selection using current and historical measurements
RU2527754C2 (ru) Система генерирования статистической информации и способ генерирования статистической информации
RU2540824C2 (ru) Устройство агрегации информации о местоположении и способ агрегации информации о местоположении
TW201130351A (en) System and method for effectively populating a mesh network model
US20160044462A1 (en) Method for Identifying Motion Status of Mobile Terminal, and Mobile Terminal
CN108629053B (zh) 一种数据更新方法、装置及***
CN108495329A (zh) 一种基站可靠性的评价方法和装置
CN111368384B (zh) 预测天线工程参数的方法及设备
CN104462187B (zh) 基于最大似然比的群智数据有效性验证方法
Kong et al. When Compressive Sensing Meets Mobile Crowdsensing
JP6025692B2 (ja) エリア品質劣化推定装置及び方法
KR20120057163A (ko) 데이터 무결성 보장을 위한 모바일 센서 공유 방법 및 이를 이용하는 모바일 센서 공유 시스템
JP2015170144A (ja) 携帯端末を所持したユーザの滞在地を推定する装置、プログラム及び方法
JP5986028B2 (ja) 携帯端末を所持したユーザの短時間滞留地を推定する装置、プログラム及び方法
CN108291954A (zh) 电波状况地图的创建***及其控制方法
Hung et al. Model-driven traffic data acquisition in vehicular sensor networks
JP6249739B2 (ja) 移動体端末、装置、制御方法、及びプログラム
CN108600413B (zh) 定位方法及装置和电子设备
Meikle et al. A global measurement study of context-based propagation and user mobility
US20160174147A1 (en) Access point selection for mobile device positioning
Schauer et al. Extracting context information from wi-fi captures
CN105553583B (zh) 基于贝叶斯压缩感知的免于训练的室内白频谱检测方法
JP6374842B2 (ja) 滞在確率密度推定装置、方法、及びプログラム
CN110958565B (zh) 计算信号距离的方法、装置、计算机设备和存储介质
CN111159576B (zh) 一种用户分类方法、装置及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant