【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明各实施例中,符号“/”表示同时具有两种功能的含义,而对于符号“A和/或B”则表明由该符号连接的前后对象之间的组合包括“A”、“B”、“A和B”三种情况。
在本发明中,区域用水网络拓扑关系指的是,类似供水***水表总表(为本发明的流量计量装置总表的下位概念)与用户水表分表(为本发明的流量计量装置分表的下位概念)之间的连接和归属关系;还可以是供水***水表总表与工业园区内各公司水表分表之间的连接和归属关系;还可以是供水***水表总表与商住两用园区内的各用户水表分表和公司水表分表的连接和归属关系;还可以小区里各栋楼内的水表总表和各住户水表分表之间的连接和归属关系等等。在本发明后续各实施例中将更多的从供水***水表总表和用户水表分表的场景展开阐述,但是,本领域技术人员在此场景的技术描述基础上,均可以在无需创造性劳动的情况下将相应的技术手段沿用到上述举例的类似场景中,后续不在赘述。
理论上,在具体应用场景中,一个供水***包括一个或多个储水箱、水表总表以及管道,所述水表总表用于测量供水***的总流量,所述管道与对应的水表分表连接。其中,供水***内的储水箱的数目为多个时,可以采用级联的方式相互连通,以提高储水量。在实际生活中,用水一般包括饮用水以及生活水,储水箱可以包括两个输送口,其中一个输送口可以与对应的净化器连接,通过净化器输送饮用水,另一个输送口可以过滤杂质后,直接连接管道,作为生活用水使用,在此种情况下,每个供水***可以包括至少两个水表总表,其中一个水表总表设置在饮用水的对应的输送口处,以测量饮用水的总流量,另一个水表总表设置在生活用水的对应的输送口处,以测量生活用水的总流量。每个水表总表与对应的水表分表组合,构成相应的用水网络拓扑关系。当然,在其他实施例中,饮用水和生活用水也可以通过不同的供水***,输送到用户处。
水流量数据满足供水***(水表总表)输入水流量等于所有用户水流量数据(水表分表)之和的能量守恒关系。只有正确、真实的供水***用水网络拓扑关系下,上述“能量守恒关系”才能够成立。由于实际场景中,必定存在管道积水和流量计量装置自身的测量误差等情况,因此,所述的“能量守恒关系”是一个相对关系,并非绝对严格数据意义上的对等关系。供水***用水网络拓扑关系(本发明中所描述的区域用水网络拓扑关系的下位概念)正确的一个必要且充分条件是:可以找到唯一的一组水流量数据,在每一时间点,都能满足上述相对的供水***能量守恒关系(本发明后续内容中将简称为供水***的能量守恒关系)。
现实中,供水***的水流量数据中可能有数据不属于本供水***,还有可能原本属于本供水***的水流量数据在本供水***看不到了。这种情况下,无法找到一组数据使得供水***的能量守恒关系成立,利用本供水***水流量数据无法计算出供水***的用水网络拓扑关系。这也是现有技术中没有使用供水***中的水流量数据来计算供水***的用水网络拓扑关系的原因。
本发明扩大使用水流量数据范围来选择计算用的水流量数据,具体地,将相邻其他潜在会发生用水网络拓扑关系错误的一个或者多个区域的水流量数据,也作为本发明方案计算用水网络拓扑关系的数据。例如:与本供水***同属于一个供水房的其他供水***的水流量数据,与本供水***同属一个居民小区或村庄的其他供水***的水流量数据,与本供水***同属一个供水公司的其他供水***的水流量数据等等。
这样选择水流量数据的方法,配合其他供水***的用水网络拓扑关系计算,可以把不属于本供水***的水流量数据(在本发明具体实施例中将被简称“外来户”)“还回”给它理应所在的供水***,可以把被“错误统计到其他供水***”的水流量数据(在本发明具体实施例中将被简称“逃逸户”)还原回到本供水***来。从而可以得出本供水***(和“相邻供水***”)的真实供水***用水网络拓扑关系。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。现将通过各实施例逐步展开描述本发明的实现方式。
实施例1:
本发明实施例1提供了一种区域用水网络拓扑关系确认方法,本发明实施例中所描述的区域,属于相对供水***更为广泛的概念,只要是涉及总表(流量计量装置总表的简称)和分表(流量计量装置分表的简称)之间具有映射关系的,都可以划分成为一个区域概念,因此,提出所述区域的概念更偏向于是将本发明实施例所解决的技术问题,延伸到现有技术中涉及总表和分表布局场景,对于其布局后的记录信息(此处的记录信息指服务器侧记录的逻辑上的总表和分表的映射关系)和实际管道布局不对应的问题,例如:相邻供水***、相邻供水房、相邻小区、设有多个总表的一条管道链路等等中会发生服务器侧记录的总表和分表的逻辑关系,与实际场景中的水表间的连接方式不一致。而供水***则属于现有技术中出现相应问题最为典型的方面,并且,因为供水***中涉及用水、计费、流量计量装置误差、偷水、漏水以及管道积水等复杂问题,属于当前最急需被解决的应用场景,而其中最基本的要求就是要梳理清楚供水***内的用水网络拓扑关系归属,这也是本发明实施例所提出方法,相对而言针对性解决的技术问题。如图1所示,本发明实施例的方法包括:
在步骤201中,确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域。
这里的确定方法,可以是简单的通过数据库服务器中记录的信息进行划分,例如:数据库服务器记录有各供水***总表和各小区各楼栋的水表分表之间的映射关系(在本发明实施例中被描述为用水网络拓扑关系)。即可以根据划分的地理位置的片区特性进行潜在会发生用水网络拓扑关系归属错误的一个或者多个区域的标定。
除了上述简单的根据划分的地理位置的片区进行潜在区域标定以外,在本发明实施例实现过程中,优选的还可以结合具体安装环境,建立水表(包括总表和/或分表)与各安装设备(例如供水房)之间的映射关系来辅助确定,具体的,相关操作人员会将设置在同一供水房内的多块总表的对应设置信息上报给所述数据库服务器,相应的,所述同一供水房的多个总表便可以成为所述潜在会发生用水网络拓扑关系归属错误的一个或者多个区域的对象之一。以图2为例,区域1和区域2中的两块流量计量装置总表若被设置同一供水房中(两块总表可以对应设置在不同的),则可以认为区域1和区域2为所述潜在会发生用水网络拓扑关系归属错误的一个或者多个区域。具体的,由于流量计量装置总表M0和流量计量装置总表N0被设置同一供水房中,因此,其区域内的分表可能会发生实际管道连接和如图2所示的数据库服务器记录用水网络拓扑关系不一致,例如:流量计量装置分表M1对应的管道被连接到了流量计量装置总表N0中,而流量计量装置分表N1的对应的管道被连接到了流量计量装置总表M0中,此时,数据库服务器记录的用水网络拓扑关系如图2所示,而实际的管道连接关系却如图3所示。
在上述优选的实现方式,通过进一步结合了安装环境的相关信息(建立的水表与各安装设备之间的映射关系),比上述的单纯依据数据库服务器中记录的,根据地理位置划分的总表和分表映射关系的数据,进行潜在会发生用水网络拓扑关系归属错误的一个或者多个区域划分更有效和精准。另一方面,该优选方式某种意义上可以放大分析的环境,提高通过计算最后识别出用水网络拓扑关系归属错误的有效性。例如:因为后续施工原因,在已有的储水箱中新增总表,而相应的操作若仅以总表与分表的对应关系记录在数据库中,则缺失了实际可能发生用水网络拓扑关系归属错误的可能判断。因为,仅按照用水类型分类或者划分的地理位置的片区来分类,可能便会漏掉两者之间在同一储水箱内的实际环境考虑。
还有一方面,在实际情况中,对于数据库服务器中记录的供水***总表和各小区各楼栋的水表分表之间的映射关系,除了可能存在的个别楼栋内水表分表与总表的映射关系错误外,还可能发生直接登记的总表之间位置错误的可能,此时,通过上述优选的实现方式便可以更为有效的拓宽潜在会发生用水网络拓扑关系归属错误的一个或者多个区域的分析范围。仍然以图2为例,其中,由于流量计量装置总表M0和流量计量装置总表N0被设置同一供水房中,因此,可能发生数据库中录入的流量计量装置总表MO和流量计量装置N0之间的位置就发生错误情况。这种情况同样会被考虑在本发明实施例后续的步骤203的确认过程中去。
在步骤202中,获取对应所述一个或者多个区域内所包含的各流量计量装置的水流量数据。
其中,获取水流量数据的源端在本发明实施例中被描述为数据库服务器,所述数据库服务器在实际环境中通常表现为水力公司的数据管理平台,即拥有对区域范围内各流量计量装置总表和流量计量装置分表进行水流量数据搜集、存储能力的主体。相应主体的实现方式,不局限于单机形式的服务器,还可以是云平台,或者交由第三方数据库管理平台来完成管理,在此不做特殊的限定。
在本发明实施例后续展开的具体计算方法中,对于所述水流量数据的使用,涉及连续时间意义上的水流量数据、不同时段上的水流量数据、特殊场景下水流量数据等等。甚至于,对于有些水流量数据的使用上是现有的类似水力公司的数据管理平台无法直接提供的,则会需要本发明实施例所提出的相应方法来加工对应水流量数据,具体如何加工将会在本发明实施例后续展开描述内容中具体介绍。
在步骤203中,根据所述水流量数据,确认所述一个或者多个区域中,处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置。
本发明实施例提出了一种确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域,并通过水流量数据确定出所述一个或者多个区域中,处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置的概率(包括上述的外来户和/或逃逸户),从而为实地考察的工作人员提供更为有效的排查依据,相比较现有技术中需要实地考察的工作人员逐一通过流量计量装置排查的方式,不仅极大程度上节约了人力成本,还提高了排查的效率。本发明实施例的效果优势,对于应用规模越大的场景,其优势体现的尤为突出。
本发明实施例所提出的一种或者多种计算方式中,多以概率进行流量计量装置的用水网络拓扑关系归属错误状态进行描述,这主要是考虑到实际中涉及本发明所提出方法的应用场景通常会包含上百块甚至上千块流量计量装置(以一个小区为例就能达到千户左右级别的住户,而通常每一住户均会配备一块流量计量装置分表),而对于一个地区、省市来说,涉及的流量计量装置的数量会更大,而具体计算环境也会更为复杂,尤其是一些涉及长距离传输,而传输过程中存在分流的可能,并且是被非正规通过数据库服务器登记的情况下分流的;另外,流量计量装置自身存在的误差和传输管道上的积水,也会将计算环境复杂化。因此,现实场景中给予计算的环境就是一个非理想的环境,相应的结果自然无法达到100%精准的计算结果,于是,本发明实施例提出了一种利用概率来描述各流量计量装置分表与其流量计量装置总表在用水网络拓扑关系归属错误上的可能性。所述概率可以是用水网络拓扑关系计算服务器计算出来给高级管理人员看的,对于实地考察的工作人员来说,可以是仅仅获取到一个要求去验证所述一个或者多个流量计量装置用水网络拓扑关系归属的指派任务即可。也就是说,通过本发明实施例方法,完成所述处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置的展示方式可以是多样的,在本发明实施例中并不做特殊的限定。
通过上述分析,在本发明实施例的步骤203中描述的所述确认所述一个或者多个区域中,处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置,存在一种具体的表现方式为:计算出所述一个或者多个区域中,发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。所述预设阈值可以由操作人员设定,例如:第一维度:根据实地考察的工作人员在依据本发明实施例所计算出来的处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置进行排查,反馈排查结果得到相应计算准确率后,动态的设定(通常准确率越低,相应的预设阈值可以设置相应高一些)。除此以外,还可以考虑第二维度:每经过一轮实地考察的工作人员排查后,根据更新后的用水网络拓扑关系计算得到的处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置数量的多少来动态的设定(通常该重新计算得到数量大,则相应的预设阈值可以设置相应低一些)。优选的是,综合考虑上述两个维度,并进一步加入第三个维度:实地考察的工作人员每次出勤允许排查的流量计量装置数量;由上述三个维度确定出来的预设阈值能够最大限度的在最短时间内完成存在错误概率的流量计量装置的排查。
在本发明实施例中,对于计算各区域中流量计量装置总表的水流量数据和当前记录中与各区域建立有用水网络拓扑关系归属的一个或者多个流量计量装置的水流量数据的相关性,提供了至少以下三种具体方式。
方式一,如图4所示:
在步骤301中,穷举所述一个或者多个区域中,各流量计量装置所能构成各区域中流量计量装置总表和对应区域内包含的流量计量装置分表之间的组合。
此处,虽然描述的是穷举,但是实际操作中会比步骤301中描述的更为多变和复杂,例如:对于历史上已经验证过用水网络拓扑关系的区域流量计量装置总表和相应区域内的流量计量装置分表,则可以作为已知量,以一种固定形式存在于各组合中,即上述已经验证过的用水网络拓扑关系(认为是正确的)不再加入所述步骤301中的穷举过程,从而简化整个方式一的计算过程。
但是,在具体操作过程中,出于严谨的考虑,优选的是,在初期的几轮计算过程中,可以将历史验证的用水网络拓扑关系作为正确的已知量来使用,而在经过几轮论证后,仍然存在较大的相似度偏差的话,则需要在经过本发明实施例所提出的方法验证过的用水网络拓扑关系的流量计量装置的基础上,对上述历史上验证过的用水网络拓扑关系,也需要当做待验证对象加入到本发明实施例步骤301中的穷举对象中去。
在步骤302中,依据流量计量装置总表水流量Zi,以及相应组合中对应区域内包含的流量计量装置分表水流量之和Fi,计算Zi和Fi两者的差值和/或两者差值的方差。
其中,i表明是第i个组合。而对于总表水流量Zi而言,其可以采用一指定时长内的水流量数据作为相应Zi参数值,也可以选择某一时间段内的水流量数据作为相应Zi参数值,还可以采用分时段内的水流量数据的组合作为相应Zi参数值。在此不做特殊的限定,而其中优选的参数值选配方式,将在本发明实施例对应数据分析部分具体展开阐述。
在步骤303中,比较各组合计算得到的Zi和Fi两者的差值和/或两者差值的方差,得到各组合为用水网络拓扑关系归属错误的概率。
其中,步骤302和步骤303中描述了一轮的Zi和Fi两者的比较,而在具体操作中,比较的数量可以是多组,而对于多组比较过程,相应的水流量数据也需要配置多组。简单结论是,通常比较的次数越多,对于用水拓扑数据计算服务器的计算资源的占用越多,相应的计算时间也会越长,但是,相应的计算结果的准确度也会得到一定的提高,最终如何取舍还是要看实际计算环境和实际的实地考察的工作人员数量来调整,在此不再赘述。
在步骤304中,根据实际获取的用水网络拓扑关系归属关系和得到的各组合为用水网络拓扑关系归属错误的概率,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
在本发明实施例中,所述用水网络拓扑关系归属错误的概率仅为一种数据表现上的描述,也是一种直观表现上的称呼;而在学术中,则更多的会被描述为简单皮尔逊相关系数,而所述皮尔逊简单相关系数的表达式具体如下:
其中,cov(Zi,Fi)为上述Zi和Fi两者之间的协方差,为Zi的标准差,ρF为Fi的标准差,表达式/>为两者的标准差的乘积。皮尔逊简单相关系数/>的取值总是在-1.0到1.0之间,接近0的变量被成为无相关性,接近1或者-1被称为具有强相关性,在本发明实施例中也被描述为概率。为了比较上的方便,通常在本发明实施例的优选实现方式中,可以给所述皮尔逊简单相关系数/>取绝对值或者求平方后,在进行比较。
在具体操作过程中,所述被标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置,可以直接通过本发明后续***实施例中提出的配备给实地考察的工作人员的智能终端,将所述待验证的流量计量装置的相关信息发送给所述实地考察的工作人员的智能终端中,而由所述实地考察的工作人员去现场完成排查工作。
方式二,如图5所示:
在步骤401中,穷举所述一个或者多个区域中,各流量计量装置所能构成各区域中流量计量装置总表和对应区域内包含的流量计量装置分表之间的组合。
此处,虽然描述的是穷举,但是实际操作中会比步骤401中描述的更为多变和复杂,例如:对于历史上已经验证过用水网络拓扑关系的区域流量计量装置总表和相应区域内的流量计量装置分表,则可以作为已知量,以一种固定形式存在于各组合中,即上述已经验证过的用水网络拓扑关系(认为是正确的)不再加入所述步骤401中的穷举过程,从而简化整个方式二的计算过程。
但是,在具体操作过程中,处于严谨的考虑,优选的是,在初期的几轮计算过程中,可以将历史验证的用水网络拓扑关系作为正确的已知量来使用,而在经过几轮论证后,仍然存在较大的相似度偏差的话,则需要在经过本发明实施例所提出的方法验证过的用水网络拓扑关系的流量计量装置的基础上,对上述历史上验证过的用水网络拓扑关系,也需要当做待验证对象加入到本发明实施例步骤401中的穷举对象中去。
在步骤402中,依据流量计量装置总表水流量Z构成的阵列(Zk1,Zk2,…,Zkj),以及相应组合中对应区域内包含的流量计量装置分表水流量之和F构成的阵列(Fk1,Fk2,…,Fkj),计算两者相似度。
其中,k为相应的计算相似度的数据组序号,j为每一组数据所包含的数据个数,上述数据具体为流量计量装置所上报的水流量数据。在本发明实施例中,为了计算所述相似度,除了可采用上述方式外,还可以采用业内公知的复相关系数、偏相关系数和/或皮尔逊简单相关系数(类似可参考步骤304中展开描述的皮尔逊简单相关系数,类似的还有斯皮尔曼等级spearman相关系数和肯德尔kendall相关系数,在此不在赘述)相关系数来实现,在此不再一一赘述。
为了测定变量F(Fk1,Fk2,…,Fkj)与其他多个变量(Zk1,Zk2,…,Zkj)之间的相关系数,可以考虑构造一个关于(Zk1,Zk2,…,Zkj)的线性组合,通过计算该线性组合与F(Fk1,Fk2,…,Fkj)之间的简单相关系数作为变量F与(Zk1,Zk2,…,Zkj)之间的复相关系数R。
在步骤403中,根据实际获取的用水网络拓扑关系归属关系和得到的各组合为用水网络拓扑关系归属错误的概率,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
在具体操作过程中,所述被标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置,可以直接通过本发明后续***实施例中提出的配备给实地考察的工作人员的智能终端,将所述待验证的流量计量装置的相关信息发送给所述实地考察的工作人员的智能终端中,而由所述实地考察的工作人员去现场完成排查工作。相比较方式一而言,方式二具有更高的精准度,属于方式一中的一种优选实现方式的具体展开形式。
方式三,如图6所示:
在步骤501中,在除去或者增加待判定的用户水表时,计算所述的Zi和Fi两者的差值和/或两者的方差的变化。
其中,所述除去待判定的用户水表和增加待判定的用户水表,实际上对应着本发明介绍的“外来户”和“逃逸户”概念。因此,所述方式三相比较方式一和方式二而言,将原本通过各种组合的相似度来求解具体流量计量装置用水网络拓扑关系正确概率的手段,转化为将“外来户”和“逃逸户”概念引入到计算过程中,在一个初始组合基础上,对各流量计量装置的用水网络拓扑关系正确概率进行计算,并且对于其错误类型也进行判断。
在步骤502中,穷举计算所有的待判定的用户水表或者它们的组合,在加入或者退出Fi时,使得Zi和Fi两者的差值和/或两者的方差向最小化变化,从而判定所述的待判定的用户水表或者它们的组合为用水网络拓扑关系归属错误的概率。
相比较而言,方式三比方式一和方式二能够更有效的得到计算结果,但是,相对而言,方式三更适合于历史上已经确认出一部分流量计量装置的用水网络拓扑关系后,需要对于剩余的流量计量装置的用水网络拓扑关系进行确认的场景。因为,此时初始的组合中所包含的有效流量计量装置(即用水网络拓扑关系正确的流量计量装置)的数量更大,对于最终计算结果的准确率有更好的保证。
需要强调的是,本发明实施例所提供的计算各种相关系数的方法(包括步骤304中的计算方法),已经提供的具体计算公式(例如上述计算复相关系数R的公式)均为适用于本发明实施例的诸多相关系数计算方法中的一种或者几种,本领域技术人员在本发明实施例所公开的技术思想基础上,可以无需创造性劳动将其他相似度计算方法应用到本发明具体实施方式中,且均属于本发明实施例的保护范围内。
在上述方式一、方式二和方式三中,都介绍了对于历史验证过的流量计量装置的用水网络拓扑关系,可以在初始几轮计算过程中,当成是已知的正确信息使用。相应操作已经可以很大程度上改善或者提高计算效率了,然而,基于本发明实施例所提出的区域用水网络拓扑关系确认方式,还存在一些优选的技术手段,可以进一步简化方式一、方式二和方式三中穷举的组合数量。具体阐述如下:
用水网络拓扑关系计算服务器,可以根据数据管理平台侧的用水链路检修记录和各流量计量装置原本归属的区域信息,完成各流量计量装置与归属的区域的验证;和/或,
用水网络拓扑关系计算服务器,可以根据超过预设阈值的流量计量装置反馈计量数据异常值和各流量计量装置原本归属的区域信息,完成各流量计量装置与归属的区域的验证;
将上述验证结果作为穷举组合中的已知固定属性,而对于未得到验证的流量计量装置进行穷举组合相关操作。其中,所述已知固定属性含义就是当做不变量,作为固有属性排除在穷举范围以外,直接加入到组合中作为组合包含的内容。
上述方案提供了一种优选的技术手段,能够将历史上发生的用水链路检修和计量数据异常结合起来,利用排除法等对于预先可以完成用水网络拓扑关系归属验证的各流量计量装置作为固定属性,排除在步骤301或者401的穷举范围之外,从而进一步降低计算量,提高本发明实施例所提出的区域用水网络拓扑关系确认方法的计算效率。
其中,用水链路检修可以是针对楼栋的用水检修、也可以是针对小区的用水检修、还可以针对地区的用水检修,相应用水检修会带来短暂的用水真空期,从而为个别区域的用水网络拓扑关系验证提供了可能。例如因为用水检修,对于一个小区内的用水采取停水措施,然而,实际上则是该小区的1栋流量计量装置仍然在工作,则可以通过上述分析确定该小区的1栋与对应小区的区域的流量计量装置总表之间的用水网络拓扑关系归属是明确错误的验证信息,所述验证信息被使用到步骤301或者步骤401中的穷举时,便可以减少将所述小区的1栋与对应小区的区域的流量计量装置总表做组合的可能。而所述异常数据,则可以是因为突发情况造成的用水不正常,例如施工造成的片区停水、自然灾害造成的片区停水等等,从侧面来说其对于本发明实施例来说效果和上述管道检修差不多,只是可靠性更低一些。
在本发明实施例中,对于委派实地考察的工作人员进行实地排查的操作方式来说,对于其排查结果同样可以反馈到所述用水网络拓扑关系计算服务器,实现一种反馈式的迭代计算。因此,结合本发明实施例,还存在一种优选的扩展方案,如图7所示,所述方法还包括:
在步骤601中,获取所述实地考察的工作人员返回的,针对所述一个或者多个流量计量装置的用水网络拓扑关系归属是否正确的验证结果。
其中,由于本发明实施例计算出来的,针对用水网络拓扑关系中的各流量计量装置出现用水网络拓扑关系归属错误的是概率结果,并非严格意义上的绝对结果。并且,实际触发各实地考察的工作人员去验证的任务中携带的流量计量装置的相关信息,还是根据步骤304或者步骤403中确定出的预设阈值筛选后的流量计量装置,因此,存在着被实地考察的工作人员验证后,相应用水网络拓扑关系归属为正确的或者错误的可能。
在步骤602中,将所述验证结果迭代到用水网络拓扑关系归属计算过程中,得到更新后的用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
其中,结合上述方式一、方式二和方式三来阐述,所述步骤602中涉及的所述将所述验证结果迭代到用水网络拓扑关系归属计算过程中,具体为将步骤601返回的验证结果作为新增固定属性,重新执行步骤301-步骤304和/或步骤401-步骤403。通过上述描述可知,上述方式一、方式二和方式三在本发明实施例中是可以二选一使用,也可以将两个方式并行在本发明实施例中使用,在此不再赘述。
结合本发明实施例,还存在一种优选的实现方案,其中,在执行步骤201之前,通常是在发现某一区域内的流量计量装置总表的水流量和流量计量装置分表总水流量和相差超过第二预设阈值,才会进行步骤201-步骤203的方法过程,否则,便会判断相应的区域的用水网络拓扑关系是正常的,而无需进行步骤201-步骤203的方法过程。因此,在该优选的实现方案中,通常在确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域之前,所述方法还包括:
分别计算各供水***的流量计量装置总表的水流量数据与供水***内各流量计量装置分表的水流量数据总和之间的关系,确认出存在用水网络拓扑关系归属错误的一个或者多个目标区域;
则所述确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域,具体实现为:根据所述一个或者多个目标区域,确定潜在的会与所述一个或者多个目标区域发生用水网络拓扑关系归属错误的一个或者多个区域。
实施例2:
上述实施例1中,对于计算各区域中流量计量装置总表的水流量数据和当前记录中与各区域建立有用水网络拓扑关系归属的一个或者多个流量计量装置的水流量数据的相关性,主要是基于该区域所包含的所有流量计量装置分表,采用穷举的方式,形成多种组合,再根据不同的计算方法,确定归属关系错误的一个或多个流量计量装置。
当流量计量装置的数量级很庞大时,对应的组合数量会非常庞大,计算处理的效率极低。为了提高效率,本实施例针对实际应用场景,基于实施例1提出了一种改进型的方案。
在实际生活中,针对不同的时间段,会存在用水量为零的时刻,特别是针对居民用水,依据作息习惯,前述特性尤为突出。例如,凌晨时刻,一个区域的某一户或者多户的用水量为零,这是一个大概率事件。
基于前述特性,本实施例的区域用水网络拓扑关系确认方法,基于预设的时间段获取区域内的各流量计量装置的水流量数据,并针对同一预设的时间段,将每个区域内的水流量数据不为零的流量计量装置划分在一个初判集合中,以每个初判集合最为一个计算单元,确定归属关系错误的一个或多个流量计量装置。
其中,预设的时间段可以为多个,预设的时间段可以以一天(24小时)为单位进行划分而得到,例如,预设的时间段可以为01:00am-05:00am、05:00am-9:00am、9:00am-12:00pm、12:00pm-14:00pm、14:00pm-18:00pm或18:00pm-01:00am中的一个或者多个时间段。基于人们的工作和生活习惯,在01:00am-05:00am对应的时刻内,居民一般处于睡眠状态,用水有可能为零,在9:00am-12:00pm或14:00pm-18:00pm对应的时刻内,居民有可能外出或者工作中,用水也有可能为零。在其他实施例中,也可以采用其他划分方式得到预设时间段。
在确定好初判集合后,以初判集合作为一个计算单元,根据所述水流量数据,计算出所述初判集合中,处于用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
具体地,可以计算各区域对应的初判集合中,流量计量装置总表的水流量数据和当前记录中与其建立有用水网络拓扑关系归属的一个或者多个流量计量装置分表的水流量数据的相关性;根据所述相关性,确定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
与实施例1相类似,对于计算各区域对应的初判集合中,流量计量装置总表的水流量数据和当前记录中与其建立有用水网络拓扑关系归属的一个或者多个流量计量装置分表的水流量数据的相关性,提供了至少如下三种具体方式。
方式一:
在本实施例中,初判集合为一个或多个,依据预设的时间段的数目而定。首先,穷举所述初判集合中,各流量计量装置所能构成各区域中流量计量装置总表和对应区域内包含的流量计量装置分表之间的组合。然后,依据流量计量装置总表水流量Zi,以及相应组合中对应区域内包含的流量计量装置分表水流量之和Fi,计算Zi和Fi两者的差值和/或两者差值的方差;其中,i表明是第i个组合。进一步地,比较各组合计算得到的Zi和Fi两者的差值和/或两者差值的方差,得到各组合为用水网络拓扑关系归属错误的概率。最后,根据实际获取的用水网络拓扑关系归属关系和得到的各组合为用水网络拓扑关系归属错误的概率,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
当初判集合为多个时,依次采用方式一,以初判集合为计算单元,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
本实施例的方式一与上述实施例1的方式一基本相同,仅是穷举的对象不同,实施例1的方式一的穷举对象为区域中所有的流量计量装置分表,本实施例的方式一的穷举对象为初判集合中的所有流量计量装置分表,数量级可以大大降低,有利于提高处理效率。
关于本实施例的方式一的具体实现过程以及相应的计算方法参照实施例1的方式一,在此,不再赘述。
方式二:
在本实施例中,初判集合为一个或多个,依据预设的时间段的数目而定。首先,穷举所述初判集合中,各流量计量装置所能构成各区域中流量计量装置总表和对应区域内包含的流量计量装置分表之间的组合。然后,依据流量计量装置总表水流量Z构成的阵列(Zk1,Zk2,…,Zkj),以及相应组合中对应区域内包含的流量计量装置分表水流量之和F构成的阵列(Fk1,Fk2,…,Fkj),计算两者相似度;其中,k为相应的计算相似度的数据组序号,j为每一组数据所包含的数据个数。最后,根据实际获取的用水网络拓扑关系归属关系和得到的各组合为用水网络拓扑关系归属错误的概率,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
当初判集合为多个时,依次采用方式二,以初判集合为计算单元,标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
本实施例的方式二与上述实施例1的方式二基本相同,仅是穷举的对象不同,实施例1的方式二的穷举对象为区域中所有的流量计量装置分表,本实施例的方式二的穷举对象为初判集合中的所有流量计量装置分表,数量级可以大大降低,有利于提高处理效率。
关于本实施例的方式二的具体实现过程以及相应的计算方法参照实施例1的方式二,在此,不再赘述。
方式三:
在实际应用场景下,通过初判集合,可以确定有效的流量计量分表(即用水网络拓扑关系正确的流量计量装置),但是有可能还存在一些流量计量分表不在初判集合内(为描述方便,此类流量计量分表为待确定流量计量分表),则需要计算确定待确定流量计量分表的归属关系是否正确。
为了提高数据处理的效率,可以在历史上已经确认出一部分流量计量装置的用水网络拓扑关系的基础上,对各待判定流量计量装置的用水网络拓扑关系正确概率进行计算,以确定归属关系是否正确。
具体的实现方式为:在方式一的基础上,在除去或者增加待判定的用户水表时,计算所述的Zi和Fi两者的差值和/或两者的方差的变化,穷举计算所有的待判定的用户水表或者它们的组合,在加入或者退出Fi时,使得Zi和Fi两者的差值和/或两者的方差向最小化变化,从而判定所述的待判定的用户水表或者它们的组合为用水网络拓扑关系归属错误的概率。
本实施例的方式三与上述实施例1的方式三的原理以及实现过程基本相同,具体可以参照实施例1的方式三,在此,不再赘述。
相比较而言,方式三比方式一和方式三能够更有效的得到计算结果,方式三更适合于历史上已经确认出一部分流量计量装置的用水网络拓扑关系后,需要对于剩余的流量计量装置的用水网络拓扑关系进行确认的场景。
区别于实施例1,本实施例依据人们的用水习惯,划分采集水流量的时间段,然后再依据实际使用情况将流量计量装置进行了初步分组,大大减小了数据处理的量级,提高处理的效率。
为清楚说明本实施例的实现过程,在此,以预设的时间段为00:00am-05:00am为例,解释说明本实施例的区域用水网络拓扑关系确认方法。
假设从数据库服务器侧获取到记录的某个区域的用水网络拓扑关系包括:流量计量装置总表P0,以及与该流量计量装置总表P0存在归属关系的流量计量装置分表Pn(n为正整数)。依据前述实施例的方式判定,该区域为潜在会发生用水网络拓扑关系归属错误的区域。
为了确认该区域中,处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置,在本实施例中,获取00:00am-05:00am对应的时间段内,流量计量装置总表P0以及流量计量装置分表P1-Pn的水流量数据,然后筛选出00:00am-05:00am对应的时间段内,水流量数据不为零的流量计量装置,将水流量数据不为零的各流量计量装置划分到同一初判集合中。
为了便于描述方便,现假设n=10,不过在实际应用场景下,n的具体值一般远大于10,例如,针对千户级的小区,n为上千数量级的。
如图8所示,在00:00am-05:00am对应的时间段内,流量计量装置总表P0、流量计量装置分表P1、流量计量装置分表P4、流量计量装置分表P7以及流量计量装置分表P10对应的水流量数据不为零,其他流量计量装置分表对应的水流量数据为零。则将流量计量装置总表P0、流量计量装置分表P1、流量计量装置分表P4、流量计量装置分表P7以及流量计量装置分表P10划分到一个初判集合中,采用本实施例的方式一或者本实施例的方式二,确定流量计量装置分表与流量计量装置总表的用水拓扑网络关系是否正确。在可选的实施例中,为了确定其他待确定流量计量装置分表(P2、P3、P5、P6、P8、P9)与流量计量装置总表P0的归属关系的正确与否,可以再采集某天全天各流量计量装置分表的水流量,可以基于本实施例的方式三确定待确定流量计量装置与流量计量装置总表的用水拓扑网络关系是否正确从而标定发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置。
实施例3:
在本发明实施例1和实施例2提供了一种区域用水网络拓扑关系确认方法基础上,本发明实施例还提供了一种区域用水网络拓扑关系确认***,可用于完成如实施例1所述的相应方法,因此,在本发明实施例中展开描述的相应技术内容同样可以适用于实施例1中方法实现。
如图9所示,包括数据库服务器、用水网络拓扑关系计算服务器和一个或者多个智能终端,在本发明实施例中,考虑到具体运用场景的数据量的规模的可能性,所述用水网络拓扑关系计算服务器可以采用单一主机形式,也可以采用云平台实现形式,在此不做特殊限定。所述***具体包括:
所述数据库服务器用于存储各区域和区域内所包含的流量计量装置的初始归属关系,还用于存储各流量计量装置所上报的水流量数据,并且,为所述用水网络拓扑关系计算服务器提供数据访问接口;
所述用水网络拓扑关系计算服务器,用于执行以下过程内容:
确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域;获取对应所述一个或者多个区域内所包含的各流量计量装置的水流量数据;根据所述水流量数据,计算出所述一个或者多个区域中,发生用水网络拓扑关系归属错误概率超过预设阈值的一个或者多个流量计量装置;
所述一个或者多个智能终端接入所述用水网络拓扑关系计算服务器,用于根据所述一个或者多个流量计量装置的设备标识信息确定实际的拓扑归属,并反馈给所述用水网络拓扑关系计算服务器。
在本发明实施例中,所述智能终端可以是专业型的检测设备,附带有用水网络拓扑关系计算服务器数据交互能力;或者,所述智能终端就是一般意义上的智能手机,而相应的拓扑归属的确定可以是交由专业的检测设备来完成,并由实地考察的工作人员通过所述智能终端将验证结果数据传输给所述用水网络拓扑关系计算服务器,具体实现形式并不局限于上述的两种,由此衍生出的类似的验证方式和反馈方式均属于本发明实施例的保护范围内。
本发明实施例提出了一种确定潜在会发生用水网络拓扑关系归属错误的一个或者多个区域,并通过水流量数据确定出所述一个或者多个区域中,处于用水网络拓扑关系归属错误状态的一个或者多个流量计量装置的概率,从而为实地考察的工作人员提供更为有效的排查依据,相比较现有技术中需要实地考察的工作人员逐一流量计量装置排查的方式,不仅极大程度上节约了人力成本,还提高了排查的效率。本发明实施例的效果优势,对于应用规模越大的场景,其优势体现的尤为突出。
在本发明实施例中,所述流量计量装置具体对应着一个供水***下的各楼栋里的住户;或者,所述流量计量装置具体对应着一个供水***下的村庄里的各住户;或者,所述流量计量装置具体对应着一个供水***下的各商铺;或者,所述流量计量装置具体对应着一个供水***下的各厂房。
由于供水***用水网络拓扑关系混乱程度不同,不同的供水***的水流量数据也有很大的差异。对于不同的供水***水流量数据,可以构建不同的、适用的数学模型,选用不同的算法,可以更高效率的计算供水***用水网络拓扑关系。而相应的模型和算法则是被预先的存储在所述用水网络拓扑关系计算服务器中。接下来将具体展开阐述几种典型的模型:
模型1、总表与分表和残差(及残差方差)最小化模型(所述模型1对应着实施例1中的方式一)
模型:min{残差}=总表-分表和 (1)
min{σ残差}=σ总表-分表和 (2)
物理学上看,模型1成立的机理是:
利用式(1),固定供水***总表,一一穷举分表和的组合,计算出能够使得残差为最小值的供水***总表和供水***分表和的组合,该组合可以构成真实供水***用水网络拓扑关系是一个大概率事件。
利用式(2),固定供水***总表,一一穷举分表和的组合,计算出能够使得残差的方差值为最小值的供水***总表和供水***分表和的组合,该组合可以构成真实供水***用水网络拓扑关系是一个大概率事件。
在忽略水表误差以及管道积水的情况下,若式(1)的“分表和”中的分表全部都是供水***内的用户水表,式(1)中的残差=0,考虑水表误差以及管道积水的情况下,残差=水表误差和+管道积水,是一个很小的水流量,构成残差最小的分表和,刚好是供水***内全部水表的事件是一个大概率事件,其中,管道积水可以由管道的直径以及长度而定,在具体应用场景下,数据库服务器侧对应存储有每个用水网络拓扑关系中对应的管道积水范围值。即使如此,构成残差最小的判据,只能作为一个“供水***用水网络拓扑关系正确”的必要条件,不是充要条件。反之,当分表和中有供水***外水表时,残差有变大的趋势。
式(2)的意义在于,即使考虑水表误差以及管道积水因素,当分表和刚好是供水***内全部水表时,理论上,残差的方差=0成立(残差=0,是“供水***用水网络拓扑关系正确”的充要条件)。实际中,残差的方差不为0,是一个非常接近0的数值。当分表和中有算法:穷举用户分表构成分表和,同时满足式(1)、式(2)的分表和就是该总表下的真实用水网络拓扑关系。反之,当分表和中有供水***外水表时,残差方差值有变大的趋势。
鉴于可以使用式(1)和式(2)有甄别供水***内和供水***外水表,本发明将它们联立作为一套计算供水***用水网络拓扑关系的数学模型之一。
模型2、计算分表与总表相关系数的模型(所述模型2对应着实施例1中的方式二)
其中,w0i是供水***总表第i次读取的数据,wki是供水***第k块分表第i次读取的数据,模型2需要多次读取供水***水流量数据,计读取次数为m次。
模型2成立的机理是:
利用式(3),固定供水***总表w0i,在可选择的(供水***内用户水表潜在嫌疑方=本供水***用户水表+相邻供水***用户水表)水流量数据集合(用户数最大可以到N)中,选择分表、构造(其中,n=1,2,……N)的分表和量,可以得到一个不同n值的分表和量的全组合,在全组合中选取每一个/>一一穷举计算w0i与之间的相关系数,通过计算找出全组合中相关系数最大(相关系数接近于1)的分表和量,这个/>分表和与上述供水***总表一起可以构成真实的供水***用水网络拓扑关系是一个大概率事件。可以使用模型2作为供水***用水网络拓扑关系梳理计算的数学模型。
在忽略水表误差影响的情况下,式(3)中的w0i与之间的相关系数应该等于整数1,考虑水表误差情况下,式(3)中的w0i与/>之间的相关系数应该等于一个非常接近1的正常数。
即使如此,由于水表误差影响不可预知,以式(3)作判据计算得出的供水***用水网络拓扑关系,也只是一个大概率事件,不可作为100%确定的供水***用水网络拓扑关系使用。
鉴于可以使用式(3)可以甄别供水***内水表,本发明将它们联立作为一套独立计算供水***用水网络拓扑关系的数学模型之一使用。
模型3、计算分表与总表相关系数的导出关系的模型(所述模型3对应着实施例1中利用用水链路检修记录或者数据异常值,改进的方式一或者方式二;以及对应步骤501-步骤502过程)
其中,w0i是供水***总表第i次读取的数据,wki是供水***第k块分表第i次读取的数据,是已经可以确定为供水***内的分表和,/>是尚待确认为供水***内分表和的水流量,式(4)给出的模型3需要多次读取供水***水流量数据,计读取次数为m次。
模型3成立的机理是:
利用式(4),固定供水***总表w0i和除却/>在可选择的(供水***内用户水表潜在嫌疑人=本供水***用户水表+相邻供水***用户水表)水流量数据集合(用户数最大可以到N)中,选择分表、构造/>(其中,n=1,2,……N)的分表和量,可以得到一个不同n值的/>分表和量的(n-n1)的组合,在这(n-n1)个的组合中选取每一个/>一一穷举计算/>与/>之间的相关系数,通过计算找出这(n-n1)个的组合中相关系数最大(相关系数接近于1)的分表和量,这个“/>分表和与上述/>量一起可以构成真实的供水***用水网络拓扑关系”是一个大概率的事件。可以使用模型3作为供水***用水网络拓扑关系梳理计算的数学模型之一。
在忽略水表误差影响的情况下,式(4)中的与/>之间的相关系数应该等于整数1,考虑水表误差情况下,式(4)中的/>与之间的相关系数应该等于一个非常接近1的正常数。
即使如此,由于水表误差影响不可预知,以式(4)作判据计算得出的供水***用水网络拓扑关系,也只是一个大概率事件,不可作为100%确定的供水***用水网络拓扑关系使用。
鉴于可以使用式(4)可以甄别供水***内水表,本发明将它们联立作为一套独立计算供水***用水网络拓扑关系的数学模型之一使用。
前述的本发明的计算结果的不完全确定性的特质,对于各个数学模型都适用。或者说,没有一种数学模型有能力无差别地计算出供水***的真实用水网络拓扑关系。
计算的目标是为了获得最大或然率(概率值)的供水***用水网络拓扑关系,对于同一种数学模型,不同的供水***水流量数据也不同,因此,需要选用不同的计算方法。
例如,对于模型2,通过比较和计算分表和与总表的相关系数的大小,来判定某些相应水表属于供水***内,还是属于供水***外。在选择相关系数的类型时,可以选择复相关系数、偏相关系数、皮尔逊简单相关系数等等。
同理,对于模型3,也可以选择复相关系数、偏相关系数、皮尔逊简单相关系数等。
对于模型1可以使用各种回归算法、各种训练数学模型的机器学习算法等等。
本领域技术人员在无需创造性劳动下,基于本发明已经公开的模型,得到其他类似的可实施模型所构成的技术方案也将归属于本发明的保护范围内。
需要选用哪一种算法,也可以通过计算机在计算过程中“自我学习”。本发明实施例可以使用机器学习中的集成方法的算法,对所述的不同的数学模型和水流量数据,分别选用不同的算法,分别算出真实、正确的供水***用水网络拓扑关系的计算结果。然后,赋予不同模型和算法以不同的权重,得出一个综合的计算结论。具体可以在本实施例中的用水网络拓扑关系计算服务器中完成。
实施例4:
如图10所示,是本发明实施例的区域用水网络拓扑关系确认装置的架构示意图。本实施例的区域用水网络拓扑关系确认装置包括一个或多个处理器21以及存储器22。其中,图10中以一个处理器21为例。
处理器21和存储器22可以通过总线或者其他方式连接,图10中以通过总线连接为例。
存储器22作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序和非易失性计算机可执行程序,如实施例1或实施例2中的区域用水网络拓扑关系确认方法。处理器21通过运行存储在存储器22中的非易失性软件程序和指令,从而执行区域用水网络拓扑关系确认方法。
存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器22可选包括相对于处理器21远程设置的存储器,这些远程存储器可以通过网络连接至处理器21。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述程序指令/模块存储在所述存储器22中,当被所述一个或者多个处理器21执行时,执行上述实施例1或实施例2中的区域用水网络拓扑关系确认方法,例如,执行以上描述的图1、图4、图5和图7所示的各个步骤。
值得说明的是,上述装置和***内的模块、单元之间的信息交互、执行过程等内容,由于与本发明的处理方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
本轮计算到此为止,剩余的串户如果有必要可以在第二轮计算与核验解决。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。