CN110069907A - 基于数字水印的大数据溯源方法及*** - Google Patents
基于数字水印的大数据溯源方法及*** Download PDFInfo
- Publication number
- CN110069907A CN110069907A CN201910335999.8A CN201910335999A CN110069907A CN 110069907 A CN110069907 A CN 110069907A CN 201910335999 A CN201910335999 A CN 201910335999A CN 110069907 A CN110069907 A CN 110069907A
- Authority
- CN
- China
- Prior art keywords
- big data
- record
- records
- watermark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 53
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 230000001052 transient effect Effects 0.000 claims description 2
- 238000012217 deletion Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 206010020675 Hypermetropia Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Editing Of Facsimile Originals (AREA)
- Storage Device Security (AREA)
Abstract
本发明实施例提供一种大数据溯源方法及***,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
Description
技术领域
本发明实施例涉及数字水印技术领域,具体涉及一种基于数字水印的大数据溯源方法及***。
背景技术
随着大数据在人类生活、工作和思维方面开启的重大变革,个人数据已成为一个蕴藏着巨大价值的宝藏,当它的价值被发掘后,能以多样的方式不断创造价值。通过深度挖掘个人数据,企业能实现更加细化的市场细分并设计生产更具针对性的产品,实现精准营销;政府政策法规的制定将更加睿智、科学。在大数据时代,个人数据收集、处理、交易和应用将空前活跃,同时,频繁的交易活动也将置个人数据隐私于随时泄露的危险境地。因此,如何解决大数据背景下个人数据隐私保护难题,平衡个人隐私保护与数据利用之间的关系,已引起业界和学术界的广泛关注。
数据溯源是其中一个重要方向。利用数字水印技术采用非加密的方法,实现对数据的版权保护和安全控制,更符合大数据时代数据的特性和应用需求。目前,对于数据的水印嵌入主要基于数值型属性可存在一定的冗余度来实现,通过对数值型属性的最低有效位LSB(Least Significant Bit)引入一定的误差实现水印的嵌入和提取。
然而,现有大数据溯源技术有如下缺陷:算法鲁棒性差,抗删除攻击性差,抗增加攻击差等。
发明内容
为此,本发明实施例提供一种基于数字水印的大数据溯源方法及***,以解决现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例,提供一种大数据溯源方法,包括:
将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;
将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;
基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
进一步地,所述方法还包括:
将待比对大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的第二数字指纹;
基于第二数字指纹,将待比对大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的第二数字指纹,对应所述二值图片水印中一个像素,即第二数字水印中的一个位;
提取待比对大数据中各组中被嵌入在数值型数据中的位,作为提取值。
进一步地,所述方法还包括:
基于待比对大数据中各组的提取值,根据分组投票机制,获取嵌入在待比对大数据中的第二数字水印;
基于共享密钥对第二数字水印进行解密,获得第二字节流水印;
通过比对第二字节流水印和原始字节流水印是否一致,进而判断待比对大数据是否仿冒。
进一步地,所述方法还包括:
通过比对第二字节流水印和原始字节流水印中不一样字节的比例,获得原始大数据被篡改的比例。
进一步地,所述方法还包括:
通过比对各条记录中嵌入值和提取值的不同,确定待比对大数据中被篡改的记录。
进一步地,所述基于数字指纹,将原始大数据中所有条记录分为n组,包括:
将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;
每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印后,取的余数为i;其中,i为大于等于0的整数,且n>i。
进一步地,所述方法还包括:
将大数据中每条记录中的浮点型数据通过移动小数点转化为整数;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
根据本发明实施例,提供一种大数据溯源***,包括:
第一转换模块,用于将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;
第二转换模块,用于将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;
分组模块,用于基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;
嵌入模块,用于将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
根据本发明实施例,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述大数据溯源方法的步骤。
根据本发明实施例,提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述大数据溯源方法的步骤。
本发明实施例提供一种大数据溯源方法及***,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
本发明实施例具有如下优点:具有优化算法鲁棒性,抗删除攻击性强,抗增加攻击强等技术效果。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明实施例提供的一种大数据溯源方法整体流程示意图;
图2为本发明实施例提供的一种大数据溯源***整体结构示意图;
图3为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
然而,现有大数据溯源技术有如下缺陷:算法鲁棒性差,抗删除攻击性差,抗增加攻击差等。为解决上述技术问题,本发明实施例提供一种大数据溯源方法。如图1,示出本发明实施例大数据溯源方法的整体流程示意图,所述大数据溯源方法的执行主体能够为服务器、个人电脑及其他具有同等处理能力的智能终端产品,本发明实施例不作具体限定。所述方法具体包括以下步骤。
步骤S1,将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥。
其中,本发明实施例获取数字水印的来源。二值图像(Binary Image)是指将图像上的每一个像素只有两种可能的取值或灰度等级状态,人们经常用黑白B&W(Black andWhite)、单色图像表示二值图像。首先将二值图片水印转化成原始字节流水印,具体的转换方法可以采用现有技术中的转换方法,本发明实施例不作具体限定。进一步,基于现有技术中的AES-192(Advanced Encryption Standard 192)高级加解密算法对原始字节流水印进行加密,获得加密后的数字水印和共享秘钥。共享秘钥共享与共享用户ID绑定,以供对数字水印进行解密时调取。
进一步,数字水印(Digital Watermarking)技术是将一些标识信息(即数字水印)直接嵌入数字载体当中(包括多媒体、文档、软件等)或是间接表示(修改特定区域的结构),且不影响原载体的使用价值,也不容易被探知和再次修改。但可以被生产方识别和辨认。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是保护信息安全、实现防伪溯源、版权保护的有效办法,是信息隐藏技术研究领域的重要分支和研究方向。
步骤S2,将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹。
其中,原始大数据默认为经过结构化处理过的大数据。原始大数据中包含若干条记录,每条记录中又包含若干文本记录。本发明实施例将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹。所述转换方法可以采用现有技术中的hash算法(SHA),本发明实施例不作具体限定。
步骤S3,基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位。
进一步,首先对原始大数据中的所有条记录进行分组,分组个数n为二值图片水印中的像素点个数。例如二值图片水印为40*50,则将原始大数据中的所有条记录分为2000个组内,由于原始大数据中记录数据量很大,图片中每个像素点对应至少一组数据,每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印的分辨率,取的余数为i;其中,i为大于等于0的整数,且n>i。
步骤S4,将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
进一步,所述方法还包括:
将待比对大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的第二数字指纹;
基于第二数字指纹,将待比对大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的第二数字指纹,对应所述二值图片水印中一个像素,即第二数字水印中的一个位;
提取待比对大数据中各组中被嵌入在数值型数据中的位,作为提取值。
又进一步,所述方法还包括:基于待比对大数据中各组的提取值,根据分组投票机制,获取嵌入在待比对大数据中的第二数字水印;
基于共享密钥对第二数字水印进行解密,获得第二字节流水印;
通过比对第二字节流水印和原始字节流水印是否一致,进而判断待比对大数据是否仿冒。
还进一步,所述方法还包括:通过比对第二字节流水印和原始字节流水印中不一样字节的比例,获得原始大数据被篡改的比例。
再进一步,所述方法还包括:通过比对各条记录中嵌入值和提取值的不同,确定待比对大数据中被篡改的记录。
再进一步,所述基于数字指纹,将原始大数据中所有条记录分为n组,包括:
将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;
每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印后,取的余数为i;其中,i为大于等于0的整数,且n>i。
再进一步,所述方法还包括:
将大数据中每条记录中的浮点型数据通过移动小数点转化为整数;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。完成水印嵌入后再还原为浮点型数据。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明上述实施例的基础上,所述方法还包括:
将待比对大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的第二数字指纹;
基于第二数字指纹,将待比对大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的第二数字指纹,对应所述二值图片水印中一个像素,即第二数字水印中的一个位;
提取待比对大数据中各组中被嵌入在数值型数据中的位,作为提取值。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,所述方法还包括:
基于待比对大数据中各组的提取值,根据分组投票机制,获取嵌入在待比对大数据中的第二数字水印;
基于共享密钥对第二数字水印进行解密,获得第二字节流水印;
通过比对第二字节流水印和原始字节流水印是否一致,进而判断待比对大数据是否仿冒。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,所述方法还包括:通过比对第二字节流水印和原始字节流水印中不一样字节的比例,获得原始大数据被篡改的比例。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,所述方法还包括:通过比对各条记录中嵌入值和提取值的不同,确定待比对大数据中被篡改的记录。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,所述基于数字指纹,将原始大数据中所有条记录分为n组,包括:
将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;
每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印后,取的余数为i;其中,i为大于等于0的整数,且n>i。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,所述方法还包括:
将大数据中每条记录中的浮点型数据转化为整数;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
本发明实施例提供一种大数据溯源方法,所述方法包括:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
在本发明任一上述实施例的基础上,本发明实施例提供一种大数据溯源***。如图2,示出本发明实施例大数据溯源***的整体结构示意图。包括以下模块。
第一转换模块210,用于将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥。
其中,本发明实施例获取数字水印的来源。二值图像(Binary Image)是指将图像上的每一个像素只有两种可能的取值或灰度等级状态,人们经常用黑白、B&W、单色图像表示二值图像。首先将二值图片水印转化成原始字节流水印,具体的转换方法可以采用现有技术中的转换方法,本发明实施例不作具体限定。进一步,基于现有技术中的AES-192加解密算法对原始字节流水印进行加密,获得加密后的数字水印和共享秘钥。共享秘钥共享与共享用户ID绑定,以供对数字水印进行解密时调取。
进一步,数字水印(Digital Watermarking)技术是将一些标识信息(即数字水印)直接嵌入数字载体当中(包括多媒体、文档、软件等)或是间接表示(修改特定区域的结构),且不影响原载体的使用价值,也不容易被探知和再次修改。但可以被生产方识别和辨认。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是保护信息安全、实现防伪溯源、版权保护的有效办法,是信息隐藏技术研究领域的重要分支和研究方向。
第一转换模块220,用于将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹。
其中,原始大数据默认为经过结构化处理过的大数据。原始大数据中包含若干条记录,每条记录中又包含若干文本记录。本发明实施例将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹。所述转换方法可以采用现有技术中的hash算法(SHA),本发明实施例不作具体限定。
分组模块230,用于基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位。
进一步,首先对原始大数据中的所有条记录进行分组,分组个数n为二值图片水印中的像素点个数。例如二值图片水印为40*50,则将原始大数据中的所有条记录分为2000个组内,由于原始大数据中记录数据量很大,图片中每个像素点对应至少一组数据,每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印后,取的余数为i;其中,i为大于等于0的整数,且n>i。
嵌入模块240,用于将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
本发明实施例提供一种大数据溯源***,所述***包括:第一转换模块,用于将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;第二转换模块,用于将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;分组模块,用于基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;嵌入模块,用于将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。本发明实施例具有如下优点:解决了现有技术中算法鲁棒性差,抗删除攻击性差,抗增加攻击差等问题。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种大数据溯源方法,其特征在于,包括:
将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;
将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;
基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
2.根据权利要求1所述的大数据溯源方法,其特征在于,所述方法还包括:
将待比对大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的第二数字指纹;
基于第二数字指纹,将待比对大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的第二数字指纹,对应所述二值图片水印中一个像素,即第二数字水印中的一个位;
提取待比对大数据中各组中被嵌入在数值型数据中的位,作为提取值。
3.根据权利要求2所述的大数据溯源方法,其特征在于,所述方法还包括:
基于待比对大数据中各组的提取值,根据分组投票机制,获取嵌入在待比对大数据中的第二数字水印;
基于共享密钥对第二数字水印进行解密,获得第二字节流水印;
通过比对第二字节流水印和原始字节流水印是否一致,进而判断待比对大数据是否仿冒。
4.根据权利要求3所述的大数据溯源方法,其特征在于,所述方法还包括:
通过比对第二字节流水印和原始字节流水印中不一样字节的比例,获得原始大数据被篡改的比例。
5.根据权利要求3所述的大数据溯源方法,其特征在于,所述方法还包括:
通过比对各条记录中嵌入值和提取值的不同,确定待比对大数据中被篡改的记录。
6.根据权利要求1所述的大数据溯源方法,其特征在于,所述基于数字指纹,将原始大数据中所有条记录分为n组,包括:
将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;
每个数字指纹对应的第i组通过如下步骤确定:数字指纹转换成整数再除以数字水印的分辨率,取的余数为i;其中,i为大于等于0的整数,且n>i。
7.根据权利要求1所述的大数据溯源方法,其特征在于,所述方法还包括:
将大数据中每条记录中的浮点型数据通过移动小数点转化为整数;
将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
8.一种大数据溯源***,其特征在于,包括:
第一转换模块,用于将二值图片水印转化成原始字节流水印,对原始字节流水印进行加密获得数字水印和共享密钥;
第二转换模块,用于将原始大数据中每条记录中的主键和文本数据转换成,与每条记录相对应的数字指纹;
分组模块,用于基于数字指纹,将原始大数据中所有条记录分为n组,n为所述二值图片水印的像素点个数;每条记录及与每条记录相对应的数字指纹,对应所述二值图片水印中一个像素,即数字水印中的一个位;
嵌入模块,用于将数字水印中的一个位作为嵌入值,嵌入到大数据中每条记录中的数值型数据中。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述大数据溯源方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述大数据溯源方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910335999.8A CN110069907A (zh) | 2019-04-24 | 2019-04-24 | 基于数字水印的大数据溯源方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910335999.8A CN110069907A (zh) | 2019-04-24 | 2019-04-24 | 基于数字水印的大数据溯源方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110069907A true CN110069907A (zh) | 2019-07-30 |
Family
ID=67368704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910335999.8A Pending CN110069907A (zh) | 2019-04-24 | 2019-04-24 | 基于数字水印的大数据溯源方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110069907A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385102A (zh) * | 2020-03-20 | 2020-07-07 | 浙江传媒学院 | 基于母子链的视频版权交易溯源方法 |
CN113032744A (zh) * | 2021-03-29 | 2021-06-25 | 吉林省容汇科技服务中心(有限合伙) | 一种数字水印一体机*** |
CN117473470A (zh) * | 2023-12-28 | 2024-01-30 | 深圳昂楷科技有限公司 | 动态水印生成方法及***、水印溯源方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184243A (zh) * | 2011-05-17 | 2011-09-14 | 沈阳化工大学 | 一种基于文本型属性的关系数据库水印嵌入方法 |
CN104866735A (zh) * | 2015-05-22 | 2015-08-26 | 电子科技大学 | 一种数值型关系数据库水印的嵌入及提取验证方法 |
CN109360143A (zh) * | 2018-09-21 | 2019-02-19 | 北京仁信证科技有限公司 | 一种用于大数据的数字水印嵌入和提取方法及*** |
-
2019
- 2019-04-24 CN CN201910335999.8A patent/CN110069907A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184243A (zh) * | 2011-05-17 | 2011-09-14 | 沈阳化工大学 | 一种基于文本型属性的关系数据库水印嵌入方法 |
CN104866735A (zh) * | 2015-05-22 | 2015-08-26 | 电子科技大学 | 一种数值型关系数据库水印的嵌入及提取验证方法 |
CN109360143A (zh) * | 2018-09-21 | 2019-02-19 | 北京仁信证科技有限公司 | 一种用于大数据的数字水印嵌入和提取方法及*** |
Non-Patent Citations (3)
Title |
---|
崔海亭: "基于公钥密码学的关系数据库水印算法研究", 《中国优秀硕士学位论文全文数据库》 * |
曹再辉: "基于图像的数据库水印算法研究", 《中国优秀硕士学位论文全文数据库》 * |
马瑞敏等: "一种基于混沌加密的关系数据库水印算法", 《南通大学学报(自然科学版)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111385102A (zh) * | 2020-03-20 | 2020-07-07 | 浙江传媒学院 | 基于母子链的视频版权交易溯源方法 |
CN111385102B (zh) * | 2020-03-20 | 2021-05-11 | 浙江传媒学院 | 基于母子链的视频版权交易溯源方法 |
CN113032744A (zh) * | 2021-03-29 | 2021-06-25 | 吉林省容汇科技服务中心(有限合伙) | 一种数字水印一体机*** |
CN117473470A (zh) * | 2023-12-28 | 2024-01-30 | 深圳昂楷科技有限公司 | 动态水印生成方法及***、水印溯源方法 |
CN117473470B (zh) * | 2023-12-28 | 2024-05-07 | 深圳昂楷科技有限公司 | 动态水印生成方法及***、水印溯源方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103646264B (zh) | 一种多重信息加密的二维码防伪方法 | |
CN107239713B (zh) | 一种敏感内容数据信息防护方法和*** | |
CN101295343B (zh) | 二维码多重加密防伪印刷方法 | |
US9619665B2 (en) | Method and system for adding dynamic labels to a file and encrypting the file | |
Zhou et al. | Faster-RCNN based robust coverless information hiding system in cloud environment | |
CN110245469B (zh) | 网页的水印生成方法、水印解析方法、装置及存储介质 | |
Cao et al. | Coverless information hiding based on the generation of anime characters | |
TWI528217B (zh) | 於線上加上即時檔案動態標籤、加密之系統及方法 | |
CN110069907A (zh) | 基于数字水印的大数据溯源方法及*** | |
CN101232380A (zh) | 智能密钥设备安全使用的方法和智能密钥设备 | |
CN111222178B (zh) | 一种数据签名方法及装置 | |
CN108416223B (zh) | 一种基于混沌理论的信息标签加密方法及其*** | |
CN104426879B (zh) | 验证码生成和验证的处理方法及对应的方法、装置和*** | |
CN108881230B (zh) | 一种政务大数据的安全传输方法及装置 | |
CN109785222A (zh) | 一种用于网页的信息快速嵌入和提取的方法 | |
CN101834726A (zh) | 基于二维码的安全加密方法 | |
WO2024051770A1 (zh) | 一种智能设备真随机密钥生成方法、装置、终端及介质 | |
AlKhafaji et al. | Improved technique for hiding data in a colored and a monochrome image | |
US20160189015A1 (en) | Data exchange methods, systems and apparatus using color images | |
Chhajed et al. | Data hiding in binary images for secret and secure communication using decision tree | |
CN109657487A (zh) | 图像处理方法、图像验证方法及其装置 | |
CN112184841B (zh) | 块替换生成式信息隐藏及恢复方法、设备及介质 | |
CN114845115A (zh) | 一种信息传输方法、装置、设备及存储介质 | |
Du et al. | Image hashing for tamper detection with multiview embedding and perceptual saliency | |
Kich et al. | Image steganography scheme using dilated convolutional network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190730 |