基于hadoop大数据平台和无简并高维离散超混沌系统的加密算法-温贺平.pdf
《基于hadoop大数据平台和无简并高维离散超混沌系统的加密算法-温贺平.pdf》由会员分享,可在线阅读,更多相关《基于hadoop大数据平台和无简并高维离散超混沌系统的加密算法-温贺平.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于Hadoop大数据平台和无简并高维离散超混沌系统的加密算法温贺平禹思敏吕金虎Encryption algorithm based on Hadoop and non-degenerate high-dimensional discrete hyperchaoticsystemWen He-Ping Yu Si-Min L Jin-Hu引用信息Citation: Acta Physica Sinica , 66, 230503 (2017) DOI: 10.7498/aps.66.230503在线阅读View online: http:/dx.doi.org/10.7498/aps.66.2
2、30503当期内容View table of contents: http:/ you may be interested in利用混沌激光脉冲在线实时产生7 Gbit/s物理随机数Online real-time 7 Gbit/s physical random number generation utilizing chaotic laser pulses物理学报.2017, 66(5): 050501 http:/dx.doi.org/10.7498/aps.66.050501基于混沌系统的SM4密钥扩展算法SM4 key scheme algorithm based on chaoti
3、c system物理学报.2017, 66(2): 020504 http:/dx.doi.org/10.7498/aps.66.020504三维空间域多普勒功率谱及其多天线系统性能Doppler power spectrum density and multi-antenna system performance in three-dimensional environ-ment物理学报.2014, 63(24): 240507 http:/dx.doi.org/10.7498/aps.63.240507基于改进的统计信道模型与多天线系统性能分析Geometricalstatisticalc
4、hannelmodelandperformanceinvestigationformulti-antennasystemsinwirelesscommunications物理学报.2014, 63(14): 140506 http:/dx.doi.org/10.7498/aps.63.140506基于扩展混沌映射的认证密钥协商协议An authenticated key agreement protocol based on extended chaotic maps物理学报.2014, 63(5): 050507 http:/dx.doi.org/10.7498/aps.63.050507万
5、方数据物理学报Acta Phys. Sin. Vol. 66, No. 23 (2017) 230503基于Hadoop大数据平台和无简并高维离散超混沌系统的加密算法温贺平1)y禹思敏1)吕金虎2)1)(广东工业大学自动化学院,广州510006)2)(中国科学院数学与系统科学研究院,北京100190)(2017年7月5日收到; 2017年7月29日收到修改稿)针对目前大数据环境中存在的数据安全问题,提出一种基于Hadoop大数据平台和无简并高维离散超混沌系统的加密算法.算法采用流密码对称加密方式,在Hadoop平台上读取存储于HDFS(Hadoop distributedle system)的
6、大数据,进行分片处理和MapReduce编程后,用Map函数实现数据并行加密和解密,通过Reduce函数实现数据的合并操作并存储于HDFS.该算法具有较好的执行效率.与正李氏指数发生简并的低维混沌系统相比,无简并高维离散超混沌加密算法能提高系统安全性能,李氏指数均为正并且足够大,具有更好的统计特性,可通过严格的TESTU01测试,并行加密的密文之间互相关性很小.密钥参数众多使得估计或辨识难度增大.在密文闭环反馈条件下,具有抵御已知明文攻击和选择明文攻击的能力.关键词:混沌系统,混沌密码, HadoopPACS: 05.45.Vx, 05.45.Jn DOI: 10.7498/aps.66.23
7、05031引言随着物联网和云计算等新兴信息技术的发展,人类进入了大数据时代1,安全与隐私保护无疑是大数据环境中的重要问题,在大数据环境中探索高效的数据安全和隐私保护模式是人们关注的热点2. Hadoop是Apache基金会发布的一个开发和处理大数据的软件平台,作为一种开源的大数据处理架构,在业内得到了广泛应用,几乎成为大数据技术的代名词3.然而,目前的HDFS (Hadoopdistributed le system)并不支持云内的数据加密,这对Hadoop平台的数据安全提出了挑战4.近年来,针对Hadoop大数据加密的研究引起了人们的关注5-8. 2013年,文献5将对称加密算法DES(da
8、ta encryption standard)和非对称加密算法RSA进行融合,先对HDFS数据进行DES加密,再利用RSA对DES的密钥进行加密,提高了算法安全性.同年,文献6提出了一种基于HDFS的数据传输存储安全技术方案,利用AES(advancedencryption standard)算法对大数据文件进行加密和解密. 2015年,文献7提出在Hadoop中对存储在HDFS上的视频采用AES算法进行选择性加密,兼顾算法执行效率和安全性. 2016年,文献8对Hadoop平台的传输数据加密及数据访问安全机理进行了分析和研究.这些工作大都基于传统的密码技术,随着通信环境的日趋复杂和破译能力的
9、不断提升,许多传统密码算法的安全性受到威胁,需要更为安全的密码设计理论和技术来解决这个问题9.众所周知,混沌是确定性系统中的内秉随机运动,其典型特征体现在对初始条件与控制参数的高度敏感性、良好的伪随机性、遍历性、轨道的长期不可预测性和连续宽带谱等各个方面,与密码学国家重点研发计划(批准号: 2016YFB0800401)和国家自然科学基金(批准号: 61532020, 61671161, 61172023)资助的课题.通信作者. E-mail: 2017中国物理学会Chinese Physical Society http:/230503-1万方数据物理学报Acta Phys. Sin. V
10、ol. 66, No. 23 (2017) 230503中的混淆、扩散、密钥、循环轮数等有许多相似之处10.尽管混沌密码研究取得了一些进展11-14,但目前关于混沌密码在Hadoop大数据平台中的研究报道尚不多见15;16. 2015年,文献15提出基于MapReduce的并行混合混沌加密方案,综合运用Lorenz, Chen, Logistic, Henon等低维混沌系统产生的混沌序列对明文进行加密,在Hadoop平台并行编程架构的基础上提升了数据加密的速度;文献16提出了基于Logistic和Tent映射等低维混沌系统的大数据环境并行加密算法, MapReduce编程仿真结果表明,该算法具
11、有较好的执行效率.从安全性角度来看,现有低维混沌密码算法有待进一步改进,主要原因在于: 1)现有低维混沌系统的正李氏指数不够大,而且通常会发生简并,尽管有些能通过常规NIST测试,但无法通过目前更为严格的TESTU01测试; 2)独立的密钥参数不够多,不能抵御基于密钥参数估计或辨识的攻击17-20; 3)算法大多采用开环结构,没有密文的反馈,难以抵御已知明文攻击和选择明文攻击21.为了进一步改进算法的安全性,本文提出一种基于Hadoop大数据平台和无简并高维离散超混沌系统的密码算法.首先,设计一种无简并高维离散超混沌系统,保证正李氏指数的个数等于混沌系统的维数并且正李氏指数尽可能大.其次,利用
12、MapReduce并行编程模型,设计Map和Reduce函数,在Map函数中实现混沌序列密码对存储在HDFS上文本数据的加密和解密操作,在Reduce函数中实现大数据文件的排序和合并操作.最后,在Hadoop大数据平台中进行验证和分析.数值计算结果表明,提出的无简并高维离散超混沌密码算法同时具备执行效率较高和安全性较好的特点.2用状态变量的环形耦合方法构造无简并高维离散超混沌系统及相应的混沌密码设计无简并高维超混沌系统是指正李氏指数的个数L+能够达到可能的最大个数的一类高维超混沌系统.对于n维连续时间自治耗散系统,设正李氏指数个数为L+c ,负李氏指数的个数为L-c ,零李氏指数的个数为L0c
13、,它们满足n = L+c +L-c +L0c.对于n维连续时间自治系统,如果正李氏指数的个数达到了可能的最大个数,即满足L+c = n-2,称为无简并高维连续时间超混沌系统.如果正李氏指数个数仅满足L+c = n-2-d 2,则称为有简并高维连续时间超混沌系统,其中d 0为正李氏指数的简并度,是衡量正李氏指数个数减少的一个量化指标, d越大,正李氏指数个数减少的程度越大.对于n维离散时间自治系统,如果正李氏指数的个数达到了可能的最大个数,即满足L+d = n,则称之为无简并高维离散时间超混沌系统.如果正李氏指数的个数仅满足L+d = n-d 2,则称为有简并高维离散时间超混沌系统.通常情况下将
14、连续和离散系统的正李氏指数是否发生简并的两种情况统称为无简并混沌系统和有简并混沌系统.对于连续时间系统,必须有一个零指数和至少一个负指数,而离散系统则无此要求.在简并无法消除的情况下,正李氏指数的个数不能随着系统维数的拓展而增加,这种单纯拓展系统维数而不能增加正李氏指数个数的高维系统设计方法并无实质性的研究意义.例如,一个3维离散混沌系统和一个10维离散混沌系统,如果这两个系统都只有一个正李氏指数,除维数上的差异之外,其他的动力学性质并没有本质上的区别.但如果后者是无简并的,有10个正李氏指数,那么两者的动力学性质将会出现较大的差异.这种差异具体体现在混沌的统计特性能否通过严格的TESTU01
15、测试和度量混沌系统统计特性的KS(Kolmogorov-Sinai)熵值的大小,而这些指标是混沌加密算法安全性所需的必要条件.无简并高维超混沌系统和有简并高维超混沌系统在维数相同的条件下,在动力学行为、混沌化程度以及统计特性等多个方面都存在较大的差异.根据混沌理论,混沌系统的本质特征由混沌轨道的拉伸折叠变换所决定.只有一个正李氏指数的混沌系统,相邻轨道之间仅有一个方向上的拉伸折叠变换和发散度(即指数分离度),而多个正李氏指数的混沌系统则具有多个不同方向上的拉伸折叠变换和发散度.在混沌系统全局有界条件下,如果正李氏指数越多(即L+越大),且正李氏指数的值E+L越大,则具有更大强度、更多不同方向上
16、的拉伸折叠变换,整个系统的行为越复杂,导致无简并系统与有简并系统的动力学性质出现较大的差异.众所周知,混沌系统的KS熵与正李氏指数的关系满足hKS =iE+Li,其中E+Li表示正李氏指数的值, hKS表示KS熵22. hKS越大,则混沌系统的230503-2万方数据物理学报Acta Phys. Sin. Vol. 66, No. 23 (2017) 230503统计特性越好,这意味着正李氏指数的个数越多且混沌系统越大,则统计特性越好.设计正李氏指数无简并高维离散超混沌系统,应使正李氏指数的个数等于系统的维数,不存在零指数和负指数,正李氏指数个数达到最大值.此外,可通过调节系统的参数,使正李氏
17、指数尽可能大.总之,与其他混沌系统相比,正李氏指数无简并超混沌系统具有更好的统计特性.在离散时间混沌系统的诸多特征中,目前在工程应用中被广泛采用的混沌判据主要有两项,即具有正的李氏指数和轨道全局有界23.根据这两项,首先给出无简并高维离散超混沌系统的具体设计步骤:1)设计渐进稳定的标称系统的一般形式为x(k + 1) = Cx(k); (1)式中x(k)Rn,标称矩阵C的特征根全部位于单位圆内,使得标称系统渐进稳定.2)为了对标称系统实施有效控制,需要对标称矩阵C作相似变换,得A = PCP-1; (2)式中P为非奇异矩阵.得相似变换后的标称系统为x(k + 1) = Ax(k): (3)(1
18、)式和(3)式具有相同的特征根和稳定性.3)设计一致有界反控制器g x(k);和控制矩阵B,从而对(3)式实施反控制,得全局有界的受控系统为x(k + 1) = Ax(k) +Bg x(k);: (4)4)利用控制矩阵B和反控制器g x(k);对受控系统(4)式进行极点配置,经极点配置后,正李氏指数个数达到最大值,即满足李氏指数的个数L+ = n,使得(4)式成为无简并高维离散时间超混沌系统.为了兼顾混沌密码算法的执行效率和安全性能两个方面,必须选取适当的系统维数n的大小.维数高时尽管能提高安全性能,但会降低执行效率,反之亦然.选取5维系统作为典型实例,根据(4)式和状态变量的环形耦合方法设计
19、无简并5维离散超混沌系统.首先,根据(1)(3)式,设n = 5,得5维标称系统(3)式所对应的标称矩阵的数学表达式为A =0BBBBBBBa11 a12 a13 a14 a15a21 a22 a23 a24 a25a31 a32 a33 a34 a35a41 a42 a43 a44 a45a51 a52 a52 a54 a551CCCCCCCA=0BBBBBBB-0:0250 0:7750 -0:7250 0:8750 -0:9250-0:5000 0:4000 -0:3000 1:3000 -0:5000-0:8750 0:8250 0:0250 0:9250 -0:8750-0:4750
20、 1:2250 -0:2750 0:4250 -0:4750-0:9250 0:7750 -0:7250 0:8750 -0:02501CCCCCCCA: (5)其次,根据标称系统(3)式和状态变量的环形耦合方法进一步设计受控系统(4)式,如图1所示.图中fi()(1 i 5)的数学表达式为fi()xi(k + 1)= ai1x1(k) + ai2x2(k) + ai3x3(k)+ ai4x4(k) + ai5x5(k):在该方法中,首先将(3)式中第1个迭代方程输出的状态变量x1经sin函数耦合到第2个迭代方程,然后将第2个迭代方程输出的状态变量x2经sin函数耦合到第3个迭代方程,其余依此
21、类推.最后将第5个迭代方程输出的状态变量x5经sin函数耦合到第1个迭代方程,从而构成状态变量的环形耦合.根据图1,得5维受控系统的数学表达式为0BBBBBBBBBx1(k+1)x2(k+1)x3(k+1)x4(k+1)x5(k+1)1CCCCCCCCCA=0BBBBBBBBBa11 a12 a13 a14 a15a21 a22 a23 a24 a25a31 a32 a33 a34 a35a41 a42 a43 a44 a45a51 a52 a52 a54 a551CCCCCCCCCA0BBBBBBBBBx1(k)x2(k)x3(k)x4(k)x5(k)1CCCCCCCCCA+0BBBBBBB
22、BB0 0 0 0 11 0 0 0 00 1 0 0 00 0 1 0 00 0 0 1 01CCCCCCCCCA0BBBBBBBBB1 sin( 1x1)2 sin( 2x2)3 sin( 3x3)4 sin( 4x4)5 sin( 5x5)1CCCCCCCCCA; (6)230503-3万方数据物理学报Acta Phys. Sin. Vol. 66, No. 23 (2017) 230503式中矩阵元素aij(1 i;j 5)的大小由(5)式给出.根据(6)式,不妨选取密钥参数1 = 1:0105,1 = 2:0103, 2 = 3:0105, 2 = 4:0103,3 = 5:0105
23、, 3 = 6:0103, 4 = 7:0105,4 = 8:0103, 5 = 9:0105, 5 = 10:0103,得李氏指数的计算结果分别为EL1 = 20:7752,EL2 = 20:7532, EL3 = 20:7520, EL4 = 20:7295,EL5 = 20:7050.所有的李氏指数均为正数,满足L+ = 5,正的李氏指数比较大并且大小一致,故(6)式是一个无简并5维离散超混沌系统.混沌吸引子相图如图2所示.在图1和(6)式的基础上,进一步设计混沌并行加密算法,如图3所示.图中将大数据切分为N个单元块,其中前N - 1块的大小均为1 kB,最后一块为剩余部分, i = 1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 hadoop 数据 平台 离散 混沌 系统 加密算法 温贺平
限制150内