大数据安全与隐私保护24课件.pptx
《大数据安全与隐私保护24课件.pptx》由会员分享,可在线阅读,更多相关《大数据安全与隐私保护24课件.pptx(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大数据安全与隐私保护大数据安全与隐私保护LOGO大数据安全与隐私保护大数据安全与隐私保护大大数据的现状数据的现状 1大大数据研究概述数据研究概述2大数据带来的安全挑战大数据带来的安全挑战3大数据安全与隐私保护关键技术大数据安全与隐私保护关键技术4大数据服务与信息安全大数据服务与信息安全5小结小结6LOGO一、大一、大数据的现状数据的现状为什么为什么我们要我们要研究研究大数据?大数据?在科学界Nature和Science都推出了大数据专利对其展开探讨,意味着大数据成为云计算之后的信息技术领域的另一个信息产业增长点。当今,社会信息化和网络化的发展导致数据的爆炸式增长,据统计,平均每秒有200万的用
2、户在使用谷歌搜索,各行业也有大量数据在不断产生。缺点:安全与隐私问题是人们公认的关键问题。缺点:安全与隐私问题是人们公认的关键问题。LOGO二、大二、大数据研究概述数据研究概述 大数据大规模高速性多样性人机物特点来源LOGO大数据分析目标大数据分析目标1获得知识与推测趋获得知识与推测趋势势由于大数据包含大由于大数据包含大量原始、真实信息,量原始、真实信息,大数据分析能够有大数据分析能够有效摒弃个体差异,效摒弃个体差异,帮助人们透过现象帮助人们透过现象把握规律。把握规律。2分析掌握个性化特分析掌握个性化特征征企业通过长时间、企业通过长时间、多维度的数据积累,多维度的数据积累,可以分析用户行为可以
3、分析用户行为规律,为用户提供规律,为用户提供更好的个性化产品更好的个性化产品和服务,以及更精和服务,以及更精确的广告推荐。确的广告推荐。3通过分析辨别通过分析辨别真相真相由于网络中信息的由于网络中信息的传递更变便利,所传递更变便利,所以网络虚假信息造以网络虚假信息造成的危害也更大。成的危害也更大。目前人们开始尝试目前人们开始尝试利用大数据进行虚利用大数据进行虚假信息的识别。假信息的识别。LOGO大数据技术框架大数据技术框架数据解释数据解释旨在更好地支旨在更好地支持用户对数据持用户对数据分析结果的使分析结果的使用,涉及的主用,涉及的主要技术为可视要技术为可视化和人机交互。化和人机交互。数据分析数
4、据分析分为三类:计分为三类:计算架构,查询算架构,查询与索引,数据与索引,数据分析和处理。分析和处理。数据采集与预数据采集与预处理处理由于大数据的由于大数据的来源不一,可来源不一,可能存在不同模能存在不同模式的描述,甚式的描述,甚至存在矛盾。至存在矛盾。因此。在数据因此。在数据集成过程中对集成过程中对数据进行清洗,数据进行清洗,以消除相似、以消除相似、重复或不一致重复或不一致的数据是非常的数据是非常必要的。必要的。LOGO三、大数据带来的安全挑战三、大数据带来的安全挑战大数据中的用户隐私保护大数据中的用户隐私保护大数据的可信性大数据的可信性如何实现大数据的访问控制如何实现大数据的访问控制大数据
5、带来的安大数据带来的安大数据带来的安大数据带来的安全挑战全挑战全挑战全挑战LOGO大数据带来的安全挑战大数据带来的安全挑战用户隐私用户隐私保护保护大数据的大数据的可信性可信性如何实现如何实现大数据访大数据访问控制问控制不仅限于个人不仅限于个人隐私隐私泄漏,还泄漏,还在于基于大数在于基于大数据对人们状态据对人们状态和和行为的预行为的预测测。目前目前用户用户数据数据的的收集、管理收集、管理和使用缺乏监和使用缺乏监管,主要依靠管,主要依靠企业自律企业自律威胁之一威胁之一是伪是伪造或刻意制造造或刻意制造数据,数据,而错误而错误的数据的数据往往会导致往往会导致错错误的误的结论结论。威胁之二是数威胁之二是
6、数据在传播中的据在传播中的逐步失真。逐步失真。(1 1)难以预)难以预设角色,实现设角色,实现角色划分;角色划分;(2 2)难以预)难以预知每个角色的知每个角色的实际权限。实际权限。LOGO四、大数据安全与隐私保护关键技术四、大数据安全与隐私保护关键技术数据发布匿名保护技术数据发布匿名保护技术1社交网络匿名保护技术社交网络匿名保护技术2数据水印技术数据水印技术3数据溯源技术数据溯源技术4角色挖掘技术角色挖掘技术5风险自适应的访问控制风险自适应的访问控制6LOGO数据发布匿名保护技术数据发布匿名保护技术v数据发布匿名保护技术是对大数据中结构化数据实现隐私保护的核心关键与基本技术手段v典型例子:K
7、匿名方案 k-匿名技术要求发布的数据中存在 一定数量(至少为k)的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私K K匿名方案匿名方案优势优势一定程度上保护一定程度上保护了了数据数据的隐私的隐私,能够,能够很好的解决静态、很好的解决静态、一次发布的数据隐一次发布的数据隐私保护问题私保护问题劣势劣势不能应对数据连续不能应对数据连续多次发布、多次发布、攻击者攻击者从多渠道获得数据从多渠道获得数据的的问题的场景。问题的场景。LOGO社交网络匿名保护技术社交网络匿名保护技术v社交网络中典型的匿名保护:1、用户标识匿名与属性匿名,在数据发布时隐藏了 用户的标识与
8、属性信息2、用户间关系匿名,在数据发布时隐藏了用户间的关系v常见社交网络匿名保护1边匿名方案多基于边匿名方案多基于边的增删,用随机边的增删,用随机增删交换便的方法增删交换便的方法有效地实现边匿名有效地实现边匿名不足:匿名边保护不足:匿名边保护不足不足2基于超级节点对图基于超级节点对图结构进行分割和集结构进行分割和集聚操作聚操作不足:牺牲数据的不足:牺牲数据的可用性可用性LOGO数据水印技术数据水印技术v数据水印是指将标识信息以难以察觉的方式嵌入在数据载体内部且不影响其使用方法,多见于多媒体数据版权保护,也有针对数据库和文本文件的水印方案。v前提:数据中存在冗余信息或可容忍一定精度的误差v案例:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 安全 隐私 保护 24 课件
限制150内