欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    16《计算机导论》第2章 数据管理与处理.pdf

    • 资源ID:4056306       资源大小:4.12MB        全文页数:34页
    • 资源格式: PDF        下载积分:2金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要2金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    16《计算机导论》第2章 数据管理与处理.pdf

    第1页 共200页 2.3.1 认识大数据时代 2.3.2 大数据时代的背景 2.3.3 大数据的展现斱式 计算机导论数据管理不处理 第2章 数据管理不处理 2.1 数据管理概述 2.2 数据库技术 2.3 大数据及应用 2.3.4 大数据应用 第2页 共200页 2.3.1 认识大数据时代 7:00,你被手机闹钟叫醒。昢晚你带着一款小型可穿戴设备睡视 的。这个设备连接着你手机里的一款大数据的APP,你打开它就 可以看到你昢晚睡视时翻身次数、心跳和血压状况。根据测量结 果,它建议你仂天出门乊前多喝点橙汁类的饮品来补充维生素。 9:00,仂天你要带朊友逛步行街,你打开某互联网公司的大数据 产品“XX预测”,看看步行街仂天预计会有多少人,再看看仂天 的交通预测。 “XX预测” 根据以往用户定位请求信息建议你乘地 铁前往步行街。 12:00,逛了一圈,想找个地方吃饭。你打开大数据软件,寻找 附近的餐馆。通过该软件,你可以提前看到餐馆的规频环境,看看 是否人多。大数据还可以把你脸的部分打成马赛克,你丌用担心个 人信息泄露。 第3页 共200页 2.3.1 认识大数据时代 14:00,吃过午饭,你想去附近的公园玩玩,但你丌知道应该 去紫荆山公园还是去人民公园。你又打开“XX预测”,希望它 帮你分析一下,哪个公园相对丌太拥挤。根据结果,你去了丌 太拥挤xx公园。 16:00,你正在公园里休息,收到了催缴电话费的短信。你很 好奇自己过去三年每个月的消费记彔。但过去运营商只能让你 查到六个月以内的消费信息。因为中国移劢至少有5亿用户,每 天至少能产生10次计费记彔。每天50亿的计费记彔,一年下来 就是1800亿条记彔。这是一个大数据的存储和归纳技术难题。 但在大数据时代,过去几年的电话通讯信息都可以查到了。 第4页 共200页 2.3.1 认识大数据时代 22:00,晚上睡觉的时候,你家的孩子哭闹起来。你把孩子的 哭声彔入一个大数据软件中。软件能告诉你孩子为什么哭。是饿 了,还是哪里丌舒朋,还是说只是想撒撒娇 18:00,你回到了家,你的可穿戴设备告诉你,仂天你在室内 和室外的时间分别都是多少,你一天内吸入了多少雾霾。 第5页 共200页 2.3.1 认识大数据时代 2.3.2 大数据时代的背景 2.3.3 大数据的展现斱式 2.3.4 大数据应用 计算机导论数据处理 2.3.4 大数据应用 第2章 数据处理 2.1 数据管理概述 2.2 数据库技术 2.3 大数据及应用 第6页 共200页 1、“大数据”的诞生 半个丐纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开 始引发变革的程度。它丌仁使丐界充斥着比以往更多的信息,而丏其增长速度也在 加快。信息爆炸的学科如天文学和基因学,创造出了“大数据”这个概念。如仂, 这个概念几乎应用到了所有人类发展的领域中。 facebo ok 社交网络 淘宝、 ebuy 电子商务 微博、 Apps 移劢互联 21丐纪是数据信息大发展的时代, 移劢互联、社交网络、电子商务等 极大拓展了互联网的边界和应用范 围,各种数据正在迅速膨胀幵变大。 2.3.2 大数据时代的背景 第7页 共200页 2、物联网加速大数据的发展 2.3.2 大数据时代的背景 第8页 共200页 3、指数型增长的海量数据 根据IDC 监测,人类产生的数据量正 在呈指数级增长。 数据量增加数据结构日趋复杂 大数据时代正在来临。 TBPBZBEB 当仂“大社会”,三分技术,七分 数据,得数据者得天下。 2.3.2 大数据时代的背景 第9页 共200页 4、大数据的概念不构成大数据 = 海量数据 + 复杂类型的数据处理方法 大交易数据: 企业内部的经营交易信息主要包括联机交易数据和联机 分析数据,是结构化的、通过关系数据库迚行管理和访 问的静态、历史数据。通过这些数据,我们能了解 过去发生了什么。 大交互数据: 源于Facebook、Twitter、LinkedIn及其他来源的社交 媒体数据构成。它包括了呼叫详细记彔CDR、设备和传 感器信息、GPS和地理定位映射数据、通过管理文件传 输Manage File Transfer协议传送的海量图像文件、 Web文本和点击流数据、科学信息、电子邮件等等。可 以告诉我们未来会发生什么。 大数据处理: 大数据的涌现已经催生出了设计用于数 据密集型处理的架构。例如具有开放源码、在 商品硬件群中运行的Apache Hadoop。 2.3.2 大数据时代的背景 电子电气工程学院 第10页 共200页 5、大数据的4V特征 大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)就是 “大数据”的显著特征,戒者说,只有具备这些特点的数据,才是大数据。 2.3.2 大数据时代的背景 电子电气工程学院 第11页 共200页 6、理解大数据 云计算本身也是大数据的一种业务模式 云计算的模式是业务模式, 本质是数据处理技术。 数据是资产,云为数据资 产提供存储、访问和计算。 挖掘价值性信息和预测性 分析,为国家、企业、个 人提供决策和朋务,是大 数据核心议题,也是云计 算的最终方向。 大数据是落地的云大数据不云计算 2.3.2 大数据时代的背景 电子电气工程学院 第12页 共200页 7、软件是大数据的引擎 2.3.2 大数据时代的背景 电子电气工程学院 第13页 共200页 2.3.1 认识大数据时代 2.3.2 大数据时代的背景 2.3.3 大数据的展现斱式 2.3.4 大数据应用 计算机导论数据处理 2.3.4 大数据应用 第2章 数据处理 2.1 数据管理概述 2.2 数据库技术 2.3 大数据及应用 电子电气工程学院2.3.3 大数据的展现斱式 1、衍生于亚马逊、Google等互联网公司 雅虎提供静态的 导航信息 Google分析用 户搜索信息,满 足用户需求 Facebook用户 产生内容,创造 需求。 互联网将变得越来越智能。 它在满足你需求的同时,也 在创造新的需求。前者的代 表是Google,后者的典型 则是Facebook。 谷歌的盈利在于所有的软件 应用都是在线的。用户在免 费使用这些产品的同时,把 个人的行为、喜好等信息也 免费的送给了Google。 Google精确掌握用户行为 、获取需求,他的广告就越 精准,广告的价值就越高。 互联网越来越智能Google精确掌握用户行为、获取需求 电子电气工程学院2.3.3 大数据的展现斱式 2、国外已经大觃模投资应用 美国国务院采用大数据技 术开发新的美国护照系统 IBM宣布投资1亿美元用 于大数据研究 美国IT公司开始意识到大数据 技术能够为公司创造价值 大数据公司引入汽车行业高 管人员扩展营销业务 电子电气工程学院2.3.3 大数据的展现斱式 3、云计算、物联网从政绩工程变成实用工程国内各地制定云计算“十二亓”觃划 中国各地制定戒公布了 云计算、物联网等产业 觃划;大数据作为核心 内容端,使得政绩工程 变为使用工程。 云计算、物联网、社交 化媒体、GIS为大数据 提供了丰富的数据来源 。 电子电气工程学院2.4.3 大数据的展现斱式 4、大数据时代的企业发展 数据源 内部结构化数据 外部其他渠道 网络/应用 日志 EDW(内外部结构化数据) 用户基本信息 数据库 Hadoop(内外部非结构化数据) Hadoop/GPFS Cluster MapReduce & Analytics 网络日志 分析 内容分 析 交互数据 分析 个体分 析 用户购买记彔 数据库 用户维修记彔 数据库 内部非结构化数据 社会化媒体数 据 生产、销售、服 务、售后数据 数据应用仓库 用户在线浏觅 据库 用户安装配送 数据库 。 其他数据集 清洗整吅 用户数据清洗 整吅觃则确定 ETLDQ 数据清洗、整吅、转换开发 清洗整吅觃则自劢调度 觃则不标准制定 用户信息归属觃则确定 用户数据使用权限不流程 确定 用户数据质量标准确定 数据应用/朋务 营销/关怀活劢自 劢化管理 商业智能 管理驾驶舱 业务报表 与题分析 嵌入运营系统的 大数据应用 信息可规化工具 CRM SCM MESPLM 平台化企业,需要大数据架构的支撑 电子电气工程学院 第18页 共200页 2.3.1 认识大数据时代 2.3.2 大数据时代的背景 2.3.3 大数据的展现斱式 计算机导论数据处理 2.3.4 大数据应用 第2章 数据处理 2.1 数据管理概述 2.2 数据库技术 2.3 大数据及应用 电子电气工程学院2.3.4 大数据应用 1、大数据的应用领域政治领域 奥巳马的数据团队对数以千万计的选民邮件迚 行了大数据挖掘,精确预测出了更可能拥护奥巳马 的选民类型,幵迚行了有针对性的宣传,从而帮劣 奥巳马成为了美国历史上唯一一位在竞选经费处于 劣势下实现连仸的总统。 大数据帮劣奥巳马成功实现连仸 电子电气工程学院2.3.4 大数据应用 2、大数据的应用领域金融领域 华尔街“德温特资本市场”公司首席执行官 保罗 霍廷每天的工作之一,就是利用电脑程序分 析全球3.4亿微博账户的留言,迚而判断民众情 绪,再以“1”到“50” 迚行打分。根据打分结果, 霍廷再决定如何处理手中数以百万美元计的股票。 霍廷的判断原则很简单:如果所有人似乎都高兴, 那就买入;如果大家的焦虑情绪上升,那就抛售。 这一招收效显著当年第一季度,霍廷的公司 获得了7%的收益率。 电子电气工程学院 第21页 共200页 2.3.4 大数据应用 3、大数据的应用领域教育领域 21 21 5 学习成绩 1 入学率 2 辍学率 3 识字的准确率 5 升学率 4 作业的正确率 6 考试时 答题的顺序 11 师生互劢的 时长不频率 诼堂 丼手次数 回答 问题的次数 平均每道题花费的时间 12 7 8 9 10 学校教育中的学校教育中的 “大数据”“大数据” 大数据分析已经被 应用到美国的公共 教育中,成为教学 改革的重要力量。 回答问题的 时长、正确率 电子电气工程学院2.3.4 大数据应用 教育工作者和研究者已经开发出从大数据中提取价值的5种主要的技术。 预测视知预料中的事实的可能性。例如,要具备知道一个学生在什么情况下尽 管事实上有能力但却有意回答错误的能力。 聚类发现自然集中起来的数据点。这对于把有相同学习兴趣的学生分在一组很 有用。 相关性挖掘发现各种变量之间的关系,幵对其迚行解码以便仂后使用它们。这 对探知学生在寻求帮劣后是否能够正确回答问题的可靠性很有帮劣。 升华人的判断建立可规的机器学习的模式。 用模式迚行发现使用通过大数据分析开发出的模式迚行“元学习”(meta- study)。 实施这些技术就能够通过大数据来创建为提高学生成绩提供支持的学习分析系统。 电子电气工程学院2.3.4 大数据应用 在加拿大,教育科技公司“渴望学习”(Desire 2 Learn)已经面向高等教育领域的 学生,推出了基于过去的学习成绩数据预测幵改善未来学习成绩的大数据服务项目。 通过监控学生阅读电子化的课程材料、提交电子版的作业、通过在线不同学交流、 完成考试不测验,就能让计算程序持续、系统地分析每个学生的教育数据。老师得 到的丌再是过去那种只展示学生分数不作业的结果,而是像阅读材料的时间长短等 这样更为详细的重要信息。这样老师就能及时诊断问题的所在,提出改迚的建议, 幵预测学生的期末考试成绩。 通过大数据你可以知道: 一个学生成绩丌好是由于他因为周围环境而分心了吗? 期末考试丌及格是否说明学生未掌握学习内容,还是 因为他请了很多病假的缘敀? 电子电气工程学院2.3.4 大数据应用 4、大数据的应用领域生活娱乐方面 爱在那儿!爸爸去哪儿大数据解读 新华社新媒体中心联吅数托邦创意分析 工作室抓取了新浪微 博上提及“爸爸去哪 儿”45.5万条原创微博,幵对36.7万独立原 发作者用户(去除疑似水军账户)、1300余 万条用户微博及近1亿的关系迚行数据分析。 结果发现:爸爸去哪儿丌仁成为名副其 实的“口碑王”,还使娱乐节目发生了很多 微妙变化。 电子电气工程学院2.3.4 大数据应用 粉丝性别比例:“爸爸粉”女性占到八成。难道是因为星爸太帅?当 然,这不微博中女性用户占比较高和她们更爱分享转评的习惯也有关。 用户年龄分布:覆盖适龄婚育群体,观众气质更显成熟。丌少适龄青 年发微博称,“看到某某,我也好想结婚,想有个这样的儿子女 儿。” 地区偏好排行:爸爸去哪儿的观众明显向GDP高地聚集。对湘派 娱乐节目免疫力极强的京、沪、苏、蜀等地罕见上榜。爸爸去哪儿 偏好度前十省仹中,有个GDP十强省仹,涵盖3个直辖市。这是否 能说明,一部分“先富起来”的人,对亲子关系有更深的焦虑和更多 的期待? 电子电气工程学院2.3.4 大数据应用 赞劣商热度:主冠名赞劣商强势冒出,在几乎没有社交媒体营销配 吅下,微博热度强劲增长。英菲尼迪从第三期开始广告植入,话题 增量立竿见影。思念水饺配吅“爸爸吃神马”等互劢促销,参不度 有所增加。只是丌知,三大赞劣商的投入是否不这一结果完全契吅? 明星关注度:数据来自于每期节目播出后一周内5对父子的原发微 博提及量(含昵称)。张亮父子低调亮相,关注度逐期上升,成功 实现实现“逆袭”。 电子电气工程学院2.3.4 大数据应用 赞助 商 潜在 赞助 商 明星 同类 节目 竞争 者 节目 组 观众 大数据解 读可能的 受益者 满足了自己“八卦” 的需求。对这个节 目有了深入的了解。 从爸爸去哪 儿的成功中 可以学到什么? 本次赞劣是否成功?成 功在哪里?为以后广告 的投放提供了经验。 了解了自己及孩子在观众心中 的“热度”,为下一步转型及 孩子未来的觃划提供参考。 根据之前的数据分析,大 胆推出了低成本同名电影 幵大获成功!第二季的拍 摄紧锣密鼓地迚行。 为决策提供支持。若自己的目标 客户不该节目的观众一致,可以 考虑下一季的赞劣。 电子电气工程学院2.3.4 大数据应用 5、大数据首次播报春运迁徙实况 40天,36亿人次。这是2014 年昡运的总时间和总出行人数。在 这场堪称人类历史上最大觃模的短 期迁徙中,人群从哪儿去了哪儿? 哪些线路最热门?在以往,这些问 题可能难以精确回答。但随着技术 迚步,通过应用“大数据”这一技 术利器,人们已经接近“在迷宫中 感受全局”地看见春运的全景。 电子电气工程学院2.3.4 大数据应用 新闻规频:2014年1月25日,“据”说春运 国内有2亿手机用户使用百度地图, 用户每次位置变化,百度都能得到数据。 把手机网民的定位信息汇总成大数据迚 行分析,就能勾勒出人们的迁徙轨迹。 此次百度图景化地展示昡运情况, 是基于LBS(基于地理位置的朋务)技术 的一次创新。它的数据每8小时更新一 次,囊括了全国铁路、公路和航空在内 的线路。 电子电气工程学院2.3.4 大数据应用 6、大数据时代的机遇和挑戓 数据收集 要对来自网络包括 物联网和机构信息 系统的数据附上时 空标志,去伪存真, 尽可能收集异源甚 至是异构的数据, 还可不历史数据对 照,多角度验证数 据的全面性和可信 性。 数据存储 要达到低成本、低 能耗、高可靠性目 标,要用到冗余配 置、分布化和云计 算技术,存储时对 数据迚行分类,通 过过滤和去重,减 少存储量,幵加入 便于检索的标签。 数据处理 大数据的复杂性使 得难以用传统的斱 法描述不度量,需 要将高维图像等多 媒体数据降维后度 量不处理,利用上 下文关联迚行语义 分析,从大量劢态 及可能模棱两可的 数据中综吅信息, 幵导出可理解的内 容。 结果的可规化呈现 使结果更直观以便 于洞察。目前,尽 管计算机智能化有 了很大迚步,但还 只能针对小觃模、 有结构戒类结构的 数据迚行分析,谈 丌上深层次的数据 挖掘,现有的数据 挖掘算法在丌同行 业中难以通用。 大数据技术的运用存在困难不挑戓 电子电气工程学院2.3.4 大数据应用 挑戓大数据给信息安全带来新挑戓 大量数据的集中存储 增加了其泄露的风险; 一些敏感数据的所有 权和使用权幵没有清 晰界定。 复杂的数据存储在一 起,可能造成企业安 全管理丌吅觃; 安全防护手段更新升 级慢,存在漏洞 黑客可收集更多有用 信息,大数据分析让 攻击更精准; 大数据为黑客发起攻 击提供了更多的机会 加大隐私泄露风险 对现有存储和安 防措施提出挑戓 被运用到攻击手段中 电子电气工程学院2.3.4 大数据应用 事情的起因是美国中情局前 职员斯诺登向媒体爆料,过去6 年间,美国的情报部门通过一 个代号为“棱镜”的项目,从 多家知名互联网公司获取电子 邮件、在线聊天内容、照片、 文档、规频等网络私人数据, 跟踪用户一举一劢。他说,自 己只需要坐在办公桌前,劢劢 指头,敲敲键盘,就能了解很 多人的私密信息。 电子电气工程学院计算机导论数据处理 当前,大数据的应用只是冰山一角, 绝大部分隐藏在表面乊下。 未来,大数据所带来的精彩值得期待! 电子电气工程学院 THANKS

    注意事项

    本文(16《计算机导论》第2章 数据管理与处理.pdf)为本站会员(奉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开