专题二:数据处理与人工智能 复习课件--高中信息技术浙教版(2019)必修1.pptx
《专题二:数据处理与人工智能 复习课件--高中信息技术浙教版(2019)必修1.pptx》由会员分享,可在线阅读,更多相关《专题二:数据处理与人工智能 复习课件--高中信息技术浙教版(2019)必修1.pptx(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据处理必修一:数据与计算(一轮复习)必修一:数据与计算(一轮复习)表格表格数据处理数据处理常见常见数据问题及解决方法数据问题及解决方法数据缺失:忽略或采用平均值、中间值或概率统计值填充数据重复:进一步审核的基础上进行合并或删除数据异常数据不符合一般规律:这些有可能是要去掉的噪声,也有可能是含有重要信息的数据对象逻辑错误与实际不符,违背逻辑或规则:对应的字段需要设置取值范围判断格式不一致:将不同格式的数据转换成统一格式后再进行处理数据计算数据计算数据计算数据计算 (1)如图1所示,区域 G4:G14 的数据是通过排名函数RANK 计算得到,在 G4 中输入公式_,再利用自动填充完成 G5:G1
2、4 的计算。(2)对图1中浙江省各地市数据按“十年增幅”为关键字进行降序排序,则排序的数据区域是_。=RANK(F4,F$4:F$14)A4:G14数据计算数据计算数据计算数据计算 (3)对 A4:G15 中的数据进行两次筛选操作,首先对“十年增量”列进行筛选,筛选条件如图2所示;再对“城市”列筛选,筛选条件如图3所示,则筛选出的行数为 _1数据计算数据计算(4)根据图1中数据制作了反应各地区人口情况的图表,如图2所示,创建图表的数据区域是_。B4:D14图表呈现图表呈现图表类型适合展现数据关系柱形图大小关系折线图变化趋势饼图数据构成百分比雷达图多项指标比较散点图变量之间的联系气泡图变量之间的
3、关系大数据处理大数据处理大数据特点与大数据思维大数据特点与大数据思维大数据特点(4V):数据体量大(Volume)类型多(Variety)速度快(Velocity):产生速度快 处理速度快价值密度低(Value)大数据思维:分析全体数据,而不是抽样数据不追求数据的精确性,而能够接受数据的混杂型不强调对因果关系的探求,而更加注重相关性大数据大数据大数据处理大数据处理静态数据静态数据批处理Hadoop、Spark图数据图数据图计算Pregel、GraphX流数据流数据流计算Storm、Heron大数据处理思想大数据处理思想大数据处理思想“分治思想”。即将一个复杂的问题拆分成两个或多个相同或相似的子
4、问题,找到求这几个问题的解法之后,把它们组合成求整个问题的解法。分解、解决、合并大数据处理框架大数据处理框架静态数据静态数据批处理批处理在处理时已经收集完成、在计算时不会发生改变的数据。Hbase(数据存储与管理)数据以文件的形式、用多副本保存在不同的存储节点中,并进行分布式管理。HDFS用于云盘、网盘的底层。采用基于列的存储方式,用于存储半结构化和非结构化数据,具有良好的横向扩展能力。静态数据静态数据批处理批处理在处理时已经收集完成、在计算时不会发生改变的数据。Hbase(数据存储与管理)静态数据批处理软件:Hadoop、Spark流流数据数据流计算流计算不间断地、持续地到达的实时数据。流数
5、据的价值会随着时间 的流逝而降低。对采集的数据实时分析和计算并反馈实时结果。经处理系统处理完成的数据流直接丢弃或存储用户可以实时查询最新数据分析结果,数据不断更新,实时推荐给用户流计算应用:广告推送、个性化推荐、实时交通流计算软件:Storm、Streams、S4、Puma流流数据与传统数据区别数据与传统数据区别流处理系统和传统的数据处理系统的区别:1、流处理系统处理的是实时的数据,而传统的数据处理系统处理的是预先存储好的静态数据。2、用户通过流处理系统获取的一般是实时结果,而传统的数据处理方式获取的都是过去某一个历史时刻的快照。3、流处理系统会实时地把生成的结果不断的推动给用户,传统数据需要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术精品资料 电脑知识资料 信息技术课件
限制150内