谁说菜鸟不会数据分析--整理概括版本(14页).doc
-
资源ID:37800813
资源大小:216KB
全文页数:14页
- 资源格式: DOC
下载积分:15金币
快捷下载
![游客一键下载](/images/hot.gif)
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
谁说菜鸟不会数据分析--整理概括版本(14页).doc
-谁说菜鸟不会数据分析-整理概括版本-第 14 页数据分析的三大作用一、 现状分析简单来说告诉你过去发生了什么第一:告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明整体经营是好还是坏,以及好坏的程度。第二:告诉你企业各项业务的构成,让你了解企业各项业务的发展及变动情况,对企业运营情况有更深入的了解。二、 原因分析简单来说告诉你某一现状为什么发生。运营情况具体好在哪里,差在哪里。三、 预测分析将来会发生什么对企业的未来发展趋势作出预测,一般通过专题分析来完成的,通常在制定企业季度、年度等计划时进行的,其开展的频率没有现状分析及原因分析高。数据分析六部曲一、 明确分析目的和思路1、 明确分析目的(为什么开展数据分析?通过这次数据分析我要解决什么问题?等等)2、 确定分析思路(如何具体开展数据分析,需要从那几个角度进行分析,采用那些分析指标。要知道先分析什么,后分析什么,使得各个分析点之间有逻辑关系。通俗来说以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保分析维度的完整性,分析结果的有效性及正确性。营销理论模型有4p、用户使用行为、stp理论、swot等,管理方面理论pest、5w2h、时间管理、生命周期)3、 数据分析方法论(指数据分析思路比如从哪几方面开展数据分析?各方面包含什么内容和指标?是数据分析的前期规划,指导着后期数据分析工作的开展。与数据分析方法不同,前者是宏观角度分析的,后者是从微观角度分析的包括对比分析、交叉分析等等方法。)常用的方法论有:PEST(是指影响一切行业和企业的各种宏观力量。一般应对的是政治、经济、技术、社会);5W2H(何因、何事、何人、何时、何地、如何做、何价);逻辑树分析法(将问题的所有子问题分层罗列,从最高层开始,并逐步向下拓展。遵循3个原则:要素化;把相同问题总结归纳成要素,框架化:将各个要素组织成框架,遵守不重不漏的原则,关联化;框架内的各要保持必要的相互关系,简单而不孤立);4P营销理论(四要素:产品(有形产品、服务、人员、组织、观念和它们的组合)、价格(基本价格、折扣价格、支付期限。影响定价因素:需求、成本、竞争)、渠道、促销(促销组合:广告、宣传推广、人员推销、销售促进)用户行为理论(指用户为获取、使用物品或服务所采取的各种行动,用户对产品首先有一个认知、熟悉的过程、然后试用,再决定是否继续消费使用,最后成为忠诚用户。)二、 数据收集数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。一般数据来源主要有以下几种方式:数据库(公司自身数据库)、公开出版物(中国统计年鉴)、互联网(搜索引擎)、市场调查(专门的调查)三、 数据处理数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对问题有价值、有意义的数据。数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。1. 数据清洗找出重复数据(函数法、高级筛选法、条件格式法、数据表透视法)删除重复数据(菜单删除重复选项、通过排序删除重复选项、筛选删除重复选项)缺失数据处理(缺失值接受标准10%以下):定位输入(查找):开始-编辑-定位条件-空白-确定处理方法(四种):样本统计量值替代缺失值(常用平均值) 统计模型计算的值替代(回归模型、判别模型) 将缺失数据删除(样本量减少) 将缺失数据记录保留,仅在相应的分析中做必要的排除检查数据逻辑错误(利用IF函数检查错误、利用条件格式标记错误:OR,AND)2. 数据加工数据抽取:保留元数据表中某些字段的部分信息,组合成一个新字段。(字段分裂:菜单法.数据-数据工具-分裂 其他选项按自己需求填写 函数法.LEFT&RIAHT;字段合并,字段匹配)数据计算:简单计算(加减乘除)、函数计算(sum、average等)、3. 数据分组:(VLOOKUP)4. 数据转换数据表的行列互换(开始-剪贴板-粘贴-选择性粘贴-对话框里面的转置)5. 数据抽样使用RAND四、 数据分析数据分析是指用适当的分析方法及工具,对处理过的数据进行分析;提取有价值的信息,形成有效结论的过程。数据处理是数据分析的基础,通过数据处理,将收集到的原始数据转化为可以分析的形式,并且保证数据的一致性和有效性。数据挖掘是一种高级的数据分析方法。数据挖掘是人们长期对数据库技术进行研究开发的结果。数据挖掘侧重解决四类数据问题:分析、聚类、关联和预测,重点需找模式和规律。数据分析方法三大作用:现状分析(对比)、原因分析(细分)、预测分析(预测)1.对比分析法:将两个或两个以上的数据进行比较,分析差异,从而揭示数据所代表的事物发展情况和规律性。可分为静态比较(同一时间条件下对不同总体指标的比较如不同部门、不同地区、不同国家的比较,也叫做横向比较),动态比较(在同意总体条件下对不同时期指标数值的比较,也叫纵向比较)。在实践运用中,与目标对比,不同时期对比,同级部门、单位、地区对比,行内对比,活动效果对比。进行对比应该注意到以下几点因素:指标的口径范围、计算方法、计量单位必须一致;对比对象的可比性,对比对象之间相似处越多越具有可比性;对比的指标类型必须一致。2.分组分析法:把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律。步骤:确定数组、确定各组的组距、根据组距大小,对数据进行分组整理,划归至相应组内。3.结构分析法:总体内各部分占总体的比例属于相对指标。一般来说,某部分的比例越大,说明其重要程度越高,对总体的影响越大。4.平均分析法:运用计算平均的方法来反应总体在一定时间、地点条件下某一数量特征的一般水平。平均指标可用于某一同一现象在不同地区、不同部门、不同类型部门、不同时间。有两特点,一是如上,二是某些现象在不同历史时期的变化,更能说明发展趋势和规律。5.交叉分析法:通常用于两个变量之间的关系即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量值成为不同变量的交叉节点,形成交叉表,从而分析交叉表中变量之间的关系。如二维表6.综合评价分析法:人们通过对实践活动的总结,逐步形成了一系列多个指标对多个参评单位进行评价的方法。步骤:1)确定综合评价指标体系2)收集数据3)确定指标体系中各指标的权重,以保证评价的科学性4)对经处理后的指标在进行再进行汇总计算出综合评价指数或综合评价分值5)根据评价指数或分值对参评单位进行排序,并由此得出结论。三大特点:通过一系列特殊方法将多个指标同时完成,要根据指标的重要性进行加权处理,以指数或分值表示参评单位综合状况的的排序。权重确定的方法:专家访谈法、德尔菲法、层次分析法、主成分分析法、因子分析法、回归分析法、目标优化矩阵表7.杜邦分析法:利用主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方法。8.漏斗图分析法:适合业务流程比较规范、周期比较长、各流程环节涉及复杂业务过程比较多的管理分析工具。9.矩阵关联分析法:指根据事物的两个重要属性作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。目标优化矩阵表:把人脑的模糊思维简化为计算机的1/0式逻辑模式研究方向数据分析方法产品研究相关分析、对应分析、判别分析、结合分析、多为尺度分析等品牌研究相关分析、聚类分析、判别分析、因子分析、对应分析、多为尺度分析等价格研究相关分析、PSM价格分析等市场细分聚类分析、判别分析、因子分析、对应分析、多为尺度分析、logistic回归、决策树等满意度研究相关分析、回归分析、主成分分析、因子分析、结构方程等用户研究相关分析、聚类分析、判别分析、因子分析、对应分析、logistic回归、决策树、关联规则等预测决策回归分析、决策树、神经网络、时间序列、logistic回归等数据分析工具:数据透视表五、 数据展现一般情况下,数据是通过表格和图形方法来呈现的。图形的种类很多。(能用图说明问题的就不用表格,能用表格说明问题的就不用文字。)通过关系选择图表:成分(用于表示整体的一部分,饼图、柱形图、条形图、瀑布图)、排序(比较大小进行排列)、时间序列(表示某事按照一定的时间顺序发展的走势、趋势)、频率分布(用于表示各项目、类别间的比较)、相关性(用于衡量两大类中各项目间的关系)、多重数据比较(数据类型多于2个的数据分析比较)要表达的数据和信息饼图柱形图条形图折线图气泡图其他(雷达图、散点图、表格)成分整体一部分111百分比堆积图排序数据间比较111帕累托图时间序列走势、趋势11面积图频率分布数据频次111相关性数据间关系111散点图多重数据比较雷达图(1表示已被选中)图标制作五步法:1.确定所要表达的主体或目的 2.确定哪种图表适合你的目的3.选择数据制作图表 4.检查是否有效的展示数据5.检查是否表达了你的观点表格注意事项1. 突出单元格(用特殊背景,颜色突出个别项:开始-样式-条件格式-突出显示单元格规则)2. 项目选取(与上不同的是指定的规则不同,突出显示的单元格的规则指定值是与原始数据相关的数据同上所选)3. 数据条(数据条越长,表示数值越大.)4. 图标集(对数据进行注释,并可以按照临界值,将数据分为3-5个类别)5. 迷你图(可提供对数据的形象表示)图表换装1. 平均线图(在原来的柱形图或折线图的基础上,添加一条平均线或则标准线。先列出数据与平均数据,选取所给的数据做柱形图,选柱形图中的“平均值”的任一条柱,右击选“更改系列图表类型”把柱形图改为折线图不带数据标记)2. 双坐标图(图中有两个及其以上数据,并且他们的量纲不同或者数据差别很大,在一纵坐标下就无法很好的展现原数据的面貌,做法同上只不过要带数据标记)3. 竖形折线图(主要用来展示产品功能、品牌形象等在消费者心中的评价)4. 瀑布图(第n个占位数据的大小=(总成本-(成本1+成本2+成本3+.成本n)5. 帕累托图(又叫排列图,主次图;)6. 旋风图(同一事物在某个活动、行为影响前后不同指标的变化;在指标a变化下,指标b影响也随之变化,具有因果关系;两个类别之间不同指标的比较,如某班男女同学成绩的比较)7. 人口金字塔图(专门用来反应人口过去、现在、未来的发展情况)8. 漏斗图9. 矩阵图(散点图)10. 发展矩阵图11. 改进难易矩阵(气泡图)(以上图形做法百度便可)美化图表1. 别让图表犯错(标题、图例、单位、脚注、资料来源)2. 制作图表的规则避免生出无意义的图表(作图表与否标准:能否帮助你有效表达信息)避免信息量过大(一张图表反应一个观点,才能突出重点)基本院原则:简约,标题要有吸引力图形的注意事项:1. 饼图(把数据从12点钟的位置开始排列最重要成分靠近12点钟的位置,数据项5个以内,不要使用饼图分离,不要使用图例;数据超过5项使用复合饼图)2. 柱形图(同一数据序列使用相同的颜色,不要使用倾斜的标签,别让读者歪着脑袋看)3. 条形图(同一序列使用相同的颜色,尽量让数据由大到小排序,方便阅读,不使用倾斜的标签,最好添加数据标签)4. 折线图(折线的线型要相对粗些要有突出的感觉,线条一般不超过5条若过多可以分开作图表,不使用倾斜的标签,纵坐标从0一般开始)图表会说谎虚张声势的增长(对增长比较平缓的图形进行拉伸)3D效果的伪装(3D效果的图表让人理解起来困难重重,使得图表显得拖沓繁沉)一维图形的障眼法(使用图形的大小来表示增长)图表美化三原则1. 简约(简明扼要、清晰明了)2. 整洁(整整齐齐、干干净净、和谐自然)3. 对比(是指突出某些重要,帮助读者迅速抓住信息)美化图标的技巧1.最大化数据墨水比(图表中的每一滴墨水都要有存在的理由即尽量减少和弱化非数据元素网格线、坐标轴、填充色等与数据源有关,增强和突出数据元素曲线、条形、扇形等与数据源无关)步骤:1.去掉不必要的背景填充色2.去掉无意义的颜色分类3.去掉装饰性的渐变性4.去掉网格线、边框5.删掉不必要的图例6.去掉不必要的坐标轴7.去掉装饰行的图片8.以上不能去掉的元素要尽量淡化9.对需强调的数据元素进行突出标识2.找出隐形的线(注意图表中元素的位置,应找出能够与之对齐的元素)图表喜欢的数字格式(数据标签很多时,可考虑改成Arial字体)4. 如何突出对比(使用醒目的颜色、直线、箭头、阴影将元素突出,切记对比的目的:让读者快速地领悟重要信息,其次才是吸引读者的眼球,调动他们的兴趣)图表的配色方案主色配色红色白色、黑色、蓝灰色、米色、灰色咖啡色米色、鹅黄、转红、蓝绿色、黑色黄色紫色、蓝色、白色、咖啡色、黑色绿色白色、米色、黑色、暗紫色、灰棕色蓝色白色、粉蓝色、酱红色、金色、银色、橄榄绿、橙色、黄色 制作属于自己的模板,快速作图f11键,添加小工具jwalk chart tools 通过加载宏来加载,这个工具需另外下载;修剪超大值六、 报告撰写数据分析报告是对整个数据分析过程的一个总结和呈现。通过报告,把数据分析的起因、过程、及结果完整的呈现出来,提供决策者参考。好的分析报告一定要有建议或解决方案。初识分析报告1. 写作原则:规范性(名词术语规范前后一致,与行内公认的术语一致)、重要性(体现数据分析的重点,重点选取关键指标,按重要性的高低来分级阐述)、谨慎性(基础数据必须真实、完整,内容实事求是)、创新性(各种新的研究模型或数据分析方法)2.报告的作用:展示分析结果、验证分析质量(对整个数据分析项目的一个总结)、提供决策参考3.报告的种类:专题分析报告(对社会经济现象的某一个方面或某个问题进行专门研究的一种数据分析报告,作用为决策者制定某项政策、解决某个问题提供决策参考和依据;特点:单一性,主要针对某一方面或问题进行分析,不要求反映事物的全貌;深入性,主要针对问题深入,对问题进行具体描述,对引起的问题的原因进行分析,并提出可行的解决方案的)综合分析报告(全面评价一个地区、单位、部门业务或其他发展方面例如世界人口发展报告;特点:全面性,综合分析报告反映的对象,全面反映对象的各个方面的情况;联系性,要把一些相互关联的一些现象、问题综合起来进行全面系统的分析,联系的重点比例关系和平衡关系,分析他们的发展是否协调,是否适应。)、日常数据通报(以定期数据分析报表为依据,反映计划执行情况,并分析其影响和形成原因,一般是按日月季年等时间阶段进行;特点:进度性,必须把计划执行的进度与时间的进展结合起来分析,观察两者是否一样,从而判断计划完成的好坏,需要计算一些绝对数和相对数指标来突出进度;规范性,反应计划的基本情况,分析完成或未完成的原因,总结计划执行中的成绩和经验,找出存在的问题,提出措施和建议;时效性,有日常数据通报的性质和任务决定,是时效性最强的一种)数据分析报告的结构按照总分总的结构结构开篇包括标题页、目录和前言(主要包括分析背景、目的与思路);正文包括具体分析过程与结果;结尾部分包括结论、建议及附录标题页:题目要精简干练,要求在一两行内完成;常用类型:解释基本观点,点名数据分析报告的基本观点不可忽视高价值客户的保有;概括主要内容,重在叙述数据反映的基本事实我司销售额比去年增长30%;交代分析主题,这类反映分析的对象、范围、时间、内容等情况,并不点明分析师的看法和主张2014年运营报告;提出问题,以设问的方式提出报告所要分析的问题所在,引起读者的注意和思考。制作要求:直接,不可含糊,开门见山的表达基本观点;确切,做到文题相符,宽窄适度;简洁反应报告的主要内容和基本精神,高度的概括性;标题的艺术性 目录:相当于数据分析大纲,体现报告的分析思路,不能过于详细一、 分析背景与目的二、 分析思路三、 分析正文1.2.四、总结与建议 前言: 分析背景(为何要开展此次分析?有何意义?) 分析目的(通过此次分析要解决什么问题?达到何种目的?) 分析思路(如何开展此次分析?主要通过哪几方面开展?) 正文:系统全面的表述数据分析的过程与结果;特点如下: 是报告最长的部分 包含所有数据分析的事实与观点 通过数据图表和相关的文字结合分析 正文各部分具有逻辑关系 结论与建议:结论是以分析结果为依据得出的分析结果,以综述性文字来说明,结合公司实际业务,经过综合分析、逻辑推理形成的总体论点;建议对企业或业务所存在的问题提出的解决方案,主要关注在保持优势及改进劣势等方面 附录:提供正文中涉及而未予阐述的有关资料,有时也包含证问题及的资料,包括涉及的专有名词解释、计算方法、重要原始数据、地图等内容,每个内容都要编号。 撰写报告的注意事项: 结构合理,逻辑清晰;实事求是,反应真实;用词准确,避免含糊;篇幅适宜,简洁有效;结合业务,分析合理数据分析的三大误区1、 分析目的不明确,为分析而分析数据分析应该围绕自己的分析目的(了解现状、找出业务变动原因、预测发展等)而分析。2、 缺乏业务知识,分析结果偏离实际对业务的理解相对较浅,对数据分析偏重于数据分析方法的使用,如回归分析、相关分析,分析忽视了业务逻辑上的关联性,得不到全面、综合性的结论。懂营销,懂管理,懂策略。3、 以为追求使用高级分析方法,热衷研究模型高级的数据分析方法不一定是最好的,能够简单有效解决问题的方法才是最好的。仅有分析模型远远不够,围绕业务发现问题并解决问题的才是数据分析的最终目的。数据分析师的职业要求一、 懂业务熟悉行业知识、公司业务及流程二、 懂管理是搭建数据分析框架的要求,还是针对数据分析结论提出有指导意义的分析建议三、 懂分析掌握数据分析的基本原理与一些有效的数据分析方法(基本的数据分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等)四、 懂工具Excel、access、spss、SAS,建议先学好Excel五、 懂设计运用图表有效表达数据分析师的分析观点数据分析师的基本素质1、 态度严谨负责2、 好奇心强3、 逻辑思维清晰4、 擅长模仿学习5、 勇于创新几个常用指标和术语1. 平均数 2.绝对数与相对数 3.百分比和百分点 4.频数和频率 5.比例和比率6.倍数和番数 7.同比和环比 数据分析三字经1. 学习:先了解,后深入:先记录,后记忆;先理论,后实践;先模仿,后创新2. 方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手3. 分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议数据类型字符型数据 数值型数据数据表的设计要求1. 数据表由标题行和数据部分组成2. 第一行是表的列标题(字段名),列标题不能重复3. 第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许 出现空白列4. 数据表中不能含有合并单元格存在5. 数据表与其他数据之间留出至少一个空白行和一个空白列6. 数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应该将二维表转化为一维表的形式存储数据(Excel中将二维数据表转化为一维数据表,需要“添加功能选项”“数据透视表和数据透视图向导”)数据来源导入外部数据:文本和网站数据来源问卷录入要求:(调查问卷常用的类型:单选、多选、排序、开放性文字题)数值题(直接录入数据即可) 单选题(答案唯一,用1234替代ABCD)多选题(二分法:把每一个相应选项定义为一个变量,若一个变量有被选到则填上1,否则填上0;多重分类法:定义录入的数值A1.根据限选的项数确定输入变量个数,选A则填1)排序题(定义对应变量A1.,然后按照被调查者填写的顺序录入选项)开放性文字题(如果答案可以进行归类,侧进行归类,若不可以则要概括填写)数据分析主要有三大作用:现状分析:告诉我们过去发生了什么。原因分析:告诉我们为什么发生。预测分析:告诉我们将来会发生什么。运营分析部的主要职责如下:1、负责完成运营日报、周报、月报等日常通报,告诉公司领导及运营部门现阶段公司整体运营情况,这是通过各个关键经营指标完成情况来衡量的。2、根据公司运营需要,开阵业务专题分析。比如基于日报、周报、月报的现状分析,我们对公司的运营情况由了基本了解,但是这还不够,还需要知道运营情况具体好在哪里,差在哪里,是什么原因引起的。这时就需要开展原因分析,以进一步确定业务变动的具体原因。3、根据公司运营需要,开展市场研究工作。如果现有数据无法满足分析要求,就需要通过外部用户调研进行补充说明,我们才能进一步了解用户的真实想法与需求。4、开展预测分析,预测公司未来发展趋势,为公司制订运营目标及策略提供有效的决策依据,以保证公司的可持续健康发展。5、搭建公司经营分析体系,指导公司业务运营。数据分析师“神马”数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析的目的是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析:描述性-探索性-验证性初级数据分析:对比分析法、平均分析法、交叉分析法高级数据分析:相关分析、因子分析、回归分析数据分析师如此抢手的原因何在呢?一个简单的原因就是社会越发达,人们对数据的依赖就越多。无论政府还是公司运营,科学研究还是媒体宣传,都需要数据支持。那么,对数据有如此大的以来,就必然导致对数据分析的大量需求。因此,将数据转化为知识、结论和规律,就是数据分析的作用和价值。数据分析的重点-数据“供应链”1、将数据与实际业务进行结合,深入了解业务背景,明确需求。2、将数据信息化、可视化3、转化为生产力,帮助企业获利。数据分析师的想法?1、数据变化的背后真相是什么?2、从哪些角度分析数据才系统?3、用什么分析方法最有效?4、图表是否表达出有效的效果?5、数据分析的目的达到了么?6、数据分析报告有说服力么?数据分析师的基本素质1、态度严谨负责2、好奇心强烈3、逻辑思维清晰-有条理,有目的,不可以眉毛胡子一把抓,不分主次。4、擅长模仿-模仿主要是参考他人优秀的分析思路和方法。但不能一直在模仿,从未超越。5、勇于创新数据分析的六部曲:明确目的-数据收集-数据处理-数据分析-数据展现-报告撰写常用的指标或术语:1、平均数2、相对数与绝对数3、百分比与百分点4、频数与频率5、比例与比率6、倍数与番数7、同比与环比数据处理原则:“三心二意”处理数据信心、细心、平常心、诚意、合老板意信心:什么是信息?信息是指未看见任何未来时,你依然怀抱希望,坚持下去。细心:1%的错误=100%的失败合老板意:第一,老板永远是对的;读谁说菜鸟不会数据分析有感资讯部 陈罗东一提到数据分析很多人就望而却步,无法迈入经常有朋友问:数据分析应该怎么去做?有什么快捷的分析技巧?而最近我们读了一本“谁说菜鸟不会数据分析”从中了解了海量数据分析方法和技巧,本书基于通用的工具EXCEL,加上必知必会的数据分析概念,然后采用通俗易懂的讲解方式,全书共分为8章,以对话问答的形式故事化的情境设计来讲解完成,让读者更有一口气读下去的兴致。下面就由我来讲述一下对本书的一些感想。 第1章 数据分析那些事儿数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它他加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信和形成结论而对数据加以详细研究和概括总结的过程。主要讲述了所谓数据分析,菜鸟与数据分析师的区别,对数据分析产生的好奇心,数据分析应该做到怎么样的流程,数据分析前应该有那些准备。从中的数据分析六步曲,首先明确分析目的和内容,然后是数据收集,数据处理,分析,展现,最后撰写数据分析报告,还有数据分析中经常用到的几个术语,平均数绝对数与相对数,百分比,比例等这些采用图形来分类讲述数据分析结果容易出现的错误,这些数据分析流程很值得我们去学习和运用。第2章 无米难为巧妇数据准备当我们做某件事情时都首先要了解做这一件事情前我们要准备些什么,事情的经过及事情的结果,相同数据分析也必须先要有数据,从一开始的数据收集、数据处理、数据分析都离不开数据。所以要想数据能达到更效的说服力数据前期准备是相当重要。了解数据最基本于EXCEL,主要有四种方法,如菜单操作、函数、图表和宏,以及常用的快捷键。通过简单的工具对数据事先分类汇总处理。在这里我们还要了解到数据的来源,其主要有两种:导入外部数据和自己录入数据。自己录入数据为我们提供了四种很好的方法让我们输入时更准确更省时。第3章 三心二意数据处理 数据处理无疑就是对一些数据作增加删除,以及无效数据的筛选,分析数据的可用性及真实性,使得出来的数据具有一的说服力,这是我没读这本书时的个人理解。今天使我对数据处理又有了一种不同的看法,数据的采集、存储、检索、加工、变换和传输。数据是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据的形式可以是数字、文字、图形或声音等。从这标题“三心二意”就很好理解,做数据处理我们要做到:有信心、细心、平常心、诚意、合老板意,以及处理中的步骤和技巧。数据处理或许就是像我们平常所说的在鸡蛋里挑骨头,在数据里查找替换、数据排序、筛选、函数运算等都是我们在数据处理中必不可少的,通过本章阅读更了数据抽取、数据计算、数据分组和数据转换四大数据加工技巧。第4章 工欲善其事必先利其器数据分析分析数据是将收集的数据通过加工、整理和分析、使其转化为信息,在这里我常常错误的将数据分析方法和数据分析法论为一谈。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。数据分析我们可以从对比分析、分组分析、结构分析、平均分析、交叉分析、综合评价分析、漏斗图分析、矩阵关联分析等数据分析法,其中我们常常用到的就是EXCEL数据分析工具数据透视表,其通过一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。第5章 给数据量体裁衣数据展现 最深体会一句话:让老板在30秒钟内读懂你的数据,确确实实如此,职员在工作当中每一项工作内容也不过和数据一样,不同内容用不同方法处理,数据处理用案例图形来说话。 根据不同类型数据来选择图表表述,最记得我们初学EXCEL入门时运用的饼图、柱形图、条形图、折线图等来做数据,在这里我更看到了竖形折线图、瀑布图、帕累托图、旋风图、人口金字塔图等图表分析技巧。所以真不能小看平时小小的数据它后面是隐藏了多少的技巧与方法,真是有一种:让数据来说话的感觉。第6章 专业化生存图表可以更美的 专业化生存就给我一种吸引力,因为专业这个词已经逐渐成了评价一个人工作水平的标准。图表只是为了证明一个观点及事实而存面的,如果使图表变成一幅精致美观令人赏心悦目的图表才让人有更想看它的欲望,给人深刻印象。而这就更需要我们要掌握数据的准确性又要有能让人想看的那种吸引的专业技巧。 掌握了专业图表的制作技巧,如何存图表模板、快速制图、添加数据系列的两种快捷方式、用Jwalk chart tools添加数据标签、知能照相机等技巧。第7章 专业的报告休现你的职场价值数据分析报告是通过对项目数据全方位的科学分析来评估项目的可行性,为投资方决策项目提供科学、严谨的依据,了解事物、掌握信息、为决策者提供科学、严谨的依据,降低风险。讲述数据分板报告的分类,如专题分析报告、综合分析报告、日常数据分析通报三种类型各有各的特点。分析报告的结构格式组成,报告标题、目录、前言、正文、结论与建议、附录等六大组成,撰写报告时的注意事项追求数据真实性。撰写报告时的五大注意事项在此值得一提:第一,合理的结构以及清晰的逻辑;第二,实事求是,反映真相;第三,用词准确,避免含糊;第四,篇幅适宜,简洁有效;第五,结合具体业务进行合理的分析。第8章 数据分析技能持续提升 数据分析可以通过软件工具让你的数据更具有直观性,数据分析软件有Mind Manager,Ultraedit和Maple等。这些软件功能强大,可满足科技工作中的许多需要,但使用这些软件需要一定的计算机编程知识和矩阵知识,并熟悉其中大量的函数和命令。而使用Origin就像使用Excel和Word那样简单,只需点击鼠标,选择菜单命令就可以完成大部分工作,获得满意的结果。 但它又比excel要强大些。一般日常的话可以用Excel,然后加载宏,里面有一些分析工具等。第一通过读谁说菜鸟不会数据分析我收获了清晰的数据分析流程。从新认识了数据分析流程,数据分析是一个完整的流程。正如书中的逻辑,数据分析时由数据收集、数据处理、数据分析、数据展现及数据分析的报告撰写等环节构成。而这些环节环环相扣,每一环节都必须注意其中的细节。这本书按照数据分析的流程来介绍数据分析,对刚开始接触数据分析的我来说,帮助无疑是很大的。通读本书,使我对数据分析的整体有了深刻而全局的认识。第二通过读本还收获了职场经验和职场技能。书中以故事对白的形式介绍数据分析。阅读的时候,读者可以根据自己的数据分析水平来选择Mr林或者小白作为自己的角色,从而给人一种置身职场的感觉。对于我来说,小白就是我阅读时的角色。故事中小白的虚心好学,这无疑是职场新手应该具备的素质。另外,以小白作为角色,用一种学习的态度去掌握数据分析技能,从而提高职场技能。对于即将踏入职场的我,感受最深的的是图表呈现、数据分析报告的撰写以及excel的一些函数和公式的应用。这些技能将对我带来很大的帮助。第三还收获了数据图表的使用原则及方法。做论文的时候,作为初学者一般会犯这样的错误:把数据分析的结果都呈现到文章中去。菜鸟多处强调了图表的使用应该以简约为原则,并且要以观点为导向,及图表应该为观点阐述服务。虽然在别的书也看过这些警示,而这本书不但给出警示,还教我们怎样做到简约。以上简要总结了三点收获,其实从这本书所收获的知识还不止这三点,比如还收获了许多学习数据分析的网站、博客、名人等,收获了ppt的一些展示原则以及颜色搭配的知识等。谁说菜鸟不会数据分析是一本详细、信息丰富,适合数据分析入门者阅读的好书。