欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    【R语言入门】从R、RStudio安装到 条形图、折线图、散点图 等的图形绘制【建议收藏】-精品文档资料整理.docx

    • 资源ID:73281610       资源大小:24.62KB        全文页数:26页
    • 资源格式: DOCX        下载积分:14.8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要14.8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    【R语言入门】从R、RStudio安装到 条形图、折线图、散点图 等的图形绘制【建议收藏】-精品文档资料整理.docx

    【R语言入门】从R、RStudio安装到 条形图、折线图、散点图 等的图形绘制【建议收藏】 最近博主在完成一项R语言绘图的课程作业 就想着造福一下R语言零根底的同学们 从零根底的安装到导包到最终的各种类型的图形绘制 不可谓最好 但可谓很全。非常合适新手小白使用。本教程肝了两夜 期末降临 时间紧张 共两万五千字 真心不易 建议三连 建议珍藏 一、【R语言入门】安装R以及Rstuido软件 R语言是用于统计分析 图形表示以及报告的编程语言以及软件环境 Rstudio是编辑、运行R语言的最为理想的工具之一。 1、R安装包 1.1、直接下载博主我的安装包资源 亲测平安有效 1.2、官网下载R安装包 下载地址为 s:/cran.r-project.org 进入链接 如下列图所示 在页面顶部提供了三个下载链接 分别对应三种操作系统 Windows、Mac以及Linux。请选择自己操作系统对应的链接 接下来我将以windows为例给大众展示安装经过。 接下来单击【Download R for Windows】 【base】 【Download R 3.3.1 for Windows】 即可下载相应安装包。 单击base 进入下面页面 点击【Download R 3.5.1 for Windows】 2、安装R 下载完R安装包 我下的按转包名称为 “R-4.1.0-win.exe 之后双击开场安装 跟一般的软件安装一样 根据需要进展相关安装设置并不断点击下一步即可。 step1、选择安装位置 可改成自己的安装途径。 十分注意 安装目录一定要为英文 step2、安装组件 注意 根据自身电脑操作系统的位数选择 但64位系统可全选 因为64位向下兼容32位系统。 要想知道R语言的32位以及64位区别的请继续往下查看博客 step3、启动选项 step4、正在安装 step5、安装完成 并生成桌面快捷方式 下面是桌面快捷方式 分为32位以及64位 R i386为32位的 R x64为64位的。 step6、翻开R 双击两个快捷方式中任意一个即可翻开R的原生IDE 接下来就是大众所关心的R的32位与64位的区别啦 3.R的32位与64位的区别 提问 R既有32位版本也有64位版本。那么我们该选择使用哪个版本呢 答 除了32位操作系统不能安装64位版本以外 在大多数情况下 你可以任意选择。两个版本都使用32位整数 也就意味着 他们在数值计算时具有一样的数值精度。 两者的主要区别在于内存管理方面。64位的R使用了64位的指针 而32位的R使用的那么是32位指针。这意味着 64位的R可以使用以及搜索更大的内存空间。 从经历来看 32位版本的R要比64位版本的R更快 固然并不总是如此。但从另一角度来看 64位版本的R在处理更大型的文件以及数据集时所面临的内存管理问题更少。两个版本允许的最大向量长度都是20亿左右。 推荐 假如你的操作系统不支持64位程序 或你的计算机内存小于4GB 那么应该选择32位版本的R。假如操作系统支持64位版本的R 那么适用于windows系统以及Mac系统的R安装程序会自动安装两个版本的R。 4、下载RStudio安装包 4.1、直接下载博主我的安装包资源 亲测平安有效 4.2、官网下载 下载地址 :/ rstudio /ide 进入下载页面后 可以发现有Desktop以及Server两个版本 我们选择Desktop。 单击蓝色圆形图标 进入跳转到Desktop版本下载窗口 Desktop版本又分为两个版本 Open Source Edition 免费 以及Commercial License 付费 。 初学者自己用的话可选择前者 单击【 DOWNLOAD RSRUDIO DESKTOP】。 单击【DOWNLOAD RSRUDIO DESKTOP】后进入下载页面 根据自己电脑的操作系统选择下载的版本 因为我的操作系统是win7 所以我选择【RStudio 0.99.903-Windows Vista/7/8/10】 单击并下载得到【RStudio-0.99.903.exe】。 5、安装RStudio step1、双击【RStudio-0.99.903.exe】进展安装 step2、选择安装位置 可自行更改安装途径。 step3、正在安装 step4、安装完成 step5、IDE功能介绍 翻开RStudio之后 会出现上图所示的窗口 其中有三个独立的面板。最大的面板是控制台窗口 这是运行R代码以及查看输出结果的地方。也就是运行原生R时看到的控制台窗口。其他面板那么是RStudio所独有的。隐藏在这些面板中的包括一个文本编辑器、一个画图界面、一个代码调试窗口、一个文件管理窗口等。 注意 有的人可能会问 有了RStudio还需要下载R吗 即使使用RStudio 还是需要事先为计算机安装好R。RStudio只是辅助你使用R进展编辑的工具 它自身不附带R程序。 6、R语言环境安装 下载步骤 翻开 s:/cran.r-project.org/ step1 step2 step3 下载好软件以后 接着傻瓜式安装 双击图标 点击启动 用demo() 来看一些示范程序 用help() 来浏览在线帮助文件 或者用help.start() 通过HTML阅读器来看帮助文件。用q() 退出R. R语言的相关环境搭建至此已经全部准备完毕 接下来正式进入正题 二、【R语言入门】R语言绘图之ggplot2绘制条形直方图 2.1、什么是数据可视化 (What is Data Visualization?) Wiki says “Data visualization is the graphic representation of data. It involves producing images that communicate relationships among the represented data to viewers of the images. Wiki讲 “数据可视化是数据的图形表示。 它涉及制作图像 以将表示的数据之间的关系传达给图像的查看者。 2.2、R语言绘制频率直方图 频率直方图是数据统计中经常会用到的图形展示方式 同时在生物学分析中可以更好的展示表型性状的数据分布类型 R根底做图中的hist函数对单一数据的展示很方便 但是当遇到多组数据的时候就不如ggplot2绘制来的方便。 2.2.1、根底做图hist函数 hist(rnorm(200),col blue ,border yellow ,main ,xlab ) 2.2.1.1、多图展示 par(mfrow c(2,3)for (i in 1:6) hist(rnorm(200),border yellow ,col blue ,main ,xlab ) 2.2.2、ggplot2绘制 构造一组正态分布的数据 PH -data.frame(rnorm(300,75,5)names(PH) -c( PH )#显示数据head(PH)# PH# 1 72.64837# 2 67.10888# 3 89.34927# 4 75.70969# 6 82.85354 加载ggplot2作图包并绘图 library(ggplot2)library(gridExtra)p1 -ggplot(data PH,aes(PH) geom_histogram(color white ,fill gray60 ) #控制颜色ylab(label total number ) #修改Y轴标签 2.2.2.1、修改柱子之间的间隔 p2 -ggplot(data PH,aes(PH) geom_histogram(color white ,fill gray60 ,binwidth 3) 2.2.2.2、添加拟合曲线 p3 -ggplot(data PH,aes(PH,.density.) geom_histogram(color white ,fill gray60 ,binwidth 3) geom_line(stat density ) 2.2.2.3、修改线条的粗细 p4 -ggplot(data PH,aes(PH,.density.) geom_histogram(color white ,fill gray60 ,binwidth 3) geom_line(stat density ,size 1.5)grid.arrange(p1,p2,p3,p4) 2.2.2.4、绘制密度曲线 p1 -ggplot(data PH,aes(PH,.density.) geom_density(size 1.5) 2.2.2.5、修改线条款式 p2 -ggplot(data PH,aes(PH,.density.) geom_density(size 1.5,linetype 2)p3 -ggplot(data PH,aes(PH,.density.) geom_density(size 1.5,linetype 5) 2.2.2.6、修改颜色 p4 -ggplot(data PH,aes(PH,.density.) geom_density(size 1.5,linetype 2,colour red )grid.arrange(p1,p2,p3,p4) 2.2.2.7、多组数据展示 构造两组数据 df -data.frame(c(rnorm(200,5000,200),rnorm(200,5000,600),rep(c( BJ , TJ ),each 200) names(df) -c( salary , city ) 结果展示 library(ggplot2)p1 -ggplot() geom_histogram(data df,aes(salary,.density.,fill city),color white )p2 -ggplot() geom_histogram(data df,aes(salary,.density.,fill city),color white ,alpha .5)p3 -ggplot() geom_density(data df,aes(salary,.density.,color city)p4 -ggplot() geom_histogram(data df,aes(salary,.density.,fill city),color white ) geom_density(data df,aes(salary,.density.,color city)grid.arrange(p1,p2,p3,p4) 注 假如出现如下加载ggplot2包失败的问题 2.3、加载ggplot2包失败的解决方法 2.3.1、法一、R x64 4.1.0 step 1 step 2 安装程序包 - ggplot2 f 2.3.2、法二 、 RStudio step1 Tools Install Packages step 2 2.4、什么是ggplot2 (What is ggplot2?) 为了更加真正的帮助大众理解 博主我去查询翻译了由哈德利·威克姆、丹妮尔·纳瓦罗以及托马斯·林·佩德森撰写的?ggplot2 用于数据分析的优雅图形?第三版的在线版本。甄选出了局部核心内容如下 While this book gives some details on the basics of ggplot2, its primary focus is explaining the Grammar of Graphics that ggplot2 uses, and describing the full details. It is not a cookbook, and wont necessarily help you create any specific graphic that you need. But it will help you understand the details of the underlying theory, giving you the power to tailor any plot specifically to your needs. 固然本书提供了 ggplot2 根底知识的一些细节 但它的主要重点是解释 ggplot2 使用的图形语法 并描绘完好的细节。它不是一本食谱 也不一定能帮助您创立所需的任何特定图形。但它将帮助您解析根本理论的细节 使您可以根据自己的需要专门定制任何情节。 Wiki says “Data visualization is the graphic representation of data. It involves producing images that communicate relationships among the represented data to viewers of the images. Wiki讲 “数据可视化是数据的图形表示。 它涉及制作图像 以将表示的数据之间的关系传达给图像的查看者。 The inputs we are interested in are: 我们感兴趣的输入是 Call the ggplot(df) function which creates a blank canvas with the dataset(df) of interest 调用ggplot(df)函数 该函数将使用感兴趣的数据集(df)创立一个空白画布 Specify aesthetic mappings, which specifies how you want to map variables to visual aspects. In this case, we are simply mapping the variables to the x- and y-axes. 指定美学映射 这指定了怎样将变量映射到视觉方面。 在这种情况下 我们只是将变量映射到x轴以及y轴。 You then add new layers that are geometric objects which will show up on the plot and additional layers as required. 然后添加作为几何对象的新图层 这些图层将显示在图形上 并根据需要添加其他图层。 2.4.1、搭建环境 (Setting up the environment) Because ggplot2 package isnt part of the standard distribution of R or R Base, you have to download the package from CRAN(Comprehensive R Archive Network) repository and install it. 由于ggplot2软件包不是R或者R Base的标准发行版的一局部 因此您必须从CRAN(综合R存档网络)存储库下载该软件包并进展安装。 Here is how to install a package for the first time with theinstall.packages() function and to load the package at the start of each R session with the library() function. 这是第一次使用install.packages()函数安装软件包 并在每个R会话开场时使用library()函数加载软件包的方法。 To install the ggplot2 package, use the following: 要安装ggplot2软件包 请使用以下命令 install.packages( ggplot2 ) And then to load it, use the following: 然后使用以下命令加载它 library(ggplot2) 2.4.2、虹膜数据集 (The Iris Dataset) The Iris Dataset contains four features (length and width of sepals and petals) of 50 samples of three species of Iris (Iris setosa, Iris virginica and Iris versicolor). Four features were measured from each sample: the length and the width of the sepals and petals, in centimetres. 鸢尾花数据集包含三种鸢尾花(鸢尾花 鸢尾花以及鸢尾花)的50个样本的四个特征(萼片以及花瓣的长度以及宽度)。 从每个样品中测量出四个特征 萼片以及花瓣的长度以及宽度 以厘米为单位。 The data is already available in the datasets package of R. We can simply access the data using the following: R中的datasets包中已经有可用的datasets 。我们可以使用以下命令简单地访问数据 library(datasets)data( iris ) 2.5、以下是ggplot2下的常用图形 2.5.1、条形图 (1. Bar Graphs) A Bar Graph (or a Bar Chart) is a graphical display of data using bars of different heights. They are good if you to want to visualize the data of different categories that are being compared with each other. 条形图(或者条形图)是使用不同高度的条形图的数据图形显示。 假如您要可视化正在互相比拟的不同类别的数据 那么它们很好。 The following code is used to create a bar graph using the geom_bar() function that contains “Species on the x-axis and count of each category on the y-axis: 以下代码用于使用geom_bar()函数创立条形图 该函数在x轴上包含“ Species 在y轴上包含每个类别的计数 ggplot(data iris, aes(x Species, fill Species) geom_bar() xlab( Species ) ylab( Count ) ggtitle( Bar plot of Sepal Length ) 2.5.2、直方图 (2. Histograms) A Histogram is a graphical display of continuous data using bars of different heights. It is similar to a bar graph, except histograms group the data into bins. The height of each bar shows the number of elements in the bin. 直方图是使用不同高度的条形图的连续数据的图形显示。 它类似于条形图 不同之处在于直方图将数据分组到箱中。 每个条形图的高度显示箱中元素的数量。 In R, you can create a histogram using the geom_histogram() function and specify required arguments as follows: 在R中 您可以使用geom_histogram()函数创立直方图 geom_histogram()如下所示指定所需的参数 ggplot(data iris, aes(x Sepal.Width) geom_histogram(binwidth 0.2, color black , aes(fill Species) xlab( Sepal Width ) ylab( Frequency ) ggtitle( Histogram of Sepal Width ) 2.5.3、箱形图 (3. Boxplots) The box-whisker plot (or a boxplot) is a quick and easy way to visualize complex data where you have multiple samples. A box plot is a good way to get an overall picture of the data set in a compact manner. 箱须图(或者箱图)是一种快速简便的方法 可在您有多个样本的情况下可视化复杂数据。 箱形图是一种以紧凑的方式获得数据集的整体图的好方法。 To create a box plot, usegeom_boxplot() and specify what variables you want on the X and Y axes and add different colours to the plot using the following code: 要创立箱形图 请使用geom_boxplot()并在X以及Y轴上指定所需的变量 然后使用以下代码向图中添加不同的颜色 ggplot(data iris, aes(x Species, y Sepal.Length) geom_boxplot(aes(fill Species) ylab( Sepal Length ) ggtitle( Iris Boxplot )Image for post 2.5.4.散点图 (4. Scatter Plots) A scatter plot is a graphical display of the relationship between two sets of data. They are good if you to want to visualize how two variables are correlated. Thats why they are also called correlation plot. 散点图是两组数据之间关系的图形显示。 假如您想可视化两个变量之间的关系 那么它们非常有用。 这就是为什么它们也称为相关图。 To create a scatter plot, use ggplot() with geom_point() and specify what variables you want on the X and Y axes as shown below: 要创立散点图 ggplot()与geom_point()并在X以及Y轴上指定所需的变量 如下所示 ggplot(data iris, aes(x Sepal.Length, y Sepal.Width) geom_point(aes(color Species, shape Species) xlab( Sepal Length ) ylab( Sepal Width ) ggtitle( Sepal Length-Width ) 2.5.5、密度图 (5. Density Plots) A density plot is a representation of the distribution of a numeric variable. It is a smoothed version of the histogram and is used in the same kind of situation. Density plots are used to study the distribution of one or a few variables. 密度图表示数字变量的分布。 它是直方图的平滑版本 在一样情况下使用。 密度图用于研究一个或者几个变量的分布。 Density plots are built-in ggplot2 thanks to the geom_density geom. Only one numeric variable is needed as input as shown below: 由于使用了geom_density geom 密度图是内置的geom_density 。 只需一个数字变量作为输入 如下所示 ggplot(iris, aes(x Sepal.Length, colour Species, fill Species) geom_density(alpha .3) xlab( Petal Length (cm) ) ylab( Density ) ggtitle( Iris Density Plot ) 2.5.6、小提琴图 (6. Violin Plot) Violin plots are similar to box plots, except that they also show the kernel probability density of the data at different values. Typically, violin plots will include a marker for the median of the data and a box indicating the interquartile range, as in standard box plots. 小提琴图类似于箱形图 不同之处在于它们还显示了不同值的数据的核概率密度。 通常 小提琴图将包括数据中位数的标记以及指示四分位数范围的框 如在标准框图中一样。 The function geom_violin() is used to produce a violin plot as shown below: 函数geom_violin()用于产生小提琴图 如下所示 ggplot(iris, aes(Species, Sepal.Length, fill Species) geom_violin(aes(color Species), trim T) geom_boxplot(width 0.1) ggtitle( Iris Violin Plot ) 2.5、R语言 ggplot2包 ggplot2超详细讲解教程及相关实例 2.6、结论 I hope you liked this introductory explanation about visualizing the iris dataset with ggplot2 package in R. You can run these examples yourself an improve on them. You can also apply these visualization methods to other datasets as well. 我祈望您喜欢这个介绍性的讲明 它涉及使用R中的ggplot2包可视化虹膜数据集。您可以自己运行这些例如 以对其进展改良。 您还可以将这些可视化方法也应用于其他数据集。 Check out this book if youre interested in learning more and for any future references 假如您有兴趣解析更多信息和将来的参考资料 请查看本书? 以及? 翻译自: s:/medium / namithadeshpande/plotting-data-using-ggplot2-in-r-578d29275b84 三、【R语言入门】R语言绘图之散点图 #下载并安装ggplot2包if(!suppressWarnings(require( ggplot2 )install.packages( ggplots )require( ggplot2 )head(diamonds) 简单介绍一下数据集中变量的含义 carat 砖石的重量 卡拉 cut 砖石的切工 共有5种程度 color 砖石的颜色 共有7个程度 clarity 砖石的纯度 depth table x y以及z为砖石的5种物理指标 深度、宽度等 price 砖石的价格 #绘制diamonds数据集中carat与price的散点图qplot(carat, price, data diamonds) #对x以及y坐标做对数变换 可以使用log参数qplot(log(carat), log(price), data diamonds)qplot(carat, price, data diamonds, log xy ) 绘制砖石重量与体积的散点图qplot(carat, x*y*z, data diamonds) #对diamonds数据集进展抽样set.seed(1234)dia_sample - diamondssample(1:nrow(diamonds),1000),#为散点图添加图形的其他装饰属性 使用col参数添加颜色qplot(carat, price, data dia_sample, col color) #为散点图添加图形的其他装饰属性 使用shape参数添加形状属性qplot(carat, price, data dia_sample, shape cut) #为散点图添加拟合曲线 使用method参数qplot(carat, price, data dia_sample,geom c( point , smooth ), method lm )0?wx_fmt png qplot(carat, price, data dia_sample,geom c( point , smooth ),method loess , span 0.2) span越小 平滑线越弯曲(0 1:很不平滑 很平滑) 四、【R语言入门】R语言绘图之折线图 折线图一 #绘制密度曲线qplot(x carat, data diamonds, geom density ) qplot(x carat, data diamonds, geom density ,col color) 折线图二 假如将散点图上的点从左往右连接起来 就会得到一个折线图。我们以R中自带的Orange数据集为例 来学习折线图的画法 该数据集中包含五种橘树的树龄以及年度轮数据。要

    注意事项

    本文(【R语言入门】从R、RStudio安装到 条形图、折线图、散点图 等的图形绘制【建议收藏】-精品文档资料整理.docx)为本站会员(安***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开