r 字符串转化为数值.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《r 字符串转化为数值.docx》由会员分享,可在线阅读,更多相关《r 字符串转化为数值.docx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、r字符串转化为数值点击上方“早起Python关注并星标公众号以及我一起玩Python本文为玩转数据处理120题R语言版本习题刘早起解答陈熹大众好本文为R语言数据处理120题系列完好版本。精心挑选120道数据处理中相关操作以习题形式发布一共涵盖了数据处理、计算、可视化等常用操作并对局部题目给出了多种解法与注解。动手敲一遍代码一定会让你有所收获1创立DataFrame题目将下面的字典创立为DataFramegrammer:难度期望结果R语言解法#R中没有字典概念故直接创立dataframe/tibble注1-20题均基于该数据框给出2数据提取题目提取含有字符串Python的行难度期望结果gramm
2、erR语言解法which(df3提取列名题目输出df的所有列名难度期望结果Index(R语言解法names(df)#1grammerscore4修改列名题目修改第二列列名为popularity难度R语言解法df%rename(popularityscore)5字符统计题目统计grammer列中每种编程语言出现的次数难度R语言解法#神方法table6缺失值处理题目将空值用上下值的平均值填充难度上下两数的均值R语言解法library(Hmisc)indexis.na(df$popularity)df$popularity(unlist(dfindex-1,2dfindex1,2)/2)7数据提取题
3、目提取popularity列中值大于3的行难度R语言解法df%filter(popularity3)#等价于dfdf$popularity3,#这种方法跟pandas很相似8数据去重题目按照grammer列进展去重难度R语言解法!duplicated(df$grammer),9数据计算题目计算popularity列平均值难度R语言解法#第一种10格式转换题目将grammer列转换为list难度R解法unlist(df$grammer)#1PythonCJavaGONASQLPHPPython11数据保存题目将DataFrame保存为EXCEL难度R解法#R对EXCEL文件不太友好12数据查看题
4、目查看数据行列数难度R解法dim(df)#18213数据提取题目提取popularity列值大于3小于7的行难度R解法library(dplyr)df%filter(popularity3popularity7)#等价于df(df$popularity3)(df$popularity7),14位置处理题目交换两列位置难度R解法df%15数据提取题目提取popularity列最大值所在行难度R解法df%filter(popularitymax(popularity)#同理也有类似pandas的方法dfdf$popularitymax(df$popularity),16数据查看题目查看最后5行数据
5、难度R解法#R中head以及tail默认是6行可以指定数字17数据修改题目删除最后一行数据难度R解法1,18数据修改题目添加一行数据Perl,6.6难度R解法Perl)19数据整理题目对数据按照popularity列值的大小进展排序难度R解法df%20字符统计题目统计grammer列每个字符串的长度难度R解法library(Hmisc)library(stringr)df$grammer$grammer,R)str_length(df$grammer)df$len_str$grammer)第二期数据处理根底21数据读取题目读取本地EXCEL数据难度R解法#R语言处理excel不友好直接读取日期
6、时间数据会变成实数2150局部习题与该数据相关22数据查看题目查看df数据前5行难度期望输出R解法#默认是6行可指定行数23数据计算题目将salary列数据转换为最大值与最小值的平均值难度期望输出R解法library(stringr)df$salary%str_replace_all(k,)%str_split(-,simplifyT)%apply(2,as.numeric)%rowMeans()*100024数据分组题目将数据根据学历进展分组并计算平均薪资难度期望输出educationR解法df%25时间转换题目将createTime列时间转换为月-日难度期望输出R解法#转化后该列属性是字符
7、串R中对时间格式要求严格26数据查看题目查看索引、数据类型以及内存信息难度期望输出classpandas.core.frame.DataFrameR解法str(df)#内存查看需要用到其他的库library(pryr)object_size(df)#6.66kB27数据查看题目查看数值型列的汇总统计难度R解法summary(df)28数据整理题目新增一列根据salary将数据分为三组难度输入期望输出R解法#用ifelse可以以29数据整理题目按照salary列对数据降序排列难度R解法df%30数据提取题目取出第33行数据难度R解法33,31数据计算题目计算salary列的中位数难度R解法med
8、ian(df$salary)#11750032数据可视化题目绘制薪资程度频率分布直方图难度期望输出R解法library(ggplot2)33数据可视化题目绘制薪资程度密度曲线难度期望输出R解法df%34数据删除题目删除最后一列categories难度R解法df435数据处理题目将df的第一列与第二列合并为新的一列难度R解法df%mutate(testpaste0(df$education,df$createTime)36数据处理题目将education列与salary列合并为新的一列难度备注salary为int类型操作与35题有所不同R解法df%37数据计算题目计算salary最大值与最小值之
9、差难度R解法df%summarise(deltamax(salary)-min(salary)%unlist()#delta#4150038数据处理题目将第一行与最后一行拼接难度R解法1,df39数据处理题目将第8行数据添加至末尾难度R解法8,)40数据查看题目查看每列的数据类型难度期望结果objectR解法str(df)#tibble135x5(S3:spec_tbl_df/tbl_df/tbl/data.frame)#$createTime:chr1:13503-1603-1603-1603-16.#$education:chr1:135本科本科不限本科.#$salary:num1:135
10、2750030000275001650015000140002300012500700016000.#$test:chr1:135本科03-16本科03-16不限03-16本科03-16.#$test1:chr1:13527500本科30000本科27500不限16500本科.41数据处理题目将createTime列设置为索引难度R解法df%tibble:column_to_rownames(createTime)42数据创立题目生成一个以及df长度一样的随机数dataframe难度R解法df1135,function(n)replicate(n,sample(1:10,1)#列名暂时不一样下
11、一题重命名43数据处理题目将上一题生成的dataframe与df合并难度R解法df%rename(0df1)#非常规命名需要用包裹变量名44数据计算题目生成新的一列new为salary列减去之前生成随机数列难度R解法df%mutate(newsalary-0)45缺失值处理题目检查数据中是否含有任何缺失值难度R解法#这个包的结果呈现非常有趣46数据转换题目将salary列类型转换为浮点数难度R解法as.double(df2$salary)47数据计算题目计算salary大于10000的次数难度R解法df%48数据统计题目查看每种学历出现的次数难度期望输出119R解法table(df$educa
12、tion)49数据查看题目查看education列共有几种学历难度R解法length(unique(df$education)#1450数据提取题目提取salary与new列的以及大于60000的最后3行难度期望输出R解法dfdf$salarydf51数据读取题目使用绝对途径读取本地Excel数据难度R解法#转存csv后再读备注请将答案中途径交换为自己机器存储数据的绝对途径5180相关习题与该数据有关52数据查看题目查看数据前三行难度期望结果R解法head(df,53缺失值处理题目查看每列数据缺失值情况难度期望结果1R解法is.na(df)54缺失值处理题目提取日期列含有空值的行难度期望结果R
13、解法is.na(df$日期),55缺失值处理题目输出每列缺失值详细行数难度期望结果327行位置有缺失值R解法library(glue)for(iinnames(df)if(sum(is.na(df,日期)!0)res1is.na(df,i)res2,)print(glue(列名i,第res2行有缺失值)56缺失值处理题目删除所有存在缺失值的行难度Python解法0,how备注0-行操作(默认)57数据可视化题目绘制收盘价的折线图难度期望结果R解法library(ggplot2)58数据可视化题目同时绘制开盘价与收盘价难度期望结果R解法df%ggplot()geom_line(aes(日期,收盘
14、价(元),size1.2,colorsteelblue)geom_line(aes(日期,开盘价(元),size1.2,colororange)ylab(c(价格(元)#这种画出来没有图例当然可以手动添加但为了映射方便可以用另一种方法library(tidyr)df%select(日期,开盘价(元),收盘价(元)%pivot_longer(c(开盘价(元),收盘价(元),names_totype,values_toprice)%ggplot(aes(日期,price,colortype)geom_line(size1.2)scale_color_manual(valuesc(steelblue
15、,orange)theme_bw()theme(panel.grid.majorelement_blank(),panel.grid.minorelement_blank(),legend.titleelement_blank(),legend.positionc(0.86,0.9)59数据可视化题目绘制涨跌幅的直方图难度期望结果R解法df%60数据可视化题目让直方图更细致难度期望结果R解法df%61数据创立题目以data的列名创立一个dataframe难度R解法temp62异常值处理题目打印所有换手率不是数字的行难度期望结果R解法#换手率这一列属性为chr需要先强转数值型63异常值处理题目打
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 字符串转化为数值 字符串 转化 数值
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内