首页 > 编程语言 > 详细

R语言基础-数据转换

时间:2020-05-12 00:57:45      阅读:91      评论:0      收藏:0      [点我收藏+]

一、基本转换

读取Excel数据

技术分享图片
技术分享图片
methods(is) 函数可以查看所有 is 的方法。用于判断数据
methods(as) 函数可以查看所有的转换方法。

二、对大数据集,取数据子集

1.读数据

技术分享图片
技术分享图片
技术分享图片

两种写法

技术分享图片
技术分享图片

2.随机抽样函数 sample()

对向量抽样

技术分享图片

对数据框抽样,取子集

技术分享图片

3.删除特定数据

原数据 mtcars

技术分享图片

删除1-5列

技术分享图片

删除mpg列

技术分享图片

4.合并不同的数据集

美国50个州的数据

技术分享图片

每个周的分区

技术分享图片

合并后的数据集

技术分享图片
或者
技术分享图片

合并前20行和后20行

技术分享图片

注意:

使用 cbind() 和 rbind() 函数合并矩阵时必须要有相同的行和列数

5.去除重复行

使用 duplicated() 函数判断是否为重复值

技术分享图片

使用 unique() 函数直接对数据集去重

三、数据框的翻转

使用 t() 函数对mtcars数据进行行和列的翻转

技术分享图片

使用 rev() 函数实现向量倒置

技术分享图片

通过翻转数据框索引的方式实现 women 数据的翻转

技术分享图片

四、数据框数据的替换

使用 transform() 函数修改列的值

技术分享图片
技术分享图片

或者
  women$height <- women$height*2.54

五、数据框的排序

1.sort() 函数,对向量进行排序

技术分享图片
技术分享图片

通过列名对数据框排序

技术分享图片

2.order() 函数,也可对向量进行排序,不过返回的值是索引

技术分享图片

对mtcars数据框中的mpg列进行排序

技术分享图片

反排

技术分享图片

对多个列进行排序

技术分享图片

六、对数据框进行运算

1.apply() 函数,用于数据框或者矩阵

技术分享图片

lapply() 函数,运算后返回的值是列表

sapply() 函数,运算后的值返回的是向量

使用state.center 列表数据
技术分享图片

tapply() 函数,第二个参数是因子

查看区域有多少个州

技术分享图片

七、数据的去中心化和去标准化处理,消除量纲对数据结构的影响

数据中心化:

指数据集中的各项数据减去数据集的均值

数据标准化:

指在中心化之后再除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。
技术分享图片

1.案例,对 state.x77 数据绘制热图

  heatmap(state.x77)

非常的不明显,没有意义

技术分享图片

2.使用scale() 函数,实现去中心化和去标准化

技术分享图片
技术分享图片

R语言基础-数据转换

原文:https://www.cnblogs.com/nnadd/p/12865687.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!