R语言-获取指定位置的数据
R中采用数据对象+[ , ]的方式获取对应位置的数据,根据填入索引参数的不同类型可具体分为:
正整数、负整数、零、空格、逻辑值、名称
> matrix [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 2 6 10 14 18 [3,] 3 7 11 15 19 [4,] 4 8 12 16 20
1.正整数索引
因为R中的起始位置为1,与一般的编程语言不同,所以这类索引最为常见。
需要注意的是,如果索引中存在重复值,R会继续执行进而重复提取部分值,如:
> matrix[c(1,1),1:5] [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 1 5 9 13 17
2.负整数索引
使用负整数索引与正整数正好相反,R会返回不包含在负整数对应位置的元素,当需要选取的行或列很多时,用这个索引会更快捷。
需要注意,正整数索引与负整数索引可以同时出现在不同索引位置,但不能同时出现在同一位置,否则将报错,具体如下:
> matrix[c(-1,-1),1] [1] 2 3 4 > matrix[c(-1,1),1] Error in matrix[c(-1, 1), 1] : only 0's may be mixed with negative subscripts
3.零索引
零索引的存在说实话并没有什么意义,很有可能是设计师为了防止很多程序员无法避开从0开始计数而经常导致error的一种保护措施而已。使用情况如下:
> matrix[1,0] integer(0) > matrix[0,0] <0 x 0 matrix>
4.空格索引
空格表示提取该索引位置所对应的所有维度,但不写空格效果也一样,具体如下:
> matrix[1,] [1] 1 5 9 13 17 > matrix[1, ] [1] 1 5 9 13 17
5.逻辑值索引
当提供的索引位置是一个包含TRUE和FALSE逻辑值的向量,那么R会匹配出索引值为TRUE的列,并取出相应元素。
使用这种方法,需要向量长度与索引位置的维度相同,否则就达不到需要的效果,具体如下:
> matrix[c(T,F,F,F),] [1] 1 5 9 13 17
这种方式看似笨重,但在特殊情况下作用十分明显
6.名称索引
当被索引的对象有名称属性,就可以采用名称作为索引提取相关元素,这是提取列的常用方法,因为列总会有名称,具体如下:
> colnames(matrix)<-c("a","b","c","d","e") > matrix[,"b"] [1] 5 6 7 8
补充:R语言获取特定时间段的数据
获取特定时间段的表格数据方法:
1. 方法一:正则表达式
data <- read.csv('F:/data.csv') date <- as.Date(data$Date) #获取2018-3-1到2018-3-10之间的第3-5列数据 subT <- date[(format(date,format = "%Y")=="2018"&as.numeric(format(date,format = "%m"))=="3" &as.numeric(format(date,format = "%d"))>=1&as.numeric(format(date,format = "%d"))<=10),3:5] #对2018-3-1到2018-3-10之间第3-5列的数据进行按列求平均值 mean <- apply(subT,2, mean)
2. 方法二:
date1 <- as.POSIXct(paste("2018-3-1","08:00:00")) date2 <- as.POSIXct(paste("2018-3-1","17:00:00")) int <- interval(date1, date2) #获取2018-3-1 08:00:00到2018-3-1 17:00:00之间的第3-5列数据 subT <- data[ymd_hms(data$Date) %within% int,3:5]
注意:
1. within判断数据是否在该时间段之内,其中包括起始时间,不包括末尾时间。
2.paste0(num_year[y],'_',m,'_1') 实现字符串的合并,其中m,num_year[y]为变量。
paste拼接时有空格,paste0无空格
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。