本文介绍基于R语言中的raster
包,读取单张或批量读取多张栅格图像,并对栅格图像数据加以基本处理的方法。
1 包的安装与导入
首先,我们需要配置好对应的R语言包;前面也提到,我们这里选择基于raster
包来实现栅格图像数据的读取与处理工作。首先,如果有需要的话,我们可以先到raster
包在R语言的官方网站中,查阅raster
包的基本情况,比如其作者信息、当前的版本、所依赖的其他包等等;如下图所示。
当然,这些内容看不看都不影响我们接下来的操作。接下来,我们开始安装raster
包;这里我是在RStudio中进行代码的撰写的。
首先,我们输入如下的代码,从而开始raster
包的下载与自动配置。
install.packages("raster")
随后,按下回车
键,运行代码,如下图所示。
可以看到,我们在安装raster
包时,会自动将其所需依赖的其他包(如果在此之前没有配置过)都一并配置好,非常方便。
接下来,输入如下的代码,从而将刚刚配置好的raster
包导入。
library(raster)
随后,按下回车
键,运行代码,如下图所示。
此时,在RStudio右下方的“Packages”中,可以看到raster
包以及其所依赖的sp
包都处于选中的状态,表明二者都已经配置成功,且完成导入。
2 单一栅格图像读取与处理
接下来,我们首先开始读取、处理单独一景栅格图像数据。
首先,我们输入如下的代码;其中第一句是指定接下来要打开的栅格图像的路径与文件名,第二句则是通过raster()
函数打开这一栅格图像。
tif_file_name <- r"(E:\02_Project\01_Chlorophyll\ClimateZone\Split\A_LCC0.TIF)"
tif_file <- raster(tif_file_name)
运行上述代码。此时,我们可以在RStudio中右上方的“Environment”中看到我们刚刚新建的两个变量,以及其对应的值。
接下来,我们可以直接通过plot()
函数,对刚刚读取到的栅格图像数据加以绘制。
plot(tif_file)
运行代码后,可以在RStudio中右下方的“Plots”看到绘制完毕的图像。可以说,这一绘制栅格图像的方式,相较于Python、C++等语言都更为方便。
随后,我们简单介绍一下对这一栅格图像数据的处理操作。例如,我们可以通过mean()
函数与sd()
函数,计算栅格图像全部像元数值的平均值和标准差;这里我们用到了na.rm = TRUE
参数,具体含义稍后会提到。
tif_mean <- mean(tif_file[], na.rm = TRUE)
tif_std <- sd(tif_file[], na.rm = TRUE)
运行上述代码,随后输入如下的代码,即可查看我们刚刚计算得到的平均值与标准差。
tif_mean
tif_std
结果图下图所示。
前面我们提到了na.rm = TRUE
参数,这一参数表示是否消除数据集中无效值NA
的影响;如果我们不将其设置为TRUE
,那么就表示不消除数据集中的无效值;而如果我们的栅格图像中出现无效值(NoData值),那么就会使得平均值、标准差等计算结果同样为无效值NA
;如下图所示。
3 大量栅格图像读取与处理
接下来,我们介绍一下基于raster
包批量读取大量栅格图像的方法。
首先,我们需要将存放有大量栅格图像的文件夹明确,并将其带入list.files()
函数中;这一函数可以对指定路径下的文件加以遍历。其中,pattern
是对文件名称加以匹配,我们用".tif$"
表示只筛选出文件名称是以.tif
结尾的文件;full.names
表示是否将文件的全名(即路径名称加文件名称)返回,ignore.case
表示是否不考虑匹配文件名称时的大小写差异。
tif_file_path <- list.files(r"(E:\02_Project\01_Chlorophyll\ClimateZone\Split\0)", pattern = ".tif$", full.names = TRUE, ignore.case = TRUE)
运行上述代码,并将这一变量打印出来,结果如下图所示。可以看到,此时我们已经将指定路径下的.tif
格式的栅格图像全部提取出来了。
接下来,我们通过stack()
函数,将全部栅格图像的数据放入同一个变量中;随后,我们可以打印一下这个变量,查看其中的内容。这里需要注意,如果通过这种方法批量读取栅格图像,需要保证每一景图像的空间参考信息、行数与列数完全一致,否则会弹出报错信息。如果大家的栅格图像行数与列数不完全一致,可以参考文章Python实现snap:对齐多张遥感影像的空间范围,对各个栅格图像加以统一。
tif_file_all <- stack(tif_file_path)
tif_file_all
运行上述代码,得到如下所示的结果。可以看到,这一变量中保存了12
个图层(虽然栅格图像只有7
景,但是其中有几景是具有多个波段的);其中,除了最基本的栅格图像维度、空间范围、空间参考信息等内容,names
还展示了12
个图层各自的名称,min values
与max values
则还展示了每一个图层的最小值与最大值。
此外,我们还可以继续基于plot()
函数,直接批量绘制多个图层各自的栅格图像。
plot(tif_file_all)
运行上述代码,结果如下所示。
此外,我们还可以基于mean()
等函数,对栅格图像的基本数学统计信息加以计算。不过在对多个栅格图像数据加以计算时需要注意,在tif_file_all
后是否添加[]
符号,得到的结果是不一样的——如果不添加[]
符号,我们相当于是加以逐像元分析,对每一个位置的像元在12
个图层中的数值加以统计,并计算该像元在12
个图层中的平均值;因此最终所得结果是一景新的栅格图像,图像中的每一个像元数值都表示该像元在12
个图层中的平均值。而如果我们添加了[]
符号,那么就和前述单一栅格图像的处理一样,计算的结果就是一个数值,即12
个图层中每一个像元对应数值的总体的平均值。
tif_all_mean <- mean(tif_file_all, na.rm = TRUE)
tif_all_mean_2 <- mean(tif_file_all[], na.rm = TRUE)
我们分别打印上述两个变量,得到结果如下图所示。
由此可以更加明显地看出添加[]
符号与否的差异。
本文就只是对R语言raster
包读取、处理栅格数据加以基本的方法介绍,至于更加深入的用法,我们将在后期的文章中加以介绍。