例如,某数据库如下,需要把第二个变量里面的ID号码(格式为T-20-252-02)提取出来作为一个新变量。
命令如下:
b=readWorksheetFromFile(temp[11],sheet=1)
读入excel数据,命名为数据库b,这里temp[11]是读入temp中第11个文件名对应的文件
attach(b)
attach数据库,之后即可直接用变量名file, 否则要用b$file
b$id=substr(File,regexpr("T",File),regexpr("T",File)+10)
在数据库b中生成一个新变量id,其等于从File变量中提取字符,从T所在位置开始,到T位置后10位置结束
结果如下所示:
补充:R语言提取字符串的一部分substring函数
语法
这个函数提取字符串的一部分。
substring()函数的基本语法是:
substring(x,first,last)
x - 是字符向量输入。
first - 是第一个字符要被提取的位置。
last - 是最后一个字符要被提取的位置。
示例
# Extract characters from 5th to 7th position. substring("Extract", 5, 7) > [1] "act"
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。