需求:
1.大量csv文件,以数字命名,如1.csv、2.cvs等;
2.逐个打开,对csv文件中的某一列进行格式修改;
3.将更改后的内容写入新的csv文件。
解决思路:
先读取需处理的csv文件名,去除文件夹下的无用文件,得到待处理文件地址名称和新文件保存的地址名称,分别读取每一个csv文件进行处理后写入新的文件。
if __name__ == '__mAIn__': filenames_in = '../Train_data/' # 输入文件的文件地址 filenames_out = '../Train_data1/' # 新文件的地址 pathDir = os.listdir(filenames_in) for allDir in pathDir: child = re.findall(r"(.+?).csv", allDir) # 正则的方式读取文件名,去扩展名 if len(child) > 0: # 去掉没用的系统文件 newfile='' needdate = child #### 这个就是所要的文件名 domain1 = os.path.abspath(filenames_in) # 待处理文件位置 info = os.path.join(domain1, allDir) # 拼接出待处理文件名字 domain2 = os.path.abspath(filenames_out) # 处理完文件保存地址 outfo = os.path.join(domain2, allDir) # 拼接出新文件名字 print(info, "开始处理") # ------省略数据处理过程---------------------- df.to_csv(outfo, encoding='utf-8') # 将数据写入新的csv文件 print(info,"处理完")