当前位置: 首页 > news >正文

遍历所有文件夹,并把文件里所有的csv合并为一个dataframe

import os
import pandas as pd

def load_and_combine_csv(root_dir):
    # 初始化一个空的列表来存储所有的DataFrame
    df_list = []

    # 遍历根目录下的所有文件夹及子文件夹
    for subdir, _, files in os.walk(root_dir):
        for file in files:
            if file.endswith(".csv"):
                # 构造文件的完整路径
                file_path = os.path.join(subdir, file)
                
                # 读取CSV文件为DataFrame
                df = pd.read_csv(file_path)
                
                # 将DataFrame添加到列表中
                df_list.append(df)

    # 将所有的DataFrame合并为一个
    combined_df = pd.concat(df_list, ignore_index=True)
    
    return combined_df

# 使用函数遍历并合并CSV文件
root_directory = 'path_to_your_directory'  # 根目录路径
combined_data = load_and_combine_csv(root_directory)

# 查看合并后的数据
print(combined_data.head())

相关文章:

  • ES6基础----Map的使用
  • vue3.5更新内容
  • 爬虫常用模板
  • css画个熊猫
  • C语言:刷题笔记
  • MyCat
  • ant vue design日期组件date-picker自定义快捷选择日期封装
  • OpenXR Monado创建Swapchain和生成纹理
  • Verilog基础,原码,反码与补码的概念
  • 透明加密为什么是最佳选择,10款透明加密软件推荐
  • CGLIB 是什么
  • Linux驱动(四):Linux2.6字符设备驱动及GPIO子系统
  • [数据集][目标检测]鲜花检测数据集VOC+YOLO格式25215张106类别
  • 【2024-2025源码+文档+调试讲解】微信小程序的城市公交查询系统
  • 三级_网络技术_59_应用题
  • 机器学习:svm算法原理的优缺点和适应场景
  • 【Python】数据分析分类图可视化
  • C++入门day3-面向对象编程(中)
  • c++ unordered_set的用法
  • 登录-异步请求用户数据无法保存-bug
  • 游客曝九寨沟打网约车被出租车围堵,景区回应:当地无合规网约车
  • 西夏文残碑等文物来沪,见证一段神秘灿烂的历史
  • 外交部官方公众号发布视频:不跪!
  • 美国“杜鲁门”号航母一战机坠海
  • 非法收受财物逾1648万,湖南原副厅级干部康月林一审被判十年半
  • 价格周报|猪价继续回暖:二次育肥热度仍存,对猪价仍有一定支撑