当前位置: 首页 > news >正文

Python读取Excel表数据转为JSON格式文件(详细优化版)

🤟致敬读者

  • 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉

📘博主相关

  • 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息

文章目录

  • Python读取Excel表数据转为JSON格式文件(详细优化版)
    • 1. 精简代码
    • 2. 详细优化部分
      • 2.1 下载pandas
      • 2.2 读取表格文件(可指定sheet页)
      • 2.3 库日期处理
      • 2.4 布尔值转换
      • 2.5 空值Na的处理
      • 2.6 列名替换
    • 3. 详细优化后的完整代码


📃文章前言

  • 🔷文章均为学习工作中整理的笔记。
  • 🔶如有错误请指正,共同学习进步。

Python读取Excel表数据转为JSON格式文件(详细优化版)

使用pandas库读取Excel表

1. 精简代码

可直接食用

# 步骤 1:引入pandas库
import pandas as pd# 步骤 2: 读取Excel文件
file_path = 'path_to_your_excel_file.xlsx'  # 替换为你的Excel文件路径
df = pd.read_excel(file_path)# 步骤 3: 将DataFrame转换为JSON格式
# orient参数可以控制JSON的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。
# 这里使用'records'格式,它会将每一行数据作为一个对象。orient='records'确保JSON输出为记录列表。
json_data = df.to_dict('records')# 步骤 4: 保存JSON文件
output_file_path = 'output.json'  # 指定输出JSON文件的路径和名称
with open(output_file_path, 'w', encoding='utf-8') as f:f.write(json_data)print("Excel数据已成功转换为JSON并保存到文件。")

2. 详细优化部分

该部分以上面精简代码为基础进行优化改造

2.1 下载pandas

使用pip命令下载pandas库

pip install pandas openpyxl

2.2 读取表格文件(可指定sheet页)

读取excel文件,可加参数sheet_name="sheet名称"来指定Sheet页,如果不指定,默认第一个sheet页
如想要读取的名称为Sheet2

df = pd.read_excel(file_path, sheet_name='Sheet2')

2.3 库日期处理

由于表格中日期转换为json后变成了一串数字,如何解决这个问题,可使用to_datetime函数

# 假设日期列名为'Date',且数据类型为整数(Excel序列号)
df['Date'] = pd.to_datetime(df['Date'], origin='unix', unit='D')  # 将Excel序列号转换为datetime对象
df['Date'] = df['Date'].dt.strftime('%Y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'

2.4 布尔值转换

表格中的true和false转换时不会做处理,单如果json后续要导入到mysql表中,mysql表识别true和false会导入失败,只能识别0和1
可以使用以下代码将true和false转为1和0

# 修改表中的Boolean值,满足表中要求的0-1,而不是false true,不然导入报错
df['是否加装急停开关'] = df['是否加装急停开关'].map({True: 1, False: 0})

2.5 空值Na的处理

如果出现了空值,可使用fillna函数替换,如下

# 将Na替换为空字符
df = df.fillna('')

2.6 列名替换

如果想修改读取到的列名称,可使用以下代码将列名修改值
如excel表中列名是中文,为了更方便导入mysql表,这里将中文列名修改为对应的表字段(非表中字段,而是小驼峰)


column_map ={'任务单编号': 'taskTicketId','工号': 'employeeId'}print(df.columns)
col_names = df.columns.to_list()
col_names = [column_map[s] for s in col_names]
print(col_names)
df.columns = col_names

3. 详细优化后的完整代码

完整代码如下

# 步骤 1:引入pandas库
import pandas as pd# 步骤 2: 读取Excel文件
# file_path = 'path_to_your_excel_file.xlsx'  # 替换为你的Excel文件路径
file_path = '车辆改造单数据库.xlsm'  # 替换为你的Excel文件路径
df = pd.read_excel(file_path, sheet_name='Sheet2')
# print(df)# 假设日期列名为'Date',且数据类型为整数(Excel序列号)
# df['Date'] = pd.to_datetime(df['Date'], origin='unix', unit='D')  # 将Excel序列号转换为datetime对象
# df['Date'] = df['Date'].dt.strftime('%Y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'list = ['创建日期','样品送达日期','要求完成日期','实际完成日期']for i in list:df[i] = pd.to_datetime(df[i], origin='unix', unit='D')  # 将Excel序列号转换为datetime对象df[i] = df[i].dt.strftime('%Y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'# df['创建日期'] = pd.to_datetime(df['创建日期'], origin='unix', unit='D')  # 将Excel序列号转换为datetime对象
# df['创建日期'] = df['创建日期'].dt.strftime('%Y-%m-%d')  # 将datetime对象转换为字符串格式'年-月-日'print(df['是否加装急停开关'])
# 修改表中的Boolean值,满足表中要求的0-1,而不是false true,不然导入报错
df['是否加装急停开关'] = df['是否加装急停开关'].map({True: 1, False: 0})# df = df.fillna('')column_map ={'任务单编号': 'taskTicketId',
'工号': 'employeeId',
'委托人': 'requester',
'创建日期': 'creationDate',
'样品送达日期': 'sampleDeliveryDate',
'要求完成日期': 'requiredCompletionDate',
'实际完成日期': 'completionDate'
}print(df.columns)
col_names = df.columns.to_list()
col_names = [column_map[s] for s in col_names]
print(col_names)
df.columns = col_names# 步骤 3: 将DataFrame转换为JSON格式
# orient参数可以控制JSON的输出格式,例如 'records', 'index', 'columns', 'values', 'split' 等。
# 这里使用'records'格式,它会将每一行数据作为一个对象。orient='records'确保JSON输出为记录列表。
# force_ascii=False确保输出的JSON中包含非ASCII字符,例如中文。
# date_format='iso'确保日期以ISO格式输出。如果你需要其他日期格式,可以相应调整或去掉此参数。
json_data = df.to_json(orient='records', indent=4, force_ascii=False, date_format='iso',)# 步骤 4: 保存JSON文件
# output_file_path = 'output.json'  # 指定输出JSON文件的路径和名称
output_file_path = '车辆改造单数据库.json'  # 指定输出JSON文件的路径和名称with open(output_file_path, 'w', encoding='utf-8') as f:f.write(json_data)print("Excel数据已成功转换为JSON并保存到文件。")

📜文末寄语

  • 🟠关注我,获取更多内容。
  • 🟡技术动态、实战教程、问题解决方案等内容持续更新中。
  • 🟢《全栈知识库》技术交流和分享社区,集结全栈各领域开发者,期待你的加入。
  • 🔵​加入开发者的《专属社群》,分享交流,技术之路不再孤独,一起变强。
  • 🟣点击下方名片获取更多内容🍭🍭🍭👇

相关文章:

  • 软件研发技术团队管理规范
  • 怎么隐藏QTabWidget内的页面
  • 如何校验一个字符串是否是可以正确序列化的JSON字符串呢?
  • 优恩-具备浪涌保护功能的固态继电器UNRD0610-无触点开关器件‌
  • 理解和实现RESTful API的最佳实践
  • ros3d.js中动态改变pointCloud2点云数据的参数
  • vue2.6.12 安装babel 以使用 可选链 ?. 和空值合并 ??
  • 树莓派练习
  • 曲棍球·棒球1号位
  • Linux | I.MX6ULL 内核的编译(13)
  • LINUX学习——守护进程的含义及编程实现
  • KaliARP 攻击工具配置——简单局域网断网攻击
  • C言雅韵集:野指针
  • 团体程序设计天梯赛PTA-SHU冲刺赛4. L22-L32
  • 【AI学习】OpenAI:《A practical guide to building agents》(中文介绍与原文)
  • 无锡透平叶片将携尖端叶片登陆2025涡轮展,5月苏州相见
  • 《软件设计师》复习笔记(11.5)——测试原则、阶段、测试用例设计、调试
  • Linux文件类型
  • Day3-UFS深入学习路线
  • MAC-如果是分页查询,怎么分批次in;基于多线程的分页查询工具类
  • 由“环滁皆山”到“环滁皆景”,滁州如何勾勒“文旅复兴”
  • 湖北一季度GDP为13543.49亿元,同比增长6.3%
  • 抵制饭圈极端应援,发倡议书还不够
  • 特朗普:“百分之百”相信能与欧盟达成贸易协议
  • 江西修水警方:一民房内发生刑案,犯罪嫌疑人已被抓获
  • 中国驻德国大使馆公使曾颖如,调任广州医科大学党委书记