当前位置：首页 > 院校库 > pandas读取excel

pandas读取excel

shiwaishuzidu2025年07月17日 12:28:58院校库183

andas是一个功能强大的数据处理库，它提供了多种方法来读取Excel文件，在处理Excel数据时，我们通常需要根据具体的文件结构和需求来选择合适的读取方式,以下是一些常见的使用场景和方法：

基本读取

假设你有一个名为data.xlsx的Excel文件，其中包含一个工作表Sheet1,你可以使用以下代码将其读取为一个DataFrame：

import pandas as pd
# 读取第一个工作表
df = pd.read_excel('data.xlsx')
print(df.head())
# 读取指定名称的工作表
df_sheet1 = pd.read_excel('data.xlsx', sheet_name='Sheet1')
print(df_sheet1.head())

选择特定的列和行

如果你只对文件中的某些列感兴趣，可以使用usecols参数来指定要读取的列，如果你只想读取A、C和D列,可以这样做：

# 按列字母读取
df = pd.read_excel('data.xlsx', usecols='A,C:D')
print(df.head())
# 按列名读取
df = pd.read_excel('data.xlsx', usecols=['日期', '销量'])
print(df.head())
# 按索引读取
df = pd.read_excel('data.xlsx', usecols=[0, 3])
print(df.head())

你还可以使用skiprows和nrows参数来跳过文件顶部或底部的行,或者只读取特定数量的行：

# 跳过前2行和末尾1行
df = pd.read_excel('report.xlsx', header=0, skiprows=2, skipfooter=1)
print(df.head())
# 读取前10行数据
df = pd.read_excel('data.xlsx', nrows=10)
print(df.head())

处理缺失值

在实际数据中，缺失值可能以各种形式存在，如"N/A", "-", "空"等，你可以使用na_values参数来指定哪些值应被视为缺失值：

# 将"N/A"和"-"识别为缺失值
df = pd.read_excel('data_with_missing.xlsx', na_values=['N/A', '-'])
print(df.isnull().sum())

指定数据类型

有时Pandas可能会错误地推断数据类型（将数字编码的ID读取为整数而不是字符串），你可以使用dtype参数来强制指定列的数据类型：

# 将"产品ID"读取为字符串，"销量"读取为浮点数
df = pd.read_excel('products.xlsx', dtype={'产品ID': str, '销量': float})
print(df.dtypes)

读取多个工作表

如果Excel文件包含多个工作表，你可以一次性加载所有工作表，或者只加载指定的几个工作表。sheet_name参数可以接受一个列表,用于指定要读取的工作表名称或索引：

# 读取所有工作表，返回一个字典
all_sheets = pd.read_excel('sales_multi_sheet.xlsx', sheet_name=None)
print(all_sheets.keys())
# 访问第一个工作表的DataFrame
df_sheet1 = all_sheets['Sheet1']
print(df_sheet1.head())
# 读取指定的一些工作表
quarterly_data = pd.read_excel('sales_multi_sheet.xlsx', sheet_name=['Q1', 'Q2'])
print(quarterly_data[0].head())  # Q1的数据
print(quarterly_data[1].head())  # Q2的数据

处理大型Excel文件

当处理大型Excel文件时，一次性将整个文件加载到内存中可能会导致内存不足，此时可以使用chunksize参数进行分块读取：

chunk_size = 1000
chunks = pd.read_excel('large_file.xlsx', chunksize=chunk_size)
for chunk in chunks:
    # 处理每个数据块
    processed_chunk = chunk[chunk['销量'] > 100]
    print(processed_chunk.head())

实战演练：清洗一个不规范的Excel文件

假设我们有一个不规范的报告messy_report.xlsx，其中包含一些杂乱的信息,我们可以使用Pandas的各种参数来清洗这个文件：

# 自定义列名并跳过前两行
df = pd.read_excel('messy_report.xlsx', header=None, names=['ID', '下单日期', '城市', '产品名称', '销量', '备注'], skiprows=2)
print(df.head())
# 转换日期格式
df['下单日期'] = pd.to_datetime(df['下单日期'], format='%Y-%m-%d')
print(df.head())
# 填充缺失值
df.fillna(0, inplace=True)
print(df.isnull().sum())

FAQs

Q1: 如何读取Excel文件中的特定区域？

A1: 你可以使用usecols参数指定要读取的列范围，使用skiprows和nrows参数指定要跳过的行和读取的行数。

# 读取第1到第3列，跳过前2行，读取10行
df = pd.read_excel('data.xlsx', usecols="A:C", skiprows=2, nrows=10)
print(df.head())

Q2: 如何处理Excel文件中的合并单元格？

A2: 你可以使用openpyxl库来处理合并单元格，你需要加载工作簿并获取合并单元格的信息,然后根据这些信息填充数据。

from openpyxl import load_workbook
wb = load_workbook('merged_cells.xlsx')
ws = wb['Sheet1']
# 获取合并单元格信息
merged_ranges = ws.merged_cells.ranges
# 填充合并单元格值
for merged_range in merged_ranges:
    min_row, min_col, max_row, max_col = merged_range.bounds
    cell_value = ws.cell(row=min_row, column=min_col).value
    for row in range(min_row, max_row + 1):
        for col in range(min_col, max_col + 1):
            ws.cell(row=row, column=col).value = cell_value
# 保存修改后的文件
wb.save('merged_cells_filled.xlsx

本文链接：https://www.shuzidu.com/zhichangjineng/5942.html

标签: ndas excel

分享给朋友：

返回列表

上一篇：excel绝对值函数

下一篇：excel绝对值公式

“pandas读取excel” 的相关文章

pdf怎么转换成word免费

日常工作和学习中，我们经常会遇到需要将PDF文件转换为Word文档的情况，以便进行编辑、修改或格式调整，许多专业的PDF转换工具往往需要付费，这对于普通用户来说可能会造成一定的经济负担，如何在不花费一分钱的情况下，实现PDF到Word的免费...

excel转换成word

当今数字化办公的时代,我们常常需要在不同的文档格式之间进行转换，以满足各种工作和学习的需求，将 Excel 转换成 Word 是一个比较常见的操作，无论是将电子表格中的数据整理成报告，还是将表格形式的内容转化为更易于阅读和编辑的文档格式，掌...

word2003

rd 2003是微软公司推出的一款经典文字处理软件，全称为Microsoft Office Word 2003，它在当时的办公软件领域占据着重要地位，为用户提供了强大的文字处理功能,以下为你详细介绍：主要功能功能类别...

excel根据身份证号计算年龄

Excel中根据身份证号计算年龄是一项非常实用的操作，尤其在处理大量人员信息时，可以快速准确地获取年龄数据,以下将详细介绍如何在Excel中根据身份证号计算年龄的方法。了解身份证号的结构中国的身份证号码是一组具有特定含义的数字，共1...

用excel做仓库管理系统

当今数字化的时代，对于仓库管理而言，借助 Excel 来搭建一套行之有效的管理系统，已然成为众多企业提升运营效率、优化库存管控的得力举措，Excel 凭借其强大的数据处理与分析功能，以及极高的灵活性，为仓库管理的各个环节提供了精细化、可视化...

word怎么转换成excel

常办公中,我们经常会遇到需要将Word文档中的数据或表格转换为Excel格式的情况，无论是为了进行更复杂的数据分析，还是为了利用Excel强大的数据处理功能，掌握Word转换成Excel的方法都是非常实用的技能，下面，我将详细介绍几种将Wo...

pandas读取excel

基本读取

选择特定的列和行

处理缺失值

指定数据类型

读取多个工作表

处理大型Excel文件

实战演练：清洗一个不规范的Excel文件

FAQs

“pandas读取excel” 的相关文章

pdf怎么转换成word免费

excel转换成word

word2003

excel根据身份证号计算年龄

用excel做仓库管理系统

word怎么转换成excel

Copyright © 2002-2025 数字独教育 版权所有 冀ICP备2021017634号-12 冀公网安备13062802000114号 工商营业执照 网站地图

Copyright © 2002-2025 数字独教育版权所有冀ICP备2021017634号-12 冀公网安备13062802000114号工商营业执照

网站地图