当前位置 : 首页 » 文章分类 :   »  Pandas

Pandas

Pandas 学习笔记


数据结构

Pandas 的主要数据结构是:

  • Series 一维数据
  • DataFrame 二维数据

​Series 一维带标签数组,支持多种数据类型

s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])

​DataFrame 二维表格结构,支持列名定义和混合数据类型

data = {'姓名': ['张三', '李四'], '年龄': [28, 34]}
df = pd.DataFrame(data)

表格读写

CSV、Excel、SQL等多种格式的读取与保存

df = pd.read_csv('data.csv')  # 读取CSV
df.to_excel('output.xlsx', index=False)  # 保存Excel

读取表头:

import pandas as pd

try:
    # 读取 Excel 文件,只读取表头(0 行数据)
    file_path = '/path/my-table.xlsx'
    df = pd.read_excel(file_path, nrows=0)
    print(f"表头: {list(df.columns)}")
except Exception as e:
    print(f"读取 Excel 文件失败:")
    print(f"{type(e).__name__}: {e}")

数据清洗与处理

fillna 使用指定的方法填充 NA/NaN 值。
df.fillna(value=’’, inplace=True) 缺失值替换为空字符串,原地修改
df.fillna({‘年龄’: df[‘年龄’].mean()}) 用均值填充空白年龄


下一篇 JavaScript-Worker

阅读
评论
274
阅读预计1分钟
创建日期 2025-11-19
修改日期 2025-11-19
标签

页面信息

location:
protocol:
host:
hostname:
origin:
pathname:
href:
document:
referrer:
navigator:
platform:
userAgent:

评论