当前位置 : 首页 » 文章分类 : » Pandas
Pandas
Pandas 学习笔记
数据结构
Pandas 的主要数据结构是:
Series一维数据DataFrame二维数据
Series 一维带标签数组,支持多种数据类型
s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])
DataFrame 二维表格结构,支持列名定义和混合数据类型
data = {'姓名': ['张三', '李四'], '年龄': [28, 34]}
df = pd.DataFrame(data)
表格读写
CSV、Excel、SQL等多种格式的读取与保存
df = pd.read_csv('data.csv') # 读取CSV
df.to_excel('output.xlsx', index=False) # 保存Excel
读取表头:
import pandas as pd
try:
# 读取 Excel 文件,只读取表头(0 行数据)
file_path = '/path/my-table.xlsx'
df = pd.read_excel(file_path, nrows=0)
print(f"表头: {list(df.columns)}")
except Exception as e:
print(f"读取 Excel 文件失败:")
print(f"{type(e).__name__}: {e}")
数据清洗与处理
fillna 使用指定的方法填充 NA/NaN 值。
df.fillna(value=’’, inplace=True) 缺失值替换为空字符串,原地修改
df.fillna({‘年龄’: df[‘年龄’].mean()}) 用均值填充空白年龄
页面信息
location:protocol: host: hostname: origin: pathname: href: document:referrer: navigator:platform: userAgent: