郭佳恩前端工程师
返回首页
15 分钟阅读技术专栏

Python 数据分析入门:Pandas 实战

从 CSV 读取到数据清洗、透视表。Pandas 是 Python 数据科学领域的核心库。

PythonData SciencePandas

Pandas 是 Python 中最强大的数据处理库之一。它提供了 DataFrame 结构,让数据操作变得像 SQL 一样简单。

1. 读取数据

python
import pandas as pd

# 读取 CSV 文件
df = pd.read_csv('data.csv')

# 查看前 5 行
print(df.head())

# 查看数据概览
print(df.info())

2. 数据清洗

处理缺失值是数据分析的第一步。

python
# 删除包含缺失值的行
df_clean = df.dropna()

# 或者填充缺失值
df_filled = df.fillna(0)

# 重命名列
df = df.rename(columns={'old_name': 'new_name'})

3. 数据聚合

python
# 按部门分组并计算平均薪资
salary_by_dept = df.groupby('Department')['Salary'].mean()

print(salary_by_dept)

评论区0

自由讨论你的想法,分享你的实践。

还没有评论

成为第一个发言的人吧