郭
←返回首页郭佳恩前端工程师
15 分钟阅读技术专栏
Python 数据分析入门:Pandas 实战
从 CSV 读取到数据清洗、透视表。Pandas 是 Python 数据科学领域的核心库。
PythonData SciencePandas
Pandas 是 Python 中最强大的数据处理库之一。它提供了 DataFrame 结构,让数据操作变得像 SQL 一样简单。
1. 读取数据
pythonimport pandas as pd # 读取 CSV 文件 df = pd.read_csv('data.csv') # 查看前 5 行 print(df.head()) # 查看数据概览 print(df.info())
2. 数据清洗
处理缺失值是数据分析的第一步。
python# 删除包含缺失值的行 df_clean = df.dropna() # 或者填充缺失值 df_filled = df.fillna(0) # 重命名列 df = df.rename(columns={'old_name': 'new_name'})
3. 数据聚合
python# 按部门分组并计算平均薪资 salary_by_dept = df.groupby('Department')['Salary'].mean() print(salary_by_dept)