Skip to main content

数据分析

数据分析是从数据中提取有价值信息的过程。Python 的数据分析生态系统以三大核心库为基础:

  • NumPy:提供高性能的多维数组对象和数学运算能力
  • Pandas:提供灵活的数据结构(DataFrame/Series)和数据操作工具
  • Matplotlib/Pyecharts:提供强大的数据可视化能力

这三个库相互配合,构成了 Python 数据分析的完整工作流:数据处理 → 数据分析 → 数据可视化。

import numpy as np      # 数值计算
import pandas as pd # 数据处理
import matplotlib.pyplot as plt # 数据可视化

一提到图表,大家脑海里浮现的,通常是柱状图、饼图、趋势图等等。这是按照图形等维度对图表进行分类,经常会导致图表的误用。

图表的作用,是帮助我们更好地看懂数据。选择什么图表,需要回答的首要问题是『我有什么数据,需要用图表做什么』,而不是 『图表长成什么样』 。

推荐绘图库:

参考链接: