数据分析
数据分析是从数据中提取有价值信息的过程。Python 的数据分析生态系统以三大核心库为基础:
- NumPy:提供高性能的多维数组对象和数学运算能力
- Pandas:提供灵活的数据结构(DataFrame/Series)和数据操作工具
- Matplotlib/Pyecharts:提供强大的数据可视化能力
这三个库相互配合,构成了 Python 数据分析的完整工作流:数据处理 → 数据分析 → 数据可视化。
import numpy as np # 数值计算
import pandas as pd # 数据处理
import matplotlib.pyplot as plt # 数据可视化
一提到图表,大家脑海里浮现的,通常是柱状图、饼图、趋势图等等。这是按照图形等维度对图表进行分类,经常会导致图表的误用。
图表的作用,是帮助我们更好地看懂数据。选择什么图表,需要回答的首要问题是『我有什么数据,需要用图表做什么』,而不是 『图表长成什么样』 。
推荐绘图库:
参考链接: