3小时入门numpy,pandas,matplotlib

使用Python中的三个库可以优雅地进行数据分析,得到一只野生的Matlab,这三个库是numpy,pandas 和 matplotlib。

numpy是高性能科学计算和数据分析的基础包,其array多维数组拥有丰富的数据类型,基于向量化技术可以有效代替循环,代码简单速度极快。

以numpy为基础的pandas中的数据框dataframe集数据分析工具万象于一身,可以像array数组一样进行复杂计算,又可以像excel一样地操作数据,又可以像SQL一样地操作数据。

而matplotlib进一步以matlab风格实现了绘图功能。其强大的数据可视化能力可以让你的数据分析结果颜值倾城。

一、numpy 库

numpy提供了三种常用的对象,数组array、矩阵matrix和ufunc(universal function)。

1,创建array


2,访问array元素


3,array运算


4,使用matrix运算


5,使用ufunc对象


二、pandas 库

pandas中的DataFrame是交互性最好在数据分析中使用最广泛的数据结构。

pandas 中常用的数据结构有:

(1)Series:一维数组,与Numpy中的一维array类似。

Series中只允许存储相同的数据类型。

(2)DataFrame:二维的表格型数据结构。

可以将DataFrame理解为Series的容器。

(3)Panel :三维的数组,可以理解为DataFrame的容器。

1,Series对象


2,创建DataFrame对象


3,从excel中读入DataFrame对象


4,增加行


5,删除行


6,增加列


7,删除列


8,移动列


9,排序


10,拼接


11,选取数据

有三种选取数据的方法:下标索引、标签索引、布尔索引。


12,导出到csv文件或excel文件


13,常用统计函数




14,时间格式


三,matplotlib 库

matplotlib 支持函数式绘图和面向对象绘图两种绘图方式。

函数式绘图方式与matlab风格一致,先用一条语句画出图像,然后用一系列函数去修饰。而面向对象绘图方式一般自上而下完成,先创建figure,然后再创建子图ax,然后绘制data,最后设计各种辅助元素 (包括 xaxis, yaxis, title, grid,legend, annotate 等 )。

1,折线图






2,条形图


3,柱形分布图


4,散点图


5,饼图


6,绘制子图



Appendix:Jupyter Notebook 常用快捷键

  • Tab 对象补全
  • Shift + Tab 对象提示帮助
  • Ctrl + Enter 运行当前cell
  • Shift + Enter 运行当前cell,并选中下一个cell
  • Alt + Enter 运行当前cell,并在下方创建一个空的cell
  • Esc * M 切换成markdown输入状态
  • Esc * A 在上方插入cell
  • Esc * B 在下方插入cell

来自公众号: Python与算法之美

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();