Python 中的科学计算工具

Python 在解决数据科学任务和挑战方面继续处于领先地位,本章主要介绍 Python 中几个最基础、也是最重要科学技计算包。

NumPy

NumPy 是科学应用程序库的主要软件包之一,用于处理大型多维数组和矩阵,它大量的高级数学函数集合和实现方法使得这些对象执行操作成为可能。

官网:http://www.numpy.org/

Pandas

Pandas 是一个 Python 库,提供高级的数据结构和各种各样的分析工具。这个软件包的主要特点是能够将相当复杂的数据操作转换为一两个命令。Pandas包含许多用于分组、过滤和组合数据的内置方法,以及时间序列功能。

官网:https://pandas.pydata.org/

Matplotlib

Matplotlib 是一个用于创建二维图和图形的底层库。藉由它的帮助,你可以构建各种不同的图标,从直方图和散点图到费笛卡尔坐标图。

Matplotlib 就是 MATLAB+Plot+Library ,即模仿 MATLAB 的绘图库,其绘图风格与 MATLAB 类似。

官网:https://matplotlib.org/index.html

Seaborn

Seaborn 本质上是一个基于 matplotlib 库的高级 API。它包含更适合处理图表的默认设置。此外,还有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图

官网:https://seaborn.pydata.org/

Scikit-learn

Scikit-learn 是 Python 中简单高效的数据挖掘和数据分析工具,建立在 NumPy,SciPy 和 matplotlib 的基础上,为许多标准的机器学习和数据挖掘任务提供算法,如聚类、回归、分类、降维和模型选择。

官网:http://scikit-learn.org/stable/

中文文档:http://sklearn.apachecn.org/cn/0.19.0/

SciPy

SciPy 基于 NumPy,其功能也因此得到了扩展。SciPy 主数据结构又是一个多维数组,由 Numpy 实现,包含了帮助解决线性代数、概率论、积分计算和许多其他任务的工具。

官网:https://scipy.org/scipylib/

Plotly

Plotly 是 一个动态绘图模块,它可以让你轻松构建复杂的图形。该软件包适用于交互式 Web 应用程,可实现轮廓图、三元图和三维图等视觉效果。

官网:https://plot.ly/python/

参考文章

2018:数据科学20个最好的Python库