Python是一种跨平台的计算机程序设计语言,是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python很适合用来做数据分析,近年来,越来越多的从业人员使用Python来做数据工作,围绕数据分析的生态也越来越完善,拥有比较完备的资源、教程、库等,所以用Python来做数据分析是很不错的选择。
基于Python语言的特性,加上历史和文化上的原因,Python发展出了一个大型、活跃的科学计算及数据分析社区。在数据科学、交互式计算以及数据可视化等领域,Python经常被拿来和其他开源或商业编程语言、工具进行对比,比如R、MATLAB、SAS、Stata等。近些年,Python提高了对类库的支持(比如pandas和scikit-learn),使得它成为数据分析任务的一个流行选择。再综合考虑Python在通用软件工程上的总体实力,它便成为数据分析的首选语言。
本教程主要关注用Python来操作、处理、清洗和操作数据时的基本要点,并介绍了主流数据处理库如Numpy、pandas、matplotlib等的使用,基于此,您可以用来实现各种数据分析、数据可视化操作,满足常规数据分析需求。
本教程是用Python来做数据分析,而不是做软件开发,所以并不需要您对Python语言非常擅长,只需要掌握基础用法即可。如果您之前没接触过Python,可以直接跟着本教程走,而不需要先单独学习Python。