最近,工作中要测试数据加工结果表和原表,原先没接触过这块的知识,学习总结下相关知识和概念:
1.环境安装
Java(JDK8),python3.6.5, pycharm ,idea , pyspark
2.jpuyter概念理解:
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。在本文中,我们将介绍 Jupyter notebook 的主要特性,以及为什么对于希望编写漂亮的交互式文档的人来说是一个强大工具。
Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等
本地网页jpuyter new 一个python时报错,多半是权限问题!
3.Anaconda与Pycharm的区别?
python自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算,在cmd终端输入:pip3 install numpy就能安装numpy包了。
每次都额外安装所需要的包略麻烦,这时候我们可以采用anaconda了。anaconda是一个python发行版,包含了大量的包,使用anaconda无需再去额外安装所需包
原文:https://www.cnblogs.com/pcy226/p/12304385.html