Jupyter是使用Python做数据分析,机器学习的IDE。可能你会奇怪,Python开发有很多IDE可以选择,为什么要使用Jupyter呢?这里需要先建立一个新的认知:写代码做数据分析跟写代码做软件系统是不同的。软件系统在运行时是一个连续的流程,一个输入对应一个输出。而数据分析是将多个片段串联起来的间断式流程,每个片段都需要查看分析结果。比如先对数据做预处理,处理完后查看结果,然后再做特征工程,再看结果,再训练模型评估,再看评估结果。严格来说数据分析并不是程序设计过程,只是用代码的方式做数学计算。自然传统面向程序设计的IDE并不适合做数据分析。
Jupyter环境安装
Jupyter是Python生态的一个模块,可以借助Python生态的安装工具pip来安装。
MAC安装Jupyter
- # 安装python3,如已安装可以忽略
- brew install python3 --with-brewed-openssl
- # 安装jupyter
- pip3 install jupyter
- # 启动jupyter
- jupyter notebook --port=9527
复制代码
Linux安装Python3.5
- # yum install sqlite-devel
复制代码
安装机器学习相关的Lib
- pip3 install numpy scipy pandas scikit-learn sklearn tensorflow
- 说明:
- # numpy:线性代数计算包
- # scipy: 科学计算包
- # pandas:(Python Data Analysis Library)数据分析包
- # scikit-learn:开源机器学习工具包
- # tensor flow:google开源的深度学习包
复制代码
pip3 install matplotlib
pip3 install seaborn |
|