PART 2 環境構築:すごいぞ!機械学習ライブラリ インストォォォル!
前回までの振り返り
ゼロからAIエンジニアのPART1ではPythonの本体をインストールする手順とその際に入門者がつまづきがちなポイントをご紹介しました。PART2の今回はPythonに機械学習ライブラリという強力なツールをインストールする手順をご紹介します。
【この記事の目次】
1. この記事が想定する読者の方について
2. Pythonへのライブラリの追加とは
3. pipってなに?
4. pipでライブラリのインストールを実行!
1. この記事が想定する読者の方について
- プログラミング知識が全くゼロの状態の方で、かつPythonによる機械学習をこれから勉強したい方
- ご自身のパソコンへのPython等のインストールなど(環境構築)をこれから行いたい方
- 逆に、プログラミングをすでに少しでもご存知の方は本記事の対象ではありません。
さて、Part 1でPython本体のインストールが終わりました。
今回の Part 2ではPythonにライブラリを追加していきます。
2. Pythonへのライブラリの追加とは
Python本体に標準で用意されているライブラリのほか、外部のライブラリを追加することで様々なことを実現できます。このブログで目指している機械学習プログラミングのためのライブラリも豊富です。
以下に代表的な機械学習ライブラリをご紹介します。
numpy(ナムパイ): numpyは、Pythonで学術計算を行うためのライブラリです。機械学習で頻繁に扱う行列計算などを簡潔なコードで高速に実行できます。
scipy(サイパイ): scipyは、科学計算を行うためのライブラリです。numpyで行うことができる配列・行列演算のほか、信号処理・統計といった処理を行えます。
pandas(パンダス): pandasは、データ解析ツールです。ビッグデータを表形式で表示し、編集、抽出のほか簡単なデータ前処理も行えます。
matplotlib(マットプロットリブ): matplotlibは、グラフ表示ソフトです。機械学習で用いる訓練データなどの分散をグラフで可視化したりする際に用います。
scikit-learn(サイキットラーン): scikit-learnは、様々な機械学習モデルがセットになったライブラリです。scikit-learnだけで、ロジスティック回帰、サポートベクトル、決定木など色々な学習モデルを簡単なコードで実装することができます。
その他のライブラリは必要に応じてインストールをしますので、まずは上記5つのライブラリのインストールを行いましょう。
3. pipってなに?
Pythonの本体がインストールされた段階で、pipというライブラリのインストール管理ソフトもインストールされています。pipを使えば、必要なライブラリがインストールできるほか、どんなライブラリがインストールされているのか、各ライブラリのバージョン管理、アンインストールなどが行えます。
なお、pipを使うにはネットワークに繋がっていることが必要です。
4. pipでライブラリのインストールを実行!
それではpipを使っていきましょう。pipは、Windowsの場合、「コマンドプロンプト」から使います。Macの場合は「ターミナル」です。
Windowsでコマンドプロンプトを開くと、黒いWindowが開き白い文字で、
C:¥>
とか
C:¥User>
といった文字が表示されると思います。
この">"の右横に、コードを入力し「Enter」を押すことでコマンドが実行されます。コマンドプロンプトを開くのが初めての方は、これだけで少し敷居が高い感じがすると思いますが、慣れてしまえば実に簡単な操作です。
それではコマンドプロンプトでpipのinstallを実行してみましょう。
以下、C:¥> は省略します。
とその前に、pip自体をアップグレードしましょう。
先ほどの C:¥> のすぐ横に、
pip install --upgrade setuptools
と入力して「Enter」。アップグレードが終わったら、
pip install --upgrade pip
と入力して「Enter」をしてください。pipがアップグレードされます。
プログラムのコードは、スペース一つにも意味があります。小文字であるところ大文字にしてもエラーになりますので、一文字も間違えないよう注意してください。なお、間違えても実行されないだけなのでご安心を。入力し直せばいいだけです。
次からがいよいよライブラリのインストールです。
同じく先ほどの C:¥> のすぐ横に、
pip install numpy
と入力し「Enter」を押します。
あとは勝手にインストールしてくれます。
同じく、
pip install scipy
と入力してEnter。scipyのインストールが終わるのを待ちます(以下同じです)。
pip install pandas
と入力してEnter。
pip install matplotlib
と入力してEnter。
pip install scikit-learn
と入力してEnter。
それぞれEnterを押すごとにインストールの処理が走ります。
なお、scikit-learnにはnumpyとscipyが必須なので先にそれらをインストールします。
最後に、以下のコードを入力してインストール確認しましょう。
pip list
これでインストール済みライブラリのリストが出力されます。
自分が入れたライブラリ名が表示されることを確認しましょう。
全て終わればコマンドプロンプトはWindow右上の×ボタンで終了して構いません。
さて、これでPythonが動く環境ができました。次回は、Jupyter NotebookをインストールしてPythonのプログラミング環境を整えましょう。