今回は、データ分析用のツールであるJupyter Notebookについて解説します。
Jupyter Notebookは、データーサイエンティストの間でも広く使われているツールです。
とても便利なので、ぜひ、この記事を参考に、Jupyter Notebookにチャレンジしてみてください。
Jupyter Notebookとは
Jupyter Notebookは、ノートブックと呼ばれるファイルにプログラムや説明の文章、実行結果などをまとめて管理できる、データ分析用のツールです。「ジュパイター ノートブック」または「ジュピター ノートブック」と読みます。
Jupyter Notebookはオープンソースで公開されており、個人/商用問わず、誰でも無料で利用することができます。またブラウザで動作するため、いろいろなOSから利用でき、チームメンバーとのプログラムの共有も用意です。
Jupyter Notebookをインストールするには
Anacondaという開発環境のパッケージを利用すると、Jupyter Notebookと共に、データ分析やグラフ描画など、Pythonでよく利用されるライブラリをまとめてインストールできるので便利です。あらかじめPythonの公式ページから、Python3をインストールしておきましょう。
Anacondaはダウンロードページからダウンロードできます。
ページを開くと、使っているOSに合わせたダウンロードページが表示されますので、Python 3.6 version と書かれた方を選択します。
ダウンロードしたインストーラーを実行して、手順通りに進めていきます。
インストールが終わったら、ANACONDA NAVIGATORを起動します。
ANACONDAは、複数の環境を用意して、用途に応じて環境を切り替えて使うことができるようになっています。先ず、Environmentsを選択して、画面下のCreateボタンをクリックしましょう。
Nameに適宜名称を入力し、Createをクリックすると新しい環境が作成されます。
ライブラリのインストールもEnvironmentsから行います。ここではグラフ描画ライブラリである、matplotlibをインストールしてみましょう。
画面右側で「Not Installed」を選択し、テキストボックスに「matplotlib」と入力します。一覧に候補が表示されますので、matplotlibを選択し、Applyをクリックすると、インストールが行われます。
他のライブラリも、同様の手順でインストールすることができます。
環境の作成が終わったら、HOMEを選択します。jupyterと書かれたタイルにInstallボタンが表示されていますのでクリックすると、Jupyter Notebookのインストールが行われます。
インストールが終わると、ボタンの表記が「Launch」に変わります。Launchをクリックすると、Jupyter Notebookが起動します。次回以降はLaunchをクリックするだけでJupyter Notebookを起動することができます。
Jupyter Notebookの使い方
Jupyter Notebookを起動すると、以下のような画面になります。新たにノートブックを作成するには、画面右側のNewボタンをクリックします。
表示されたメニューからPython3を選択しましょう。
選択すると、新たにノートブックが作成され、ブラウザに表示されます。
それでは、1と書かれたセルに、以下のように入力してみましょう。
# ソースコードを記述し、Shift+Enterで実行できます。 print(1+2)
入力が終わったら、Shiftキーを押しながらEnterキーを押します。そうすると、セルに書かれたソースコードが実行され、実行結果が表示されます。
このように、Jupyter Notebookでは、セルごとにソースコードを記述して、実行を行うことができます。実行結果はすぐ下に表示され、何度でも再実行できます。
実行することで、新たにセルが追加されています。新たに追加されたセルを選択し、Cellメニューから、Cell Type、Markdownを選択しましょう。
次のように入力します。
## CellTypeをMarkDownにする CellTypeをMarkDownにすることで、 *マークダウン記法* により文章を記述することができます
入力が終わったら、Shiftキーを押しながらEnterキーを押します。そうすると、セルに書かれたマークダウン記法が解釈され、表示されます。
また、Jupyter Notebookでは、ノートブックにグラフを表示することもできます。以下のソースコードを入力し、実行してみましょう。
% matplotlib inline import matplotlib.pyplot as plt price = [100, 250, 380, 500, 700] number = [1, 2, 3, 4, 5] # グラフを書く plt.plot(price, number) # グラフのタイトル plt.title("price / number") # x軸のラベル plt.xlabel("price") # y軸のラベル plt.ylabel("number") # 表示する plt.show()
実行結果は以下のようになります。ノートブックにグラフも表示されているのが確認できますね。
このように、ソースコードと説明の文章、実行結果をまとめて保存しておくことができるので、データ分析を試行錯誤しながら行ったり、分析結果を他の人に説明したりすることが、とても簡単に行うことができます。
それでは最後に、ノートブックの保存方法と終了方法についてご説明しましょう。
Jupyter Notebookでは、定期的に自動保存されますが、必要に応じて、メニューのSAVEボタンを押して保存することもできます。
終了するときは、Fileメニューの「Close and Halt」を選択します。ブラウザの閉じるボタンを押して終了すると、バックグラウンドでPythonの実行環境(カーネル)が起動したままになってしまいますので注意しましょう。
今回は、Jupyter Notebookの概要とインストール方法、使い方について説明しました。
これからJupyter Notebookを勉強したい、機械学習を使って何か作ってみたいという方は最初に理解しておきたい内容でしょう。
コメントをお書きください