Python学習6日目 「『Python for MBA Pythonとデータ分析を実践的に身につける』5章データ分析の準備

Python学習6日目「『Python for MBA Pythonとデータ分析を実践的に身につける』5章データ分析の準備のP180からです。
いよいよ今日は、pandasを使いました。 (前回の記事はこちら

やったことは、
pandasデータの読み込み、列と行の表示、列と行の名前変更、エクセルとCSVとZIPファイルの読み込み。
これは応用するためにも必須の知識です!!
おそらくP201~P218は、株価データ作成で必要な技術ですね。

さて、今日の学習のはじまり。
さっそくJupyter notebookを開いて実行したら、
errorがでました。こちらです。
入力は
inport pandas as pd

結果

  File "C:\Users\USER\AppData\Local\Temp/ipykernel_18948/367464543.py", line 1
    inport pandas as pd
           ^
SyntaxError: invalid syntax

ググると、無効な構文エラーだそうです。

??

あ、importじゃなくて、inportになってますね!

で、修正して実行。

入力
import pandas as pd

どうだ!

ModuleNotFoundError                       Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_18948/4080736814.py in <module>
----> 1 import pandas as pd

ModuleNotFoundError: No module named 'pandas'

もう 笑

pandasがないって言ってるので、
インストールしてみました。

上のセルに、pip install pandasを追加して実行。

うまくいきました!
P203の長文はこちらのサイトからでもコピペできます。
https://www.pythonformbas.com/df_students.html

入力したら、表が現れました!

ここまで読んで、マッタン先生のお話で
今日一番心に残った言葉

エラーで重要なことは、一番最後に書いてある。

Python for MBA Pythonとデータ分析を実践的に身につける P207

P216でもエラーがでました。

Missing optional dependency 'openpyxl

ググると、どうやら、
モジュール「xlrd」がv1.0.0 以上がインストールされていないためだそうです。

インストールします。

pip install xlrd

またまたエラー。

ImportError: Missing optional dependency 'openpyxl'.  Use pip or conda to install openpyxl.

ピップのアップグレードですか??

いやいや、” pip install xlrd ”を実行したあとの注意文を読んだら、
以下にKernelを再起動と書いてあります。

Collecting xlrd
  Downloading xlrd-2.0.1-py2.py3-none-any.whl (96 kB)
Installing collected packages: xlrd
Successfully installed xlrd-2.0.1
Note: you may need to restart the kernel to use updated packages.

kernelってなんですか?

画面上にあったので、再起動。
それでも同じエラーが表示。

ぐぐると、Pandasで処理したデータをエクセルファイルに出力するときに下記のパッケージが必要になるそうです。

import pandas as pd
pip install xlrd
pip install openpyxl
df_students = pd.read_excel(‘raw data/Students.xlsx’)

とセルを分けて入力したら、
できました。

本日は、
「Python for MBA Pythonとデータ分析を実践的に身につける」のP224まで読み進めました。
5章終了!

ここには記載しておりませんが、
スペル入力ミスによるエラーが結構起きてました。
スペルが間違ってますよ、という言い方の説明ではなく
~がありません。という言い回しなので、
dfの定義からひとつひとつ実行し、
問題がなければ最後の指示セルでのスペルチェックをするという流れで
解決していきました。

本日も、本当に授業を受けているような感覚で学習ができました。
ただ大学の授業とは違うのは、
先生の言ったことを即座に実行できない内容でも、
書籍なら、ゆっくり考える時間があること、
そして他にも自分が理解していなかったことや、
新しい気づきをして新たな学習をすることができるという
良い点を感じました。
自分のペースで学習できる環境って素晴らしいですね。

やっとjupyter notebookにも慣れてきました。
今日はエラーとの闘いでしたね~。
エラーは友だち。
エラーを出さないように意識するよりも、
エラーを解決できるようになることが大事なんだと
改めて実感しました。

さてさて、やっと本書の半分まで来ました。
まだまだ先は遠いように思えるのですが、
できるようになったことはとても多いです。
まだ今日覚えたものも明日には忘れているでしょうし、
何度も使って覚えていくしかなさそうです。

そこから応用していきたいことがあるので、
諦めるわけにはいきません!!
けれども、少々基礎のお勉強に飽きてきた感があります。

早く株価データを作りたくて仕方ありません!!
「Python for MBA Pythonとデータ分析を実践的に身につける」の最終章には、
顧客の注文パターンを分析する箇所があるのですが、
たとえば、銘柄ごとの株価変動パターンの傾向がわかれば、
投資判断の良い指標になります。

もちろん、株価は100%的中するパターンはないと思います。
ですが、たとえば60%くらいの的中率で30%上昇します。
というくらい分析できたとすれば、
どのくらいのリスクをとればいいのか、
どの程度の資産を投資すれば良いのかが出せます。

先は長いですが、わくわくしてきました。
がんばるぞ!

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です