本格的なデータの分析や集計業務に取り掛かろうとしたときに、データを読み込むわけですが読み込むデータの種類は様々です。
今回はPythonのpandasでエクセルデータを読み込む方法を紹介していきます。
前提:pandasはインストールできていること
今回はpandasを使ってエクセルデータを読み込むので、前提としてpandasはインストールされている前提です。pandasをインストールしていない人は、インストールしましょう。
1 |
pip install pandas |
準備:エクセルデータを読み込むには「xlrd」のインストールが必要
では、pandasを使ってエクセルデータを読み込みましょう。ここでポイントですが、csvの読み込みならpandasそのままで読み込みができるのですが、エクセルの場合は追加で「xlrd」をインストールする必要があります。
下記を入力して「xlrd」をインストールしましょう。
1 |
pip install xlrd |
xlrdをインストールしたら、エクセルデータを読み込む準備は完了です。
実際にエクセルを読み込む場合
実際にpandasからエクセルを読み込むには、下記のように記述します。
1 2 |
import pandas as pd pd.read_excel('example.xlsx') |
エラーが出ている場合
エラーが出ている場合、読み込むデータのディレクトリパスがあっているかどうかを確認しましょう。またcsvファイルを読み込む場合は、read_excelをread_csvに変更します。