27 Understanding Time Series Analysis in Python のメモ
from pandas import datetime
from datetime import datetime
datetimeはpandasではなくdatetimeからインポートする
import kagglehub
path = kagglehub.dataset_download("redwankarimsony/shampoo-saled-dataset")
def parser(x):
return datetime.strptime('190'+x, '%Y-%m')
series = read_csv('/home/shrishti/shampoo_sales.csv', header=0, parse_dates=[0], index_col=0, squeeze=True, date_parser=parser)
series = read_csv(path+'/shampoo_sales.csv', header=0, parse_dates=[0], index_col=0, date_parser=parser)
squeezeオプションは廃止された。一行しかないcsvを読むとデータフレームとして読み込まれるが、それをSeriesに変換するには読み込んだデータフレームに.squeeze()メソッドを使って変換する。(読み込んだshampoo_sales.csvは二行なのでsqueezeの必要なし)
model = ARIMA(series, order=(5,1,0))
model_fit = model.fit(disp=0)
model_fit = model.fit()
print(model_fit.summary())
fitメソッドのdispオプション(表示の抑制など)は廃止された