Understanding Time Series Analysis in Python

27 Understanding Time Series Analysis in Python のメモ

  1. from pandas import datetime
    from datetime import datetime
    
    図7

    datetimeはpandasではなくdatetimeからインポートする

  2. import kagglehub
    path = kagglehub.dataset_download("redwankarimsony/shampoo-saled-dataset")
    def parser(x):
      return datetime.strptime('190'+x, '%Y-%m')
    
    series = read_csv('/home/shrishti/shampoo_sales.csv', header=0, parse_dates=[0], index_col=0, squeeze=True, date_parser=parser)
    series = read_csv(path+'/shampoo_sales.csv', header=0, parse_dates=[0], index_col=0, date_parser=parser)
    
    図8

    squeezeオプションは廃止された。一行しかないcsvを読むとデータフレームとして読み込まれるが、それをSeriesに変換するには読み込んだデータフレームに.squeeze()メソッドを使って変換する。(読み込んだshampoo_sales.csvは二行なのでsqueezeの必要なし)

  3. model = ARIMA(series, order=(5,1,0))
    model_fit = model.fit(disp=0)
    model_fit = model.fit()
    print(model_fit.summary())
    
    図11

    fitメソッドのdispオプション(表示の抑制など)は廃止された


坂本直志 <sakamoto@c.dendai.ac.jp>
東京電機大学工学部情報通信工学科