Melalui artikel kali ini, saya akan mencoba mengupas tuntas sebuah metode dalam data science, yaitu analisis time series, menggunakan Python.
Seperti yang sudah diketahui secara umum bahwa untuk keperluan data science, Python telah menyediakan banyak sekali library, yang dengannya analisis data menjadi lebih mudah dan cepat. Tidak terkecuali analisis time series.
Artikel ini akan membahas tentang cara melakukan analisis time series menggunakan library FBProphet di Python. Analisis yang dilakukan meliputi prediksi data time series, mengetahui pola data trend mingguan, bulanan, dan tahunan. Sebagai dataset analisisnya, akan diambil data rata-rata temperatur harian di beberapa titik di asia di sepanjang tahun 2010, yang berformat netCDF.
Persiapan Tools
Untuk analisis data ini, tools yang saya gunakan adalah Anaconda3 versi 2020.07 for Windows. Di dalam Anaconda versi ini, sudah terdapat Python versi 3.8.3.
Library FBProphet ini sendiri hanya bisa diinstall di beberapa versi Python sbb: 2.7.*; 3.5.*; 3.6.*; dan 3.7.* . Lantas bagaimana jika Python yang ada di Anacondanya 3.8.* ? jangan khawatir karena nanti kita bisa membuat environment baru di Anacondanya.
Membuat Environment di Anaconda
Tujuan dari langkah ini adalah untuk membuat environment baru di Anaconda untuk menginstall Python versi yang disupport oleh FBProphet. Ini nanti kita akan menginstall Python versi 3.7.0. Apabila Anaconda yang dimiliki sudah terdapat versi Python yang disupport seperti di atas, maka langkah ini bisa diskip.
Untuk membuat environment baru di Anaconda dengan Python versi 3.7.0, langkahnya adalah terlebih dahulu masuk ke Anaconda Prompt, kemudian ketikkan perintah berikut ini.
conda create -n timeseries python=3.7.0
Perintah di atas adalah untuk membuat environment baru dengan nama ‘timeseries’ yang di dalamnya terdapat Python 3.7.0. Untuk nama environment ini sebenarnya bisa sembarang.
Setelah proses pembuatan environment ‘timeseries’ selesai, selanjutnya kita masuk ke environment tersebut dengan memberikan perintah:
activate timeseries
Sebagai tanda kita bisa masuk ke environment ‘timeseries’ adalah tanda promptnya berubah dari ‘base’ menjadi ‘timeseries’.
Untuk memastikan bahwa versi Python yang terinstall 3.7.0, bisa diketikkan perintah berikut:
python --version
Menginstall Library FBProphet
Selanjutnya kita menginstall library FBProphet. Library ini sebenarnya bisa diinstall menggunakan perintah:
pip install fbprophet
namun, berdasarkan pengalaman metode di atas sering menyebabkan kegagalan dalam proses instalasinya. Untuk alternatifnya, kita berikan perintah sebagai berikut:
conda install -c conda-forge fbprophet
Menginstall Library NetCDF4
Library NetCDF4 digunakan untuk mengekstrak/memproses data format NetCDF. Untuk menginstallnya melalui perintah:
pip install netcdf4
Menginstall Library Plotly
Sebenarnya library ini optional saja artinya tanpa diinstall pun tidak mengapa. Namun, plotly ini diperlukan di FBProphet untuk membuat plot interaktif. Apabila tidak diinstall, maka nanti muncul warning. Karena hanya berupa Warning, sehingga library ini sebenarnya bisa diskip. Akan tetapi apabila ingin diinstall bisa menggunakan perintah:
pip install plotly
Menginstall Library Jupyter Notebook
Meskipun di Anaconda sudah ada Jupyter Notebook, kita tetap menginstallnya di environment yang kita buat supaya kita bisa melakukan analisisnya di Jupyter Notebook menggunakan kernel yang berasal dari environment yang sudah disetting.
Untuk menginstall Jupyter Notebook, kita berikan perintah:
conda install jupyter
Setelah terinstall, kita bisa jalankan Jupyter Notebooknya dengan perintah
jupyter-notebook
Proses Analisis
Pada proses berikutnya, kita bisa melakukan analisis melalui Jupyter Notebook.