Time Series Forecasting Untuk Prediksi Dalam Data Mining

Time Series Forecasting adalah salah satu teknik analisis prediktif paling tua yang diketahui. Teknik ini telah ada dan telah digunakan secara luas bahkan sebelum istilah “analytics prediktif” pernah diciptakan. Algoritma forecasting (prediksi) sama dengan algoritma estimasi di mana label/target/class bertipe numerik, bedanya adalah data yang digunakan merupakan data rentet waktu (data time series).

Variabel independen atau prediktor tidak sepenuhnya diperlukan untuk Time Series Forecasting univariat, tetapi sangat disarankan untuk deret waktu multivarian. Metode Time Series Forecasting yakni Metode Data Driven dan Metode Model Driven:

  1. Metode Data Driven: Tidak ada perbedaan antara prediktor dan target. Teknik seperti rata-rata deret waktu atau perataan dianggap pendekatan berbasis data untuk peramalan deret waktu
  2. Model Driven Method: Mirip dengan model prediksi “konvensional”, yang memiliki variabel independen dan dependen, tetapi dengan twist: variabel independen sekarang waktunya

Baca Juga: Memahami Konsep Data Mining Beserta Prosesnya

1. Metode data driven (Pendekatan yang dimotori oleh data)

Metode forward chaining juga disebut data driven yaitu proses pencarian atau pengolahan data dikendalikan oleh data yang diberikan. Forward Chaining adalah suatu metode pengambilan keputusan yang umum digunakan dalam sistem pakar. Proses pencarian dengan metode forward chaining berangkat dari kiri ke kanan, yaitu dari premis menuju kepada kesimpulan akhir, metode ini sering disebut data driven yaitu pencarian dikendalikan oleh data yang diberikan (Hartati dan Iswanti, 2008).

Tidak ada perbedaan antara prediktor dan target. Prediktor juga merupakan variabel target. Metode Data Driven:

  • Naïve Forecast
  • Simple Average
  • Moving Average
  • Weighted Moving Average
  • Exponential Smoothing
  • Holt’s Two-Parameter Exponential Smoothing

2. Metode Model Driven (Metode yang digerakkan oleh Model)

Dalam metode yang digerakkan oleh model, waktu adalah prediktor atau variabel independen dan nilai deret waktu adalah variabel dependen. Metode berbasis model umumnya lebih disukai ketika rangkaian waktu tampaknya memiliki pola “global”. Idenya adalah bahwa parameter model akan dapat menangkap pola-pola ini. Dengan demikian memungkinkan kita membuat prediksi untuk setiap langkah di masa depan di bawah asumsi bahwa pola ini akan terulang. Untuk deret waktu dengan pola lokal bukannya pola global, menggunakan pendekatan berbasis model memerlukan menentukan bagaimana dan kapan pola berubah, yang mana itu sulit. Metode Model Driven:

  • Linear Regression
  • Polynomial Regression
  • Linear Regression with Seasonality
  • Autoregression Models and ARIMA

Implementasi Time Series Forecasting

Pendekatan RapidMiner terhadap deret waktu didasarkan pada dua proses transformasi data utama. Yang pertama adalah windowing untuk mengubah data deret waktu menjadi kumpulan data generik: Langkah ini akan mengubah baris terakhir dari suatu jendela dalam rangkaian waktu menjadi label atau variabel target. Kita menerapkan salah satu dari “pelajar” atau algoritma untuk memprediksi variabel target dan dengan demikian memprediksi langkah waktu berikutnya dalam seri.

Konsep Windowing

  • Parameter dari operator Windowing memungkinkan perubahan ukuran windows, tumpang tindih antara windows berturut-turut (ukuran step), dan horizon prediksi, yang digunakan untuk perkiraan
  • Horizon prediks mengontrol baris mana dalam seri data mentah yang berakhir sebagai variabel label dalam seri yang diubah.
Konsep Windowing
Konsep Windowing

Operator Windowing pada Rapidminer

Operator Windowing pada Rapidminer
Operator Windowing pada Rapidminer

Parameter Operator Windowing

  • Window size: Menentukan berapa banyak “atribut” yang dibuat untuk data cross-sectional
    • Setiap baris deret waktu asli dalam lebar jendela akan menjadi atribut baru
    • Kita tentukan w = 6
  • Step size: Menentukan cara memajukan jendela
    • Mari kita gunakan s = 1
  • Horizon: Menentukan seberapa jauh untuk membuat perkiraan
    • Jika Window size adalah 6 dan horizon adalah 1, maka baris ketujuh dari deret waktu asli menjadi sampel pertama untuk variabel “label”
    • Mari kita gunakan h = 1

Daftar Pustaka

Hartati dan Iswanti. 2008. Sistem Pakar dan Pengembangannya. Yogyakarta: Graha Ilmu.

Tinggalkan komentar