Strategi Penanganan Outlier
⚠ Data terbatas — pilih strategi dengan hati-hati
Nonaktif: Tidak ada batas outlier — semua data digunakan. Direkomendasikan bila data terbatas (<50 baris). Distribusi akan tetap apa adanya.
Winsorizing: Nilai ekstrem di-clip ke batas [Q1−K×IQR, Q3+K×IQR] tanpa menghapus baris. Aman untuk dataset kecil, mengurangi pengaruh ekstrem tanpa kehilangan data.
Drop Outlier: Baris yang keluar dari batas IQR akan dihapus dari dataset ML. Hati-hati bila dataset kecil — dapat menyebabkan bias signifikan.
Multiplier K (batas outlier: Q1 ± K × IQR)
Konversi selesai? Lanjut ke eksplorasi data
03Eksplorasi Data (EDA)
Analisis Eksplorasi & Korelasi
Statistik deskriptif, distribusi variabel, heatmap korelasi, scatter plot, dan Variance Inflation Factor (VIF) untuk deteksi multikolinearitas.
Pilih target prediksi, model yang akan diuji, proporsi data training vs testing, dan strategi hyperparameter tuning.
Target Prediksi (Variabel Dependen Y)
Model Machine Learning
Fitur X: Current Ratio, Leverage (DAR), Asset Turnover, Working Capital — semua di-standardize (z-score) sebelum training
Catatan: SVR/KRR mengimplementasikan Kernel Ridge Regression dengan kernel RBF — setara SVR loss kuadratik. MLR = OLS tanpa regularisasi. Ridge = OLS dengan L2. XGBoost menggunakan pendekatan boosting dengan regularisasi L2 pada leaf nodes.
Train / Test Split — Pembagian Data
80%
Training
Model belajar dari data ini
20%
Testing
Evaluasi — tidak dilihat saat training
💡 60/40 → data <20 baris | 70/30 → standar | 80/20 → default | 90/10 → data >100 baris
Hyperparameter Tuning
Filter Periode (opsional — default: semua)
Melatih model…
0%
Training selesai? Lihat hasil di Langkah 5
05Hasil & Prediksi
Hasil Training & Forecasting
Perbandingan performa model (R², RMSE, MAE, MAPE), visualisasi, feature importance, dan prediksi ROA/ROE untuk 3 tahun ke depan.
Jalankan training terlebih dahulu di Langkah 4 untuk melihat hasil prediksi.