Apa Itu Overfitting? Bahaya, Cara Deteksi, dan Solusinya

Rita Puspita Sari
•
19 Jul 2025 15.52 WIB

Ilustrasi Artificial Intelligence New — Artificial Intelligence

Bayangkan Anda sedang mengajarkan seorang murid untuk mengenali pola dalam soal matematika. Alih-alih memahami konsep dasarnya, murid tersebut malah menghafal soal-soal latihan tanpa memahami maknanya. Ketika ujian tiba dengan soal berbeda, dia gagal menjawab karena tidak mampu menyesuaikan diri dengan soal baru.

Fenomena inilah yang dikenal sebagai overfitting dalam dunia machine learning, di mana sebuah model tidak belajar memahami pola yang umum dan penting, tetapi justru terlalu "menempel" pada data latih yang digunakan selama proses pelatihan.

Dalam artikel ini, kita akan membahas secara mendalam apa itu overfitting, perbedaannya dengan underfitting, bagaimana mendeteksinya, serta solusi dan teknik mutakhir untuk menghindarinya.

Apa Itu Overfitting?

Overfitting adalah kondisi ketika algoritma machine learning terlalu akurat dalam “menghafal” data pelatihan, termasuk noise (gangguan) dan informasi tidak relevan, sehingga kehilangan kemampuan untuk menggeneralisasi terhadap data baru. Artinya, model tampak bekerja sangat baik pada data latih, tetapi buruk dalam prediksi data yang belum pernah dilihat sebelumnya.

Fenomena ini berbanding terbalik dengan tujuan utama machine learning: menciptakan model yang mampu mempelajari pola umum dan kemudian menerapkannya ke data dunia nyata.

Ciri utama dari overfitting:

Akurasi sangat tinggi pada data pelatihan.
Akurasi rendah atau kesalahan tinggi pada data pengujian.
Variansi model yang sangat tinggi.

Bagaimana Overfitting Terjadi?

Overfitting biasanya terjadi karena dua hal:

Model terlalu kompleks, misalnya menggunakan terlalu banyak parameter atau arsitektur jaringan yang berlapis-lapis (deep learning).
Durasi pelatihan terlalu lama, sehingga model tidak hanya belajar pola dominan, tetapi juga kebisingan acak dalam data.

Sebagai contoh, bayangkan kita melatih model untuk mengenali jenis bunga dari gambar. Jika data pelatihannya terbatas atau banyak gangguan (misalnya pencahayaan buruk, label yang tidak konsisten), model bisa saja belajar bahwa “jika ada bayangan di pojok kanan, berarti itu bunga A”, padahal itu tidak ada hubungannya sama sekali.

Overfitting vs Underfitting

Dalam dunia machine learning, salah satu tantangan terbesar adalah membuat model yang tidak hanya hebat dalam belajar dari data yang diberikan (data pelatihan), tetapi juga mampu menggeneralisasi dan memberikan prediksi yang akurat pada data baru (data uji). Dua masalah utama yang sering muncul adalah overfitting dan underfitting. Keduanya adalah ekstrem yang harus dihindari demi membangun model yang seimbang dan dapat diandalkan.

Apa Itu Underfitting?

Underfitting terjadi ketika model terlalu sederhana atau tidak cukup belajar dari data pelatihan. Model tidak mampu mengenali pola-pola penting dalam data, sehingga baik pada data pelatihan maupun data uji, hasil prediksinya tetap buruk.

Analoginya, seperti siswa yang tidak belajar sama sekali, sehingga baik soal latihan maupun soal ujian, semua dijawab dengan asal.

Perbandingan Overfitting dan Underfitting

Untuk membantu memahami perbedaannya, berikut adalah perbandingan karakteristik dari kedua kondisi ini:

Aspek	Overfitting	Underfitting
Definisi	Model terlalu cocok dengan data pelatihan	Model gagal belajar dari data pelatihan
Akurasi Data Latih	Sangat tinggi	Rendah
Akurasi Data Uji	Rendah	Rendah
Variansi	Tinggi	Rendah
Bias	Rendah	Tinggi

Underfitting terjadi ketika model terlalu sederhana atau belum dilatih cukup lama, sehingga tidak mampu menangkap pola penting. Ini membuat model tidak berguna untuk membuat prediksi, bahkan terhadap data pelatihan itu sendiri.

Kunci keberhasilan dalam pelatihan machine learning adalah menemukan titik keseimbangan antara underfitting dan overfitting, yang sering disebut sebagai bias-variance tradeoff.

Cara Mendeteksi Overfitting

Untuk mendeteksi apakah model mengalami overfitting, beberapa metode yang umum digunakan adalah:

Evaluasi Performa pada Data Uji
Cara paling langsung adalah dengan membandingkan akurasi model pada data pelatihan vs data uji:

Jika model sangat akurat pada data pelatihan, tetapi performanya jatuh drastis pada data uji, maka kemungkinan besar model mengalami overfitting.

Misalnya:
- Akurasi data latih: 99%
- Akurasi data uji: 68%
Perbedaan besar seperti ini merupakan tanda peringatan.
Validasi Silang (Cross-Validation)
Salah satu metode populer untuk mendeteksi overfitting adalah menggunakan teknik K-Fold Cross-Validation.
Bagaimana Cara Kerjanya?
- Data dibagi menjadi K bagian (misalnya K = 5 atau 10).
- Model dilatih menggunakan K-1 bagian, dan diuji dengan 1 bagian sisanya.
- Proses diulang sebanyak K kali, dengan bagian pengujian yang berbeda-beda.
- Rata-rata performa dari semua iterasi digunakan untuk menilai kualitas model.
Keuntungan: Model tidak hanya dievaluasi pada satu set data, tetapi pada banyak kombinasi data, sehingga lebih akurat dalam mendeteksi overfitting.
Visualisasi Kurva Loss
Memantau kurva loss (fungsi kesalahan) selama proses pelatihan juga sangat membantu.
- Training loss: menunjukkan kesalahan model terhadap data pelatihan.
- Validation loss: menunjukkan kesalahan terhadap data validasi (data yang tidak dilatih, tapi digunakan untuk evaluasi saat pelatihan).
Tanda Overfitting:
- Jika training loss terus menurun, tetapi validation loss mulai meningkat, maka model sedang terlalu menyesuaikan diri dengan data pelatihan, dan mulai kehilangan kemampuan generalisasi.
Solusi: Hentikan pelatihan lebih awal (early stopping) ketika validation loss mulai naik.

Cara Menghindari Overfitting

Menghindari overfitting tidak hanya penting, tetapi juga krusial untuk menciptakan model yang benar-benar bermanfaat di dunia nyata. Berikut adalah sejumlah teknik penting:

Early Stopping
Early stopping adalah metode yang menghentikan proses pelatihan model sebelum model mulai terlalu cocok dengan data pelatihan. Biasanya dilakukan dengan memantau akurasi atau loss pada data validasi.
Mengapa Ini Penting?
Selama pelatihan, model akan terus belajar dari data pelatihan. Namun, jika proses ini berlangsung terlalu lama, model tidak hanya mempelajari pola yang penting, tapi juga noise atau detail kecil yang tidak berguna, sehingga justru menurunkan performa saat diuji.

Contoh:
Bayangkan kamu melatih model klasifikasi gambar. Pada awalnya, akurasi validasi meningkat. Tapi setelah beberapa epoch, akurasi malah mulai turun meskipun akurasi pada data latih terus naik. Ini adalah tanda overfitting, dan early stopping bisa mencegah hal ini terjadi.

Catatan Penting:
Early stopping harus dilakukan secara hati-hati. Jika dilakukan terlalu cepat, model malah tidak sempat belajar dengan baik dan justru akan mengalami underfitting.
Menambah Jumlah Data Pelatihan
Dengan memperbanyak jumlah data pelatihan, model akan lebih sulit untuk “menghafal” semua contoh secara detail. Sebaliknya, model dipaksa untuk mengenali pola umum yang benar-benar penting dari data.

Kunci Utama:
- Data tambahan harus relevan dan representatif.
- Data yang kotor atau tidak terkait justru bisa memperburuk kinerja model.
Contoh Praktis:
Jika kamu melatih model deteksi spam pada email, menambahkan ribuan contoh email spam dan non-spam dari berbagai bahasa, platform, dan konteks akan membuat model lebih tangguh dan tidak terjebak dalam pola sempit.
Data Augmentation
Data augmentation adalah teknik menambah variasi data secara artifisial tanpa perlu mengumpulkan data baru. Ini sangat populer di bidang komputer visi seperti pengenalan wajah, deteksi objek, dan klasifikasi gambar.

Metode yang Umum Digunakan:
- Rotasi gambar
- Horizontal/vertical flip
- Zoom-in/zoom-out
- Translasi (geser ke kiri, kanan, atas, bawah)
- Perubahan pencahayaan atau warna
Manfaatnya:
- Meningkatkan ukuran dataset secara signifikan
- Membantu model melihat objek dalam berbagai posisi dan kondisi
- Meningkatkan kemampuan generalisasi
Contoh:
Sebuah model yang mengenali kucing akan belajar lebih baik jika melihat gambar kucing dari berbagai sudut dan pencahayaan.
Feature Selection
Feature selection adalah proses memilih fitur (kolom) yang paling relevan untuk digunakan dalam pelatihan model, dan membuang fitur yang tidak memberikan kontribusi signifikan.

Mengapa Ini Penting?
- Terlalu banyak fitur dapat membuat model menjadi terlalu kompleks.
- Fitur yang tidak relevan bisa menyebabkan model mempelajari pola yang salah.
- Mempercepat pelatihan dan mengurangi konsumsi memori.
Cara Umum Melakukan Feature Selection:
- Menggunakan analisis korelasi
- Menggunakan algoritme seperti Recursive Feature Elimination (RFE)
- Mengukur importance score dari fitur pada model yang telah dilatih
Contoh:
Jika kamu membangun model prediksi harga rumah, fitur seperti “warna pagar” mungkin tidak penting dibandingkan “luas tanah” atau “jumlah kamar”.
Regularisasi: Mengendalikan Kompleksitas Model
Regularisasi adalah teknik yang menambahkan penalti terhadap bobot/parameter model yang terlalu besar, untuk menghindari model menjadi terlalu fleksibel dan menyesuaikan diri secara berlebihan terhadap data pelatihan.

Jenis-jenis Regularisasi:
- L1 Regularization (Lasso)
  - Mendorong bobot fitur menjadi nol.
  - Secara otomatis menghilangkan fitur yang tidak penting.
  - Cocok untuk feature selection.
- L2 Regularization (Ridge)
  - Menyusutkan nilai bobot agar tetap kecil, tetapi tidak membuatnya nol.
  - Cocok ketika semua fitur dianggap penting namun ingin menghindari overfitting.
- Dropout (Untuk Neural Networks)
  Dropout adalah metode di mana beberapa neuron di dalam jaringan dimatikan secara acak selama pelatihan. Tujuannya adalah agar model tidak terlalu bergantung pada satu bagian jaringan tertentu, dan secara tidak langsung memperkuat kemampuan generalisasi.
Metode Ensemble
Ensemble adalah teknik menggabungkan beberapa model untuk membuat prediksi yang lebih akurat daripada hanya menggunakan satu model saja.
Dua Teknik Ensemble Populer:
- Bagging (Bootstrap Aggregating)
  Melatih beberapa model pada subset berbeda dari data pelatihan.
  Hasil akhirnya merupakan rata-rata atau voting dari semua model.
  
  Contoh: Random Forest (gabungan banyak decision tree).
- Boosting
  - Melatih model secara berurutan.
  - Model baru mencoba memperbaiki kesalahan dari model sebelumnya.
  - Meningkatkan performa dengan fokus pada data yang sulit dipelajari.
  Manfaat Ensemble:
  - Mengurangi variasi (bagging) dan bias (boosting)
  - Lebih tahan terhadap overfitting
  - Memperbaiki akurasi secara keseluruhan
  Contoh: AdaBoost, Gradient Boosting, XGBoost.

Penelitian Terbaru: Paradoks Overfitting

Secara tradisional, overfitting dianggap sebagai musuh utama dalam machine learning. Namun, penelitian terbaru pada model kompleks seperti deep learning menunjukkan hal menarik: beberapa model bekerja sangat baik bahkan ketika mereka terlihat overfitted secara teoritis.

Fenomena ini dijelaskan melalui kurva risiko ganda (double descent), di mana performa model kembali membaik setelah titik interpolasi tercapai. Artinya, dalam kondisi tertentu, overfitting bukan lagi masalah besar.

Meski demikian, teknik seperti regularisasi, early stopping, dan validasi silang tetap penting karena masih relevan dalam banyak skenario pelatihan dan model yang tidak terlalu besar.

Kesimpulan:

Dalam dunia machine learning, overfitting adalah masalah yang harus selalu diwaspadai. Meskipun model tampak hebat di atas kertas karena memiliki akurasi tinggi pada data pelatihan, model tersebut bisa gagal total ketika dihadapkan pada data baru.

Melalui pendekatan seperti validasi silang, regularisasi, pemilihan fitur, hingga metode ensemble, para praktisi dapat menciptakan model yang tidak hanya akurat tetapi juga andal.

Seiring dengan berkembangnya riset terbaru, pemahaman kita tentang overfitting juga berkembang. Namun satu prinsip tetap: generalization is king. Model yang benar-benar cerdas bukanlah yang bisa menghafal, tetapi yang bisa memahami dan beradaptasi.