Kaggle Open Dataset

Dataset X-Ray Paru-paru

Menggunakan basis data COVID-19 Radiography Database yang telah memenangkan penghargaan dari Kaggle, berisi ribuan citra yang dikurasi secara medis untuk melatih algoritma Deep Learning.

1 Seleksi Kelas Penyakit

Untuk menjaga kemurnian data dan fokus diagnosis, kami melakukan penyaringan ketat terhadap kategori yang tersedia dalam dataset asli.

🎯 3 Kelas Utama

  • Normal
  • COVID-19
  • Viral Pneumonia

❌ Eksklusi Lung Opacity

Kategori ini dihapus karena merupakan temuan klinis yang ambigu (kekeruhan paru) dan dapat beririsan secara visual dengan ketiga kelas lainnya.

💡 Alasan Klinis

Langkah ini memastikan model CNN belajar membedakan fitur patologis yang unik dan tajam, bukan pola visual yang tumpang tindih.

Visualisasi Citra Chest X-Ray per Kelas

Sample Classes

2 Prapemrosesan & Augmentasi

Semua citra diproses ulang menjadi format seragam 224x224 piksel. Kami menerapkan teknik augmentasi dinamis untuk memperkaya variasi data latihan.

Data Augmentation

🔄 Rotasi & Zoom Dinamis

Mensimulasikan berbagai sudut kemiringan pasien dan variasi jarak saat pengambilan sinar-X.

↔️ Pergeseran Piksel (Shifting)

Mencegah model hanya bergantung pada posisi objek yang berada tepat di tengah frame.