Bu çalışma, "TFT-Flood for Nationwide Flood Prediction in Turkey: A Three-Branch Hybrid Deep Learning Architecture" başlığıyla IEEE Sinyal İşleme ve İletişim Uygulamaları Kurultayı'nda (SIU 2026) yayımlanmak üzere kabul edilmiştir.
Proje Özeti
Bu proje, Türkiye genelindeki ilçeler için günlük sel riski tahmini yapan bir yapay zeka sistemidir. Araştırma modeli TFT-Flood, Temporal Fusion Transformer'dan ilham alan üç dallı hibrit bir derin öğrenme mimarisidir ve 8 günlük zaman pencereleri üzerinde çalışır. Model, 973 ilçeyi kapsayan 6.372 dizilik veri seti üzerinde, tahmin gününün maskelendiği sızıntısız (leak-free) 1 günlük tahmin protokolü altında değerlendirilmiştir.
8-seed ensemble, 0.909 AUC (F1 0.84, Precision 0.88, Recall 0.81) ile altı kıyaslama (baseline) modelinin tamamını geçmiştir. Canlı sistem ise her gün otomatik çalışarak güncel meteorolojik ve hidrolojik verileri çeker, ilçe bazlı risk analizi yapar ve interaktif bir choropleth harita oluşturur.
Kullanılan Teknolojiler
| Kategori | Teknolojiler |
|---|---|
| Model Mimarisi | Temporal Fusion Transformer (TFT), Bi-LSTM, GRN/VSN — ~234K parametre |
| Yapay Zeka | Keras 3 (PyTorch backend), AdamW + cosine LR |
| Veri İşleme | Pandas, NumPy, Scikit-learn |
| Görselleştirme | Folium (Leaflet.js), Matplotlib |
| Veri Kaynakları | TUCBS açık veri (DSI + AFAD sel olayları, 2000–2020), ERA5 + NASA POWER, DSI debi arşivi, Open-Meteo API |
| Donanım | RTX 3050 Ti (4 GB VRAM) — dizi başına çıkarım < 5 ms |
Öne Çıkan Özellikler
- Sızıntısız (Leak-Free) Protokol: Tahmin günü maskelenir; kümülatif öznitelikler yalnızca görünür pencere üzerinden yeniden hesaplanır.
- İlçe Bazlı Tahmin: Türkiye'nin 973 ilçesi için 1 gün ileri (24 saat) sel olasılığı üretir.
- Eşleştirilmiş Zor Negatif Örnekleme: Her sel için aynı ilçe, klimatolojik hafta ve aylık sayımları paylaşan negatif dizi (Pearson r > 0.99) — sadece zamansal dinamikler ayırt edici olur.
- Mekânsal Artırma (k-NN): Her ilçe, 1-hop K-en yakın komşu (k=8, ≤50 km) ortalamasıyla zenginleştirilir; sızıntıyı önlemek için yalnızca eğitim düğümleri kullanılır.
- Hibrit Veri Yapısı: Hem dinamik (hava durumu) hem statik (arazi yapısı) verileri kullanır.
Sistem Mimarisi
TFT-Flood, her ilçe için 8 günlük zaman penceresini analiz eden üç paralel daldan oluşur:
- Branch A — Statik Zenginleştirme: Statik öznitelikleri dört GRN bloğuyla işleyerek bağlam vektörleri üretir.
- Branch B — Zamansal İşleme: Değişken Seçim Ağı (VSN) + Bi-LSTM ile zamansal dinamikleri kodlar.
- Branch C — Risk Niceleme: Son zaman adımını statik bağlamla birleştirip GRN-MLP başlığıyla sel olasılığını ve 4 sınıflı risk skorunu üretir.
Girdi Özellikleri: 7 dinamik (toplam yağış, yağmur, max/min sıcaklık, rüzgar hızı, toprak nemi, DSİ debisi) + 8 türetilmiş dinamik (3/5 günlük kümülatif yağış, yağış değişim hızı, sıcaklık×yağış, toprak×yağış, yağış yoğunluğu, sıcaklık aralığı, debi×yağış) = 15 dinamik; ayrıca 8 statik (yükseklik, eğim, en yakın göle uzaklık, su yüzeyi oranı, CORINE arazi örtüsü).
Kıyaslama (Baseline) Karşılaştırması
v8_full (6.372 dizi, 973 ilçe) üzerinde, sızıntısız 1 günlük tahmin protokolü altında altı baseline ile karşılaştırma. TFT-Flood (8-seed ensemble) en yüksek AUC ve F1'i elde eder:
| Model | AUC | F1 | Precision | Recall |
|---|---|---|---|---|
| Logistic Regression | 0.787 | 0.750 | 0.721 | 0.782 |
| Random Forest | 0.905 | 0.842 | 0.913 | 0.782 |
| XGBoost | 0.897 | 0.842 | 0.907 | 0.786 |
| Pure Bi-LSTM | 0.891 | 0.833 | 0.874 | 0.795 |
| ST-GNN | 0.896 | 0.834 | 0.901 | 0.776 |
| Informer-lite | 0.900 | 0.834 | 0.901 | 0.776 |
| TFT-Flood (ensemble) | 0.909 | 0.844 | 0.884 | 0.807 |
Sonuçlar
- AUC (8-seed ensemble): 0.909 | seed başına ortalama 0.897 ± 0.004
- F1 / Precision / Recall: 0.84 / 0.88 / 0.81
- Veri Seti: 6.372 dizi, 973 ilçe (5.950 TUCBS + 422 NASA POWER backfill)
- Zamansal (kronolojik) bölme: AUC 0.606 — dağılım kayması altında dahi tüm baseline'ları geçer.
Bu proje, afet yönetimi ve erken uyarı sistemlerinde yapay zekanın gücünü göstermektedir.