Nesne Algılama Yaklaşımlarına “Transformer” Devrimi

“Bilimde yeni olgular elde etmekten daha önemli olan şey, olgular üzerine yeni düşünme yolları keşfetmektir.” Lawrence Bragg

Photo by Samule Sun on Unsplash

Nesne Algılama için Transformer kullanma fikri

DETR Pipeline

DETR, ortak bir CNN’i Transformer mimarisiyle birleştirerek nihai algılama kümesini paralel olarak tahmin eder. Eğitim sırasında, iki taraflı eşleştirme, referans kutuları (ground truth) ile benzersiz bir şekilde tahminler hesaplar. Eşleşme olmayan tahminler “nesnesiz” sınıf tahmini olarak hesaplanır.

Eğitim

Başlangıç model (Backbone)

Transformers nasıl çalışır?

Vaswani ve diğerleri tarafından “Attention is All You Need” den Transformatör Mimarisi.

Kodlayıcı

Kod çözücü

İleri Besleme Ağı (FFN)

Yitim/KayıpFonksiyonu

Nasıl bir graf tekniği uygulanır?

En düşük maliyetle önceden ve gt arasında en iyi eşleşme.
Maliyet Fonksiyonunu Eşleştirme
Pred ve gtarasındaki Hungarian Yitimi

Kutu Yitim Fonksiyonu (L_box)

Kutu Yitim Fonksiyonu

🎯 Sonuçlar

COCO veri kümesinde DETR sonuçları

💻 Uygulama

Ph.D. Candidate at Yıldız Technical University | AI Researcher at Bahçeşehir University | www.ayyucekizrak.com/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store