Veri Odaklı Yapay Zekâ

“There are things known and there are things unknown, and in between are the doors of perception.” — Aldous Huxley

Photo by Joy Tyson on Unsplash
Yapay zekâ sistemlerinin başarısında verilerden doğan riskler

Yapay Zekâ Sistemleri = Model /Algoritma + Veri

“Yakın tarihli yayınlar incelendiğinde, makalelerin %99'unun model odaklı olduğunu ve yalnızca %1'inin veri odaklı olduğunu ortaya çıkarıyor.”Andrew NG

✔️Model Odaklı Yaklaşım Nedir?

Problemin çözümüne ulaşırken; iyileştirmeler için model etrafında güncellemeler gerçekleştirilir. Model mimarisi ve eğitim sürecindeki iyileştirmelerin yapılması ile en uygun konfigürasyonu bulmaya odaklanılır.

✔️Veri Odaklı Yaklaşım Nedir?

Problemin çözümüne ulaşırken; doğruluğu artırmak için sistematik olarak veri kümesinde iyileştirmeler gerçekleştirilir. Veri kümesindeki etiket doğruluğu, kesinliği ve kalitesini etkileyen faktörlere odaklanılır.

Burada temel zorluk, veri mühendisliğini demokratikleştirerek yeniden kullanım verimliliğini artırmakla birlikte sürdürülebilir ve tutarlı veri kümeleri oluşturmayı hızlandırmaktır.

Verinin Önemi ve Veri Odaklı Yapay Zekâ için Sistematik Yaklaşım

Bir problemi çözmek için yapay zekâ kullanacaksak aşağıdaki gibi bir yaklaşım genel ve en kabul görmüş olanıdır. Projenin tanımı kapsamında veri toplanır, model eğitilir ve ürünleştirme sürecinde alınan geri bildirimlerle hem model hem de veri tarafında güncellemeler yapılır. Ürünleştirme sürecine insan katılımı da bir o kadar önemlidir. Buna human-in-the-loop yapay zekâ da denir.

Veri Odaklı Yapay Zekâ için Sistematik Yaklaşım
Model ve verideki iyileştirmelerin temel sonuçlara etkisi

⭐Verinin Hacmi

⭐ Verinin Tutarlılığı

Veri etiketlerindeki tutarlılık şarttır. Bu konudaki tutarsızlıklar modelinizi boşuna eğittiğiniz anlamına gelecektir. Bu bazen sizin topladığınız bir veri kümesinde değil, yüzlerce benchmark yapılmış yaygın kullanılan bir veri kümesinde bile karşınıza çıkabilir.

⭐ Verinin Kalitesi

Verilerin çözümünü istediğimiz probleme ilişkin varyasyonları kapsayan çeşitlilikte ve rastgelelikte olması isteriz. Verinin kaliteli olduğunu söyleyebilmek için dikkat etmek gereken bazı unsurlar vardır:

Görsel Kaynağı
  • Sahte korelasyonlar: İnek görseline bir gözatalım. Bir nesne sınıflama problemi üzerinde çalışırken nesnel olmayan bir özniteliğin etiketle ilişkilenmesi — yani inek 3 görselde de inekken arka planın değişmesi etiketle ilişkilenmiştir — nesne aynı olsa bile sınıflandırma sonucunu olumsuz etkiler ve arkaplana bağlı olarak çöl ortamındaki ineğe deve, karlı ortamdaki ineğe kutup ayısı deme eğiliminde olur. Bu sahte korelasyonlar istenmeyen durumların başında geliyor.
Görsel Kaynağı
  • Varyasyon eksikliği: Görüntü parlaklığı gibi nedensel olmayan bir öznitelik veri kümesinde yeterince değişemediğinde, model bu özniteliğin dağılımına fazla fit olabilir ve iyi bir genelleme yapamaz. Buna aşırı öğrenme diyoruz. Örneğin; gündüz verilerinde eğitilen modeller karanlıkta başarılı olamaz ve bunun tersi de geçerlidir. Daha fazla varyasyona sahip yeni veriler toplamanın yanı sıra, veri artırma, sahte korelasyonları ve varyasyon sorunlarının önüne geçmek için iyi bir stratejidir.
  • veri toplama/oluşturma
  • veri etiketleme
  • veri ön işleme/artırma
  • veri kalitesi değerlendirmesi
  • veri maliyeti
  • veri yönetişimi

🚴 Veri Odaklı Yapay Zekâ Yarışması

🐝 İlginizi çekebilecek diğer yazılar

⛲️ Kaynaklar

A Chat with Andrew on MLOps: From Model-centric to Data-centric AI

Merve Ayyüce Kızrak isimli yazarın Veri Odaklı Yapay Zekâ başlıklı eseri bu Creative Commons Atıf-AynıLisanslaPaylaş 4.0 Uluslararası Lisansı ile lisanslanmıştır

--

--

AI Specialist @Digital Transformation Office, Presidency of the Republic of Türkiye | Academics @Bahçeşehir University | http://www.ayyucekizrak.com/

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Ayyüce Kızrak, Ph.D.

AI Specialist @Digital Transformation Office, Presidency of the Republic of Türkiye | Academics @Bahçeşehir University | http://www.ayyucekizrak.com/