Yazı

Şirket içi Federe Öğrenme: Ham Veriyi Paylaşmadan İşbirlikçi Yapay Zeka

On-Premises AI · Data Security · AI Architecture · Advanced

Hassas verileri her departman veya tesiste tutarak, şirket içi düğümler arasında federe öğrenme uygulayarak daha iyi modeller nasıl eğitilir?

Aydınlatılmış sunucu altyapısına sahip fütüristik veri merkezi şehir manzarası

Veri Silosu Paradoksu

Şirket içi yapay zeka çalıştıran kurumlar sürekli bir gerilimle karşı karşıyadır: modeller daha fazla veriyle daha iyi performans gösterir, ancak organizasyonel, düzenleyici ve güvenlik kısıtlamaları verilerin tek bir konumda toplanmasını engeller. Bir hastane ağı, karmaşık gizlilik düzenlemelerini aşmadan birden fazla tesisten hasta kayıtlarını tek bir eğitim setinde birleştiremez. Bir üretim holdingi, fikri mülkiyet riskini göze almadan tesisler arasında tescilli süreç verilerini aktaramaz.

Bu durum veri silosu paradoksu olarak adlandırdığımız sorunu yaratır: her düğüm orta düzey bir model eğitmeye yetecek veriye sahiptir, ancak toplu veri havuzu önemli ölçüde daha iyi bir model üretecektir. Geleneksel yaklaşımlar ikili bir seçim dayatır: veriyi merkezileştirip riski kabul edin ya da dağıtık tutup daha zayıf modelleri kabul edin.

Federe öğrenme bu gerilimi eğitim sürecini tersine çevirerek çözer. Veriyi modele getirmek yerine, modeli veriye götürürsünüz. Her düğüm kendi veri seti üzerinde yerel olarak eğitim yapar ve yalnızca model güncellemeleri — gradyanlar veya ağırlık deltaları — merkezi bir toplama sunucusuyla paylaşılır. Ham veri asla kaynağını terk etmez.

Federe Öğrenme Şirket içinde Nasıl Çalışır

Şirket içi bir federe öğrenme sistemi genellikle turlar halinde çalışır. Her turda merkezi sunucu, mevcut global modeli tüm katılımcı düğümlere dağıtır. Her düğüm, modeli yerel verileri üzerinde belirli sayıda epoch boyunca eğitir ve ortaya çıkan ağırlık güncellemelerini hesaplar. Bu güncellemeler merkezi sunucuya geri gönderilir ve sunucu bunları — genellikle Federated Averaging (FedAvg) kullanarak — toplayarak geliştirilmiş bir global model üretir. Model yakınsamaya ulaşana kadar süreç tekrarlanır.

Mimari üç altyapı bileşeni gerektirir:

  • Koordinasyon sunucusu: Eğitim turlarını yönetir, model kontrol noktalarını dağıtır ve toplama işlemini gerçekleştirir. GPU kaynağına ihtiyaç duymaz — toplama hesaplama açısından hafiftir. NVIDIA FLARE, PySyft ve Flower gibi araçlar tamamen şirket içinde çalışan üretim kalitesinde koordinasyon çerçeveleri sunar.

  • Eğitim düğümleri: Her düğümün modeli yerel veriler üzerinde eğitmek için yeterli hesaplama gücüne ihtiyacı vardır. Donanım gereksinimleri model boyutuna ve veri setine bağlıdır.

  • Güvenli iletişim katmanı: Model güncellemeleri, düğümler ve koordinasyon sunucusu arasında şifreli kanallar üzerinden iletilmelidir. Şirket içi ortamlarda bu genellikle dahili ağınız üzerinden TLS şifreli gRPC bağlantıları anlamına gelir.

Non-IID Veri Dağılımlarını Ele Alma

Federe öğrenmede en büyük pratik zorluk non-IID (bağımsız ve eşit dağılımlı olmayan) veridir. Merkezi bir kurulumda eğitim veriniz karıştırılır ve eşit şekilde gruplandırılır. Federe öğrenmede ise her düğüm, yerel bağlamı tarafından şekillenen farklı bir veri dağılımına sahiptir — kırsal bir bölgedeki hastane, kentsel bir bölgedekinden farklı hasta demografileri görür.

Non-IID veriler federe eğitimin sapmasına veya ortalamada iyi ancak bireysel düğümlerde kötü performans gösteren bir global model üretmesine neden olabilir. Birkaç strateji bunu hafifletir:

  • FedProx: Yerel eğitim hedefine, global modelden büyük sapmaları cezalandıran bir yakınsal terim ekler. Bu, herhangi bir düğümün modeli yerel dağılımına doğru fazla çekmesini önler.

  • Kişiselleştirme katmanları: Temel modeli federe tutarken her düğümün yerel uyarlama katmanlarını korumasına izin verir. Paylaşılan katmanlar genel özellikleri öğrenirken kişiselleştirme katmanları düğüme özgü kalıpları yakalar.

  • Veri artırma: Eğitim öncesinde dağılımları dengelemek için yetersiz temsil edilen sınıfları yerel olarak sentezler. Gerçek veri paylaşımı gerektirmez ancak her düğümün daha dengeli gradyanlar katkıda bulunmasına yardımcı olur.

Güvenlik ve Gizlilik Hususları

Federe öğrenme ham veri paylaşımından kaçınsa da model güncellemelerinin kendisi bilgi sızdırabilir. Araştırmalar, özellikle görüntü verileri ve küçük parti boyutları için gradyan tersine çevirme saldırılarının gradyanlardan eğitim örneklerini yeniden oluşturabildiğini göstermiştir. Şirket içi dağıtımlar ek korumalar katmalıdır:

Güvenli toplama, koordinasyon sunucusunun bireysel düğüm güncellemelerini değil, yalnızca toplu sonucu görmesini sağlar. Gizli paylaşım gibi kriptografik protokoller kullanan uygulamalar, koordinasyon sunucusu dahil hiçbir tarafın belirli bir düğümün katkısını incelemesini engeller.

Diferansiyel gizlilik, iletim öncesinde model güncellemelerine kalibre edilmiş gürültü ekler. Herhangi bir eğitim örneğinin güncelleme üzerindeki etkisini sınırlayarak, yeniden yapılandırma saldırılarına karşı matematiksel garantiler sağlar. Ödünleşim model doğruluğudur — daha fazla gürültü daha güçlü gizlilik ama daha yavaş yakınsama demektir.

Gradyan sıkıştırma, iletilen güncellemelerin boyutunu top-k seyrekleştirme veya kuantizasyon gibi tekniklerle azaltır. Bu hem ağ bant genişliği gereksinimlerini düşürür hem de saldırganın daha az bilgi alması nedeniyle gradyan tersine çevirme saldırılarını zorlaştırır.

Pratik Uygulama Kalıpları

Tek bir koordinasyon sunucusunun tüm düğümleri yönettiği bir merkez-uç (hub-and-spoke) topolojisi ile başlayın. Bu en basit mimaridir ve 50'den az katılımcı düğüme sahip çoğu kurumsal dağıtım için yeterlidir. Ölçeklendikçe, bölgesel sunucuların global sunucuya göndermeden önce yerel olarak toplayıp gönderdiği hiyerarşik toplama modelini değerlendirin.

Geç kalan düğümleri — eğitim turlarını tamamlamada yavaş kalan düğümleri — asenkron toplama ile yönetin. Tüm düğümlerin raporlamasını beklemek yerine, güncellemeleri geldikçe toplayın ve güncellenmiş modelleri daha hızlı düğümlere dağıtın.

Katkı doğrulaması uygulayarak bozuk veya düşmanca güncellemeler gönderen düğümleri tespit edin. Basit yaklaşımlar arasında her düğümün güncelleme büyüklüğünü popülasyon medyanıyla karşılaştırmak ve istatistiksel aykırı değerleri işaretlemek yer alır. Daha sofistike yöntemler, kötü niyetli katılımcılara dayanıklı Krum veya Trimmed Mean gibi Bizans-dirençli toplama algoritmaları kullanır.

Federe Öğrenme Ne Zaman Doğru Tercih?

Federe öğrenme evrensel bir çözüm değildir. Merkezi eğitime kıyasla önemli bir karmaşıklık ekler ve bu karmaşıklık gerçek kısıtlamalarla gerekçelendirilmelidir. Düzenleyici gereksinimler (GDPR, KVKK, sektöre özgü yönetmelikler), organizasyonel sınırlar (ortak girişimler, çok taraflı işbirlikleri) veya ağ sınırlamaları nedeniyle merkezileştirilemeyen birden fazla lokasyona dağılmış veriniz olduğunda doğru yaklaşımdır.

Veriniz merkezileştirilebilir ancak taşınması yalnızca zahmetliyse, bunun yerine daha iyi bir veri hattına yatırım yapın. Gerçek veri dağıtım kısıtlamalarıyla karşı karşıya olan organizasyonlar için federe öğrenme, daha önce imkansız olan işbirlikçi model iyileştirmesini mümkün kılar — veri silosu paradoksunu bir sınırlamadan mimari bir avantaja dönüştürür.

Öne çıkan görsel: Markus Stickling, Unsplash.