Yazı

Kurum İçi Yapay Zeka Model Kayıt Defteri: Makine Öğrenimi için Sürüm Kontrolü

On-Premises AI · MLOps · AI Architecture · Best Practices · Intermediate

Kurum içi yapay zeka altyapınıza sürüm kontrolü, köken takibi ve tekrarlanabilirlik kazandıran bir model kayıt defterini nasıl tasarlayacağınızı ve uygulayacağınızı öğrenin.

Sunucu altyapısında düzgünce bağlanmış fiber optik kablolar

Model Kayıt Defteri Kurum İçi Altyapılarda Neden Önemli?

Bulut ortamında yapay zeka çalıştıran kuruluşlar için AWS SageMaker Model Registry veya Azure ML gibi yönetilen hizmetler model sürümlemeyi arka planda halleder. Kurum içi yapay zeka çalıştıran ekipler ise bu lükse nadiren sahiptir. Modeller genellikle paylaşılan dosya sistemlerinde, S3 uyumlu depolama alanlarında veya daha kötüsü bireysel geliştirici makinelerinde tutulur. Sonuç tahmin edilebilirdir: ekipler üretimde hangi model sürümünün çalıştığını kaybeder, üç ay önceki sonuçları yeniden üretemez ve yeni bir dağıtım performansı düşürdüğünde güvenilir bir geri alma yolu bulamaz.

Bir model kayıt defteri bu sorunu, kuruluşunuzun ürettiği her model için tek doğru kaynak olarak çözer. Yalnızca model ağırlıklarını değil, bu ağırlıkları anlamlı kılan meta verileri de depolar: eğitim verisi referansları, hiperparametreler, değerlendirme metrikleri, köken bilgisi ve dağıtım durumu. Bunu makine öğrenimi yapıtlarınız için bir Git sistemi olarak düşünün; takip edilen nesneler kilobayt yerine genellikle gigabayt boyutundadır.

Kurum İçi Model Kayıt Defterinin Temel Bileşenleri

İyi tasarlanmış bir model kayıt defteri, her biri belirli bir operasyonel ihtiyacı karşılayan birbiriyle bağlantılı dört katmandan oluşur:

  • Yapıt depolama: Model dosyalarının, ağırlıkların ve ilişkili varlıkların fiziksel olarak saklandığı katman. Kurum içi ortamda bu genellikle MinIO gibi S3 uyumlu nesne depolama veya CephFS gibi dağıtık dosya sistemi anlamına gelir. Temel gereksinim, içerik adreslenebilir depolamadır: her yapıt, bütünlüğü doğrulayabileceğiniz ve müdahaleyi tespit edebileceğiniz benzersiz bir hash alır.

  • Meta veri katalogu: Model hakkında modelin kendisi dışındaki her şeyi depolayan yapılandırılmış bir veritabanı (PostgreSQL bu iş için iyi çalışır). Sürüm numaraları, eğitim parametreleri, veri seti parmak izleri, değerlendirme puanları, yazarlık bilgisi, zaman damgaları ve etiketler buna dahildir. Meta veri katalogu, kayıt defterini aranabilir ve denetlenebilir kılan bileşendir.

  • Köken grafiği: Her modelin nasıl üretildiğini izleyen yönlendirilmiş döngüsüz bir graf. Hangi veri seti kullanıldı? Hangi ön işleme hattı dönüştürdü? Hangi eğitim çalışması ağırlıkları üretti? Köken bilgisi, "bu model neden böyle davranıyor?" sorusunu yanıtlar ve üretim sorunlarını ayıklamak için vazgeçilmezdir.

  • Yaşam döngüsü durum makinesi: Modeller tanımlı aşamalardan geçer: geliştirme, hazırlık, üretim, arşivlenmiş, kullanımdan kaldırılmış. Kayıt defteri bu geçişleri zorunlu kılar ve yalnızca doğrulama kapılarından geçen modellerin üretime yükseltilmesini sağlar. Bu, kalite kontrollerini atlayan geçici dağıtımları önler.

Kurum İçi Dağıtım için Doğru Aracı Seçmek

Kurum içi model kayıt defteri altyapısı olarak kullanılabilecek birçok açık kaynaklı araç mevcuttur. Doğru seçim, mevcut altyapınıza ve ekip yeteneklerinize bağlıdır.

MLflow Model Registry en yaygın kullanılan seçenektir. MLflow'un deney takibi ile yerel olarak entegre olur ve programatik erişim için REST API sağlar. MLflow, PostgreSQL arka ucu ve S3 uyumlu yapıt deposuyla tamamen kurum içinde çalışır. Ana kısıtlaması, köken takibinin nispeten sığ olmasıdır: modelleri çalıştırmalara bağlar, ancak ek araçlar olmadan veri kökenini yukarı akış hatlarından izlemez.

DVC (Data Version Control) Git-yerel bir yaklaşım benimser. Model dosyaları, Git uyumlu meta veri dosyaları kullanılarak kodla birlikte izlenirken gerçek yapıtlar uzak depolamada bulunur. DVC, her deneyin bir commit olması nedeniyle tekrarlanabilirlikte mükemmeldir, ancak özel otomasyon oluşturmadan üretim ekiplerinin ihtiyaç duyduğu yaşam döngüsü yönetim özellikleri (hazırlık, onay iş akışları) sunmaz.

Çoğu kurumsal kurum içi dağıtım için MLflow; özellik seti, topluluk desteği ve operasyonel olgunluk açısından en iyi dengeyi sunar. MinIO ile yapıt depolama ve PostgreSQL ile meta veri depolama birleştirildiğinde, tamamen ağ çevreniz içinde çalışan bir kayıt defteri yığını elde edersiniz.

Gerçekten İşe Yarayan Köken Takibi Uygulamak

Köken takibi, çoğu ekibin uygulamayı planladığı ama en sık yanlış yaptığı özelliktir. Yaygın başarısızlık şekli, kökenin belgeleme olarak ele alınmasıdır — mühendislerin eğitimden sonra elle doldurduğu bir şey. Elle tutulan köken bilgisi her zaman eksik ve sıklıkla yanlıştır.

Etkili köken takibi otomatik ve değiştirilemez olmalıdır. Her eğitim çalışması, girdilerini (veri seti sürümü, yapılandırma dosyası hash'i, temel model referansı), ortamını (konteyner görüntü özeti, kütüphane sürümleri, donanım özellikleri) ve çıktılarını (model yapıt hash'i, değerlendirme metrikleri) programatik olarak kaydetmelidir. Bu, eğitim hatlarınızdaki enstrümantasyon yoluyla gerçekleşir, elle etiketleme yoluyla değil.

Pratik bir yaklaşım, eğitim giriş noktalarınızı bu bilgiyi otomatik olarak yakalayan bir dekoratör veya bağlam yöneticisi ile sarmaktır. Bir veri bilimci eğitim işi çalıştırdığında, sarmalayıcı eğitim kodunun Git commit'ini, girdi veri setinin hash'ini, kullanılan tam konteyner görüntüsünü ve tüm hiperparametreleri kaydeder. Ortaya çıkan model yapıtı, tüm bu köken bilgisi eklenmiş olarak kayıt defterine kaydedilir.

Köken takibi, olay müdahalesi sırasında özellikle değerli hale gelir. Üretim modeli beklenmeyen çıktılar üretmeye başladığında, köken grafiği üzerinden geriye doğru izleyerek tam olarak neyin değiştiğini belirleyebilirsiniz: veri, kod, yapılandırma veya temel model. Köken bilgisi olmadan bu araştırma tahmine dönüşür.

Yaşam Döngüsü Yönetimi ve Yükseltme Kapıları

Yaşam döngüsü yönetimi olmayan bir model kayıt defteri, ekstra meta verili bir dosya deposundan ibarettir. Gerçek operasyonel değer, yükseltme kapılarının zorunlu kılınmasından gelir: bir modelin bir aşamadan diğerine geçmeden önce başarıyla tamamlaması gereken otomatik kontroller.

Tipik bir yaşam döngüsü şöyle görünür: yeni eğitilmiş bir model, kayıt defterine Geliştirme aşamasında girer. Hazırlık aşamasına geçmek için, ayrılmış test setine karşı otomatik değerlendirmeyi geçmeli ve minimum performans eşiklerini karşılamalıdır. Üretime ulaşmak için, hazırlık ortamında entegrasyon testlerini geçmeli, mevcut üretim modeline kıyasla temel metriklerde gerileme olmadığını kanıtlamalı ve belirlenmiş bir denetçiden onay almalıdır.

Bu kapıları, kayıt defteri olayları tarafından tetiklenen CI/CD hattı aşamaları olarak uygulayın. Bir model kaydedildiğinde, bir webhook tetiklenir ve değerlendirme hattını başlatır. Sonuçlar meta veri olarak kayıt defterine geri yazılır. Kapı kriterlerini karşılamayan yükseltme talepleri, hangi kontrollerin başarısız olduğuna dair net bir açıklama ile otomatik olarak reddedilir.

Kayıt Defterini Çok Ekipli Ortamlar için Ölçeklendirmek

Daha fazla ekip kayıt defterini benimsedikçe, erişim kontrolü ve organizasyon kritik hale gelir. Her ekibin, isim çakışması veya yanlışlıkla üzerine yazma riski olmadan kendi modellerini yönetebilmesi için alan adı izolasyonu uygulayın. Her alan içinde rol tabanlı erişim zorunlu kılın: veri bilimciler model kaydedebilir ve etiketleyebilir, ML mühendisleri hazırlık aşamasına yükseltebilir ve yalnızca belirlenen üretim operatörleri üretim dağıtımlarını onaylayabilir.

Model sayısı arttıkça depolama ölçeklendirmesi dikkat gerektirir. Kullanımdan kaldırılmış veya arşivlenmiş aşamadaki modelleri yapılandırılabilir bir saklama süresinden sonra daha ucuz depolama katmanlarına taşıyan otomatik arşivleme politikaları uygulayın. Meta verileri süresiz olarak saklayın — küçüktür ve denetim gereksinimlerini karşılar — ancak büyük yapıt dosyalarını soğuk depolamaya taşıyın.

Son olarak, bir arama ve karşılaştırma arayüzüne yatırım yapın. Ekiplerin belirli bir görev için en iyi performans gösteren modeli hızla bulması, sürümler arası metrikleri karşılaştırması ve bir modelin diğerinden neden daha iyi performans gösterdiğini anlaması gerekir. İyi dizinlenmiş bir meta veri katalogu, kayıt defteriyle çalışma sürtünmesini önemli ölçüde azaltır ve kuruluş genelinde benimsemeyi artırır.

Kapak görseli: Albert Stoynov, Unsplash.