Yazı

Kurum İçi Yapay Zeka Modelleri İçin Tedarik Zinciri Güvenliği

On-Premises AI · Data Security · Best Practices · Advanced

Model bütünlüğünü doğrulama, yapay zekaya özel yazılım malzeme listeleri oluşturma ve manipüle edilmiş ağırlıkların kurum içi çıkarım altyapınıza ulaşmasını önleme yöntemleri.

Dijital güvenliği simgeleyen metal zincir üzerinde kırmızı asma kilit

Yapay Zeka Model Tedarik Zincirleri Neden Farklı Bir Tehdit Yüzeyi Oluşturur

Geleneksel yazılım tedarik zinciri güvenliği kaynak kodu, derleme hattı ve paket kayıt defterlerine odaklanır. Yapay zeka model tedarik zincirleri ise tamamen farklı bir risk kategorisi sunar. Bir model dosyası, insan tarafından okunabilir kod değildir — milyonlarca veya milyarlarca öğrenilmiş parametreye sahip serileştirilmiş bir hesaplama grafiğidir. Bir model ağırlık dosyasını, bir pull request'i karşılaştırdığınız gibi karşılaştıramazsınız. Bir ağırlık tensöründe tek bir bit değişikliği, meta verilerinde veya sağlama toplamlarında görünür bir değişiklik olmadan model davranışını incelikle değiştirebilir.

Bu opaklık, geleneksel yazılımda karşılığı olmayan saldırı fırsatları yaratır. Model kayıt defterinize erişim sağlayan bir saldırgan, üretim modelini standart kıyaslamalarda normal davranıp belirli girdi kalıplarında ince ama hatalı çıktılar üreten zehirlenmiş bir varyantla değiştirebilir. Ele geçirilmiş bir eğitim hattı, ince ayar sırasında kuantizasyon ve dağıtım boyunca varlığını sürdüren arka kapılar enjekte edebilir.

Kurum içi dağıtımlar bu risklerle özellikle yoğun biçimde karşılaşır çünkü genellikle harici kaynaklardan açık kaynak temel modeller indirip bunları özel verilerle ince ayar yapmayı içerirler. Bu zincirdeki her adım — indirme, doğrulama, depolama, ince ayar, kuantizasyon, dağıtım — açık güvenlik kontrolleri gerektiren potansiyel bir tehlike noktasıdır.

Yapay Zekaya Özel Yazılım Malzeme Listesi Oluşturma

Geleneksel uygulamalar için Yazılım Malzeme Listesi (SBOM) bağımlılıkları, sürümleri ve bilinen güvenlik açıklarını listeler. Bir Yapay Zeka Malzeme Listesi (AI-BOM) ise çok daha zengin bir köken bilgisi kümesini yakalamalıdır çünkü bir modelin "bileşenleri" kod bağımlılıklarının çok ötesine uzanır.

Kapsamlı bir AI-BOM, temel model kimliğini — temel modelin tam sürümü ve kaynağı, açıklanmışsa orijinal eğitim veri bileşimi dahil — içermelidir. Her ince ayar çalışmasını veri seti tanımlayıcısı, hiperparametreler, eğitim süresi ve çalışmayı yürüten mühendis veya hattın kimliği ile kaydetmelidir. Kuantizasyon ve optimizasyon adımları (GPTQ, AWQ, GGUF dönüşümü) kullanılan tam araç sürümleri ve parametrelerle birlikte günlüğe kaydedilmelidir.

AI-BOM ayrıca her aşamadaki değerlendirme sonuçlarını da yakalamalıdır — modelin beklenen çıktıları için temel oluşturan doğruluk metrikleri, güvenlik kıyaslamaları ve davranışsal testler. CycloneDX spesifikasyonu artık makine öğrenmesi model desteği içermektedir ve ML-SLSA çerçevesi, Google'ın SLSA çerçevesini modele özgü derleme bütünlüğünü kapsayacak şekilde genişletmektedir.

Model Eserlerinin Kriptografik İmzalanması ve Doğrulanması

Kurum içi altyapınıza giren her model eseri, kaynak noktasında kriptografik olarak imzalanmalı ve çıkarım için yüklenmeden önce doğrulanmalıdır. Bu, model manipülasyonuna karşı en etkili tek kontroldür.

İmzalama iş akışı, yerleşik kod imzalama uygulamalarını yansıtır. Bir eğitim veya ince ayar hattı bir model ürettiğinde, ağırlıklar, yapılandırma, tokenizer dosyaları ve meta veriler dahil olmak üzere tam model eserinin kriptografik bir hash'ini (en az SHA-256) hesaplar. Bu hash daha sonra kurum içi anahtar yönetim sisteminizde tutulan özel bir anahtarla imzalanır.

Sigstore'un cosign aracı, başlangıçta konteyner imajı imzalama için oluşturulmuş olup, model eseri imzalama için uyarlanmıştır ve pratik bir uygulama yolu sunar. İş yükü kimliğini kullanarak anahtarsız imzalamayı destekler, bu da otomatik hatlar için uzun ömürlü imzalama anahtarlarını yönetme yükünü ortadan kaldırır.

Doğrulama iki kritik noktada gerçekleşmelidir: bir model kayıt defterinizden servis ortamına çekildiğinde ve servis çerçevesi onu belleğe yüklediğinde. İlk kontrol, ele geçirilmiş bir kayıt defterinin manipüle edilmiş eserleri sunmasını önler. İkinci kontrol, çekme ve yükleme arasındaki disk üzerinde yapılan manipülasyonu önler.

Model İndirme ve İçe Aktarma Hattının Güvenliği

Çoğu kurum içi yapay zeka dağıtımı, harici bir kaynaktan — Hugging Face Hub, bir satıcının model deposu veya ortak bir kuruluş — bir temel model indirerek başlar. Bu ilk indirme, güven sınırınızın dışından çalıştırılabilir bir eser aktardığınız için en yüksek tedarik zinciri riski noktasıdır.

Bir karantina bölgesi oluşturun — indirilen modellerin üretim altyapınıza girmeden önce tutulduğu ağ izolasyonlu bir ortam. Bu bölgede otomatik doğrulama adımları çalıştırın: modelin yayınlanmış sağlama toplamlarını indirilen eserle karşılaştırın, serileştirilmiş model formatlarında bilinen kötü amaçlı kalıpları tarayın (picklescan aracı Python pickle serileştirilmiş modellerinde kod yürütme yüklerini algılar) ve davranışsal temel çizgiler oluşturmak için standart değerlendirme paketinizi çalıştırın.

Harici kaynaklardan doğrudan üretim ortamlarına indirmeye asla izin vermeyin. Bunun yerine, karantina kontrollerinden geçtikten sonra onaylanmış modelleri dahili kayıt defterinize yansıtan bir model proxy'si uygulayın. Ortaklardan veya satıcılardan alınan modeller için imzalı eserler ve AI-BOM'lar sağlamalarını talep edin. Bunu satıcı sözleşmelerinize veri işleme anlaşmaları gibi dahil edin.

Çalışma Zamanı Bütünlük İzleme

Tedarik zinciri güvenliği dağıtımla sona ermez. Üretimde çalışan modeller, dağıtım sonrası manipülasyonu veya dağıtım öncesi kontrolleri atlayan bir tedarik zinciri ihlalini gösterebilecek davranışsal anomaliler açısından sürekli izlenmelidir.

Düzenli aralıklarla her modele sabit bir kanonik girdi kümesi göndererek ve çıktıları AI-BOM'unuzdaki bilinen iyi temel çizgilerle karşılaştırarak davranışsal parmak izi uygulayın. Çıktılardaki istatistiksel olarak anlamlı herhangi bir sapma — model dosyasının sağlama toplamı değişmemiş olsa bile — araştırmayı gerektirir.

AIDE veya OSSEC gibi araçlar kullanarak disk üzerindeki model eserlerinin dosya bütünlüğünü izleyin; model ağırlık dosyalarında, yapılandırma dosyalarında veya tokenizer sözlüklerinde herhangi bir değişiklik olduğunda uyarı verecek şekilde yapılandırın. Konteynerize dağıtımlarda, model depolaması için salt okunur dosya sistemleri kullanın.

Model tedarik zinciri ihlaline özel olay müdahale prosedürleri oluşturun. Bunlar geleneksel olay müdahalesinden farklıdır çünkü düzeltme basitçe "yama uygula ve yeniden dağıt" değildir. Ele geçirilmiş bir model, tespit edilmeden önce bilinmeyen bir süre boyunca hatalı çıktılar üretmiş olabilir; bu da o modelin çıktılarına dayanan tüm kararları tespit etmenizi ve etkilerini değerlendirmenizi gerektirir.

Model Tedarik Zincirlerini Güçlendiren Organizasyonel Uygulamalar

Teknik kontroller gerekli ancak yetersizdir. Model tedarik, depolama ve dağıtım etrafındaki organizasyonel uygulamalar, teknik kontrollerinizin tutarlı biçimde uygulanıp uygulanmadığını veya rutin olarak atlanıp atlanmadığını belirler.

Her model ailesi için net sahiplik atamaları bulunan, güvenlik inceleme sürecinizden geçmiş modellerin küratörlüğünü yapan bir onaylanmış model kayıt defteri sürdürün. Bir ekip yeni bir model kullanmak istediğinde, modelin kökenini, kaynağının güvenilirliğini ve belgelerinin eksiksizliğini değerlendiren bir inceleme sürecinden geçirsin.

Makine öğrenmesi mühendislerinizi yapay zekaya özgü tedarik zinciri riskleri konusunda eğitin. Çoğu mühendis yazılım bağımlılık risklerinin farkındadır ancak model dosyalarını saldırı vektörleri olarak düşünmez. Pratik eğitim alıştırmaları — ince ayar yapılmış bir modelde arka kapı enjeksiyonu gösterimi gibi — model kaynak bulma ve işleme konusundaki günlük kararlar için gereken güvenlik sezgisini oluşturur.

Son olarak, model tedarik zinciri güvenliğini mevcut risk yönetimi çerçevenize entegre edin. Yüksek riskli kararlar veren modeller (kredi puanlama, tıbbi triyaj, güvenlik sistemleri) düşük riskli dahili araçlar için kullanılan modellerden daha katı köken kontrollerine ihtiyaç duyar. Kademeli bir yaklaşım, güvenlik kontrollerinin bir ihlalin potansiyel etkisiyle orantılı olmasını sağlayarak sistemi ekipleriniz için pratik ve sürdürülebilir tutar.

Öne çıkan görsel: FlyD tarafından Unsplash'ta yayınlanmıştır.