Apple’ın merakla beklenen Kişiselleştirilmiş Siri özelliğini geçen ay iOS 18.4’ün piyasaya sürülmesiyle birlikte yayınlaması bekleniyordu. Ancak daha sonra bu yeni aracın gelecek yıla erteleneceği doğrulandı. Apple’ın yapay zeka modellerini Apple Intelligence referansıyla nasıl eğittiğine dair ayrıntıları paylaşan yeni bir rapor ortaya çıktı.
Apple, Kişiselleştirilmiş Siri özelliklerinin gelecek yıla erteleneceğini resmi olarak belirtmiş olsa da, şirket içindeki çalışanlar özelliğin bu yılın sonlarında kullanıma hazır olacağına dair giderek daha fazla güven duyuyor. Bloomberg’in yeni bir raporunda, Apple’ın Apple Intelligence için yapay zeka modellerini nasıl eğittiği vurgulanıyor. Rapor, Apple’ın Makine Öğrenimi Araştırma web sitesindeki bir blog gönderisine atıfta bulunarak, Apple’ın yapay zeka modellerini eğitmek için sentetik verileri nasıl kullandığını açıklıyor. Daha önce birkaç kez Apple’ın yapay zeka yarışında rakiplerinin gerisinde kaldığını bildirmiştik ve şirketin yapay zeka modellerini eğitmek için sentetik veri kullanma stratejisi biraz alışılmadık ve sınırlamaları var. Örneğin, özetleme veya daha uzun cümleler veya tam teşekküllü e-postalar gerektiren yazma araçları söz konusu olduğunda, verilerin “trendleri anlaması” zahmetli olabiliyor.
Apple bunu dikkate aldı ve sentetik verileri son kullanıcı e-postalarının bir örneğiyle karşılaştırarak bu sınırlamaların üstesinden gelmesini sağlayacak yeni bir teknolojiyi vurguladı. Ancak bu süreç, kullanıcı gizliliğinden ödün vermiyor.
Modellerimizi geliştirmek için, mesajlarda en yaygın olan konuları kapsayan çok sayıda e-posta oluşturmamız gerekiyor. Temsil edici bir sentetik e-posta kümesi oluşturmak için, çeşitli konularda geniş bir sentetik mesaj kümesi oluşturarak başlıyoruz. Örneğin, “Yarın saat 11:30’da tenis oynamak ister misiniz?” gibi sentetik bir mesaj oluşturabiliriz. Bu, bireysel kullanıcı e-postaları hakkında herhangi bir bilgi olmadan yapılır. Daha sonra, mesajın dili, konusu ve uzunluğu gibi bazı temel boyutlarını yakalayan, gömütleme adı verilen bir temsil türetiyoruz. Bu gömütlemeler daha sonra Cihaz Analitiği’ne katılan az sayıda kullanıcı cihazına gönderiliyor.
Katılımcı cihazlar daha sonra son kullanıcı e-postalarından küçük bir örnek seçer ve bunların gömütlemelerini hesaplar. Her cihaz daha sonra bu örneklere hangi sentetik gömütlemenin en yakın olduğuna karar verir. Diferansiyel gizlilik kullanarak Apple, herhangi bir cihazda hangi sentetik gömütlemenin seçildiğini öğrenmeden, tüm cihazlardaki en sık seçilen sentetik gömütlemeleri öğrenebilir.
Bu en sık seçilen sentetik gömütlemeler daha sonra eğitim veya test verileri oluşturmak için kullanılabilir veya veri kümesini daha da iyileştirmek için ek düzenleme adımları çalıştırabiliriz. Örneğin, tenis oynama mesajı en iyi gömütlemelerden biriyse, “tenis” yerine “futbol” veya başka bir sporun geçtiği benzer bir mesaj oluşturulup bir sonraki düzenleme turu için kümeye eklenebilir (Şekil 1’e bakınız). Bu süreç, sentetik e-postalarımızın konularını ve dilini geliştirmemize olanak tanır, bu da modellerimizi e-posta özetleri gibi özelliklerde daha iyi metin çıktıları oluşturacak şekilde eğitmemize yardımcı olurken gizliliği de korur.
Şirket sınırlamaların farkında olsa da, yeni teknolojinin kullanıcı gizliliğinden ödün vermeden veya bilgi toplamadan genel eğilimleri daha iyi anlamalarını sağlayacağını açıklıyor. Bloomberg ayrıca şirketin bu yeni teknolojiyi iOS 18.5 ve macOS 15.5’in yeni bir beta sürümünde yayınlayacağını iddia ediyor. Konuyla ilgili Apple’ın tam gönderisine buradan göz atabilirsiniz.