Sıfır atışlı öğrenme, makine öğrenimindeki birçok sorunu çözüyor, ancak nasıl çalışıyor ve yapay zekayı nasıl daha iyi hale getiriyor?

Temel Çıkarımlar

  • Yeni verilerle doğru tahminler sağlamak için derin öğrenmede genelleme önemlidir. Sıfır atışlı öğrenme, yapay zekanın etiketli veriler olmadan yeni veya görülmemiş sınıflar hakkında doğru tahminler yapmak için mevcut bilgiyi kullanmasına izin vererek bunu başarmaya yardımcı olur.
  • Sıfır atışlı öğrenme, insanların verileri öğrenme ve işleme şeklini taklit eder. Önceden eğitilmiş bir model, ek anlamsal bilgi sağlayarak, tıpkı bir insanın içi boş gövdeli bir gitarın özelliklerini anlayarak tanımlamayı öğrenebilmesi gibi, yeni sınıfları doğru bir şekilde tanımlayabilir.
  • Sıfır atışlı öğrenme, genelleştirmeyi, ölçeklenebilirliği iyileştirerek, aşırı uyumu azaltarak ve uygun maliyetli olarak yapay zekayı geliştirir. Modellerin daha büyük veri kümeleri üzerinde eğitilmesine, aktarım öğrenimi yoluyla daha fazla bilgi edinilmesine, daha iyi bir bağlamsal anlayışa sahip olmasına ve kapsamlı etiketli verilere olan ihtiyacın azaltılmasına olanak tanır. Yapay zeka ilerledikçe sıfır atışta öğrenme, çeşitli alanlardaki karmaşık zorlukların üstesinden gelmede daha da önemli hale gelecektir.
    instagram viewer

Derin öğrenmenin en büyük hedeflerinden biri genelleştirilmiş bilgi kazanmış modelleri eğitmektir. Genelleme önemlidir çünkü modelin anlamlı kalıpları öğrenmesini ve yeni veya görünmeyen verilerle karşılaştığında doğru tahminler veya kararlar verebilmesini sağlar. Bu tür modellerin eğitimi genellikle önemli miktarda etiketli veri gerektirir. Ancak bu tür veriler maliyetli, emek yoğun ve bazen imkansız olabiliyor.

Sıfır atışlı öğrenme, bu boşluğu kapatmak için uygulanıyor ve yapay zekanın, etiketli veri eksikliğine rağmen oldukça doğru tahminler yapmak için mevcut bilgisini kullanmasına olanak tanıyor.

Sıfır Atışlı Öğrenme Nedir?

Sıfır atışlı öğrenme, transfer öğrenme tekniğinin özel bir türüdür. Yeni sınıfın özelliklerini açıklayan ekstra bilgi sağlayarak yeni veya daha önce hiç görülmemiş sınıfları tanımlamak için önceden eğitilmiş bir model kullanmaya odaklanır.

Bir modelin belirli konulara ilişkin genel bilgisini kullanarak ve ona ne arayacağına dair ekstra anlam bilgisi vererek, hangi konuyu tanımlamakla görevlendirildiğini oldukça doğru bir şekilde belirleyebilmelidir.

Diyelim ki bir zebrayı tanımlamamız gerekiyor. Ancak bu tür hayvanları tanımlayabilecek bir modelimiz yok. Böylece, atları tanımlamak ve modele siyah beyaz çizgili atların zebra olduğunu anlatmak için eğitilmiş önceden var olan bir model elde ediyoruz. Zebra ve at görselleri sağlayarak modelden çıkarım yapmaya başladığımızda, modelin her bir hayvanı doğru şekilde tanımlama şansı yüksektir.

Birçok derin öğrenme tekniği gibi, sıfır atışlı öğrenme de insanların verileri nasıl öğrendiğini ve işlediğini taklit eder. İnsanların doğal sıfır atış öğrenenleri olduğu biliniyor. Bir müzik mağazasında içi boş gövdeli bir gitar bulmakla görevlendirildiyseniz, bulmakta sorun yaşayabilirsiniz. Ama size içi boş bir gövdenin temelde bir ya da her iki yanında F şeklinde delik bulunan bir gitar olduğunu söylediğimde muhtemelen hemen bir tane bulacaksınız.

Gerçek dünyadan bir örnek olarak, sıfır atış sınıflandırma uygulamasını şu şekilde kullanalım: açık kaynak yüksek lisans barındırma sitesi Hugging Face Clip-vit-large modelini kullanarak.

Bu fotoğrafta mama sandalyesine bağlanmış bir alışveriş çantasının içindeki ekmeğin görüntüsü yer alıyor. Model, geniş bir görüntü veri kümesi üzerinde eğitildiğinden, model muhtemelen fotoğraftaki ekmek, bakkaliye ürünleri, sandalyeler ve emniyet kemerleri gibi her öğeyi tanımlayabilmektedir.

Şimdi modelin daha önce görülmemiş sınıfları kullanarak görüntüyü sınıflandırmasını istiyoruz. Bu durumda, yeni veya görünmeyen sınıflar "Rahat Ekmek", "Güvenli Ekmek", "Oturan Ekmek", "Sürüş Bakkal" ve "Güvenli Bakkal" olacaktır.

Sıfır atışlı sınıflandırmanın bir görüntü üzerinde etkinliğini göstermek için özellikle alışılmadık, görülmeyen sınıflar ve görüntüler kullandığımızı unutmayın.

Modelden çıkarım yapıldıktan sonra, %80 civarında bir kesinlikle en uygun sınıflandırmanın hangisi olduğu belirlenebilmiştir. resim "Güvenli Ekmek" idi. Bunun nedeni muhtemelen modelin mama sandalyesinin oturmak, rahatlamak veya eğlenmekten ziyade güvenlik amaçlı olduğunu düşünmesidir. sürme.

Mükemmel! Ben şahsen modelin çıktısına katılıyorum. Peki model böyle bir çıktıyı tam olarak nasıl ortaya çıkardı? İşte sıfır atışlı öğrenmenin nasıl çalıştığına dair genel bir bakış.

Sıfır Atışlı Öğrenme Nasıl Çalışır?

Sıfır atışlı öğrenme, önceden eğitilmiş bir modelin, etiketli veriler sağlamadan yeni sınıfları tanımlamasına yardımcı olabilir. En basit haliyle, sıfır adımlı öğrenme üç adımda gerçekleştirilir:

1. Hazırlık

Sıfır atışlı öğrenme, üç tür verinin hazırlanmasıyla başlar

  • Görülen Sınıf: Önceden eğitilmiş modelin eğitiminde kullanılan veriler. Model zaten görülen sınıfları sağlıyor. Sıfır atışlı öğrenme için en iyi modeller, modelin tanımlamasını istediğiniz yeni sınıfla yakından ilişkili sınıflarda eğitilmiş modellerdir.
  • Görünmeyen/Roman Sınıfı: Modelin eğitimi sırasında hiç kullanılmamış veriler. Bunu modelden alamadığınız için bu verileri kendiniz düzenlemeniz gerekecek.
  • Anlamsal/Yardımcı Veriler: Modelin yeni sınıfı tanımlamasına yardımcı olabilecek ekstra veri bitleri. Bu kelimeler, ifadeler, kelime yerleştirmeleri veya sınıf adlarında olabilir.

2. Anlamsal Haritalama

Bir sonraki adım, görünmeyen sınıfın özelliklerinin haritasını çıkarmaktır. Bu, sözcük yerleştirmeleri oluşturularak ve görünmeyen sınıfın niteliklerini veya özelliklerini sağlanan yardımcı verilere bağlayan anlamsal bir harita yapılarak yapılır. Yapay zeka aktarım öğrenimi görünmeyen sınıfla ilgili birçok özellik zaten eşlendiğinden süreci çok daha hızlı hale getirir.

3. Çıkarım yapma

Çıkarım, tahminler veya çıktılar üretmek için modelin kullanılmasıdır. Sıfır atışlı görüntü sınıflandırmasında, verilen görüntü girişi üzerinde sözcük yerleştirmeler oluşturulur ve daha sonra çizilir ve yardımcı verilerle karşılaştırılır. Kesinlik düzeyi, girdi ile sağlanan yardımcı veriler arasındaki benzerliğe bağlı olacaktır.

Sıfır Atışlı Öğrenme Yapay Zekayı Nasıl Geliştirir?

Sıfır atışlı öğrenme, makine öğrenimindeki aşağıdakiler de dahil olmak üzere çeşitli zorlukları ele alarak yapay zeka modellerini geliştirir:

  • Geliştirilmiş Genelleme: Etiketli verilere bağımlılığın azaltılması, modellerin daha büyük veri kümelerinde eğitilmesine olanak tanır, genelleştirmeyi geliştirir ve modeli daha sağlam ve güvenilir hale getirir. Modeller daha deneyimli ve genelleştikçe, modellerin sağduyuyu öğrenmesi bile mümkün olabilir bilgiyi analiz etmenin tipik yolu yerine.
  • Ölçeklenebilirlik: Modeller sürekli olarak eğitilebilir ve transfer öğrenimi yoluyla daha fazla bilgi kazanabilir. Şirketler ve bağımsız araştırmacılar, gelecekte daha yetenekli olabilmek için modellerini sürekli olarak geliştirebilirler.
  • Fazla Takılma Şansının Azaltılması: Modelin olası tüm girdileri temsil edecek kadar çeşitlilik içermeyen küçük bir veri kümesi üzerinde eğitilmesi nedeniyle aşırı uyum meydana gelebilir. Modeli sıfır atışlı öğrenme yoluyla eğitmek, modeli konuları bağlamsal olarak daha iyi anlayacak şekilde eğiterek aşırı uyum olasılığını azaltır.
  • Uygun Maliyet: Büyük miktarda etiketli veri sağlamak zaman ve kaynak alabilir. Sıfır atışlı transfer öğrenimi kullanılarak sağlam bir modelin eğitimi çok daha az zaman ve etiketli verilerle yapılabilir.

Yapay zeka ilerledikçe sıfır atışta öğrenme gibi teknikler daha da önemli hale gelecektir.

Sıfır Atışlı Öğrenmenin Geleceği

Sıfır atışlı öğrenme, makine öğreniminin önemli bir parçası haline geldi. Modellerin açık bir eğitim gerektirmeden yeni sınıfları tanımasına ve sınıflandırmasına olanak tanır. Model mimarilerinde, öznitelik tabanlı yaklaşımlarda ve çok modlu entegrasyonda devam eden ilerlemeler sayesinde sıfır atışlı öğrenme, Robotik, sağlık hizmetleri ve bilgisayar alanlarındaki karmaşık zorlukların üstesinden gelmede modellerin çok daha uyumlu hale getirilmesine önemli ölçüde yardımcı olur görüş.