Bu araç setini kullanarak takviyeli öğrenme algoritmaları geliştirin ve karşılaştırın.

Sıfırdan bir makine öğrenimi modeli oluşturamıyorsanız veya altyapınız yoksa uygulamanızı çalışan bir modele bağlamanız boşluğu giderir.

Yapay zeka herkesin öyle ya da böyle kullanması için burada. OpenAI Gym'e gelince, takviyeli öğrenme ajanlarınızı beslemek için birçok keşfedilebilir eğitim alanı vardır.

OpenAI Gym nedir, nasıl çalışır ve onu kullanarak ne inşa edebilirsiniz?

OpenAI Spor Salonu Nedir?

OpenAI Gym, takviyeli öğrenme ajanlarının çevresel gözlemlere dayalı olarak hareket etmesi için simüle edilmiş eğitim ortamları sağlayan Pythonic bir API'dir; her eylem, her zaman adımında tahakkuk eden olumlu veya olumsuz bir ödülle birlikte gelir. Ajan, ödülleri en üst düzeye çıkarmayı amaçlarken, beklenmedik her karar için cezalandırılır.

Zaman adımı, ortamın başka bir duruma geçmesi için ayrı bir zaman adımıdır. Aracının eylemleri ortam durumunu değiştirdikçe toplanır.

OpenAI Spor Salonu Nasıl Çalışır?

instagram viewer

OpenAI Spor Salonu ortamları, pekiştirmeli öğrenmede kullanılan dinamik bir karar verme modeli olan Markov Karar Sürecine (MDP) dayanmaktadır. Böylece, ödüllerin yalnızca ortam durum değiştirdiğinde geldiği sonucu çıkar. MDP geçmiş olayları hesaba katmadığı için bir sonraki durumdaki olaylar yalnızca mevcut duruma bağlıdır.

Devam etmeden önce, OpenAI Gym'in pekiştirmeli öğrenmedeki uygulamasını hızlı bir şekilde anlamak için bir örneğe bakalım.

Bir yarış oyununda bir arabayı eğitmeyi planladığınızı varsayarsak, OpenAI Gym'de bir yarış pistini çevirebilirsiniz. Takviyeli öğrenmede araç sola değil sağa dönerse -1 gibi negatif bir ödül alabilir. Yarış pisti her zaman adımında değişir ve sonraki durumlarda daha karmaşık hale gelebilir.

Olumsuz ödüller veya cezalar, pekiştirmeli öğrenmede bir aracı için fena değildir. Bazı durumlarda hedefine daha çabuk ulaşması için onu cesaretlendirir. Böylece araba zamanla pisti öğrenir ve ödül serilerini kullanarak navigasyonunda ustalaşır.

Örneğin, biz başlattık FrozenLake-v1 bir temsilcinin buz çukurlarına düştüğü için cezalandırıldığı, ancak bir hediye kutusunu kurtardığı için ödüllendirildiği ortam.

İlk çalıştırmamız, ödülsüz daha az cezaya neden oldu:

Ancak, üçüncü bir yineleme daha karmaşık bir ortam üretti. Ancak temsilci birkaç ödül aldı:

Yukarıdaki sonuç, aracının bir sonraki yinelemede gelişeceği anlamına gelmez. Bir dahaki sefere daha fazla delikten başarılı bir şekilde kaçınabilse de ödül alamayabilir. Ancak birkaç parametreyi değiştirmek, öğrenme hızını artırabilir.

OpenAI Spor Salonu Bileşenleri

OpenAI Gym API, aşağıdaki bileşenler etrafında döner:

  • bu ortamlar bir ajanı nerede eğitirsiniz. kullanarak birini başlatabilirsiniz. spor salonu.make yöntem. OpenAI Gym ayrıca çok aracılı ortamları destekler.
  • bu sarmalayıcılar Mevcut bir ortamı değiştirmek için. Her bir temel ortam varsayılan olarak önceden sarılmış olsa da, onu max_actions, min_actions ve max prizes gibi parametrelerle yeniden ölçeklendirebilirsiniz.
  • Bir aksiyon; aracının ortamındaki değişiklikleri gözlemlerken ne yaptığını tanımlar. Bir ortamdaki her eylem, bir aracının gözlemlere verdiği yanıtı tanımlayan bir adımdır. Bir adım tamamlama, bir gözlem, bir ödül, bilgi ve bir kesme veya sonlandırma değeri döndürür.
  • bu gözlem; bir aracının bir ortamdaki deneyimini tanımlar. Bir gözlem olduğunda, bilgileriyle birlikte bir eylem izler. info parametresi, hata ayıklama için kullanışlı olan bir yürütme günlüğüdür. Bir adım sona erdiğinde, belirtilen yineleme sayısına bağlı olarak ortam n kez sıfırlanır.

OpenAI Gym ile Neler Yapabilirsiniz?

OpenAI Gym, özel öğrenme ortamlarını hızlandırmanıza izin verdiğinden, onu gerçek hayat senaryosunda kullanmanın bazı yollarını burada bulabilirsiniz.

1. Oyun Simülasyonu

İstenen davranışları ödüllendirmek, oyun ödülleri oluşturmak ve oyun seviyesi başına karmaşıklığı artırmak için OpenAI Gym'in oyun ortamlarından yararlanabilirsiniz.

2. Görüntü Tanıma

Sınırlı miktarda veri, kaynak ve zamanın olduğu durumlarda OpenAI Gym, bir görüntü tanıma sistemi geliştirmek için kullanışlı olabilir. Daha derin bir düzeyde, aracıyı yüzleri doğru bir şekilde tanımladığı için ödüllendiren bir yüz tanıma sistemi oluşturmak için ölçeklendirebilirsiniz.

3. Robot Eğitimi

OpenAI Gym ayrıca 3B ve 2B simülasyonlar için robotlara istenen davranışları uygulayabileceğiniz sezgisel ortam modelleri sunar. Robookul OpenAI Gym kullanılarak oluşturulan ölçekli robot simülasyon yazılımına bir örnektir.

4. Pazarlama

OpenAI Gym'i kullanarak reklam sunucuları, hisse senedi alım satım botları, satış tahmini botları, ürün tavsiye sistemleri ve daha pek çok pazarlama çözümü de oluşturabilirsiniz. Örneğin, reklamları gösterim ve tıklama oranına göre cezalandıran özel bir OpenAI Spor Salonu modeli oluşturabilirsiniz.

5. Doğal Dil İşleme

OpenAI Gym'i uygulamanın bazı yolları doğal dil işleme cümle tamamlamayı içeren çoktan seçmeli sorular mı yoksa spam sınıflandırıcı oluşturma. Örneğin, katılımcıları işaretlerken yanlılığı önlemek için cümle varyasyonlarını öğrenmesi için bir müşteri temsilcisini eğitebilirsiniz.

OpenAI Gym'e Nasıl Başlanır?

OpenAI Gym, Python 3.7 ve sonraki sürümleri destekler. Bir OpenAI Spor Salonu ortamı kurmak için, spor salonu, çatallı sürekli desteklenen spor salonu sürümü:

pip yükleme spor salonu

Ardından, bir ortamı döndürün. Yine de özel bir ortam oluşturabilirsiniz. Ancak OpenAI Spor Salonu konseptinde ustalaşmak için mevcut olanla oynayarak başlayın.

Aşağıdaki kod, FrozenLake-v1. bu env.sıfırlama yöntem ilk gözlemi kaydeder:

içe aktarmak spor salonu gibi spor salonu
env = spor salonu.make("Dondurulmuş Göl-v1", render_mode="insan")

gözlem, bilgi = env.reset()

Bazı ortamlar çalışmak için ekstra kitaplıklar gerektirir. Başka bir kitaplık kurmanız gerekirse, Python bunu istisna mesajı aracılığıyla önerir.

Örneğin, ek bir kitaplık (spor salonu[oyuncak-metin]) çalıştırmak için FrozenLake-v1 çevre.

OpenAI Gym'in Gücünü Geliştirin

Yapay zeka ve makine öğrenimi geliştirmenin önündeki engellerden biri, altyapı ve eğitim veri kümelerinin eksikliğidir. Ancak, makine öğrenimi modellerini uygulamalarınıza veya cihazlarınıza entegre etmek istediğinizde, internette uçuşan hazır yapay zeka modelleri ile artık her şey daha kolay. Bu araçlardan bazıları düşük maliyetliyken, OpenAI Gym dahil diğerleri ücretsiz ve açık kaynaklıdır.