Muhtemelen kedinizin söylediklerini tercüme ettiğini iddia eden uygulamalar görmüşsünüzdür. Ama kedinizin miyavını gerçekten İngilizceye çevirebilirler mi? Kısa cevap evet, bir nevi. Her kedinin "dili" ne kadar benzersiz olduğu için zordur, ancak modern teknolojiye oldukça yaklaşabilirler.

MeowTalk gibi Cat çeviri uygulamaları, makine öğrenimini vurgulayan bir konuşma tanıma biçimi kullanır. Daha yakından bakalım.

Konuşma Tanıma ve Makine Öğrenimi

Mary Theresa McLean /Pixabay

Konuşma tanıma, konuşmayı kaydederek ve sesi dijital bir veri dosyasına dönüştürerek çalışır. Uygulamanın analiz edip anlamlarla eşleştirebileceği veri noktaları olarak perde ve hacim gibi verileri kodlar. DPA Mikrofonları arka plan seslerine ve bir kelimenin nasıl söylendiğine bağlı olarak bu veri noktalarının çok farklı görünebileceğini açıklar.

Bazen ses tanımayı normal kabul ediyoruz, ancak bu inanılmaz bir teknoloji başarısı. Özellikle insan konuşmasının ne kadar karmaşık olduğunu düşünürsek. Gibi Bilim insanı

açıklar, her kelime, birbiriyle harmanlanmış çok çeşitli sesler veya "fonemler" içerir. Bir bilgisayarın konuşmayı anlamasını sağlamak çok zordur. Kedi seslerinin yeni sınırı daha da zor olacak.

Konuşma tanımayı kullanan uygulamalar, veri kümesi adı verilen kelimelerin "sözlüğü" ile programlanır. Uygulama daha sonra konuşmanızı veri sözlüğündeki en yakın seçenekle eşleştirir.

Bir hata yaptığında, onu düzeltirsiniz ve bu verileri bir dahaki sefere kaydeder. Bu, makine öğreniminin bir parçasıdır. Bir program, başladığı veri kümesiyle aynı olmasa bile konuşmayı tanımayı öğrenir.

İlişkili: Makine Öğrenimi Algoritmaları Nelerdir? İşte Nasıl Çalışırlar

Ses tanımanın, özellikle konuşma engelleri ve aksanlarla ilgili hala sorunları var. Bazı şirketler bu sorunların üstesinden gelmek için makine öğrenimini iyileştirmek, rağmen. Zamanla, makine öğrenimi konuşma tanımayı güçlü bir araca dönüştürebilir.

İnsanlar için konuşma tanıma böyle çalışır. Ama kediler için işe yarıyor mu?

Konuşma Tanıma vs. Miyav Tanıma

Ariana Suárez /Unsplash

Öncelikle, belirli bir tür miyavı "açım" olarak çevirmenin insan konuşmasını analiz etmekten neden farklı olduğunu anlamamız gerekir. Sorun çoğunlukla, kedi iletişiminin daha çok duruş gibi sözlü olmayan ipuçlarına dayanmasıdır. Diğer bir sorun, evrensel bir "kedi dili" nin olmamasıdır.

Göre ASPCAyetişkin vahşi kediler asla birbirlerine miyavlamazlar, sadece insanlara. Tarafından yapılan diğer araştırmalar Humane Society bu seslerin "boşlukta oluşmadığını" ekliyor. Bunları beden dili ve diğer bağlamlarla birlikte yorumlamalıyız. Çoğu durumda, bu sessiz sinyaller "açım" anlamına gelen miyav ile "oynamak istiyorum" anlamına gelen miyav arasındaki tek farktır.

Bu soruna ek olarak, iki kedi aynı dile sahip değil. Kediler, sahipleri için kişiselleştirilmiş "diller" geliştirir. Bunlar kısmen sahibinin sesini taklit etmeye ve kısmen de kedinin kişiliğine dayanmaktadır. Aynı istek veya ihtiyacı iletirken bile iki kedi aynı sesi çıkaramaz. Öyleyse bir uygulamanın konuşma kelime haznesi hepsi için nasıl tercüme edilebilir?

Kediler için Esnek Makine Öğrenimi

Ücretsiz Sesler /Unsplash

Birkaç sanal asistanın beğenmesine rağmen Oto tonu ve duyguyu anlamaya çalıştığınızda, konuşma tanıma sözsüz sinyallerde hala korkunçtur. Ancak bu, onları yorumlamanın imkansız olduğu anlamına gelmez.

MeowTalk, bu sorunların üstesinden gelmeye yardımcı olmak için daha esnek bir makine öğrenimi türü kullanır.

İndir: MeowTalk için Android | iOS (Bedava)

Meowtalk, Alexa ekibinde de çalışan Javier Sanchez tarafından yaratıldı. Uygulamayı akıllı tasmalara doğru bir adım olarak hayal etti. Bu tasmalar, insanların kedilerini daha iyi anlamalarına ve onlara daha iyi bakmalarına yardımcı olmak için karmaşık makine öğrenme stratejilerinden yararlanarak kedi seslerini insan konuşmasına çevirecek.

MeowTalk ekibi, her kedi için daha spesifik profiller oluşturarak benzersizlik sorunlarını telafi etti. Uygulamada her kediyi ayrı ayrı kaydedersiniz. Science Norveç kedi yavrularının yetişkin kedilerden farklı şekilde miyavladığını bildirir, bu nedenle uygulama aynı zamanda kedinin doğum gününü de ister. Her profil, kedi için benzersiz bir veri ağı oluşturur ve makine öğrenimine biraz derin öğrenmeyi dahil eder.

İlişkili: Derin Öğrenme vs. Makine Öğrenimi vs. AI: Birlikte Nasıl Gidiyorlar?

Kelime bilgisi için MeowTalk, veri kümesindeki 10 ses profiliyle başlar. Her birinin "mutlu" veya "avlanma" gibi farklı bir anlamı vardır. Uygulama bir ses duyduğunda ve yanlış anladığında, onu düzeltebilir veya yeni bir yorum oluşturabilirsiniz.

CATSOUNDS verileri Akvelon

Düzeltme, uygulamaya temel kelimeleri yeni sesle değiştirmesini söyler.

Örneğin, uygulamaya "Avlanma" yı uzun bir yowl yerine kısa cıvıltılarla eşleştirmesini söyleyebilirsiniz. Bu tür bir düzeltme, tek bir anlamla eşleşmesi için birden fazla ses eklemekten daha kullanışlıdır; bu, uygulamaya uzun bir yowl ve kısa cıvıltılar olduğunu söylemek gibidir. her ikisi de "Anne Çağrısı" demek.

Konuşma tanıma uygulamalarındaki makine öğrenimi, genellikle bu tür üzerine yazmaya direnir. Siri'ye "teknoloji blogu" dediğinizde gerçekten "armut" demek istediğinizi öğretmeye çalışmak gibi olur. Ancak MeowTalk'un kullandığı daha esnek makine öğrenimi biçimi bu düzeltmeyi daha fazla halledebilir kolayca.

Yeni bir yorum oluşturmak, daha önce kodlanmamış bir anlam ekler. Örneğin, kediniz en sevdiği oyuncağı istediğinde belirli bir çağrı yapıyorsa, seçenek olarak "Faremi istiyorum" seçeneğini ekleyebilirsiniz. Otomatik düzeltme sözlüğünüze bir kelime eklemeye benzer.

İlişkili: Android'de Kendi Otomatik Doğru Kelimelerinizi Nasıl Tanımlayabilirsiniz?

Zamanla, kediniz için oldukça kişiselleştirilmiş bir konuşma profili geliştirebilirsiniz. Sonunda, evcil hayvan bakıcıları için yararlı olacak veya davranış sorunlarını çözebilecek kadar karmaşık bile olabilir. Hiçbir şey değilse, kedi sahiplerinin evcil hayvanlarına daha özen göstermelerine yardımcı olur.

Karar: Kedi Çeviri Uygulamaları Çalışıyor mu?

Sonuçta, "kedi çevirisi", kullanıcının uygulamaya kedilerinin nasıl konuştuğunu öğretmesine hala çok güveniyor. Muhtemelen her kedinin iletişiminin ne kadar benzersiz olmasından dolayı durum böyle olacaktır.

Ancak makine öğreniminin, geliştiricilerin bunda kısmen bile başarılı olabileceği kadar ileri geldiği gerçeği inanılmaz. Makine öğrenimi ve yapay zeka en yüksek hızlarda ilerliyor ve bir sonraki adımda nereye gideceklerini görmek için sabırsızlanıyoruz.

E-posta adresi
İlgili konular
  • Teknoloji Açıklaması
  • Dil öğrenimi
  • Makine öğrenme
Yazar hakkında
Natalie Stewart (16 Makale Yayınlandı)

Natalie Stewart, MakeUseOf'un yazarıdır. İlk olarak üniversitede teknolojiye ilgi duymaya başladı ve üniversitede medya yazımı için bir tutku geliştirdi. Natalie, erişilebilir ve kullanımı kolay teknolojiye odaklanıyor ve sıradan insanlar için hayatı kolaylaştıran uygulamaları ve cihazları seviyor.

Natalie Stewart'dan Daha Fazla

Haber bültenimize abone ol

Teknoloji ipuçları, incelemeler, ücretsiz e-kitaplar ve özel fırsatlar için haber bültenimize katılın!

Bir adım daha…!

Lütfen size az önce gönderdiğimiz e-postadaki e-posta adresinizi onaylayın.

.