Google, Lyra ses codec beta kaynak kodunu GitHub'da yayınlayarak inanılmaz kalitede düşük bit oranlı ses işlemeyi tüm geliştiricilerin kullanımına sundu. Codec en çok, mümkün olduğunca çok verinin kaydedilmesi gereken yerleşik ve bant genişliği kısıtlı durumlarda kullanışlıdır.
Lyra: Neredeyse Hiçbir Şey Hiç Bu Kadar İyi Gelmedi
Ses codec bileşeni, kulağa en doğal gelen konuşmayı mümkün olan en düşük veri hızıyla sağlama ilkesine göre çalışır. 3 kbps'ye kadar düşük bit hızlarıyla neredeyse ürkütücü seviyelerde ses reprodüksiyonu oluşturmayı başarır. Google, zaten Duo uygulamasında gerçek zamanlı Lyra sıkıştırması kullanıyornormal bant genişliği sesten bir fark bile görmediğiniz için suçlanmayacaksınız.
Lyra'nın diğer kodeklerden ne kadar daha iyi olduğunu göstermek için Google, Blog yazısı Makine Öğrenimi tarafından sağlanan sıkıştırma codec bileşenini diğer 3 ve 6 kbps alternatifleriyle karşılaştırma.
Bu bir gece ve gündüz farkı ve geliştiricilere bu araçlar üzerinden dünyaya vermek, bant genişliğinin kıt olduğu yerlerde iletişim kalitesinin iyileştirilmesinde önemli bir itici güç olacaktır. Ayrıca, gelişmekte olan pazarlarda yeni uygulamalar oluşturmak isteyen geliştiriciler için mükemmel bir motivasyon kaynağıdır ve Google'ın bu yıl içinde kesinlikle ele alacağı bir şeydir.
ücretsiz sanal Google I / O çevrimiçi konferansı.Beta kaynak kodu şu anda 64-bit Arm cihazları düşünülerek tasarlanmıştır, ancak örnekler 64-bit x86 Linux sistemlerinde de çalışacaktır. Kaynak kodu, beta sürümünde olmasına rağmen tamamen belgelenmiş olarak sağlanır ve GitHub sayfası, Arm 64-bit hedefler için Linux'ta Lyra'nın nasıl oluşturulacağını ve kurulum talimatlarını sağlar.
Lyra beta kaynak kodunu almak için şu adrese gidin: Lyra GitHub sayfası.
Lyra Nasıl Çalışır?
Lyra'nın kullandığı asıl süreç, üzerinde eğitilmiş makine öğrenimi modellerinin inanılmaz derecede karmaşık bir kombinasyonudur. binlerce saatlik konuşma verisi ve mevcut ses kodek teknolojisinin optimizasyonları, teori oldukça basit.
Her 40 ms'de bir özellikler konuşmadan alınır ve 3 kbps'ye kadar sıkıştırılır. Bu özellikler, insanın işitsel konuşma tepkisine en yakın frekans spektrumundaki konuşma enerjisi noktalarını temsil eder - biri konuştuğunda farkına varmamız ve anlamamız gereken şeyler.
Lyra'yı özel yapan şeyin anahtar kısmı, bu bilgiyi nasıl kullandığıdır:
Ancak geleneksel parametrik kodekler, basitçe konuşma açısından kritik parametrelerden çıkarılabilir ve bunlar sinyali alıcı uçta yeniden oluşturmak, düşük bit hızları elde etmek için kullanılır, ancak genellikle robotik ve doğal olmayan bir ses çıkarır. Bu eksiklikler, yeni nesil yüksek kaliteli ses üretken modellerin geliştirilmesine yol açmıştır. Sadece sinyaller arasında ayrım yapabilmekle kalmayıp, aynı zamanda tamamen yeni şeyler üreterek alanda devrim yarattı olanlar.
İletimden sonra Lyra, bir şekilde hesaplama açısından çok karmaşık olmasa da, bu işlemi kullanarak eksik olanı doldurarak dalga biçimini yeniden oluşturur.
Bir yandan, neredeyse her yerde çalışacak teknolojik bir mucize. Öte yandan, büyücülük olmadığına hala% 100 inanmıyorum.
Google Duo, piyasadaki en iyi görüntülü görüşme uygulamalarından biridir. Pek çok özelliği var ve işte gerçekten kullanmanız gerektiğini düşündüğümüz özellikler.
Sonrakini Oku
- Teknoloji Haberleri
- Android
- Makine öğrenme
Ian Buckley, Almanya, Berlin'de yaşayan serbest gazeteci, müzisyen, sanatçı ve video yapımcısıdır. Yazmadığı veya sahnede olmadığı zamanlarda, çılgın bir bilim adamı olma umuduyla DIY elektronikleri veya kodlarıyla uğraşıyor.
Haber bültenimize abone ol
Teknoloji ipuçları, incelemeler, ücretsiz e-kitaplar ve özel fırsatlar için haber bültenimize katılın!
Bir adım daha…!
Lütfen size az önce gönderdiğimiz e-postadaki e-posta adresinizi onaylayın.