Google'ın MusicLM'si, metin istemlerinden müzik üretme yeteneğiyle umut verici görünüyordu. Ancak teste tabi tuttuktan sonra, tam olarak teslim etmedi.

Ocak 2023'te Google, metin açıklamalarına dayalı müzik üretebilen deneysel bir AI aracı olan MusicLM'yi duyurdu. Haberlerin yanı sıra Google, MusicLM için, pek çok kişinin müziği yoktan var etme yeteneği karşısında gözlerinin kamaşmasına neden olan çarpıcı bir araştırma makalesi yayınladı.

Bir metin istemi verildiğinde, model, türden enstrümana, ünlü sanat eserlerini anlatan soyut altyazılara kadar her türden açıklamayı sunan yüksek kaliteli müzik üretme sözü verdi. MusicLM artık halka açık olduğuna göre, onu test etmeye karar verdik.

Google'ın AI Müzik Üreticisi Oluşturma Girişimi

"Rahatlatıcı caz" gibi bir metin istemini çalmaya hazır bir parçaya dönüştürmek, muhtemelen AI müziğindeki deneylerin kutsal kâsesidir. Dall-E veya Midjourney gibi ünlü AI görüntü oluşturuculara benzer şekilde, melodisi ve ritmi olan bir parça üretmek için en ufak bir müzik bilgisine sahip olmanız gerekmez.

instagram viewer

Mayıs 2023'te Google'ın AI Test Kitchen'ına kaydolanlar demoyu ilk kez deneyebilir. Kullanıcı dostu bir web sayfası ve elektronik ve klasik olmak üzere birkaç yol gösterici kural tarafından karşılanır enstrümanlar en iyi şekilde çalışır ve bir "titreşim" belirtmeyi unutmayın; hayal edilemeyecek kadar kolay.

Hız, MusicLM'nin nispeten yüksek doğrulukta örneklerin yanı sıra gerçekten sunduğu birkaç şeyden biridir. Ancak, gerçek test yalnızca bir kronometre ile ölçülmek değildi. MusicLM birkaç kelimeye dayalı gerçek, dinlenebilir müzik üretebilir mi? Tam olarak değil (buna birazdan geleceğiz).

Google'ın Yapay Zeka Test Mutfağında MusicLM Nasıl Kullanılır?

MusicLM'yi kullanmak kolaydır, için bekleme listesine kaydolabilirsiniz. Google'ın AI Test Mutfağı eğer denemek istersen.

Web uygulamasında, duymak istediğiniz müzik türünü açıklayan birkaç kelimeden birkaç cümleye kadar bir bilgi istemi oluşturabileceğiniz bir metin kutusu göreceksiniz. En iyi sonuçlar için Google, müziğin ruh halini ve duygusunu dahil etmeye çalışmanız gerektiğini ekleyerek "çok açıklayıcı olmanızı" tavsiye ediyor.

Hazır olduğunuzda, işlemeye başlamak için enter tuşuna basın. Yaklaşık 30 saniye içinde, seçmelere katılmanız için iki ses parçacığı hazır olacaktır. Bu ikisi arasından isteminizle eşleşen en iyi örneğe ödül verme seçeneğiniz vardır ve bu da Google'ın modeli eğitmesine ve çıktısını iyileştirmesine yardımcı olur.

MusicLM'nin Sesi Nasıldır?

İnsanlar en az 40.000 yıl öncesinden beri müziğin dilin gelişiminden önce mi sonra mı yoksa aynı zamanda mı geldiğine dair kesin bir fikir sahibi olmadan müzik yapıyorlar. Bu nedenle, bazı yönlerden MusicLM'nin bu eski evrensel sanatın kodunu tam olarak çözememiş olması şaşırtıcı değil.

Google'ın MusicLM araştırma makalesi MusicLM'nin ünlü sanat eserlerine ait altyazılardan müzik üretebileceğini ve takip edebileceğini öne sürdü. tür veya ruh halini değiştirmek gibi talimatlar, bir dizi farklı ister.

Bununla birlikte, bu kadar zorlu siparişlere girmeden önce, MusicLM'nin öncelikle üstesinden gelmesi gereken birkaç temel sorunu olduğunu gördük.

Tempoya Bağlı Kalmada Zorluk

Herhangi bir müzisyenin en temel işi, basitçe zamanında çalmaktır. Başka bir deyişle, tempoya bağlı kalın. Şaşırtıcı bir şekilde, bu MusicLM'nin her zaman %100 yapabileceği bir şey değil.

Aslında, 20 müzik parçası üreten aynı istemi 10 kez kullanarak, yalnızca üçü zamanında geldi. Kalan 17 örnek, müziği tanımlamak için yaygın olarak kullanılan bir terim olan "dakikadaki vuruş sayısı" ile yazılan belirtilen tempodan daha hızlı veya daha yavaştı.

Bu örnekte, "dakikada 80 vuruşla çalınan, huzurlu ve meditatif solo klasik piyano" istemini kullandık. Daha yakından dinlediğinizde, müzik genellikle küçük örnek uzunluğu içinde hızlandı veya yavaşladı.

Müziğin de güçlü bir ritmi yoktu ve sanki parçanın ortasında biri play tuşuna basmış gibi geliyordu. Bu kasıtlı olsun veya olmasın, MusicLM'nin ritme bağlı kalmanın yanı sıra bir müzik parçasına gerçekten uygun bir başlangıç ​​veya son besteleyip besteleyemeyeceğine karar vermeyi zorlaştırıyor.

Rastgele Enstrüman Seçimi

Belki de MusicLM kesin zamanlamayla nasıl çalınacağını henüz öğrenmemişti, bu yüzden başka bir ortak müzik parametresine geçtik. Belirli enstrümanlar için talebimizi yerine getirip getirmeyeceğini görmek istedik.

"Solo sentezleyici" ve "Solo bas gitar" gibi açıklamaları içeren birkaç farklı bilgi istemi yazdık. Diğerleri "Yaylı dörtlü" veya "Caz grubu" gibi daha büyük topluluklardı. Genel olarak, istediğinizi elde etme şansınız 50:50 gibi görünüyordu.

Bir teori, modelin bazı enstrümanları popüler müzik türleriyle ilişkilendirmesidir. Örneğin, "Solo sentezleyici, akor ilerlemesi. Canlı ve iyimser". MusicLM, kendi başına bir sentezleyici sesi elde etmek yerine, davul ve bas ile tamamlanmış bir elektronik parça üretti.

Modelin, bir araç için özel talebi anlamak için yeterli veriye ve yeterli eğitime sahip olmaması mümkündür.

Vokaller Denklemin Dışında

O zamanki kısıtlamalara göre model, vokal içeren müzikler üretmiyordu. MusicLM'nin çetrefilli telif hakkı sorunları ve hatalı vokalleri Google'ın bu sınırlamayı ayarlayarak güvenli oynamayı seçmesinin olası bir faktörüdür.

Ancak MusicLM ile bir süre denedikten sonra, Google'ın modelin çıktısı üzerindeki kontrolünün tam olarak katı olmadığını fark ettik. Garip bir şekilde, "akustik gitar" gibi bir istem, arka planda boğuk ve uzak gelen hayalet benzeri vokaller içeren bir parça üretecektir.

Bu yaygın bir olay olmasa da, ilk etapta MusicLM'nin ikna edici vokaller yaratma becerisini merak etmenize neden oluyor.

Öncülük eden VOCALOID ve Synthesizer V gibi yazılımlarla AI destekli vokal sentez teknolojisi, mevcut modelden vokalleri çıkarmak, mevcut teknolojiye karşı rekabet edecek kadar iyi olup olmadığını merak etmemize neden oluyor. MusicLM'nin müzisyenlerin onun övgülerini söylemesi için kat etmesi gereken uzun bir yol olabilir.

Yapay Zeka Müzik Jeneratörlerinin Geleceği

MusicLM, üretken yapay zeka müzik teknolojisini ileriye taşımış olsa da, müzik endüstrisinde pratik çalışmalara başlayabilmesi için okula geri dönmesi ve birkaç şey daha öğrenmesi gerekiyor.

Şimdiye kadar, üretici AI müziği için en iyi girişim, OpenAI tarafından JukeboxAI adlı bir modeldi. Tam olarak kullanıma hazır bir durumda değildi ve sadece bir dakikalık müziği işlemek tam olarak dokuz saat sürdü.

Çabalarınız için, ses bozulması ve eserlerle dolu, gerçekten uzaylı sesi veren bir parça elde etme olasılığınız yüksekti. Öte yandan, sıkılmayacaktın Jukebox'ın çağrıştırdığı tuhaf kreasyonları dinlemek.

Bunun ışığında MusicLM, kullanıcı dostu bir AI müzik oluşturucuya doğru bazı önemli ilerlemeler kaydetti. Ham ses biçiminde müzik üretmenin ne kadar karmaşık olduğunu düşünmeyi bıraktığınızda, modeli rastgele çıktıları için neredeyse affedebiliriz.

Bununla birlikte, modeli uygulamaya koyduktan sonra MusicLM, Google'ın ilk araştırma makalesinde yayınladıklarıyla karşılaştırıldığında yarı pişmiş hissediyor. Nadiren bir AI görüntü oluşturucu, bir Apple görüntüsünü yanlış alır, aynı şekilde bir AI müzik oluşturucu, tempo ve enstrümanlar gibi birkaç temel bilgiyi doğru almalıdır.

Google'ın MusicLM Beklentilerin Gerisinde Kaldı

Yapay zeka cephesinde rekabette rekabet eden teknoloji şirketleri ile MusicLM, halka açık denemelere daha hazır olmadan girmiş gibi hissediyor. Model, temelleri doğru yapmak yerine, müzik üretme konusunda çok daha belirsiz ve öznel bir yaklaşım benimsiyor gibi görünüyor.

Google, isteminizi netleştirmeniz için sizi teşvik edebilir, ancak tempoyu iyi idare edemez ve istediğiniz enstrümanları her seferinde alacağınız garanti edilmez. MusicLM ilginç olabilir ve güçlü AI ilerlemelerinin iyi bir gösterimi olabilir, ancak müzik nihai hedefse, daha gidecek çok yolu var.