OpenAI, ChatGPT'ye sentezlenmiş bir ses kullanarak konuşma yeteneği kazandırdı ve bu özellik yakında akıllı telefonunuza da gelecek.

ChatGPT etkileşimli, üretken bir yapay zeka deneyimi olacak şekilde ayarlandı. OpenAI, dünyanın önde gelen yapay zeka sohbet robotunun, sentezlenmiş, muhtemelen yapay zeka tarafından üretilmiş bir ses kullanarak konuşabileceğini ve kullanıcı sorgularına yanıt verebileceğini ortaya çıkardı.

ChatGPT, yeni keşfedilen sesinin yanı sıra, kendisine yüklenen veya ChatGPT Android veya iOS uygulamasını kullanırken çekilen belirli görüntülere yanıt verebilecek ve bunları tartışabilecek. Görüntü tanıma özelliği, verileri ve bilgileri doğru bir şekilde algılamak için sinir ağlarını kullanan Google Lens ve diğer uygulamalara benzer.

OpenAI, ChatGPT'ye Ses Veriyor

25 Eylül 2023'te ChatGPT geliştiricisi OpenAI ortaya çıktı dünya lideri üretken yapay zeka sohbet robotuna bir ses verecek. ChatGPT kullanıcıları doğrudan chatbot ile konuşabilir ve ondan yanıt vermesini isteyebilir, böylece ChatGPT'nin ilk kez doğrudan sesli olarak konuşmasına etkin bir şekilde olanak sağlanır.

instagram viewer

OpenAI'nin örnek klibi, ChatGPT'den benzersiz bir uyku zamanı hikayesi yaratmasını isteyen bir kadını içeriyor ve ChatGPT, buna sentezlenmiş bir kadın sesiyle gerektiği gibi yanıt veriyor.

Buna göre kablolu, yeni metinden konuşmaya modeli şirket içinde geliştirildi. Metinden ve birkaç saniyelik örnek konuşmadan "insan benzeri" ses üretebilir (OpenAI Whisper modelini kullanma) ve çeşitli tonlarda ve tarzlarda konuşun. Çeşitli ses örneklerini şu adreste bulabilirsiniz: OpenAI'nin blogu.

Bazı şirketler halihazırda OpenAI'nin yeni ses modelini kullanmaya başlıyor. Örneğin Spotify, podcast'leri farklı dillere çevirmek için OpenAI'nin metinden konuşmaya modelini kullanıyor ve ChatGPT'nin dil çeviri becerisini yeni konuşma yeteneğiyle birleştiriyor.

ChatGPT'nin yeni metinden konuşmaya modeli yalnızca resmi kullanan Plus ve Enterprise abonelerine açıktır. Android ve iOS uygulamalarının önümüzdeki iki hafta içinde kullanıma sunulması bekleniyor (25 Eylül'den itibaren). 2023). Ayrıca, yeni ses özelliği başlangıçta İngilizce ile sınırlı olsa da bunun hızla değişmesini bekliyoruz.

ChatGPT, Görüntüleri ve Fotoğrafları Tanıyabilir ve Analiz Edebilir

OpenAI'nin ChatGPT güncellemesinin ikinci kısmı, araca yüklenen görüntüleri analiz etme ve konuşma yeteneğidir. Görsel görüntü analizi seçeneği GPT-4 güncelleme videolarında yer alıyordu ancak o zamandan beri pek tartışılmadı (ChatGPT Kod Yorumlayıcısı bir yana).

Artık ChatGPT, Google Lens'e benzer bir işlevsellik kazanıyor. ChatGPT'ye bir resim yükleyebilir veya ChatGPT uygulamasında akıllı telefonunuzun kamerasını kullanarak bir fotoğraf çekebilirsiniz; bu, görseli detaylandıracak ve gerektiğinde daha fazla bağlam ekleyecektir.

Bunu "Google Lens'e benzer" olarak adlandırmak gerçekten haksızlıktır. Daha fazla bilgi ve bağlam elde etmek için görüntü hakkında ileri geri sohbet etme yeteneği, onu geniş bir ayar yelpazesi için son derece yararlı kılar. Bununla birlikte, OpenAI'nin gizlilik ve doğruluk nedeniyle ChatGPT'nin "insanlar hakkında doğrudan açıklama yapma ve analiz etme yeteneğini" sınırladığını açıkça belirtmesi ile birlikte küçük yazılara dikkat etmek önemlidir. Yine de OpenAI destekli bir "Bu Kimdir" aracı gelecekte kullanımda olabilir mi? (Umarım öyle olmaz!)

Yeni metinden konuşmaya modeli gibi OpenAI de önümüzdeki iki hafta içinde görüntü tanımayı kullanıma sunacak, ancak yalnızca ChatGPT uygulamasında değil tüm platformlarda mevcut olacak.

Gizlilik, Güvenlik ve Diğer Sorunlar

Sesle çalışan bir ChatGPT'nin sonuçları çok açıktır. Elbette heyecan verici. Ancak, örnek olarak yalnızca kısa bir parçayı kullanarak benzersiz şekilde sentezlenmiş bir ses oluşturma yeteneği, önemli gizlilik ve güvenlik sorunlarına sahiptir. Kötü niyetli aktörlerin bu araçlardan yararlanma potansiyeli çok büyüktür ve herhangi bir üretken yapay zeka aracında olduğu gibi, cin şişeden çıktığında kesinlikle tekrar içeri girmeyecektir. Hükümetlerin veya düşünce liderlerinin hiçbir yapay zeka düzenlemesi bu gidişatı geri çeviremez.

OpenAI'nin konuyla ilgili uyarısı bile sorunlardan bahsetmesine rağmen bariz olanı atlıyor gibi görünüyor:

Ancak bu yetenekler, kötü niyetli aktörlerin tanınmış kişileri taklit etme veya dolandırıcılık yapma potansiyeli gibi yeni riskleri de beraberinde getiriyor. Bu teknolojiyi belirli bir kullanım örneğini (sesli sohbet) desteklemek için kullanmamızın nedeni budur.

Bunun buzdağının görünen kısmı olduğu göz önüne alındığında, ChatGPT'nin yeni keşfedilen sesine karşı, özellikle de bir kez geri adım atılmasını bekleyin. ChatGPT'nin sahtekarlık yapmak için kullanıldığını iddia eden hoş olmayan manşetlerde öngörülebilir bir artış var ve bu nedenle Açık.

OpenAI, ChatGPT'yi Kullanılacak Yapay Zeka Uygulaması Haline Getiriyor

OpenAI, ChatGPT'ye ne kadar çok kullanıcı dostu özellik eklerse, o kadar çok tercih edilen üretken AI uygulaması haline gelir. İlk üretken yapay zeka patlaması sırasında yaygın üne kavuşan ilk kişi olan ChatGPT, hâlâ öncülük ediyor ve Google Bard (ve potansiyel olarak Google Gemini) ve Anthropic's gibi şirketlerin rekabetine rağmen yalnızca bazı uygulamalar kullanılıyor Claude.

OpenAI, ChatGPT'nin kullanımını kolaylaştıran özellikler eklemeye devam edebildiği sürece, insanların ilgisini çekecek ve gerçekten çok modlu bir yapay zeka aracı hedefine daha da yaklaşacaktır.