ChatGPT'nin yapımcıları, yükü parmaklarınızın üzerinden almayı amaçlayan başka bir araca sahiptir.

ChatGPT'nin arkasındaki aynı kişiler, üretkenliğinizi artırmak için bugün kullanabileceğiniz başka bir yapay zeka tabanlı araç yarattı. Kendisinden önce gelen tüm benzer çözümleri gölgede bırakan bir sesten metne çözüm olan Whisper'dan bahsediyoruz.

Whisper'ı programlarınızda veya komut satırında kullanabilirsiniz. Yine de bu, asıl amacını bozar: klavye olmadan yazmak. Kullanmak için yazmanız gerekiyorsa, neden yazmaktan kaçınmak için kullanasınız? Neyse ki, artık Whisper'ı bir masaüstü GUI aracılığıyla kullanabilirsiniz. Daha da iyisi, sesinizi neredeyse gerçek zamanlı olarak deşifre edebilir. Whisper Desktop'ı kullanarak sesinizle nasıl yazabileceğinizi görelim.

OpenAI'nin Fısıltısı Nedir?

OpenAI'nin Whisper'ı bir Otomatik Konuşma Tanıma sistemidir (kısaca ASR) veya daha basit bir ifadeyle konuşulan dili metne dönüştürmek için bir çözümdür.

Ancak, eski dikte ve yazıya dönüştürme sistemlerinin aksine Whisper, çeşitli dillerde 680.000 saatin üzerinde konuşma üzerine eğitilmiş bir yapay zeka çözümüdür. Whisper benzersiz bir doğruluk sunar ve oldukça etkileyici bir şekilde yalnızca çok dilli olmakla kalmaz, aynı zamanda diller arasında çeviri de yapabilir.

instagram viewer

Daha da önemlisi, ücretsiz ve açık kaynak olarak mevcut. Bu sayede birçok geliştirici, kodunu kendi projelerine yerleştirdi veya Whisper Desktop gibi ona dayanan uygulamalar yarattı.

Kullanışsız GUI'ler yerine Whisper'ın "vanilya" sürümünü ve terminalin çok yönlülüğünü tercih ediyorsanız, şu makalemize bakın: Windows için OpenAI Whisper ile sesinizi nasıl metne dönüştürebilirsiniz?.

Whisper ve Whisper Desktop Aynı mı?

Resmi görünen adına rağmen Whisper Desktop, Whisper için üçüncü taraf bir GUI'dir ve komut yazmak yerine düğmelere tıklamayı tercih eden herkes için yapılmıştır.

Whisper Desktop, mevcut bir Whisper kurulumuna dayanmayan bağımsız bir çözümdür. Bonus olarak, Whisper'ın alternatif, optimize edilmiş bir sürümünü kullanır, bu nedenle bağımsız sürümden daha iyi performans göstermelidir.

Yelpazenin diğer ucundasınız ve Whisper'ı kullanmanın terminalden daha kolay bir yolunu aramak yerine, onu kendi çözümlerinize uygulamanın yollarını mı arıyorsunuz? için sevinin OpenAI, ChatGPT ve Whisper API'lerine erişimi açtı.

Whisper Desktop'ı İndirin ve Kurun

Whisper Desktop'ın kullanımı bağımsız Whisper'dan daha kolay olmasına rağmen, kurulumu bir sihirbazda tekrar tekrar İleri'ye tıklamaktan daha karmaşıktır.

  1. Ziyaret etmek Whisper Desktop'ın resmi Github sayfası. Sağa bakın ve altındaki en son sürüme tıklayın. Salıverme.
  2. Altında Varlıklar, tıklamak WhisperDesktop.zip ve PC'nize indirin.
  3. İndirilen arşivi bir klasöre çıkarın ve ziyaret etmek için dosya yöneticinizi kullanın. İçinde Whisper Desktop uygulamasını bulacaksınız. Çalıştırmak için üzerine çift tıklayın.
  4. Ayrıca bir Whisper dil modeline ihtiyacınız var. GCML ikili biçim. Whisper Desktop, bir tane edinmeniz için size iki bağlantı sağlayacaktır. Daha karmaşık bir süreç olduğu için kendi modelinizi oluşturmak için ikinci bağlantıyı atlayın. Tıklamak Sarılma Yüz o sayfayı, kullanıma hazır bir dosya indirebileceğiniz varsayılan tarayıcınızda açmak için.
  5. Bu makaleyi yazarken kullandığımız Whisper Desktop sürümü, Hugging Face'teki eski bir depoya bağlantı sağladı. Aynı sorunla karşılaşırsanız, bir bağlantıya dikkat edin. yeni konum. Yeni depoyu ziyaret etmek için üzerine tıklayın.
  6. Sizi mevcut olana götürecek bağlantıya tıklayın modeller.
  7. Bu listeden, şunlardan birine tıklayın: ggml-medium.bin veya ggml-medium.en.bin, Whisper'da çok dilli veya yalnızca İngilizce desteği isteyip istemediğinize bağlı olarak.
  8. Sonunda hedefinize ulaşmış olmalısınız. Bu dosyanın Git LFS ile depolandığını ve görüntülenemeyecek kadar büyük olduğunu ancak yine de indirebileceğinizi belirten satıra dikkat edin. Tıklamak indirmek tam olarak bunu yapmak için.
  9. Dosyanın indirilmesi tamamlandığında, indirilen dil modeli dosyasını Whisper Desktop ile aynı klasöre taşımak için favori dosya yöneticinizi kullanın (Dosya Gezgini yapacaktır).

Whisper Desktop ile Kopyalama

Whisper Desktop ile metne dönüştürmek kolaydır, ancak uygulamayı kullanmak için yine de bir veya iki tıklamaya ihtiyacınız olabilir.

Whisper Desktop'ı yeniden çalıştırın. İndirdiğiniz dil modeline giden doğru yolu (hala) kaçırıyor mu? Tıkla üç noktalı düğme Alanın sağ tarafında bulunan Hugging Face'ten indirdiğiniz dosyayı manuel olarak seçin.

Bu noktadan, yanındaki açılır menüyü de kullanabilirsiniz. Model Uygulaması GPU'nuzda Whisper'ı çalıştırmak isteyip istemediğinizi seçmek için (GPU), hem CPU hem de GPU'da (Hibrit) veya yalnızca CPU'da (Referans).

bu Gelişmiş düğmesi, Whisper'ın donanımınızda nasıl çalışacağını etkileyen daha fazla seçeneğe yol açar. Ancak, düğme gelişmiş olduklarını açıkça belirttiğinden, yalnızca sorun giderme işlemi yapıyorsanız veya ne yaptığınızı biliyorsanız bunları değiştirmenizi öneririz. Burada yanlış seçenek değerlerinin ayarlanması, performans cezası verebilir veya uygulamayı kullanılamaz hale getirebilir.

Uygulamanın ana arayüzüne geçmek için Tamam'a tıklayın.

Halihazırda sesinizin yazılı metne dönüştürmek istediğiniz bir kaydı varsa, tıklayın. Dosyayı Metne Dönüştür ve onu seçin. Yine de, bu makalenin canlı transkripsiyonu için Whisper Desktop'ı kullanacağız.

Sunulan seçenekler basittir. seçebilirsiniz dil Fısıltı kullanacak, isteyip istemediğinizi seçin Çevirmek diller arasında ve uygulamanın Hata Ayıklama Konsolu.

Çoğu İngilizce konuşan kullanıcı bu seçenekleri güvenli bir şekilde atlayabilir ve yalnızca yanındaki açılır menüden doğru ses girişinin seçildiğinden emin olabilir. Yakalama Cihazı.

Emin olmak Metin dosyasına kaydet Ve O dosyaya ekle Whisper Desktop'ın içeriğinin üzerine yazmadan çıktısını bir dosyaya kaydetmesi için etkinleştirilmiştir. Kullan üç noktalı düğme söz konusu metin dosyasını tanımlamak için dosyanın yol alanının sağında.

Tıklamak Esir almak konuşmanızı metne dönüştürmeye başlamak için.

Whisper Desktop, ses etkinliğini algıladığında, aktif olarak yazıya döktüğünde ve işlemin durduğunda size üç gösterge gösterecektir.

İstediğiniz kadar konuşmaya devam edebilirsiniz ve uygulama sesinizi metne dönüştürürken ara sıra ilk iki göstergenin yanıp söndüğünü görmelisiniz. Tıklamak Durmak bittiğinde

Seçtiğiniz metin dosyası, siz tıklayana kadar söylediğiniz her şeyi yazılı biçimde içeren varsayılan metin düzenleyicinizde açılmalıdır. Durmak.

Burada gördüğümüzün tersini de yapabileceğinizi not etmeliyiz: herhangi bir metni konuşmaya dönüştürün. Böylece ekranlara bakıp gözlerinizi yormak yerine her şeyi podcast gibi dinleyebilirsiniz. Bununla ilgili daha fazla bilgi için şu makalemize bakın: metinden konuşmaya MP3 sesi olarak indirmek için en iyi ücretsiz çevrimiçi araçlardan bazıları.

Whisper Desktop Sesle Yazma İpuçları

Whisper Desktop, yazabileceğinizden çok daha hızlı bir şekilde sesinizle yazmanıza olanak tanıyan bir cankurtaran olabilse de, mükemmel olmaktan uzaktır.

Testimiz sırasında, ara sıra kekeleyebileceğini, bazı sözcükleri atlayabildiğini ve siz yazana kadar yazıya dökemeyebileceğini gördük. işlemi manuel olarak durdurup yeniden başlatın veya bir döngüye takılıp aynı ifadeyi yeniden yazmaya devam edin defalarca.

Bağımsız Whisper aynı sorunları göstermediği için bunların düzeltilecek geçici hatalar olduğuna inanıyoruz.

Bu küçük tümseklerin dışında, Whisper Desktop ile sesinizi metne dönüştürmek zahmetsiz olmalıdır. Yine de, testlerimiz sırasında, şu durumlarda daha da iyi performans gösterebileceğini gördük...

  1. Sadece iki veya üç kelime söyleyip sonra duraklamak yerine, daha uzun devam ederseniz Whisper sizi daha iyi anlayabilir. En azından bir seferde tam bir cümle vermeye çalışın.
  2. Aynı nedenle, transkripsiyon sürecini tekrar tekrar başlatmaktan ve durdurmaktan kaçının.
  3. Bir hata yaptığınızı fark ettiğinizde, görmezden gelin ve devam edin. Dil modelinin yüklenmesi ve boşaltılması, Whisper'ın mevcut durumu ve mevcut donanımımız ile sürecin en çok zaman alan kısmı gibi görünüyor. Bu nedenle, konuşmaya devam etmek ve ardından hatalarınızı düzeltmek daha hızlıdır.
  4. Whisper'ın bağımsız sürümünde olduğu gibi, mevcut donanımınız için en uygun dil modelini kullanmak en iyisidir. kadar kullanabilirsiniz. orta GPU'nuzda 8 GB VRAM varsa model. Daha az VRAM için daha küçük modelleri tercih edin. Yalnızca biraz daha doğru ama aynı zamanda çok daha talepkar olanı seçin büyük 16 GB VRAM veya daha fazlasına sahip bir GPU kullanıyorsanız model.
  5. Dil modeli ne kadar büyük olursa, transkripsiyon sürecinin o kadar yavaş olduğunu unutmayın. Gerekenden daha büyük bir model için gitmeyin. Muhtemelen Whisper Desktop'ın orta veya daha küçük modellerde çoğu zaman paragraf başına yalnızca bir veya iki hatayla "sizi anladığını" göreceksiniz.

Hala Yazıyor Musunuz? Sesinizi Fısıldayarak Kullanın

Kurulumu biraz zaman gerektirmesine rağmen, denediğinizde göreceğiniz gibi, Whisper Desktop çok daha yüksek doğruluk ve daha iyi hız ile çoğu alternatiften çok daha iyi performans gösterir.

Sesinizle yazmak için kullanmaya başladıktan sonra, klavyeniz çok eski zamanlardan kalma bir kalıntı gibi görünebilir.