Öğrenciyseniz veya işiniz çok sayıda resim ve PDF ile çalışmayı içeriyorsa, bir noktada bir resimden veya belgeden metin çıkarma ihtiyacı hissetmişsinizdir.

Neyse ki, metin çıkarma bunu mümkün kılar. Ve bunu yapmak için kullanabileceğiniz birkaç araç var. gImageReader birçok araçtan biridir. Kullanımı ücretsizdir ve hem görüntü dosyaları hem de PDF belgeleriyle çalışır.

Gelin gImageReader'ı ayrıntılı olarak incelemek ve onu resimlerden ve PDF'lerden metin çıkarmak için nasıl kullanabileceğinizi görmek için başlayalım.

gImageReader Nedir?

gImageReader, Linux'ta resimlerden ve PDF'lerden metin çıkarmanıza izin veren bir uygulamadır. Esasen bir GUI veya ön uç Tesseract OCR motoru, bir açık kaynak Hewlett-Packard tarafından geliştirilen ve mevcut en iyi OCR motorlarından biri olarak kabul edilen motor.

gImageReader ile birkaç basit tıklamayla resimlerden veya PDF belgelerinden kolayca ve oldukça doğru bir şekilde metin ayıklayabilirsiniz. Daha sonra, ayıklanan metni daha sonra kullanmak üzere bir metne veya PDF dosyasına aktarabilirsiniz.

instagram viewer

gImageReader'ın Özellikleri

gImageReader aşağıdaki özellikleri paketler:

  • Farklı kaynaklardan (disk, tarama cihazları, pano ve ekran görüntüsü) PDF belgelerini ve görüntülerini içe aktarın
  • Görüntüleri veya belgeleri toplu işleyin, yani aynı anda birden çok görüntü veya belgeden metin çıkarın
  • Metin parçacıklarını düz metin veya hOCR belgeleri olarak tanıyın
  • Yerleşik yazım denetleyicisi
  • Otomatik metin alanı algılama
  • Temel resim/belge düzenleme
  • Çıktıyı metin dosyası olarak kaydet

Linux'ta gImageReader Nasıl Kurulur

gImageReader'da mevcuttur en büyük Linux dağıtımları. Ancak kurulumuna devam etmeden önce Tesseract OCR motorunu sisteminize kurmanız gerekir.

Bunu yapmak için, açın Yazılım Yöneticisi sisteminizde arayın ve teserakt. Bir sonuç listesi döndürdüğünde, tesseract-ocr ve tesseract-ocr-eng paketler. Terminalde daha rahatsanız, paketi kurmak için komut satırı paket yöneticilerini de kullanabilirsiniz.

Bundan sonra, gImageReader'ı bilgisayarınıza kurmak için aşağıdaki bölümlerdeki kurulum talimatlarına bakın.

Debian veya Ubuntu kullanıyorsanız, gImageReader'ı kurmak için terminali açın ve aşağıdaki komutları çalıştırın:

sudo eklenti-apt-deposu ppa: sandromani/gimagereader
sudo uygunalmak Güncelleme
sudo uygun Yüklemek gimage okuyucu

Fedora, CentOS veya Red Hat Enterprise Linux'ta (RHEL):

sudo dnf Yüklemek gimagereader-qt 

Açık Arch Linux veya Manjaro:

sudo pacman -S gimagereader

openSUSE kullanıcıları aşağıdakileri kullanarak gImageReader'ı yükleyebilir:

sudo zypper Yüklemek gimage okuyucu

Başka bir Linux dağıtımı kullanıyorsanız, adresindeki talimatları izleyerek gImageReader'ı kaynaktan oluşturabilirsiniz. gImageReader'ın GitHub'ı.

Linux'ta gImageReader Nasıl Kullanılır

gImageReader'ın kullanımı oldukça kolaydır ve PDF belgelerinin yanı sıra her türlü resim dosyasıyla çalışır. Linux'ta resimlerden veya PDF'lerden metin çıkarmak için aşağıdaki talimatları izleyin.

Uygulamalar menüsünü açın, gImageReaderve uygulamayı başlatın. I vur Büyüt tam ekran görünümünde açmak için gImageReader penceresindeki düğmesine basın.

Şimdi, tıklayın Resim ekle araç çubuğunun altındaki sol bölmedeki düğmesine basın ve metin çıkarmak istediğiniz resim(ler)i veya PDF(ler)i seçmek için dosya tarayıcısını kullanın.

Tıklamak Tamam görüntüleri veya PDF'leri gImageReader'a aktarmak için. Veya ekranda görüntülenenlerden metin çıkarmak istiyorsanız, yanındaki açılır menüyü tıklayın. Resim ekle düğmesine basın ve seçin Ekran görüntüsü al. gImageReader, ekran içeriğinin bir ekran görüntüsünü alacaktır.

Resmi gImageReader'a ekledikten sonra, Çıkış bölmesini aç/kapat çıkış bölmesini getirmek için (biri not defteri simgesi olan) düğmesine basın. Resimlerden veya PDF'lerden çıkardığınız metnin göründüğü yer burasıdır.

Nasıl ilerlemek istediğinize bağlı olarak, artık resimdeki veya PDF'deki metni otomatik veya manuel olarak tanımlama seçeneğiniz var. Bunu otomatik olarak yapmak için, üzerine tıklayın. Otomatik algılama düzeni düğmesine basın ve seçilen görüntü veya PDF belgesindeki tüm metin bloklarını vurgulayacaktır.

Bundan sonra üzerine dokunun Seçimi tanı > Geçerli Sayfa Metin çıkarma işlemini başlatmak için.

Alternatif olarak, metni manuel olarak seçmek için, çıkarmak istediğiniz metnin üzerine gelin ve artı işaretini kullanarak metni çıkarmak istediğiniz alanın çevresine bir kutu çizin. Ardından, Seçimi tanı düğmesine basın.

Bu bir PDF belgesiyse ve farklı sayfalardan metin çıkarmak istiyorsanız, üzerine dokunun. Artı (+) sayfaları çevirmek için düğmesine basın.

Geri dönmek için, Eksi (-) buton. Ardından, çıkarmak istediğiniz metni seçin ve Seçimi tanı çıkarmak için düğmesine basın.

Nadir olsa da, gImageReader'ın çıkarılan metni İngilizce dışında bir dilde döndürdüğü zamanlar olabilir. Bu olduğunda, yanındaki açılır düğmeye dokunmanız yeterlidir. Seçimi tanı düğmesine basın ve İngilizce seçeneklerinden birini seçin.

Son olarak, çıkarılan metni kaydetmek için Çıktıyı kaydet buton. Bu, Kaydet penceresini getirecektir. Burada dosyaya bir isim verin ve Tamam.

gImageReader ile Başka Neler Yapabilirsiniz?

Daha önce de belirtildiği gibi, gImageReader, içe aktarılan görüntülerin veya belgelerin parlaklık, kontrast ve çözünürlük gibi belirli yönlerini değiştirme seçeneği de sunar. Ayrıca, gerekirse renkleri tersine çevirebilir veya görüntüleri veya belgeleri döndürebilirsiniz.

Bu seçeneklerin çoğu, bir görüntü veya belgedeki metin gImageReader tarafından okunamadığında ve bu nedenle aracın metni tanımasını engellediğinde yararlı olabilir.

Bu düzenleme seçeneklerinden herhangi birine erişmek için Görüntü Kontrolleri düğmesine basın ve ana araç çubuğunun altında bir mini araç çubuğu ortaya çıkar. Resim veya belge üzerinde istediğiniz düzenleme işlemini gerçekleştirmek için buradan uygun düğmeleri seçin.

Linux'ta Metin Çıkarma, gImageReader ile Kolaylaştı

Metin çıkarma genellikle doğru aracı gerektirir: güvenilir ve doğru bir OCR motoru kullanan bir araç. bir görüntüdeki veya belgedeki metni etkili bir şekilde tanımlamasını sağlar, böylece herhangi bir sorun olmadan verimli bir şekilde ayıklayabilirsiniz. güçlük.

gImageReader, arka planda kullandığı Tesseract OCR motoru sayesinde bunu güzel bir şekilde başarır. Kullanım kolaylığı düşünüldüğünde gImageReader, şüphesiz Linux için mevcut en iyi metin çıkarma araçlarından biridir.

Alternatif olarak, daha basit bir çözüm arıyorsanız, hızlı ve kullanımı oldukça kolay olan TextSnatcher'a göz atabilirsiniz.