İlan

Basılı herhangi bir metni kopyalayabileceğiniz, yapıştırabileceğiniz, düzenleyebileceğiniz ve arayabileceğiniz dijital metne dönüştürmek istiyorsanız Optik Karakter Tanıma (OCR) tarayıcıları kullanmanız gerekir.

Bir belgenin taranmasını veya fotoğrafını çekmeyi seçtiğinizde, bu JPEG veya PDF gibi bir biçimde kaydedilir. OCR yazılımı daha sonra bu belgelerdeki harfleri ve sayıları tanıyabilir ve aranabilir PDF PDF Dosyalarını Ücretsiz Oluşturma ve Düzenleme YöntemleriBilgisayar dünyamızda bulunan tüm yaygın dosya türlerinden PDF muhtemelen en kısıtlayıcı olanlardan biridir, aynı zamanda herkesin kullanabileceği (öncelikle okumak için) ... Daha fazla oku veya Microsoft Word gibi programlarda düzenleyebileceğiniz bir dosyaya.

Sorun şu ki, bazı OCR tarayıcıları diğerlerinden çok daha iyi çalışıyor, en iyisi cüzdanda oldukça ağır.

Örneğin, Omnipage18'in maliyeti 150 ABD dolarıdır, ancak özellikle farklı dilleri tanımada iyidir. Adobe Acrobat Pro DC maliyeti 400 $ 'dır ancak inanılmaz bir hassasiyete sahiptir.

instagram viewer
ABBYY FineReader maliyeti 150 dolar, ancak dergi ve broşür gibi belgeleri aranabilir metne dönüştürmek harika. ABBYY’nin çevrimiçi teklifini daha sonra bu makalede test edeceğiz.

Ancak, ücretsiz alternatiflerin peşindeyseniz, indir ve Windows veya OS X'te kullanın, bu OCR Araçlarını deneyin Görüntülerden Metin Çıkarmak için En İyi 5 OCR AracıKağıt topunuz olduğunda, tüm basılı metinleri dijital bir programın tanıyabileceği ve dizine ekleyebileceği bir şeye nasıl dönüştürürsünüz? İyi bir OCR yazılımını yakın tutun. Daha fazla oku . Ancak ücretsiz kullanmayı tercih ediyorsanız, internet üzerinden OCR aracını kullanarak, ilk birkaçını denediğimiz gibi, aşağıdaki sonuçlarla okumaya devam edin.

Test

Çoğu insan artık kendi onlar için tarama yapmak için akıllı telefonlar Makbuzlarınızı Tarama ve Yönetme, Yerden, Kağıttan ve Zamandan Tasarruf EdinKağıt makbuzlar kolayca kaybolur ve en çok ihtiyacınız olduğunda bulmak zordur. Neyse ki, dijital olmak her iki sorunu da çözüyor. Daha fazla oku , Kullanmaya karar verdim Evernote’un Taranabilir uygulaması (İOS ve Android'de ücretsiz). Richard Dawkin’in ilk sayfasını taradım Tırmanma Montaj Aleti, çok temel biçimlendirme ile hangi sonuçları elde edebileceğimizi görmek için. Tim Ferriss'in bir sayfasını da taradım. 4 Saatlik Şef tarayıcıları biraz daha karmaşık biçimlendirmeyle denemek için. Bu dosyaların her birini PDF olarak kaydettim.

Çevrimiçi OCR'leri Test Etme

Bu belgeler daha sonra ne kadar iyi olduklarını görmek için sözde en iyi çevrimiçi OCR araçlarından bazılarıyla çalıştırıldı.

Ücretsiz Online OCR [Artık Kalmadı]

Ne mutlu ki, Ücretsiz Çevrimiçi OCR kullanmak için herhangi bir kayıt gerekli değildir. Ve belgemin biçimlendirmesini ve düzenini koruma iddiasını gördüğümde iki kat etkilendim.

Ücretsiz Online OCR

Site, girdi olarak PDF, GIF, BMP, JPEG, TIFF ve PNG'yi destekleyebildiğini iddia ediyor. Çıktılar ya DOC, bir PDF metin belgesi, RTF ve TXT olabilir. Maalesef, dosya boyutu sınırına sahip olup olmadıklarını bulamadım.

PDF'ye Temel Belge
Kesinlikle mükemmel dönüşüm. Söyleyecek çok şey yok! Biz bir çok iyi başlangıç.

DOC'a Temel Belge
Asıl sözler, bir şekilde AWOL'a giden “Rushmore Dağı” ndaki “ount” dışında kusursuz bir şekilde dönüşmüş gibi görünüyor. Biçimlendirme farklı bir hikaye. Birçok virgül, alt çizgi ile değiştirildi ve belge boyunca noktalara rastgele boşluklar yerleştirildi. Daha sonra premium yazılımın bu testte nasıl ilerlediğini gördüğünüzde, bu kötü bir çaba değil hiç.

PDF'den Karmaşık Belge
Belgeyi dönüştürmek 120 saniye sürdü! Tamamlandığında, metnin tamamı yaklaşık% 95 doğrulukla dönüştürülmüştür, ancak sayfanın sağ üst köşesindeki ayrı kutudaki metne erişilememiştir. PDF boyunca birkaç karakter daha yanlıştı.

DOC'a Karmaşık Belge
Bu sefer, dönüştürme yalnızca 10 saniye sürdü ve metin tekrar yaklaşık% 95 doğrulukla dönüştürüldü. Bazı tuhaf boşluk sorunları vardı ve yazılım yazı tipini belgenin sağ üst köşesine dönüştürmede sorun yaşıyordu ve burada birkaç karakteri kaçırdı.

Karar
Basit biçimlendirilmiş belgeleri PDF'ye dönüştürmek istiyorsanız, bu harika bir araçtır. DOC'a dönüşüm açısından sonuçlar evde yazacak bir şey değildi.

i2OCR bazı etkileyici iddialarda bulunuyor. Araç 60'tan fazla dili tanır, çok sütunlu düzenleri işleyebilir (biçimlendirmeyi kaldırarak), dosya boyutu sınırı yoktur, yüklenen dosyaları dönüştürebilir ve URL'lerden. Ayrıca bu aracı kullanmak için kayıt olmanız da gerekmez.

Hizmet, metni görüntünüzden çıkararak ve ardından biçimlendirilmemiş metin çıkararak çalışır. Metni diğer programlara kopyalamadan veya DOC, PDF veya HTML olarak indirmeden önce yan yana görünümdeki hataları hızla düzeltebilirsiniz.

Not: PDF belgelerimi yüklemeye çalıştığımda, bunlar i2OCR tarafından reddedildi, bu yüzden bunları JPEG'ye dönüştürmem gerekiyordu (bir ekran görüntüsünü alıp dosyaları yükleyerek).

Temel Belgeden Düz MetneEkran Görüntüsü 2016-02-11 at 12.30.28
Bu aracın çalışma şekli nedeniyle, tüm biçimlendirme kaybolur, ancak görüntüden metne dönüşüm neredeyse mükemmeldi. Paragraf aralığı gibi bazı küçük hatalar vardı ve bazı virgüller noktalarla değiştirildi, ancak bunlar küçük niggles.

Belgeyi Düz Metne KarmaşıkEkran Görüntüsü 12.09.48'de 2016-02-11
Metnin büyük bir kısmı, bu araç için okunamayan başlık ve sağ üstteki tarif dışında çok fazla hata olmadan dönüştürüldü. Sütunların düz metne dönüştürülme şekli idealden uzaktı. Bu dönüşümü uygulanabilir yapmak istiyorsanız, satırları tutarlı cümlelere yeniden düzenlemek için çok zaman gerekecektir.

Karar
Temel belgeler için i2OCR harika çalışıyor. İndirmeden önce metni düzenleme yeteneği de çok hoş bir dokunuş. Bununla birlikte, daha karmaşık belgeler için, dönüşüm hala oldukça doğrudur, ancak metnin çıktı biçimi hayatınızı daha kolay hale getirmeyecektir.

Çevrimiçi OCR şu anda 46 farklı dili desteklemektedir ve PDF, JPG, BMP, TIFF ve GIF dosyalarını Word, Excel veya Düz Metin biçimine dönüştürebilir. Site, “dönüştürülen belgeler orijinaline benzer - tablolar, sütunlar ve grafikler” iddia ediyor.

Kayıt olmadan kullanabileceğiniz sürüm, saatte 15 görüntüye (5mb limit) kadar dönüştürme yapmanızı sağlar. Bir hesaba kaydolursanız, çok sayfalı belgeleri ve ZIP arşivlerini de dönüştürebilirken, bu sınırın üstünde daha fazla sayfa satın alabilirsiniz.

Çevrimiçi OCR Sonuçları

DOC'a Temel Belge
Temel belge, Roma rakamından kusursuz bir şekilde dönüştü ben alınmıyor. Sitenin vaat ettiği gibi, biçimlendirme tam olarak kitapta olduğu gibiydi. Bu araca şeref.

DOC'a Karmaşık Belge
Karmaşık belgeyi dönüştürürken önceki OCR araçları tarafından hayal kırıklığına uğradıktan sonra, Online OCR'den çok etkilendim. Gördüğünüz gibi düzen mükemmeldi. Yine de, tarif çok iyi alınmadı, ancak diğer küçük hatalar ihmal edilebilirdi.

Karar

Online OCR'den kesinlikle harika sonuçlar. Gördüğüm tek dezavantaj, dönüştürülen belgeleri PDF olarak indirmenin bir yolu olmaması, çünkü belirtilen çıktı biçimleri yalnızca DOCX, XLSX ve TXT'yi içeriyor.

Daha önce de belirtildiği gibi ABBYY, OCR yazılımında pazar liderlerinden biridir ve tam, indirilebilir programları için yaklaşık 150 $ maliyete sahiptir. Bir teklif 10 sayfalık ücretsiz deneme olsa da, çevrimiçi araçları için (kayıt gereklidir). 5 $ 'lık bir abonelik için, çevrimiçi araçları her ay 200 sayfayı dönüştürmenize izin verecektir.

ABBYY FineReader Çevrimiçi

Kabul edilen dosyalar şu biçimlerden herhangi birinde 100mb'ye kadar olabilir: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ve PNG. ABBYY ayrıca yaklaşık 200 dili tanıyor. Çıktılar özellikle etkileyici, DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ve EPUB arasında seçim yapabiliyor.

Deneme süreniz boyunca birkaç BETA özelliğini bile deneyebilirsiniz. Birincisi, belgenizi başka bir dile çevirme seçeneğidir. Diğeri ise, Dropbox, Google Drive, Evernote, Microsoft OneDrive veya Box gibi dönüştürülmüş belgenizi bulut depolama hesabınıza aktarmaktır.

DOCX'e Temel Belge
Genel sonuçlar iyi, ancak bunun premium bir ürün olduğu düşünülürse şaşırtıcı değil. Birden fazla virgül ve nokta takas edildi, birkaç ters virgülün yerine bir asterix konuldu, birkaç büyük harf eksikti ve bir kelime (kelimenin tam anlamıyla) yanlış yazılmıştı.

DOCX'e Karmaşık Belge
Dönüştürüldükten sonra, belgedeki metinde çok az hata vardı (OCR'nin yazı tipiyle tekrar mücadele eden OCR dışında!), Ancak biçimlendirme istenen çok şey bıraktı.

ABBYY Sonucu

Üç sütun bir şekilde iki sayfa aldı, orta sütun sadece ikinci sayfada görünür. Eğer gerçekten isteseydin yapmak dönüştürülmüş bir belgeyle, saçınızı çekip çıkarırsınız.

PDF'ye Temel Belge
Dönüştürülen PDF'i incelerken, hiçbir hata bulamadım. Belki ABBYY'nin mükemmel olduğu yerleri bulduk. Harika sonuçlar.

PDF'den Karmaşık Belge
Yine, bu dönüştürülmüş dosyada herhangi bir hata bulamadım. ABBYY, PDF'ye nasıl olağanüstü bir şekilde dönüştürüleceğini açıkça biliyor.

Karar
Birkaç dolar ödemekten memnunsanız, PDF'ye dönüştürmek bu hizmetle ve dönüştürülmüş dosyaları bulut depolama alanınızla senkronize edebilmeniz özellikle çok sayıda belgeler. Diğer seçeneklerde olduğu gibi, ABBYY hala kolay düzenleme için belgelerin kusursuz bir şekilde DOC'a nasıl dönüştürüleceğini bulamamıştır.

Nihai Sonuç

Çoğu kişi gibi, sadece birkaç dergi makalesini ve bazı ev faturalarını taramak istiyorsanız, bu belgeleri düzenlemenize gerek yoktur. Bu nedenle, doğrudan PDF'ye dönüştürmek sizin için uygun olacaktır, çünkü yine de bu belgeleri arayabilirsiniz. Bunun için, Free Online OCR kesinlikle test ettiğimiz en iyi ücretsiz araçtır. Bununla birlikte, mükemmele yakınlık için ayda 5 dolar ödemek istiyorsanız, ABBYY’nin FineReader Çevrimiçi biraz daha doğruydu.

Belgeleri DOC'ye dönüştürme söz konusu olduğunda, mükemmel olan herhangi bir çözüm bulmayı başaramadık, ancak en iyi sonuçlar geldi Çevrimiçi OCR. Dönüşüm mükemmel değildi, ancak biçimlendirmenin bütünlüğü büyük ölçüde sağlam tutuldu ve hatalar ihmal edilebilirdi. Bu sonuçları ABBYY'nin “premium” teklifiyle karşılaştırdığımızda yardım edemezsiniz, ancak bundan çok etkilenebilirsiniz.

Dahil etmedik Google Drive’ın OCR özellikleri bu yazıda; Google’ın herkes için biraz daha fazlası, dahası, orada ücretsiz birkaç çevrimiçi OCR hizmetini test etmek istediğimiz için.

Size kalmış: Okuyucularımıza başka hangi çevrimiçi OCR araçlarını önerirsiniz? Ve hangisini bir daha asla kullanmayacağınızı denediniz?

Rob Nightingale, İngiltere'deki York Üniversitesi'nden Felsefe diplomasına sahiptir. Beş yıldan fazla bir süredir sosyal medya yöneticisi ve danışmanı olarak çalışmakta ve çeşitli ülkelerde atölye çalışmaları yürütmektedir. Son iki yıldır Rob aynı zamanda bir teknoloji yazarı ve MakeUseOf'un Sosyal Medya Yöneticisi ve Bülten Editörü. Genellikle onu seyahat ederken bulursunuz…