Imate PDF dokument ili sliku koju želite pretvoriti u tekst? Nedavno mi je netko poslao dokument poštom koji sam trebao urediti i vratiti s ispravkama. Osoba nije mogla pronaći digitalnu kopiju, tako da sam dobio zadatak da sav taj tekst dobije u digitalni format.

Nisam mogao provesti sate upisujući sve natrag, pa sam završio s fotografijom lijepe visokokvalitetne slike i zatim prošao put kroz hrpu internetskih OCR usluga da vidim koji će mi dati najbolji rezultati.

U ovom ću članku istražiti nekoliko mojih najdražih stranica za OCR koje su besplatne. Vrijedno je napomenuti da većina ovih web mjesta pruža osnovnu besplatnu uslugu, a zatim imaju plaćene opcije ako želite dodatne značajke poput većih slika, PDF stranica s više stranica, različitih jezika unosa itd.

Također je dobro znati unaprijed da se većina ovih usluga neće moći uskladiti s formatom vašeg izvornog dokumenta. Oni su uglavnom za izdvajanje teksta i to je to. Ako vam je potrebno da sve bude u određenom izgledu ili formatu, to ćete morati ručno učiniti nakon što dobijete sav tekst s OCR-a.

Osim toga, najbolji rezultati za dobivanje teksta dobit će se iz dokumenata rezolucije 200 do 400 DPI. Ako imate nisku DPI sliku, rezultati neće biti tako dobri.

Napokon, bilo je puno web lokacija koje sam testirao koje jednostavno nisu radile. Ako Google besplatno kupi na mreži OCR, vidjet ćete gomilu web lokacija, ali nekoliko web lokacija u prvih 10 rezultata nije ni dovršilo pretvorbu. Neki bi istekli, drugi bi napravili pogreške, a neki su se samo zaglavili na stranici za pretvaranje, tako da se nisam čak ni trudio spomenuti te stranice.

Za svaku sam web lokaciju testirao dva dokumenta kako bih vidio koliko će biti učinak. Za testove sam jednostavno koristio svoj iPhone 5S kako bih fotografirao oba dokumenta i zatim ih izravno prenio na web stranice radi konverzije.

U slučaju da želite vidjeti kako su izgledale slike koje sam koristio za svoj test, priložio sam ih ovdje: Test1 i Test2. Imajte na umu da ovo nisu verzije pune razlučivosti slika snimljenih s telefona. Pri prijenosu na web stranice upotrijebio sam sliku pune razlučivosti.

OnlineOCR

OnlineOCR.net je čista i jednostavna stranica koja je na mom testu dala vrlo dobre rezultate. Glavno što mi se sviđa kod mene je to što na cijelom mjestu nema tona oglasa, što je obično slučaj s ovakvim vrstama nišnih servisnih mjesta.

besplatni online ocr

Za početak odaberite datoteku i pričekajte dok se prijenos ne završi. Maksimalna veličina prijenosa za ovu web lokaciju je 100 MB. Ako se registrirate za besplatni račun, dobit ćete nekoliko dodatnih značajki poput veće veličine za prijenos, PDF-a s više stranica, različitih jezika unosa, više konverzija na sat itd.

Zatim odaberite svoj jezik unosa, a zatim odaberite izlazni format. Možete birati između Worda, Excela ili Običnog teksta. Kliknite gumb Pretvori i vidjet ćete tekst prikazan na dnu u okviru zajedno s vezom za preuzimanje.

ocr izlaz

Ako želite samo tekst, samo ga kopirajte i zalijepite iz okvira. Međutim, predlažem vam da preuzmete Wordov dokument jer to čini iznenađujuće sjajan posao zadržavanja izgleda izvornog dokumenta.

Na primjer, kad sam otvorio Wordov dokument za svoj drugi test, bio sam iznenađen kad sam otkrio da dokument uključuje tablicu s tri stupca, baš kao na slici.

online ocr izlaz

Od svih lokacija, ovaj je bio najbolji do sada. Potpuno se vrijedi registrirati ako trebate obaviti mnogo konverzija.

Radi potpunosti, povezujem se i s izlaznim datotekama kreiranim od strane svake usluge da biste mogli sami vidjeti rezultate. Evo rezultata iz OnlineOCR-a: Test1 Doc i Test2 Doc.

Imajte na umu da prilikom otvaranja ovih dokumenata programa Word na vašem računalu, u Wordu ćete dobiti poruku u kojoj stoji da je to s Interneta, a uređivanje je onemogućeno. To je sasvim u redu jer Word ne vjeruje dokumentima s Interneta i stvarno ne morate omogućiti uređivanje ako želite dokument pregledati.

i2OCR

Drugo mjesto koje je dalo prilično dobre rezultate bio je i2OCR. Proces je vrlo sličan: odaberite jezik, datoteku i pritisnite Extract Text.

i2ocr

Morat ćete pričekati minutu ili dvije jer ova stranica traje malo duže. Također, u koraku 2 provjerite prikazuje li se vaša slika s desne strane prema gore, jer ćete u protivnom dobiti hrpu ispisa. Iz nekog razloga, slike s mog iPhonea prikazivale su se u portretnom načinu na mom računalu, ali pejzažno kad sam se učitao na ovu stranicu.

i2ocr izlaz

Morao sam ručno otvoriti sliku u aplikaciji za uređivanje fotografija, okrenuti je za 90 stupnjeva, zatim je okrenuti u portret i ponovo je spremiti. Kad završite, pomaknite se prema dolje i prikazat će vam pregled teksta zajedno s gumbom za preuzimanje.

To je web mjesto bilo prilično dobro s rezultatima prvog testa, ali nije dobro s drugim testom koji je imao raspored stupca. Evo rezultata iz i2OCR: Test1 Doc i Test2 Doc.

FreeOCR

Free-OCR.com će uzeti vaše slike i pretvoriti ih u običan tekst. Nema mogućnost izvoza u Word format. Odaberite datoteku, odaberite jezik, a zatim pritisnite Start.

Web mjesto je brzo i dobit ćete izlaz prilično brzo. Samo kliknite vezu kako biste tekstualnu datoteku preuzeli na svoje računalo.

freeocr

Kao i u NewOCR-u, spomenutom dolje, ova web stranica koristi velika slova T-a u dokumentu. Nemam pojma zašto bi to učinio, ali iz nekog neobičnog razloga su to učinili i web stranica i NewOCR. Nije velika stvar to promijeniti, ali to je mučan proces koji stvarno ne biste trebali raditi.

Evo rezultata iz FreeOCR-a: Test1 Doc i Test2 Doc.

ABBYY FineReader Online

Da biste koristili FineReader Online, morate se registrirati za račun koji vam besplatno nudi 15-dnevnu probnu verziju OCR-a do 10 stranica. Ako trebate napraviti jednokratni OCR za par stranica, tada možete koristiti ovu uslugu. Nakon registracije kliknite vezu za potvrdu u potvrdnoj e-pošti.

finereader online

Kliknite na Prepoznaj pri vrhu, a zatim kliknite Prijenos da biste odabrali datoteku. Odaberite jezik, izlazni format i zatim kliknite na dnu Prepoznaj. Ova web lokacija ima čisto sučelje i nema oglasa.

U mojim testovima, ovo je mjesto uspjelo uzeti tekst iz prvog testnog dokumenta, ali bilo je apsolutno nevjerojatno kad sam otvorio Word doc, pa sam to završio ponovo i odabrao Plain Text kao izlazni format.

Za drugi test sa stupovima, Wordov dokument bio je prazan, a nisam mogao ni naći tekst. Niste sigurni što se tamo dogodilo, ali čini se da ne može podnijeti ništa osim jednostavnih odlomaka. Evo rezultata iz FineReader-a: Test1 Doc i Test2 Doc.

NewOCR

Sljedeća stranica, NewOCR.com, bila je u redu, ali ni približno tako dobra kao prva. Prvo, ima oglasa, ali srećom ne tonu. Prvo odaberite datoteku, a zatim kliknite gumb Pretpregled.

Učitaj sliku

Tada možete zakrenuti sliku i prilagoditi područje na kojem želite skenirati tekst. Prilično je poput procesa skeniranja na računalu s priloženim skenerom.

ocr slika

Ako dokument ima više stupaca, možete provjeriti gumb Analiza izgleda stranice i pokušati će podijeliti tekst na stupce. Kliknite gumb OCR, pričekajte nekoliko sekundi da se dovrši, a zatim se pomaknite prema dolje kad se stranica osvježi.

U prvom testu točno je dobila sav tekst, ali iz nekog razloga velikim slovom napisana svaka T u dokumentu! Ne znam zašto bi to učinio, ali uspjelo je. U drugom testu s omogućenom analizom stranica dobio je veći dio teksta, ali izgled je bio potpuno isključen.

Evo rezultata iz NewOCR-a: Test1 Doc i Test2 Doc.

Zaključak

Kao što vidite, besplatno vam zapravo ne daju baš dobre rezultate većinu vremena nažalost. Prva spomenuta web lokacija najbolje je daleko, jer ne samo da je odradila sjajan posao prepoznavanja čitavog teksta, već je uspjela zadržati i oblik izvornog dokumenta.

Ako vam treba samo tekst, većina gore navedenih web lokacija trebala bi to moći učiniti umjesto vas. Ako imate bilo kakvih pitanja, slobodno komentirajte. Uživati!