5 bezplatných online služieb OCR testovaných a skontrolovaných

Máte dokument PDF alebo obrázok, ktorý by ste chceli previesť na text? Nedávno mi niekto poslal poštou dokument, ktorý som potreboval upraviť a poslať späť s opravami. Táto osoba nemohla nájsť digitálnu kópiu, takže som dostal za úlohu dostať celý ten text do digitálneho formátu.

Neexistoval spôsob, ako by som trávil hodiny písaním všetkého späť, takže som nakoniec urobil peknú fotografiu dokumentu vo vysokej kvalite a potom som sa predieral množstvom online služieb OCR , aby som zistil, ktorá z nich bude najlepšia. výsledky.

V tomto článku prejdem niekoľko mojich obľúbených stránok pre OCR , ktoré sú zadarmo. Stojí za zmienku, že väčšina z týchto stránok poskytuje základnú bezplatnú službu a potom má platené možnosti, ak chcete ďalšie funkcie, ako sú väčšie obrázky, viacstranové dokumenty PDF , rôzne vstupné jazyky atď.

Vopred je tiež dobré vedieť, že väčšina týchto služieb sa nebude môcť zhodovať s formátovaním vášho pôvodného dokumentu. Tie slúžia hlavne na extrakciu textu a to je všetko. Ak potrebujete, aby bolo všetko v konkrétnom rozložení alebo formáte, budete to musieť urobiť ručne, keď získate celý text z OCR .

Okrem toho najlepšie výsledky získania textu budú pochádzať z dokumentov s rozlíšením 200 až 400 DPI . Ak máte obraz s nízkym DPI , výsledky nebudú také dobré.

Nakoniec som testoval veľa stránok, ktoré jednoducho nefungovali. Ak zadáte do Googlu bezplatné online rozpoznávanie OCR(OCR) , uvidíte veľa stránok, ale niektoré z 10 najlepších výsledkov konverziu ani nedokončili. Niektorým vypršal časový limit, iným sa vyskytli chyby a niektoré sa zasekli na stránke „konverzie“, takže som sa ani neobťažoval spomenúť tieto stránky.

Pre každú lokalitu som otestoval dva dokumenty, aby som zistil, aký kvalitný bude výstup. Na moje testy som jednoducho použil svoj iPhone 5S na odfotenie oboch dokumentov a potom som ich nahral priamo na webové stránky na konverziu.

V prípade, že chcete vidieť, ako vyzerali obrázky, ktoré som použil pri mojom teste, prikladám ich tu: Test1 a Test2 . Upozorňujeme, že toto nie sú verzie obrázkov nasnímaných z telefónu v plnom rozlíšení. Pri nahrávaní na stránky som použil obrázok v plnom rozlíšení.

OnlineOCR

OnlineOCR.net je čistá a jednoduchá stránka, ktorá v mojom teste priniesla veľmi dobré výsledky. Hlavná vec, ktorá sa mi na ňom páči, je, že nemá všade veľa reklám, čo je zvyčajne prípad takýchto stránok so špecializovanými službami.

zadarmo online ocr

Ak chcete začať, vyberte súbor a počkajte, kým sa dokončí nahrávanie. Maximálna veľkosť nahrávania pre túto stránku je 100 MB. Ak sa zaregistrujete na bezplatný účet, získate niekoľko ďalších funkcií, ako je väčšia veľkosť nahrávania, viacstranové súbory PDF(PDFs) , rôzne vstupné jazyky, viac konverzií za hodinu atď.

Ďalej vyberte jazyk vstupu a potom vyberte výstupný formát. Môžete si vybrať z Wordu(Word) , Excelu(Excel) alebo Obyčajného textu(Plain Text) . Kliknite(Click) na tlačidlo Konvertovať(Convert) a text sa zobrazí v spodnej časti poľa spolu s odkazom na stiahnutie.

ocr výstup

Ak chcete iba text, jednoducho ho skopírujte a prilepte z poľa. Navrhujem však, aby ste si stiahli dokument programu Word(Word) , pretože robí prekvapivo skvelú prácu pri zachovaní rozloženia pôvodného dokumentu.

Napríklad, keď som otvoril dokument programu Word(Word) na môj druhý test, bol som prekvapený, keď som zistil, že dokument obsahuje tabuľku s tromi stĺpcami, rovnako ako na obrázku.

online ocr výstup

Zo všetkých stránok bola táto zďaleka najlepšia. Úplne stojí za registráciu, ak potrebujete urobiť veľa konverzií.

Pre úplnosť uvediem aj odkaz na výstupné súbory vytvorené každou službou, aby ste si výsledky mohli pozrieť sami. Tu sú výsledky z OnlineOCR : Test1 Doc a Test2 Doc .

Všimnite si, že keď otvoríte tieto dokumenty programu Word(Word) na počítači, vo Worde(Word) sa zobrazí správa , že pochádza z internetu(Internet) a úpravy boli zakázané. To je úplne v poriadku, pretože Word neverí dokumentom z internetu(Internet) a naozaj nemusíte povoliť úpravy, ak chcete dokument iba zobraziť.

i2OCR

Ďalšou stránkou, ktorá priniesla celkom dobré výsledky, bola i2OCR . Postup je veľmi podobný: vyberte si jazyk, súbor a potom stlačte Extrahovať text(Extract Text) .

i2ocr

Tu budete musieť počkať minútu alebo dve, pretože táto stránka trvá trochu dlhšie. V kroku 2(Step 2) sa tiež uistite, že sa váš obrázok v ukážke zobrazuje pravou stranou nahor, inak sa na výstupe objaví veľa nezmyslov. Z nejakého dôvodu sa obrázky z môjho iPhone na mojom počítači zobrazovali v režime na výšku, ale na šírku, keď som ich odovzdal na túto stránku.

i2ocr výstup

Musel som manuálne otvoriť obrázok v aplikácii na úpravu fotografií, otočiť ho o 90 stupňov, potom ho otočiť späť na výšku a potom ho znova uložiť. Po(Once) dokončení prejdite nadol a zobrazí sa vám ukážka textu spolu s tlačidlom na stiahnutie.

Táto stránka si počínala celkom dobre s výstupom z prvého testu, ale v druhom teste, ktorý mal rozloženie stĺpcov, sa mu až tak nedarilo. Tu sú výsledky z i2OCR: Test1 Doc a Test2 Doc .

FreeOCR

Free-OCR.com vezme vaše obrázky a prevedie ich na obyčajný text. Nemá možnosť exportu do formátu Word . Vyberte svoj súbor, vyberte jazyk a potom kliknite na tlačidlo Štart(Start) .

Stránka je rýchla a výstup získate pomerne rýchlo. Stačí(Just) kliknúť na odkaz a stiahnuť si textový súbor do svojho počítača.

freeocr

Rovnako ako v prípade NewOCR , ktoré je uvedené nižšie, aj táto stránka používa veľké písmená T v dokumente. Nemám potuchy, prečo by to robilo, ale z nejakého zvláštneho dôvodu to urobila táto stránka aj NewOCR . Nie je veľký problém to zmeniť, ale je to zdĺhavý proces, ktorý by ste naozaj nemali robiť.

Tu sú výsledky z FreeOCR: Test1 Doc a Test2 Doc .

ABBYY FineReader Online

Aby ste mohli používať FineReader Online , musíte si zaregistrovať účet, ktorý vám bezplatne poskytne 15-dňovú skúšobnú verziu OCR až na 10 strán. Ak potrebujete urobiť iba jednorazové OCR pre niekoľko stránok, môžete túto službu použiť. Po registrácii sa uistite(Make) , že ste klikli na overovací odkaz v potvrdzujúcom e-maile.

finereader online

Kliknite na Rozpoznať(Recognize) v hornej časti a potom kliknutím na Nahrať(Upload) vyberte svoj súbor. Vyberte si jazyk, výstupný formát a potom kliknite na Rozpoznať(Recognize) v spodnej časti. Táto stránka má čisté rozhranie a tiež žiadne reklamy.

V mojich testoch bola táto stránka schopná zachytiť text z prvého testovacieho dokumentu, ale keď som otvoril dokument Word , bol absolútne obrovský , takže som to urobil znova a ako výstupný formát som zvolil obyčajný text .(Plain Text)

Pri druhom teste so stĺpcami bol wordovský(Word) dokument prázdny a nenašiel som ani text. Nie som si istý, čo sa tam stalo, ale zdá sa, že nezvláda nič iné ako jednoduché odseky. Tu sú výsledky z FineReader: Test1 Doc a Test2 Doc .

Nové OCR

Ďalšia stránka, NewOCR.com , bola v poriadku, ale ani zďaleka nie taká dobrá ako tá prvá. Po prvé, má reklamy, ale našťastie nie veľa. Najprv vyberte svoj súbor a potom kliknite na tlačidlo Náhľad(Preview) .

nahrať obrázok

Potom môžete obrázok otočiť a upraviť oblasť, v ktorej chcete skenovať text. Je to skoro ako proces skenovania funguje na počítači s pripojeným skenerom.

ocr obrázok

Ak má dokument viacero stĺpcov, môžete zaškrtnúť tlačidlo Analýza rozloženia strany( Page layout analysis) a pokúsi sa rozdeliť text do stĺpcov. Kliknite(Click) na tlačidlo OCR , počkajte niekoľko sekúnd na dokončenie a potom prejdite nadol, keď sa stránka obnoví.

V prvom teste dostal celý text správne, ale z nejakého dôvodu písalo každé T v dokumente veľké! Netuším, prečo by to robilo, ale stalo sa. V druhom teste so zapnutou analýzou stránky sa naň dostala väčšina textu, ale rozloženie bolo úplne mimo.

Tu sú výsledky z NewOCR: Test1 Doc  a Test2 Doc .

Záver

Ako môžete vidieť, zadarmo vám väčšinou bohužiaľ nedáva veľmi dobré výsledky. Prvá spomenutá stránka je zďaleka najlepšia, pretože nielenže odviedla skvelú prácu pri rozpoznaní celého textu, ale dokázala zachovať aj formát pôvodného dokumentu.

Ak však potrebujete iba text, väčšina vyššie uvedených webových stránok by to mala byť schopná urobiť za vás. Ak máte nejaké otázky, neváhajte ich komentovať. Užite si to!



About the author

Som počítačový technik s viac ako 10-ročnými skúsenosťami a skúsenosťami s prácou so zariadeniami Android. Posledných päť rokov pracujem aj v kancelárii, kde som sa naučil používať Office 365 a MacOS. Vo voľnom čase rád trávim čas vonku pri hudbe alebo pozeraní filmov.



Related posts