5 bezplatných online služieb OCR testovaných a skontrolovaných
Máte dokument PDF alebo obrázok, ktorý by ste chceli previesť na text? Nedávno mi niekto poslal poštou dokument, ktorý som potreboval upraviť a poslať späť s opravami. Táto osoba nemohla nájsť digitálnu kópiu, takže som dostal za úlohu dostať celý ten text do digitálneho formátu.
Neexistoval spôsob, ako by som trávil hodiny písaním všetkého späť, takže som nakoniec urobil peknú fotografiu dokumentu vo vysokej kvalite a potom som sa predieral množstvom online služieb OCR , aby som zistil, ktorá z nich bude najlepšia. výsledky.
V tomto článku prejdem niekoľko mojich obľúbených stránok pre OCR , ktoré sú zadarmo. Stojí za zmienku, že väčšina z týchto stránok poskytuje základnú bezplatnú službu a potom má platené možnosti, ak chcete ďalšie funkcie, ako sú väčšie obrázky, viacstranové dokumenty PDF , rôzne vstupné jazyky atď.
Vopred je tiež dobré vedieť, že väčšina týchto služieb sa nebude môcť zhodovať s formátovaním vášho pôvodného dokumentu. Tie slúžia hlavne na extrakciu textu a to je všetko. Ak potrebujete, aby bolo všetko v konkrétnom rozložení alebo formáte, budete to musieť urobiť ručne, keď získate celý text z OCR .
Okrem toho najlepšie výsledky získania textu budú pochádzať z dokumentov s rozlíšením 200 až 400 DPI . Ak máte obraz s nízkym DPI , výsledky nebudú také dobré.
Nakoniec som testoval veľa stránok, ktoré jednoducho nefungovali. Ak zadáte do Googlu bezplatné online rozpoznávanie OCR(OCR) , uvidíte veľa stránok, ale niektoré z 10 najlepších výsledkov konverziu ani nedokončili. Niektorým vypršal časový limit, iným sa vyskytli chyby a niektoré sa zasekli na stránke „konverzie“, takže som sa ani neobťažoval spomenúť tieto stránky.
Pre každú lokalitu som otestoval dva dokumenty, aby som zistil, aký kvalitný bude výstup. Na moje testy som jednoducho použil svoj iPhone 5S na odfotenie oboch dokumentov a potom som ich nahral priamo na webové stránky na konverziu.
V prípade, že chcete vidieť, ako vyzerali obrázky, ktoré som použil pri mojom teste, prikladám ich tu: Test1 a Test2 . Upozorňujeme, že toto nie sú verzie obrázkov nasnímaných z telefónu v plnom rozlíšení. Pri nahrávaní na stránky som použil obrázok v plnom rozlíšení.
OnlineOCR
OnlineOCR.net je čistá a jednoduchá stránka, ktorá v mojom teste priniesla veľmi dobré výsledky. Hlavná vec, ktorá sa mi na ňom páči, je, že nemá všade veľa reklám, čo je zvyčajne prípad takýchto stránok so špecializovanými službami.
Ak chcete začať, vyberte súbor a počkajte, kým sa dokončí nahrávanie. Maximálna veľkosť nahrávania pre túto stránku je 100 MB. Ak sa zaregistrujete na bezplatný účet, získate niekoľko ďalších funkcií, ako je väčšia veľkosť nahrávania, viacstranové súbory PDF(PDFs) , rôzne vstupné jazyky, viac konverzií za hodinu atď.
Ďalej vyberte jazyk vstupu a potom vyberte výstupný formát. Môžete si vybrať z Wordu(Word) , Excelu(Excel) alebo Obyčajného textu(Plain Text) . Kliknite(Click) na tlačidlo Konvertovať(Convert) a text sa zobrazí v spodnej časti poľa spolu s odkazom na stiahnutie.
Ak chcete iba text, jednoducho ho skopírujte a prilepte z poľa. Navrhujem však, aby ste si stiahli dokument programu Word(Word) , pretože robí prekvapivo skvelú prácu pri zachovaní rozloženia pôvodného dokumentu.
Napríklad, keď som otvoril dokument programu Word(Word) na môj druhý test, bol som prekvapený, keď som zistil, že dokument obsahuje tabuľku s tromi stĺpcami, rovnako ako na obrázku.
Zo všetkých stránok bola táto zďaleka najlepšia. Úplne stojí za registráciu, ak potrebujete urobiť veľa konverzií.
Pre úplnosť uvediem aj odkaz na výstupné súbory vytvorené každou službou, aby ste si výsledky mohli pozrieť sami. Tu sú výsledky z OnlineOCR : Test1 Doc a Test2 Doc .
Všimnite si, že keď otvoríte tieto dokumenty programu Word(Word) na počítači, vo Worde(Word) sa zobrazí správa , že pochádza z internetu(Internet) a úpravy boli zakázané. To je úplne v poriadku, pretože Word neverí dokumentom z internetu(Internet) a naozaj nemusíte povoliť úpravy, ak chcete dokument iba zobraziť.
i2OCR
Ďalšou stránkou, ktorá priniesla celkom dobré výsledky, bola i2OCR . Postup je veľmi podobný: vyberte si jazyk, súbor a potom stlačte Extrahovať text(Extract Text) .
Tu budete musieť počkať minútu alebo dve, pretože táto stránka trvá trochu dlhšie. V kroku 2(Step 2) sa tiež uistite, že sa váš obrázok v ukážke zobrazuje pravou stranou nahor, inak sa na výstupe objaví veľa nezmyslov. Z nejakého dôvodu sa obrázky z môjho iPhone na mojom počítači zobrazovali v režime na výšku, ale na šírku, keď som ich odovzdal na túto stránku.
Musel som manuálne otvoriť obrázok v aplikácii na úpravu fotografií, otočiť ho o 90 stupňov, potom ho otočiť späť na výšku a potom ho znova uložiť. Po(Once) dokončení prejdite nadol a zobrazí sa vám ukážka textu spolu s tlačidlom na stiahnutie.
Táto stránka si počínala celkom dobre s výstupom z prvého testu, ale v druhom teste, ktorý mal rozloženie stĺpcov, sa mu až tak nedarilo. Tu sú výsledky z i2OCR: Test1 Doc a Test2 Doc .
FreeOCR
Free-OCR.com vezme vaše obrázky a prevedie ich na obyčajný text. Nemá možnosť exportu do formátu Word . Vyberte svoj súbor, vyberte jazyk a potom kliknite na tlačidlo Štart(Start) .
Stránka je rýchla a výstup získate pomerne rýchlo. Stačí(Just) kliknúť na odkaz a stiahnuť si textový súbor do svojho počítača.
Rovnako ako v prípade NewOCR , ktoré je uvedené nižšie, aj táto stránka používa veľké písmená T v dokumente. Nemám potuchy, prečo by to robilo, ale z nejakého zvláštneho dôvodu to urobila táto stránka aj NewOCR . Nie je veľký problém to zmeniť, ale je to zdĺhavý proces, ktorý by ste naozaj nemali robiť.
Tu sú výsledky z FreeOCR: Test1 Doc a Test2 Doc .
ABBYY FineReader Online
Aby ste mohli používať FineReader Online , musíte si zaregistrovať účet, ktorý vám bezplatne poskytne 15-dňovú skúšobnú verziu OCR až na 10 strán. Ak potrebujete urobiť iba jednorazové OCR pre niekoľko stránok, môžete túto službu použiť. Po registrácii sa uistite(Make) , že ste klikli na overovací odkaz v potvrdzujúcom e-maile.
Kliknite na Rozpoznať(Recognize) v hornej časti a potom kliknutím na Nahrať(Upload) vyberte svoj súbor. Vyberte si jazyk, výstupný formát a potom kliknite na Rozpoznať(Recognize) v spodnej časti. Táto stránka má čisté rozhranie a tiež žiadne reklamy.
V mojich testoch bola táto stránka schopná zachytiť text z prvého testovacieho dokumentu, ale keď som otvoril dokument Word , bol absolútne obrovský , takže som to urobil znova a ako výstupný formát som zvolil obyčajný text .(Plain Text)
Pri druhom teste so stĺpcami bol wordovský(Word) dokument prázdny a nenašiel som ani text. Nie som si istý, čo sa tam stalo, ale zdá sa, že nezvláda nič iné ako jednoduché odseky. Tu sú výsledky z FineReader: Test1 Doc a Test2 Doc .
Nové OCR
Ďalšia stránka, NewOCR.com , bola v poriadku, ale ani zďaleka nie taká dobrá ako tá prvá. Po prvé, má reklamy, ale našťastie nie veľa. Najprv vyberte svoj súbor a potom kliknite na tlačidlo Náhľad(Preview) .
Potom môžete obrázok otočiť a upraviť oblasť, v ktorej chcete skenovať text. Je to skoro ako proces skenovania funguje na počítači s pripojeným skenerom.
Ak má dokument viacero stĺpcov, môžete zaškrtnúť tlačidlo Analýza rozloženia strany( Page layout analysis) a pokúsi sa rozdeliť text do stĺpcov. Kliknite(Click) na tlačidlo OCR , počkajte niekoľko sekúnd na dokončenie a potom prejdite nadol, keď sa stránka obnoví.
V prvom teste dostal celý text správne, ale z nejakého dôvodu písalo každé T v dokumente veľké! Netuším, prečo by to robilo, ale stalo sa. V druhom teste so zapnutou analýzou stránky sa naň dostala väčšina textu, ale rozloženie bolo úplne mimo.
Tu sú výsledky z NewOCR: Test1 Doc a Test2 Doc .
Záver
Ako môžete vidieť, zadarmo vám väčšinou bohužiaľ nedáva veľmi dobré výsledky. Prvá spomenutá stránka je zďaleka najlepšia, pretože nielenže odviedla skvelú prácu pri rozpoznaní celého textu, ale dokázala zachovať aj formát pôvodného dokumentu.
Ak však potrebujete iba text, väčšina vyššie uvedených webových stránok by to mala byť schopná urobiť za vás. Ak máte nejaké otázky, neváhajte ich komentovať. Užite si to!
Related posts
5 najlepších stránok na nájdenie online lektora pre dospelých a deti
Ako počúvať rozhlasové stanice online zadarmo
10 najlepších stránok na bezplatné pozeranie karikatúr online
6 stránok na hranie retro hier online zadarmo
Začnite online denník s týmito 6 najlepšími webovými stránkami a aplikáciami
Ako nájsť lacné letenky online a poraziť letecké spoločnosti
7 najlepších služieb živého televízneho vysielania, ktoré navždy zahodí kábel
5 najlepších stránok na hranie scrabble online s priateľmi
6 najlepších webových stránok na hranie šachu online s priateľmi zadarmo
Ako nájsť najlepšie ponuky online a ušetriť peniaze pri nakupovaní
4 najlepšie webové stránky na sledovanie anime online zadarmo
Prevod medzi mnohými rôznymi typmi súborov online
3 najlepšie služby virtuálnych debetných kariet
7 najlepších akreditovaných online kurzov, v ktorých sa dozviete viac o počítačoch
5 renomovaných služieb čísel kreditných kariet na jedno použitie
12 najlepších online hier v únikovej miestnosti
8 najlepších stránok na čítanie manga online zadarmo
7 najlepších bezplatných online solitaire stránok na hranie, keď sa nudíte
7 najlepších webových stránok na začatie online petície
7 najlepších online zdrojov pre bezplatné filtre Photoshopu