3 najlepšie online nástroje OCR na extrahovanie textu z obrázkov

Prepis textu z obrázkov môže byť skutočným utrpením. Keď je text prezentovaný ako obrázok alebo nejaký iný nevýberový formát, škola a práca sú náročné. Jediným riešením je dať do práce tie oči a prsty a začať to písať – alebo áno?

Optimálne rozpoznávanie(Character Recognition) znakov alebo OCR je proces prevodu strojom alebo rukou písaného textu z médií, ako sú naskenované dokumenty alebo fotografie, na obyčajný text.

Aj keď sa v ňom môžu vyskytovať chyby, v závislosti od zrozumiteľnosti textu vám používanie OCR na extrahovanie textu z obrázkov môže ušetriť hodiny monotónnej práce. Jedným z prípadov použitia OCR by bolo, ak ste vysokoškolský študent, ktorý potrebuje konkrétnu stranu z učebnice. Ak by vám priateľ poslal fotografiu stránky, môžete použiť OCR na extrahovanie celého textu z obrázka, aby ste ho mohli ľahko prečítať a skopírovať.

V tomto článku preskúmame tri z najlepších nástrojov OCR online na extrahovanie textu z obrázkov, z ktorých žiadny nevyžaduje stiahnutie softvéru(OCR software) alebo doplnkov OCR.

OnlineOCR

OnlineOCR je jedným z najjednoduchších a najrýchlejších spôsobov, ako previesť obrázok alebo súbor PDF do viacerých rôznych textových formátov.

Bez účtu vám OnlineOCR.net umožní previesť až 15 súborov na text za hodinu. Registráciou účtu získate prístup k funkciám, ako je konverzia viacstranových dokumentov PDF a ďalšie.

OnlineOCR.net podporuje konverziu z formátov PDF , JPG , BMP , TIFF a GIF s ich výstupom ako DOCX , XLSX alebo TXT .

OnlineOCR.net dokáže rozpoznať text v angličtine(English) , afrikánčine(Afrikaans) , albánčine(Albanian) , baskičtine(Basque) , brazílčine(Brazilian) , bulharčine(Bulgarian) , katalánčine(Catalan) , čínštine(Chinese) , chorvátčine(Croatian) , češtine(Czech) , dánčine(Danish) , holandčine(Dutch) , esperante(Esperanto) , estónčine(Estonian) , fínčine(Finnish) , francúzštine(French) , galícijčine(Galician) , nemčine(German) , gréčtine(Greek) , maďarčine(Hungarian) , islandčine(Icelandic) , indonézštine(Indonesian) , taliansky(Italian), japončina(Japanese) , kórejčina(Korean) , latinčina(Latin) , lotyština(Latvian) , litovčina(Lithuanian) , macedónčina(Macedonian) , malajčina(Malay) , moldavčina(Moldavian) , nórčina(Norwegian) , poľština(Polish) , portugalčina(Portuguese) , rumunčina(Romanian) , ruština(Russian) , srbčina(Serbian) , slovenčina(Slovak) , slovinčina(Slovenian) , španielčina(Spanish) , švédčina(Swedish) , tagalčina(Tagalog) , turečtina(Turkish) a ukrajinčina.

Proces konverzie vyžaduje tri jednoduché kroky. Odovzdáte súbor obmedzený na 15 MB, vyberiete jazyk a výstupný formát a kliknete na tlačidlo Konvertovať(Convert) .

Bez ohľadu na vybratý výstupný formát sa v poli pod odkazom na stiahnutie súboru vo vami zvolenom formáte zobrazí obyčajný textový náhľad prevodu. To pomáha používateľom zabrániť plytvaniu sťahovaním na extrakciu, ktorá môže byť nepresná.

Nové OCR(NewOCR)(NewOCR)

NewOCR v súčasnosti ponúka iba extrakciu textu z obrázkových súborov, ale podporuje niekoľko ďalších zaujímavých funkcií, ktoré mnohí online poskytovatelia OCR nemajú.

Ak chcete začať používať NewOCR , jednoducho kliknite na tlačidlo Vybrať súbor(Choose File) , vyberte obrázok, z ktorého chcete extrahovať text, a potom kliknite na modré tlačidlo Náhľad(Preview) . Potom sa zobrazí náhľad obrázka a niekoľko ďalších možností.

Na rozdiel od väčšiny iných online prevodníkov obrázkov na text vám NewOCR v skutočnosti umožní nastaviť viacero jazykov rozpoznávania. To môže byť celkom užitočné, ak si nie ste istí, v akom jazyku je text na obrázku napísaný, ale máte dobrý odhad a chcete získať správny preklad z jeho obyčajného textu.

Ak je váš obrázok naklonený na jednu stranu, môžete ho tiež dynamicky otáčať. Po použití potrebných možností môžete kliknutím na modré tlačidlo OCR extrahovať text obrázka.

Odtiaľto si môžete stiahnuť extrahovaný text vo formáte TXT , DOC alebo PDF alebo ho poslať priamo do Google Translate alebo Google Docs na ďalšie úpravy.

OCR.priestor(OCR.space)(OCR.space)

V neposlednom rade je OCR.space určite jednou z najrobustnejších možností, aké sme našli, a mala by vám pomôcť pri akejkoľvek operácii prevodu obrázkov na text.

OCR.space je jedným z najlepších nástrojov OCR, ktorý podporuje formát súboru WEBP . Okrem toho sú podporované aj PNG , JPG a PDF . Okrem toho nemusíte nahrávať súbor – môžete naň vzdialene odkazovať, ak je dostupný niekde online.

Medzi ďalšie špecializované funkcie patrí automatické otáčanie(auto-rotation) , skenovanie účteniek(receipt scanning) , rozpoznávanie tabuľky(table recognition) a automatické škálovanie(auto-scaling) . OCR .space je jedným z mála online nástrojov OCR , ktorý podporuje výstup súborov ako prehľadávateľné súbory PDF(searchable PDFs) (s viditeľným alebo neviditeľným textom) a dokonca si môžete vybrať medzi jedným z dvoch rôznych nástrojov OCR(OCR engines) pre najlepšiu možnú extrakciu.

Všetko, čo musíte urobiť, je nahrať alebo prepojiť súbor, kliknite na tlačidlo Start OCR!a potom sa na tej istej stránke dynamicky načíta ukážka vašich výsledkov. Ak ste vybrali svoj výstup ako prehľadávateľný súbor PDF(PDF) , k dispozícii budú aj tlačidlá Stiahnuť(Download) a Zobraziť prekrytie .(Show Overlay)

Jednou z najzaujímavejších a najunikátnejších funkcií OCR.space je to, že môže extrahovať výstup ako JSON . Tento JSON bude mať polia, ktoré obsahujú každé slovo v texte a ich súradnice na samotnom obrázku. Toto je veľmi oceňovaná funkcia, ak ste programátor, ktorý sa snaží programovo extrahovať text z obrázkov(extract text from images) .

S tromi webovými nástrojmi vyššie by extrahovanie textu z takmer akéhokoľvek jasného a čitateľného obrázka malo byť hračkou. Aj keď ste rýchly typ s viacerými monitormi, nemusíte trpieť prepisovaním textových obrázkov sami. OCR bol vytvorený z nejakého dôvodu a tieto webové stránky vám pomôžu čo najlepšie ho využiť!

Ak máte nejaké ďalšie tipy na najlepšie nástroje alebo služby OCR, o ktoré by ste sa chceli podeliť, alebo by ste chceli pomôcť s používaním jednej z vyššie uvedených, neváhajte nám napísať do komentárov nižšie.



About the author

Som počítačový profesionál s viac ako 10 ročnou praxou. Vo voľnom čase rada pomáham v kancelárii a učím deti používať internet. Moje schopnosti zahŕňajú veľa vecí, ale najdôležitejšie je, že viem pomáhať ľuďom riešiť problémy. Ak potrebujete niekoho, kto vám môže pomôcť s niečím súrne, alebo chcete len nejaké základné tipy, obráťte sa na mňa!



Related posts