Har du et PDF-dokument eller et billede, som du gerne vil konvertere til tekst? For nylig sendte nogen et dokument i mailen, som jeg havde brug for for at redigere og sende tilbage med korrektioner. Personen kunne ikke finde en digital kopi, så jeg fik til opgave at få al den tekst til digitalt format.

Der var ingen måde, jeg skulle bruge timer på at skrive alt ind igen, så jeg endte med at tage et dejligt billede af dokumentet af høj kvalitet og derefter brændte mig gennem en flok online OCR-tjenester for at se, hvilken der ville give mig det bedste resultater.

I denne artikel skal jeg gennemgå et par af mine yndlingswebsteder til OCR, der er gratis. Det er værd at bemærke, at de fleste af disse websteder leverer en grundlæggende gratis service og derefter har betalte muligheder, hvis du ønsker ekstra funktioner som større billeder, flersidede PDF-dokumenter, forskellige inputsprog osv.

Det er også godt at vide på forhånd, at de fleste af disse tjenester ikke kan matche formateringen af ​​dit originale dokument. Disse er hovedsageligt til udtræk af tekst, og det er det. Hvis du har brug for, at alt skal være i et specifikt layout eller format, skal du manuelt gøre det, når du har fået al teksten fra OCR.

Derudover kommer de bedste resultater for at få teksten fra dokumenter med en 200 til 400 DPI-opløsning. Hvis du har et lavt DPI-billede, vil resultaterne ikke være så gode.

Til sidst var der en masse sider, som jeg testede, som bare ikke fungerede. Hvis du Google gratis online OCR, vil du se en masse websteder, men flere af webstederne i de 10 bedste resultater gennemførte ikke engang konverteringen. Nogle ville time-out, andre ville give fejl, og andre sad lige fast på siden "konvertering", så jeg gider ikke engang at nævne disse websteder.

For hvert websted testede jeg to dokumenter for at se, hvor godt output ville være. Til mine test brugte jeg simpelthen min iPhone 5S til at tage et billede af begge dokumenter og derefter uploade dem direkte til webstederne til konvertering.

I tilfælde af at du vil se, hvordan billederne så ud, som jeg brugte til min test, har jeg vedhæftet dem her: Test1 og Test2. Bemærk, at dette ikke er de fulde opløsningsversioner af de billeder, der er taget fra telefonen. Jeg brugte billedet i fuld opløsning, når jeg uploadede til siderne.

OnlineOCR

OnlineOCR.net er et rent og enkelt websted, der leverede meget gode resultater i min test. Det vigtigste, jeg kan lide ved det, er, at det ikke har masser af annoncer overalt, hvilket normalt er tilfældet med disse slags nichetjenestesider.

gratis online ocr

Vælg din fil for at starte, og vent, indtil den er færdig med at uploade. Den maksimale uploadstørrelse for dette websted er 100 MB. Hvis du tilmelder dig en gratis konto, får du et par ekstra funktioner som den større uploadstørrelse, PDF-sider på flere sider, forskellige inputsprog, flere konverteringer i timen osv.

Vælg derefter dit inputsprog og vælg derefter outputformatet. Du kan vælge mellem Word, Excel eller Plain Text. Klik på knappen Konverter, så vises teksten i bunden i en boks sammen med et downloadlink.

ocr output

Hvis alt hvad du ønsker, er teksten, skal du bare kopiere og indsætte den fra boksen. Imidlertid foreslår jeg, at du downloader Word-dokumentet, fordi det gør et overraskende godt stykke arbejde med at bevare layoutet til det originale dokument.

Da jeg for eksempel åbnede Word-dokumentet til min anden test, blev jeg overrasket over at opdage, at dokumentet indeholdt en tabel med tre kolonner, ligesom på billedet.

online ocr output

Ud af alle siderne var denne langt langt bedst. Det er helt værd at registrere dig, hvis du har brug for en masse konverteringer.

For fuldstændighed vil jeg også linke til de outputfiler, der er oprettet af hver tjeneste, så du kan se resultaterne for dig selv. Her er resultaterne fra OnlineOCR: Test1 Doc og Test2 Doc.

Bemærk, at når du åbner disse Word-dokumenter på din computer, får du en meddelelse i Word om, at det er fra Internettet og redigering er deaktiveret. Det er helt OK, fordi Word ikke har tillid til dokumenter fra Internettet, og du virkelig ikke behøver at aktivere redigering, hvis du bare vil se dokumentet.

i2OCR

Et andet websted, der gav temmelig gode resultater, var i2OCR. Processen ligner meget: vælg dit sprog, fil, og tryk derefter på Uddrag tekst.

i2ocr

Du skal vente et minut eller to her, fordi dette websted tager lidt længere tid. I trin 2 skal du også sørge for, at dit billede vises højre side op i forhåndsvisningen, ellers får du en masse gibberish som output. Af en eller anden grund blev billederne fra min iPhone vist i portrættilstand på min computer, men liggende, da jeg uploadede til dette sted.

i2ocr output

Jeg var nødt til at åbne billedet manuelt i en fotoredigeringsapp, dreje det 90 grader, derefter dreje det tilbage til portræt og derefter gemme det igen. Når det er afsluttet, skal du rulle ned, og det viser dig et eksempel på teksten sammen med en download-knap.

Dette websted klarede sig ret godt med output til den første test, men gjorde det ikke så godt med den anden test, der havde kolonnelayoutet. Her er resultaterne fra i2OCR: Test1 Doc og Test2 Doc.

FreeOCR

Free-OCR.com vil tage dine billeder og konvertere dem til almindelig tekst. Det har ikke en mulighed for at eksportere til Word-format. Vælg din fil, vælg et sprog, og klik derefter på Start.

Webstedet er hurtigt, og du får output relativt hurtigt. Klik bare på linket for at downloade tekstfilen til din computer.

FreeOCR

Som med NewOCR nævnt nedenfor, aktiverer dette websted alle T'erne i dokumentet. Jeg aner ikke, hvorfor det ville gøre det, men af ​​en eller anden underlig grund gjorde dette sted og NewOCR begge dette. Det er ikke en stor ting at ændre det, men det er en kedelig proces, som du virkelig ikke skulle have at gøre.

Her er resultaterne fra FreeOCR: Test1 Doc og Test2 Doc.

ABBYY FineReader Online

For at bruge FineReader Online, skal du registrere dig for en konto, som får dig en 15-dages gratis prøveperiode til OCR op til 10 sider gratis. Hvis du kun behøver at gøre en engangs-OCR for et par sider, kan du bruge denne service. Sørg for, at du klikker på bekræftelseslinket i bekræftelses-e-mailen, når du registrerer dig.

finereader online

Klik på Genkend øverst, og klik derefter på Upload for at vælge din fil. Vælg dit sprog, outputformat, og klik derefter på Genkend nederst. Dette sted har en ren grænseflade og ingen annoncer også.

I mine test var dette sted i stand til at få fat i teksten fra det første testdokument, men det var helt enormt, da jeg åbnede Word-dokumentet, så jeg endte med at gøre det igen og valgte almindelig tekst som outputformat.

I den anden test med kolonnerne var Word-dokumentet tomt, og jeg kunne ikke engang finde teksten. Ikke sikker på, hvad der skete der, men det ser ikke ud til at være i stand til at håndtere andet end enkle afsnit. Her er resultaterne fra FineReader: Test1 Doc og Test2 Doc.

NewOCR

Det næste sted, NewOCR.com, var OK, men ikke så godt som det første. For det første har det annoncer, men heldigvis ikke et ton. Du vælger først din fil og klikker derefter på knappen Eksempel.

upload billede

Du kan derefter rotere billedet og justere det område, hvor du vil scanne efter tekst. Det er temmelig meget som hvordan scanningsprocessen fungerer på en computer med en vedhæftet scanner.

ocr billede

Hvis dokumentet har flere kolonner, kan du kontrollere knappen Analyse af sidelayout, og det vil forsøge at opdele teksten i kolonner. Klik på OCR-knappen, vent et par sekunder på, at den er færdig, og rul derefter ned til bunden, når siden opdateres.

I den første test fik den al teksten korrekt, men af ​​en eller anden grund aktiveres hvert T i dokumentet! Ingen idé om, hvorfor det ville gøre det, men det gjorde det. I den anden test med aktiveret sideanalyse fik den det meste af teksten, men layoutet var helt slukket.

Her er resultaterne fra NewOCR: Test1 Doc og Test2 Doc.

Konklusion

Som du kan se, giver gratis dig ikke rigtig gode resultater det meste af tiden desværre. Det første nævnte websted er langt bedst, fordi det ikke kun gjorde et godt stykke arbejde med at genkende al teksten, men det formåede også at bevare formatet på originaldokumentet.

Hvis du dog bare har brug for tekst, burde de fleste af ovennævnte websteder være i stand til at gøre det for dig. Hvis du har spørgsmål, er du velkommen til at kommentere. God fornøjelse!