Scan an OCR

Gudden Nomëtteg

Wahrscheinlech jidderee vun eis hu sech mat der Aufgab konfrontéiert, wann Dir e Pabeierdokument in elektronescher Form iwwerzeegt muss. Dëst ass besonnesch wichteg fir déi Studien, Aarbecht mat Dokumentatioun, Iwwersetzer Texter mat elektroneschen Dictionnairen, etc.

An dësem Artikel well ech gär e ​​puer vun de Basics vun dësem Prozess hunn. Allgemeng ass d'Scannerkennung an d'Texterkennung zimlech ze laang an der Konsumenzäit, well déi meescht Operatioune musse manuell gemaach ginn. Mir probéieren ze verstoen wat, wéi a firwat.

Net jiddereen versteet direkt eng Saach. Nodeems Dir gescannt hutt (all Blieder op de Scanner passen) kritt Dir Fotoe vum Format BMP, JPG, PNG, GIF (et ginn aner Formater). Also aus dësem Bild musst Dir den Text kréien - dës Prozedur gëtt Erkennung genannt. An dëser Bestellung, a gëtt et hei ënnendrënner.

De Contenu

  • 1. Wat fir Scannen an Unerkennung brauchs?
  • 2. Text Scanneroptiounen
  • 3. Erkennung vum Text vum Dokument
    • 3.1 Text
    • 3.2 Biller
    • 3.3 Tabellebar
    • 3.4 Onnéideg Elementer
  • 4. D'Erkennung vun PDF / DJVU-Dateien
  • 5. Feeler beim Préift vun de Resultater vun der Aarbechtskontrolle

1. Wat fir Scannen an Unerkennung brauchs?

1) Scanner

Fir gedréckten Dokumenter an Textform ze iwwersetzen, brauch Dir e Scanner a wéi eng "native" Programmer an Treiber, déi mat hinnen goungen. Mat hinnen kanns de Dokumenter duerchféieren a späichert sech fir weider Veraarbechtung.

Dir kënnt aner Analogie benotzen, awer d'Software, déi mam Scanner am Kit ass mat der Aarbecht funktionéiert normalerweis méi séier a méi Méiglechkeeten.

Ofhängeg wéi eng Art Scanner Dir hutt - d'Geschwindegkeet vun der Aarbecht kann enorm variéieren. Et gi Scanner déi an 10 Sekonnen e Bild aus engem Blatt kréien, et sinn déi, déi et an 30 Sekonnen kréien. Wann Dir ee Buch iwwer 200-300 Blieder scannen - ech mengen et ass net schwéier ze berechnen wéi vill Mol méi Zäit eens ass?

2) Programm fir Unerkennung

An eisem Artikel wäert ech Iech d'Aarbecht an engem vun den beschte Programmer fir Scannéieren an erkennen absolut keng Dokumenter - ABBYY FineReader. Zënterhier De Programm gëtt bezuelt, duerno wäert ech e Link op en anere kréien - säin freie Analog vu Cunei Form. True, ech géif se net vergläichen, well d'FineReader gewënnt an allen Hisiichten, ech recommandéieren et all d'selwecht ze probéieren.

ABBYY FineReader 11

Offiziell Säit: //www.abbyy.ru/

Ee vun de beschte Programmer vu senger Aart. Et ass entworf fir den Text an der Foto ze erkennen. Baut vill verschidden Optiounen a Funktiounen. Et kann e puer Schrécke parzellen, souguer mat handschriftlech Versiounen ënnerstëtzt (obwuel ech et net perséinlech probéiert huet, ech mengen et ass gutt, déi handgeschriwwe Versioun kaum ze erkennen, ausser Dir hutt e perfekte kalligrafesche Handschrëft). Méi Informatiounen iwwer d'Aarbechtsliewen si wäerte diskutéiert ginn. Mir schwätzen also hei datt den Artikel d'Aarbecht an 11 Programmversiounen iwwerdeckt.

In der Regel, verschidde Versiounen vum ABBYY FineReader sinn net ganz ënnerschiddlech vuneneen. Dir kënnt et einfach maachen am selwechte. Déi Haaptunterschiede sinn an der Éier, der Geschwindegkeet vum Programm an seng Méiglechkeeten. Zum Beispill fréiere Versioune refuséieren e PDF-Dokument a DJVU ze maachen ...

3) Dokumenter fir ze scannen

Jo, also war ech decidéiert d'Dokumenter an enger separater Spalt ze huelen. In de meeschte Fäll scannen all Bücher, Zeitungen, Artikelen, Zäitschrëften, etc. Hei déi Bicher an d'Literatur, déi gefuerdert ass. Wat sinn ech fir mat? Vun der perséinlecher Erfahrung kann ech soen datt Dir vill ze scannen - kënne scho um Netz sinn! Wéi oft hunn ech perséinlech Zäit gespuert wéi ech ee Buch fonnt hunn oder en aneren gespaart gouf am Netz. Ech muss just de Text an d'Dokument kopéieren an weiderfuere loossen.

Vun där einfache Berodung - ier Dir iergendeppes scannt, kontrolléiert ob jemols schonn en gescannt hutt an Dir musst Är Zäit net vergeuden.

2. Text Scanneroptiounen

Hei wäert ech net iwwer Är Chauffer huelen fir den Scanner, déi Programmer déi mat dobäi sinn, well all Scanner Modelle verschidden sinn, Software ass och iwwerall anescht wéi a Guessing an nach méi kloer ze weisen wéi d'Operatioun vun der Operatioun unrealistesch ass.

Awer all Scanner hunn déi selwecht Astellungen, déi d'Geschwindegkeet an d'Qualitéit vun Ärer Aarbecht staark beaflossen. Hei iwwer hinne wäert ech nëmme hei schwätzen. Ech lauschteren op Uerder.

1) Scanqualitéit - DPI

Als éischt hunn d'Scanqualitéit an de Optiounen net méi wéi 300 dpi festgeluegt. Et ass recommisséiert datt ee méi e bësse méi mécht, wann et méiglech ass. Wat méi héich den DPI Indikateur ass, wat méi kloer ass datt Äert Bild erauskënnt, a sou weider gëtt méi séier ofgeschloss. Zousätzlech ass de méi héich d'Qualitéit vum Scan - déi manner Feeler, déi Dir spéider korrigéiert hutt.

Déi beschten Optioun léisst normalerweis 300-400 dpi.

2) Chromatitéit

Dëse Parameter beaflosst de Scannen Zäit (wee wee fir d'DPI och beaflosst, awer se si sou staark, a nëmmen wann de Benotzer héich Wäerter setzt).

Normalerweis sinn et dräi Modi:

- schwaarz a wäiss (perfekt fir einfache Text);

giel (passend fir Text mat Dëscher an Biller);

- Faarf (fir Faarfzeitungen, Bicher, am allgemengen, Dokumenter, wou d'Faarwen wichteg ass).

Normalerweis hänkt d'Scan Zäit vun der Auswiel vu Faarf ab. Wann Dir e grousst Dokument hutt, och déi extra 5-10 Sekonnen op der Säit als Ganzt féieren eng decent Zäit ...

3) Fotoen

Dir kënnt d'Dokument net nëmmen duerch Scannen, awer och duerch eng Foto vun der Gitt. Wéi gesitt Dir an dësem Fall Dir e puer aner Problemer: Bildverzerrung, Vergraben. Wéinst deem kann et méi laang weider Editéierung an d'Veraarbechtung vum empfangenen Text erfëllen. Perséinlech, ech recommandéiere net fir Kameras fir dësen Geschäft ze benotzen.

Et ass wichteg ze wëssen datt net all esou Dokumenter erkannt ginn ass, well Skandalitéit kann hien extrem schwéieren ...

3. Erkennung vum Text vum Dokument

Mir huelen un datt déi geschätzte Säiten gescannt sinn. Meeschtens sinn se Formate: tif, bmb, jpg, png. Am Allgemengen, fir ABBYY FineReader - dat ass net ganz wichteg ...

Nodeems Dir d'Foto am ABBYY FineReader opgemaach huet, fänkt de Programm als Regel op der Maschinn ze wielen fir Flächen auszeschléissen an ze erkennen. Mee heiansdo mécht se et falsch. Dofir fannt Dir d'Auswiel vun den gewënschten Gebidder manuell.

Et ass wichteg! Net jiddfereen versteet direkt datt no engem Dokument am Programm de Quelldokument an der Fënster op der lénkser Säit ugewisen gëtt, an där Dir verschidde Beruffer markéiert. Nodeems Dir op de Knäppchen "Unerkennung" klickt, gëtt de Programm an der Fënster op der rietser Säit den Text gemaach. No der Unerkennung, iergendwann ass et recommandéiert fir den Text fir Fehler am selwechte FineReader ze kontrolléieren.

3.1 Text

Dëse Beräich gëtt benotzt fir den Text anzebehalen. Biller an Dëscher sollen ausgeschloss ginn. Sel berechtegt an ongewéinlech Schold mussen manuell erfëllt ginn ...

Fir e Textberäich auszeschléissen, kuckt op d'Panel an der Spëtzt vum FineReader. Et ass e Knäppchen "T" (kuckt de Bild screenshot, de Mauszeiger just op dësem Knäppchen). Klickt op et, da klickt op d'Foto ënnendrënner de nullt Rechteckleche Beräich, an deem den Text läit. By the way, a ville Fäll musst Dir Textplaze vu 2-3 erreechen an och 10-12 pro Säit, well Textformatéierung ka ënnerschiddlech sinn an de ganze Raum net mat engem Rechtepter wielen.

Et ass wichteg ze bemierken datt Biller net am Textberäich sinn! An Zukunft wäert et vill Zäit spueren ...

3.2 Biller

Benotzt fir Fotoen an déi Gebidder ze liesen déi schwiereg ze erkennen wéinst enger schlechter Qualitéit oder ongewéinlecher Schrëft.

Am Screenshot ass de Mauszeechen op de Knäppchen, deen benotzt gëtt fir "Bild" Fläsch ze wielen. By the way, kann absolut all Deel vun der Säit an dësem Beräich ausgewielt ginn, a FineReader hellt se dann als normal Bild zréck. Ie just "dumm" wäert kopéieren ...

Normalerwann gëtt dëse Beräich benotzt fir schlecht gescannte Tabellen opzehuelen, fir net Standard Text a Schrëft z'ënnerstëtzen, d'Biller selwer.

3.3 Tabellebar

De Screenshot ënnendrënner weist de Knäppchen fir d'Dësch ze markéieren. Allgemeng, ech perséinlech benotzt et ganz selten. D'Tatsaach ass datt Dir ganz rout uginn (tatsächlech) all Linn op den Dësch ze weisen an ze weisen wat a wéi de Programm. Wann d'Tafel kleng ass a net ganz gutt Qualitéit, ech recommandéieren dës Zone "Bild" fir dës Zwecker ze benotzen. Hei spuert vill Zäit, a da kanns de eng Tableau ganz schnell op der Basis vun engem Bild maachen.

3.4 Onnéideg Elementer

Et ass wichteg ze beuechten. Heiansdo gëtt onnéideg Elementer onnéideg Elementer, déi et schwiereg ass, den Text ze erkennen oder ze léisen datt Dir déi gewënschte Fläche guer net auswielen. Si kënnen iwwer de "Radiergumm" iwwerhuelen.

Fir dëst ze maachen, gitt den Bildbearbeitungsmodus.

Wielt de Radiergummeknacker an wielt déi ongewollt Ëmgéigend. Et gëtt geläscht a op senger Plaz ass e wäiss Blat aus Pabeier.

Iwwregens, ech recommandéieren dës Optioun esou oft wéi méiglech ze benotzen. Probéiert all déi Textgebidder, déi Dir ausgewielt hutt, wou Dir kee Text ass braucht, oder et gëtt keng onnéideg Punkten, Wëllheet, Verzerrungen - geläscht mat engem Radiergummel. Duerch dës Unerkennung wäert méi séier sinn!

4. D'Erkennung vun PDF / DJVU-Dateien

Am allgemengen ass dëst Erkennungsformat net ënnerschiddlech vun deenen aneren -. Dir kënnt mat esou wéi Fotoen arbeiten. Eppes ass dat Programm net ze al Versioun, wann Dir PDF / DJVU-Dateien net opmaache - d'Versioun op 11 aktualiséieren.

E klengen Avis. Nodeems Dir de Dokument op FineReader opgemaach huet - da fänkt d'Dokument automatesch unerkennen. Oft an PDF / DJVU-Dateien ass e spezifesche Beräich vun der Säit net am ganzen Dokument néideg! Fir esou e Quartier op all Säit ze läschen, passen déi folgend Saachen:

1. Gitt an d'Bildbearbeitungssäit.

2. D'Schrëft "Trimmen" aktivéieren.

3. Wielt déi Gebuert wou Dir op all Säiten brauch.

4. Klickt op d'Säiten un.

5. Feeler beim Préift vun de Resultater vun der Aarbechtskontrolle

Et schéngt et méiglecherweis nach Probleemer ze sinn, wann all d'Gebidder ausgewielt goufen, duerno erkannt - et ass et a späichert ... Et war net do!

Als éischt musse mir de Dokument kontrolléieren!

Fir et z'erméiglechen, no der Unerkennung, an der Fënster op der rietser Säit, gëtt et eng "Check" -Taste, kuckt de Bild screenshot. Wann Dir op klickt gëtt, weist d'FineReader Programm automatesch op déi Gebidder wou de Programm e Fehler huet an et kann net een zu engem bestëmmte Symbol bestëmmen. Dir musst nëmmen wielen, oder Dir sidd mat der Meenung vum Programm oder Ärem Charakter.

By the way, an der Halschent vun den Fällen, ongeféier, de Programm bitt Iech e reche richteg Gesetz. Dir musst just d'Maus benotze fir d'Optioun ze wielen déi Dir wëllt.

Zweetens, no der Iwwerpréiwung musst Dir de Format benotzen, wou Dir de Resultat vun Ärer Aarbecht späichert.

Hei FineReader gitt Iech eng voll Wendung: Dir kënnt einfach d'Informatioun am Word one-on-one transferéieren, an Dir kënnt et an engem vun Dutzende vu Formate retten. Mee ech géif gären en anere wichtegen Aspekt opmaachen. A wéi engem Format, deen Dir gewielt hutt, ass et méi wichteg fir de Code ze kopéieren! Opgepasst déi interessant Optiounen ...

Exakt Kopie

All Beräicher datt Dir op der Säit an dem erkannten Dokument ausgewielt hutt genau mat dem Source Dokument. Eng ganz praktesch Optioun, wann et wichteg ass fir Iech net fir Textformatéieren ze verléieren. Iwwregens gëtt d'Schrëften och ganz ähnlech wéi déi ursprénglech. Ech recommandéieren dës Optioun fir de Dokument op Word ze transferéieren, fir weider weider ze schaffen.

Editéiert Kopie

Dës Optioun ass gutt, well Dir eng schon formatéiert Versioun vum Text kritt. Ie Gitt d'"Kilometer", déi vläicht am ursprénglechen Dokument gewiescht sinn - Dir wäert net treffen. Nëtzlech Optioun, wann Dir déi Informatioun z'identifizéieren.

Wichteg, sollt Dir net wielen, ob et wichteg ass fir Iech den Stil vum Design, de Fonts, d'Inain ze bewahren. Heiansdo, wann d'Unerkennung net ganz erfollegräich ass - Äre Dokument kann "skeweisen" wéinst der geännert Formatéierung. An dësem Fall ass et wichteg fir eng genee Exemplar ze wielen.

Plain Text

Eng Optioun fir déi déi just den Text aus der Säit brauchen, ouni alles anescht. Geif fir Dokumente ouni Biller a Dëscher.

Dëst schließt den Dokument Scannerkennzuch an Artikel an der Unerkennung. Ech hoffen, datt mat der Hëllef vun dësen einfachen Spann kann Dir Är Problemer léisen ...

Vill Gléck!