Definiera en OCR-värdekälla
Du kan extrahera text eller streckkoder från ett skannat dokument med hjälp av OCR (Optical Character Recognition) och använda som automatiska egenskapsvärden för filer som importerats från en extern källa, en skanner i det här fallet. OCR-värdekällan är en zon som definieras för en skannad sida. Definiera metadata för en extern filkälla innehåller mer information om att definiera olika egenskaper för objekt som importeras från externa filkällor.
- TIF
- TIFF
- JPG
- JPEG
- BMP
- PNG
Det går bara att använda ett OCR-värde när du använder en extern källa. OCR-värdekällan kan inte definieras i M-Files Desktop.
Gör följande för att definiera en OCR-värdekälla:
För att säkerställa att den definierade zonen är korrekt placerad bör du i de flesta fall placera det dokument som ska skannas på skannerglaset för hand istället för att du använder den automatiska pappersmataren.
I vissa fall kan OCR ge ett felaktigt resultat, till exempel kan siffran 1 tolkas som bokstaven I på grund av teckensnitt eller -storlek. För att vara säker på att alla tecken blir rätt i dokumentets metadata kan du kontrollera egenskapsvärdena med händelsehanterare och VBScript. Du kan sedan använda VBScript för att exempelvis kontrollera att alla tillagda tecken är siffror. Mer information finns i Händelsehanterare.
Strekkodstyper som stöds
M-Files OCR-modulen har stöd för följande streckkodstyper:
- QR-kod
- EAN-13
- EAN-8
- EAN-5
- EAN-2
- MSI Plessley
- MSI Pharma
- UPC-A
- UPC-E
- Codabar
- Interleaved 2 of 5
- Discrete 2 of 5
- Code 39
- Code 39 Extended
- Code 39 HIBC
- Code 93
- Code 128
- PDF 417
- Postnet
- Postnet 32
- Postnet 52
- Postnet 62
- Patchcode
- UCC-128
- UPCE Extended
- IATA 2 of 5
- Datalogic 2 of 5
- Reverse 2 of 5
- Code 39 (out-of-spec)
- Code 128 (out-of-spec)
- Codabar (out-of-spec)