Numérisation et reconnaissance de texte (OCR)

Des documents papier peuvent être ajoutés à M-Files à l'aide d’un scanner de réseau ou d'un scanner local. Pour davantage d'informations sur le scanner de réseau, veuillez vous reporter à la section Sources de scanner. Lorsque vous utilisez le scanner local, il doit être directement connecté à l'ordinateur qui est utilisé pour ajouter le fichier numérisé à M-Files. Il est possible d’accéder aux commandes de numérisation en appuyant sur la touche Alt, puis en ouvrant le menu Opérations.

Remarque : L'intégration du scanner dans M-Files Desktop exploite les technologies TWAIN et WIA. Seuls les scanners pouvant être équipés d'un pilote TWAIN ou WIA sont pris en charge.

Si le module OCR (reconnaissance optique de caractères) de M-Files est activé, M-Files propose de convertir le fichier numérisé en PDF avec fonction de recherche (indexé) par reconnaissance de caractères une fois la numérisation terminée. Vous pouvez activer la reconnaissance de caractères ou l'ignorer. Vous pouvez aussi définir des paramètres avancés pour la reconnaissance de caractères.

Remarque : Le module OCR M-Files est un module complémentaire à M-Files disponible moyennant un supplément de prix. Il peut être activé avec un code de licence. Pour davantage d’informations, consultez Enabling the M-Files OCR Module et Gérer des licences du serveur. M-Files utilise un moteur OCR fourni par IRIS. Pour toute question concernant l'achat du module OCR M-Files, veuillez contacter notre équipe des ventes à l'adresse suivante : [email protected].

Vous pouvez également convertir un fichier image en PDF indexé. La reconnaissance optique de caractères est exécutée sur le fichier image afin de permettre une recherche plein texte dans tout le fichier. Après la conversion, vous pouvez, par exemple, trouver un document de contrat converti à partir d’une image en effectuant une recherche à l'aide du nom des parties contractantes ou tout autre texte inclus dans le fichier image d’origine.

M-Files suggère également automatiquement la reconnaissance de caractères si vous déposez un fichier image dans M-Files (si le module OCR de M-Files est installé). M-Files ne suggère pas la reconnaissance de caractères pour les fichiers PDF. En effet, le fait de réaliser la reconnaissance optique de caractères sur un PDF déjà indexé en réduit la qualité tout en augmentant la taille du fichier PDF. Vous devez convertir le PDF non indexé en PDF indexé manuellement à l’aide du menu contextuel du fichier PDF.

La reconnaissance optique de caractères peut être exécutée sur les formats de fichier suivants :
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
Les fichiers TIFF utilisant un canal alpha ou une compression JPEG ne sont pas supportés.
Remarque : Si la reconnaissance de texte est exécutée sur un fichier image qui n'a pas été enregistré et stocké dans M-Files, le fichier est uniquement enregistré comme PDF. Sinon, le fichier image d'origine se trouve dans l'historique des versions du document.

Importation de fichiers image en tant que PDF indexés

Pour importer un fichier image dans le coffre en tant que PDF indexé :
  1. Glissez et déposez une image dans M-Files.
  2. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
  3. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
    L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
  4. Cliquez sur Convertir pour lancer la conversion.
  5. Une fois la conversion terminée, la fenêtre Nouveau Document apparaît. Terminez l’importation de l’image en remplissant les métadonnées et en cliquant sur Créer.
Le fichier image est importé dans le coffre en tant que PDF indexé, ce qui vous permet de le localiser à l’aide des fonctions de recherche de M-Files.

Convertir un fichier image stocké dans M-Files en PDF indexé

  1. Dans M-Files, localisez le fichier image que vous souhaitez convertir en PDF indexé.
  2. Cliquez, à l’aide du menu bouton droit, sur le fichier et sélectionnez Numérisation et Reconnaissance de Texte (OCR) > Convertir en PDF indexé... à partir du menu contextuel.
  3. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cochez la case Utiliser la détection de langue automatique pour faire en sorte que M-Files détecte automatiquement la langue du document.
  4. Optionnelle : Dans la boîte de dialogue Conversion en PDF indexé, cliquez sur Avancé pour améliorer la qualité de la reconnaissance de texte en sélectionnant les options de langue primaire et de langue secondaire afin d’être en adéquation avec la langue utilisée sur l’image.
    L’ouverture des options avancées désactive l’option permettant d’utiliser la détection automatique de la langue.
  5. Cliquez sur Convertir pour lancer la conversion.
Le fichier image est converti en un PDF indexé et tout contenu textuel de l’image peut être retrouvé en utilisant les fonctions de recherche de M-Files.