PDF indexé

M-Files peut convertir des images importées à partir de sources de fichiers externes dans des PDF indexés à l’aide de la reconnaissance optique de caractères (OCR). Cela rend possible la recherche plein texte de documents numérisés. Après conversion vous pouvez retrouver le document PDF en recherchant le contenu du document actuel.

La reconnaissance optique de caractères peut être exécutée sur les formats de fichier suivants :
  • TIF
  • TIFF
  • JPG
  • JPEG
  • BMP
  • PNG
  • PDF
Les fichiers TIFF utilisant un canal alpha ou une compression JPEG ne sont pas supportés.
Remarque : La conversion du fichier en PDF indexé n'affecte pas l'apparence extérieure du document lors de son affichage. Les utilisateurs voient toujours l'image numérisée d'origine. M-Files stocke les résultats de reconnaissance de texte automatique dans le fichier PDF sous forme de texte invisible, utilisable ensuite pour la recherche du fichier. Les éventuelles inexactitudes de la reconnaissance de texte n'affectent pas l'apparence du document numérisé lorsqu'il est affiché à l'écran ou imprimé.
Remarque : Le module OCR M-Files est un module complémentaire à M-Files disponible moyennant un supplément de prix. Il peut être activé avec un code de licence. Pour davantage d’informations, consultez Enabling the M-Files OCR Module et Gérer des licences du serveur. M-Files utilise un moteur OCR fourni par IRIS. Pour toute question concernant l'achat du module OCR M-Files, veuillez contacter notre équipe des ventes à l'adresse suivante : [email protected].

Réalisez les étapes suivantes pour convertir les images d’une source de fichiers externe en PDF indexés :

  1. Ouvrez M-Files Admin.
  2. Dans l'arborescence de gauche, déployez une connexion au serveur M-Files.
  3. Déployez Coffres.
  4. Déployez un coffre.
  5. Déployez Connexions aux Sources Externes.
  6. Cliquez sur Fichiers.
  7. Dans la liste Fichiers, double-cliquez sur le fichier que vous souhaitez modifier.
    Résultat :La boîte de dialogue Propriétés de Connexion s’ouvre.
  8. Cliquez sur l’onglet PDF indexé.
    Résultat :L’onglet PDF indexé s’ouvre.
  9. Cochez la case Utiliser l'OCR pour la recherche plein texte dans les documents numérisés.
  10. À l’aide des menus déroulants Langue principale et Langue secondaire, sélectionnez les langues principale et secondaire des documents numérisés par le biais de la connexion externe afin d’améliorer la qualité des résultats de reconnaissance. La liste des langues secondaires ne contient que les langues qui peuvent être utilisées avec la langue principale sélectionnée.
    Bien que le moteur OCR reconnaisse automatiquement toutes les langues occidentales et les caractères cyrilliques, le choix d'une langue améliore souvent la qualité des résultats de la reconnaissance de texte. Dans les cas ambigus, un problème de reconnaissance peut être résolu par un facteur spécifique de la langue, comme la reconnaissance de la lettre 'Ä' en finnois. La liste des langues secondaires ne contient que les langues qui peuvent être utilisées avec la langue principale sélectionnée.
  11. Optionnelle : Cochez la case Utiliser hyper-compression pour réduire la taille des fichiers PDF si vous souhaitez réduire la taille des fichiers des PDF indexés créés par le biais de cette connexion.
  12. Optionnelle : Cochez la case Convertir en format PDF/A-1b si vous souhaitez que les documents PDF convertis soient conformes à la norme ISO 19005-1:2005 pour la conservation sur le long terme des documents électroniques.
    PDF/A-1b est un format plus restreint par rapport au format PDF standard ; ainsi, la taille des documents convertis au format PDF/A est souvent plus volumineuse que celle des fichiers convertis au format PDF standard. De plus, pendant l'exportation au format PDF/A, certains paramètres avancés d'aspect peuvent être omis. Vous devriez utiliser la conversion au format PDF/A seulement lorsque c'est vraiment nécessaire, pour des conditions de conservation à long terme, par exemple.
  13. Cliquez sur OK pour fermer la boîte de dialogue des Propriétés de Connexion.
Les documents numérisés via cette connexion sont convertis en PDF indexés dans la mesure où ils se trouvent dans le format de fichier applicable. Après avoir été importés dans M-Files (ou y avoir été associés),vous pouvez les trouver en recherchant leur contenu.
Remarque : La reconnaissance de texte peut aussi être effectuée dans M-Files Desktop. Pour davantage d'informations, veuillez vous reporter à la section Numérisation et reconnaissance de texte (OCR). Si vous souhaitez utiliser la reconnaissance de texte avec des sources externes via M-Files Admin uniquement, cette limitation peut être configurée en modifiant les paramètres du registre. Les paramètres de registre peuvent aussi être utilisés pour définir d'autres limitations. Pour plus d'informations sur les paramètres de registre, contactez notre service client à l'adresse [email protected].