Comment numériser un document avec OCR

Reconnaissance optique de caractères (OCR) vous permet de transformer un document imprimé dans un fichier texte informatique sans avoir à retaper. Les bonnes nouvelles sont que la plupart des scanners sont livrés avec un logiciel OCR, donc il n'y a rien d'autre à acheter. Les mauvaises nouvelles sont qu'aucun logiciel OCR est parfait, vous devez donc être prudent pour éviter de dépenser plus de temps de corriger le fichier que vous auriez dépensé retaper.

Choses que vous devez

  • Document à numériser
  • scanner de document
  • Ordinateur
  • Scanner / logiciel OCR

Capture texte avec OCR Numérisation

  1. Transformez votre scanner. Assurez-vous qu'il est correctement connecté à votre ordinateur et que vous avez chargé les pilotes appropriés pour cela.

  2. Démarrez votre logiciel de scanner. Si votre logiciel de scanner ne possède pas une option OCR en elle, démarrez votre logiciel OCR.

  3. Posez votre document face vers le bas sur le scanner, avec le haut du document dans le "en haut" la position. Habituellement, cela signifie que le haut de votre document sera confrontée à l'écart de la charnière du couvercle du scanner, si elle en a un. La plupart des scanners à plat ont une flèche indiquant l'endroit "en haut" la position.




  4. Dans votre logiciel de numérisation, vérifier vos paramètres pour vous assurer que l'option OCR est sélectionnée, et qu'il est réglé pour la numérisation de la langue appropriée.

  5. Définissez la destination pour le texte numérisé dans le logiciel de numérisation. Par exemple, vous pouvez envoyer le texte à un programme d'édition de texte plat comme WordPad ou un programme de traitement de texte comme Microsoft Word.

  6. Cliquez sur le bouton dans le logiciel de numérisation qui commence le balayage. Ce sera généralement produire une image de prévisualisation sur l'écran de l'ensemble du document.

  7. Ajustez le cadre de la numérisation dans le texte que vous souhaitez numériser. Cela implique généralement cliquant sur l'aperçu du document et en faisant glisser les poignées d'un cadre afin qu'ils entourent de près le texte que vous souhaitez numériser.




  8. Faire les ajustements optionnels que votre logiciel de numérisation permet. Par exemple, vous pouvez définir le balayage d'être juste le texte, ou du texte et des images, etc.

  9. Cliquez sur le bouton dans le logiciel de numérisation qui vous permet de faire l'analyse finale.

  10. Lorsque le logiciel vous demande le nom et l'emplacement du fichier numérisé, lui donner un nom que vous reconnaîtrez et le mettre dans un dossier que vous avez créé à cet effet.

  11. Répétez les étapes 3 à 10 pour autant de colonnes ou des pages de texte que vous devez numériser.

Conseils & Avertissements

  • Si vous numérisez un document dans une langue autre que l'anglais, assurez-vous de configurer le logiciel OCR pour cette langue. La plupart des langues, même ceux de l'Ouest, ont des caractères dans leurs alphabets que l'anglais n'a pas, et le logiciel fera un meilleur travail en les reconnaissant si elle attend de les voir.
  • Certains programmes de traitement de texte vous permettent d'importer du texte directement à partir d'un scanner OCR. Cela vous évite l'étape d'avoir à envoyer le texte numérisé au programme, ou l'importer plus tard.
  • Si vous numérisez plusieurs colonnes ou pages de texte à des fichiers, il est préférable de leur donner des noms supplémentaires de sorte que vous pouvez garder l'ordre droite. Par exemple, le premier fichier de texte à partir d'un article sur les chiens pourrait être nommé dog1.txt, le second dog2.txt, etc.
  • Beaucoup de scanners vous donnent la possibilité d'ajouter un chargeur de feuilles, qui automatise le processus de numérisation de plusieurs documents. Si vous faites beaucoup de logiciel d'OCR, il est sage d'envisager cette mise à niveau.
  • Assurez-vous que le document est vraiment analysable. Type minuscule, polices de caractères étranges ou des photocopies floues de quatrième génération seront souche plupart des programmes OCR.
  • Si vous numérisez du texte sur plusieurs colonnes, comme un journal, il est préférable de balayer une colonne à la fois. Sinon, le texte numérisé peut présenter la première ligne de la première colonne, puis la première ligne de la deuxième colonne, et ainsi de suite.
  • Toujours relire attentivement le fichier après la numérisation du document. Même les analyses plus précises peuvent contenir des erreurs subtiles qui peuvent être aussi dur pour vos yeux pour détecter comme il était pour l'appareil photo du scanner.
» » » » Comment numériser un document avec OCR