Comment convertir le HTML en texte Unix

Conversion d'un fichier HTML vers un fichier texte Unix est pas aussi difficile qu'il y paraît. Un fichier texte Unix est juste un "régulier" Fichier texte Windows avec différents marqueurs de fin de ligne. (Unix utilise le caractère de saut de ligne, ou LF- Windows utilise une combinaison du retour chariot et les caractères de saut de ligne, ou CRLF.) Pour convertir un fichier Unix, tout ce que vous devez faire est de changer les terminaisons de ligne pour les bonnes. Une conversion est généralement pas nécessaire puisque la plupart des programmes de façon transparente gérer la conversion, mais au cas où vous avez besoin de faire cette conversion, les étapes sont simples.

  1. À partir de Windows

    • 1

      Convertir le fichier HTML vers un fichier texte brut. Les navigateurs modernes tels que Internet Explorer et Firefox peuvent enregistrer des fichiers HTML comme du texte brut. Ouvrez le fichier dans le navigateur. Presse "Enregistrer Sous" ou "Enregistrer sous" dans le menu fichier. Sélectionner "fichier texte" dans le "Save as type" boîte de dialogue pour convertir le fichier.

    • 2



      Convertir le fichier texte dans un fichier texte Unix. Dans Windows, utilisez un éditeur de texte avancé. Ouvrez le fichier dans l'éditeur. Chercher "Convertir au format Unix" (Ou similaire) sous "Outils" ou "Options."

    • 3

      Vérifiez que le fichier a été converti. De l'intérieur de l'éditeur de texte avancé, choisissez "Montrer fin de ligne" sous "Voir." Les terminaisons de ligne doivent tous être "LF."

    • De Unix / Linux

      • 1

        Convertir le fichier HTML vers un fichier texte brut. Utilisez un navigateur ou l'utilitaire de ligne de commande norme "lynx." Dans un terminal, tapez "lynx -dump URL gt; NOM DE FICHIER" pour convertir une page web dans un fichier texte brut.

      • 2



        Convertir le fichier texte dans un fichier texte Unix en utilisant la norme "tr" utilitaire. Si vous avez utilisé un programme Unix / Linux à l'étape 1 pour convertir le fichier HTML, cette étape ne devrait pas être nécessaire. Dans un terminal, tapez "tr -d ' r' lt; Fichier_texte gt; CONVERTED_FILE."

      • 3

        Vérifiez que le fichier a été converti. Utilisez le programme "chat" qui est aussi standard sur les systèmes Unix / Linux. Dans un terminal, tapez "cat filename -e" pour voir le fichier. Les terminaisons de ligne doivent tous être le symbole du dollar (de $). (Si vous voyez un "^ M" caractère, puis les fins de ligne sont au format Windows.)

    Conseils & Avertissements

    • Le programme Lynx est en fait un navigateur web en mode texte. Vous pouvez l'utiliser pour surfer sur le web en texte brut.
    » » » » Comment convertir le HTML en texte Unix