Comment lire les fichiers HTML Utilisation de Java

Lecture des fichiers HTML en Java est pas différent de la lecture des fichiers texte. À moins que le format du fichier est XML, la lecture d'un fichier HTML est accompli avec un objet fichier Java. L'objet importe le texte à partir du fichier et le lit ligne par ligne. Vous pouvez ensuite utiliser le texte pour la manipulation, ou vous pouvez afficher le texte à l'écran. Utilisation de l'objet fichier en Java pour lire des fichiers est accompli avec quelques lignes de code.

Instructions

  1. Importez les bibliothèques nécessaires. Utilisation de l'objet du fichier nécessite l'utilisation de bibliothèques Java qui ne sont pas automatiquement importés lorsque vous créez une nouvelle classe ou d'un projet. Le code suivant vous montre les bibliothèques nécessaires:
    importation java.io.BufferedInputStream
    GO
    importation java.io.DataInputStream
    GO
    importation java.io.File
    GO
    importation java.io.FileInputStream
    GO
    importation java.io.FileNotFoundException
    GO
    import java.io.IOException;

  2. Ouvrez le fichier et mettre en place des tampons. L'objet fichier a besoin de l'emplacement du fichier HTML sur l'ordinateur. Cela peut aussi être un fichier sur le serveur Web. Le code suivant définit une variable d'ouvrir le fichier, et il crée des variables à utiliser pour la filestream.
    Fichier myhtml = new File ("C: myHTML.html")
    GO
    FileInputStream fileinput = null
    GO
    BufferedInputStream MonBuffer = null
    GO
    DataInputStream DataInput = null;




  3. Attribuer les informations du fichier des variables créées. Les variables de tampon de chargement et les informations en mémoire pour plus rapides temps de lecture.
    fileinput = new FileInputStream (myhtml)
    GO
    MonBuffer = new BufferedInputStream (fileinput)
    GO
    DataInput = new DataInputStream (MonBuffer);

  4. Créer une boucle qui lit le fichier ligne par ligne et imprime à la console. Le code suivant lit les données tant qu'il n'a pas atteint la fin du flux de fichier:
    while (datainput.available ()! = 0) {

    System.out.println (datainput.readLine ())



    GO

     }
  5. Fermez le flux de fichier. Pour libérer de la mémoire de l'application, il est important de fermer les fichiers et les flux de données:
    myHTML.close ()
    GO
    mybuffer.close ()
    GO
    datainput.close ();

» » » » Comment lire les fichiers HTML Utilisation de Java