Que vous ayez un site web personnel, affaires ou tout simplement pour préserver le contenu Web qui peut être retiré de la World Wide Web il ya des options pour les sites d'archivage. Il existe deux méthodes principales pour l'archivage du web: logiciel qui vous permet de tirer tout le contenu d'un site web depuis le Web dans un répertoire local sur vos services informatiques ou de souscription qui hébergent les données d'un site à distance.
Déterminer quel type de l'outil d'archivage Web serait le mieux pour vous. Si vous avez les connaissances techniques pour maintenir les pages Web, avoir accès à un personnel informatique et un serveur sécurisé, vous voudrez peut-être d'avoir un logiciel autonome de sorte que vous pouvez maintenir les pages Web interne. Si vous ne disposez pas de ces choses que vous voudrez peut-être compter sur un service en ligne qui va récupérer et les pages Web à distance magasin.
Identifier les pages Web que vous attendez d'archiver et de déterminer quels types de contenu nécessité d'être capturé. Outils d'archivage différents sont capables de capturer différents niveaux d'une page Web. Si vous avez besoin que des éléments Possibilités multimédia doivent être archivés qui va changer ce types d'outils d'archivage, vous voudrez utiliser.
Choisissez l'outil d'archivage Web qui convient à vos besoins sur la base des étapes ci-dessus. Il ya plusieurs options open source, ce qui signifie que vous ne comptez pas sur un fournisseur commercial pour stocker vos données. Quelques options disponibles incluent (liens vers toutes les options sont disponibles sous la rubrique Ressources):
Archive-It est un service disponible par abonnement via l'Internet Archive, la plus grande archive web dans le monde, qui saisit, catalogues, magasins et rend le contenu numérique disponible que l'utilisateur sélectionne. Tout le contenu est également accessible au public.
HTTrack est un programme déconnecté autonome libre de logiciel qui permet à l'utilisateur de saisir le contenu Web hors du World Wide Web et de le stocker dans un répertoire local.
Grab-A-Site est un logiciel hors ligne autonome à faible coût qui saisit le contenu Web et les stocke dans un répertoire local.
Heritrix, également créé par l'Internet Archive, est un programme de webcrawler autonome libre qui stocke les données sur le Web dans un répertoire local.
Communiquez avec l'éditeur de l'autorisation de site Web et la demande d'archiver le site. contenu Web est protégé par copyright alors assurez-vous que vous avez soit les droits sur le contenu du site.
Maintenance de l'outil d'archivage Web que vous sélectionnez est impératif. Vous voulez vérifier que les pages Web que vous archivez sont saisissant tout le contenu que vous souhaitez.
Mettre en place un système d'accès bon de sorte que si vous avez plus de quelques pages Web que vous archivez vous serez en mesure de trouver le contenu. La plupart des programmes que vous pouvez utiliser pour l'archivage Web incluront la possibilité d'ajouter des titres, des descriptions, des mots-clés et les dates pour les pages Web.