Hoe download ik alle pagina's van een website in Linux

Wget is krachtige open source software op Linux die kan worden gebruikt om inhoud van websites te downloaden. Soms is het nodig om een ​​kopie van alle inhoud op een website te maken, bijvoorbeeld om een ​​mirror van de site te maken of om de huidige inhoud te bewaren voor later gebruik. Met Wget kan een hele website worden gedownload met één enkele regel.

1.

Zorg ervoor dat wget is geïnstalleerd met behulp van de opdracht "die". Als u 'wget' typt, zonder aanhalingstekens, in een terminal, wordt aangegeven waar Wget op Linux-computers is geïnstalleerd. Als Wget niet is geïnstalleerd, gebruikt u de installatiehulpmiddelen van de distributie, zoals Yum of Apt, om Wget te installeren.

2.

Stel de vlag in om de website te spiegelen. Wget heeft meerdere vlaggen die kunnen worden ingesteld om het gedrag van het programma te veranderen. De vlag "-m" wordt gebruikt om een ​​volledige website te downloaden. Typ bijvoorbeeld:

wget -m www.fake-web-site.com

Dit maakt een lokale kopie van "www.fake-web-site.com" op uw computer. Wget maakt standaard een map met dezelfde naam als de website in de directory waarin deze is uitgevoerd.

3.

Controleer of de inhoud is verkregen door de lokale kopie van de pagina in een browser te openen.

Dingen nodig

  • wget

waarschuwingen

  • Wget kan een aanzienlijke hoeveelheid bandbreedte gebruiken bij het aanvragen van inhoud van een server. Sommige firewalls kunnen ook snelle aanvragen van een enkele client als een aanval interpreteren, waardoor uw IP-adres tijdelijk van de server kan worden geblokkeerd. Zorg ervoor dat de vlag -w is ingesteld om de tijd tussen de verzoeken te beperken. Bijvoorbeeld:
  • wget -m -w 10 www.fake-web-site.com
  • zorgt ervoor dat Wget 10 seconden wacht voordat de volgende bestanden van de server worden opgevraagd.

Populaire Berichten