Zarejestruj się na BitBay.net
Home > Uncategorized > Wget – pobieranie plików nie tylko w linuxie.

Wget – pobieranie plików nie tylko w linuxie.

Wget to UNIX-owy program do pobierania plików. Istnieje także jego windowsowa odmiana. Wget pracuje „wsadowo”, to znaczy bez dialogu z użytkownikiem: sposób jego działania jest całkowicie określany parametrami podanymi przy wywołaniu programu oraz zawartością pliku konfiguracyjnego. Dzięki temu jednak właśnie jest możliwe pozostawienie programu po uruchomieniu „samemu sobie”.

Przykłady użycia:

  • wget http://officeupdate.microsoft.com/downloaditems/Wd97cnv.exe &
    Ściąganie interesującego nas pliku. Znak „&” na końcu komendy jest sygnałem dla Unixa, że program ma być uruchomiony w tle, a my chcemy mieć możliwość dalszej pracy lub wylogowania się.
  • wget -r http://polska.pl/ &
    Ściągnie całą zawartość witryny polska.pl (do 5 poziomów w głąb). W tym przypadku w bieżącym katalogu zostanie utworzony podkatalog o nazwie identycznej z adresem serwera, z którego pobieramy pliki, a więc polska.pl, i dopiero w nim umieszczone będą ściągnięte pliki i podkatalogi. Chcąc uniknąć tworzenia tego dodatkowego katalogu, możemy dodać do komendy parametr -nH (pamiętajmy o rozróżnianiu przez Unix dużych i małych liter!), wówczas katalog ten nie będzie tworzony, a pliki i podkatalogi ściągnięte z witryny znajdą się bezpośrednio w katalogu bieżącym.
  • wget -r -l1 -A.jpg,.gif http://www.mi.com.pl/ &
    Powyższe polecenie ściągnie główną stronę internetowej witryny MI wraz ze wszystkimi znajdującymi się na niej grafikami, ale pominie wszystkie strony podrzędne. Analogicznie, za pomocą parametru -R możemy wykluczyć z obszaru naszego zainteresowania określone typy lub nazwy plików (np. gdy ściągamy witrynę zawierającą odsyłacze do filmów .mpg lub .avi, pominięcie tych plików jest wysoce wskazane).
  • wget -r -np http://www.agh.edu.pl/ogonki/ &
    Użycie tego parametru zabezpiecza przed pobraniem z serwera jakichkolwiek plików nie znajdujących się w katalogu /ogonki lub jego podkatalogach.
  • wget -r -I/przewT,/gifs,/ikony http://www.cyf-kr.edu.pl/przewT/ &
    Możemy spotkać się jednak z sytuacją, że strony znajdujące się w określonym katalogu wykorzystują grafiki znajdujące się w zupełnie odrębnym katalogu na serwerze (np. przewodnik po Tatrach znajdujący się na serwerze krakowskiego Cyfronetu – http://www.cyf-kr.edu.pl/przewT/, który korzysta z grafik w katalogach /gifs i /ikony). Aby ściągnąć również i te grafiki, trzeba, zamiast używać opcji -np, jawnie określić nazwy katalogów, z których program może ściągać plik. Jak widać, nazwy te określa się przy pomocy parametru -I (zwróćmy uwagę, że trzeba w nim wymienić również katalog /przewT, w przeciwnym razie nie zostanie ściągnięty z niego żaden plik oprócz początkowej strony!). Odwrotne znaczenie ma parametr -X – określa katalogi, do których programowi nie wolno wchodzić.
  • wget -r -l3 -H -Dtop.pl -k http://www.top.pl/ &
    Gdy chcemy ściągnąć pliki z więcej niż jednego serwera naraz, używamy parametru -H. Razem z nim zwykle podaje się parametr -D, określający zakres dopuszczalnych nazw domen (w przeciwnym wypadku bowiem program mógłby zacząć ściągać… całą sieć – niechby na którejś ze stron trafił się np. odsyłacz do www.yahoo.com!). Spróbujmy ściągnąć początkowe strony wszystkich serwerów firmy TopNet. Z uwagi na dużą liczbę plików ograniczyliśmy głębokość ściągania witryn do 3, wskazując równocześnie, że program ma podążać za wszystkimi odsyłaczami do innych serwerów w domenie top.pl. Bardzo istotne jest w takim przypadku podanie wspomnianego już paramessssstru -k, dzięki któremu odsyłacze prowadzące oryginalnie pomiędzy różnymi serwerami będą poprawnie działać na lokalnym dysku.
Kategorie:Uncategorized Tagi:,
  1. Brak komentarzy
  1. Brak jeszcze trackbacków
*