Úvod GNU/Linux Software Ke stažení Odkazy

Vaše IP: 52.3.228.47
Počet návštěv: 1507783
Hledání příkazů operačního systému Linux podle syntaxe nebo popisu.

Nastavení vzhledu stránek
Dark
Silver
Green
Grey

Radek Tříška

E-mail a Jabber :
radek(at)fastlinux(dot)eu
mseed@njs.netlab.cz

Sekce V.I.P. uživatelů


WGet

WGet je užitečná konzolová aplikace určená ke stahování souborů z WWW a FTP.


Přehled základního použití HTTP:

GNU Wget 1.11.1, program pro neinteraktivní stahování souborů.
Použití: wget [PŘEPÍNAČ]… [URL]…

# wget http://www.domena.cz - stažení výchozího souboru z adresy http://www.domena.cz (index.html, ...)

# wget -c http://domena.cz/soubor.iso - naváže přerušené stahování souboru (soubor.iso)

# wget -P /home/data/downloads http://www.domena.cz/soubor.txt - uloží stažené soubory do jiného adresáře (/home/data/downloads)

# wget -i seznam.txt - stažení souborů z adres uvedených v seznam.txt

# wget http://www.domena.cz/soubor.txt -O novejmeno.txt - přejmenování stahovaného souboru

# wget --http-user=UŽIVATEL --http-password=HESLO http://www.domena.cz/soubor.txt - stažení souboru soubor.txt ze serveru vyžadujícího HTTP autentifikaci

# wget --proxy-user=UŽIVATEL --proxy-password=HESLO http://www.domena.cz/soubor.txt - stahování přes zabespečenou proxy

# wget --limit-rate=30k http://www.domena.cz/soubor.txt - omezení rychlosti stahování

# wget --referer=URL http://www.domena.cz/soubor.txt - zahrne hlavičku "Referer" do HTTP požadavku (Referer = adresa stránek, ze kterých jsme se dostali na požadovanou stránku)

# wget --user-agent="Mozilla/5.0 (X11; U; Linux x86_64; cs; rv:1.8.1.14) Gecko/20080420 Firefox/2.0.0.14" http://www.domena.cz.org - stažení souboru se změněnou identifikcí wgetu (pro stažení webů, které obsahují test na user-agenta)

Ukázka z manuálové stránky wgetu o HTTP:

Přepínače pro HTTP:
       --http-user=UŽIVATEL    nastaví přihlašovací jméno uživatele
                               pro HTTP na UŽIVATELE.
       --http-password=HESLO   nastaví heslo pro HTTP na HESLO.
       --no-cache              zakáže kešování na straně serveru.
  -E,  --html-extension        HTML dokumenty ukládá s příponou „.html“.
       --ignore-length         ignoruje hlavičku „Content-Length“.
       --header=ŘETĚZEC        ke hlavičkám přidá ŘETĚZEC.
       --max-redirect          maximum přesměrování povolených
                               na stránku.
       --proxy-user=UŽIVATEL   nastaví UŽIVATELE jako přihlašovací jméno
                               uživatele pro proxy.
       --proxy-password=HESLO  nastaví HESLO jako heslo pro proxy.
       --referer=URL           zahrne hlavičku „Referer: URL“ do
                               HTTP požadavku.
       --save-headers          hlavičky HTTP uloží do souboru.
  -U,  --user-agent=AGENT      identifikuje se jako AGENT místo Wget/VERZE.
       --no-http-keep-alive    zakáže HTTP keep-alive (trvalá spojení).
       --no-cookies            nepoužívá cookies.
       --load-cookies=SOUBOR   před relací načte cookies ze SOUBORU.
       --save-cookies=SOUBOR   po relaci uloží cookies do SOUBORU.
       --keep-session-cookies  načte a uloží cookies relace (ne-trvalé).
       --post-data=ŘETĚZEC     použije metodu POST, jako data pošle ŘETĚZEC.
       --post-file=SOUBOR      použije metodu POST, pošle obsah SOUBORU.
       --content-disposition   při volbě jména místního souboru vezme v úvahu
                               hlavičku Content-Disposition (POKUSNÉ).
       --auth-no-challenge     Posílá údaje Basic HTTP autentizace, aniž by
                               čekal na výzvu od serveru

Přehled základního použití FTP:

# wget ftp://ftp.domena.cz/soubor.txt - stažení souboru (soubor.txt) z ftp

# wget --ftp-user=UŽIVATEL --ftp-password=HESLO ftp://ftp.domena.cz/soubor.txt - stažení souboru soubor.txt ze serveru vyžadujícího FTP autentifikaci

# wget ftp://uzivatel:heslo@domena.cz/soubor.txt - stažení souboru soubor.txt ze serveru vyžadujícího autentifikaci

Ukázka z manuálové stránky wgetu o FTP:

Přepínače FTP:
  --ftp-user=UŽIVATEL     nastaví přihlašovací jméno na UŽIVATELE.
  --ftp-password=HESLO    nastaví heslo pro FTP na HESLO.
  --no-remove-listing     neodstraňuje soubory „.listing“.
  --no-glob               neexpanduje jména FTP souborů.
  --no-passive-ftp        zakáže pasivní režim přenosu.
  --retr-symlinks         při rekurzi stáhne soubory (adresáře ne),
                          na které odkazuje symbolický odkaz.
  --preserve-permissions  zachová přístupová práva ze serveru.

Rekurzivní stahování webů:

# wget --mirror http://www.domena.cz - stáhne kompletní web (pouze na zadaném serveru)

# nohup wget -m http://www.domena.cz & - stáhne kompletní web (pouze na zadaném serveru) a bude pokračovat i po odlogování z terminálu.

# wget --span-hosts --recursive --level=3 --convert-links --page-requisites http://www.domena.cz - stáhne kompletní web, bude procházet i jiné servery na které jsou odkazy do hloubky 3 a zkonvertuje odkazy ve stažených souborech aby fungovali vrámci uložené kopie webu
(Zkrácený zápis příkazu: wget -H -r 3 -k -p http://www.domena.cz)

# wget -A txt,pdf -r -l 2 http://www.domena.cz - rekurzivně, do druhé úrovně stáhne soubory s příponama txt a pdf z webu http://www.domena.cz

Ukázka z manuálové stránky wgetu o rekurzivním stahování:

Rekurzivní stahování:
  -r,  --recursive          zapne rekurzivní stahování.
  -l,  --level=POČET        maximální hloubka rekurze
                            („inf“ nebo „0“ pro nekonečno).
       --delete-after       smaže soubory lokálně po té, co dokončí stahování.
  -k,  --convert-links      učiní odkazy v HTML odkazující na místní soubory.
  -K,  --backup-converted   před konverzí souboru X jej zazálohuje jako X.orig.
  -m,  --mirror             zkratka pro -N -r -l inf --no-remove-listing.
  -p,  --page-requisites    získá všechny obrázky apod. potřebné pro
                            zobrazení HTML stránky.
       --strict-comments    zapne přísné zacházení s HTML komentáři podle SGML.

Rekurzivní povolení/zakázání:
  -A,  --accept=SEZNAM             čárkou oddělený seznam povolených přípon.
  -R,  --reject=SEZNAM             čárkou oddělený seznam zakázaných přípon.
  -D,  --domains=SEZNAM            čárkou oddělený seznam povolených domén.
       --exclude-domains=SEZNAM    čárkou oddělený seznam zakázaných domén.
       --follow-ftp                následuje FTP odkazy z HTML dokumentů.
       --follow-tags=SEZNAM        čárkou oddělený seznam HTML značek určených
                                   k následování.
       --ignore-tags=SEZNAM        čárkou oddělený seznam ignorovaných
                                   HTML značek.
  -H,  --span-hosts                při rekurzi přechází i na jiné počítače.
  -L,  --relative                  následuje jen relativní odkazy.
  -I,  --include-directories=SEZNAM
                                   seznam povolených adresářů.
  -X,  --exclude-directories=SEZNAM
                                   seznam zakázaných adresářů.
  -np, --no-parent                 nestoupá do nadřízeného adresáře

Wget toho umí ještě mnohem více a proto doporučuji prostudovat kompletní manuálové stránky.

| Verze projektu: 1.52 | © 2000 - 2011 | Historie |