Ãëàâíàÿ > Ïðîãðàììû
WGET ìàíóàë
WGET ìàíóàë
ÍÀÇÂÀÍÈÅ
wget - ðóêîâîäñòâî GNU Wget
ÑÈÍÒÀÊÑÈÑ
wget [ïàðàìåòðû]... [URL]...
ÎÏÈÑÀÍÈÅ
GNU Wget - ýòî îòêðûòî ðàñïîñòðàíÿåìàÿ óòèëèòà äëÿ çàãðóçêè ôàéëîâ
èç èíòåðíåò. Îíà ïîääåðæèâàåò ïðîòîêîëû HTTP, HTTPS, è FTP,
çàãðóçêó ñ ñåðâåðîâ ïðîêñè ïî ïðîòîêîëó HTTP.
Wget ìîæåò ñëåäîâàòü ïî ññûëêàì ñòðàíèö HTML è ñîçäàâàòü ëîêàëüíûå êîïèè óäàëåííûõ
ñàéòîâ web, ïðè ýòîì âîçìîæíî ïîëíîå âîññòàíîâëåíèå ñòðóêòóðû ïàïîê ñàéòà
("recursive downloading" - ðåêóðñèâíàÿ çàãðóçêà). Âî âðåìÿ òàêîé ðàáîòû
Wget èùåò ôàéë ñ ïðàâàìè äîñòóïà äëÿ ðîáîòîâ (/robots.txt).
Âîçìîæíà òàêæå êîíâåðòàöèÿ ññûëîê â çàãðóæåííûõ ôàéëàõ HTML äëÿ äàëüíåéøåãî
ïðîñìîòðà ñàéòà â àâòîíîìíîì ðåæèìå ("off-line browsing").
Ïðîâåðêà çàãîëîâêîâ ôàéëîâ: Wget ìîæåò ñ÷èòûâàòü çàãîëîâêè ôàéëîâ (ýòî äîñòóïíî
ïî ïðîòîêîëàì HTTP è FTP) è ñðàâíèâàòü èõ ñ çàãîëîâêàì ðàíåå çàãðóæåííûõ ôàéëîâ,
ïîñëå ÷åãî ìîæåò çàãðóçèòü íîâûå âåðñèè ôàéëîâ. Áëàãîäàðÿ ýòîìó ïðè èñïîëüçîâàíèè
Wget ìîæíî ðåàëèçîâûâàòü çåðêàëüíîå õðàíåíèå ñàéòîâ èëè íàáîðà ôàéëîâ íà FTP.
Wget ðàçðàáîòàí äëÿ ìåäëåííûõ èëè íåñòàáèëüíûõ ñîåäèíåíèé: åñëè âî âðåìÿ çàãðóçêè
âîçíèêíåò ïðîáëåìà, òî Wget áóäåò ïûòàòüñÿ ïðîäîëæèòü çàãðóçêó ôàéëà. Åñëè ñåðâåð,
ñ êîòîðîãî çàãðóæàåòñÿ ôàéë, ïîääåðæèâàåò äîêà÷êó ôàéëîà, òî Wget ïðîäîëæèò
çàãðóæàòü ôàéë èìåííî ñ òîãî ìåñòà, ãäå îáîðâàëàñü çàãðóçêà.
OÏÖÈÈ
Îñíîâíûå ïàðàìåòðû
- -V
-
- --version
-
Îòîáðàçèòü âåðñèþ Wget.
- -h
-
- --help
-
Îòîáðàçèòü ïàðàìåòðû êîìàíäíîé ñòðîêè Wget.
- -b
-
- --background
-
Ïåðåéòè â ôîíîâûé ðåæèì ïîñëå çàïóñêà.
Åñëè ôàéë äëÿ ñîîáùåíèé íå óêàçàí ïàðàìåòðîì -o,
òî îí çàïèñûâàåòñÿ â wget-log
- -e command
-
- --execute command
-
Âûïîëíèòü command êàê åñëè áû îíà áûëà ÷àñòüþ .wgetrc.
Êîìàíäà áóäåò âûïîëíåíà
ïîñëå êîìàíä â .wgetrc.
</DL>
Ïàðàìåòðû ñîîáùåíèé
- -o logfile
-
- --output-file=logfile
-
Çàïèñûâàòü âñå ñîîáùåíèÿ â logfile. Èíà÷å îíè áóäóò íàïðàâëåíû â stderr.
- -a logfile
-
- --append-output=logfile
-
Äîïîëíèòü logfile. Êàê è -o, òîëüêî logfile íå çàìåíÿåòñÿ, à äîïîëíÿåòñÿ.
Åñëè logfile íå ñóùåñòâóåò, ñîçäàåòñÿ íîâûé ôàéë.
- -d
-
- --debug
-
Îòîáðàæàòü ñîîáùåíèÿ îòëàäêè - ðàçíàÿ èíôîðìàöèÿ, âàæíàÿ äëÿ ðàçðàáîò÷èêîâ Wget.
- -q
-
- --quiet
-
Âûêëþ÷èòü ñîîáùåíèÿ Wget.
- -v
-
- --verbose
-
Âêëþ÷èòü ïîäðîáíûå ñîîáùåíèÿ, ñî âñåìè äîñòóïíûìè äàííûìè. Ïî óìîë÷àíèþ âêëþ÷åíî.
- -nv
-
- --non-verbose
-
Èñîïëüçîâàòü ñîêðàùåííûå ñîîáùåíèÿ (÷òîáû âûêëþ÷èòü ñîîáùåíèÿ, ñì. -q).
Ñîîáùåíèÿ îá îøèáêàõ è îñíîâíàÿ èíôîðìàöèÿ áóäóò îòîáðàæàòüñÿ.
- -i file
-
- --input-file=file
-
Ñ÷èòàòü URL èç file.  ýòîì ñëó÷àå óêàçûâàòü URL â êîìàíäíîé ñòðîêå
íå òðåáóåòñÿ. Åñëè URL óêàçàíû è â êîìàíäíîé ñòðîêå è â file, òî ñíà÷àëà
áóäóò çàãðóæåíû URL èç êîìàíäíîé ñòðîêè. file íå îáÿçàòåëüíî äîëæåí èìåòü
ôîðìàò HTML (íî íè÷åãî ñòðàøíîãî, åñëè ýòî òàê) -- URL ïðîñòî äîëæíû
áûòü óêàçàíû â íåì.
Åñëè âû óêàæåòå --force-html, òî ôàéë áóäåò ïðî÷òåí êàê html.
 ýòîì ñëó÷àå ìîãóò âîçíèêíóòü ïðîáëåìû ñ îòíîñèòåëüíûìè ññûëêàìè. Ýòî ìîæíî
ïðåäîòâðàòèòü äîáàâëåíèåì â íåãî "<base href="url">"
èëè ââîäîì â êîìàíäíîé ñòðîêå --base=url.
- -F
-
- --force-html
-
Ïðè ÷òåíèè URL èç ôàéëà, âêëþ÷àåò ÷òåíèå ôàéëà êàê HTML.
Äëÿ ïðåäîòâðàùåíèÿ îøèáîê â ñëó÷àå ëîêàëüíîãî ôàéëà HTML äîáàâüòå
â ôàéë "<base href="url">" èëè ââåäèòå ïàðàìåòð
êîìàíäíîé ñòðîêè --base.
- -B URL
-
- --base=URL
-
Ïðè ÷òåíèè URL èç ôàéëà (-F) îïðåäåëÿåò URL, äîáàâëÿåìûé
ê îòíîñèòåëüíûì àäðåñàì ôàéëà, óêàçàííîãî ïàðàìåòðîì -i.
Ïàðàìåòðû çàãðóçêè
- --bind-address=ADDRESS
-
Ïðè ñîåäèíåíèÿõ ïî ïðîòîêîëàì TCP/IP ïåðåäàåò "bind()" â ADDRESS
íà ëîêàëüíîé ìàøèíå. Â ADDRESS ìîæåò áûòü óêàçàíî êàê èìÿ õîñòà, òàê è IP àäðåñ.
Èñïîëüçóåòñÿ, åñëè âàø êîìïüþòåð èìååò íåñêîëüêî àäðåñîâ IP.
- -t number
-
- --tries=number
-
Óñòàíàâëèâàåò ÷èñëî ïîâòîðîâ number.
Óêàæèòå 0 èëè inf äëÿ îòìåíû ïîâòîðîâ.
- -O file
-
- --output-document=file
-
Äîêóìåíòû íå áóäóò çàïèñûâàòüñÿ â ñîîòâåòñòâóþùèå ôàéëû, à áóäóò îáúåäèíåíû
âìåñòå è çàïèñàíû â ôàéë file. Åñëè file ñóùåñòâóåò, òî îí áóäåò çàìåíåí.
Åñëè file óêàçàí, êàê -, òî äîêóìåíòû áóäóò âûâîäèòüñÿ íà ñòàíäàðòíûé âûâîä (stdout).
Ýòîò ïàðàìåòð àâòîìàòè÷åñêè óñòàíàâëèâàåò ÷èñëî ïîâòîðîâ â 1.
Ïîëåçåí ïðè çàêà÷êå ðàçäåëåííûõ íà ÷àñòè ôàéëîâ ñ ïî÷òîâûõ ñåðâåðîâ ÷åðåç èíòåðôåéñ web.
- -nc
-
- --no-clobber
-
Åñëè ïðè çàãðóçêå ñàéòà ñâÿçü îáîðâàëàñü, òî óêàæèòå ýòîò ïàðàìåòð äëÿ
ïðîäîëæåíèÿ çàãðóçêè ñ ìåñòà ïðåðûâàíèÿ ñâÿçè.
Ïðè çàïóñêå Wget áåç ïàðàìåòðîâ -N, -nc, èëè -r
çàãðóçêà îäíîãî è òîãî æå ôàéëà â îäíó ïàïêó ïðèâåäåò ê ñîçäàíèþ êîïèè ôàéëà
ñ èìåíåì file.1.
Åñëè ñóùåñòâóåò ôàéë è ñ òàêèì èìåíåì, òðåòüÿ êîïèÿ áóäåò íàçûâàòüñÿ
file.2 è ò.ä. Ïðè ïàðàìåòðå -nc áóäóò âûâîäèòüñÿ ïðåäóïðåæäåíèÿ îá ýòîì.
Ïðè çàïóñêå Wget ñ ïàðàìåòðîì -r, íî áåç -N èëè -nc,
íîâàÿ çàãðóçêà ñàéòà ïðèâåäåò ê çàìåíå óæå çàãðóæåííûõ ôàéëîâ. Ïðè óêàçàíèè
ïàðàìåòðà -nc çàãðóçêà ïðîäîëæèòñÿ ñ ìåñòà îáðûâà è çàãðóæåííûå ôàéëû
íå áóäóò çàãðóæàòüñÿ çàíîâî (åñëè òîëüêî îíè íå èçìåíèëèñü).
Ïðè çàïóñêå Wget ñ ïàðàìåòðîì -N, ñ èëè áåç -r, ôàéë áóäåò
çàãðóæåí òîëüêî åñëè îí íîâåå óæå ñóùåñòâóþùåãî, èëè åñëè ðàçìåð åãî íå ñîâïàäàåò
ñ èìåþùåéñÿ êîïèåé (ñì. Ñðàâíåíèå ïî äàòå). -nc íå êîìáèíèðóåòñÿ ñ -N.
Ïðè óêàçàííîì ïàðàìåòðå -nc ôàéëû ñ ðàñøèðåíèÿìè .html èëè
(âîò ýòî ïðîñòî óæàñíî) .htm ñ ëîêàëüíûõ äèñêîâ áóäóò çàãðóæàòüñÿ,
êàê áóäòî áû èç èíòåðíåò.
- -c
-
- --continue
-
Âîçîáíîâëåíèå çàãðóçêè ôàéëà. Èñïîëüçóåòñÿ, åñëè çàãðóçêà ôàéëà áûëà ïðåðâàíà.
Íàïðèìåð:
# wget -c <A HREF="ftp://sunsite.doc.ic.ac.uk/ls-lR.Z">ftp://sunsite.doc.ic.ac.uk/ls-lR.Z</A>
Åñëè â òåêóùåé ïàïêå óæå åñòü ôàéë ñ èìåíåì ls-lR.Z, òî Wget ïðîâåðèò,
ñîîòâåòñòâóåò ëè äàííûé ôàéë çàãðóæàåìîìó (íå ïî ðàçìåðó!), è åñëè ýòî òàê,
òî îòïðàâèò çàïðîñ íà ñåðâåð íà ïðîäîëæåíèå çàãðóçêè ôàéëà ñ òîãî æå ìåñòà,
ãäå îáîðâàëàñü çàãðóçêà â ïðîøëûé ðàç.
Ïîìíèòå, ÷òî ïðè îáðûâå ñâÿçè Wget ïîâòîðÿåò ïîïûòêè äîçàãðóçêè ñàìîñòîÿòåëüíî
è áåç ïàðàìåòðà -c, è òîëüêî êîãäà îí "ñäàñòñÿ" è çàâåðøèò ñâîþ ðàáîòó,
òî äëÿ âîçîáíîâëåíèÿ çàãðóçêè ôàéëà áóäåò íóæåí ýòîò ïàðàìåòð.
Áåç óêàçàíèÿ îïöèè -c ïðåäûäóùèé ïðèìåð ïðèâåäåò ê çàãðóçêå óêàçàííîãî
ôàéëà çàíîâî ñ êîíå÷íûì èìåíåì ls-lR.Z.1, íèêàê íå òðîãàÿ óæå èìåþùèéñÿ ls-lR.Z.
Íà÷èíàÿ ñ âåðñèè 1.7 ïðè óêàçàíèè ïàðàìåòðà -c åñëè ôàéë íà ñåðâåðå
èìååò ðàâíûé èëè ìåíüøèé, ÷åì ó ëîêàëüíîãî ôàéëà, ðàçìåð, òî Wget íå áóäåò
íè÷åãî çàãðóæàòü è îòîáðàçèò ñîîòâåòñòâóþùåå ñîîáùåíèå.
Îäíàêî, ïðè èñïîëüçîâàíèè -c ëþáîé ôàéë íà ñåðâåðå, èìåþùèé áîëüøèé ðàçìåð,
÷åì ëîêàëüíûé ôàéë, áóäåò ðàññìàòðèâàòüñÿ, êàê íåäîêà÷àííûé. Ïðè ýòîì áóäåò çàãðóæåíî
è çàïèñàíî â êîíåö ôàéëà òîëüêî "(äëèíà(óäàë.ôàéë) - äëèíà(ëîêàë.ôàéë))" áàéò.
Ýòî ìîæåò ïðèãîäèòüñÿ, åëñè âàì íóæíî çàãðóçèòü íîâûå ñîîáùåíèÿ èç êàêîãî-ëèáî æóðíàëà (log).
Ïðè ýòîì åñëè çàãðóæàåìûé ôàéë áîëüøå ïîòîìó, ÷òî îí èçìåíèëñÿ, òî âû ïîëó÷èòå
ïîâðåæäåííûé ôàéë (ò.å. ôàéë ìîæåò â èòîãå ïîëó÷èòüñÿ ñîâåðøåííî îòëè÷íûì îò îðèãèíàëà).
Íóæíî áûòü îñîáåííî âíèìàòåëüíûì ïðè èñïîëüçîâàíèè -c âìåñòå ñ -r,
òàê êàê êàæäûé èçìåíåííûé ôàéë ìîæåò áûòü êàíäèäàòîì íà ``íåçàâåðøåííóþ çàãðóçêó.
Âû òàêæå ïîëó÷èòå ïîâðåæäåííûé ôàéë åñëè âàø ñåðâåð ïðîêñè HTTP ðàáîòàåò
ãëóïî è ïðè îáðûâå ñîåäèíåíèÿ ïèøåò â ôàéë ñîîáùåíèå transfer interrupted.
Âåðîÿòíî, â ñëåäóþùèõ âåðñèÿõ Wget ñàì áóäåò èñïðàâëÿòü ýòî.
Ïîìíèòå, ÷òî -c ðàáîòàåò òîëüêî ñ ñåðâåðàìè FTP è HTTP,
ïîääåðæèâàþùèìè çàãîëîâêè "Range" (ò.å. äîêà÷êó ôàéëîâ).
- --progress=type
-
Èíäèêàòîð ïðîãðåññà çàãðóçêè è åãî òèï. Âîçìîæíûå çíà÷åíèÿ: ``dot è ``bar.
Ïî óìîë÷àíèþ èñïîëüçóåòñÿ ``bar. Óêàçàíèå îïöèè --progress=bar ïðèâåäåò
ê ïðîðèñîâêå êðàñèâîãî èíäèêàòîðà èç ñèìâîëîâ ASCII (êàê òåðìîìåòð).
Åñëè ñòàíäàðòíûé âûõîä íå TTY, òî áóäåò èñïîëüçîâàí ``dot.
Óêàæèòå --progress=dot ÷òîáû ïåðåêëþ÷èòñÿ íà òèï ``dot.
Ïðîãðåññ çàãðóçêè áóäåò îòìå÷àòüñÿ äîáàâëåíèåì â ïîëîñå òî÷êè èëè çíàêà ðàâíî,
êàæäûé ñèìâîë ïðåäñòàâëÿåò îäèíàêîâîå êîëè÷åñòâî äàííûõ.
Ïðè èñïîëüçîâàíèè ýòîãî òèïà, âû ìîæåòå óêàçàòü åãî ñòèëü - dot:style.
Åñëè ñòèëü "default", òî êàæäûé ñèìâîë áóäåò ïðåäñòàâëÿòü 1 Ká,
10 ñèìâîëîâ â êëàñòåðå è 50 â ñòðîêå.
Ñòèëü "binary" èìååò áîëåå êîìïüþòåðíûé âèä -
8Ká â ñèìâîëå, 16 ñèìâîëîâ â êëàñòåðå è 48 ñèìâîëîâ â ñòðîêå (ïîëó÷àåòñÿ ñòðîêà íà 384 Ká).
Ñòèëü "mega" èñïîëüçóåòñÿ äëÿ çàãðóçêè áîëüøèõ ôàéëîâ - êàæäûé ñèìâîë ïðåäñòàâëÿåò
64Ká, 8 ñèìâîëîâ â êëàñòåðå è 48 ñèìâîëîâ â ñòðîêå (ïîëó÷àåòñÿ 3 Má íà ñòðîêó).
Âû ìîæåòå îïðåäåëèòü ñòèëü ïî óìîë÷àíèþ, èñïîëüçóÿ êîìàíäó "progress"
â .wgetrc. Åñëè âû õîòèòå, ÷òîáû òèï èíäèêàòîðà ``bar èñïîëüçîâàëñÿ âñåãäà
(à íå òîëüêî ïðè âûâîäå â stdout), òî óêàæèòå
--progress=bar:force.
- -N
-
- --timestamping
-
Âêëþ÷èòü ñðàâíåíèå ïî äàòå.
- -S
-
- --server-response
-
Îòîáðàæàòü çàãîëîâêè, îòïðàâëÿåìûå ñåðâåðàì HTTP è çàïðîñû, îòïðàâëÿåìûå ñåðâåðàì FTP.
- --spider
-
<P>Óñòàíîâêà ïîâåäåíèÿ Wget êàê "ïàóêà", ò. å. Wget íå áóäåò çàãðóæàòü ôàéëû,
à òîëüêî áóäåò ïðîâåðÿòü èõ íàëè÷èå. Òàê ìîæíî ïðîâåðÿòü çàêëàäêè è
ññûëêè ñàéòà. Íàïðèìåð:
# wget --spider --force-html -i bookmarks.html
Wget íå ñîäåðæèò âñå âîçìîæíîñòè "íàñòîÿùèõ ïàóêîâ" äëÿ WWW.
- -T seconds
-
- --timeout=seconds
-
Âðåìÿ îæèäàíèÿ â ñåêóíäàõ. Ïî óìîë÷àíèþ âðåìÿ îæèäàíèÿ ðàâíî 900 ñ (15 ìèí).
Óñòàíîâêà çíà÷åíèÿ â 0 îòìåíÿåò ïðîâåðêó âðåìåíè îæèäàíèÿ.
Ïîæàëóéñòà, íå ñíèæàéòå çíà÷åíèå âðåìåíè îæèäàíèÿ, åñëè Âû òî÷íî íå çíàåòå, ÷òî èìåííî äåëàåòå.
- -w seconds
-
- --wait=seconds
-
Ïàóçà â ñåêóíäàõ ìåæäó íåñêîëüêèìè çàãðóçêàìè (â ò.÷. ïîâòîðàìè).
Ýòî ñíèæàåò çàãðóæåííîñòü ñåðâåðà. ×òîáû óêàçàòü çíà÷åíèå â ìèíóòàõ,
èñïîëüçóéòå "m", â ÷àñàõ - "h",
â äíÿõ - "d" ïîñëå ÷èñëà.
Óêàçàíèå áîëüøîãî çíà÷åíèÿ ýòîãî ïàðàìåòðà ïîëåçíî,
åñëè ñåòü íåñòàáèëüíà (íàïðèìåð ïðè îáðûâàõ ìîäåìíîé ñâÿçè).
- --waitretry=seconds
-
Óñòàíàâëèâàåò ïàóçó òîëüêî ìåæäó ïîâòîðàìè îáîðâàâøèõñÿ çàãðóçîê.
Wget áóäåò æäàòü 1 ñåêóíäó ïîñëå ïåðâîãî îáðûâà, 2 ñåêóíäû ïîñëå
âòîðîãî îáðûâà çàãðóçêè òîãî æå ôàéëà, è ò.ä. - äî ìàêñèìóìà,
êîòîðûé óêàçûâàåòñÿ â ñåêóíäàõ. Íàïðèìåð, ïðè çíà÷åíèè äàííîãî
ïàðàìåòðà, ðàâíîãî 10, Wget áóäåò æäàòü â îáùåì (1 + 2 + ... + 10) = 55
ñåêóíä äëÿ êàæäîãî ôàéëà.
Ýòî çíà÷åíèå óêàçûâàåòñÿ ïî óìîë÷àíèþ â ôàéëå wgetrc.
- --random-wait
-
Íåêîòîðûå ñåðâåðû, ñîâåðøàÿ ôîðìèðîâàíèå ôàéëîâ æóðíàëîâ ñ ïàóçàìè çàïðîñîâ ôàéëîâ,
ìîãóò îïðåäåëèòü ðåêóðñèâíóþ çàãðóçêó ôàéëîâ - ñêàíèðîâàíèå ðîáîòàìè, òàêèìè,
êàê Wget. Ýòîò ïàðàìåòð óñòàíàâëèâàåò âðåìÿ ìåæäó çàïðîñàìè, âàðüèðóÿ ïàóçû ñî âðåìåíåì,
ðàññ÷èòûâàåìûì îò 0 äî 2*wait (ñåêóíä), ãäå wait óêàçàíî
ïàðàìåòðîì -w äëÿ ìàñêèðîâêè Wget.
<P>
Íåëüçÿ çàáûâàòü, ÷òî èñõîäíûé êîä Wget äîñòóïåí, è ïýòîìó äàæå ýòó ìàñêèðîâêó
ïðè æåëàíèè ìîæíî âû÷èñëèòü.
- -Y on/off
-
- --proxy=on/off
-
Ïîääåðæêà ñåðâåðà ïðîêñè. Âêëþ÷åíà ïî óìîë÷àíèþ, åñëè ïðîêñè îïðåäåëåí.
- -Q quota
-
- --quota=quota
-
Êâîòà íà ðàçìåð çàãðóæàåìûõ ôàéëîâ. Óêàçûâàåòñÿ â áàéòàõ (ïî óìîë÷àíèþ),
â êèëîáàéòàõ Êá (åñëè â êîíöå k) èëè â ìåãàáàéòàõ Ìá (åñëè â êîíöå m).
Ïðè èñ÷åðïàíèè êâîòû òåêóùèé ôàéë çàãðóæàåòñÿ äî êîíöà, òî åñòü
êâîòà íå ðàáîòàåò ïðè çàãðóçêå îäíîãî ôàéëà. Íàïðèìåð,
åñëè âû èñïîëíèåò wget -Q10k [1],
òî ôàéë ls-lR.gz áóäåò ïîëíîñòüþ çàãðóæåí. Òàêæå
âñå óêàçàííûå â êîìàíäíîé ñòðîêå ôàéëû áóäóò îáÿçàòåëüíî çàãðóæåíû,
â îòëè÷èå îò ñïèñêà ôàéëîâ â îäíîì ôàéëå èëè êàê ïðè ðåêóðñèâíîé çàãðóçêå.
Óêàçàíèå 0 èëè inf îòìåíèò êâîòó.
</DL>
Ïàðàìåòðû çàãðóçêè ïàïîê
- -nd
-
- --no-directories
-
<P>Íå ñîçäàâàòü ñòðóêòóðó ïàïîê ïðè ðåêóðñèâíîé çàãðóçêå. Ïðè óêàçàííîì ïàðàìåòðå,
âñå ôàéëû áóäóò çàãðóæàòüñÿ â îäíó ïàïêó. Åñëè ôàéë ñ äàííûì èìåíåì óæå ñóùåñòâóåò,
òî îí áóäåò ñîõðàíåí ïîä èìåíåì ÈìÿÔàéëà.n.</P>
- -x
-
- --force-directories
-
Ïðîòèâîïîëîæíî ïàðàìåòðó -nd - ñîçäàâàòü ñòðóêòóðó ïàïîê,
íà÷èíàÿ ñ ãëàâíîé ñòðàíèöû ñåðâåðà. Íàïðèìåð,
wget -x http://fly.srk.fer.hr/robots.txt ïðèâåäåò ê çàãðóçêå
ôàéëà â ïàïêófly.srk.fer.hr.
- -nH
-
- --no-host-directories
-
<P>Íå ñîçäàâàòü ïóñòûå ïàïêè â íà÷àëå ñòðóêòóðû. Ïî óìîë÷àíèþ
/pub/xemacs/.
Åñëè âû çàãðóçèòå åå ñ ïàðàìåòðîì -r, òî îíà ñîõðàíèòñÿ
ïîä èìåíåì ftp.xemacs.org/pub/xemacs/.
Ñ ïàðàìåòðîì -nH èç èìåíè íà÷àëüíîé ïàïêè âûðåæåòñÿ ftp.xemacs.org/,
è îíà áóäåò íàçûâàòüñÿ pub/xemacs.
À ïàðàìåòð --cut-dirs óáåðåò number êîìïîíåíòîâ.
Ïðèìåðû ðàáîòû ïàðàìåòðà --cut-dirs:
</P>
Áåç ïàðàìåòðîâ -> <A HREF="ftp://ftp.xemacs.org">ftp.xemacs.org</A>/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .
--cut-dirs=1 -> <A HREF="ftp://ftp.xemacs.org">ftp.xemacs.org</A>/xemacs/
...
Åñëè âû õîòèòå ïðîñòî èçáàâèòüñÿ îò ñòðóêòóðû ïàïîê,
òî âû ìîæåòå çàìåíèòü ýòîò ïàðàìåòð íà -nd è -P.
 îòëè÷èå îò -nd, -nd ðàáîòàåò ñ ïîäêàòàëîãàìè -
íàïðèìåð, ïðè -nH --cut-dirs=1 ïîäêàòàëîã beta/
çàïèøåòñÿ, êàê xemacs/beta.
- -P prefix
-
- --directory-prefix=prefix
-
Îïðåäåëÿåò íà÷àëüíóþ ïàïêó, â êîòîðîé áóäåò ñîõðàíåíà
ñòðóêòóðà ïàïîê ñàéòà (èëè ïðîñòî ôàéëû). Ïî óìîë÷àíèþ
ýòîò ïàðàìåòð ðàâåí . (òåêóùàÿ ïàïêà).
Ïàðàìåòðû HTTP
- -E
-
- --html-extension
-
<P>Åñëè òèï çàãðóæåííîãî ôàéëà text/html è åãî àäðåñ íå îêàí÷èâàåòñÿ
íà \.[Hh][Tt][Mm][Ll]?, ïðè èñïîëüçîâàíèè äàííîãî ïàðàìåòðà ê åãî
èìåíè áóäåò äîáàâëåíî .html. Ýòî ìîæåò áûòü ïîëåçíî ïðè çåðêàëüíîì
õðàíåíèè ñòðàíèö .asp, åñëè âû íå õîòèòå, ÷òîáû îíè âìåøèâàëèñü
â ðàáîòó âàøåãî ñåðâåðà Apache. Äðóãîé ñëó÷àé ïðèìåíåíèÿ ýòîãî ïàðàìåðà -
ýòî çàãðóçêà ñòðàíèö-îòâåòîâ CGI ñêðèïòîâ. Ñòðàíèöà ñ URL âèäà
http://site.com/article.cgi?25 áóäåò ñîõðàíåíà,
êàê article.cgi?25.html.
</P>
<P>
Ïðèìå÷àíèå: ïðè îáíîâëåíèè èëè äðóãîé ïåðåçàãðóçêå ñòðàíèö ñ äàííûì
ïàðàìåòðîì ïîñëåäíèå áóäóò çàãðóæàòüñÿ çàíîâî â ëþáîì ñëó÷àå,
ò.ê. Wget íå ìîæåò óçíàòü, èìååò ëè îòíîøåíèå ëîêàëüíûé ôàéë X.html
ê çàãðóæàåìîìó ñ URL X. ×òîáû èçáåæàòü ëèøíåé ïåðåçàãðóçêè,
èñïîëüçóéòå îïöèè -k è -K. Ïðè ýòîì îðèãèíàëüíûå âåðñèè
ôàéëîâ áóäóò òàêæå ñîõðàíåíû êàê X.orig.
</P>
- --http-user=user
-
- --http-passwd=password
-
<P>Èìÿ ïîëüçîâàòåëÿ user è ïàðîëü password äëÿ ñåðâåðà HTTP.
 çàâèñèìîñòè îò òèïà îòêëèêà, Wget áóäåò èñïîëüçîâàòü
"basic" (íåáåçîïàñíóþ)
èëè "digest" (çàùèùåííóþ) àâòîðèçàöèþ.
</P>
<P>
Ìîæíî òàêæå óêàçûâàòü èìÿ ïîëüçîâàòåëÿ è ïàðîëü è â ñàìîì URL.</P>
- -C on/off
-
- --cache=on/off
-
<P>Âêëþ÷àåò èëè âûêëþ÷àåò êåøèðîâàíèå ñî ñòîðîíû ñåðâåðà.
Ïðè ýòîì Wget ïîñûëàåò ñîîòâåòñòâóþùèõ çàïðîñ (Pragma: no-cache).
Òàêæå èñïîëüçóåòñÿ äëÿ áûñòðîãî îáíîâëåíèÿ ôàéëîâ íà ïðîêñè-ñåðâåðå.</P>
<P>
Ïî óìîë÷àíèþ êåøèðîâàíèå ðàçðåøåíî.
- --cookies=on/off
-
Âêëþ÷àåò èëè âûêëþ÷àåò èñïîëüçîâàíèå cookie. Ñåðâåð îòïðàâëÿåò
êëèåíòó cookie, èñïîëüçóÿ çàãîëîâîê "Set-Cookie"
è êëèåíò îòâå÷àåò òàêèì æå cookie. Áëàãîäàðÿ ýòîìó ñåðâåð ìîæåò
âåñòè ñòàòèñòèêó ïîñåòèòåëåé. Ïî óìîë÷àíèþ cookie èñïîëüçóþòñÿ,
íî çàïèñü èõ íà äèñê âûêëþ÷åíà.</P>
- --load-cookies file
-
Çàãðóæàòü cookie èç file ïåðåä ïåðâîé çàãðóçêîé HTTP.
file èìååò òåêñòîâûé ôîðìàò, êàê cookies.txt ó Netscape.
<P>
Ýòîò ïàðàìåòð èñïîëüçóåòñÿ ïðè çåðêàëèðîâàíèè. Äëÿ ýòîãî Wget îòïðàâëÿåò
òå æå cookies, êîòîðûå îòïðàâëÿåò âàø áðàóçåð ïðè ñîåäèíåíèè ñ ñåðâåðîì HTTP.
Ýòî âêëþ÷àåòñÿ äàííûì ïàðàìåòðîì - ïðîñòî óêàæèòå Wget ïóòü
ê cookies.txt. Ðàçíûå áðàóçåðû õðàíÿò cookie â ðàçíûõ ïàïêàõ:
</P>
-
- Netscape 4.x.
-
Ôàéë íàõîäèòñÿ â ~/.netscape/cookies.txt.
- Mozilla è Netscape 6.x.
-
Mozilla õðàíèò cookies â cookies.txt, ðàñïîëîæåííîì ãäå-òî
â ~/.mozilla, â ïàïêå âàøåãî ïðîôèëÿ.
Ïîëíûé ïóòü îáû÷íî çàêàí÷èâàåòñÿ ÷åì-òî âðîäå
~/.mozilla/default/some-weird-string/cookies.txt.
- Internet Explorer.
-
×òîáû ýêñïîðòèðîâàòü cookie äëÿ Wget, âûáåðèòå "Ôàéë", "Èìïîðò è Ýêñïîðò",
â ìàñòåðå âûáåðèòå "Ýêñïîðò ôàéëîâ cookie". Ïðîâåðåíî â Internet Explorer 5;
âîçìîæíî íå áóäåò ðàáîòàòü â ðàííèõ âåðñèÿõ.
- Äðóãèå îáîçðåâàòåëè.
-
Ïàðàìåòð --load-cookies áóäåò ðàáîòàòü ñ cookie â ôîðìàòå Netscape,
êîòîðûé ïîääåðæèâàåòñÿ Wget.
-
<P>
Åñëè âû íå ìîæåòå èñïîëüçîâàòü ïàðàìåòð --load-cookies,
òî âñå ðàâíî åñòü âûõîä. Åñëè âàø îáîçðåâàòåëü ïîääåðæèâàåò
Çàïèøèòå èìÿ è çíà÷åíèå cookie è âðó÷íóþ óêàæèòå Wget îòïðàâêó ýòèõ cookie:
</P>
# wget --cookies=off --header "Cookie: I<name>=I<value>"
- --save-cookies file
-
Ñîõðàíèòü cookie èç file â êîíöå ñåññèè. Óñòàðåâøèå cookie íå ñîõðàíÿþòñÿ.
- --ignore-length
-
Íåêîòîðûå ñåðâåðû HTTP (òî÷íåå, ñêðèïòû CGI) îòïðàâëÿþò
çàãîëîâêè "Content-Length", êîòîðûå óêàçûâàþò Wget,
÷òî çàãðóæåíî åùå íå âñå. È Wget çàãðóæàåò îäèí äîêóìåíò íåñêîëüêî ðàç.
<P>
Ñ ýòèì ïàðàìåòðîì, Wget áóäåò èãíîðèðîâàòü çàãîëîâêè "Content-Length".
- --header=additional-header
-
Îïðåäåëÿåò additional-header, îòïðàâëÿåìûé ñåðâåðó HTTP.
Îí äîëæåí ñîäåðæàòü : è ñèìâîëû ïîñëå íåãî.
</P>
<P>
Âû ìîæåòå îïðåäåëèòü íåñêîëüêî äîïîëíèòåëüíûõ çàãîëîâêîâ
÷åðåç èñïîëüçîâàíèå --header íåñêîëüêî ðàç.
</P>
# wget --header='Accept-Charset: iso-8859-2' \
--header='Accept-Language: hr' \
<A HREF="http://fly.srk.fer.hr/">http://fly.srk.fer.hr/</A>
Óêàçàíèå ïóñòîé ñòðîêè â çíà÷åíèè çàãîëîâêà
î÷èñòèò âñå îïðåäåëåííûå ïîëüçîâàòåëåì äî ýòîãî çàãîëîâêè.
- --proxy-user=user
-
- --proxy-passwd=password
-
Îïðåäåëÿåò èìÿ ïîëüçîâàòåëÿ user è ïàðîëü password äëÿ àâòîðèçàöèè
ñåðâåðå ïðîêñè. Áóäåò èñïîëüçîâàí òèï àâòîðèçàöèè "basic".
- --referer=url
-
Äîáàâëÿåò çàãîëîâîê `Referer: url' â çàïðîñ HTTP.
Èñïîëüçóåòñÿ ïðè çàãðóçêå ñòðàíèö, êîòîðûå ïåðåäàþòñÿ ïðàâèëüíî
òîëüêî åñëè ñåðâåð çíàåò, ñ êàêîé ñòðàíèöû âû ïðèøëè.
- -s
-
- --save-headers
-
Ñîõðàíÿòü çàãîëîâêè, îòïðàâëÿåìûå ñåðâåðàì HTTP.
- -U agent-string
-
- --user-agent=agent-string
-
Èäåíòèôèöèðîâàòüñÿ, êàê agent-string ïðè çàïðîñå íà HTTP ñåðâåð.
<P>
Ïðîòîêîë HTTP ïîçâîëÿåò îïðåäåëÿòü ñåáÿ èñïîëüçîâàíèåì
çàãîëîâêà àãåíòà. Wget ïî óìîë÷àíèþ èäåíòèôèöèðóåòñÿ,
êàê Wget/version, ãäå version - ýòî âåðñèÿ Wget.
</P><P>
Íåêîòîðûå ñåðâåðû âûäàþò òðåáóåìóþ èíôîðìàöèþ òîëüêî äëÿ îáîçðåâàòåëåé,
èäåíòèôèöèðóþùèõñÿ êàê "Mozilla" èëè
Microsoft "Internet Explorer".
Ýòîò ïàðàìåòð ïîçâîëÿåò îáìàíóòü òàêèå ñåðâåðû.</P>
Ïàðàìåòðû FTP
- -nr
-
- --dont-remove-listing
-
Íå óäàëÿòü âðåìåííûå ôàéëû .listing, ãåíåðèðóåìûå ïðè çàãðóçêå
ïî FTP. Ýòè ôàéëû ñîäåðæàò èíôîðìàöèþ î ïàïêàõ ñåðâåðîâ FTP.
Íåóäàëåíèå ïîìîæåò âàì áûñòðî îïðåäåëèòü îáíîâëåíèå ïàïîê ñåðâåðà
(ò.å. îïðåäåëÿòü., ÷òî âàøå çåðêàëî ÿâëÿåòñÿ òàêîâûì).
<P>
Åñëè âû íå óäàëÿåòå .listing, òî ïîìíèòå î ñâîåé áåçîïàñíîñòè!
Íàïðèìåð, ñ òàêèì èìåíåì ìîæíî ñîçäàòü ñèìâîëè÷åñêóþ ññûëêó
íà /etc/passwd èëè ÷òî-òî åùå.</P>
- -g on/off
-
- --glob=on/off
-
<P>Âêëþ÷àåò èëè âûêëþ÷àåò èñïîëüçîâàíèå ñïåöèàëüíûõ ñèìâîëîâ (ìàñêè)
ïî ïðîòîêîëó FTP. Ýòî ìîæåò áûòü *, ?, [ è ].
Íàïðèìåð:
</P>
# wget [ftp://gnjilux.srk.fer.hr/*.msg ftp://gnjilux.srk.fer.hr/*.msg]
Ïî óìîë÷àíèþ èñïîëüçîâàíèå ñèìâîëîâ ìàñêè ðàçðåøåíî,
åñëè URL ñîäåðæèò òàêèå ñèìâîëû.
<P>
Âû ìîæåòå òàêæå âçÿòü URL â êàâû÷êè.
Ýòî ñðàáîòàåò òîëüêî íà ñåðâåðàõ Unix FTP
(è ýìóëèðóþùèõ âûõîä Unix "ls").</P>
- --passive-ftp
-
Âêëþ÷àåò ïàññèâíûé ðåæèì FTP, êîãäà ñîåäèíåíèå èíèöèèðóåòñÿ êëèåíòîì.
Èñïîëüçóåòñÿ ïðè íàëè÷èè firewall.
- --retr-symlinks
-
Ïðè ðåêóðñèâíîé çàãðóçêå ïàïîê FTP ôàéëû, íà êîòîðûå óêàçûâàþò
ñèìâîëè÷åñêèå ññûëêè, íå çàãðóæàþòñÿ. Äàííûé ïàðàìåòð îòêëþ÷àåò ýòî.
<P>
Ïàðàìåòð --retr-symlinks ðàáîòàåò ñåé÷àñ òîëüêî äëÿ ôàéëîâ, íå äëÿ ïàïîê.
</P>
Ïîìíèòå, ÷òî ýòîò ïàðàìåòð íå ðàáîòàåò ïðè çàãðóçêå îäèíî÷íîãî ôàéëà.
Ïàðàìåòðû ðåêóðñèâíîé çàãðóçêè
- -r
-
- --recursive
-
Âêëþ÷èòü ðåêóðñèâíóþ çàãðóçêó.
- -l depth
-
- --level=depth
-
<P>Ìàêñèìàëüíàÿ ãëóáèíà ðåêóðñèâíîé çàãðóçêè depth.
Ïî óìîë÷àíèþ åå çíà÷åíèå ðàâíî 5.
- --delete-after
-
Óäàëÿòü êàæäóþ ñòðàíèöó (ëîêàëüíî) ïîñëå åå çàãðóçêè.
Èñïîëüçóåòñÿ äëÿ ñîõðàíåíèÿ íîâûõ âåðñèé ÷àñòî çàïðàøèâàåìûõ
ñòðàíèö íà ïðîêñè. Íàïðèìåð:
</P>
# wget -r -nd --delete-after <A HREF="http://whatever.com/~popular/page/">http://whatever.com/~popular/page/</A>
Ïàðàìåòð -r âêëþ÷àåò çàãðóçêó ïî óìîë÷àíèþ,
ïàðàìåòð -nd îòêëþ÷àåò ñîçäàíèå ïàïîê.
<P>
Ïðè óêàçàííîì ïàðàìåòðå --delete-after
áóäåò èãíîðèðîâàòüñÿ ïàðàìåòð --convert-links.
- -k
-
- --convert-links
-
Ïîñëå çàâåðøåíèÿ çàãðóçêè êîíâåðòèðîâàòü ññûëêè â äîêóìåíòå äëÿ ïðîñìîòðà
â àâòîíîìíîì ðåæèìå. Ýòî êàñàåòñÿ íå òîëüêî âèäèìûõ ññûëîê íà äðóãèå
äîêóìåíòû, à ññûëîê íà âñå âíåøíèå ëîêàëüíûå ôàéëû.
</P>
<P>Êàæäàÿ ññûëêà èçìåíÿåòñÿ îäíèì èç äâóõ ñïîñîáîâ:
-
- *
-
Ññûëêè íà ôàéëû, çàãðóæåííûå Wget èçìåíÿþòñÿ íà ñîîòâåòñòâóþùèå
îòíîñèòåëüíûå ññûëêè.
</P>
<P>
Íàïðèìåð: åñëè çàãðóæåííûé ôàéë /foo/doc.html, òî ññûëêà
íà òàêæå çàãðóæåííûé ôàéë /bar/img.gif áóäåò âûãëÿäåòü,
êàê ../bar/img.gif. Ýòîò ñïîñîá ðàáîòàåò, åñëè åñòü âèäèìîå
ñîîòíîøåíèå ìåæäó ïàïêàìè îäíîãî è äðóãîãî ôàéëà.
</P>
- *
-
Ññûëêè íà ôàéëû, íå çàãðóæåííûå Wget áóäóò èçìåíåíû íà àáñîëþòíûå
àäðåñà ýòèõ ôàéëîâ íà óäàëåííîì ñåðâåðå.
<P>
Íàïðèìåð: åñëè çàãðóæåííûé ôàéë /foo/doc.html ñîäåðæèò ññûëêó
íà /bar/img.gif (èëè íà ../bar/img.gif), òî ññûëêà
â ôàéëå doc.html èçìåíèòñÿ íà <A HREF="http://host/bar/img.gif">http://host/bar/img.gif</A>.
</P>
-
<P>
Áëàãîäàðÿ ýòîìó, âîçìîæåí àâòîíîìíûé ïðîñìîòð ñàéòà è ôàéëîâ: åñëè çàãðóæåí ôàéë,
íà êîòîðûé åñòü ññûëêà, òî ññûëêà áóäåò óêàçûâàòü íà íåãî, åñëè íåò -
òî ññûëêà áóäåò óêàçûâàòü íà åãî àäðåñ â èíòåðíåò (åñëè òàêîé ñóùåñòâóåò).
Ïðè êîíâåðòèðîâàíèè èñïîëüçóþòñÿ îòíîñèòåëüíûå ññûëêè, çíà÷èò âû ñìîæåòå
ïåðåíîñèòü çàãðóæåííûé ñàéò â äðóãóþ ïàïêó, íå ìåíÿÿ åãî ñòðóêòóðó.
<P>
Òîëüêî ïîñëå çàâåðøåíèÿ çàãðóçêè Wget çíàåò, êàêèå ôàéëû áûëè çàãðóæåíû.
Ñëåäîâàòåëüíî, ïðè ïàðàìåòðå -k êîíâåðòàöèÿ ïðîèçîéäåò òîëüêî ïî
çàâåðøåíèè çàãðóçêè.
- -K
-
- --backup-converted
-
Êîíâåðòèðîâàòü ññûëêè îáðàòíî - óáèðàòü ðàñøèðåíèå .orig.
Èçìåíÿåò ïîâåäåíèå îïöèè -N.
- -m
-
- --mirror
-
Âêëþ÷èòü ïàðàìåòðû äëÿ çåðêàëüíîãî õðàíåíèÿ ñàéòîâ. Ýòîò ïàðàìåòð
ðàâåí íåñêîëüêèì ïàðàìåòðàì: -r -N -l inf -nr.
Äëÿ íåïðèõîòëèâîãî õðàíåíèÿ çåðêàëüíûõ êîïèé ñàéòîâ âû ìîæåòå
èñïîëüçîâàòü äàííûé ïàðàìåòð.
- -p
-
- --page-requisites
-
<P>Çàãðóæàòü âñå ôàéëû, êîòîðûå íóæíû äëÿ îòîáðàæåíèÿ ñòðàíèö HTML.
Íàïðèìåð: ðèñóíêè, çâóê, êàñêàäíûå ñòèëè.
</P><P>
Ïî óìîë÷àíèþ òàêèå ôàéëû íå çàãðóæàþòñÿ. Ïàðàìåòðû -r è -l,
óêàçàííûå âìåñòå ìîãóò ïîìî÷ü, íî ò.ê. Wget íå ðàçëè÷àåò âíåøíèå è âíóòðåííèå
äîêóìåíòû, òî íåò ãàðàíòèè, ÷òî çàãðóçèòñÿ âñå òðåáóåìîå.
</P><P>
Íàïðèìåð, 1.html ñîäåðæèò òåã "<IMG>", ñî ññûëêîé
íà 1.gif, è òåã "<A>", ññûëàþùèéñÿ íà âíåøíèé
äîêóìåíò 2.html. Ñòðàíèöà 2.html àíàëîãè÷íà, íî åå
ðèñóíîê - 2.gif è ññûëàåòñÿ îíà íà 3.html.
Ñêàæåì, ýòî ïðîäîëæàåòñÿ äî îïðåäåëåííîãî ÷èñëà.
</P><P>
Åñëè áóäåò äàíà êîìàíäà:
<P>
# wget -r -l 2 [http://I]<site>/1.html
òî 1.html, 1.gif, 2.html, 2.gif è 3.html çàãðóçÿòñÿ.
Êàê âèäèì, 3.html áåç 3.gif, ò.ê. Wget ïðîñòî ñ÷èòàåò ÷èñëî ïðûæêîâ,
ïî êîòîðûì îí ïåðåøåë, äîõîäèò äî 2 è îñòàíàâëèâàåòñÿ. À ïðè ïàðàìåòðàõ:
<P>
# wget -r -l 2 -p [http://I">http://I]<site>/1.html
Âñå ôàéëû è ðèñóíîê 3.gif ñòðàíèöû 3.html çàãðóçÿòñÿ.
Àíàëîãè÷íî
<P>
# wget -r -l 1 -p <A HREF="http://I">http://I</A><site>/1.html
ïðèâåäåò ê çàãðóçêå 1.html, 1.gif, 2.html è 2.gif.
×òîáû çàãðóçèòü îäíó óêàçàííóþ ñòðàíèöó HTML ñî âñåìè åå ýëåìåíòàìè,
ïðîñòî íå óêàçûâàéòå -r è -l:
<P>
# wget -p <A HREF="http://I">http://I</A><site>/1.html
Ïðè ýòîì Wget áóäåò ñåáÿ âåñòè, êàê ïðè ïàðàìåòðå -r,
íî áóäóò çàãðóæåíû ñòðàíèöà è åå âñïîìîãàòåëüíûå ôàéëû.
Åñëè âû õîòèòå, ÷òîáû âñïîìîãàòåëüíûå ôàéëû íà äðóãèõ
ñåðâåðàõ (ò.å. ÷åðåç àáñîëþòíûå ññûëêè) áûëè çàãðóæåíû, èñïîëüçóéòå:
<P>
# wget -E -H -k -K -p <A HREF="http://I">http://I</A><site>/I<document>
È â çàâåðøåíèè, íóæíî ñêàçàòü, ÷òî äëÿ Wget âíåøíÿÿ ññûëêà -
ýòî URL, óêàçàííûé â òåãàõ "<A>",
"<AREA>" è "<LINK>",
êðîìå "<LINK REL="stylesheet">".
Ïàðàìåòðû çàïðåòà/ðàçðåøåíèÿ ðåêóðñèâíîé çàãðóçêè
- -A acclist --accept acclist
-
- -R rejlist --reject rejlist
-
Ñïèñîê èìåí ôàéëîâ, ðàçäåëåííûõ çàïÿòûìè, êîòîðûå ñëåäóåò èëè íå ñëåäóåò
çàãðóæàòü. Ðàçðåøàåòñÿ çàäàíèå èìåí ôàéëîâ ïî ìàñêå.
- -D domain-list
-
- --domains=domain-list
-
Ñïèñîê äîìåíîâ domain-list, ñ êîòîðûõ ðàçðåøåíî çàãðóæàòü ôàéëû.
Ðàçäåëÿåòñÿ çàïÿòûìè. Ýòîò ïàðàìåòð íå âêëþ÷àåò -H.
- --exclude-domains domain-list
-
Ñïèñîê äîìåíîâ, ñ êîòîðûõ íå ðàçðåøåíî çàãðóæàòü ôàéëû
- --follow-ftp
-
Ñëåäîâàòü ïî ññûëêàì FTP ñ HTML ñòðàíèö.
Èíà÷å, ññûëêè íà ôàéëû ïî ïðîòîêîëó FTP èãíîðèðóþòñÿ.
- --follow-tags=list
-
Wget èìååò âñòðîåííóþ òàáëèöó òåãîâ HTML, â êîòîðûõ îí èùåò
ññûëêè íà äðóãèå ôàéëû. Âû ìîæåòå óêàçàòü äîïîëíèòåëüíûå òåãè â
ðàçäåëåííîì çàïÿòûìè ñïèñêå list â ýòîì ïàðàìåòðå.
- -G list
-
<A NAME="ixAEQ"></A>
- --ignore-tags=list
-
Îáðàòíî --follow-tags. Äëÿ ïðîïóñêà òåãîâ HTML ïðè ðåêóðñèâíîé
çàãðóçêå, óêàæèòå èõ â ðàçäåëåííîì çàïÿòûìè ñïèñêå list.
<P>
Ðàíüøå ïàðàìåòð -G áûë ëó÷øèì äëÿ çàãðóçêè îòäåëüíûõ ñòðàíèö
ñ èõ âñïîìîãàòåëüíûìè ôàéëàìè. Âû ìîæåòå ïîñìîòðåòü, êàê ýòî áûëî, óêàçàâ êîìàíäó
<P>
# wget -Ga,area -H -k -K -r <A HREF="http://I">http://I</A><site>/I<document>
Íî òåïåðü ëó÷øèì ïàðàìåòðîì äëÿ çàãðóçêè îäíîé ñòðàíèöû ïîëíîñòüþ
ñ÷èòàåòñÿ --page-requisites.
- -H
-
- --span-hosts
-
Ðàçðåøàåò ïîñåùàòü ëþáûå ñåðâåðà, íà êîòîðûå åñòü ññûëêà.
- -L
-
Ñëåäîâàòü òîëüêî ïî îòíîñèòåëüíûì ññûëêàì.
Ïðè ýòîì ïàðàìåòðå ôàéëû ñ äðóãèõ ñåðâåðîâ òî÷íî íå áóäóò çàãðóæàòüñÿ.
- -I list
-
- --include-directories=list
-
Ñïèñîê ïàïîê, ðàçäåëåííûõ çàïÿòûìè, èç êîòîðûõ ðàçðåøåíî çàãðóæàòü ôàéëû.
Ýëåìåíòû ñïèñêà list ìîãóò ñîäåðæàòü ñèìâîëû ìàñîê.
- -X list
-
- --exclude-directories=list
-
Ñïèñîê ïàïîê, ðàçäåëåííûõ çàïÿòûìè, èñêëþ÷àåìûõ äëÿ çàãðóçêè
(ñì. Îãðàíè÷åíèå ïî ïàïêàì).
Ýëåìåíòû ñïèñêà list ìîãóò ñîäåðæàòü ñèìâîëû ìàñîê.
- -np
-
- --no-parent
-
Íå ïîäíèìàòüñÿ âûøå íà÷àëüíîãî àäðåñà ïðè ðåêóðñèâíîé çàãðóçêå.
ÏÐÈÌÅÐÛ ÈÑÏÎËÜÇÎÂÀÍÈß
Ïðèìåðû ðàçäåëåíû íà òðè êàòåãîðèè ñîãëàñíî èõ ñëîæíîñòè.
Ïðîñòî èñïîëüçîâàíèå
- *
-
Åñëè âàì íóæíî çàãðóçèòü URL, òî ââåäèòå:
<P>
# wget <A HREF="http://fly.srk.fer.hr/">http://fly.srk.fer.hr/</A>
- *
-
Íî ÷òî æå áóäåò, åñëè ñîåäèíåíèå ìåäëåííîå, à ôàéë äëèííûé?
Åñòü âîçìîæíîñòü îáðûâà ñâÿçè ïåðåä çàâåðøåíèåì çàãðóçêè.
 ýòîì ñëó÷àå Wget áóäåò ïðîäîëæàòü ïîïûòêè íîâîãî ñîåäèíåíèÿ,
ïîêà íå êîí÷èòñÿ ÷èñëî ïîïûòîê (ïî óìîë÷àíèþ 20).
Ìîæíî èçìåíèòü ýòî ÷èñëî, íàïðèìåð äî 45:
<P>
# wget --tries=45 <A HREF="http://fly.srk.fer.hr/jpg/flyweb.jpg">http://fly.srk.fer.hr/jpg/flyweb.jpg</A>
- *
-
Òåïåðü îñòàâèì Wget ðàáîòàòü â ôîíîâîì ðåæèìå, à åãî ñîîáùåíèÿ áóäåì
çàïèñûâàòü â æóðíàë log. Äîëãî íàáèðàòü --tries,
òàê ÷òî èñïîëüçóåì -t.
<P>
# wget -t 45 -o log <A HREF="http://fly.srk.fer.hr/jpg/flyweb.jpg">http://fly.srk.fer.hr/jpg/flyweb.jpg</A> &
Ñèìâîë àìïåðñàíäà â êîíöå óêàçûâàåò êîìàíäíîìó èíòåðïðåòàòîðó ïðîäîëæàòü ðàáîòó,
íå äîæèäàÿñü çàâåðøåíèÿ ðàáîòû Wget.
×òîáû ïðîãðàììà äåëàëà ïîâòîðû áåñêîíå÷íî - èñïîëüçóéòå -t inf.
- *
-
Èñïîëüçîâàòü FTP òàêæå î÷åíü ïðîñòî.
Wget áåðåò íà ñåáÿ âñå çàáîòû ïî àâòîðèçàöèè.
<P>
# wget <A HREF="ftp://gnjilux.srk.fer.hr/welcome.msg">ftp://gnjilux.srk.fer.hr/welcome.msg</A>
- *
-
Åñëè âû óêàæèòå àäðåñ ïàïêè, òî Wget çàãðóçèò ëèñòèíã ýòîé ïàïêè (ò.å.
ôàéëû è ïîäêàòàëîãè, ñîäåðæàùèåñÿ â íåé) è ñêîíâåðòèðóåò åãî â
ôîðìàò HTML. Íàïðèìåð:
<P>
# wget <A HREF="ftp://prep.ai.mit.edu/pub/gnu/">ftp://prep.ai.mit.edu/pub/gnu/</A>
links index.html
Ðàñøèðåííîå èñïîëüçîâàíèå
- *
-
Åñëè ó Âàñ åñòü ôàéë ñ URL, êîòîðûå âû õîòèòå çàãðóçèòü,
òî èñïîëüçóéòå ïàðàìåòð -i:
<P>
# wget -i I<file>
÷Åñëè âû óêàæåòå - âìåñòî èìåíè ôàéëà, òî URL áóäóò ÷èòàòüñÿ
èç ñòàíäàðòíîãî ââîäà (stdin).
- *
-
Ñîçäàòü ïÿòèóðîâíåâóþ êîïèþ ñàéòà GNU ñî ñòðóêòóðîé ïàïîê îðèãèíàëà,
ñ îäíîé ïîïûòêîé çàãðóçêè, ñîõðàíèòü ñîîáùåíèÿ â gnulog:
<P>
# wget -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o gnulog
- *
-
Êàê è â ïðèìåðå âûøå, íî ñ êîíâåðòèðîâàíèåì ññûëêè â ôàéëàõ HTML
â ëîêàëüíûå, äëÿ ïîñëåäóþùåãî àâòîíîìíîãî ïðîñìîòðà:
<P>
# wget --convert-links -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o gnulog
- *
-
Çàãðóçèòü îäíó ñòðàíèöó HTML è âñå ôàéëû, òðåáóåìûå äëÿ îòîáðàæåíèÿ
ïîñëåäíåé (íàïð. ðèñóíêè, ôàéëû êàñêàäíûõ ñòèëåé è ò. ä.). Òàêæå
ñêîíâåðòèðîâàòü âñå ññûëêè íà ýòè ôàéëû:
<P>
# wget -p --convert-links <A HREF="http://www.server.com/dir/page.html">http://www.server.com/dir/page.html</A>
Ñòðàíèöà HTML áóäåò ñîõðàíåíà â <A HREF="http://www.server.com">www.server.com</A>/dir/page.html
è ðèñóíêè, êàñêàäíûå ñòèëè è ïðî÷åå áóäåò ñîõðàíåíî
â ïàïêå <A HREF="http://www.server.com">www.server.com</A>/, êðîìå ñëó÷àÿ,
êîãäà ôàéëû áóäóò çàãðóæàòüñÿ ñ äðóãèõ ñåðâåðîâ.
- *
-
Êàê è â ïðèìåðå âûøå, íî áåç ïàïêè <A HREF="http://www.server.com">www.server.com</A>/.
Òàêæå âñå ôàéëû áóäóò ñîõðàíåíû â ïîäïàïêàõ download/.
<P>
# wget -p --convert-links -nH -nd -Pdownload \
<A HREF="http://www.server.com/dir/page.html">http://www.server.com/dir/page.html</A>
- *
-
Çàãðóçèòü index.html ñ <A HREF="http://www.lycos.com">www.lycos.com</A>, îòîáðàæàÿ çàãîëîâêè ñåðâåðà:
<P>
# wget -S <A HREF="http://www.lycos.com/">http://www.lycos.com/</A>
- *
-
Ñîõðàíèòü çàãîëîâêè â ôàéë äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ.
<P>
# wget -s <A HREF="http://www.lycos.com/">http://www.lycos.com/</A>
more index.html
- *
-
Çàãðóçèòü äâà âûñøèõ óðîâíÿ wuarchive.wustl.edu â /tmp.
<P>
# wget -r -l2 -P/tmp <A HREF="ftp://wuarchive.wustl.edu/">ftp://wuarchive.wustl.edu/</A>
- *
-
Çàãðóçèòü ôàéëû GIF ïàïêè íà HTTP ñåðâåðå.
Êîìàíäà wget <A HREF="http://www.server.com/dir/*.gif">http://www.server.com/dir/*.gif</A> íå áóäåò ðàáîòàòü,
òàê êàê ìàñêèðîâî÷íûå ñèìâîëû íå ïîääåðæèâàþòñÿ ïðè çàãðóçêå
ïî ïðîòîêîëó HTTP. Èñïîëüçóéòå:
<P>
# wget -r -l1 --no-parent -A.gif <A HREF="http://www.server.com/dir/">http://www.server.com/dir/</A>
-r -l1 âêëþ÷àåò ðåêóðñèâíóþ çàãðóçêó ñ ìàêñèìàëüíîé ãëóáèíîé 1.
--no-parent âûêëþ÷àåò ñëåäîâàíèå ïî ññûëêàì â ðîäèòåëüñêóþ ïàïêó,
èìåþùóþ âåðõíèé óðîâåíü,
-A.gif ðàçðåøàåò çàãðóæàòü òîëüêî ôàéëû ñ ðàñøèðåíèåì .GIF.
-A ``*.gif òàêæå áóäåò ðàáîòàòü.
- *
-
Ïðåäïîëîæèì, ÷òî âî âðåìÿ ðåêóðñèâíîé çàãðóçêè âàì íóæíî áûëî ñðî÷íî
âûêëþ÷èòü/ïåðåçàãðóçèòü êîìïüþòåð. ×òîáû íå çàãðóæàòü óæå èìåþùèåñÿ
ôàéëû, èñïîëüçóéòå:
<P>
# wget -nc -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A>
- *
-
Åñëè âû õîòèòå óêàçàòü èìÿ ïîëüçîâàòåëÿ è ïàðîëü äëÿ ñåðâåðà HTTP
èëè FTP, èñïîëüçóéòå ñîîòâåòñòâóþùèé ñèíòàêñèñ URL:
<P>
# wget <A HREF="ftp://hniksic:mypassword@unix.server.com/.emacs">ftp://hniksic:mypassword@unix.server.com/.emacs</A>
- *
-
Âû õîòèòå, ÷òîáû çàãðóæàåìûå äîêóìåíòû øëè â ñòàíäàðòíûé âûâîä, à íå â ôàéëû?
<P>
# wget -O - <A HREF="http://jagor.srce.hr/">http://jagor.srce.hr/</A> <A HREF="http://www.srce.hr/">http://www.srce.hr/</A>
Åñëè âû õîòèòå óñòðîèòü êîíâåéåð è çàãðóçèòü âñå ñàéòû,
ññûëêè íà êîòîðûå óêàçàíû íà îäíîé ñòðàíèöå:
<P>
# wget -O - <A HREF="http://cool.list.com/">http://cool.list.com/</A> | wget --force-html -i -
Ïðîôåññèîíàëüíîå èñïîëüçîâàíèå
- *
-
Äëÿ õðàíåíèå çåðêàëà ñòðàíèöû (èëè ïàïêè FTP), òî
èñïîëüçóéòå --mirror (-m), ÷òî çàìåíÿåò -r -l inf -N.
Âû ìîæåòå äîáàâèòü Wget â crontab ñ çàïðîñîì íà ïðîâåðêó îáíîâëåíèé êàæäîå âîñêðåñåíüå:
<P>
# crontab
0 0 * * 0 wget --mirror <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog
- *
-
Âû òàêæå õîòèòå, ÷òîáû ññûëêè êîíâåðòèðîâàëèñü â ëîêàëüíûå.
Íî ïîñëå ïðî÷òåíèÿ ýòîãî ðóêîâîäñòâà, âû çíàåòå, ÷òî ïðè ýòîì
íå áóäåò ðàáîòàòü ñðàâíåíèå ïî âðåìåíè. Óêàæèòå Wget
îñòàâëÿòü ðåçåðâíûå êîïèè HTML ôàéëîâ ïåðåä êîíâåðòàöèåé.
Êîìàíäà:
<P>
# wget --mirror --convert-links --backup-converted \
<A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog
- *
-
À åñëè íå ðàáîòàåò ëîêàëüíûé ïðîñìîòð ôàéëîâ HTML ñ ðàñøèðåíèåì,
îòëè÷íûì îò .html, íàïðèìåð index.cgi, òî íóæíî ïåðåäàòü
êîìàíäó íà ïåðåèìåíîâàíèå âñåõ òàêèõ ôàéëîâ (content-type = text/html)
â èìÿ.html.
<P>
# wget --mirror --convert-links --backup-converted \
--html-extension -o /home/me/weeklog \
<A HREF="http://www.gnu.org/">http://www.gnu.org/</A>
Ñ êðàòêèìè àíàëîãàìè êîìàíä:
<P>
# wget -m -k -K -E <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog
ÔÀÉËÛ
- /usr/local/etc/wgetrc
-
Ïî óìîë÷àíèþ ýòî ðàñïîëîæåíèå ãëîáàëüíîãî ôàéëà íàñòðîåê.
- .wgetrc
-
Ôàéë íàñòðîåê ïîëüçîâàòåëÿ.
ÍÀÉÄÅÍÍÛÅ ÎØÈÁÊÈ
Âû ìîæåòå îòïðàâëÿòü îò÷åòû îá îøèáêàõ â GNU Wget
íà àäðåñ <"<A HREF="mailto:bug-wget@gnu.org">bug-wget@gnu.org</A>"> (íà àíãëèéñêîì).
<P>
Ïåðåä îòïðàâêîé:
- 1.
-
Óáåäèòåñü, ÷òî ïîâåäåíèå ïðîãðàììû äåéñòâèòåëüíî îøèáî÷íî.
Åñëè Wget "âûëåòàåò", òî ýòî îøèáêà.
Åñëè ïîâåäåíèå Wget íå ñîîòâåòñòâóåò äîêóìåíòàöèè, òî ýòî îøèáêà.
Åñëè âñå ðàáîòàåò ñòðàííî, íî âû íå óâåðåíû, êàê îíî äîëæíî
ðàáîòàòü íà ñàìîì äåëå, òî ýòî òîæå ìîæåò áûòü îøèáêîé.
- 2.
-
Ïîïûòàéòåñü ïîâòîðèòü ñèòóàöèþ ñ âûäà÷åé îøèáêè
çà ìèíèìàëüíîå êîëè÷åñòâî äåéñòâèé.
<P>
Íå ñïåøèòå îòïðàâëÿòü .wgetrc, ïîïðîáóéòå ïðîäåëàòü
âñå äåéñòâèÿ, ïðèâåäøèå ê îøèáêå ñ äðóãèì ôàéëîì íàñòðîåê
(èëè âîîáùå áåç íåãî).
- 3.
-
Çàïóñòèòå Wget ñ ïàðàìåòðîì -d è îòïðàâüòå æóðíàë
(èëè åãî ÷àñòè). Íàìíîãî ëåã÷å îòûñêèâàòü îøèáêè
ïðè íàëè÷èè òàêèõ æóðíàëîâ.
- 4.
-
Åñëè Wget âûäàë îøèáêó, òî ïîïûòàéòåñü çàïóñòèòü åãî â îòëàä÷èêå,
íàïðèìåð "gdb `which wget` core" è
ââåäèòå "where" äëÿ ïîëó÷åíèÿ îáðàòíîé òðàññèðîâêè.
ÑÌ. ÒÀÊÆÅ
GNU Info äëÿ wget.
ÀÂÒÎÐÛ
Hrvoje Niksic <<A HREF="mailto:hniksic@arsdigita.com">hniksic@arsdigita.com</A>>.
ÏÅÐÅÂÎÄ
Í. Øàôîðîñòîâ <<A HREF="mailto:admin@program.net.ua">admin@program.net.ua</A>>
ÀÂÒÎÐÑÊÈÅ ÏÐÀÂÀ
Copyright (c) 1996, 1997, 1998, 2000, 2001 Free Software Foundation, Inc.
<P>
Ýòî ñâîáîäíîå ïðîãðàììíîå îáåñïå÷åíèå;
óñëîâèÿ êîïèðîâàíèÿ èùèòå â èñõîäíûõ òåêñòàõ.
ÍÅ ñóùåñòâóåò íèêàêèõ ãàðàíòèé; ïðîãðàììà ÍÅ ïðåäíàçíà÷åíà äëÿ ÏÐÎÄÀÆ.
Ãëàâíàÿ > Ïðîãðàììû
|