Ãëàâíàÿ | Êîíòàêòû | Íàñòðîéêè ÑÌÅÍÈÒÜ ÏÀËÈÒÐÓ:

Ãëàâíàÿ > Ïðîãðàììû

WGET ìàíóàë

Ñîäåðæàíèå

WGET ìàíóàë

ÍÀÇÂÀÍÈÅ

wget - ðóêîâîäñòâî GNU Wget

ÑÈÍÒÀÊÑÈÑ

wget [ïàðàìåòðû]... [URL]...

ÎÏÈÑÀÍÈÅ

GNU Wget - ýòî îòêðûòî ðàñïîñòðàíÿåìàÿ óòèëèòà äëÿ çàãðóçêè ôàéëîâ èç èíòåðíåò. Îíà ïîääåðæèâàåò ïðîòîêîëû HTTP, HTTPS, è FTP, çàãðóçêó ñ ñåðâåðîâ ïðîêñè ïî ïðîòîêîëó HTTP.

Wget ìîæåò ñëåäîâàòü ïî ññûëêàì ñòðàíèö HTML è ñîçäàâàòü ëîêàëüíûå êîïèè óäàëåííûõ ñàéòîâ web, ïðè ýòîì âîçìîæíî ïîëíîå âîññòàíîâëåíèå ñòðóêòóðû ïàïîê ñàéòà ("recursive downloading" - ðåêóðñèâíàÿ çàãðóçêà). Âî âðåìÿ òàêîé ðàáîòû Wget èùåò ôàéë ñ ïðàâàìè äîñòóïà äëÿ ðîáîòîâ (/robots.txt). Âîçìîæíà òàêæå êîíâåðòàöèÿ ññûëîê â çàãðóæåííûõ ôàéëàõ HTML äëÿ äàëüíåéøåãî ïðîñìîòðà ñàéòà â àâòîíîìíîì ðåæèìå ("off-line browsing").

Ïðîâåðêà çàãîëîâêîâ ôàéëîâ: Wget ìîæåò ñ÷èòûâàòü çàãîëîâêè ôàéëîâ (ýòî äîñòóïíî ïî ïðîòîêîëàì HTTP è FTP) è ñðàâíèâàòü èõ ñ çàãîëîâêàì ðàíåå çàãðóæåííûõ ôàéëîâ, ïîñëå ÷åãî ìîæåò çàãðóçèòü íîâûå âåðñèè ôàéëîâ. Áëàãîäàðÿ ýòîìó ïðè èñïîëüçîâàíèè Wget ìîæíî ðåàëèçîâûâàòü çåðêàëüíîå õðàíåíèå ñàéòîâ èëè íàáîðà ôàéëîâ íà FTP.

Wget ðàçðàáîòàí äëÿ ìåäëåííûõ èëè íåñòàáèëüíûõ ñîåäèíåíèé: åñëè âî âðåìÿ çàãðóçêè âîçíèêíåò ïðîáëåìà, òî Wget áóäåò ïûòàòüñÿ ïðîäîëæèòü çàãðóçêó ôàéëà. Åñëè ñåðâåð, ñ êîòîðîãî çàãðóæàåòñÿ ôàéë, ïîääåðæèâàåò äîêà÷êó ôàéëîà, òî Wget ïðîäîëæèò çàãðóæàòü ôàéë èìåííî ñ òîãî ìåñòà, ãäå îáîðâàëàñü çàãðóçêà.

OÏÖÈÈ

Îñíîâíûå ïàðàìåòðû

-V
--version
Îòîáðàçèòü âåðñèþ Wget.
-h
--help
Îòîáðàçèòü ïàðàìåòðû êîìàíäíîé ñòðîêè Wget.
-b
--background

Ïåðåéòè â ôîíîâûé ðåæèì ïîñëå çàïóñêà. Åñëè ôàéë äëÿ ñîîáùåíèé íå óêàçàí ïàðàìåòðîì -o, òî îí çàïèñûâàåòñÿ â wget-log

-e command
--execute command
Âûïîëíèòü command êàê åñëè áû îíà áûëà ÷àñòüþ .wgetrc. Êîìàíäà áóäåò âûïîëíåíà ïîñëå êîìàíä â .wgetrc. </DL>

Ïàðàìåòðû ñîîáùåíèé

-o logfile
--output-file=logfile
Çàïèñûâàòü âñå ñîîáùåíèÿ â logfile. Èíà÷å îíè áóäóò íàïðàâëåíû â stderr.
-a logfile
--append-output=logfile

Äîïîëíèòü logfile. Êàê è -o, òîëüêî logfile íå çàìåíÿåòñÿ, à äîïîëíÿåòñÿ. Åñëè logfile íå ñóùåñòâóåò, ñîçäàåòñÿ íîâûé ôàéë.

-d
--debug
Îòîáðàæàòü ñîîáùåíèÿ îòëàäêè - ðàçíàÿ èíôîðìàöèÿ, âàæíàÿ äëÿ ðàçðàáîò÷èêîâ Wget.
-q
--quiet
Âûêëþ÷èòü ñîîáùåíèÿ Wget.
-v
--verbose

Âêëþ÷èòü ïîäðîáíûå ñîîáùåíèÿ, ñî âñåìè äîñòóïíûìè äàííûìè. Ïî óìîë÷àíèþ âêëþ÷åíî.

-nv
--non-verbose
Èñîïëüçîâàòü ñîêðàùåííûå ñîîáùåíèÿ (÷òîáû âûêëþ÷èòü ñîîáùåíèÿ, ñì. -q). Ñîîáùåíèÿ îá îøèáêàõ è îñíîâíàÿ èíôîðìàöèÿ áóäóò îòîáðàæàòüñÿ.
-i file
--input-file=file


Ñ÷èòàòü URL èç file.  ýòîì ñëó÷àå óêàçûâàòü URL â êîìàíäíîé ñòðîêå íå òðåáóåòñÿ. Åñëè URL óêàçàíû è â êîìàíäíîé ñòðîêå è â file, òî ñíà÷àëà áóäóò çàãðóæåíû URL èç êîìàíäíîé ñòðîêè. file íå îáÿçàòåëüíî äîëæåí èìåòü ôîðìàò HTML (íî íè÷åãî ñòðàøíîãî, åñëè ýòî òàê) -- URL ïðîñòî äîëæíû áûòü óêàçàíû â íåì.

Åñëè âû óêàæåòå --force-html, òî ôàéë áóäåò ïðî÷òåí êàê html.  ýòîì ñëó÷àå ìîãóò âîçíèêíóòü ïðîáëåìû ñ îòíîñèòåëüíûìè ññûëêàìè. Ýòî ìîæíî ïðåäîòâðàòèòü äîáàâëåíèåì â íåãî "<base href="url">" èëè ââîäîì â êîìàíäíîé ñòðîêå --base=url.

-F
--force-html

Ïðè ÷òåíèè URL èç ôàéëà, âêëþ÷àåò ÷òåíèå ôàéëà êàê HTML. Äëÿ ïðåäîòâðàùåíèÿ îøèáîê â ñëó÷àå ëîêàëüíîãî ôàéëà HTML äîáàâüòå â ôàéë "<base href="url">" èëè ââåäèòå ïàðàìåòð êîìàíäíîé ñòðîêè --base.

-B URL
--base=URL
Ïðè ÷òåíèè URL èç ôàéëà (-F) îïðåäåëÿåò URL, äîáàâëÿåìûé ê îòíîñèòåëüíûì àäðåñàì ôàéëà, óêàçàííîãî ïàðàìåòðîì -i.

Ïàðàìåòðû çàãðóçêè

--bind-address=ADDRESS
Ïðè ñîåäèíåíèÿõ ïî ïðîòîêîëàì TCP/IP ïåðåäàåò "bind()" â ADDRESS íà ëîêàëüíîé ìàøèíå. Â ADDRESS ìîæåò áûòü óêàçàíî êàê èìÿ õîñòà, òàê è IP àäðåñ. Èñïîëüçóåòñÿ, åñëè âàø êîìïüþòåð èìååò íåñêîëüêî àäðåñîâ IP.
-t number
--tries=number
Óñòàíàâëèâàåò ÷èñëî ïîâòîðîâ number. Óêàæèòå 0 èëè inf äëÿ îòìåíû ïîâòîðîâ.
-O file
--output-document=file

Äîêóìåíòû íå áóäóò çàïèñûâàòüñÿ â ñîîòâåòñòâóþùèå ôàéëû, à áóäóò îáúåäèíåíû âìåñòå è çàïèñàíû â ôàéë file. Åñëè file ñóùåñòâóåò, òî îí áóäåò çàìåíåí. Åñëè file óêàçàí, êàê -, òî äîêóìåíòû áóäóò âûâîäèòüñÿ íà ñòàíäàðòíûé âûâîä (stdout). Ýòîò ïàðàìåòð àâòîìàòè÷åñêè óñòàíàâëèâàåò ÷èñëî ïîâòîðîâ â 1. Ïîëåçåí ïðè çàêà÷êå ðàçäåëåííûõ íà ÷àñòè ôàéëîâ ñ ïî÷òîâûõ ñåðâåðîâ ÷åðåç èíòåðôåéñ web.

-nc
--no-clobber

Åñëè ïðè çàãðóçêå ñàéòà ñâÿçü îáîðâàëàñü, òî óêàæèòå ýòîò ïàðàìåòð äëÿ ïðîäîëæåíèÿ çàãðóçêè ñ ìåñòà ïðåðûâàíèÿ ñâÿçè.

Ïðè çàïóñêå Wget áåç ïàðàìåòðîâ -N, -nc, èëè -r çàãðóçêà îäíîãî è òîãî æå ôàéëà â îäíó ïàïêó ïðèâåäåò ê ñîçäàíèþ êîïèè ôàéëà ñ èìåíåì file.1. Åñëè ñóùåñòâóåò ôàéë è ñ òàêèì èìåíåì, òðåòüÿ êîïèÿ áóäåò íàçûâàòüñÿ file.2 è ò.ä. Ïðè ïàðàìåòðå -nc áóäóò âûâîäèòüñÿ ïðåäóïðåæäåíèÿ îá ýòîì.

Ïðè çàïóñêå Wget ñ ïàðàìåòðîì -r, íî áåç -N èëè -nc, íîâàÿ çàãðóçêà ñàéòà ïðèâåäåò ê çàìåíå óæå çàãðóæåííûõ ôàéëîâ. Ïðè óêàçàíèè ïàðàìåòðà -nc çàãðóçêà ïðîäîëæèòñÿ ñ ìåñòà îáðûâà è çàãðóæåííûå ôàéëû íå áóäóò çàãðóæàòüñÿ çàíîâî (åñëè òîëüêî îíè íå èçìåíèëèñü).

Ïðè çàïóñêå Wget ñ ïàðàìåòðîì -N, ñ èëè áåç -r, ôàéë áóäåò çàãðóæåí òîëüêî åñëè îí íîâåå óæå ñóùåñòâóþùåãî, èëè åñëè ðàçìåð åãî íå ñîâïàäàåò ñ èìåþùåéñÿ êîïèåé (ñì. Ñðàâíåíèå ïî äàòå). -nc íå êîìáèíèðóåòñÿ ñ -N.

Ïðè óêàçàííîì ïàðàìåòðå -nc ôàéëû ñ ðàñøèðåíèÿìè .html èëè (âîò ýòî ïðîñòî óæàñíî) .htm ñ ëîêàëüíûõ äèñêîâ áóäóò çàãðóæàòüñÿ, êàê áóäòî áû èç èíòåðíåò.

-c
--continue
Âîçîáíîâëåíèå çàãðóçêè ôàéëà. Èñïîëüçóåòñÿ, åñëè çàãðóçêà ôàéëà áûëà ïðåðâàíà. Íàïðèìåð:

# wget -c <A HREF="ftp://sunsite.doc.ic.ac.uk/ls-lR.Z">ftp://sunsite.doc.ic.ac.uk/ls-lR.Z</A>

Åñëè â òåêóùåé ïàïêå óæå åñòü ôàéë ñ èìåíåì ls-lR.Z, òî Wget ïðîâåðèò, ñîîòâåòñòâóåò ëè äàííûé ôàéë çàãðóæàåìîìó (íå ïî ðàçìåðó!), è åñëè ýòî òàê, òî îòïðàâèò çàïðîñ íà ñåðâåð íà ïðîäîëæåíèå çàãðóçêè ôàéëà ñ òîãî æå ìåñòà, ãäå îáîðâàëàñü çàãðóçêà â ïðîøëûé ðàç.

Ïîìíèòå, ÷òî ïðè îáðûâå ñâÿçè Wget ïîâòîðÿåò ïîïûòêè äîçàãðóçêè ñàìîñòîÿòåëüíî è áåç ïàðàìåòðà -c, è òîëüêî êîãäà îí "ñäàñòñÿ" è çàâåðøèò ñâîþ ðàáîòó, òî äëÿ âîçîáíîâëåíèÿ çàãðóçêè ôàéëà áóäåò íóæåí ýòîò ïàðàìåòð.

Áåç óêàçàíèÿ îïöèè -c ïðåäûäóùèé ïðèìåð ïðèâåäåò ê çàãðóçêå óêàçàííîãî ôàéëà çàíîâî ñ êîíå÷íûì èìåíåì ls-lR.Z.1, íèêàê íå òðîãàÿ óæå èìåþùèéñÿ ls-lR.Z.

Íà÷èíàÿ ñ âåðñèè 1.7 ïðè óêàçàíèè ïàðàìåòðà -c åñëè ôàéë íà ñåðâåðå èìååò ðàâíûé èëè ìåíüøèé, ÷åì ó ëîêàëüíîãî ôàéëà, ðàçìåð, òî Wget íå áóäåò íè÷åãî çàãðóæàòü è îòîáðàçèò ñîîòâåòñòâóþùåå ñîîáùåíèå.

Îäíàêî, ïðè èñïîëüçîâàíèè -c ëþáîé ôàéë íà ñåðâåðå, èìåþùèé áîëüøèé ðàçìåð, ÷åì ëîêàëüíûé ôàéë, áóäåò ðàññìàòðèâàòüñÿ, êàê íåäîêà÷àííûé. Ïðè ýòîì áóäåò çàãðóæåíî è çàïèñàíî â êîíåö ôàéëà òîëüêî "(äëèíà(óäàë.ôàéë) - äëèíà(ëîêàë.ôàéë))" áàéò. Ýòî ìîæåò ïðèãîäèòüñÿ, åëñè âàì íóæíî çàãðóçèòü íîâûå ñîîáùåíèÿ èç êàêîãî-ëèáî æóðíàëà (log).

Ïðè ýòîì åñëè çàãðóæàåìûé ôàéë áîëüøå ïîòîìó, ÷òî îí èçìåíèëñÿ, òî âû ïîëó÷èòå ïîâðåæäåííûé ôàéë (ò.å. ôàéë ìîæåò â èòîãå ïîëó÷èòüñÿ ñîâåðøåííî îòëè÷íûì îò îðèãèíàëà). Íóæíî áûòü îñîáåííî âíèìàòåëüíûì ïðè èñïîëüçîâàíèè -c âìåñòå ñ -r, òàê êàê êàæäûé èçìåíåííûé ôàéë ìîæåò áûòü êàíäèäàòîì íà ``íåçàâåðøåííóþ çàãðóçêó.

Âû òàêæå ïîëó÷èòå ïîâðåæäåííûé ôàéë åñëè âàø ñåðâåð ïðîêñè HTTP ðàáîòàåò ãëóïî è ïðè îáðûâå ñîåäèíåíèÿ ïèøåò â ôàéë ñîîáùåíèå transfer interrupted. Âåðîÿòíî, â ñëåäóþùèõ âåðñèÿõ Wget ñàì áóäåò èñïðàâëÿòü ýòî.

Ïîìíèòå, ÷òî -c ðàáîòàåò òîëüêî ñ ñåðâåðàìè FTP è HTTP, ïîääåðæèâàþùèìè çàãîëîâêè "Range" (ò.å. äîêà÷êó ôàéëîâ).

--progress=type
Èíäèêàòîð ïðîãðåññà çàãðóçêè è åãî òèï. Âîçìîæíûå çíà÷åíèÿ: ``dot è ``bar.

Ïî óìîë÷àíèþ èñïîëüçóåòñÿ ``bar. Óêàçàíèå îïöèè --progress=bar ïðèâåäåò ê ïðîðèñîâêå êðàñèâîãî èíäèêàòîðà èç ñèìâîëîâ ASCII (êàê òåðìîìåòð). Åñëè ñòàíäàðòíûé âûõîä íå TTY, òî áóäåò èñïîëüçîâàí ``dot.

Óêàæèòå --progress=dot ÷òîáû ïåðåêëþ÷èòñÿ íà òèï ``dot. Ïðîãðåññ çàãðóçêè áóäåò îòìå÷àòüñÿ äîáàâëåíèåì â ïîëîñå òî÷êè èëè çíàêà ðàâíî, êàæäûé ñèìâîë ïðåäñòàâëÿåò îäèíàêîâîå êîëè÷åñòâî äàííûõ.

Ïðè èñïîëüçîâàíèè ýòîãî òèïà, âû ìîæåòå óêàçàòü åãî ñòèëü - dot:style. Åñëè ñòèëü "default", òî êàæäûé ñèìâîë áóäåò ïðåäñòàâëÿòü 1 Ká, 10 ñèìâîëîâ â êëàñòåðå è 50 â ñòðîêå. Ñòèëü "binary" èìååò áîëåå êîìïüþòåðíûé âèä - 8Ká â ñèìâîëå, 16 ñèìâîëîâ â êëàñòåðå è 48 ñèìâîëîâ â ñòðîêå (ïîëó÷àåòñÿ ñòðîêà íà 384 Ká). Ñòèëü "mega" èñïîëüçóåòñÿ äëÿ çàãðóçêè áîëüøèõ ôàéëîâ - êàæäûé ñèìâîë ïðåäñòàâëÿåò 64Ká, 8 ñèìâîëîâ â êëàñòåðå è 48 ñèìâîëîâ â ñòðîêå (ïîëó÷àåòñÿ 3 Má íà ñòðîêó).

Âû ìîæåòå îïðåäåëèòü ñòèëü ïî óìîë÷àíèþ, èñïîëüçóÿ êîìàíäó "progress" â .wgetrc. Åñëè âû õîòèòå, ÷òîáû òèï èíäèêàòîðà ``bar èñïîëüçîâàëñÿ âñåãäà (à íå òîëüêî ïðè âûâîäå â stdout), òî óêàæèòå --progress=bar:force.

-N
--timestamping
Âêëþ÷èòü ñðàâíåíèå ïî äàòå.
-S
--server-response
Îòîáðàæàòü çàãîëîâêè, îòïðàâëÿåìûå ñåðâåðàì HTTP è çàïðîñû, îòïðàâëÿåìûå ñåðâåðàì FTP.
--spider
<P>Óñòàíîâêà ïîâåäåíèÿ Wget êàê "ïàóêà", ò. å. Wget íå áóäåò çàãðóæàòü ôàéëû, à òîëüêî áóäåò ïðîâåðÿòü èõ íàëè÷èå. Òàê ìîæíî ïðîâåðÿòü çàêëàäêè è ññûëêè ñàéòà. Íàïðèìåð:

# wget --spider --force-html -i bookmarks.html

Wget íå ñîäåðæèò âñå âîçìîæíîñòè "íàñòîÿùèõ ïàóêîâ" äëÿ WWW.

-T seconds
--timeout=seconds

Âðåìÿ îæèäàíèÿ â ñåêóíäàõ. Ïî óìîë÷àíèþ âðåìÿ îæèäàíèÿ ðàâíî 900 ñ (15 ìèí). Óñòàíîâêà çíà÷åíèÿ â 0 îòìåíÿåò ïðîâåðêó âðåìåíè îæèäàíèÿ.

Ïîæàëóéñòà, íå ñíèæàéòå çíà÷åíèå âðåìåíè îæèäàíèÿ, åñëè Âû òî÷íî íå çíàåòå, ÷òî èìåííî äåëàåòå.

-w seconds
--wait=seconds

Ïàóçà â ñåêóíäàõ ìåæäó íåñêîëüêèìè çàãðóçêàìè (â ò.÷. ïîâòîðàìè). Ýòî ñíèæàåò çàãðóæåííîñòü ñåðâåðà. ×òîáû óêàçàòü çíà÷åíèå â ìèíóòàõ, èñïîëüçóéòå "m", â ÷àñàõ - "h", â äíÿõ - "d" ïîñëå ÷èñëà.

Óêàçàíèå áîëüøîãî çíà÷åíèÿ ýòîãî ïàðàìåòðà ïîëåçíî, åñëè ñåòü íåñòàáèëüíà (íàïðèìåð ïðè îáðûâàõ ìîäåìíîé ñâÿçè).

--waitretry=seconds
Óñòàíàâëèâàåò ïàóçó òîëüêî ìåæäó ïîâòîðàìè îáîðâàâøèõñÿ çàãðóçîê. Wget áóäåò æäàòü 1 ñåêóíäó ïîñëå ïåðâîãî îáðûâà, 2 ñåêóíäû ïîñëå âòîðîãî îáðûâà çàãðóçêè òîãî æå ôàéëà, è ò.ä. - äî ìàêñèìóìà, êîòîðûé óêàçûâàåòñÿ â ñåêóíäàõ. Íàïðèìåð, ïðè çíà÷åíèè äàííîãî ïàðàìåòðà, ðàâíîãî 10, Wget áóäåò æäàòü â îáùåì (1 + 2 + ... + 10) = 55 ñåêóíä äëÿ êàæäîãî ôàéëà.

Ýòî çíà÷åíèå óêàçûâàåòñÿ ïî óìîë÷àíèþ â ôàéëå wgetrc.

--random-wait
Íåêîòîðûå ñåðâåðû, ñîâåðøàÿ ôîðìèðîâàíèå ôàéëîâ æóðíàëîâ ñ ïàóçàìè çàïðîñîâ ôàéëîâ, ìîãóò îïðåäåëèòü ðåêóðñèâíóþ çàãðóçêó ôàéëîâ - ñêàíèðîâàíèå ðîáîòàìè, òàêèìè, êàê Wget. Ýòîò ïàðàìåòð óñòàíàâëèâàåò âðåìÿ ìåæäó çàïðîñàìè, âàðüèðóÿ ïàóçû ñî âðåìåíåì, ðàññ÷èòûâàåìûì îò 0 äî 2*wait (ñåêóíä), ãäå wait óêàçàíî ïàðàìåòðîì -w äëÿ ìàñêèðîâêè Wget. <P> Íåëüçÿ çàáûâàòü, ÷òî èñõîäíûé êîä Wget äîñòóïåí, è ïýòîìó äàæå ýòó ìàñêèðîâêó ïðè æåëàíèè ìîæíî âû÷èñëèòü.

-Y on/off
--proxy=on/off
Ïîääåðæêà ñåðâåðà ïðîêñè. Âêëþ÷åíà ïî óìîë÷àíèþ, åñëè ïðîêñè îïðåäåëåí.
-Q quota
--quota=quota

Êâîòà íà ðàçìåð çàãðóæàåìûõ ôàéëîâ. Óêàçûâàåòñÿ â áàéòàõ (ïî óìîë÷àíèþ), â êèëîáàéòàõ Êá (åñëè â êîíöå k) èëè â ìåãàáàéòàõ Ìá (åñëè â êîíöå m).

Ïðè èñ÷åðïàíèè êâîòû òåêóùèé ôàéë çàãðóæàåòñÿ äî êîíöà, òî åñòü êâîòà íå ðàáîòàåò ïðè çàãðóçêå îäíîãî ôàéëà. Íàïðèìåð, åñëè âû èñïîëíèåò wget -Q10k [1], òî ôàéë ls-lR.gz áóäåò ïîëíîñòüþ çàãðóæåí. Òàêæå âñå óêàçàííûå â êîìàíäíîé ñòðîêå ôàéëû áóäóò îáÿçàòåëüíî çàãðóæåíû, â îòëè÷èå îò ñïèñêà ôàéëîâ â îäíîì ôàéëå èëè êàê ïðè ðåêóðñèâíîé çàãðóçêå.

Óêàçàíèå 0 èëè inf îòìåíèò êâîòó. </DL>

Ïàðàìåòðû çàãðóçêè ïàïîê

-nd
--no-directories

<P>Íå ñîçäàâàòü ñòðóêòóðó ïàïîê ïðè ðåêóðñèâíîé çàãðóçêå. Ïðè óêàçàííîì ïàðàìåòðå, âñå ôàéëû áóäóò çàãðóæàòüñÿ â îäíó ïàïêó. Åñëè ôàéë ñ äàííûì èìåíåì óæå ñóùåñòâóåò, òî îí áóäåò ñîõðàíåí ïîä èìåíåì ÈìÿÔàéëà.n.</P>

-x
--force-directories

Ïðîòèâîïîëîæíî ïàðàìåòðó -nd - ñîçäàâàòü ñòðóêòóðó ïàïîê, íà÷èíàÿ ñ ãëàâíîé ñòðàíèöû ñåðâåðà. Íàïðèìåð,

wget -x http://fly.srk.fer.hr/robots.txt ïðèâåäåò ê çàãðóçêå ôàéëà â ïàïêófly.srk.fer.hr.

-nH
--no-host-directories

<P>Íå ñîçäàâàòü ïóñòûå ïàïêè â íà÷àëå ñòðóêòóðû. Ïî óìîë÷àíèþ /pub/xemacs/. Åñëè âû çàãðóçèòå åå ñ ïàðàìåòðîì -r, òî îíà ñîõðàíèòñÿ ïîä èìåíåì ftp.xemacs.org/pub/xemacs/. Ñ ïàðàìåòðîì -nH èç èìåíè íà÷àëüíîé ïàïêè âûðåæåòñÿ ftp.xemacs.org/, è îíà áóäåò íàçûâàòüñÿ pub/xemacs. À ïàðàìåòð --cut-dirs óáåðåò number êîìïîíåíòîâ. Ïðèìåðû ðàáîòû ïàðàìåòðà --cut-dirs:

</P>

Áåç ïàðàìåòðîâ        -> <A HREF="ftp://ftp.xemacs.org">ftp.xemacs.org</A>/pub/xemacs/
        -nH               -> pub/xemacs/
        -nH --cut-dirs=1  -> xemacs/
        -nH --cut-dirs=2  -> .

        --cut-dirs=1      -> <A HREF="ftp://ftp.xemacs.org">ftp.xemacs.org</A>/xemacs/
        ...

Åñëè âû õîòèòå ïðîñòî èçáàâèòüñÿ îò ñòðóêòóðû ïàïîê, òî âû ìîæåòå çàìåíèòü ýòîò ïàðàìåòð íà -nd è -P.  îòëè÷èå îò -nd, -nd ðàáîòàåò ñ ïîäêàòàëîãàìè - íàïðèìåð, ïðè -nH --cut-dirs=1 ïîäêàòàëîã beta/ çàïèøåòñÿ, êàê xemacs/beta.

-P prefix
--directory-prefix=prefix

Îïðåäåëÿåò íà÷àëüíóþ ïàïêó, â êîòîðîé áóäåò ñîõðàíåíà ñòðóêòóðà ïàïîê ñàéòà (èëè ïðîñòî ôàéëû). Ïî óìîë÷àíèþ ýòîò ïàðàìåòð ðàâåí . (òåêóùàÿ ïàïêà).


Ïàðàìåòðû HTTP

-E
--html-extension

<P>Åñëè òèï çàãðóæåííîãî ôàéëà text/html è åãî àäðåñ íå îêàí÷èâàåòñÿ íà \.[Hh][Tt][Mm][Ll]?, ïðè èñïîëüçîâàíèè äàííîãî ïàðàìåòðà ê åãî èìåíè áóäåò äîáàâëåíî .html. Ýòî ìîæåò áûòü ïîëåçíî ïðè çåðêàëüíîì õðàíåíèè ñòðàíèö .asp, åñëè âû íå õîòèòå, ÷òîáû îíè âìåøèâàëèñü â ðàáîòó âàøåãî ñåðâåðà Apache. Äðóãîé ñëó÷àé ïðèìåíåíèÿ ýòîãî ïàðàìåðà - ýòî çàãðóçêà ñòðàíèö-îòâåòîâ CGI ñêðèïòîâ. Ñòðàíèöà ñ URL âèäà http://site.com/article.cgi?25 áóäåò ñîõðàíåíà, êàê article.cgi?25.html. </P> <P> Ïðèìå÷àíèå: ïðè îáíîâëåíèè èëè äðóãîé ïåðåçàãðóçêå ñòðàíèö ñ äàííûì ïàðàìåòðîì ïîñëåäíèå áóäóò çàãðóæàòüñÿ çàíîâî â ëþáîì ñëó÷àå, ò.ê. Wget íå ìîæåò óçíàòü, èìååò ëè îòíîøåíèå ëîêàëüíûé ôàéë X.html ê çàãðóæàåìîìó ñ URL X. ×òîáû èçáåæàòü ëèøíåé ïåðåçàãðóçêè, èñïîëüçóéòå îïöèè -k è -K. Ïðè ýòîì îðèãèíàëüíûå âåðñèè ôàéëîâ áóäóò òàêæå ñîõðàíåíû êàê X.orig. </P>

--http-user=user
--http-passwd=password

<P>Èìÿ ïîëüçîâàòåëÿ user è ïàðîëü password äëÿ ñåðâåðà HTTP. Â çàâèñèìîñòè îò òèïà îòêëèêà, Wget áóäåò èñïîëüçîâàòü

"basic" (íåáåçîïàñíóþ) èëè "digest" (çàùèùåííóþ) àâòîðèçàöèþ. </P> <P> Ìîæíî òàêæå óêàçûâàòü èìÿ ïîëüçîâàòåëÿ è ïàðîëü è â ñàìîì URL.</P>

-C on/off
--cache=on/off

<P>Âêëþ÷àåò èëè âûêëþ÷àåò êåøèðîâàíèå ñî ñòîðîíû ñåðâåðà. Ïðè ýòîì Wget ïîñûëàåò ñîîòâåòñòâóþùèõ çàïðîñ (Pragma: no-cache). Òàêæå èñïîëüçóåòñÿ äëÿ áûñòðîãî îáíîâëåíèÿ ôàéëîâ íà ïðîêñè-ñåðâåðå.</P>

<P> Ïî óìîë÷àíèþ êåøèðîâàíèå ðàçðåøåíî.

--cookies=on/off
Âêëþ÷àåò èëè âûêëþ÷àåò èñïîëüçîâàíèå cookie. Ñåðâåð îòïðàâëÿåò êëèåíòó cookie, èñïîëüçóÿ çàãîëîâîê "Set-Cookie" è êëèåíò îòâå÷àåò òàêèì æå cookie. Áëàãîäàðÿ ýòîìó ñåðâåð ìîæåò âåñòè ñòàòèñòèêó ïîñåòèòåëåé. Ïî óìîë÷àíèþ cookie èñïîëüçóþòñÿ, íî çàïèñü èõ íà äèñê âûêëþ÷åíà.</P>
--load-cookies file

Çàãðóæàòü cookie èç file ïåðåä ïåðâîé çàãðóçêîé HTTP. file èìååò òåêñòîâûé ôîðìàò, êàê cookies.txt ó Netscape.

<P> Ýòîò ïàðàìåòð èñïîëüçóåòñÿ ïðè çåðêàëèðîâàíèè. Äëÿ ýòîãî Wget îòïðàâëÿåò òå æå cookies, êîòîðûå îòïðàâëÿåò âàø áðàóçåð ïðè ñîåäèíåíèè ñ ñåðâåðîì HTTP. Ýòî âêëþ÷àåòñÿ äàííûì ïàðàìåòðîì - ïðîñòî óêàæèòå Wget ïóòü ê cookies.txt. Ðàçíûå áðàóçåðû õðàíÿò cookie â ðàçíûõ ïàïêàõ: </P>

Netscape 4.x.
Ôàéë íàõîäèòñÿ â ~/.netscape/cookies.txt.
Mozilla è Netscape 6.x.
Mozilla õðàíèò cookies â cookies.txt, ðàñïîëîæåííîì ãäå-òî â ~/.mozilla, â ïàïêå âàøåãî ïðîôèëÿ. Ïîëíûé ïóòü îáû÷íî çàêàí÷èâàåòñÿ ÷åì-òî âðîäå

~/.mozilla/default/some-weird-string/cookies.txt.

Internet Explorer.
×òîáû ýêñïîðòèðîâàòü cookie äëÿ Wget, âûáåðèòå "Ôàéë", "Èìïîðò è Ýêñïîðò", â ìàñòåðå âûáåðèòå "Ýêñïîðò ôàéëîâ cookie". Ïðîâåðåíî â Internet Explorer 5; âîçìîæíî íå áóäåò ðàáîòàòü â ðàííèõ âåðñèÿõ.
Äðóãèå îáîçðåâàòåëè.

Ïàðàìåòð --load-cookies áóäåò ðàáîòàòü ñ cookie â ôîðìàòå Netscape, êîòîðûé ïîääåðæèâàåòñÿ Wget.

<P> Åñëè âû íå ìîæåòå èñïîëüçîâàòü ïàðàìåòð --load-cookies, òî âñå ðàâíî åñòü âûõîä. Åñëè âàø îáîçðåâàòåëü ïîääåðæèâàåò Çàïèøèòå èìÿ è çíà÷åíèå cookie è âðó÷íóþ óêàæèòå Wget îòïðàâêó ýòèõ cookie: </P>

# wget --cookies=off --header "Cookie: I<name>=I<value>"

--save-cookies file
Ñîõðàíèòü cookie èç file â êîíöå ñåññèè. Óñòàðåâøèå cookie íå ñîõðàíÿþòñÿ.
--ignore-length
Íåêîòîðûå ñåðâåðû HTTP (òî÷íåå, ñêðèïòû CGI) îòïðàâëÿþò çàãîëîâêè "Content-Length", êîòîðûå óêàçûâàþò Wget, ÷òî çàãðóæåíî åùå íå âñå. È Wget çàãðóæàåò îäèí äîêóìåíò íåñêîëüêî ðàç.

<P> Ñ ýòèì ïàðàìåòðîì, Wget áóäåò èãíîðèðîâàòü çàãîëîâêè "Content-Length".

--header=additional-header
Îïðåäåëÿåò additional-header, îòïðàâëÿåìûé ñåðâåðó HTTP. Îí äîëæåí ñîäåðæàòü : è ñèìâîëû ïîñëå íåãî. </P> <P> Âû ìîæåòå îïðåäåëèòü íåñêîëüêî äîïîëíèòåëüíûõ çàãîëîâêîâ ÷åðåç èñïîëüçîâàíèå --header íåñêîëüêî ðàç. </P>

# wget --header='Accept-Charset: iso-8859-2' \
             --header='Accept-Language: hr'        \
               <A HREF="http://fly.srk.fer.hr/">http://fly.srk.fer.hr/</A>

Óêàçàíèå ïóñòîé ñòðîêè â çíà÷åíèè çàãîëîâêà î÷èñòèò âñå îïðåäåëåííûå ïîëüçîâàòåëåì äî ýòîãî çàãîëîâêè.

--proxy-user=user
--proxy-passwd=password

Îïðåäåëÿåò èìÿ ïîëüçîâàòåëÿ user è ïàðîëü password äëÿ àâòîðèçàöèè ñåðâåðå ïðîêñè. Áóäåò èñïîëüçîâàí òèï àâòîðèçàöèè "basic".

--referer=url
Äîáàâëÿåò çàãîëîâîê `Referer: url' â çàïðîñ HTTP. Èñïîëüçóåòñÿ ïðè çàãðóçêå ñòðàíèö, êîòîðûå ïåðåäàþòñÿ ïðàâèëüíî òîëüêî åñëè ñåðâåð çíàåò, ñ êàêîé ñòðàíèöû âû ïðèøëè.
-s
--save-headers

Ñîõðàíÿòü çàãîëîâêè, îòïðàâëÿåìûå ñåðâåðàì HTTP.

-U agent-string
--user-agent=agent-string

Èäåíòèôèöèðîâàòüñÿ, êàê agent-string ïðè çàïðîñå íà HTTP ñåðâåð.

<P> Ïðîòîêîë HTTP ïîçâîëÿåò îïðåäåëÿòü ñåáÿ èñïîëüçîâàíèåì çàãîëîâêà àãåíòà. Wget ïî óìîë÷àíèþ èäåíòèôèöèðóåòñÿ, êàê Wget/version, ãäå version - ýòî âåðñèÿ Wget. </P><P> Íåêîòîðûå ñåðâåðû âûäàþò òðåáóåìóþ èíôîðìàöèþ òîëüêî äëÿ îáîçðåâàòåëåé, èäåíòèôèöèðóþùèõñÿ êàê "Mozilla" èëè Microsoft "Internet Explorer". Ýòîò ïàðàìåòð ïîçâîëÿåò îáìàíóòü òàêèå ñåðâåðû.</P>

Ïàðàìåòðû FTP

-nr
--dont-remove-listing

Íå óäàëÿòü âðåìåííûå ôàéëû .listing, ãåíåðèðóåìûå ïðè çàãðóçêå ïî FTP. Ýòè ôàéëû ñîäåðæàò èíôîðìàöèþ î ïàïêàõ ñåðâåðîâ FTP. Íåóäàëåíèå ïîìîæåò âàì áûñòðî îïðåäåëèòü îáíîâëåíèå ïàïîê ñåðâåðà (ò.å. îïðåäåëÿòü., ÷òî âàøå çåðêàëî ÿâëÿåòñÿ òàêîâûì).

<P> Åñëè âû íå óäàëÿåòå .listing, òî ïîìíèòå î ñâîåé áåçîïàñíîñòè! Íàïðèìåð, ñ òàêèì èìåíåì ìîæíî ñîçäàòü ñèìâîëè÷åñêóþ ññûëêó íà /etc/passwd èëè ÷òî-òî åùå.</P>

-g on/off
--glob=on/off

<P>Âêëþ÷àåò èëè âûêëþ÷àåò èñïîëüçîâàíèå ñïåöèàëüíûõ ñèìâîëîâ (ìàñêè) ïî ïðîòîêîëó FTP. Ýòî ìîæåò áûòü *, ?, [ è ]. Íàïðèìåð: </P>

# wget [ftp://gnjilux.srk.fer.hr/*.msg ftp://gnjilux.srk.fer.hr/*.msg]

Ïî óìîë÷àíèþ èñïîëüçîâàíèå ñèìâîëîâ ìàñêè ðàçðåøåíî, åñëè URL ñîäåðæèò òàêèå ñèìâîëû. <P> Âû ìîæåòå òàêæå âçÿòü URL â êàâû÷êè. Ýòî ñðàáîòàåò òîëüêî íà ñåðâåðàõ Unix FTP (è ýìóëèðóþùèõ âûõîä Unix "ls").</P>

--passive-ftp
Âêëþ÷àåò ïàññèâíûé ðåæèì FTP, êîãäà ñîåäèíåíèå èíèöèèðóåòñÿ êëèåíòîì. Èñïîëüçóåòñÿ ïðè íàëè÷èè firewall.
--retr-symlinks
Ïðè ðåêóðñèâíîé çàãðóçêå ïàïîê FTP ôàéëû, íà êîòîðûå óêàçûâàþò ñèìâîëè÷åñêèå ññûëêè, íå çàãðóæàþòñÿ. Äàííûé ïàðàìåòð îòêëþ÷àåò ýòî. <P> Ïàðàìåòð --retr-symlinks ðàáîòàåò ñåé÷àñ òîëüêî äëÿ ôàéëîâ, íå äëÿ ïàïîê. </P> Ïîìíèòå, ÷òî ýòîò ïàðàìåòð íå ðàáîòàåò ïðè çàãðóçêå îäèíî÷íîãî ôàéëà.

Ïàðàìåòðû ðåêóðñèâíîé çàãðóçêè

-r
--recursive

Âêëþ÷èòü ðåêóðñèâíóþ çàãðóçêó.

-l depth
--level=depth

<P>Ìàêñèìàëüíàÿ ãëóáèíà ðåêóðñèâíîé çàãðóçêè depth. Ïî óìîë÷àíèþ åå çíà÷åíèå ðàâíî 5.

--delete-after
Óäàëÿòü êàæäóþ ñòðàíèöó (ëîêàëüíî) ïîñëå åå çàãðóçêè. Èñïîëüçóåòñÿ äëÿ ñîõðàíåíèÿ íîâûõ âåðñèé ÷àñòî çàïðàøèâàåìûõ ñòðàíèö íà ïðîêñè. Íàïðèìåð: </P>

# wget -r -nd --delete-after <A HREF="http://whatever.com/~popular/page/">http://whatever.com/~popular/page/</A>

Ïàðàìåòð -r âêëþ÷àåò çàãðóçêó ïî óìîë÷àíèþ, ïàðàìåòð -nd îòêëþ÷àåò ñîçäàíèå ïàïîê. <P> Ïðè óêàçàííîì ïàðàìåòðå --delete-after áóäåò èãíîðèðîâàòüñÿ ïàðàìåòð --convert-links.

-k
--convert-links

Ïîñëå çàâåðøåíèÿ çàãðóçêè êîíâåðòèðîâàòü ññûëêè â äîêóìåíòå äëÿ ïðîñìîòðà â àâòîíîìíîì ðåæèìå. Ýòî êàñàåòñÿ íå òîëüêî âèäèìûõ ññûëîê íà äðóãèå äîêóìåíòû, à ññûëîê íà âñå âíåøíèå ëîêàëüíûå ôàéëû. </P> <P>Êàæäàÿ ññûëêà èçìåíÿåòñÿ îäíèì èç äâóõ ñïîñîáîâ:

*
Ññûëêè íà ôàéëû, çàãðóæåííûå Wget èçìåíÿþòñÿ íà ñîîòâåòñòâóþùèå îòíîñèòåëüíûå ññûëêè. </P> <P> Íàïðèìåð: åñëè çàãðóæåííûé ôàéë /foo/doc.html, òî ññûëêà íà òàêæå çàãðóæåííûé ôàéë /bar/img.gif áóäåò âûãëÿäåòü, êàê ../bar/img.gif. Ýòîò ñïîñîá ðàáîòàåò, åñëè åñòü âèäèìîå ñîîòíîøåíèå ìåæäó ïàïêàìè îäíîãî è äðóãîãî ôàéëà. </P>
*
Ññûëêè íà ôàéëû, íå çàãðóæåííûå Wget áóäóò èçìåíåíû íà àáñîëþòíûå àäðåñà ýòèõ ôàéëîâ íà óäàëåííîì ñåðâåðå.

<P> Íàïðèìåð: åñëè çàãðóæåííûé ôàéë /foo/doc.html ñîäåðæèò ññûëêó íà /bar/img.gif (èëè íà ../bar/img.gif), òî ññûëêà â ôàéëå doc.html èçìåíèòñÿ íà <A HREF="http://host/bar/img.gif">http://host/bar/img.gif</A>. </P>

<P> Áëàãîäàðÿ ýòîìó, âîçìîæåí àâòîíîìíûé ïðîñìîòð ñàéòà è ôàéëîâ: åñëè çàãðóæåí ôàéë, íà êîòîðûé åñòü ññûëêà, òî ññûëêà áóäåò óêàçûâàòü íà íåãî, åñëè íåò - òî ññûëêà áóäåò óêàçûâàòü íà åãî àäðåñ â èíòåðíåò (åñëè òàêîé ñóùåñòâóåò). Ïðè êîíâåðòèðîâàíèè èñïîëüçóþòñÿ îòíîñèòåëüíûå ññûëêè, çíà÷èò âû ñìîæåòå ïåðåíîñèòü çàãðóæåííûé ñàéò â äðóãóþ ïàïêó, íå ìåíÿÿ åãî ñòðóêòóðó. <P> Òîëüêî ïîñëå çàâåðøåíèÿ çàãðóçêè Wget çíàåò, êàêèå ôàéëû áûëè çàãðóæåíû. Ñëåäîâàòåëüíî, ïðè ïàðàìåòðå -k êîíâåðòàöèÿ ïðîèçîéäåò òîëüêî ïî çàâåðøåíèè çàãðóçêè.
-K
--backup-converted
Êîíâåðòèðîâàòü ññûëêè îáðàòíî - óáèðàòü ðàñøèðåíèå .orig. Èçìåíÿåò ïîâåäåíèå îïöèè -N.
-m
--mirror

Âêëþ÷èòü ïàðàìåòðû äëÿ çåðêàëüíîãî õðàíåíèÿ ñàéòîâ. Ýòîò ïàðàìåòð ðàâåí íåñêîëüêèì ïàðàìåòðàì: -r -N -l inf -nr. Äëÿ íåïðèõîòëèâîãî õðàíåíèÿ çåðêàëüíûõ êîïèé ñàéòîâ âû ìîæåòå èñïîëüçîâàòü äàííûé ïàðàìåòð.

-p
--page-requisites

<P>Çàãðóæàòü âñå ôàéëû, êîòîðûå íóæíû äëÿ îòîáðàæåíèÿ ñòðàíèö HTML. Íàïðèìåð: ðèñóíêè, çâóê, êàñêàäíûå ñòèëè. </P><P> Ïî óìîë÷àíèþ òàêèå ôàéëû íå çàãðóæàþòñÿ. Ïàðàìåòðû -r è -l, óêàçàííûå âìåñòå ìîãóò ïîìî÷ü, íî ò.ê. Wget íå ðàçëè÷àåò âíåøíèå è âíóòðåííèå äîêóìåíòû, òî íåò ãàðàíòèè, ÷òî çàãðóçèòñÿ âñå òðåáóåìîå. </P><P> Íàïðèìåð, 1.html ñîäåðæèò òåã "<IMG>", ñî ññûëêîé íà 1.gif, è òåã "<A>", ññûëàþùèéñÿ íà âíåøíèé äîêóìåíò 2.html. Ñòðàíèöà 2.html àíàëîãè÷íà, íî åå ðèñóíîê - 2.gif è ññûëàåòñÿ îíà íà 3.html. Ñêàæåì, ýòî ïðîäîëæàåòñÿ äî îïðåäåëåííîãî ÷èñëà. </P><P> Åñëè áóäåò äàíà êîìàíäà: <P>

# wget -r -l 2 [http://I]<site>/1.html

òî 1.html, 1.gif, 2.html, 2.gif è 3.html çàãðóçÿòñÿ. Êàê âèäèì, 3.html áåç 3.gif, ò.ê. Wget ïðîñòî ñ÷èòàåò ÷èñëî ïðûæêîâ, ïî êîòîðûì îí ïåðåøåë, äîõîäèò äî 2 è îñòàíàâëèâàåòñÿ. À ïðè ïàðàìåòðàõ: <P>

# wget -r -l 2 -p [http://I">http://I]<site>/1.html

Âñå ôàéëû è ðèñóíîê 3.gif ñòðàíèöû 3.html çàãðóçÿòñÿ. Àíàëîãè÷íî <P>

# wget -r -l 1 -p <A HREF="http://I">http://I</A><site>/1.html

ïðèâåäåò ê çàãðóçêå 1.html, 1.gif, 2.html è 2.gif. ×òîáû çàãðóçèòü îäíó óêàçàííóþ ñòðàíèöó HTML ñî âñåìè åå ýëåìåíòàìè, ïðîñòî íå óêàçûâàéòå -r è -l: <P>

# wget -p <A HREF="http://I">http://I</A><site>/1.html

Ïðè ýòîì Wget áóäåò ñåáÿ âåñòè, êàê ïðè ïàðàìåòðå -r, íî áóäóò çàãðóæåíû ñòðàíèöà è åå âñïîìîãàòåëüíûå ôàéëû. Åñëè âû õîòèòå, ÷òîáû âñïîìîãàòåëüíûå ôàéëû íà äðóãèõ ñåðâåðàõ (ò.å. ÷åðåç àáñîëþòíûå ññûëêè) áûëè çàãðóæåíû, èñïîëüçóéòå: <P>

# wget -E -H -k -K -p <A HREF="http://I">http://I</A><site>/I<document>

È â çàâåðøåíèè, íóæíî ñêàçàòü, ÷òî äëÿ Wget âíåøíÿÿ ññûëêà - ýòî URL, óêàçàííûé â òåãàõ "<A>",

"<AREA>" è "<LINK>", êðîìå "<LINK REL="stylesheet">".


Ïàðàìåòðû çàïðåòà/ðàçðåøåíèÿ ðåêóðñèâíîé çàãðóçêè

-A acclist --accept acclist
-R rejlist --reject rejlist

Ñïèñîê èìåí ôàéëîâ, ðàçäåëåííûõ çàïÿòûìè, êîòîðûå ñëåäóåò èëè íå ñëåäóåò çàãðóæàòü. Ðàçðåøàåòñÿ çàäàíèå èìåí ôàéëîâ ïî ìàñêå.

-D domain-list
--domains=domain-list

Ñïèñîê äîìåíîâ domain-list, ñ êîòîðûõ ðàçðåøåíî çàãðóæàòü ôàéëû. Ðàçäåëÿåòñÿ çàïÿòûìè. Ýòîò ïàðàìåòð íå âêëþ÷àåò -H.

--exclude-domains domain-list
Ñïèñîê äîìåíîâ, ñ êîòîðûõ íå ðàçðåøåíî çàãðóæàòü ôàéëû
--follow-ftp
Ñëåäîâàòü ïî ññûëêàì FTP ñ HTML ñòðàíèö. Èíà÷å, ññûëêè íà ôàéëû ïî ïðîòîêîëó FTP èãíîðèðóþòñÿ.

--follow-tags=list
Wget èìååò âñòðîåííóþ òàáëèöó òåãîâ HTML, â êîòîðûõ îí èùåò ññûëêè íà äðóãèå ôàéëû. Âû ìîæåòå óêàçàòü äîïîëíèòåëüíûå òåãè â ðàçäåëåííîì çàïÿòûìè ñïèñêå list â ýòîì ïàðàìåòðå.
-G list
<A NAME="ixAEQ"></A>

--ignore-tags=list

Îáðàòíî --follow-tags. Äëÿ ïðîïóñêà òåãîâ HTML ïðè ðåêóðñèâíîé çàãðóçêå, óêàæèòå èõ â ðàçäåëåííîì çàïÿòûìè ñïèñêå list. <P> Ðàíüøå ïàðàìåòð -G áûë ëó÷øèì äëÿ çàãðóçêè îòäåëüíûõ ñòðàíèö ñ èõ âñïîìîãàòåëüíûìè ôàéëàìè. Âû ìîæåòå ïîñìîòðåòü, êàê ýòî áûëî, óêàçàâ êîìàíäó <P>

# wget -Ga,area -H -k -K -r <A HREF="http://I">http://I</A><site>/I<document>

Íî òåïåðü ëó÷øèì ïàðàìåòðîì äëÿ çàãðóçêè îäíîé ñòðàíèöû ïîëíîñòüþ ñ÷èòàåòñÿ --page-requisites.

-H
--span-hosts
Ðàçðåøàåò ïîñåùàòü ëþáûå ñåðâåðà, íà êîòîðûå åñòü ññûëêà.
-L
Ñëåäîâàòü òîëüêî ïî îòíîñèòåëüíûì ññûëêàì. Ïðè ýòîì ïàðàìåòðå ôàéëû ñ äðóãèõ ñåðâåðîâ òî÷íî íå áóäóò çàãðóæàòüñÿ.
-I list
--include-directories=list
Ñïèñîê ïàïîê, ðàçäåëåííûõ çàïÿòûìè, èç êîòîðûõ ðàçðåøåíî çàãðóæàòü ôàéëû. Ýëåìåíòû ñïèñêà list ìîãóò ñîäåðæàòü ñèìâîëû ìàñîê.
-X list
--exclude-directories=list

Ñïèñîê ïàïîê, ðàçäåëåííûõ çàïÿòûìè, èñêëþ÷àåìûõ äëÿ çàãðóçêè (ñì. Îãðàíè÷åíèå ïî ïàïêàì). Ýëåìåíòû ñïèñêà list ìîãóò ñîäåðæàòü ñèìâîëû ìàñîê.

-np
--no-parent

Íå ïîäíèìàòüñÿ âûøå íà÷àëüíîãî àäðåñà ïðè ðåêóðñèâíîé çàãðóçêå.


ÏÐÈÌÅÐÛ ÈÑÏÎËÜÇÎÂÀÍÈß

Ïðèìåðû ðàçäåëåíû íà òðè êàòåãîðèè ñîãëàñíî èõ ñëîæíîñòè.

Ïðîñòî èñïîëüçîâàíèå

*
Åñëè âàì íóæíî çàãðóçèòü URL, òî ââåäèòå: <P>

# wget <A HREF="http://fly.srk.fer.hr/">http://fly.srk.fer.hr/</A>

*
Íî ÷òî æå áóäåò, åñëè ñîåäèíåíèå ìåäëåííîå, à ôàéë äëèííûé? Åñòü âîçìîæíîñòü îáðûâà ñâÿçè ïåðåä çàâåðøåíèåì çàãðóçêè.  ýòîì ñëó÷àå Wget áóäåò ïðîäîëæàòü ïîïûòêè íîâîãî ñîåäèíåíèÿ, ïîêà íå êîí÷èòñÿ ÷èñëî ïîïûòîê (ïî óìîë÷àíèþ 20). Ìîæíî èçìåíèòü ýòî ÷èñëî, íàïðèìåð äî 45: <P>

# wget --tries=45 <A HREF="http://fly.srk.fer.hr/jpg/flyweb.jpg">http://fly.srk.fer.hr/jpg/flyweb.jpg</A>

*
Òåïåðü îñòàâèì Wget ðàáîòàòü â ôîíîâîì ðåæèìå, à åãî ñîîáùåíèÿ áóäåì çàïèñûâàòü â æóðíàë log. Äîëãî íàáèðàòü --tries, òàê ÷òî èñïîëüçóåì -t. <P>

# wget -t 45 -o log <A HREF="http://fly.srk.fer.hr/jpg/flyweb.jpg">http://fly.srk.fer.hr/jpg/flyweb.jpg</A> &

Ñèìâîë àìïåðñàíäà â êîíöå óêàçûâàåò êîìàíäíîìó èíòåðïðåòàòîðó ïðîäîëæàòü ðàáîòó, íå äîæèäàÿñü çàâåðøåíèÿ ðàáîòû Wget. ×òîáû ïðîãðàììà äåëàëà ïîâòîðû áåñêîíå÷íî - èñïîëüçóéòå -t inf.

*

Èñïîëüçîâàòü FTP òàêæå î÷åíü ïðîñòî. Wget áåðåò íà ñåáÿ âñå çàáîòû ïî àâòîðèçàöèè. <P>

# wget <A HREF="ftp://gnjilux.srk.fer.hr/welcome.msg">ftp://gnjilux.srk.fer.hr/welcome.msg</A>

*
Åñëè âû óêàæèòå àäðåñ ïàïêè, òî Wget çàãðóçèò ëèñòèíã ýòîé ïàïêè (ò.å. ôàéëû è ïîäêàòàëîãè, ñîäåðæàùèåñÿ â íåé) è ñêîíâåðòèðóåò åãî â ôîðìàò HTML. Íàïðèìåð: <P>

# wget <A HREF="ftp://prep.ai.mit.edu/pub/gnu/">ftp://prep.ai.mit.edu/pub/gnu/</A>
        links index.html


Ðàñøèðåííîå èñïîëüçîâàíèå

*
Åñëè ó Âàñ åñòü ôàéë ñ URL, êîòîðûå âû õîòèòå çàãðóçèòü, òî èñïîëüçóéòå ïàðàìåòð -i: <P>

# wget -i I<file>

÷Åñëè âû óêàæåòå - âìåñòî èìåíè ôàéëà, òî URL áóäóò ÷èòàòüñÿ èç ñòàíäàðòíîãî ââîäà (stdin).

*

Ñîçäàòü ïÿòèóðîâíåâóþ êîïèþ ñàéòà GNU ñî ñòðóêòóðîé ïàïîê îðèãèíàëà, ñ îäíîé ïîïûòêîé çàãðóçêè, ñîõðàíèòü ñîîáùåíèÿ â gnulog:

<P>

# wget -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o gnulog

*
Êàê è â ïðèìåðå âûøå, íî ñ êîíâåðòèðîâàíèåì ññûëêè â ôàéëàõ HTML â ëîêàëüíûå, äëÿ ïîñëåäóþùåãî àâòîíîìíîãî ïðîñìîòðà: <P>

# wget --convert-links -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o gnulog

*
Çàãðóçèòü îäíó ñòðàíèöó HTML è âñå ôàéëû, òðåáóåìûå äëÿ îòîáðàæåíèÿ ïîñëåäíåé (íàïð. ðèñóíêè, ôàéëû êàñêàäíûõ ñòèëåé è ò. ä.). Òàêæå ñêîíâåðòèðîâàòü âñå ññûëêè íà ýòè ôàéëû: <P>

# wget -p --convert-links <A HREF="http://www.server.com/dir/page.html">http://www.server.com/dir/page.html</A>

Ñòðàíèöà HTML áóäåò ñîõðàíåíà â <A HREF="http://www.server.com">www.server.com</A>/dir/page.html è ðèñóíêè, êàñêàäíûå ñòèëè è ïðî÷åå áóäåò ñîõðàíåíî â ïàïêå <A HREF="http://www.server.com">www.server.com</A>/, êðîìå ñëó÷àÿ, êîãäà ôàéëû áóäóò çàãðóæàòüñÿ ñ äðóãèõ ñåðâåðîâ.

*

Êàê è â ïðèìåðå âûøå, íî áåç ïàïêè <A HREF="http://www.server.com">www.server.com</A>/. Òàêæå âñå ôàéëû áóäóò ñîõðàíåíû â ïîäïàïêàõ download/. <P>

# wget -p --convert-links -nH -nd -Pdownload \
             <A HREF="http://www.server.com/dir/page.html">http://www.server.com/dir/page.html</A>

*
Çàãðóçèòü index.html ñ <A HREF="http://www.lycos.com">www.lycos.com</A>, îòîáðàæàÿ çàãîëîâêè ñåðâåðà: <P>

# wget -S <A HREF="http://www.lycos.com/">http://www.lycos.com/</A>

*
Ñîõðàíèòü çàãîëîâêè â ôàéë äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ. <P>

# wget -s <A HREF="http://www.lycos.com/">http://www.lycos.com/</A>
        more index.html

*
Çàãðóçèòü äâà âûñøèõ óðîâíÿ wuarchive.wustl.edu â /tmp. <P>

# wget -r -l2 -P/tmp <A HREF="ftp://wuarchive.wustl.edu/">ftp://wuarchive.wustl.edu/</A>

*
Çàãðóçèòü ôàéëû GIF ïàïêè íà HTTP ñåðâåðå. Êîìàíäà wget <A HREF="http://www.server.com/dir/*.gif">http://www.server.com/dir/*.gif</A> íå áóäåò ðàáîòàòü, òàê êàê ìàñêèðîâî÷íûå ñèìâîëû íå ïîääåðæèâàþòñÿ ïðè çàãðóçêå ïî ïðîòîêîëó HTTP. Èñïîëüçóéòå: <P>

# wget -r -l1 --no-parent -A.gif <A HREF="http://www.server.com/dir/">http://www.server.com/dir/</A>

-r -l1 âêëþ÷àåò ðåêóðñèâíóþ çàãðóçêó ñ ìàêñèìàëüíîé ãëóáèíîé 1.

--no-parent âûêëþ÷àåò ñëåäîâàíèå ïî ññûëêàì â ðîäèòåëüñêóþ ïàïêó, èìåþùóþ âåðõíèé óðîâåíü, -A.gif ðàçðåøàåò çàãðóæàòü òîëüêî ôàéëû ñ ðàñøèðåíèåì .GIF. -A ``*.gif òàêæå áóäåò ðàáîòàòü.

*
Ïðåäïîëîæèì, ÷òî âî âðåìÿ ðåêóðñèâíîé çàãðóçêè âàì íóæíî áûëî ñðî÷íî âûêëþ÷èòü/ïåðåçàãðóçèòü êîìïüþòåð. ×òîáû íå çàãðóæàòü óæå èìåþùèåñÿ ôàéëû, èñïîëüçóéòå: <P>

# wget -nc -r <A HREF="http://www.gnu.org/">http://www.gnu.org/</A>

*
Åñëè âû õîòèòå óêàçàòü èìÿ ïîëüçîâàòåëÿ è ïàðîëü äëÿ ñåðâåðà HTTP èëè FTP, èñïîëüçóéòå ñîîòâåòñòâóþùèé ñèíòàêñèñ URL: <P>

# wget <A HREF="ftp://hniksic:mypassword@unix.server.com/.emacs">ftp://hniksic:mypassword@unix.server.com/.emacs</A>

*
Âû õîòèòå, ÷òîáû çàãðóæàåìûå äîêóìåíòû øëè â ñòàíäàðòíûé âûâîä, à íå â ôàéëû? <P>

# wget -O - <A HREF="http://jagor.srce.hr/">http://jagor.srce.hr/</A> <A HREF="http://www.srce.hr/">http://www.srce.hr/</A>

Åñëè âû õîòèòå óñòðîèòü êîíâåéåð è çàãðóçèòü âñå ñàéòû, ññûëêè íà êîòîðûå óêàçàíû íà îäíîé ñòðàíèöå: <P>

# wget -O - <A HREF="http://cool.list.com/">http://cool.list.com/</A> | wget --force-html -i -


Ïðîôåññèîíàëüíîå èñïîëüçîâàíèå

*
Äëÿ õðàíåíèå çåðêàëà ñòðàíèöû (èëè ïàïêè FTP), òî èñïîëüçóéòå --mirror (-m), ÷òî çàìåíÿåò -r -l inf -N. Âû ìîæåòå äîáàâèòü Wget â crontab ñ çàïðîñîì íà ïðîâåðêó îáíîâëåíèé êàæäîå âîñêðåñåíüå: <P>

# crontab
        0 0 * * 0 wget --mirror <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog

*
Âû òàêæå õîòèòå, ÷òîáû ññûëêè êîíâåðòèðîâàëèñü â ëîêàëüíûå. Íî ïîñëå ïðî÷òåíèÿ ýòîãî ðóêîâîäñòâà, âû çíàåòå, ÷òî ïðè ýòîì íå áóäåò ðàáîòàòü ñðàâíåíèå ïî âðåìåíè. Óêàæèòå Wget îñòàâëÿòü ðåçåðâíûå êîïèè HTML ôàéëîâ ïåðåä êîíâåðòàöèåé. Êîìàíäà: <P>

# wget --mirror --convert-links --backup-converted  \
             <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog

*
À åñëè íå ðàáîòàåò ëîêàëüíûé ïðîñìîòð ôàéëîâ HTML ñ ðàñøèðåíèåì, îòëè÷íûì îò .html, íàïðèìåð index.cgi, òî íóæíî ïåðåäàòü êîìàíäó íà ïåðåèìåíîâàíèå âñåõ òàêèõ ôàéëîâ (content-type = text/html) â èìÿ.html. <P>

# wget --mirror --convert-links --backup-converted \
             --html-extension -o /home/me/weeklog        \
             <A HREF="http://www.gnu.org/">http://www.gnu.org/</A>

Ñ êðàòêèìè àíàëîãàìè êîìàíä: <P>

# wget -m -k -K -E <A HREF="http://www.gnu.org/">http://www.gnu.org/</A> -o /home/me/weeklog

ÔÀÉËÛ

/usr/local/etc/wgetrc
Ïî óìîë÷àíèþ ýòî ðàñïîëîæåíèå ãëîáàëüíîãî ôàéëà íàñòðîåê.
.wgetrc
Ôàéë íàñòðîåê ïîëüçîâàòåëÿ.


ÍÀÉÄÅÍÍÛÅ ÎØÈÁÊÈ

Âû ìîæåòå îòïðàâëÿòü îò÷åòû îá îøèáêàõ â GNU Wget íà àäðåñ <"<A HREF="mailto:bug-wget@gnu.org">bug-wget@gnu.org</A>"> (íà àíãëèéñêîì). <P> Ïåðåä îòïðàâêîé:

1.
Óáåäèòåñü, ÷òî ïîâåäåíèå ïðîãðàììû äåéñòâèòåëüíî îøèáî÷íî. Åñëè Wget "âûëåòàåò", òî ýòî îøèáêà. Åñëè ïîâåäåíèå Wget íå ñîîòâåòñòâóåò äîêóìåíòàöèè, òî ýòî îøèáêà. Åñëè âñå ðàáîòàåò ñòðàííî, íî âû íå óâåðåíû, êàê îíî äîëæíî ðàáîòàòü íà ñàìîì äåëå, òî ýòî òîæå ìîæåò áûòü îøèáêîé.

2.
Ïîïûòàéòåñü ïîâòîðèòü ñèòóàöèþ ñ âûäà÷åé îøèáêè çà ìèíèìàëüíîå êîëè÷åñòâî äåéñòâèé. <P> Íå ñïåøèòå îòïðàâëÿòü .wgetrc, ïîïðîáóéòå ïðîäåëàòü âñå äåéñòâèÿ, ïðèâåäøèå ê îøèáêå ñ äðóãèì ôàéëîì íàñòðîåê (èëè âîîáùå áåç íåãî).
3.
Çàïóñòèòå Wget ñ ïàðàìåòðîì -d è îòïðàâüòå æóðíàë (èëè åãî ÷àñòè). Íàìíîãî ëåã÷å îòûñêèâàòü îøèáêè ïðè íàëè÷èè òàêèõ æóðíàëîâ.
4.
Åñëè Wget âûäàë îøèáêó, òî ïîïûòàéòåñü çàïóñòèòü åãî â îòëàä÷èêå, íàïðèìåð "gdb `which wget` core" è ââåäèòå "where" äëÿ ïîëó÷åíèÿ îáðàòíîé òðàññèðîâêè.

ÑÌ. ÒÀÊÆÅ

GNU Info äëÿ wget.

ÀÂÒÎÐÛ

Hrvoje Niksic <<A HREF="mailto:hniksic@arsdigita.com">hniksic@arsdigita.com</A>>.

ÏÅÐÅÂÎÄ

Í. Øàôîðîñòîâ <<A HREF="mailto:admin@program.net.ua">admin@program.net.ua</A>>

ÀÂÒÎÐÑÊÈÅ ÏÐÀÂÀ

Copyright (c) 1996, 1997, 1998, 2000, 2001 Free Software Foundation, Inc. <P>

Ýòî ñâîáîäíîå ïðîãðàììíîå îáåñïå÷åíèå; óñëîâèÿ êîïèðîâàíèÿ èùèòå â èñõîäíûõ òåêñòàõ. ÍÅ ñóùåñòâóåò íèêàêèõ ãàðàíòèé; ïðîãðàììà ÍÅ ïðåäíàçíà÷åíà äëÿ ÏÐÎÄÀÆ.


Ãëàâíàÿ > Ïðîãðàììû