Thank you for reading this post, don't forget to subscribe!
Скопируйте веб-сайт для просмотра в автономном режиме с помощью копира сайта HTTrack.
Установите HTTrack.
1 |
$ yum install -y httrack |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
Reading package lists... Done Building dependency tree Reading state information... Done The following additional packages will be installed: libhttrack2 Suggested packages: webhttrack httrack-doc The following NEW packages will be installed: httrack libhttrack2 0 upgraded, 2 newly installed, 0 to remove and 0 not upgraded. Need to get 302 kB of archives. After this operation, 798 kB of additional disk space will be used. Get:1 http://ftp.task.gda.pl/debian stretch/main amd64 libhttrack2 amd64 3.48.24-1+b2 [263 kB] Get:2 http://ftp.task.gda.pl/debian stretch/main amd64 httrack amd64 3.48.24-1+b2 [39.8 kB] Fetched 302 kB in 0s (609 kB/s) Selecting previously unselected package libhttrack2. (Reading database ... 27239 files and directories currently installed.) Preparing to unpack .../libhttrack2_3.48.24-1+b2_amd64.deb ... Unpacking libhttrack2 (3.48.24-1+b2) ... Selecting previously unselected package httrack. Preparing to unpack .../httrack_3.48.24-1+b2_amd64.deb ... Unpacking httrack (3.48.24-1+b2) ... Processing triggers for libc-bin (2.24-11+deb9u3) ... Processing triggers for man-db (2.7.6.1-2) ... Setting up libhttrack2 (3.48.24-1+b2) ... Setting up httrack (3.48.24-1+b2) ... Processing triggers for libc-bin (2.24-11+deb9u3) ... |
Я буду использовать версию 3.48.
1 2 |
$ httrack --version HTTrack version 3.48-24 |
Загрузите отдельную статью в каталог article-x, используя параметр near, чтобы также получить ссылки на файлы внутри загруженной страницы.
1 2 |
$ httrack --mirror --ext-depth=0 --depth=1 --near --stay-on-same-address --keep-links=0 --path article-x --quiet https://example.com/article-x/ |
Зеркально отразите весь сайт в каталоге example.org, используя фильтры для ограничения загружаемых файлов.
1 |
$ httrack --mirror --robots=0 --stay-on-same-domain --keep-links=0 --path example.org --quiet https://example.org/ -* +example.org/* |
Продолжить загрузку, расположенную в каталоге example.org.
1 |
$ httrack --continue --path example.org |
Обновление веб-сайта, расположенного в каталоге article-x.
1 |
$ httrack --update --path article-x |
Зеркально отразите весь сайт в каталоге example.net, используя фильтры для ограничения загружаемых файлов, используя 8 одновременных подключений, ограничение скорости передачи 400 КБ / с и максимум 4 подключения в секунду.
1 |
$ httrack --mirror --robots=0 --stay-on-same-domain --keep-links=0 --path example.net --max-rate=409600 --connection-per-second=4 --sockets=8 --quiet https://example.net/ -* +example.org/* |
Зеркально отразите отдельную статью в каталоге article-y, используя Mozilla / 5.0 (X11; Ubuntu; Linux x86_64; rv: 63.0). Пользовательский агент Gecko / 20100101 Firefox / 63.0, https://example.com/list/ referer и предпочитаемый язык pl.
1 |
$ httrack --mirror --ext-depth=0 --depth=1 --near --stay-on-same-address --keep-links=0 --user-agent "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:63.0) Gecko/20100101 Firefox/63.0" --referer "https://example.com/list/" --language "pl" --path article-y --quiet https://example.net/article-y/ |