Возникла необходимость создания локального репозитория для разработчиков, которым необходимы пакеты с сайта http://repo1.maven.org/maven2/, но данный сайт применяет защиту от скачивания его репозитория. Я перепробовал уже несколько методов использования wget, в конечном итоге либо получаю ошибку 403 Forbidden, либо скачивается только индексная страница:
Вобщем я эту сволочь достебал (простите). Сайт проверяет @#$ную кучу заголовков, прежде чем отдаёт контент.
Чтобы всё не писать в командной строке, нафигачил ~/.wgetrc следующего содержания:
Из корня долго попробовать, но по факту дерево папок выдирается (пока пустое), можно скрипт в принципе написать что бы подпапки вставлял в конец ссылки и тогда вопрос в принципе будет решен полагаю…
Короче тут такая тема, пока в пятницу игрался с командами, сегодня обнаружил что одна из команд, до сих пор работает (работала), терминал и сам wget пришлось потушить, так как была “сожрана” вся память, в итоге эта папка (maven) на данный момент размером в ~35.5 Гб… сейчас попробую запаковать и могу слить, куда надо…
Незадача:
В терминале было открыто много вкладок с сесиями пользователя из-под которого работал скрипт, команда работала на одной из вкладок, в итоге история команд отображает команду только последней вкладки :facepalm: а так как вариаций команд было великое множество, то реально не помню именно “рабочую” команду… можно как то все команды за пятницу промотреть?
up
эээ, архив вышел в 33.8Гб при степени сжатия 6 ))
Репозиторий “Maven” по истине большущий репозиторий из всех каких-либо, которые я встречал по итогу скачка у меня уже заняла почти 7 суток и продолжает качаться! Уже скачалось порядка 170Гб, хватит мне места или я уже сам не уверен.
На счёт финального скрипта, то у меня он получился такой: