Có nhiều người đã hỏi mình về một chương trình quản lý download tương tự như Internet Download Manager (IDM) của Windows, và câu trả lời của mình là khó có chương trình nào có thể làm tốt bằng IDM ngay cả trên Windows. Để thay thế IDM trên Linux thì có rất nhiều lựa chọn như Flashget, JDownloader hay Wget…Trong những chương trình trên mình đặc biệt thích Wget, đây là một chương trình download đơn giản nhưng cực kỳ hiệu quả. Nó có thể được dùng để download các tập tin riêng lẻ hay download toàn bộ một website (crawler). Bây giờ chúng ta sẽ xem một vài ví dụ về wget để thấy được các chức năng của nó:
- Download một tập tin:
wget download-url
- Restore download khi bị ngắt (thêm tham số -c khi bắt đầu download)
wget -c download-url
Nhìn vào hình ảnh trên ta thấy được file tải về đã bị ngắt ở thời điểm 19%, tuy nhiên ban đầu chúng ta đã dùng tham số -c (–continue) nên có thể tiếp tục tải về mà không bị mất dữ liệu đã tải trước đó. Chúng ta có thể thấy file tải về sẽ được tiếp tục tải ở 19%, quá trình bắt đầu từ dấu (+) cuối cùng và tiếp đó là dấu (=). Tham số này rất hữu ích khi bạn muốn tải về một file nhưng kết nối của bạn không ổn định.
- Để crawler một website chúng ta dùng tham số -r ( –recursive)
wget -r url_website
- Khi crawler bạn có thể giới hạn các định dạng tải về bằng tham số -A (–accept). Ví dụ chỉ tải về các file định dạng htm,html,jpg ta làm như sau:
wget -r -A.jpg,.html,.htm http://www.vnexprees.net
#hoặc
wget -r --accept=jpg,html,htm http://www.vnexpress.net
- Dùng wget để phân tích một địa chỉ bằng –spider, nếu địa chỉ đúng sẽ hiển thị như sau:
wget --spider download-url
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Remote file exists and could contain further links,
but recursion is disabled -- not retrieving.
Nếu địa chỉ không tồn tại thì kết quả là:
wget --spider download-url
Spider mode enabled. Check if remote file exists.
HTTP request sent, awaiting response... 404 Not Found
Remote file does not exist -- broken link!!!
- Tải về nhiều file đồng thời. Chúng ta có thể dùng một danh sách file cần tải về rồi tham số -i:
wget - i file_list.txt
Trên đây là một số chức năng mà mình thường dùng với wget, còn rất nhiều chức năng mà wget có thể làm, các bạn có thể tham khảo trong trang man của wget.
Chúc các bạn thành công
Wikilinux!