Tips, Tricks & Tutorial

Tips : Ekstrak URL dari File HTML

Masim Vavai Sugianto13 years ago13 years ago32 mins

Beberapa waktu yang lalu Zimbra versi 7 dirilis untuk public dan saya ingin mendownloadnya ke server IIX agar bisa dengan cepat dan mudah didownload oleh rekan-rekan yang memerlukan. Sayangnya, Zimbra tidak menyediakan fasilitas rsync atau sejenisnya sehingga saya harus mendownload binarynya satu per satu dari alamat http://www.zimbra.com/downloads/os-downloads.html.

Melakukan copy-paste link satu per satu tentu bukan pilihan yang menarik karena ada puluhan link yang ada disana, padahal yang saya perlukan hanya akses ke link download Zimbra 7 saja.

Setelah browsing beberapa saat, saya menemukan script yang cukup brilian, hanya cukup 1 baris perintah untuk mengekstrak informasi link sesuai dengan parameter yang diperlukan. Berikut adalah caranya :

Simpan halaman yang ingin diekstrak, dalam hal ini halaman http://www.zimbra.com/downloads/os-downloads.html

Ketikkan perintah berikut ini :

sed -rn 's|.*(http://files2[^"]*).*|\1|p' zimbra-download.html > daftar-url.sh

Perintah diatas akan membaca file zimbra-download.html dan mengekstrak semua link yang berawalan “http://files2” dan memasukkan linknya ke file teks daftar-url.sh. File daftar-url.txt ini bisa saya edit dan menambahkan perintah wget -c (find & replace http menjadi wget -c http). Sebenarnya bisa juga memodifikasi script agar hasil sed sudah menyertakan perintah wget -c. File sh yang dihasilkan bisa digunakan untuk melakukan download semua file binary Zimbra.

Sederhana sekali namun hasilnya mantabs 😉

3 thoughts on “Tips : Ekstrak URL dari File HTML”

iang says:

February 12, 2011 at 3:13 pm

kalau punya file berisi daftar url, pake wget -i daftar.txt biar wget ngedownload semua url yg tertulis di dalamnya. ngga perlu satu2 ditambahin wget dan dijadikan script segala 🙂
Masim Vavai Sugianto says:

February 12, 2011 at 3:44 pm

@Iang, thanks buat tambahannya, sarannya mempercepat ke tujuan.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Author Info

Andrew Dawson

_Popular

Useful _Links

Trending News

Wirausaha

Family & Personal

Wirausaha

Family & Personal

Wirausaha

Bibit Pisang dari Tunas Bonggol

Tips Menghemat dan Menghasilkan Uang : Menanam Sekali, Panen Berkali-kali

Pengalaman Saat Membeli Tanah 100 M2 Pertama

Tips Perawatan Semangka Kuning (Semangka Golden)

Menghitung Pendapatan Menanam Padi (Investasi Sawah)

Panen Melon Premium dan Pengunjung Pertama Greenhouse #3 Zeze Zahra

Tips : Ekstrak URL dari File HTML

3 thoughts on “Tips : Ekstrak URL dari File HTML”

Leave a Reply

Author Info

Popular

Useful Links

Trending News

3 thoughts on “Tips : Ekstrak URL dari File HTML”

Leave a Reply

Related News

_Popular

Useful _Links