Definisi, Kegunaan dan Cara Membuat Robots.txt
Beberapa hari yang lalu, saya ketemu teman saya di Yahoo! chat. Setahu saya, beliau sudah cukup lama berkecimpung di dunia webmaster. Maka dari itu, saya selalu senang berbincang dengannya tentang masalah-masalah internet dengannya.
Saat chatting, dia bertanya
Bagaimana cara submit ke Search Engine? Lu biasanya pake software apa?
Pertanyaannya agak ngga nyambung dengan bayangan saya. Pake software? Hmmm… Maka dari itu saya pastikan dulu bahwa maksudnya adalah Search Engine Submission, bukan Link Directory submission atau sejenisnya. Akhirnya setelah pasti bahwa yang dia maksud adalah Search Engine Submission, maka saya akhirnya me-refer ke artikel ini.
Ternyata dia ngga terima karena artikel tersebut sangat spesifik untuk blog. Akhirnya, setelah saya cek whois nya, ternyata sudah berumur hampir 1 tahun. Hmm… jika tidak di blok oleh Robots.txt, maka pasti isi website tersebut sudah ada di index search engine.
Saya bilang, sebaiknya dia cari tahu dulu halaman mana saja yang sudah di index oleh search engine. Caranya dengan mengetik www.google.com, kemudian masukkan alamat ini ke search form:
site:www.websiteanda.com
(Contoh index BloggersGuideToSEO di Google ada disini).
Jika halaman yang di index sedikit atau tidak ada sama sekali, pastikan dulu apakah ada robots.txt, karena teman saya ini tidak menahu tentang instalasinya, karena website itu sendiri adalah hasil serah terima dari webmaster lain.
Cara mengetahui apakah website anda ada robots.txt adalah dengan mengetik:
www.domainanda.com/robots.txt.
Jika ada file yang keluar, maka berarti sudah ada jika 404 error berarti belum ada.
Ternyata robots.txt nya belum ada. Ok, saya sarankan, sebelum jauh, lebih baik buat saja robots.txt untuk memastikan Search Engine tidak dilarang masuk ke website nya.
Dia tanya, apaan tuh robots.txt? Kenapa buat sendiri? Bukannya Search Engine akan membuatkan website kita robots.txt?
Well… Robots.txt tidak dibuat sendiri oleh Search Engine dan dimasukkan ke server kita. Tapi jika tidak ada Robots.txt, biasanya memang Search Engine akan meng-index seluruh directory website anda. Ok. Definisi robots adalah sebagai berikut:
Robots.txt protocol atau robot exclusion standard, juga dikenal sebagai Robots Exclusion Protocol, adalah sebuah sistem protokol standar yang digunakan untuk membatasi web spider atau membolehkan crawler dan segala jenis web robot untuk mengakses bagian-bagian dari sebuah website. Robots ini digunakan oleh search engine untuk mengkategorikan dan mengumpulkan data dari sebuah website.
Sebenarnya untuk blog WordPress (yang self-hosted, bukan di WordPress.com), jika tidak ada URL yang ingin di block, cara membuat robots.txt sangat mudah.
- Copy dan paste code di bawah ini ke notepad:
- Save as sebagai ‘robots’ (tanpa quote).
- FTP file tersebut ke roots folder anda (biasanya public_html/)
- Cek dengan mengetik www.domainanda.com/robots.txt
- Jika ada code seperti diatas, berarti anda sudah selesai.
User-agent: *
Disallow:
- Login ke Google Webmaster account anda.
- Klik Tools
- Klik Analyze Robots.txt
- Paste code robots.txt anda di kotak form pertama.
- Copy sitemap anda (anda bisa membuatnya dengan menggunakan software gratis ini) dan paste URL-nya website ada di form dibawah tulisan Test URLs against this robots.txt file.
- Akan terlihat apakah ada URL yang di block atau tidak.
Comments
53 Responses to “Definisi, Kegunaan dan Cara Membuat Robots.txt”
Leave a Reply


User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Noindex: /feedReaderJson
kalo kodenya gini artinya apa ya?
soalnya blog saya gak muncul2 di google sih…
Shaniago,
Kalau kamu pake Blogger.com, setahu saya kamu ngga punya kontrol untuk content dan folder2 website/blog kamu, termasuk Robots.txt. Jadi, Robots yang ada di blog kamu itu Google sendiri yang buat.
Untuk mengecek blog kamu sudah ada di Google atau belum, login ke Google Webmaster account kamu, lihat apakah sudah di index atau belum oleh Google.
Untuk mengecek apakah robots tidak mem-block directory manapun di website kamu, ikuti langkah-langkah di postingan di atas.
Oh by the way saya hapus link ke daily mp3 kamu ya, maaf saya ngga support download/warez website.
Semoga membantu.
Kunjungan Blog Regedit, Artikelnya bagus apalagi kata-katanya menarik menambah wawasan dan pengalaman saya trims ya…lanjutkan artikelnya saya tunggu. O iya… Boleh saya minta komentar dari teman untuk artikel di blog saya? Kalau Boleh Kunjungi blog saya ya hari ini saya baru posting artikel tolong komentarnya kalau bisa komentarnya berkaitan dengan artikel yang di pilih teman. Ini alamatnya : http://regedit.blog.telkomspeedy.com/ terima kasih banyak satu lagi kalau mau tuker link masukan saja link teman di Guest Book insya Allah swt besok langsung saya pasang link teman.
saya mau nanya nich..???
cara bikin tag/meta tag/robot.txt dimana fungsinya untuk merefresh crawler agar website trsbt fresh lagi dan bisa crawler lagi… (alias update website yg sallu update)…???
tolong dong bingung nich..???
Setahu saya, Robots hanya dibuat untuk ‘memberi ijin’ pada robot crawler untuk meng-index website kita, sementara meta tag untuk mengenali kata kunci utama halaman tertentu website kita. Keduanya tidak mempengaruhi kapan crawlerdatang dan kerja di website kita.
Untuk volume crawling mereka, yang pasti dasar-dasarnya:
Semoga membantu
Salam kenal..
Mas, saya baru aktifkan plugin google sitemap..pada bagian update notification dari settingnya muncul tulisan sepeti ini :
File permissions: Error, robots.txt doesn’t exist and the directory is not writable.
Itu artinya apa yah ? File apa yang permisionnya salah dan musti diganti..?
terima kasih..maaf merepotkan
Hai Bagaswaras,
Kedengerannya karena file permission. Tapi kayaknya masalahnya udah beres ya sekarang? Udah ada robots-nya tuh…
Terimakasih.
kok masih belum berhasil ya mas…
sekarang pesan errornya:
# There was a problem writing your sitemap file. Make sure the file exists and is writable. Learn more
# There was a problem writing your zipped sitemap file. Make sure the file exists and is writable. Learn more
katanya disuruh bangun file sitemap.xml resp. sitemap.xml.gz secara manual..tapi saya gak tau caranya..
terima kasih..
udah berhasil mas…ternyata tinggal bikin file kosong di notepad terus di save as sitemap.xml dan sitemap.xml.gz
sitemap saya skrg dah beres….
terima kasih bantuannya..
terima kasih mas, saya udah numpang baca2 artikelnya mas, moga bermanfaat buat kita semua, sekali lagi makasih bangett ya…
Sama-sama Novita.
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Sitemap: http://bloggertoblog.blogspot.com/feeds/posts/default?orderby=updated
itu kode robot.txt di blok sudah betul belum boss,..
maksudnya Disallow: /search apaan tuh
mas kalau mendaftar di 2 webmaster boleh kan? di webmasternya google dan msn.thanks, ditunggu infonya, btw lam kenal mas.
boleh lah. jangan lupa masukin juga ke yahoo! lewat http://siteexplorer.yahoo.com login pakai account yahoo! kamu. cheers.
Artikel dan tanggapannya cukup jelas.
Terima kasih
Punya blog dan di masukin ke webmaster google lihat kode2 kepala jadi puyeng
Jangan bingung, konsen yang kamu butuh aja.
saya baru selesai membuat sitemap cape banget….tapi akhirnya diverifikasi google,,,selanjutnya apa sih kegunaannya teman?
Buat ngasih petunjuk ke Google seperti apa struktur content website kamu. Kurang lebih seperti itu bro…
waduh mas ….saya binggung nie kenapa blog saya ngk kesearch dengan optimal di serach engine…
coba cek blog saya mas di google dan lihat hasilnya mas…
thank’s u b4
waduh kok aku bingung ya.. hehe
Thanks artikelnya mas,untuk yang pake wp kekna ga perlu bingung2 dgn robots.txt dan sitemap karena ada bnyak plugin yg bisa otomatis membuat sitemap begitu kita membuat posting baru. Salam persahabatan dari NGALAS WORLD maen ke blog aku ya..Blog aku dofollow lho
makasih y bos………..
Aq kurang begitu ngerti. Tapi ntr aq pahami lagi,…
thanks bos tutorial nya bagus banget
Banyak banget referensi artikel tentang robot.txt and smua gak ada yang sama alias beda-beda pembuatan file robot.txt’Nya. Kok ane jadi bingung mo pilih yang mana… kira-kira kalau di pakai semua (maksudnya; digabungin) referensi dari para master tu gmana ya ?
Bos… Blog ai kok di banned oleh blogger knp ya? katanya di anggap spam.. gmn cara pulihkannya ?
Artikel yang sangat bermanfaat banget..
wow thanks mas, saya cuma bingung upload robot.txt nya kmn tp skrg dah bisa ??
abis spider ngindex smua nya ampe tag,script sgla di index itu sngat mengganggu buat saya akhir nya saya dissalow smua yg gag penting..
Sharing ilmu
ai kurang faham nih masalah robots.txt
menarik sekali.. utk web smuo gimana cara pasang robot.txt, ada yg bisa bantu. thanks.
Pusing aku, webku hilang dari peredaran google adsense, siapa yang bisa nolongin ya
Informasi seperti ini yang nanti jadi inspirasi bagi semua orang, lanjutkan mas…
great thanks for your infooo
Kalo memasang robot.txt di platfotm blogspot gmna caranya bang???
Saya tidak tahu apakah di blog saya sudah ada robot atau belum. bisa dibantu mas?
apa ga salah ne.. kalau kita tulis tek macam tu.. brati kita melarang pencarian robot di blog kita dan yang punya blog juga tidak mengizinkan.. coba kalin fahami dulu tulisannya.. follow dengan disallow..
Puter2, liat disini http://www.bloggersguidetoseo.com/robots.txt
Jd tambah puyenx soal robot.txt,soalya baru punya blog,jd lg cari2 info juga.skalian tanya,apa aktifasi crawler google bisa dipercepat,masa pengatifanya 3bulan.
matap artikelnya pak……..
Halo sob saya mau tanya sedikit, apa boleh membuat lebih dari satu sitemap misal atom.xml, rss.xml, feeds/posts/default? Ohya kenapa type sitemap blog saya di webmaster di deteksi typenya tidak diketahui, apa sebabnya dan bagaimana untuk memperbaikinya agar type menjadi atom lagi bukan unknown? Thanks!
Terimakasih atas informasinya…Dulu saya pernah hapal, tapi karena udah lama gak ngoprek, jadi lupa lagi… Robot atau Robots hehehe..
infonya bagus mas, setelah saya cek punya saya nggak ada di google. tapi masih pusing gimana caranya menempatkannya di blogspot….. mohon pencerahannya. cekdot mas.
@Cekdot kalo Google’s Blogger rasanya ga usah dikasih robots.txt lagi deh, soalnya by default semua isinya udah pasti di index sama Google.
terima kasih atas infonya, setelah saya cek punya saya terdapat error, mungkin saya belum bemasukkan robots txt ke blogger ? bagaimana memasukkannya ya
salam
oh salah mas ternyata punya saya sudah ada, cuma saya salah copy contoh yg anda buat *ww.domainanda.com/robots.txt. <dibelakang txt ada titiknya ikut ke copy ke url broser saya
blog anne http://www.hargablackberry.com kenapa pas pencarian di google munculnya menjadi lsw-proxy.appspot.com mohon pencerahan
mantep infonya gan
informasi yang bagus
makasih mas atas informasinya,,akhirnya saya tidak bingung lagi
sangat membantu saya dalam menyelesaikan masalah yang saya hadapi saat ini. Penjelasnya cukup terperinci dan sangat mudah untuk di pahami. terimaksih atas bantuannya..
thank mas bro sangat membantu sekali
jangan lupa
# Disallow all directories and files within
Disallow: /cgi-bin/
Disallow: /stats/
#Disallow: /tag/
Disallow: /wp-admin/
Disallow: /wp-includes/
# The Googlebot is the main search bot for google
User-agent: Googlebot
# Disallow all files ending with these extensions
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.tar$
Disallow: /*.tgz$
Disallow: /*.cgi$
Disallow: /*.xhtml$
untuk tambahan silahkan di copy di robots.txt nya