Setting Robot.txt Pada Blogger

Robot.txt dalah file teks berformat.txt yang harus ada di setiap situs web yang didaftarkan di Google, Yahoo!, dan Bing.



Hai sobat turtlebin kali ini bahasan tentang Cara Setting Robots.txt Khusus Blogger Dan Penjelasannya - Jika anda seorang blogger niscaya anda pernah mendengar Robots.txt , dan niscaya di saat pertama kali kita mendengar kata tersebut kita akan merasa kebingungan , nah kita sama saya juga di saat pertama kali mendengan ungkapan robots.txt niscaya saya akan merasa bingung.

Cara Setting Robots.txt Khusus Blogger Dan Penjelasannya




Apa itu robots.txt

Robots.txt adalah file teks berformat.txt yang harus ada di setiap situs web yang didaftarkan di Google, Yahoo!, dan Bing. Robots.txt sangat terkait dengan SEO karena berfungsi untuk mengontrol atau mengontrol halaman atau direktori mana yang dapat dilihat atau diindeks oleh mesin telusur.


Cara kerja dari robots.txt

Jika situs anda berdomain .com dan domain anda didaftarkan pada mesin pemcari google.com atau mesin penelusuran lainnya. maka secara otomatis anda memperbolehkan atau meminta robot-robot yang dimiliki oleh mesih pencari tersebut untuk mendatangi dan merayapi situs yang anda miliki. nah di saat pertama kali robot-robot pencari tersebut merayapi situs anda maka yang pertama mereka cari merupakan file robots.txt. File robots.txt tersebut berisi perintah-perintah tentang halaman mana saja yang diperbolehkan diperbolehkan untuk di index atau ditampilkan pada situs mesin pencari. pada blogspot , default robots.txt dikontrol selaku berikut:


  • User-agent: Mediapartners-Google
  • disallow:
  • User-agent: *
  • disallow: /search
  • allow: /
  • sitemap: http://blogURL/feed/posts/default?orderby=UPDATED


Kode diatas bermakna selaku berikut:

  • "User-agent:" Mediapartners-Google" menunjukkan bahwa arahan di bawah ini hanya berlaku untuk robot perayap atau bot crawler; "Mediapartners-Google" adalah robot perayap untuk Google AdSense.
  • " disallow: " berarti tidak ada batas-batas untuk para robot untuk merayapi halaman anda , dengan kata lain , para robot sanggup marayapi semua halaman disitus anda.
  • " User-agent: * " berarti bahwa kode/perintah yang diposisikan di bawahnya berlaku pada semua robot pencari dewakili dengan tanda *.
  • " disallow: /search "Melarang robot pencari untuk mencari URL dengan awalan urlbloganda.com/search.
  • " allow: / "  membiarkan robot pencari marayapi semua halaman kecuali yang disebutkan dalam perintah tidak diizinkan.
  • "sitemap:" merupakan sitemap dari situs anda , yang diberitahukan terhadap robot pencari biar mudah di saat menjelahahinya lagi. Sitemap mencakup semua link yang ada di situs untuk crawler dapat mengaksesnya.


Cara mengendalikan Robots.txt

Jika kita ingin memodifikasi atau mengendalikan robots.txt Anda , pertama anda mesti waspada apalagi dulu dan paham betul sebab kesalahan pengaturan sanggup menghasilkan situs web adna tidak terindex oleh mesin pencari.


a. Memblokir url

Untuk memblokir postingan tertentu biar tidak diindeks oleh semua mesin penelusuran , anda sanggup melakukan dengan menempatkan arahan dibawah ini.

  • user-agent: *
  • disalllow: /2012/11/url-permalink-posting.html

Kode yang berwarna merah merupakan pola dari struktur arahan url posting blogspot yang diblokir tanpa menuliskan nama domain web.


b. Memblokir folder/direktori

Untuk memblokir folder atau direktori yang terdapat pada situs yang kita miliki dengan arahan menyerupai dibawah ini:

  • user-agent: *
  • disallow: /cgi-bin/
  • disallow: /wp-admin/
  • disallow: /wp-includes/
  • disallow: /wp-content/plugins/
  • disallow: /wp-content/cache/
  • disallow: /wp-content/themes/

Kode di atas melarang robot pencari untuk merayapi semua file web di folder kita.


c. Memblokir url yang mengandung karakter/kata tertentu.

Dengan menggunakan robots.txt kita sanggup pergunakan untuk memblokir url yang memiliki karakter/kata tertentu biar tidak sanggup terindex oleh mesin pencari. Misalnya saya menggunakan aksara tanda tanya (?) yang umumnya dipakai pada url untuk query setting atas penarian pada web tertentu yang menyebabkan duplikat.


  • user-agent: * disallow: /*?*  #untuk memblok semua url yang mengandung "?"
  • allow: /*?$ #untuk mengizinkan susukan pada semua url yang memiliki akhiran "?"


d. Memblokir susukan pada ekstensi/format file tertentu.

Robots.txt sanggup kita atur untuk memblokir file dalam situr yang anda miliki dan memiliki format tertentu. Misalnya, kita akan memblokir file css, php, dan javascript.

  • user-agent: *
  • disallow: /*.php$
  • disallow: /*.js$
  • disallow: /*.css$


Cara memasang robots.txt

Robots.txt digunakan oleh blogger untuk mencegah atau memungkinkan search engine melakukan pengindeksan pada blog kita. Dengan demikian, kita memiliki kemampuan untuk memilih mana halaman yang diindeks dan mana yang tidak. Di sini, saya akan menjelaskan cara mengontrol robots.txt pada blogger kita agar konten tidak duplikat pada halaman pencarian, halaman mobile, dan permalink komentar.


Untuk cara settingnya silahkan masuk ke blogger kita dan pilih setelan->search preference kemudian pilih custom robots.txt->edit

Setting Robots.txt bloger


Selanjutnya masukkan arahan berikut pada form yang tersedia


  • User-agent: Mediapartners-Google
  • Disallow:
  • User-agent: Googlebot
  • Allow: /
  • Disallow: /search
  • Disallow: /?m=1
  • Disallow: /?m=0
  • Disallow: /*?m=1
  • Disallow: /*?m=0
  • Disallow: /*/*/*.html?showComment=*
  • User-agent:*
  • Allow: /
  • Disallow: /search
  • Disallow: /?m=1
  • Disallow: /?m=0
  • Disallow: /*?m=1
  • Disallow: /*?m=0
  • Disallow: /*/*/*.html?showComment=*
  • Sitemap: https://webanda/feeds/posts/default?orderby=UPDATED

Ganti kata yang berwarna merah dengan alamat web atau blog anda kemudian simpan pergantian yang sudah kita masukkan tadi.


Sekarang jaman nya web yang mobile friendly jadi anda juga mesti wajib baca postingan ini

Bahaya: Disallow M=1 dan M=0 pada Robos.txt dan Algoritma Google Mobile Tidak Akan Merayapi Blog Versi Mobile Anda


Kesimpulan

Robots.txt sungguh mempunyai kegunaan bagi blog yang anda pergunakan , dengan memutuskan mana saja yang sanggup di susukan dengan  menggunakan script yang robots.txt , dengan menggunakan robots.txt kecepatan susukan dari suatu web akan kian cepat.

demikian postingan saya mengenai Setting Robots.txt Khusus Blogger semoga postingan saya ini berharga untuk kita semua

Share this artikel

About the author

turtlebin
Hamba Allah

Posting Komentar