Google, duplikasi konten dan raib-nya situs scraper…

desain.bohlam.gantung.nyalaSebelum mempublikasikan artikel terjemahan “Semua tentang SEO di WordPress“, ada sedikit keraguan di pikiran saya. Apakah artikel terjemahan tersebut masuk dalam kategori tindakan menjiplak / menduplikasi? Jika benar demikian, maka situs / blog ini (listrikdirumah.com) akan dikategorikan sebagai situs penjiplak (scraper) oleh Google. Konsekuensinya, situs ini akan di-“singkir”-kan dari Google SERP (Search Engine Result Page – halaman hasil pencarian).

Berdasarkan adanya keraguan tersebut, saya mencoba mencari hal apa yang menjadi dasar kategori tindakan menjiplak / menduplikasi dari sebuah artikel.

Kesimpulan yang diperoleh, kira-kira seperti ini :

Untuk terhindar dari kategori sebagai penjiplak artikel, tindakan terbaik yang harus dikerjakan adalah meminta ijin untuk menulis ulang (copy-paste) kepada pemilik artikel asli. Cara lainnya adalah minimal harus menyertakan keterangan sumber referensi /  tautan dari artikel asli. Namun demikian, tindakan tersebut hanya dapat dikerjakan dengan syarat situs yang menjadi sumber tidak memiliki keterkaitan bisnis apa pun dengan pihak-pihak lain di dunia maya (situs / blog gratis).

Walau pun secara teori diperbolehkan, pada penerapannya, cara copy-paste sangat tidak diperkenankan dengan tujuan dan alasan apa pun. Lebih dianjurkan untuk menuliskan beberapa kalimat pengantar yang menjelaskan isi artikel asli, kemudian menyertakan link / tautan dari artikel asli tersebut.

Melakukan tindakan copy-paste akan dikategorikan sebagai scraper. Arti kata scraper disini dalam bahasa Indonesia mirip dengan pengertian pen-jiplak / pen-duplikasi. Secara harfiah, kata “scrapbook” berarti buku dengan halaman kosong yang dipenuhi tempelan kliping koran, baik berupa artikel tulisan maupun gambar. Saya mengistilahkan situs berisi konten hasil men-jiplak / men-duplikasi dari situs lain dengan sebutan “scrapsites” dan pemiliknya sebagai “scraper”.

Kasus duplikasi konten / artikel sudah sejak lama menjadi hal sensitif dan abu-abu di dunia maya. Sulit untuk menentukan batasan yang jelas mengenai duplikasi artikel. Salah satu metode yang cukup “valid” untuk dipakai sebagai penentu keaslian sebuah artikel adalah pengenalan tutur-kata dan kalimat yang tertulis pada artikel bersangkutan. Ide boleh sama, namun dalam tutur-kata cara penyampaiannya sangat ditentukan dari lingkungan, jenis pendidikan dan sudut pandang si pemilik ide. Jadi, sangat kecil kemungkinan untuk mendapatkan dua artikel dengan ide sama memiliki tutur-kata penyampaian dengan urutan yang sama. Kecuali, salah satu diantaranya melakukan tindak duplikasi!
icon.top.par

Google dan SERP-nya

Google sebagai salah satu penyelenggara mesin pencari (Search Engine), sangat memperhatikan kasus duplikasi artikel yang muncul di halaman hasil pencarian mesin-nya. Tindakan ini dilakukan karena Google sangat mengkhawatirkan rekan bisnis usaha-nya dirugikan atas tindakan tidak bertanggung jawab. Biasanya, tindakan seperti itu dilakukan oleh pemilik situs yang mencari keuntungan lebih dari hasil pemasangan iklan di situs milik mereka sendiri. Atau, bisa juga pemilik situs lain yang menginginkan porsi keuntungan pendapatan dari situs saingannya.

Hal itulah yang menjadi salah satu alasan (cepat atau lambat) situs / blog dengan duplikasi artikel akan di-“singkir”-kan dari Google SERP. Baik artikel yang di duplikasi maupun alamat situs / blog yang mengusungnya. Lebih parah lagi, situs pengusung tersebut tidak dapat di-akses lagi oleh pemiliknya karena di blokir oleh penyelenggara situs akibat melakukan tindak pelanggaran hak cipta dan dianggap sebagai situs penjiplak. Bagaimana Google dapat membedakan keaslian dari dua artikel identik secara akurat? Metode yang saya ketahui (secara tidak sengaja) selain dari tinggi-rendahnya prosentase perbandingan tingkat kesamaan isi antar artikel adalah dengan membandingkan tanggal publikasi pertama kali dilakukan dari masing-masing artikel. Kedua data tersebut adalah informasi paling terpercaya untuk mengetahui situs mana yang menjadi pemilik artikel asli.
icon.top.par

Search Engine sebagai sarana publikasi

Mengalami menjadi korban scraper, membuat saya sedikit mengerti besarnya peran mesin pencari dalam mem-populer-kan keberadaan sebuah situs / blog. Walau pun telah banyak beredar “social-media” seperti Facebook atau Twitter sebagai sarana alternatif dalam mem-populer-kan artikel / blog / situs, biar bagaimana pun juga, mesin pencari adalah sarana terbaik untuk meraih keberhasilan dari tujuan tersebut. Karena tidak dibutuhkan status keanggotaan atau keunikan apa pun untuk bisa menggunakan mesin pencari. Dengan browser yang telah tersedia di setiap komputer, maka setiap orang dari segala lapisan penjuru dunia dapat menggunakan mesin pencari cukup hanya dengan memasukkan kata kunci pada browser.

Adalah sebuah omong-kosong jika seorang blogger atau pembuat situs jaringan menyatakan tidak memiliki ketergantungan dengan mesin pencari sebagai sarana publikasi. Pemilik situs mana pun pasti berharap atas respon mesin pencari dalam menampilkan alamat situsnya di SERP untuk setiap kata kunci yang berhubungan dengan keberadaan situs mereka. Begitu penyelenggara mesin pencari (Google, Yahoo, Bing, Ask dll.) menghilangkan link / tautan sebuah blog / situs dari daftar SERP mereka, maka dapat dipastikan ruang lingkup blog / situs tersebut akan menciut (bahkan bisa menghilang) dari peredaran di dunia maya.

Saya sarankan untuk tidak bermain-main mencoba melanggar aturan main, terutama perihal hak cipta, dengan pihak-pihak yang memegang teguh prinsip keaslian (genuine) di dunia maya. Jika masih ingin menggunakan mesin pencari sebagai sarana pilihan utama dalam mempublikasikan / mempopulerkan blog / situs kita, lebih baik hindari untuk berurusan dengan pelanggaran hak cipta. Google adalah salah satu yang dipercaya dan tegas dalam mempraktekkan prinsip tersebut. Sebagai salah satu penyelenggara mesin pencari terbaik, Google tidak main-main dalam mempertahankan reputasinya. Tindakan tegas akan diambil untuk hal-hal yang menurut mereka akan membawa masalah dikemudian hari.

Sedalam apa pun kepentingan pribadi anda untuk menggunakan kekayaan intelektual tanpa sama sekali melibatkan keberadaan pemiliknya, jangan pernah berpikir untuk menyatakan dan mempublikasikannya sebagai hasil kreasi anda sendiri. Diasingkan / dihilangkan dari peredaran dunia maya adalah konsekuensi ter-ringan akibat tindakan tersebut.

Hal yang jarang diketahui oleh para penjiplak adalah penyebab raibnya situs mereka dari SERP bukan dikarenakan laporan / aduan dari pihak korban mereka. Melainkan tindakan sepihak yang dilakukan oleh penyelenggara mesin pencari akibat ulah para penjiplak itu sendiri. Lagi pula, para scraper itu pun tidak akan menyadari kalau link / tautan scrapsites-nya telah dilenyapkan dari SERP.

icon.top.par

WordPress.com tentang terjemahan artikel

Menyertakan kalimat pengantar dan link / tautan artikel asli di awal artikel terjemahan “Semua tentang SEO di WordPress.com” yang menyatakan bahwa terjemahan tersebut adalah hasil karya dari penulis “All about SEO on WordPress.com” adalah salah satu cara saya membangun hubungan yang sehat dalam lingkungan dunia maya. Walaupun ini bukan tindakan copy-paste, tetap harus ada kalimat pengantar yang menyatakan kondisi sebenarnya. Bagaimana pun juga, sebesar apa pun usaha yang saya kerjakan dalam menerjemahkan, ide asli dari artikel tersebut tetap berasal dari si empu-nya. Peran saya hanya sebatas sebagai pihak perpanjangan tangan saja.

Dari WordPress.com sendiri menyatakan secara garis besar, tidak ada masalah dengan tindakan menerjemahkan artikel yang telah dipublikasikan oleh WordPress.com. Sebesar apa ruang lingkup dari pernyataan “tidak ada masalah” tersebut, saya belum mengetahuinya. Namun, cara paling aman dan benar adalah tetap dengan meminta ijin atau menyertakan nara sumber artikel yang hendak diterjemahkan.

Jika saya mendapat peringatan bahwa sebelumnya telah diterbitkan artikel dengan topik sama dalam bahasa Indonesia, adalah hal wajar seandainya saya harus menghapus hasil terjemahan di situs saya dan menambahkan link / tautan terjemahan pertama pada kalimat pengantar serta meminta maaf kepada penulis penerjemah pertama. Karena memang demikianlah aturan main / kode etik yang semestinya dijalankan.icon.top.par

Keuntungan menjadi korban scraper…

Dengan Google menerapkan tindakan pembersihan duplikasi konten dan situs penjiplak dari SERP-nya, saya rasa, tidak ada yang perlu dikhawatirkan lagi oleh pemilik konten asli mengenai masalah duplikasi artikel. Dari hasil analisa yang saya dapatkan, semakin banyak dijiplak – semakin menguntungkan bagi para pemilik konten asli.

Ketika tindakan pembersihan dilakukan, semua kata kunci yang sebelumnya mengarah pada duplikasi konten di situs penjiplak akan dialihkan ke situs pemilik konten asli. Dengan kata lain, semua pengunjung yang sebelumnya berhasil didapat oleh situs scraper dari duplikasi konten, akan dipindahtangankan ke pemilik konten asli.

Bayangkannya seperti ini :

Dari sekian banyak mesin pencari yang ada, hanya tiga penyelenggara yang benar-benar diakui eksistensinya, yaitu : Google, Yahoo dan Bing. Penyelenggara mesin pencari lainnya banyak yang berafiliasi dengan ketiga penyelenggara tersebut. Dengan demikian daftar situs yang terdapat di ketiga penyelenggara tersebut akan dipakai juga oleh afiliasinya. Begitu link / tautan sebuah scrapsites dihilangkan oleh ketiga penyelenggara tersebut, afiliasinya pun akan melakukan hal yang sama. Lalu, bagaimana dengan daftar data kata-kunci di semua penyelenggara mesin pencari yang sebelumnya mengarah ke duplikasi konten? Kemana harus dialihkan?

Jadi, tidak perlu heran seandainya satu saat jumlah pengunjung situs anda sebagai pemilik konten asli membludak di luar dugaan.

Menarik bukan?
icon.top.par

Hanya sekedar Informasi…

Apa yang hendak saya sampaikan dari artikel ini adalah hanya dalam kerangka sebatas informasi saja. Tidak ada niat lainnya daripada itu. Saya hanya mencoba memberi gambaran pihak-pihak mana saja yang merasa lebih besar dirugikan terhadap tindakan duplikasi konten.

Pada dasarnya, bagi para pemilik konten asli, kerugian atas tindakan scraper hanya berdampak sebatas wilayah kepentingan pribadi mereka saja. Namun, jika terdapat 100 konten asli yang di duplikasi dimana para pemilik konten asli tersebut mempunyai kerja-sama bisnis dengan Google, maka pihak yang paling dirugikan adalah Google. Apakah hanya sebatas 100 pemilik konten asli saja dari seluruh dunia yang berkepentingan dengan Google?

Tidak perlu kita mengetahui angka pasti-nya kerugian yang didapat Google dari tindakan scraper tersebut. Dengan sengaja mengkhususkan mengembangkan algoritma program guna menyapu bersih duplikasi konten dan situs scraper dari SERP-nya adalah gambaran yang cukup jelas untuk dijadikan perkiraan mengenai besar kerugian yang telah diperoleh selama ini. Melakukan tindakan pengembangan seperti itu, setahu saya, tidak berbicara mengenai alokasi biaya yang seadanya / secukupnya saja.

Dari beberapa informasi yang beredar saat ini, keakuratan algoritma program tersebut tidak sepenuhnya tepat menghantam semua scrapsites. Ada juga beberapa pemilik konten asli yang mengeluh atas raib-nya link / tautan situs mereka dari Google SERP. Apakah hal tersebut akan berlanjut tanpa ada perbaikan apa pun? Menurut saya, perlu waktu untuk menjadikan semua itu berjalan sebagaimana mestinya. Dengan sedemikian besar usaha dan biaya yang telah dikeluarkan, Google pun tidak akan puas dan berhenti hanya pada batas itu saja.

Mungkin, semua deskripsi di atas tidak sepenuhnya sama dengan apa yang sebenarnya telah / sedang dikerjakan oleh Google. Semua itu diperoleh dari hasil analisa dan saya tidak memiliki hubungan apa pun dengan Google. Namun, jika saya seorang diri saja bisa membuat perkiraan kerugian akibat tindakan para penjiplak, saya rasa, Google memiliki pemikiran lebih luas dan lebih baik mengenai tindakan apa yang harus mereka lakukan untuk melindungi kepentingan mereka dari hal-hal seperti itu.

Semoga artikel ini dapat memberikan pemahaman lebih baik untuk anda mengenai seberapa luas wilayah kepentingan dari pihak-pihak yang terkena dampak atas tindakan pen-duplikasi-an konten.

Salam…

icon.top.document

Iklan