Jumat, 22 November 2013

EKSPERIMEN SKINNER (Operant Conditioning)

Operant Conditioning
Dalam salah satu eksperimennya, Skinner menggunakan seekor tikus yang ditempatkan dalam sebuah peti yang disebut dengan Skinner Box. Kotak Skinner ini berisi dua macam komponen pokok, yaitu manipulandum dan alat pemberi reinforcement yang antara lain berupa wadah makanan. Manipulandum adalah komponen yang dapat dimanipulasi dan gerakannya berhubungan dengan reinforcement. Komponen ini terdiri dari tombol, batang jeruji, dan pengungkit.
Dalam eksperimen tadi mula-mula tikus itu mengeksplorasi peti sangkar dengan cara lari kesana kemari, mencium benda-benda yang ada disekitarnya, mencakar dinding, dan sebagainya. Tingkah laku tikus yang demikian disebut dengan ‘’ emmited behavior ” (tingkah laku yang terpancar), yakni tingkah laku yang terpancar dari organism tanpa memedulikan stimulus tertentu. Kemudian salah satu tingkah laku tikus (seperti cakaran kaki, sentuhan moncong) dapat menekan pengungkit. Tekanan pengungkit ini mengakibatkan munculnya butir-butir makanan ke dalam wadahnya.
Butir-butir makanan yang muncul merupakan reinforce bagi tikus yang disebut dengan tingkah laku operant yang akan terus meningkat apabila diiringi reinforcement, yaitu penguatan berupa butiran-butiran makanan kedalam wadah makanan.
Teori belajar operant conditioning ini juga tunduk pada dua hukum operant yang berbeda lainnya, yaitu law operant conditioning dan law extinction. Menurut hukum operant conditioning, jika suatu tingkah diriingi oleh sebuah penguat (reinforcement), maka tingkah laku tersebut meningkat. Sedangkan menurut hukum law extinction, jika suatu tingkah laku yang diperkuat dengan stimulus penguat dalam kondisioning, tidak diiringi stimulus penguat, maka tingkah laku tersebut akan menurun atau bahkan musnah. Kedua hukum ini pada dasarnya juga memiliki kesamaan dengan hukum pembiasaan klasik (classical conditioning).
 
 

Skinner membedakan perilaku atas :
  1. ·  Perilaku alami (innate behavior), yang kemudiandisebut juga sebagai clasical ataupun respondent behavior, yaitu perilaku yangdiharapkan timbul oleh stimulus yang jelas ataupun spesifik, perilaku yangbersifat refleksif.
  2. Perilaku operan (operant behavior), yaitu perilakuyang ditimbulkan oleh stimulus yang tidak diketahui, namun semata-mataditimbulkan oleh organisme itu sendiri setelah mendapatkan penguatan.
Skinner yakin jika kebanyakan perilaku manusia dipelajari lewat Operant Conditioning atau pengkondisian operan, yang kuncinya adalah penguatan segera terhadap respons. Operant Conditioning adalah suatu proses penguatan perilaku yang dapatmengakibatkan perilaku tersebut dapat berulang kembali atau menghilang sesuaidengan keinginan.
Skinner membuat mesin untuk percobaanya dalam Operant Conditioning yang dinamakan dengan"Skinner Box" dan tikus yang merupakan subjek yang sering digunakandalam percobaanya.
Dalam percobaannya tersebut yang dilakukan oleh Skinner dalam Laboratorium, seekor tikus yang lapar diletakkan dalam Skinner Box, kemudian binatang tersebut akan akanmenekan sebuah tuas yang akan membukakan dulang makanan, sehingga diperolehpenguatan dalam bentuk makanan. Di dalam setiap keadaan, seekor binatang akanmemperlihatkan bentuk perilaku tertentu; tikus tadi misalnya, akanmemperlihatkan perilaku menyelidik pada saat pertama kali masuk kedalam Box,yaitu dengan mencakar-cakar dinding dan membauinya sambil melihat-lihat kesekelilingnya. Secara kebetulan, dalam perilaku menyelidik tersebut tikusmenyentuh tuas makanan dan makanan pun berjatuhan. Setiap kali tikus melakukanhal ini akan mendapatkan makanan; penekanan tuas diperkuat dengan penyajian makanan tersebut, sehingga tikus tersebut akan menghubungkan perilaku tertentudengan penerimaan imbalan berupa makanan tadi. Jadi, tikus tersebut akanbelajar bahwa setiap kali menekan tuas dia akan mendapatkan makanan dan tikustersebut akan sering kali mengulangi perilakunya, sampai ada proses pemadamanatau penghilangan dengan menghilangkan penguatannya.
Dalam eksperimen Skinner tersebut terdapat istilah Penguatan atau dapat disebut sebagai reinforcementyaitu, setiap kejadian yang meningkatkan ataupun mempertahankan kemungkinan  adanya respon terhadap kemungkinan respon yang diinginkan. Biasanya yangberupa penguat adalah sesuatu yang dapat menguatkan dorongan dasar (basicdriver, seperti makanan yang dapat memuaskan rasa lapar atau air yang dapatmenuatkan rasa haus) namun tidak harus selalu demikian.
Pada manusia, penguatan sering salah sasaran sehingga pembelajaran menjadi tidak effisien. Masalah lain dengan pengkondisian manusia adalah penentuan manakahkonsekuansi-konsekuensi yang menguatkan dan manakah yang melemahkan. Karena bergantung pada sejarah individu, penguatan dan disiplin terkadang dapatmenjadi penguatan sedangkan ciuman dan pujian dapat menjadi hukuman.
Dalam penguatantersebut dibedakan antara pengutan positif dan negatif.
  • Penguatan positif adalah stimulus yang apabila diberikan sesudah terjadinya respon, meningkatkan kemungkinan respon tersebut.

                              ->          Respon 1
                           /
S (Rangsang)  --->              Respon 2       -->          Penguatan
                           \
                             ->          Respon 3
Menjadi :

S(Rangsang)   -->              Respon 2 berulang-ulang

  • Penguatan negatif adalah stimulus yang dihapuskan sesudah responnyatimbul, meningkatkan kemungkinan adanya respon; shock elektrik dan bunyi yangmenyakitkan digolongkan sebagai penguat negatif dan sebagai penguat negatifjika penguat itu dapat ditiadakan ketika timbul respon yang diinginkan.
                               ->        Respon 1     -->                Shock elektrik
                             /
S (Rangsang)    -->            Respon2
                            \
                             ->          Respon3      -->               Shock elektrik
Menjadi :

S (Rangsang)        -->             Respon2

Adapun Jenis-Jenis Penguat Skinner dikategorikan, sbb;
  1. Penguat utama (Primary reinforcers) adalah  penguat yang memengaruhi perilaku tanpa perlu belajar, seperti: makanan, minuman, seks. Ini disebut penguat alami. 
  2. Penguat sekunder (Secondar reinforcers). Adalah penguat yang membutuhkan  tenaga penguat karena sudah diasosiasikan dengan penguat utama, seperti memuji seseorang. 
      Tadi telah diuraikan bahwa bagaimana seekor tikus dalam Skinner Box yang menekan tuas akan menerima butir-butir makanan setiap kali tikus tersebut melakukannya. Apabila kita menghentikan pemberian penguatan ini, perilaku penekanan tuas pun secara bertahap akan menghilang, biasanya hanya beberapa menit setelahpenghentian penguatan. Apa yang membuat Operant Conditioning ini penting untuk menjelaskan belajar adalah pengembangan jadwal penguatan yang dilakukanoleh Skinner. Jadwal ini merupakan bentuk lain dari penyajian penguatan yang dihasilkannya perbedaan pada taraf respons (respons rate), yaitu taraf penekanan tuas oleh tikus tadi, maupun pada taraf penghapusan (extinctionrate), yaitu terhapusnya perilaku penekanan tuas. Jadwal penguatan inilahyang membuat Operant Conditioning menjadi bentuk belajar yang sangatFleksibel. Setiap respons yang pada suatu saat dapat dibiasakan dan dapat juga diakhiri sesuai dengan keinginan kita, dan ini tercapai dengan melalui beragam jadwal pengautan.
    Penguatan dapat dialakukkan kepada perilaku entah melalui jadwal yang berkesinambungan atau sebentar-sebentar. Dalam jadwal-penguatan-berkesinambungan (continous schedule), organisme diperkuat untuk setiap responnya. Jenis penjadwalan ini dapat meningkatkan frekuensi respons sekalipun pemakaian penguat kadang-kadang tidak efisien. Skinner kemudian mengusulkan jadwal-penguatan sebentar-sebentar (intermittent schedules) yang bukan hanya lebih effisien menggunakan penguat, tetapi juga menghasilkan respons yang lebih resisten terhadap pemadaman. Melaui intermittent schedule Skinner mengidentifikasi dua macam penguatan yaitu penguatan berjangka (Interval reinforcement ) dan penguatan berbanding ( ratio reinforcement).
·                      Interval reinforcement adalah penguatan yang dijadwalkan atau yang muncul pada interval waktu yang telah ditentukan. Contoh: seseorang memutuskan untuk memberikan permen  hanya jika orang tersebut  tetap diam  selama lima menit. Setelah itu baru diberikan permen, tidak ada penguatan tambahan yang diberikan sampai berlalu lima menit berikutnya.

·                  Ratio reinforcement adalah penguatan yang muncul setelah sejumlah respon tertentu. Contoh: seseorang akan memberikan permen pada seoranganak apabila anak tersebut menampilkan perilaku patuh, setelah anak tersebutpatuh kemudian diberikan permen tersebut dan terus seperti itu sehingga anaktersebut benar-benar patuh.
Penjadwalan tersebut terbagi lagi menjadi 4 jenis penguatan jadwal, yakni :
  • Rasio tetap (Fixed ratio), dimana penguatan tergantungpada sejumlah respon yang terbatas. Artinya, mengatur pemberian reinforcement sesudah respon yang dikehendaki muncul yang kesekian kalinya. Misalnya, Pekerja diberikan bonus apabila mampu menghasilkan produk sesuai target dengan kualitas produk yang sesuai dengan standar (mampu mengikuti prosedur)
    Tujuan
    , membentuk perilaku bekerja yang efektif dan dengan tetap memperhatikan kualitas
    Reinforcement
    , bonus
  • Rasio yang dapat berubah (variable ratio), dimana sejumlah respon yang dibutuhkan  untuk penguatan yang berbeda-berbeda dari satu penguatan ke penguatan berikutnya. Misalnya, Pemberian bonus pada pekerja dilakukan secara acak yaknipada periode tertentu pekerja diberikan bonus apabila mampu memberikan performa kerja yang ramah dan menghasilkan produk berjumlah 1000 unit, namun pada periode yang lain pekerja diberikan bonus apabila telah mampu menghasilkan produk 2000 unit, dan pada waktu yang lain pekerja mendapatkan bonus saat mampu menghasilkan produk 2500 unit.
    Tujuan,
    membentuk perilaku bekerja dengan tidak selalu bergantung kepada bonus karena bonus akan diberikan sewaktu-waktu sehingga pekerja cenderung akan menampilakan performa kerjanya yang paling maksimal.
    Reinforcement, bonus
  • Interval tetap (fixed interval), dimana  suatu responmenghasilkan penguatan setelah jangka waktu tertentu (khusus).Misalnya, Ujian tengah semester diberikan pada pertengahan semester (waktu telah ditentukan). Mahasiswa akan belajar lebih sungguh-sungguh saat menjelang ujian agar mendapat nilai yang baik.
    Tujuan,
    membentuk perilaku belajar.Reinforcement,  nilai yang baik (A)
  • Interval yang dapat berubah (variable interval), dimana penguatan tergantung pada waktu dan  suatu respon, tetapiwaktu antara penguatan berbeda-beda. Artinya, reinforcement diberikkan dalam waktu yang tidak menentu, tetapi jumlah atau rata-rata penguat yang diberikkan sama dengan pengaturan tetap.Misalnya, dosen yang memberikan kuis tiba-tiba dalam perkuliahan sehingga mahasiswa diharapkan selalu belajar agar apabila diadakan kuis mendadak mereka akan siap dan dapat meraih nilai yang baik
    Tujuan,
    membentuk perilaku belajar mahasiswa
    Reinforcement, nilai yang baik (A)

                              /-->      Fixed Ratio
                       Ratio
                      /        \ -->     Variable Ratio
                     /
Reinfocement
                    \
                     \            /-->      Fixed interval
                      Interval
                                  \-->       Variable Interval

Extinction (pemadaman)
       Meskipun sudah dipelajari, respons masih dapat padam karena empat alasan berikut :
  1. Respons bisa dilupakkan dalam beberapa waktu
  2. Respons dapat hilang jika ada campur tangan dari proes pembelajaran lain sebelum atau sesudahnya
  3. Respon dapat hilang akibat penghukuman
  4. Kecenderungan respon yang sudah diperoleh sebelumnyauntuk menjadi progresif dan melemahkan respon sesudahnya yang sudah tidak lagimendapatkan penguatan
Prinsip dari extinction dalampengkondisian operan adalah penahanan pemberian reinforcement atau penghentian pemberian reinforcement, artinya bila respon yang diinginkanterjadi, maka respon tersebut tidak diikuti dengan pemberian reinforcement. Pada percobaan Skinner diatas, penekanan tuas tidak lagi diikuti dengan munculnya makanan, maka secara bertahap perilaku menekan tuas pada tikus akan hilang Generalisasi Stimulus     
Unconditional Response dalam pengkondisian klasikal, cenderung untuk muncul bila dihadapkan pada US (Unconditioned Stimulus) yang mirip.
Demikian juga halnya dengan Pengkondisian Operan. Bila stimulus atau event yang mengawali suatu respon itu mirip, maka perilaku (respon) yang sama cenderung untukmuncul. Contohnya dapat kita lihat dalam penelitian Skinner terhadap seekor burung merpati dalam kotak. Dalam kotak tersebut ada "kunci" yangdapat diterangi oleh lampu. Saat lampu dinyalakan (dan menerangi"kunci") burung mematuk "kunci" tersebut, maka makanan akanmengalir dari lubang di bawah kunci. Untuk kepentingan penelitian generalisasi stimulus, lampu yang menerangi "kunci" diubah-ubah intensitasnya.Besar kecilnya peningkatan tergantung dari kedekatan atau kemiripan stimulus atau situasi yang menimbulkan respon.
Stimulus Diskriminasi
Diskriminasi stimulus bertujuan agar subjek dapat melakukan perbedaan terhadap stimulus atausituasi yang dihadirkan agar subjek hanya melakukan respon terhadap stimulusatau situasi yang sesuai. Dalam pengkondisian operan, diskriminasi stimulus dilakukan dengan pemberian reinforcement terhadap respon yang diinginkan dalam suatu situasi atau stimulus yang sesuai dan tidak memberikan reinforcement bila respon tersebut muncul dalamsituasi yang tidak sesuai. Contohnya pada percobaan burung merpati tadi. Makanan sebagai reinforcer hanya diberikan bila yang menyala lampu hijau. Sedangkan bila yang menyala lampu merah, reinforcer tidak diberikan. Pemasangan lampu merah dan hijau ini dilakukan secara berturut-turut, hijau-merah-hijau-merah, dst, atau makanan-tidakada-makanan-tidak ada, dst. Oleh karena itu teknik ini disebut dengan prosesdikriminasi "go-no-go".
Reinforcement Negative dan Escape Learning
Escapelearning adalah prosesbelajar yang didasarkan pada pengkondisian operan dengan teknik pemberianreinforcer negatif. Contohnya dapat kita lihat melalui penelitian terhadapseekor tikus di dalam kotak percobaan yang terdiri dari sebuah kandang yangmemiliki dua tingkat tempat tikus berdiri. Bila tikus turun dari tingkat keduake tingkat pertama, maka tikus akan mengalami kejutan listrik. Oleh sebab itu tikus berusaha untuk naik kembali ke tingkat dua. Perilaku seperti itulah yangdisebut dengan proses belajar escape (melarikan diri) yangdidasarkan pada pemberian reinforcer negatif pada pengkondisian operan.
Avoidance Learning
Avoidance learning adalah proses belajar untuk menghindari reinforcement negatif. Caranya dengan menghadirkan suatu stimulus sebelum pemberian reinforcer negatif. Pada contoh percobaan di atas, tikus diberi sebuah bel atau buzzer sebelumdiberi kejutan listrik. Setelahterjadi proses belajar, dengan mendengar buzzer saja tikus sudah berusaha naik ke tingkat dua agar tidak terkena kejutan listrik. Oleh karena itu proses belajar yang demikian disebut dengan avoidance learning (proses belajar untuk menghindarkan diri dari reinforcer negatif)
Punishment
Punisher adalah stimulus atau kejadian dimana jika diberikan pada suatu respon akan menurunkan kemungkinan respon tersebut akan muncul kembali.
Punishment  adalah penggunaan punisher untuk menekan atau menghentikan suatu trespon agar tidak muncul kembali.
Positive Punishment (juga disebut "Hukuman dengan rangsangan tidak terduga") muncul ketika suatu prilaku (respon) diikuti oleh suatu rangsangan tidak menyenangkan, sepertimemperkenalkan setruman atau suara keras, menghasilkan prilaku yang tidak diinginkan berkurang atau seseorang dipukul karena salah.
Negative Punishment (juga disebut "Hukuman dengan pengambilan tidakterduga" muncul ketika suatu perilaku (respon) diikuti dengan membuang rangsangan yang menyenangkan, seperti mengambil mainan anak-anak bersama perilaku yang tidak diinginkan, menghasilkan perilaku yang tidak diinginkan berkurang, pemotongan uang jajan.

2 komentar: