Operant Conditioning
Dalam salah satu
eksperimennya, Skinner menggunakan seekor tikus yang ditempatkan dalam sebuah
peti yang disebut dengan Skinner Box. Kotak Skinner ini berisi dua macam
komponen pokok, yaitu manipulandum dan alat pemberi reinforcement yang antara
lain berupa wadah makanan. Manipulandum adalah komponen yang dapat dimanipulasi
dan gerakannya berhubungan dengan reinforcement. Komponen ini terdiri dari
tombol, batang jeruji, dan pengungkit.
Dalam eksperimen
tadi mula-mula tikus itu mengeksplorasi peti sangkar dengan cara lari kesana
kemari, mencium benda-benda yang ada disekitarnya, mencakar dinding, dan
sebagainya. Tingkah laku tikus yang demikian disebut dengan ‘’ emmited behavior
” (tingkah laku yang terpancar), yakni tingkah laku yang terpancar dari
organism tanpa memedulikan stimulus tertentu. Kemudian salah satu tingkah laku
tikus (seperti cakaran kaki, sentuhan moncong) dapat menekan pengungkit.
Tekanan pengungkit ini mengakibatkan munculnya butir-butir makanan ke dalam
wadahnya.
Butir-butir
makanan yang muncul merupakan reinforce bagi tikus yang disebut dengan tingkah
laku operant yang akan terus meningkat apabila diiringi reinforcement, yaitu
penguatan berupa butiran-butiran makanan kedalam wadah makanan.
Teori belajar
operant conditioning ini juga tunduk pada dua hukum operant yang berbeda
lainnya, yaitu law operant conditioning dan law extinction. Menurut hukum
operant conditioning, jika suatu tingkah diriingi oleh sebuah penguat
(reinforcement), maka tingkah laku tersebut meningkat. Sedangkan menurut hukum
law extinction, jika suatu tingkah laku yang diperkuat dengan stimulus penguat
dalam kondisioning, tidak diiringi stimulus penguat, maka tingkah laku tersebut
akan menurun atau bahkan musnah. Kedua hukum ini pada dasarnya juga memiliki
kesamaan dengan hukum pembiasaan klasik (classical conditioning).
Skinner membedakan perilaku atas
:
- · Perilaku alami (innate behavior), yang kemudiandisebut juga sebagai clasical ataupun respondent behavior, yaitu perilaku yangdiharapkan timbul oleh stimulus yang jelas ataupun spesifik, perilaku yangbersifat refleksif.
- Perilaku operan (operant behavior), yaitu perilakuyang ditimbulkan oleh stimulus yang tidak diketahui, namun semata-mataditimbulkan oleh organisme itu sendiri setelah mendapatkan penguatan.
Skinner yakin
jika kebanyakan perilaku manusia dipelajari lewat Operant Conditioning atau
pengkondisian operan, yang kuncinya adalah penguatan segera terhadap respons.
Operant Conditioning adalah suatu proses penguatan perilaku yang
dapatmengakibatkan perilaku tersebut dapat berulang kembali atau menghilang
sesuaidengan keinginan.
Skinner membuat
mesin untuk percobaanya dalam Operant Conditioning yang dinamakan
dengan"Skinner Box" dan tikus yang merupakan subjek yang sering
digunakandalam percobaanya.
Dalam
percobaannya tersebut yang dilakukan oleh Skinner dalam Laboratorium, seekor
tikus yang lapar diletakkan dalam Skinner Box, kemudian binatang tersebut akan
akanmenekan sebuah tuas yang akan membukakan dulang makanan, sehingga
diperolehpenguatan dalam bentuk makanan. Di dalam setiap keadaan, seekor
binatang akanmemperlihatkan bentuk perilaku tertentu; tikus tadi misalnya,
akanmemperlihatkan perilaku menyelidik pada saat pertama kali masuk kedalam
Box,yaitu dengan mencakar-cakar dinding dan membauinya sambil melihat-lihat
kesekelilingnya. Secara kebetulan, dalam perilaku menyelidik tersebut
tikusmenyentuh tuas makanan dan makanan pun berjatuhan. Setiap kali tikus
melakukanhal ini akan mendapatkan makanan; penekanan tuas diperkuat dengan
penyajian makanan tersebut, sehingga tikus tersebut akan menghubungkan perilaku
tertentudengan penerimaan imbalan berupa makanan tadi. Jadi, tikus tersebut
akanbelajar bahwa setiap kali menekan tuas dia akan mendapatkan makanan dan
tikustersebut akan sering kali mengulangi perilakunya, sampai ada proses
pemadamanatau penghilangan dengan menghilangkan penguatannya.
Dalam
eksperimen Skinner tersebut terdapat istilah Penguatan atau dapat disebut
sebagai reinforcementyaitu, setiap kejadian yang meningkatkan ataupun
mempertahankan kemungkinan adanya respon
terhadap kemungkinan respon yang diinginkan. Biasanya yangberupa penguat adalah
sesuatu yang dapat menguatkan dorongan dasar (basicdriver, seperti makanan yang
dapat memuaskan rasa lapar atau air yang dapatmenuatkan rasa haus) namun tidak
harus selalu demikian.
Pada manusia, penguatan
sering salah sasaran sehingga pembelajaran menjadi tidak effisien. Masalah lain
dengan pengkondisian manusia adalah penentuan manakahkonsekuansi-konsekuensi
yang menguatkan dan manakah yang melemahkan. Karena bergantung pada sejarah
individu, penguatan dan disiplin terkadang dapatmenjadi penguatan sedangkan
ciuman dan pujian dapat menjadi hukuman.
Dalam
penguatantersebut dibedakan antara pengutan positif dan negatif.
- Penguatan positif adalah stimulus yang apabila diberikan sesudah terjadinya respon, meningkatkan kemungkinan respon tersebut.
-> Respon 1
/
S
(Rangsang) ---> Respon 2 --> Penguatan
\
-> Respon 3
Menjadi :
S(Rangsang) --> Respon 2 berulang-ulang
- Penguatan negatif adalah stimulus yang dihapuskan sesudah responnyatimbul, meningkatkan kemungkinan adanya respon; shock elektrik dan bunyi yangmenyakitkan digolongkan sebagai penguat negatif dan sebagai penguat negatifjika penguat itu dapat ditiadakan ketika timbul respon yang diinginkan.
-> Respon 1 --> Shock elektrik
/
S
(Rangsang) --> Respon2
\
-> Respon3 --> Shock elektrik
Menjadi :
S
(Rangsang) --> Respon2
Adapun
Jenis-Jenis Penguat Skinner dikategorikan, sbb;
- Penguat utama (Primary reinforcers) adalah penguat yang memengaruhi perilaku tanpa perlu belajar, seperti: makanan, minuman, seks. Ini disebut penguat alami.
- Penguat sekunder (Secondar reinforcers). Adalah penguat yang membutuhkan tenaga penguat karena sudah diasosiasikan dengan penguat utama, seperti memuji seseorang.
Tadi telah diuraikan bahwa bagaimana seekor tikus dalam Skinner Box yang menekan tuas akan menerima butir-butir makanan setiap kali tikus tersebut melakukannya. Apabila kita menghentikan pemberian penguatan ini, perilaku penekanan tuas pun secara bertahap akan menghilang, biasanya hanya beberapa menit setelahpenghentian penguatan. Apa yang membuat Operant Conditioning ini penting untuk menjelaskan belajar adalah pengembangan jadwal penguatan yang dilakukanoleh Skinner. Jadwal ini merupakan bentuk lain dari penyajian penguatan yang dihasilkannya perbedaan pada taraf respons (respons rate), yaitu taraf penekanan tuas oleh tikus tadi, maupun pada taraf penghapusan (extinctionrate), yaitu terhapusnya perilaku penekanan tuas. Jadwal penguatan inilahyang membuat Operant Conditioning menjadi bentuk belajar yang sangatFleksibel. Setiap respons yang pada suatu saat dapat dibiasakan dan dapat juga diakhiri sesuai dengan keinginan kita, dan ini tercapai dengan melalui beragam jadwal pengautan.
Penguatan dapat
dialakukkan kepada perilaku entah melalui jadwal yang berkesinambungan atau
sebentar-sebentar. Dalam jadwal-penguatan-berkesinambungan (continous
schedule), organisme diperkuat untuk setiap responnya. Jenis penjadwalan ini
dapat meningkatkan frekuensi respons sekalipun pemakaian penguat kadang-kadang
tidak efisien. Skinner kemudian mengusulkan jadwal-penguatan sebentar-sebentar
(intermittent schedules) yang bukan hanya lebih effisien menggunakan penguat,
tetapi juga menghasilkan respons yang lebih resisten terhadap pemadaman. Melaui
intermittent schedule Skinner mengidentifikasi dua macam penguatan yaitu
penguatan berjangka (Interval reinforcement ) dan penguatan berbanding ( ratio
reinforcement).
· Interval reinforcement adalah penguatan yang
dijadwalkan atau yang muncul pada interval waktu yang telah ditentukan. Contoh:
seseorang memutuskan untuk memberikan permen
hanya jika orang tersebut tetap
diam selama lima menit. Setelah itu baru
diberikan permen, tidak ada penguatan tambahan yang diberikan sampai berlalu
lima menit berikutnya.
· Ratio reinforcement adalah penguatan yang muncul
setelah sejumlah respon tertentu. Contoh: seseorang akan memberikan permen pada
seoranganak apabila anak tersebut menampilkan perilaku patuh, setelah anak
tersebutpatuh kemudian diberikan permen tersebut dan terus seperti itu sehingga
anaktersebut benar-benar patuh.
Penjadwalan tersebut terbagi lagi
menjadi 4 jenis penguatan jadwal, yakni :
- Rasio
tetap (Fixed ratio), dimana penguatan tergantungpada sejumlah respon yang
terbatas. Artinya, mengatur pemberian reinforcement sesudah respon yang
dikehendaki muncul yang kesekian kalinya. Misalnya, Pekerja diberikan bonus
apabila mampu menghasilkan produk sesuai target dengan kualitas produk yang
sesuai dengan standar (mampu mengikuti prosedur)
Tujuan , membentuk perilaku bekerja yang efektif dan dengan tetap memperhatikan kualitas
Reinforcement, bonus
- Rasio
yang dapat berubah (variable ratio), dimana sejumlah respon yang
dibutuhkan untuk penguatan yang berbeda-berbeda
dari satu penguatan ke penguatan berikutnya. Misalnya, Pemberian bonus pada
pekerja dilakukan secara acak yaknipada periode tertentu pekerja diberikan
bonus apabila mampu memberikan performa kerja yang ramah dan menghasilkan
produk berjumlah 1000 unit, namun pada periode yang lain pekerja diberikan
bonus apabila telah mampu menghasilkan produk 2000 unit, dan pada waktu yang
lain pekerja mendapatkan bonus saat mampu menghasilkan produk 2500 unit.
Tujuan, membentuk perilaku bekerja dengan tidak selalu bergantung kepada bonus karena bonus akan diberikan sewaktu-waktu sehingga pekerja cenderung akan menampilakan performa kerjanya yang paling maksimal.
Reinforcement, bonus
- Interval
tetap (fixed interval), dimana suatu
responmenghasilkan penguatan setelah jangka waktu tertentu (khusus).Misalnya,
Ujian tengah semester diberikan pada pertengahan semester (waktu telah
ditentukan). Mahasiswa akan belajar lebih sungguh-sungguh saat menjelang ujian
agar mendapat nilai yang baik.
Tujuan, membentuk perilaku belajar.Reinforcement, nilai yang baik (A)
- Interval
yang dapat berubah (variable interval), dimana penguatan tergantung pada
waktu dan suatu respon, tetapiwaktu
antara penguatan berbeda-beda. Artinya, reinforcement diberikkan dalam waktu
yang tidak menentu, tetapi jumlah atau rata-rata penguat yang diberikkan sama
dengan pengaturan tetap.Misalnya, dosen yang memberikan kuis tiba-tiba dalam
perkuliahan sehingga mahasiswa diharapkan selalu belajar agar apabila diadakan
kuis mendadak mereka akan siap dan dapat meraih nilai yang baik
Tujuan, membentuk perilaku belajar mahasiswa
Reinforcement, nilai yang baik (A)
/--> Fixed Ratio
Ratio
/ \ --> Variable Ratio
/
Reinfocement
\
\ /--> Fixed interval
Interval
\--> Variable Interval
Extinction (pemadaman)
Meskipun sudah
dipelajari, respons masih dapat padam karena empat alasan berikut :
- Respons bisa dilupakkan dalam beberapa waktu
- Respons dapat hilang jika ada campur tangan dari proes pembelajaran lain sebelum atau sesudahnya
- Respon dapat hilang akibat penghukuman
- Kecenderungan respon yang sudah diperoleh sebelumnyauntuk menjadi progresif dan melemahkan respon sesudahnya yang sudah tidak lagimendapatkan penguatan
Prinsip dari
extinction dalampengkondisian operan adalah penahanan pemberian reinforcement
atau penghentian pemberian reinforcement, artinya bila respon yang
diinginkanterjadi, maka respon tersebut tidak diikuti dengan pemberian
reinforcement. Pada percobaan Skinner diatas, penekanan tuas tidak lagi diikuti
dengan munculnya makanan, maka secara bertahap perilaku menekan tuas pada tikus
akan hilang Generalisasi Stimulus
Unconditional Response dalam pengkondisian klasikal, cenderung untuk muncul bila dihadapkan pada US (Unconditioned Stimulus) yang mirip.
Demikian juga halnya
dengan Pengkondisian Operan. Bila stimulus atau event yang mengawali suatu
respon itu mirip, maka perilaku (respon) yang sama cenderung untukmuncul.
Contohnya dapat kita lihat dalam penelitian Skinner terhadap seekor burung
merpati dalam kotak. Dalam kotak tersebut ada "kunci" yangdapat
diterangi oleh lampu. Saat lampu dinyalakan (dan menerangi"kunci")
burung mematuk "kunci" tersebut, maka makanan akanmengalir dari
lubang di bawah kunci. Untuk kepentingan penelitian generalisasi stimulus,
lampu yang menerangi "kunci" diubah-ubah intensitasnya.Besar kecilnya
peningkatan tergantung dari kedekatan atau kemiripan stimulus atau situasi yang
menimbulkan respon.
Stimulus Diskriminasi
Diskriminasi stimulus
bertujuan agar subjek dapat melakukan perbedaan terhadap stimulus atausituasi
yang dihadirkan agar subjek hanya melakukan respon terhadap stimulusatau
situasi yang sesuai. Dalam pengkondisian operan, diskriminasi stimulus dilakukan
dengan pemberian reinforcement terhadap respon yang diinginkan dalam suatu
situasi atau stimulus yang sesuai dan tidak memberikan reinforcement bila
respon tersebut muncul dalamsituasi yang tidak sesuai. Contohnya pada percobaan
burung merpati tadi. Makanan sebagai reinforcer hanya diberikan bila yang
menyala lampu hijau. Sedangkan bila yang menyala lampu merah, reinforcer tidak diberikan.
Pemasangan lampu merah dan hijau ini dilakukan secara berturut-turut,
hijau-merah-hijau-merah, dst, atau makanan-tidakada-makanan-tidak ada, dst.
Oleh karena itu teknik ini disebut dengan prosesdikriminasi
"go-no-go".
Reinforcement Negative dan Escape
Learning
Escapelearning
adalah prosesbelajar yang didasarkan pada pengkondisian operan dengan teknik
pemberianreinforcer negatif. Contohnya dapat kita lihat melalui penelitian terhadapseekor
tikus di dalam kotak percobaan yang terdiri dari sebuah kandang yangmemiliki
dua tingkat tempat tikus berdiri. Bila tikus turun dari tingkat keduake tingkat
pertama, maka tikus akan mengalami kejutan listrik. Oleh sebab itu tikus
berusaha untuk naik kembali ke tingkat dua. Perilaku seperti itulah yangdisebut
dengan proses belajar escape (melarikan diri) yangdidasarkan pada pemberian
reinforcer negatif pada pengkondisian operan.
Avoidance Learning
Avoidance
learning adalah proses belajar untuk menghindari reinforcement negatif. Caranya
dengan menghadirkan suatu stimulus sebelum pemberian reinforcer negatif. Pada
contoh percobaan di atas, tikus diberi sebuah bel atau buzzer sebelumdiberi
kejutan listrik. Setelahterjadi proses belajar, dengan mendengar buzzer saja
tikus sudah berusaha naik ke tingkat dua agar tidak terkena kejutan listrik.
Oleh karena itu proses belajar yang demikian disebut dengan avoidance learning
(proses belajar untuk menghindarkan diri dari reinforcer negatif)
Punishment
Punisher adalah
stimulus atau kejadian dimana jika diberikan pada suatu respon akan menurunkan
kemungkinan respon tersebut akan muncul kembali.
Punishment adalah penggunaan punisher untuk menekan atau menghentikan
suatu trespon agar tidak muncul kembali.
Positive
Punishment (juga disebut "Hukuman dengan rangsangan tidak terduga")
muncul ketika suatu prilaku (respon) diikuti oleh suatu rangsangan tidak
menyenangkan, sepertimemperkenalkan setruman atau suara keras, menghasilkan
prilaku yang tidak diinginkan berkurang atau seseorang dipukul karena salah.
Negative Punishment
(juga disebut "Hukuman dengan pengambilan tidakterduga" muncul ketika
suatu perilaku (respon) diikuti dengan membuang rangsangan yang menyenangkan,
seperti mengambil mainan anak-anak bersama perilaku yang tidak diinginkan,
menghasilkan perilaku yang tidak diinginkan berkurang, pemotongan uang jajan.