Minggu, 08 Januari 2012

VALIDITAS INTERNAL DAN EXTERNAL PADA PENELITIAN EXPERIMEN


Donald Campbell dan Julian Stanley menulis sebuah makalah lama yang membedakan antar model-model experimen yang berkenaan dengan validitas-validitas internalnya. Adapun bvaliditas internal sebuah experiment adalah perpanjangan variable-variabel tambahan yang telah dikontrol oleh peneliti. Jika variable tambahan tidak dikontrol dalam proses experimennya, maka kita tidak dapat mengetahui apakah perubahan-perubahan yang diamati pada beberapa tahap experiment merupakan penyebab perlakuan experiment atau merupakan sekedar variable tambahan.
Untuk mendemonstrasikan pentingnya upaya kontrol/pengamatan pada variable-variabel tambahan itu, kita seyogyanya menyadari bahwa satu saja masalah penelitian akan mempengaruhi analisa experimennya nanti. Seperti contoh, seorang peneliti sebaiknya mengevaluasi keefektifan program pengembangan kemampuan baca yang baru saja diterapkan (program remedial). Pada tahun pertama, dia (peneliti) memilih 100 siswa  untuk ikut program tersebut (program pengembangan kemampuan baca); semua siswa tersebut memenuhi persyaratan skor tertentu setidaknya dua angka dibawah angka normal pada tes kemampuan baca. Setelah ikut dalam program remedial pada tahun pertama, kemudian sekali lagi siswa tersebut diberikan tes kemampuan baca. Peneliti mungkin menduga menemukan prestasi yang lebih besar, secara statistik telah terjadi peningkatan hasil yang signifikan (hal tersebut ditentukan dari kedua tes yang sebelumnya sudah dilakukan).

Dapatkan peneliti itu menyimpulkan bahwa prestasi yang dicapai disebabkan oleh perlakuan experiment yang mana yang dimaksud yaitu program remedial baca? Jawabannya adalah Tidak. Peneliti itu tidak bisa semaunya menyimpulkan sebab dan akibatnya kecuali memperhatikan secara saksama variable tambahan yang ada. Variable tambahan mengacu pada aspek-aspek situasi yang terjadi pada saat perlakuan experiment sedang berlangsung; aaspek-aspek tersebut memungkinkan tidak relepan dengan perlakuan, akan tetapi keduanya terjadi secara beriringan maka bisa digabungkan. Campbell dan Stanley mengidentifikasi 8 tipe variable tambahan, beberapa diantaranya berkaitan dengan experiment yang sudah kita kenal sebelumnya. Variabel-variabel tersebut sebagai berikut:
1.    Sejarah. Perlakuan experiment menambah beberapa waktu, sambil menyediakan selang waktu untukperistiwa  yang lain terjadi disamping perlakuan experiment tersebut. Siswa-siswa yang dijadikan sampel ikut dalam program remedial sepanjang tahun mereka disekolah. Ini bisa berarti beberapa factor seperti instruksi guru ke muridnya, bisa ditentukan semua atau sebagai bagian dari prestasi mereka capai.
2.    Kedewasaan. Sementara perlakuan experiment sedang berlangsung, proses biologi dan psikologi diantara siswa juga akan terjadi. Mereka mungkin menjadi lebih dewasa, kuat, lebih kognitif konflex, lebih percaya diri, atau bahkan lebih pengecut. Selang beberapa waktu saat program remedial berjalan, siswa-siswaakan berkembang fisiknya, sosialnya dan juga intelektualnya. Dari pada program remedial, kedewasaan memungkinkan siswa bisa mengatasi kekurangan kemampuan baca mereka.
3.    Tes. Di banyak experiment pendidikan, pretest selalu dilakukan, yang diikuti oleh perlakuan experiment dan kemudian posttest. Jika kedua tes hasilnya sama, maka siswa mungkin menunjukkan peningkatan sederhana seperti efek dari pengalamannya saat pretest, yang seperti ini mereka sudah “sadar atas tes”. Nah, sehubungan dengan contoh penelitian, sepertinya variable tambahan sedang berlaku disebabkan waktu selang yang panjang antara pretest dan posttest.
4.    Instrumentasi. Hasil belajar bisa diamati dari pretest dan posttest sebab secara alamiyah alat ukurnya juga berubah. Anggap saja dalam contoh penelitian kita siswa-siswanya sudah dibeda-bedakan, yang lebih mudah di posttest dibandingkan dengan yang di pretestnya. Hasil pencapaian bisa menandai instrumen tesnya dari pada efek yang disebabkan ke perlakuan experiment. Dalam experiment yang mencakup pengukuran observasi, efek instrumentasi bisa menjadi satu masalah: yaitu observer/pengamat yang menilai guru atau siswa sebelum dan sesudah sebuah perlakuan  experiment mungkin dilakukan untuk memberikan rating yang baik kedua kali nya sebab mereka berharap sebuah perubahan akan terjadi.
5.    Kemunduran Statistik. Kapanpun prosedur tes dan pengulangan tes digunakan untuk menilai perubahan sebagai efek sebuah perlakuan experiment, kemungkinan adanya penurunan tingkat statistic bisa saja terjadi sementara proses observasi belajar berlangsung. Kita tidak akan memakai matematika dasar untuk mengukur penurunan statistik tersebut, akan tetapi cukup dengan menentukan efeknya pada skor tes nanti. Contoh: sekelompok siswa dipilih siapa yang  berada pada angka 15 per seratus kemampuan bacanya. Jika siswa yang sama dites sekali lagi dengan tes yang sama (tes lain yang dikaitkan dengan tes yang pertama), maka mereka aka mendapatkan skor tinggi sebab penurunan statistic, dengan atau tanpa campurtangan perlakuan experiment. Lebih lanjut, jika sekelompok siswa yang lain dipilih yang memperoleh skor paling tinggi pada tes yang pertama, contoh, yang dapat 85 per seratus, maka siswa-siswa tersebut akan memperoleh  skor yang lebih rendah ketika dites yang ukuran yang sama, sekali lagi hal ini disebabkan penurunan statistik. Seorang peneliti sebaiknya siap atas efek buruk yang disebabkan oleh penurunan angka statistik kapanpun siswa-siwa dipilih menurut nilai-nilai pada tes awal yang kemudian akan di tes lagi dengan ukuran yang sama pada tes sebelumnya. Sesuai dengan tes lagi (kedua), penurunan selalu cenderung untuk pindah dari skor subjeknya ke rata-rata nilainya. Kemungkinan penurunan bisa ditaksir dan disadari nanti pada hasilnya.
6.    Seleksi yang berbeda. Pada model-model experiment yang mana kelompok kontrol itu digunakan, efek perlakuan kadangkala bisa dikacaukan sebab pemilahan yang berbeda antara siswa yang masuk di kelompok experiment dan yang masuk di kelompok kontrol. Anggap saja pada penelitian kita, siswa-siswa harus memenuhi syarat harus berada pada angka 15 perseratus kemampuan bacanya dan syarat kedua secara sukarela ikut dalam program remedial. Kemudian anggap saja prestasi yang dicapai kelompok ini dibandingkan dengan siswa di kelompok kontrol yang mempunyai kekurangan baca yang sama tapi mereka tidak secara sukarela ikut dalam program tersebut. Jika kelompok experiment lebih bisa menunjukkan perkembangan yang memuaskan dari pada yang ada di kelompok kontrol, maka bisa dipastikan efek “semangat sukaarela” lebih besar dibandingkan perlakuan experiment itu sendiri. Untuk menghindari efek kekacauan ini, maka seorang peneliti butuh untuk memilih kelompok experiment dan kelompok kontrol yang ditidak dibedakan kecuali untuk menerapkan perlakuan experiment. Cara yang terbaik untuk menyelesaikan kondisi ini menempatkan subjek secara acak kedalam dua kelompok.
7.    Kematian experiment (kadang ini merujuk pada penurunan). Variable tambahan ini lebih operatif pada contoh penelitian kita jika terdapat prasangka yang sistematis pada setiap tipe siswa yang diikutkan pada program remedial pada setiap tahunnya. Contoh, beberapa siswa kemungkinan meninggalkan program sebab mereka merasa mereka tidak mengalami peningkatan kemampuan (pencapaian). Jika kemudian peneliti hanya mengukur pencapaian prestasi terhadap siswa-siswa tersebut yang menyelesaikan program, maka keefektifan perlakuan experiment bisa jadi dilebih-lebihkan. Untuk menghindari kesalahan ini, pertama-tama perlu untuk mengukur hasil pencapaiannya semua siswa yang masuk program remedial baik mereka sempat menyelesaikannya maupun tidak; kemudian hasil pencapaian mereka dibandingkan dengan kelompok kontrol yang sesuai. Prosedur-prosedurnya sudah dikembangkan dalam menganalisa data penelitian untuk menentukan apakah prasangka sistematis tersebut yang tanpa disertai subjek dari kelompok experiment dan kelompok kontrol telah terjadi.
8.    Interaksi seleksi kedewasaan. Variable tambahan ini hampir sama dengan seleksi yang berbeda (lihat nomor 6), kecuali kedewasaan merupakan variable yang kacau. Seandainya siswa-siswa dikelas 1 dari satu sekolah dikabupaten dipilih dan dimasukkan dalam program remedial. Sedangkan kelompok kontrol diambil dari populasi kelas 1 juga yang berasal dari sekolah dikabupaten lain. Sebab kebijakan admisi yang berbeda, menyebabkan siswa pada umur rata-rata yang berada pada kelompok kontrol adalah 6 bulan lebih tua dari pada kelompok experiment. Nah, sekarang seandainya hasil penelitian menunjukkan kelompok experiment lebih mendapatkan pencapaian yang gemilang dari pada kelompok kontrol. Bagaimana caranya kita bisa menjelaskan hasil tersebut? Apakah mereka mengindikasikan bahwa perlakuan experiment itu efektif, atau apakah mereka menunjukkan bahwa pencapaian kemampuan baca pada siswa-siswa yang lebih muda itu adalah dipengaruhi oleh factor kedewasaan dibandingkan siswa-siswa yang sedikit lebih tua? Karena tugas berbeda pada siswa yang berbeda kedewasaannya dalam kelompok experiment dan kelompok kontrol, ini tidak jelas mana penjelasan alternatif ini yang benar.
Pada poin ini kita mengajukan untuk memperluas  penjelasan Campbell dan Stanley dengan cara menambahkan kurang lebih dua variable tambahan lagi yang memungkinkan dapat mengancam validitas internal experiment.
9.     Efek Jhon Hendry. Kita sebelumnya sudah membahas efek Jhon Hendry dapa Bab 6. Efek ini merujuk pada situasi dimana subjek kelompok kontrol tampil lebih dari yang biasanya sebaba mereka mengira bahwa mereka berada dalam situasi kompetitif dengan kelompok experiment. Jika phenomena ini muncul, perbedaan yang diobservasi, atau tidak ada perbedaaan antara perlakuan experiment dan kelompok control dalam posttest lebih bisa dihubungkan dengan motivasi kelompok control daripada efek perlakuan.
10. Difusi perlakuan experiment. Jika kondisi perlakuan dirasa relative diinginkan untuk kondisi control, maka anggota dari kelompok control akan mencari jalan ke kondisi perlakuan. Difusi perlakuan experiment secara khusus jikalau subjek kelompok experiment dan control lebih dekat satu sama lainnya. Contoh, beberapa guru di sebuah sekolah (disebut kelompok perlakuan) mungkin terdorong untuk menggunakan kurrikulum yang lebih inofatif dan atraktif, sedangkan beberapa guru yang lain disekolahan yang sama (disebut dengan kelompok control) mungkin terdorong menggunakan kurikulum yang ada. Sebagai kemajuan experiment, beberapa guru di kelompok control boleh jadi mendiskusikan kurrikulum baru dengan guru-guru di kelompok perlakuan. Meskipun sebenarnya tidak diinstrusikan untuk melakukan hal tersebut. Mereka bahkan meminjam beberapa materi dan aktivitas untuk pergunakan di kelas mereka. Sehingga, selang waktu perlakuan terjadi difusi untuk kelompok control.
Jika difusi perlakuan experiment terjadi, maka efek perlakuan pada posttest akan sedikit lamur. Untuk mengatasi masalah ini, seorang peneliti sebaiknya mencoba mengatur kondisi-kondisi tersebut sehingga kontak antara kelompok experiment dan kelompok control bisa diminimalisir. Juga, dia (peneliti) bisa langsung memberitahukan anggota-anggota setiap kelompoknya untuk tidak berbicara satu sama lainnya tentang experimen sementara dalam proses penelitian. Setelah experiment selesai, peneliti dianjurkan untuk mewawancarai beberapa atau semua sampel untuk menentukan apakah terjadi difusi perlakuan experiment dalam bentuk apapun.
Nah, kita sudah paham sekarang bagaimana sepuluh jenis variable tambahan yang berbeda bisa mengancam validitas internal sebuah experiment. Ini sangat penting bagi seorang peneliti untuk  memilah model experiment yang cocok yang bisa mengontrol factor-faktor ini. Dengan control experiment yang baik, maka perubahan-perubahan apapun dapat diatasi dengan lebih menekankan pada perlakuan experiment dari pada pada variable tambahan.
Sebagaimana telah kita pelajari sebelumnya, seorang peneliti pendidikan akan menghadapi banyak potensi ancaman di validitas internal experiment nya. Variasi-variasi pengawasan dibutuhkan sehingga efek perlakuan experiment tidak diganggu oleh variable tambahan. Bagaimanapun juga, seorang peneliti pendidikan dihadapkan pada dilemma dimana pengawasan yang ketat betul-betul dibutuhkan, sebab keteledoran bisa saja terjadi saat experiment dan di situasi yang berkaitan lainnya. Dengan kata lain, ilmu social (behavioral science) secara konstan dihadapkan dengan pilihan untuk melakukan pengawasan laboratorium yang tegas dengan alasan realisme biaya atau mempertahankan situasi experiment yang benar dalam upaya untuk mengurangi kekakuan keilmuan di dalam prosesnya nanti. Kebanyakan kajian bertujuan pada disetujui diantara tujuan-tujuannya. Mereka berusaha untuk mencapai kekakuan yang secukupnya untuk membuat hasilnya bisa diterima sementara dia mempertahankan sedikit realismenya untuk membuat hasilnya layak ditransfer ke situasi pendidikan pada bidangnya.
Campbell dan Stanley mengidentifikasi ada empat factor yang mempengaruhi kemampuan generalisasi terhadap temuan-temuan dalam experiment – yang kemudian mereka sebut dengan validitas external experiment. Validitas External merupakan perluasan dimana temuan-temuan di experiment bisa diaplikasikan kedalam pengaturan tertentu. Ini memungkinkan untuk temuan-temuan pada experiment pendidikan menjadi valid secara external untuk  salah satu keadaan sedangkan tidak sepenuhnya valid  secara external untuk keadaan yang lainnya dan sama sekali tidak valid secara external pada beberapa keadaan yang lain.
Glenn Bracht dan Gene Glass lebih lanjut membedakan empat factor umum menurut Campbell dan Stanley kedalam sumber yang spesifik terhadap validitas external. Sesi selanjutnya adalah gambaran deretan factor-faktor yang dikemukakan oleh Bracht dan Glass yang mempengaruhi kemampuan generalisasi terhadap temuan-temuan dalam experiment.

Tidak ada komentar:

Posting Komentar