Belajar Blog

Selasa, 01 Februari 2011

VALIDITAS DAN RELIABILITAS


VALIDITAS DAN RELIABILITAS

A.     Validitas
Validitas menunjukkan sejauh mana “ketepatan” dan “kecermatan” suatu alat ukur melakukan fungsinya.
·         Kata “tepat” disini berarti alat ukur yang digunakan itu tidak salah, tidak meragukan. Misalnya bila orang ingin mengukur berat suatu benda, maka ia menggunakan timbangan, karena timbangan adalah alat ukur yang tepat bila dipakai untuk mengukur berat benda. Bila panjang benda yang ingin diukur, maka harus menggunakan alat ukur meteran, karena meteran adalah alat pengukur yang tepat (valid) bila digunakan untuk mengukur panjang.
Dalam hal ini, maka timbangan bukanlah alat pengukur yang tepat (valid) jika digunakan untuk mengukur panjang. Sebaliknya, meteran juga bukanlah alat ukur yang tepat (valid) jika digunakan untuk mengukur panjang. Sebaliknya, meteran juga bukanlah alat ukur yang tepat (valid) jika digunakan untuk mengukur berat.
Jika alat ukurnya tepat (valid), maka error pengukurannya juga kecil.

·         Kata “cermat” di sini berarti bahwa pengukuran itu mampu memberikan gambaran mengenai perbedaan yang sekcil-kecilnya diantara subjek yang satu dengan yang lain. Misalnya, timbangan yang cermat (valid) adalah timbangan yang mampu menyajikan perbedaan berat sekecil-kecilnya. Timbangan emas tentu lebih cermat (valid) mengukur benda daripada sebuah alat penimbang badan.
Jika alat ukurnya cermat (valid), maka error pengkurannya juga kecil.

·         Berarti, jika alat ukur yang kita gunakan sudah valid (sudah tepat dan sudah cermat), maka error pengukurannya juga kecil.

Tampaknya, pengertian validitas erat hubungannya dengan masalah tujuan pengukuran, oleh sebab itu tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran, biasanya hanya merupakan ukuran yang spesifik valid (tepat dan cermat) untuk satu tujuan pengukuran saja.

Menurut Soetarlinah Sukadji (1993), kunci pemilihan alat observasi terletak pada ketepatan pilihan metode an pada pilihan teknik pencatatan observasi.

1.      Jenis-jensi Validitas
Karena validitas menunjukkan seberapa jauh prosedur pengukur mengukur hal yang seharusnya diukur, maka dalam suatu observasi dapat dilakukan pengecekan berikut ini. Misalnya dalam mengukur agresivitsa seorang anak.
a.       Gari segi Validitsa Konstruk (construct validity)
Konstruk adalah kerangka dari suatu konsep. Jadi, misalnya seorang peneliti ingin mengukur konsep religiusitas, maka pertama-tama yang harus dilakukan oleh peneliti ialah mencari apa saja yang merupakan kerangka dari konsep tersebut. Dengan diketahuinya kerangka tersebut, seorang peneliti dapat menyusun tolak ukur oprasional konsep tersebut. Dalam hal kita ingin mnegukur agresivitas anak, maka apakah benar perilaku yang ditandai sebagai kode observasi (memaki, memukul, dan sebagainya) merupakan bagian dari agresivitas dan merupakan definisi operasional yang tepat bagi agresivitas?
b.       Dari segi Validitas Konkuren (concurrent validity)
Mengobservasi perilaku dengan membandingkan perilaku lain. Contoh : perilaku di sekolah = perilaku diluar kelas (menunjukkan agresivitas). Menurut Soetarlinah Sukadji (1990) untuk validitas konkuren ini, pertanyaannya adalah, “apakah data yang diperoleh sesuai dengan perolehan data bila diukur dengan cara lain (misalnya rating, dan sebagainya).”

c.       Dari segi Validitas isi (content validity)
Validitas isi adalah sejauh mana isi alat ukur tersebut memiliki semua aspek yang dianggap sebagai aspek kerangka konsep. Data yang mencerminkan ciri-ciri yang telah ditentukan yaitu apa saja yang diungkap atau diukur.
Contohnya, bila seorang peneliti ingin mengukur keikutsertaan dalam program KB dengan menyebutkan metode kontrsepsi yang dipakai, namun bila aspek yang diamati tidak mencakup semua metode kontrasepsi sebagaimana disebutkan, maka alat ukur tersebut tidak memiliki validitas isi.
Dalam hal mengukur agresivitas anak, maka pertanyaannya adalah, “apakah data yang diperoelh menggambarkan dengan cermat sifat maupun tingkat agresivitasnya yang terjadi selama observasi?”

d.       Dari segi Validitas Prediktif (predictive validity)
Alat pengukur yang dibuat oleh penelti seringkali dimaksudkan untuk memprediksi apa yang terjadi di masa mendatang. Contohnya, ujian seleksi masuk perguruan tinggi, merupakan upaya untuk meprediksi apa yang terjadi di masa datang. Peserta yang lulus seleksi diprediksikan akan dapat mengikuti pelajaran dengan baik. Apakah soal ujian masuk tersebut memiliki validitas prediktif? Itu tergantung pada apakah aad korelasi yang tinggi) antara nilai ujian masuk dengan prestasi belajar setelah menjadi mahasiswa. Bila ternyata ada korelasi yang tinggi antara nilai ujian seleksi dengan indeks prestasi belajar mahasiswa, maka soal ujian seleksi tersebut dikatakan memiliki validitas prediktif.
Dalam hal mengukur agresivitas anak, maka pertanyaannya adalah, “apakah perilaku yang ditandai dengan kode observasi tersebut dapat memprediksikan kriteria penting lain?”

2.      Teknik Menguji Validitas
Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat pengukur itu dipandang valid.
Ada dua jenis kriterium ang digunakan untuk menguji kejituan alat pengukur, yaitu :
a.       Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.

b.       Kriterium dalam alat (internal criterion)
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil hasil keseluruhan pengukuran atau total score sebagai kriteriumnya.
Misalnya, kita ingin mengukur intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya ingatan, daya pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk item benar-benar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus terdapat korelasi yang positif (tinggi dan cukup meyakinkan).
Kecocokkan antara hasil-hasil dari item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung kepada besar kecilnya kecocokan itu.

B.     RELIABILITAS
Menurut Azwar (2003) reliabilitas, asal katanya rely dan ability. Pengukuran yang memiliki reliabilitas tinggi disebut pengukuran yang reliable. Reliabilitas mempunyai berbagai “nama lain” seperti kepercayaan, keterandalan, keajegan, kestabilan, konsistensi, dan sebagainya. Namun ide pokok yang terkandung didalam konsep reliabilitas itu adalah “sejauhmana hasil suatu pengukuran dapat dipercaya.”
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang “relatif” sama. Makna relatif di sini diartikan sebagai adanya toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran. Bila perbedaan itu sangat besar dari waktu ke waktu, maka hasil pengukuran tidak dapat dipercaya atau tidak reliable.

1.      Memilih Instrumen yang Reliable
Setiap penelitian perlu ada bukti bahwa instrumen pengumpul datanya valid dan reliable. Salah satu cara terpenting mengukur reiabilitas dalam observasi adalah membandingkan data yang dicatat oleh dua orang observer yang satu sama yang lain independen dan dilaksanakan pada saat yang sama. Hasil pencatatan harus tidak banyak terpaut atau dengan perkataan lain mendekati “kesepakatan bulat” untuk diperkirakan bahwa “perilaku sasaran” diukur dengan alat ukur yang sama. Bila “persentase kesepakatan” tidak cukup tinggi, perubahan yang dicatat oleh seorang observer menunjukkan perubahan pada pengamatan dan pencatatan, bukan perilaku yang diamatinya itu yang berubah.
Jadi, kesalahan pada diri observer sangatlah mungkin, salah satu kesalahan itu adalah terkait dengan “harapan” observer. Kesalahan yang tanpa disadari seperti mencatat ke arah hasil yang diharapkan. Untuk itulah maka guna memastikan konsistensi, para pengamat hendaknya mencatat pengukurannya secara langsung. Penilaian secara independen dari dua penilai kemudian dibandingkan. Sebagai patokan, seperangkat pengamatan diperkirakan reliable bila persentase kesepakatan mencapai mencapai 80% atau lebih tinggi, tergantung pada apakah perilaku dapat disepakati sebagai perilaku sederhana atau kompleks.

2.      Cara Menghitung Reliabilitas Observasi
Sebagaimana dijelaskan di atas bahwa cara mendapatkan anga reliabilitas observasi adalah berdasarkan “kesepakatan observer,” dan cara mendapatkan validitas adalah dengan membandingkan hasil observasi dengan hasil ranking. Reliabilitas berarti, apabila dua observer sepakat dalam hasil observasi (Soetarlinah Sukadji, 1993). Rumus “kesepakatan” juga bisa untuk menghitung hasil “dua kali” observasi yang dilakukan oleh satu orang observer (Soetarlinah Sukadji, 1993).

Rumus “Persentase Kesepakatan” sebagai berikut :
·         Interval Recording
-          Agreement of total observation (A tot) total ke dua observer ‘sama-sama setuju’ baik X maupun O
-          Agreement of occurence observation (A occ) sama-sama setuju ‘ada peristiwa’ observasi (X)
-           Agreement of nonoccurence observation (A non) sama-sama setuju ‘tidak ada peristiwa’ observasi (O)

Jadi, Rumus menghitung ‘Interval Recording’ adalah :

% A IR tot, occ, non-occ =  

% A IR tot =              % A IR occ =        % A IR nonocc =

Keterangan D = jumlah skala di mana observer tidak setuju.
Contoh :

1
2
3
4
5
6
7
8
9
10
Observer 1
X
O
X
O
X
O
O
X
O
X
Observer 2
X
O
X
X
X
O
O
O
X
X

60    enit = 10 kali
Carilah reliabilitas Interval Recording-nya, melalui :
-          Agreement of total observation (A tot)
-          Agreement of occurence observation (A occ)
-          Agreement of nonoccurence observation (A non)
Jawab :

% A IR tot =            =

% A IR occ =           =

% A IR nonocc =       =

·         Event Recording
Adalah kejadian yang tegas mulai dan berakhirnya. Pencatatan bisa dengan  check list, dengan mechanical devices, dan lain-lain. Dalam observasi kelas, rincian perilaku dapat ditulis dalam bentuk daftar event yang dapat dihitung bila terjadi. Baca Soetarlinah Sukadji (1993).              t h
Rumus :
% A ER =

Keterangan :
Ft =  Frekuensi dari observer dengan frekuensi kejadian rendah.
Fh = Frekuensi dari observer dengan frekuensi kejadian tinggi.

Contoh :

1
2
3
4
5
6
7
8
9
10
Observer 1
X
O
X
O
X
O
O
X
O
X
Observer 2
X
O
X
X
X
O
O
O
X
X

Lihat, selama 20 menit periode observasi :
Ø  Observer 1 mencatat 5 kali perilaku muncul.
Ø  Observer 2 mencatat 6 kali perilaku muncul.
Carilah reliabilitas Event Recording-nya!
Jawab 5/6 X 100% = 83,33%

Contoh catatan Event Recording / Frekuensi.
 
·         Rating Recording
% ARR =
Keterangan :
A rr = jumlah skala di mana kedua observer setuju me-rating-nya.
D = jumlah skala di mana observer tidak setuju.

Setelah selama 30 menit waktu observasi, dua observer selesai me-rating 10 perilaku (berarti indikator perilaku juga merupakan jumlah skala atau item) yang terdiri atas kategori skala 1 sampai dengan  5. Dari 10 perilaku (yang tertuang dalam item tadi) ke dua observer sepakat 8 dari 10 skala.
Carilah reliabilitas ating Recording-nya!
Jawab 8/10 X 100 = 80%

3.      Sumber-sumber yang Mengurangi Reliabilitas Observasi
Pengamatan perilaku disebut reliable sejauh mana pengamatan-pengamatan tersebut konsisten dan stabil dalam penyekorannya. Arti reliabilitas yang paling dikenal adalah derajat kesepakatan di mana dua atau lebih observer sepakat dalam hasil observasi. Di bagian atas sudah dijelaskan bahwa kesepakatan ini biasa dinyatakan dalam bentuk persentase unit-unit penyekoran yang sama, yang dicatat oleh observer-observer.
Sebagaimana metode pengupulan data lainnya, data observasi juga perlu diujui validitas dan reliabilitasnya. Pemantapan reliabilitas interobserver atau kesepakatan, itu penting. Supaya yakin bahwa observasi dapat diulang (direplikasi) dan konsisten. Reliabilitas ini akan menambah kecermatan pengukuran, yang berarti juga memantapkan validitas. Dalam observasi, reliabilitas dan validitas dipengaruhi oleh faktor-faktor antara lain :
a.      Observer
Banyak sekali kesalahan yang bersumber dari kualitas pribadi observer yang dapat digolongkan sebagai “kecondongan” (bias).

1)     Kesalahan yang berkaitan dengan kualitas pribadi observer, antara lain :
a)      Central tendency
Observer lebih sering menggunakan kategori yang di tengah dalam skala rating daripada kategori tepi, sehingga dalam prosesnya cenderung underestimasi perilaku yang intens dan overestimasi perilaku yang lemah.

b)     Leniency (kemurahan)
Observer cenderung membuat penilain yang cenderung ke arah “baik” terhadap subjek.

c)      Efek primacy (kesan pertama)
Observer membiarkan kesan pertama mendistorsikan kesan atau penilaiannya kemudian.

d)     Halo effect
Observer membuat penilaian berdasar kesan umum subjek atau berdasar perilaku subjek yang paling mencolok.

e)      Teori pribadi
Observer menyesuaiakn observasi ke asumsi teori pribadi.

f)       Nilai pribadi
Observer menyesuaikan observasi ke harapan, nilai, dan minat pribadi.

g)      Overestimasi perilaku yang hampir-hampir tidak dikenali ada pada diri observer sendiri. Misalnya, observer overestimasi volume suara subjek sebab observer sendiri tidak mengenali bahwa suaranya terlalu rendah volumenya.

h)     Kesalahan logika
Observer membuat penilaian yang serupa terhadap sifat-sifat subjek yang kelihatannya secara logika saling terkait.

i)       Kesalahan kontras
Pada sifat khusus, observer menilai subjek jauh lebih berbeda dengan diri observer sendiri daripada kenyataannya.

j)       Kesalahan proksimitas
Observer menilai serupa sifat-sifat tertentu karena bentuk penilaian membuat sifat-sifat itu berdekatan dalam waktu atau letak.

k)     Pengaruh pribadi
Tanpa diketahui oleh observer sendiri, karakteristik diri observer (usia, jenis, kelamin, ras, dan status sosial) mempengaruhi penilaian perilaku subjek.

l)       Ketidakstabilan penilaian observer
Kriteria penilaian yang dipakai oleh observer berubah bersama waktu, akibat ada dan tidaknya perilaku karena kelelahan, atau belajar, atau penyebab lainnya.

m)   Terlewat
Observer alpa mencatat perilaku yang muncul.

n)     Commision
Observer keliru kode suatu perilaku.

o)     Efek harapan
Harapan observer mempengaruhi pencatatan, atau observer mengharapkan sesuatu terjadi dan mengkomunikasikan harapan ini kepada subjek.

p)     Reaktivitas observer
Observer berubah pencatatan perilakunya karena ia sadar diamati.

q)     Isyarat nonverbal
Observer dengan tidak sengaja memberi isyarat kepada subjek sehingga mendukung perilaku tertentu pada subjek.

2)     Ketidakstabilan Penilaian Observer
Bila observasi berlangsung lama, observer mungkin menunjukkan tanda-tanda kelelahan, lupa dan motivasinya menurun. Misalnya, pada saat permulaan menggunakan standar tertentu untuk menilai suara bisikan atau vokalisasi singkat, tetapi kemudian berubah standarnya, ketidakstabilan hal ini mungkin saja terjadi, walaupun telah ada persetujuan mengenai definisi oprasional perilaku yang diamati.

3)     Kesulitan dalam Mengkodekan Perilaku
Kategori global, seperti perilaku “off-task” atau perilaku tidak patut (innappropriate behavior) membutuhkan penyimpulan tingkat tinggi dibanding kategori spesifik, seperti memukul, atau meninggalkan tempat duduk. Meskipun diusahakan sebaik-baiknya mendefinisikan perilaku dengan cermat, beberapa perilaku memang sulit dikategorikan. Jadi, kode observasi menuntut pertimbangan yang masak di pihak observer.

4)     Memilih Waktu dan Saat yang Tepat
Menentukan waktu yang tepat munculnya suatu kejadian bukanlah semudah yang dibayangkan. Misalnya, kapan saat yang tepat anak mulai menolak memulai makan. Selain itu, unit waktu yang dipilih oleh observer mungkin tidak dapat menggambarkan dengan tepat peta kejadian perilaku.

b.      Setting, Skala, dan Instrumen
Secara rinci, ketiga hal itu dapat mempengaruhi reliabilitas dalam bentuk-bentuk berikut ini.
1)     Setting Perilaku yang tidak Representatif
Observer memilih hanya satu setting atau hanya satu periode waktu dan gagal untuk mengambil perilaku yang secara representatif memadai.

2)     Kompleksitas Koding
Observer tidak dapat menggunakan kode dengan cermat yang disebabkan oleh :
-          Terlalu bayak kategori dalam sistem;
-          Terlalu banyak skor kategori untuk satu satuan waktu, dan
-          Terlalu banyak subjek diobservasi pada satu satuan waktu.

3)     Ada pengaruh eksternal
Observer dipengaruhi oleh kejadian tertentu dalam lingkungan, yang menyebabkan ia mencatat ada terjadi perilaku, padahal perilaku tersebut tidak terjadi.

4)     Kategori dalam Rating
Observer menggunakan kategori yang kasar, yang mengakibatkan kurang peka terhadap adanya perbedaan.

5)     Instrumen yang Bersifat Mekanik tidak Akurat
Misalnya, stopwatch yang kerjanya kurang cermat.

c.       Subjek yang Diamati
Subjek yang diamati juga memberi konstribusi kesulitan, antara lain :
1)     Reaktivitas Subjek
Subejk berubab sebab ia tahu sedang diamati.

2)     Seleksi Peran
Subjek mengadopsi peran tertentu karena ia tahu sedang diamati.

3)     Pengukuran Menjadi Pendorong Perubahan
Subjek berubah secara signifikan, perilaku maupun sikapnya, akibat diukur.

4)     Kemantapan Tanggapan
Subjek memberi tanggapan yang kompromistik dengan isyarat observer.

5)     Perilaku Bergeser
Perilaku subjek terus berlangsung, tetapi bentuknya sudah tidak sesuai lagi denagn cakupan definisi yang telah disepakati oleh para observer.

d.      Sampel
Kesalahan ini terutama terjadi pada pengamatan subjek yang seharusnya mewakili kelompok.
1)     Sampel tidak Representatif
Observer gagal memperoleh sampel yang representatif.

2)     Stabilitas Sampel
Observer gagal mengenali perubahan populasi, sehingga sulit membuat perbandingan dengan sampel yang terdahulu.

3)     Data yang Tidak Representatif
Observer gagal mengenali perbedaan regional maupun geografikal antara sampel-sampel yang diambil.

4.      Beberapa petunjuk Praktis untuk Meningkatkan Reliabilitas Observasi
Adanya kelemahan-kelemahan yang enyebabkan reliabilitas pengukuran menurun (sehingga validitasnya juga menurun), membuat kita waspada untuk menghindarinya.
Beberapa petunjuk praktis, antara lain :

a.       Observer hendaknya memahami benar-benar teknik-teknik pencatatan, manual maupun instrumental. Pastikanlah dalam rancangannya perilaku-perilaku kritis didefinisikan dengan jelas, tegas dan cermat.

b.       Sebelum melaksanakan observasi, periksalah dulu peralatan-peralatan pengumpul data.

c.       Observer perlu latihan sampai mahir sebelum turum ke lapangan.

d.       Kumpulkan data dengan mengobservasi subjek dalam berbagai situasi dan waktu, terutama bila yang diobersevasi kelompok, atau untuk mendapatkan norma.

e.       Temukan kecondongan (bias), kelemahan-kelemahan, yang kita miliki sebagai observer, dan kembangkan ketrampilan pemahaman diri dan evaluasi diri yang kritis.

f.        Kembangkan skeptisisme yang sehat terhadap laporan yang telah ada mengenai perilaku subjek, agar observasi yang kita lakukan dapat seobjektif mungkin.

g.       Tunda dulu asumsi dan spekulasi mengenai arti dan implikasi perilaku subjek yang diamati selagi pengambilan data.

h.       Bila pengamatan telah selesai, pertimbangkanlah faktor-faktor yang meyulut dan memelihara perilaku subjek, serta tanggapan-tanggapan orang lain yang ada di dalam setting subjek atas perilaku subjek tersebut.

i.         Secara periodik bandingkan hasil pengamatan dengan pengamat lain yang menggunakan sistem penyekoran yang sama.

j.         Secara teratur pencatatan harus “dikalibrasi” yaitu dengan mencocokkan lagi dengan potokol standar.

k.       Ikuti teori-teori dan test-retest mutakhir dalam bidang observasi.

l.         Hindari kekeliruan-kekeliruan umum berkenaan dengan observasi sebagaimana telah disebut terlebih dahulu.



Tidak ada komentar:

Poskan Komentar