Ofick D'Sensei : realibilitas instrumen

RELIABILITAS INSTRUMEN

Ada beberapa cara pendefinisian dan penginterpretasian reliabilitas tes. Tes disebut reliable jika skor pengamatan dikorelasikan dengan tinggi dengan skor yang sebenarnya, dengan merupakan koefisien reabilitas tes. Reabilitas dapat diekspresikan sebagai koefisien korelasi antara skor pengamatan pada dua tes yang parallel. Jika dua tes parallel diberikan pada populasi yang diuji dan hasil skor pengamatan dikorelasikan, maka korelasi ini (symbol dimana X dan X’diamati skornya pada kedua tes paralelnya) adalah koefisien reabilitas.
Pada kasus umum, skor sebenarnya tidak dapat diperoleh, dan tidak mungkin untuk menguji apakah tes tersebut parallel. Oleh karena itu, reabilitas seharusnya diperkirakan dengan metode lain.

Definisi reliabilitas tes
Koefisien reliabilitas untuk sejumlah skor dari sekelompok uji adalah koefisien korelasi antara himpunan skor dan himpunan lain skor pada tes yang sama dihitung dengan independen/terpisah dari anggota kelompok yang sama
Dari definisi tersebut di dapat 3 aspek penting:
1. Koefisien reliabilitas mengimplikasikan bahwa reliabilitas bukan sifat tes itu sendiri tetapi lebih pada kapan instrumen diaplikasikan pada bagian kelompok yang diuji.
2. Definisi operasional khusus dari penggunaan koefisien korelasi sebagai reliabilitas pengukuran.
3. Definisi operasional dikatakan dua atau lebih pengukuran terpisah, menghitung dari tes ekuivalen dari perlakuan yang sama untuk masing-masing anggota kelompok.
(ini adalah inti dari definisi)

Definisi teori
Untuk tujuan teoritis kita mengasumsikan bahwa skor tes dipisah-pisah dalam dua komponen: true skor dan error skor.
Hipotesis true skor individual adalah rata-rata skor orang yang akan dihitung jika pada beberapa tes yang sama. Hubungan antara skor ini:
X= T + E
dengan variansi tes skor:

Thorndike mengelompokkan kemungkinan sumber variansi pada skor adalah untuk megidentifikasi kontribusi dari 2 tipe variansi.(lihat hal 74). Beberapa factor mengemukakan mengapa individu memperoleh skor yang berbeda pada tes yang sama pada dua kesempatan, dan mengemukakan mengapa ujian di teskan pada saat/kesempatan yang sama diperoleh skor yang berbeda anat individu yang berbeda. Diskusi lebih detail dapat dilihat pada Stanley, untuk mendapatkan 4 tujuan dapat digeneralisasi sebagai: .(lihat hal 74).
1. Semua sumber variansi tidak penting dioperasikan dalam setiap situasi.
2. Beberapa factor mempunyai kontribusi terhadap skor eror dalam beberapa situasi tes tetapi berkontribusi true skor dalam situasi tes yang lain.
3. Reliabilitas bukan sekedar factor intrisik tes, realibilitas nilainya berdasarkan tes kelompok, isi tes, dan kondisi saat tes.
Reabilitas merupakan tingkatan hasil penilaian siswa yang sama ketika:
a. mereka menyelesaikan tugas yang sama
b. dua atau lebih guru menilai hasil pekerjaan mereka pada tugas yang sama
c. mereka menyelesaikan dua atau lebih tugas yang berbeda namun dengan tingkat kesulitan yang sama pada suatu kesempatan yang sama ataupun berbeda.

Realibilitas membatasi Validitas
Meskipun validitas yang tinggi memerlukan relaibilitas yang tinggi pula, mundur itu tidak benar. Pengukuran reliabilitas yang tinggi tidak menjamin diperoleh interpretasi atau keputusan yang valid. Hal ini dikarenakan reliabilitas bukanlah satu-satunya criteria di dalam validitas.
Sebagai ilustrasi: Nona Cortez mengajar aritmatika kelas tujuh. Beliau merefleksikan siswa-siswanya pada perhitungan yang mana diharapkan siswa-siswanya mampu menggunakannya dalam kehidupan sehari-hari dan mendata ketrampilannya ini. Dia kemudian membuat tes perhitungan dan problem solving untuk menilai kemampuan siswa-siswanya pada ketrampilannya. Karena tes tertulis yang dibuat sangat banyak item, nona cortes dapat percaya diri bahwa apa yang dibuatnya akan sangat reliable.
Strategi umum untuk menghitung koefisien reliabilitas adalah mengatur penilaian pada sekelompok siswa satu kali atau lebih dan diperoleh skor. Kemudian satu atau dua pendekatan digunakan untuk memeriksa kekonsistenan.
 Dalam konteks skor kekonsistenan korelasi ini disebut sebagai koefisien reliabilitas.
 Indeks pengekspresian variansi dalam skor kekonsistenan disebut sebagi standar eror pengukuran.
Bagaimanapun mengetahui skor reliable tidak cukup untuk menyimpulkan bahwa tes tersebut valid. Penilaian dari keandalan akan mempengaruhi kualitas (validitas) dari keputusan. Berikut sebagi contoh pengambilan keputusan:
1. Nona Cortez memutuskan penguasaan 80% dari target yang diharapkan dalam perhitungan kelulusan. Bagaimanapun tes hanya mengambil contoh dari sub-sub yang harus dikuasai. Dari tes yang dilakukan beberapa siswa dapat menguasai 80% atau bahkan lebih dari target yang diharapkan (dikatakan lulus tes), dan beberapa dapat menguasai kurang dari 80% (dikatakan tidak lulus tes). Siswa yang tidak lulus tes ini dikelompokkan sebagai siswa yang kompetensinya masih kurang.
2. Seorang penasehat ingin mengetahui apakah kemampuan matematika siswa atau kemampuan komunikasi siswa tinggi. Skor siswa pada tes kemampuan matematika tidak seperti skor tes pada kemampuan bahasanya. Yang menjadi pertanyaan adalah apakah siswa mempunyai kemampuan yang berbeda dalam 2 kemampuan tersebut? Kemmapuan siswa dalam hal yang berbeda akan berbeda pula, penasehat membutuhkan seberapa besar perbedaan dari true skor dalam kaitan dengan kesalahan perhitungan. Jika jarak skor sangat jauh maka kemungkinan tidak reliable. Jika skor tidak reliable maka penasehat dapat dengan kurang percaya diri mengemukakan bahwa perbedaan skor mengindikasikan perbedaan dalam kemampuan komunikasi dan kemampuan matematika.
Salah satu masalah utama dalam penelitian adalah masalah cara mngumpulkan data informasi yang akurat dan objektif. Hal ini menjadi sangat penting dikarenakan kesimpulan penelitian hanya akan dapat dipercaya apabila didasarkan pada informasi yang juga dapat dipercaya.
Reliabilitas merupakan penerjemah dari kata reliability , Pengukuran yang memiliki reliabilitas tinggi sisebut sebagai pengukuran yang reliable. Walaupun reliabilitas mempunya banyak nama lain seperti keterpercayaan, keterandalan, kesetabilan, dan sebagainya namun ide pokok yang tekandung dalam konsep eliabilitas adalah sejauh man ahasil suatu pengukuran dapat dipercaya.
Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relative sama, selama asfek yang diukur dalam diri subyek memang belum berubah. Namun konsep reliabilitas dalam arti reliabilitas alat ukur erat kaitannya dengan masalah eror pengukuran (error of measurement). Eror pengukuran sendiri menunjukan pada sejauh mana inkonsistensi hasil pengukuran terjadi apabila pengukluran dilakukan berulang kali pada kelompok subyek yang sama. Konmsep reliabilitas dalam arti reliabilitas hasil ukur erat kaitannya dengan eror dalam pengambilan sampel (sampling error) yang menace kepada inmkonsistensi hasil ukur apabila pengukuran dilakukan berulang kali pada kelompok insividu yang berbeda.

Koefisien Reliabilitas
Secara empiric tinggi rendahnya reliabilitas ditunjukan oleh suatu angka yang disebut koefisien reliabilitas. Pada awalnya tinggi rendahnya reliabilitas tes dicerminkan oleh koefisien korelasi antara sekor pada dua tes yang parallel, yang dikenakan pada sekelompok individu yang sama. Semakin tinggi koefisien korelasi termaksud berarti konsistensi atara hasil pengenaan dua tes tersebut semakin baik dan hasil ukur kedua tes itu dikatakn semakin reliable.
Koefisien korelasi antara dua variable dilambangkan oleh huruf r. Apabila skor pada tes pertama diberi lambing X dan skor pada tes kedua diberi lambing X’, maka koefisien korelasi antara kedua tes tersebut adalah . Symbol inilah yang digunakan sebagai symbol koifisien korelasi.
Walaupun secara teoritik besarnya koifisien relibialitas berkisar mulai dari 0,0 dampai denga 1,0 akan tetapi kenyataanya koefisien sebesar 1,0 dan sekecil 0,0 tidak pernah dijumpai. Disamping itu, walaupun koifisien korelasi dapat saja betambah negative (-), koefisien reliabilitas selalu mengacu pada angka positif (+) dikarenakan angka negative tidak ada artinya bagi intefretasi reliabilitas hasil ukur. Koifisien korelasi = 1,0 berarti adanya konsistensi yang sempurna pada hasil ukur yang bersangkutan. Konsisten yang sempurna seperti itu tidak dapat terjadi dalam pengukuran aspek-aspek psikologis dan social yang menggunakan manusia sebagi subyeknya dikarenakan terdapatnya berbagai sumber eror dalam diri manusia dan dalam pelaksanaan pengukuran yang sangat mudah mempengaruhi kecermatan hasil pengkuran.
Dalam penilaian pendidikan, sering timbul pertanyaan bahwa apakah koefisien reabilitas dari soal yang digunakan cukup bagus? Koefisien yang sempuna adalah 1, akan tetapi dalam penilaian pendidikan yang subyeknya adalah manusia maka hal tersebut adalah tidak mungkin. Dari penilaian dengan tipe-tipe instrumen yang berbeda, mempunyai tingkatan yang berbeda pula tentang koefisien reliabilitasnya.
 Standar penilaian untuk soal pilihan ganda, koefisien reliabilitasnya 0,85-0,90.
 Standar penilaian untuk soal open ended, koefisien reliabilitasnya 0,65-0,80
 Standar penilaian untuk soal portofolio, koefisien reliabilitasnya 0,40-0,60
Disamping tehnik-tehnik korelasi, berkembang pula tehnik analisis varians skor dan tehnik analisis varian eror. Walaupun demikian untuk melambangkan koifiseien reliabilitas umumnya tetap digunakan symbol .
Konsepsi mengenai Reliabilitas
Konsepsi reliabilitas dalam teori skor murni klasikal dapat dipahami dari beberapa intefretasi. Suatu tes dikatakan sebagi memilki reliabilitas tinggi apabila, misalnya, skor tampak tes itu berkorelasi tinggi dengan skor murninya sendiri. Reliabilitas dapat pula ditafsirkan sebagai seberapa tingginya korelasi antara skor tampak pada dua tes yang parallel.
Allen dan Yen (1979) menguraikan enam data untuk memandang koefisien reliabilitas tes. Dalam uraian mereka, koefisien reliabilitas disombolkan oleh sebagai parameter reliabilitas populasi umum. Guna penyederhanaan kita akan menggunakan symbol sebagai lambang reliabilitas dalam aliran statistic maupun dalam parameter populasi. Lambang varian polulasi , dalam pengertian yang sama, akan digantikan oleh lambang varian sampel S2.

Interpretasi 1
= korelasi skor -tampak antara sua tes yang parallel
Interprestasi ini mngatakan bahwa reliabilitas tes ditentuka oleh sejauhmana skor-tampak pada dua tes yang parallel berkorelasi. Bila pada dua tes yang parallel setiap subyek memperoleh skor yang sama dan pada masing-masing tes terdapat varian skor subyek, yaitu varian skor-tampaknya tidak sama dengan 0, maka tes tersebut mempunyai reliabilitas sempurna dengan koifisien sebesar = 1,00. Sebaliknya apabila skor-tampak pada suatu tes tidak berkorelasi sama sekali dengan skor tampak pada tes paralelnya maka kedua tes tersebut sama sekali tidak reliable dan koifisien reliabilitasnya adalah . Interprestasi ini menjadi asumsi dasar dalam pendekatan reliabilitas bentuk parallel (parallel – forms) dan pendekatan reliabilitas bentuksejajar (alternate-form)
Interpretasi 2
2 = besarnya populasi varian X yang dijelaskan oleh hubungan antara liniernya dengan x’
Interpretasi ini berasal dari penafsiran koifisien determinasi sebgaimana biasanya dilakukan pada p[enafsiran koifisien korelasi linier pearson. Jadi didalam hal ini besarnya kuadrat koifisien reliabilitas dapat dipandang sebagai proporsi varians skor pada tes lainnya yang parallel.

Interpretasi 3
Rxx’ = st2 / sx2
Koifisien reliabilitas merupakan besarnya perbandingan antara varian skor-murni dan varian skor-tampak pada suatu tes, atau merupakan provorsi varians skor-tampak yang berisi varian skor-murni. Suatu koifisien reliabilitas sebesar 0,8 berarti bahwa 80 persen dari varian skor merupakan varian skor murni.

Bila semua perbedaan yang terjadi pada skor tampak subyek merefleksikan perbedaan skor murni yaitu sx2 =st2, maka reliabilitas tes tersebut adalah sempurna dengan koefisien rxx’ = 1,00.

Intertpretasi 4
= rxt2
Koifisoen reliabilitas merupakan kuadrat koifisien korelasi antara skor-tampak dengan skor murni. Jadi apabila koefisien reliabilitas rxx’ = 0,64 maka rxt = = 0,80. Bila besarnya koifisien rxx’ = 0,49 maka rxt = = 0.70.
Dari kedua contoh itu tampak bahwa koefisien korelasi antara skor-tampak dengan skor-murni selalu akan lebih besar dari pada koefisien reliabilitasnya, selama koefisien reliabilitas itu tidak sama dengan 0 atau 1. Kalau skor tampak pada tes atau variable lain itu diberi symbol Y maka fakta tersebut mendukung pernyataan bahwa rxt rxy
Menuru tinterpretasi ini yaitu, = rxt2 korelasi maksimal antara X dan Y adalah . Dalam simbolisasi valisitas, skor X sendiri meruipakan skor tes dan skor Y merupakan skor kriteriasedangakan koefisien validitas disimbolkan oleh rxy.

Interpretasi 5
rxx’ = 1 – rxe2
Besarnya proporsi varian skor tampak yang berkaitan dengan varian eror ditunjukan oleh rxe2. Sedangkan semakin besar proporsi itu maka semakin eratlah kaitan antara skor-tampak yang diperoleh subyek dengan dengan eror dan semakin rendahnya reliabilitas tes. Idealnya antara skor tampak dan eror sama sekali tidak boleh berkorelasi sehingga rxe = 0. Hal ini hanya terjadi apabila reliabilitas tes adalah maksimal.

Interpretasi 6
rxx’ = se2 / sx2
Interpretasiini mengaitkan reliabilitas dengan varian eror dan varian skor tampak. Disisi lain kita dapat melihat bahwa derajat heterogenitas skor subyek yang ditunjukanb oleh besarnya sx2 mempunyai pengaruh pnting terhadap koefisien reliabilitas. Dengan asumsi varian eror tetap, tinggi rendahnya koefisien reliabilitas akan tergantung pada besar kecilnya varian skor tampak pada subyek yang bersangklutan. Pada kelompok subyek yang homogen yaitu yang memiliki sx2 kecil, harga se2 / sx2 akan relative lebih kecildibandingkan dengan hargannya pada kelompok subyek yang heterogen (yang terdistribusi dengan sx2 besar)
Estimasi Reliabilitas
Estimasi reliabilitas dapat dilakukan melalui salah satu pendekatan umum yaitu pendekatan tes ulang (test – retest), pendekatan tesw sejajar (alternetif – forms) dan pendekatan konsistensi interlan (internal-consistency)
• tes - retest reliabilitas mengukur stabilitas nilai.
Pendekatan ini menunjukan konsistensi pengukuran dari waktu kewaktu dan mnghasilkan koefisien reliabilitas yang sering disebut sebagai koefisien stabilitas. Prinsip estimasinya adalah dengan menggunakan suatu ionstrumen pengukur dua kali dengan tenggang waktu tertentu, terhadap sekelompok subyek yang sama.
Komputasi korelasi antara distribusi skor dari kedua penggunaan tersebut menghasilkan estimasi reliabilitas instrument yang bersangkutan.
Kelemahan pendekatan test – retest adalah kurang pralktisnya penggunaan tes dua kali dan besarnya kemungkinan terjadi efek bawaan (carry –over-effects) dari suatu penggunaan tes kepenggunaan yang kedua.
• Pendekatan tes sejajar (alternetif – forms)
Pendekataan tes sejajar hanya dapat dilakukan apabila tersedia dua bentuk instrument pengukur yang dapat dianggap memnuhi asumsi parallel.
Pada kenyataan dilapangan bentuk parallel tidak selalu ada, karena biasanya penilaian bentuk parallel:
1. Prosedur penilaian hanya sekali digunakan pada masing-masing siswa
2. Tindalkan penilaian mengubah siswa
3. Hanya ada satu tindakan untuk menilai kemampuan ketertarikan
4. Sangat mahal utnuk membangun bentuk parallel dari penilaian

Salah satu indikator terpenuhinya asumsi paralel adalah setaranya korelasi antara skor kedua instrument tersebut dengan skor suatu ukuran lain.
Untuk dapat parallel kedua bentuk instrument harus disusun dengan tujuan mengukur objek psikologis yang sama berdasarkan blue print (pola rancangan) yang sama serta spesifikasi yang sama pula.
Estimasi reliabilitas dengan pendekatan bentuk sejajar dilakukan setelah kedua instrument tersebut dikenakan berturut-turut pada sekelompok subyek. Komputasi koefisien korelasi antara distribusi skor dari penggunaan kedua instrimen itu menghasilkan koefisien reliabilitas yang berlaku bagi keduanya.
Kelemahan utama pendekatan ini terletak pada sulitnya menyusun dua alat ukur yang menuhi persyaratan paralel atau sejajar disamping pendekatan ini juga tidak menghilangkan sama sekali kemungkiana terjadinya efek bawaan.
• Pendekatan Konsistensi Internal (internal consistency)
Estimasi reliabilitas dengan pendekatan konsistensi internal didasarkan pada pada data dari sekali peggunaan satu bentuk alat uikur pada sekelompok subyek. Komputasi koefisien reliabilitasnya dilakukan setelah keselruhan instrument yang telah dikenakan pada subyek itu dibelah menjadi bebrapa bagian. Satu instrument dapat dibelah menjadi dua, tiga, empat atau lebih bagian bahkan dapat dibelah menjadi sebanyak sejumlah item-itemnya. Bentuk dan sifat alat ukur serta banyaknya belahan yang dibuat akan menentukan tehnik perhitungan koefisien relkiabilitasnya.
Diantara tehnik-tehnik komputasi reliabilitas konsistensi internal adalah:
a. Formula Spearman Brown
Dapat digunakan apabila jumlah item dalam tes adalah genab sehingga dapat dibelah menjadi dua bagioan yang seimbang.
Pembelahan ini dapat dilakukan dengan mengelompokkan item-item bernomor ganjil menjadi satu dan item-itembernomor genap menjadi satu pula.
Contoh:
Table 1

= koefisien korelasi antara antara skor belahan Y1 dan skor blahan Y2
Komputasi korelasi antara belahan y1 dan Y2 dari data pada table 1 menghasilkan = 0,827 sehingga koefisien reliabilitasnya yang dihitung dengan formula Spearman Brown adalah

b. Formula Rulon
Sebagaimana formula Sperman Brown juga dikenakan pada data skor suatu tes yang dibelah menjadi dua bagian yang seimbang.
Dan formula Rulon, komputasi reliabilitas didasarkan pada selisih skor subyek pada kedua belahan tersebut. Mrnurut Rulon selisih skor itulah sumber variasi eror dan karenannya bila dibandingkan dengan variasi skor akan dapat menjadi dasar mengestimasi reliabilitas tes.
Dirumuskan:

= variansi perbedaan skor belahan (d)
= variansi skor tes (X)
Pada table 1 perbedaan skor diantara belahan yaitu d telah di hitung dengan mengurangkan setiap harga Y2 dari Y1. Perhitungan varias d dan varian X menghasilkan = 1,378 dan = 14,04
Dengan demikiandiperoleh koefisien reliabilitas rulon

c. Formula Alfa
Untuk melakukan estimasi reliabilitas Alfa tes dapat dibelah menjadi beberapa bagian. Dalam pembelahan ini sangat penting untuk menjadikan banyaknya aitem dalam setiap belahan sama sehingga diharapkan belahan-belahan itu seimbang. Bila formula Allpa dikenakan pada tes yang dibelah tidak seimbang maka koefisien yang di peroleh akan rendah dan merupakan underestimasi terhadap reliabilitas sebelumnya.
Formula Alpa untuk tes yng dibelah dua

= koefisien relibilitas Alpa
= banyaknya belahan
= Varians skor belahan (j)
= variasn skor tes (X)
Bila tes dibelah menjadi tiga bagian maka formulanya untuk komputasi reliabilitas adalah

Sebagai contoh data pada table 1 kita belah menjadi 3 belahan yang masing-masing berisi 4 aitem

Y1 = Aitem 1 + 4 +7 + 10
Y2 = Aitem 2 + 5 +8 + 11
Y3 = Aitem 3 + 6 +9 + 12
Perhitungan terhadap varians-varians skor belahan dan varians skor tes pada data diatas menghasilkah:

Dengan demikian koefisien reliabilitas Alpa untuk hasil tes tersebut diatas adalah:

d. Formula Kuder Richardson 20
Formula KR-20 sebetulnya sama denagn formaula Alfa, akan tetapi formula KR – 20 hanya dapat dikenakan pada data skor dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak aitemnya.
Dirumuskan oleh:

k = banyaknya aitem
P = indeks kesukaran aitem
= varians skor tes (X)
Untuk contoh penggunaan pormula ini perhatikan table berikut:

sedangkan banyaknya item 12 dan = 14,04 sehingga koefisien reliabilitasnya dengan menggunakan formula KR-20 adalah:

Ofick D'Sensei

Selasa, 15 Februari 2011

realibilitas instrumen

Tidak ada komentar:

Posting Komentar

Catatan Yang Ditampilkan

Formulir