Teori respon butir merupakan salah satu prosedur statistik untuk
menganalisis dan mendeskripsikan hasil tes. Wendy M. Yen dalam
Encyclopedia of Educational Research (1992: 657) dikatakan beberapa hal
yang membedakannya dengan teori tes klasik. Disana disebutkan 3
karakteristik khusus teori respon butir yaitu : "(1) ... it focuses on
performanceon individual items, rather than only intact tests, (2) it
describes item performance at each level of student ability and (3) it
is model based".
Pengembangan teori respon
butir didasarkan kepada dua postulat. Menurut Hambleton dan Swaminathan
(1991: 7) kedua postulat itu adalah bahwa kemampuan seseorang subyek
pada suatu butir dapat diprediksikan oleh seperangkat faktor yang
disebut traits, latent traits atau kemampuan. Menurut Djemari Mardapi
(2004: 135) trait adalah dimensi kemampuan seseorang seperti kemampuan
verbal, kemampuan psikomotor, kemampuan kognitif dan sebagainya.
Postulat kedua adalah bahwa hubungan antara kemampuan subyek pada suatu
item dan perangkat kemampuan laten yang mendasarinya dapat digambarkan
melalui kurva karakteristik butir (Item Caracteristic Curve).
Model-model kurva karakteristik butir tergantung pada bentuk matematis
fungsi karakteristik butimya dan pada banyaknya parameter yang
dilibatkan dalam model yang dilibatkan.
Suatu kurva karakteristik butir adalah suatu rumusan matematis yang menghubungkan probabilitas keberhasilan menjawab dengan benar pada suatu butir soal dengan kemampuan yang diukur oleh tes tersebut dan karakteristik soal bersangkutan. Model-model kurva karakteristik butir tergantung pada bentuk matematis fungsi karakteristik butirnya dan banyaknya parameter yang dilibatkan dalam model yang digunakan. Hal ini dikarenakan tidak semua model respon butir cocok untuk perangkat data tes yang lain. Maka langkah pertama yang harus dilakukan dalam menganalisis dengan menggunakan teori respon butir adalah menentukan kecocokan antara model dengan perangkat data tes yang hendak dianalisis. Jika hal ini telah dilakukan, hasil yang akan didapat adalah item independence dan subject independence. Item independence yaitu bahwa estimasi kemampuan butir tidak tergantung pada butir. Subject independence bermakna estimasi kemampuan subyek tidak tergantung pada tes.
Selain hal-hal yang telah disebutkan di atas, berbeda dengan teori tes klasik yang tidak dapat mengestimasi kekeliruan kemampuan individual, teori respon butir dapat memberikan perkiraan tentang standard error untuk setiap estimasi kemampuan individu dan bukan estimasi kekeliruan untuk semua peserta tes seperti dalam teori tes klasik.
Suatu kurva karakteristik butir adalah suatu rumusan matematis yang menghubungkan probabilitas keberhasilan menjawab dengan benar pada suatu butir soal dengan kemampuan yang diukur oleh tes tersebut dan karakteristik soal bersangkutan. Model-model kurva karakteristik butir tergantung pada bentuk matematis fungsi karakteristik butirnya dan banyaknya parameter yang dilibatkan dalam model yang digunakan. Hal ini dikarenakan tidak semua model respon butir cocok untuk perangkat data tes yang lain. Maka langkah pertama yang harus dilakukan dalam menganalisis dengan menggunakan teori respon butir adalah menentukan kecocokan antara model dengan perangkat data tes yang hendak dianalisis. Jika hal ini telah dilakukan, hasil yang akan didapat adalah item independence dan subject independence. Item independence yaitu bahwa estimasi kemampuan butir tidak tergantung pada butir. Subject independence bermakna estimasi kemampuan subyek tidak tergantung pada tes.
Selain hal-hal yang telah disebutkan di atas, berbeda dengan teori tes klasik yang tidak dapat mengestimasi kekeliruan kemampuan individual, teori respon butir dapat memberikan perkiraan tentang standard error untuk setiap estimasi kemampuan individu dan bukan estimasi kekeliruan untuk semua peserta tes seperti dalam teori tes klasik.
Item Response Butir menggunakan model ogive normal atau ogive logistik. Adapun jenis-jenisnya adalah tergantung dengan parameter yang digunakan yakni:
- Model Logistik 1 Parameter atau dikenal dengan model Rasch yaitu model IRT yang menitikberatkan satu parameter butir soal yakni tingkat kesukaran butir (b). Persamaannya adalah
- Model Logistik 2 Parameter, model IRT yang melibatkan dua parameter yakni tingkat kesukaran butir (b) dan daya pembeda butir (a). Persamaannya adalah
- Model Logistik 3 Parameter, model IRT yang melibatkan tiga parameter yakni tingkat kesukaran butir (b) dan daya pembeda butir (a) serta faktor tebakan (c). Persamaannya adalah
Model yang paling banyak digunakan adalah model yang pertama karena bentuknya yang sederhana dan relatif lebih mudah perhitungannya.
1. Asumsi-asumsi
Menurut Hambleton & Swaminathan ((1991: 9) model matematis yang digunakan teori respon butir menyatakan bahwa kemungkinan subyek menjawab benar terhadap butir soal tertentu tergantung pada kemampuan subyek dan karakteristik butir soal yang bersangkutan. Karena itulah dalam teori respon butir ada dua asumsi utama yang secara tidak langsung dapat diukur dan dibuktikan.
Asumsi pertama adalah unidimensionalitas (unidimensionality). Asumsi ini menyatakan bahwa dalam setiap tes hanya ada satu kemampuan yang diukur oleh perangkat butir-butimya. Asumsi ini sangat sulit dipenuhi dikarenakan banyaknya faktor-faktor yang mempengaruhi tes seperti kognitif, kepribadian dan administrasi tes. Namun yang paling penting dari asumsi ini adalah adanya satu komponen yang dianggap dominan dalam menentukan kemampuan subyek.
Asumsi kedua dikenal dengan independensi lokal (local independence). Asumsi ini maksudnya adalah apabila kemampuan-kemampuan yang mempengaruhi kemampuan dijadikan konstan maka respon subyek terhadap pasangan butir manapun juga akan independen secara statistik satu sama lain. Dengan demikian, hal-hal yang dispesifikasikan dalam dalam model merupakan faktor satu-satunya yang memiliki pengaruh terhadap respon yang ditunjukkan subyek. Kemampuan-kemampuan ini biasa dikenal dengan complete latent space.
2. Model model teori respon butir
Model ogive normal pada awalnya adalah model yang paling dominan digunakan dalam pengembangan teori respon butir. Namun model tersebut saat ini sudah jarang digunakan dan digantikan dengan model-model logistik. Model logistik lebih sering digunakan karena prosedur komputasinya lebih mudah dan sederhana dibandingkan model ogive normal. Ada tiga model logistik yang sering digunakan saat ini yaitu (1) model logistik satu parameter, (2) model logistik dua parameter dan (3) model logistik tiga parameter. Pemilihan model yang digunakan tergantung pada asumsi yang cocok bagi perangkat data yang akan dianalisis serta selera pada pemakainya.
Model logistik satu parameter adalah model yang paling sering digunakan karena prosedurnya yang sangat sederhana. Penyebutan satu parameter karena karakteristik butimya hanya ditunjukkan oleh statistik bi yang merupakan parameter tingkat kesukaran butir. Persamaan matematik untuk model logistik satu parameter adalah :
keterangan
= kemungkinan seorang subyek dengan kemampuan untuk menjawab butir i dengan benar.
= tingkat kemampuan
bi = parameter tingkat kesukaran butir i
n = banyaknya butir dalam tes
e = angka konstan sebesar 2,718
Menurut Hambleton dan Swaminatan (1991: 13) paramater bi adalah satu titik pada skala kemampuan dimana kemungkinan untuk menjawab benar sebesar 0,5. Semakin besar parameter bi semakin besar pula kemampuan yang dituntut dari seorang subyek untuk memperoleh 50% peluang menjawab dengan benar. Ketika kemampuan sebuah kelompok ternyata memiliki mean 0 dan standar deviasi I maka nilai bi akan berkisar dari -2,0 sampai +2,0. nilai yang mendekati -2,0 menandakan bahwa butir soal mudah dan nilai yang mendekati +2,0 berarti butir soal tersebut tergolong sulit untuk kelompok tersebut
Pengembangan model logistik dua parameter dikembangkan pertama kali oleh Birnbaum dan Lord. Pengembangannya didasarkan pada distribusi normal kumulatif. Pengembangan model logistik dua parameter juga dimaksudkan untuk mengganti fungsi ogive normal dengan model yang lebih sederhana dan mudah untuk dianalisis. Bentuk matematik untuk model logistik dua parameter adalah
dengan i = 1,2,3, …n
Model logistik dua parameter memiliki tambahan dibandingkan model dengan satu parameter. Model dua parameter terdapat faktor D yang merupakan faktor penskalaan dengan nilai yang konstan sebesar 1,7. Ternyata dalam model dua parameter perbedaan nilai bagi kedua fungsi ogive normal dan fungsi logistik besamya kurang dari 0,01 untuk semua nilai . Parameter ai adalah daya diskriminasi atau daya beda butir. Parameter ini proporsional terhadap slop kurva karakteristik butir di titik bi pada skala kemampuan.
Secara teoretis, parameter diskriminasi ditetapkan pada skala Tetapi dalam prakteknya parameter negatif menghendaki butir tersebut tidak digunakan sedangkan parameter yang lebih besar dari 2 jarang terjadi. Dengan demikian, yang dilihat hanya parameter ai yang besarnya diantara 0 sampai 2.
Model logistik tiga parameter memiliki persamaan matematis sebagai berikut :
i = 1, 2, 3, … n
Satu parameter (1P) yang ditambahkan dalam model logistik tiga parameter (3P) adalah ci yaitu parameter kemungkinan untuk menjawab benar secara kebetulan yang biasanya dikenal dengan pseudo - chance level. Dengan demikian dalam model logistik tiga parameter juga terdapat satu asumsi dimana seorang subyek yang memiliki kemampuan rendahpun bisa menjawab butir dengan benar. Hal ini biasanya berlaku untuk format tes pilihan ganda. Harga c, biasanya diasumsikan akan lebih kecil daripada harga yang akan diperoleh bila subyek menjawab dengan tebakan secara acak.
Parameter butir (b, a, c) digambarkan dalam sebuah kurva yang dinamakan Kurva Karakteristik Butir (Item Characteristics Curve) atas skala parameter kemampuan siswa (θ) dan Peluang menjawab soal dengan benar (P(θ)).
Contoh :
Data 1.
|
||||
Item ke
|
Parameter butir
|
Respons Peserta
|
||
a
|
b
|
c
|
||
1
|
1.00
|
1.00
|
0.15
|
1
|
2
|
0.50
|
1.50
|
0.10
|
1
|
3
|
-0.50
|
-1.00
|
0.10
|
0
|
Parameter ciri peserta yang belum diketahui = θ
Jawaban peserta :
X =1 untuk jawaban benar
X =0 untuk jawaban salah
Q = 1 – P
Fungsi Likelihood, L(X|θ)
L(X|θ) = (P11Q10) (P21Q20)
(P30Q31)
= P1
P2Q3
Rumus Respons butir/Karakteristik
adalah :
Sehingga D = 1.7 untuk butir ke-1, ke-2 dan ke-3 kita
rumuskan
Kemudian kita masukkan nilai θ untuk rumus ini. Disini kita
menggunakan bentangan nilai θ dari -3.00 sampai 3.00.
Hasil dibawah ini setelah di olah menggunakan MS. Excel 2007.
Nilai Likelihood (kebolehjadian) untuk Data 1
|
|||||
θ
|
P1(θ)
|
P2(θ)
|
Q3(θ)
|
L (U = 110)
|
L (U = θ)
|
-3.00
|
0.150946
|
0.119217
|
0.139019
|
0.002502
|
0.001006
|
-2.50
|
0.152209
|
0.129066
|
0.196562
|
0.003861
|
0.001553
|
-2.00
|
0.155151
|
0.143711
|
0.269490
|
0.006009
|
0.002416
|
-1.50
|
0.161954
|
0.165184
|
0.355789
|
0.009518
|
0.003828
|
-1.00
|
0.177451
|
0.196022
|
0.450000
|
0.015653
|
0.006295
|
-0.50
|
0.211563
|
0.239019
|
0.544211
|
0.027519
|
0.011067
|
0.00
|
0.281295
|
0.296562
|
0.630510
|
0.052598
|
0.021152
|
0.50
|
0.404518
|
0.369490
|
0.703438
|
0.105139
|
0.042282
|
1.00
|
0.575000
|
0.455789
|
0.760981
|
0.199437
|
0.080204
|
1.50
|
0.745482
|
0.550000
|
0.803978
|
0.329643
|
0.132567
|
2.00
|
0.868705
|
0.644211
|
0.834816
|
0.467187
|
0.187881
|
2.50
|
0.938437
|
0.730510
|
0.856289
|
0.587019
|
0.236071
|
3.00
|
0.972549
|
0.803438
|
0.870934
|
0.680533
|
0.273678
|
∑L(U|θ) =
|
2.486619
|
1.000000
|
Dari data diatas tampak kebolehjadian
juga berubah-ubah menurut nilai θ. Bersama itu,
kebolehjadian maksimum terletak di sekitar 0.680533 pada saat itu nilai θ
terletak di sekitar 3.00. Dengan demikian estimasi parameter/kemampuan
adalah θ ≈ 3.00.
Untuk Sheet Perhitungan Nilai Likelihood dengan M.S. Excel, Silahkan download disini.
Untuk Sheet Perhitungan Nilai Likelihood dengan M.S. Excel, Silahkan download disini.
Semangat pagi....bapak Ian...terima kasih artikel bpk ttg irt bisa bikin saya sedikit lebih paham....oya untuk latihan boleh bapak emailkan ke altersda@gmail.com tentang Sheet Perhitungan Nilai Likelihood dengan M.S. Excel...terima kasih dan sukses selalu
ReplyDelete