Makalah:
VALIDITAS DAN
REALIBILITAS PENILAIAN
Diajukan sebagai tugas individu pada mata kuliah speaking, yang di ampuh oleh Fatimah
M.Pd
Oleh:
Satarudin
A. Tudu
Siti
Nurrahmi
Nurul
Zihra
THE STATE INSTITUTE OF ISLAMIC STUDIES
(IAIN) SULTAN AMAI GORONTALO
TARBIYAH AND TADRIS
FACULTY
ENGLISH STUDY PROGRAM
2013
BAB I
PENDAHULUAN
A.
Latar Belakang
Perkembangan konsep penilaian pendidikan yang ada pada saat
ini menunjukkan arah yang lebih luas. Penilaian program pendidikan atau
penilaian kurikulum menyangkut penilaian terhadap tujuan pendidikan, isi
program, strategi pelaksanaan program dan sarana pendidikan. Penilaian proses
belajar-mengajar menyangkut penilaian terhadap kegiatan guru, kegiatan siswa,
pola interaksi guru-siswa dan keterlaksanaan program belajar-mengajar.
Sedangkan penilaian hasil hasil belajar menyangkut hasil belajar jangka pendek
dan hasil belajar jangka panjang.
Dengan demikian, inti penilaian adalah proses memberikan
atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria
tertentu. Proses pemberian nilai tersebut berlangsung, baik dalam bentuk
validitas maupun reliabilitas. Hal ini mengisyaratkan bahwa objek yang
dinilainya adalah hasil belajar siswa. Keberhasilan mengungkapkan hasil dan
proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat
tergantung pada kualitas alat penilaiannya di samping pada cara pelaksanaannya.
B.
Rumusan Masalah
Adapun yang menjadi rumusan masalah dalam makalah ini,
yaitu:
1.
Bagaimanakah
validitas dalam penilaian?
2.
Bagaimanakah
reliabilitas dalam penilaian?
C.
Tujuan
Berdasarkan rumusan masalah di atas, maka penulis dapat
menguraikan tujuannya yaitu:
1.
Untuk
mengetahui validitas dan reliabilitas dalam penilaian.
BAB II
PEMBAHASAN
Keberhasilan mengungkapkan hasil dan proses belajar siswa
sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada
kualitas alat penilaiannya di samping pada cara pelaksanaannya. Suatu alat
penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki
atau memenuhi dua hal, yakni ketepatan atau validitasnya dan keajegannya atau
reliabilitasnya.
A.
Validitas
1. Pengertian Validitas
Menurut Azwar (1986) Validitas
berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya. Suatu skala
atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang
memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Validitas berkenaan dengan ketetapan alat penilaian terhadap
konsep yang dinilai sehingga betul-betul menilai apa yang yang seharusnya
dinilai. Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya
diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar
ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami
pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi
ditanyakan mengenai tata bahasa atau kesastraan seperti puisi atau sajak.
Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab
bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah valid
untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
Contoh prestasi belajar dan motivasi belajar dapat dinilai
oleh tes ataupun oleh kuisioner. Caranya juga bisa berbeda, bisa dilaksanakan
secara tertulis atau bisa secara lisan. Ketentuan penting dalam evaluasi adalah
bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi dapat
diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dikatakan baik
apabila sesuai dengan aslinya. Gambar pemotretan hasil evaluasi tersebut di
dalam kegiatan evaluasi dikenal dengan data
evaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data yang
valid, instrumen atau alat untuk mengevaluasinya harus valid. Jika pernyataan
tersebut dibalik, instrumen evaluasi dituntut untuk valid karena diinginkan
dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi
dipersyaratkan valid agar hasil yang diperoleh dari kegiatan evaluasi valid.
2. Macam-Macam Validitas
Di dalam buku Encyclopedia
of Educational Evaliation yang ditulis oleh Scarvia B. Anderson dan
kawan-kawan disebutkan: “A test is valid
if it measures what it purpose to measure”, yang dapat diartikan “sebuah
tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur”.
Dalam bahasa Indonesia “valid”
disebut dengan istilah “sahih”.
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri
tetapi pada hasil pengetesan atau skornya.
Contoh: Skor yang diperoleh dari hasil mengukur kemampuan
mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki
mobil, bukan pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil.
Tes yang mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk
mekanik. Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari
hasil pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal yang kedua
diperoleh validitas empiris (empirical
validity). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes.
Secara garis besar ada dua macam validitas, yaitu validitas
logis dan validitas empiris.
a. Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal
dari kata “logika” atau validitas logis sering juga disebut sebagai analisis
kualitatif yaitu berupa penalaran atau penelaahan. Dengan makna demikian maka
validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena
instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan
ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah
karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara logis
karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang
sudah disusun berdasarkan teori penyusunan instrumen, secara logis sudah valid.
Dari penjelasan tersebut dapat dipahami bahwa validitas logis dapat dicapai
apabila instrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat
disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung
diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstrak (construct validity). Validitas isi bagi sebuah instrumen menunjuk
suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran
yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu
kondisi sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan
yang seharusnya dievaluasi.
b. Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang
artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji dari pengalaman.
Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat
apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh
lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan
bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui berbeda
dari hal-hal yang sudah ada. Dari penjelasan dan contoh-contoh tersebut
diketahui bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun
instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang
dapat dilakukan untuk menguji bahwa sebuah instrumen memang valid. Pengujian
tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan
dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai
pembanding kondisi instrumen dimaksud ada dua cara, yaitu yang sudah tersedia
dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi
instrumen yang kondisinya sesuai dengan kriterium yang sudah ada tersedia, yang
sudah ada disebut memiliki validitas “ada sekarang”, yang ada dalam istilah
bahasa inggris disebut memiliki concurrent
validity. Selanjutnya instrumen yang kondisinya sesuai dengan kriterium
yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas
prediksi, yang dalam istilah bahasa inggris disebut memiliki predictive validity.
3. Cara Mengetahui Validitas Alat Ukur
Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki
validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki
kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan
untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.
B.
Reliabilitas
1. Pengertian Reliabilitas
Menurut Masri Singarimbun, realibilitas adalah indeks yang
menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan.
Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama dan
hasil pengukuran yang diperoleh relative
konsisten, maka alat pengukur tersebut reliable. Dengan kata lain,
realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala
yang sama.
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas
berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai
taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang
tetap. Maka pengertian reliabilitas tes,
berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya
berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
2. Cara Mengetahui Reliabilitas Alat
Ukur
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila
diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya
dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan
rumus korelasi product moment untuk
mengetahui validitas, kesejajaran hasil dalam reliabilitas tes. Kriterium yang
digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu
sendiri (consistency internal). Ada 3
macam untuk mengetahui reliabilitas alat ukur yaitu:
a. Cara Pengukuran Ulang ( Metode
Test-Reset Ralibility)
Metode tes ulang dilakukan orang
untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode
ini pengetes hanya memiliki satu seri tetapi dicobakan dua kali. Oleh karena
tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-test-double-trial method.
Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya. Untuk tes yang banyak mengungkap
pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena karena tercoba
akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu
antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri.
Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Tentu saja
hal ini akan berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua
cenderung lebih baik dari pada hasil tes pertama. Hal ini tidak mengapa karena
pengetes harus sadar akan adanya practice
effect dan carry over effect.
Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil yang ditunjukkan
oleh koefisien korelasi yang tinggi. Dalam menggunakan cara ini, tes instrument
yang dibuat satu seri tetapi dicobakan dua kali. Kalau asli dari kedua tes
tersebut sama atau relative sama maka instrument tersebut reliable. Adapun
langkah yang ditempuh pada uji realibilitas ini sebagai berikut:
ü Menyusun sebuah tes yang tersusun
tersebut ( tahap I)
ü Mengujikan tes yang tersusun
tersebut (tahap II)
ü Menghitung skor hasil tes tahap I
ü Mengujikan ulang tes tersusun
tersebut (tahap II)
ü Menghitung skor hasil tes ulang
(tahap I)
ü Menghitung realibilitas tes tersebut
dengan jalan mengkorelasi skor tes I dengan skor tes II dengan rumus korelasi
product Moment Pearson.
b. Cara Mengukur Setara ( Metode
Equivalent-From Relibility)
Tes paralel atau tes equivalent
adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan
susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris
disebut alternative-form method (parallel
forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya
tes Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan
kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien
korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya
tes seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkan dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sama.
Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena
siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat
soalnya” yang dalam evaluasi disebut adanya practice-effect
dan carry-over effect, artinya ada
faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. Kelemahan
dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun
dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
Cara ini adalah cara mengukur reliabilitas tes dengan jalan
menyusun dua buah tes yang memiliki kemiripan atau kesamaan. Walaupun tesnya
tediri dari dua macam, namun hakikatnya isinya mengukur hal yang sama dan alat
ini keduanya juga sama. Cara ini juga dapat di gunakan untuk mengetahui
koefisien stabilitas tes dengan asumsi bahwa system yang di ukur dengan tes
tersebut tidak akan berubah dengan hanya digunakan dua bentuk tes. Ada langkah
yang di tempuh adalah:
ü Menyusun dua buah tes yang sama
ü Menguji kedua buah tes tersebut (
dalam waktu yang bersamaan atau beriringan)
ü Memberikan skor hasil tes A dan tes
B
ü Mencari koefisien stabilitas kedua
tes (A dan B) dengan jalan mencari korelasinya melalui rumus korelasi product
mement.
c. Cara Pengukuran Belah Dua (Metode
Split-Half Reliability)
Cara ini dipakai untuk mengetahui tingkat reliabilitas tes
dengan jalan membelah tes menjadi dua bagian dan skor kedua belahan tersebut
dikorelasikan dengan rumus tertentu. Cara membaginya adalah dengan meletakan
soal-soal tes bernomor ganjil pada tengahan I dan soal-soal yang bernomor genap
pada tengahan II. Jadi dengan sekali tes diperoleh 2 hasil terpisah. Korelasi
antara kedua hasil tersebut akan memperlihatkan reliabilitas instrument tes
tersebut. Adapun langkah-langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah:
ü Menyusun sebuah tes sebaiknya jumlah
nomornya genap, sehingga jika dibelah jumlahnya sama.
ü Mengujikan tes tersebut pada satu
sampel.
ü Menghitung skor masing-masing
peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan skor
genap, dapat juga dikelompokkan skor belahan atas dan skor belahan bawah.
ü Mencari reliabilitas setengah tes dengan
jalan mengkorelasikan kedua skor tersebut dengan rumus product moment, atau
mencari deviasi pada belahan ganjil genap.
Kelemahan penggunaan metode dua-tes dua kali percobaan dan
satu-tes dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah
dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan
dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial
method. Berbeda dengan metode pertama dan kedua yang setelah diketemukan
koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilitas, maka
dengan ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan
mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes.
Banyak sekali hal yang dapat mempengaruhi
hasil tes. Namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu:
1. Hal yang berhubungan dengan tes itu
sendiri
Yaitu panjang tes dan kualitas
butir-butir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi
rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Kualitas
butir-butir soal ditentukan oleh:
a. Jelas tidaknya rumusan soal.
b. Baik-tidaknya pengarahan soal kepada
jawaban sehingga tidak menimbulkan salah jawab.
c. Petunjuknya jelas sehingga mudah dan
cepat dikerjakan.
2. Hal yang berhubungan dengan tercoba
(testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari
banyak siswa akan mencerminkan keragaman hasil yang menggambarkan
besar-kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan kelompok
terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang
dicobakan pada kelompok tertentu yang diambil secara dipilih.
3. Hal yang berhubungan dengan
penyelenggaraan tes
Sudah disebutkan bahwa faktor penyelenggaraan tes yang
bersifat administrative sangat menentukan hasil tes. Contoh:
a.
Petunjuk
yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada para
tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak
terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil
tes.
b.
Pengawas
yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes.
Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa
jengkel dan tidak dapat dengan leluasa mengerjakan tes.
c.
Suasana
lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya ramai
dan sebagainya) akan mempengaruhi hasil tes.
BAB III
PENUTUP
A.
Kesimpulan
Berdasarkan pembahasan dari isi makalah di atas maka dapat
disimpulkan bahwa:
a.
Suatu
alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut
memiliki atau memenuhi dua hal, yakni ketepatan atau validitasnya dan ketetapan
atau keajegannya atau reliabilitasnya.
b.
Validitas
berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga
betul-betul menilai apa yang yang seharusnya dinilai. Penilaian tersebut tidak
tepat (valid). Alat penilaian yang telah valid untuk suatu tujuan tertentu
belum otomatis akan valid untuk tujuan yang lain.
c.
Reliabilitas
berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai
taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang
tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan
hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat
dikatakan tidak berarti.
d.
Validitas
terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data
dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas
terkait dengan pemotretan berkali-kali.
B. Saran
Demikianlah makalah ini kami buat, semoga apa yang telah
disajikan akan memberikan ilmu dan informasi. Selanjutnya demi kesempurnaan
makalah ini kami memohon saran dan kritik guna memperbaiki dikemudian hari.
DAFTAR PUSTAKA
Moh. Yasin Fahri. 2009. Sistem Evaluasi Pembelajaran, Sultan
Amai Press IAIN Sultan Amai Gorontalo.
http://mathsamah1989.blogspot.com/2012/10/validitas-dan-reliabilitas-tes-hasil.html.
http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html.
No comments:
Post a Comment