NoerZhiee's Blog: Validitas Dan Reliabilitas Penilaian

Makalah:

VALIDITAS DAN REALIBILITAS PENILAIAN

Diajukan sebagai tugas individu pada mata kuliah speaking, yang di ampuh oleh Fatimah M.Pd

Oleh:

Satarudin A. Tudu

Siti Nurrahmi

Nurul Zihra

THE STATE INSTITUTE OF ISLAMIC STUDIES

(IAIN) SULTAN AMAI GORONTALO

TARBIYAH AND TADRIS FACULTY

ENGLISH STUDY PROGRAM

2013

BAB I

PENDAHULUAN

A. Latar Belakang

Perkembangan konsep penilaian pendidikan yang ada pada saat ini menunjukkan arah yang lebih luas. Penilaian program pendidikan atau penilaian kurikulum menyangkut penilaian terhadap tujuan pendidikan, isi program, strategi pelaksanaan program dan sarana pendidikan. Penilaian proses belajar-mengajar menyangkut penilaian terhadap kegiatan guru, kegiatan siswa, pola interaksi guru-siswa dan keterlaksanaan program belajar-mengajar. Sedangkan penilaian hasil hasil belajar menyangkut hasil belajar jangka pendek dan hasil belajar jangka panjang.

Dengan demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Hal ini mengisyaratkan bahwa objek yang dinilainya adalah hasil belajar siswa. Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada cara pelaksanaannya.

B. Rumusan Masalah

Adapun yang menjadi rumusan masalah dalam makalah ini, yaitu:

1. Bagaimanakah validitas dalam penilaian?

2. Bagaimanakah reliabilitas dalam penilaian?

C. Tujuan

Berdasarkan rumusan masalah di atas, maka penulis dapat menguraikan tujuannya yaitu:

1. Untuk mengetahui validitas dan reliabilitas dalam penilaian.

BAB II

PEMBAHASAN

Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada kualitas alat penilaiannya di samping pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yakni ketepatan atau validitasnya dan keajegannya atau reliabilitasnya.

A. Validitas

1. Pengertian Validitas

Menurut Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara, tetapi ditanyakan mengenai tata bahasa atau kesastraan seperti puisi atau sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.

Contoh prestasi belajar dan motivasi belajar dapat dinilai oleh tes ataupun oleh kuisioner. Caranya juga bisa berbeda, bisa dilaksanakan secara tertulis atau bisa secara lisan. Ketentuan penting dalam evaluasi adalah bahwa hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan hasil evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar dapat diperoleh data yang valid, instrumen atau alat untuk mengevaluasinya harus valid. Jika pernyataan tersebut dibalik, instrumen evaluasi dituntut untuk valid karena diinginkan dapat diperoleh data yang valid. Dengan kata lain, instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan evaluasi valid.

2. Macam-Macam Validitas

Di dalam buku Encyclopedia of Educational Evaliation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan: “A test is valid if it measures what it purpose to measure”, yang dapat diartikan “sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur”. Dalam bahasa Indonesia “valid” disebut dengan istilah “sahih”. Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau skornya.

Contoh: Skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk mekanik. Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes.

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

a. Validitas Logis

Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” atau validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa penalaran atau penelaahan. Dengan makna demikian maka validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori penyusunan instrumen, secara logis sudah valid. Dari penjelasan tersebut dapat dipahami bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu validitas isi dan validitas konstrak (construct validity). Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi.

b. Validitas Empiris

Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.

Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah instrumen memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksud ada dua cara, yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah ada tersedia, yang sudah ada disebut memiliki validitas “ada sekarang”, yang ada dalam istilah bahasa inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa inggris disebut memiliki predictive validity.

3. Cara Mengetahui Validitas Alat Ukur

Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh Pearson.

B. Reliabilitas

1. Pengertian Reliabilitas

Menurut Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.

Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.

2. Cara Mengetahui Reliabilitas Alat Ukur

Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes. Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency external) dan pada tes itu sendiri (consistency internal). Ada 3 macam untuk mengetahui reliabilitas alat ukur yaitu:

a. Cara Pengukuran Ulang ( Metode Test-Reset Ralibility)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-test-double-trial method. Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya. Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Tentu saja hal ini akan berpengaruh pula terhadap reliabilitas.

Pada umumnya hasil tes yang kedua cenderung lebih baik dari pada hasil tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi. Dalam menggunakan cara ini, tes instrument yang dibuat satu seri tetapi dicobakan dua kali. Kalau asli dari kedua tes tersebut sama atau relative sama maka instrument tersebut reliable. Adapun langkah yang ditempuh pada uji realibilitas ini sebagai berikut:

ü Menyusun sebuah tes yang tersusun tersebut ( tahap I)

ü Mengujikan tes yang tersusun tersebut (tahap II)

ü Menghitung skor hasil tes tahap I

ü Mengujikan ulang tes tersusun tersebut (tahap II)

ü Menghitung skor hasil tes ulang (tahap I)

ü Menghitung realibilitas tes tersebut dengan jalan mengkorelasi skor tes I dengan skor tes II dengan rumus korelasi product Moment Pearson.

b. Cara Mengukur Setara ( Metode Equivalent-From Relibility)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris disebut alternative-form method (parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut. Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

Cara ini adalah cara mengukur reliabilitas tes dengan jalan menyusun dua buah tes yang memiliki kemiripan atau kesamaan. Walaupun tesnya tediri dari dua macam, namun hakikatnya isinya mengukur hal yang sama dan alat ini keduanya juga sama. Cara ini juga dapat di gunakan untuk mengetahui koefisien stabilitas tes dengan asumsi bahwa system yang di ukur dengan tes tersebut tidak akan berubah dengan hanya digunakan dua bentuk tes. Ada langkah yang di tempuh adalah:

ü Menyusun dua buah tes yang sama

ü Menguji kedua buah tes tersebut ( dalam waktu yang bersamaan atau beriringan)

ü Memberikan skor hasil tes A dan tes B

ü Mencari koefisien stabilitas kedua tes (A dan B) dengan jalan mencari korelasinya melalui rumus korelasi product mement.

c. Cara Pengukuran Belah Dua (Metode Split-Half Reliability)

Cara ini dipakai untuk mengetahui tingkat reliabilitas tes dengan jalan membelah tes menjadi dua bagian dan skor kedua belahan tersebut dikorelasikan dengan rumus tertentu. Cara membaginya adalah dengan meletakan soal-soal tes bernomor ganjil pada tengahan I dan soal-soal yang bernomor genap pada tengahan II. Jadi dengan sekali tes diperoleh 2 hasil terpisah. Korelasi antara kedua hasil tersebut akan memperlihatkan reliabilitas instrument tes tersebut. Adapun langkah-langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah:

ü Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga jika dibelah jumlahnya sama.

ü Mengujikan tes tersebut pada satu sampel.

ü Menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan skor genap, dapat juga dikelompokkan skor belahan atas dan skor belahan bawah.

ü Mencari reliabilitas setengah tes dengan jalan mengkorelasikan kedua skor tersebut dengan rumus product moment, atau mencari deviasi pada belahan ganjil genap.

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial method. Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilitas, maka dengan ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes.

Banyak sekali hal yang dapat mempengaruhi hasil tes. Namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu:

1. Hal yang berhubungan dengan tes itu sendiri

Yaitu panjang tes dan kualitas butir-butir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Kualitas butir-butir soal ditentukan oleh:

a. Jelas tidaknya rumusan soal.

b. Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab.

c. Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

2. Hal yang berhubungan dengan tercoba (testee)

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.

3. Hal yang berhubungan dengan penyelenggaraan tes

Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat administrative sangat menentukan hasil tes. Contoh:

a. Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.

b. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.

c. Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya ramai dan sebagainya) akan mempengaruhi hasil tes.

BAB III

PENUTUP

A. Kesimpulan

Berdasarkan pembahasan dari isi makalah di atas maka dapat disimpulkan bahwa:

a. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yakni ketepatan atau validitasnya dan ketetapan atau keajegannya atau reliabilitasnya.

b. Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai. Penilaian tersebut tidak tepat (valid). Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.

c. Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.

d. Validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali-kali.

B. Saran

Demikianlah makalah ini kami buat, semoga apa yang telah disajikan akan memberikan ilmu dan informasi. Selanjutnya demi kesempurnaan makalah ini kami memohon saran dan kritik guna memperbaiki dikemudian hari.

DAFTAR PUSTAKA

Moh. Yasin Fahri. 2009. Sistem Evaluasi Pembelajaran, Sultan Amai Press IAIN Sultan Amai Gorontalo.

http://mathsamah1989.blogspot.com/2012/10/validitas-dan-reliabilitas-tes-hasil.html.

http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html.

NoerZhiee's Blog

Pages

Sunday, December 15, 2013

Validitas Dan Reliabilitas Penilaian

No comments:

Post a Comment