A.
Pengertian Penilaian dan Evaluasi Hasil Belajar
Dalam evaluasi pembelajaran terdapat tiga istilah yang
saling berkaitan, meskipun ruang lingkupnya berbeda, yaitu: pengukuran (measurement), penilaian (assessment) dan evaluasi (evaluation). Mengukur adalah menentukan
dimensi kuantitatif berdasarkan suatu standar/ukuran/instrumen yang telah
ditetapkan. Menilai adalah menentukan dimensi kualitatif terhadap suatu hasil
pengukuran, berdasarkan kriteria tertentu yang telah ditetapkan. Sedangkan pengertian
evaluasi dalam konteks evaluasi hasil belajar adalah sama dengan penilaian.
B.
Pengertian Evaluasi Program
Istilah evaluasi juga sering dikaitkan dengan objek yang
ruang lingkupnya lebih luas, yaitu evaluasi program. Program adalah suatu
rangkaian kegiatan sebagai bentuk implementasi dari suatu kebijakan. Menurut
pengertian secara umum, program diartikan sebagai “rencana” yang akan
dilakukan/ dikerjakan oleh seseorang atau suatu organisasi dalam rangka
mencapai tujuan. Namun apabila program tersebut dikaitkan dengan evaluasi
program, maka program didefinisikan sebagai suatu unit atau kesatuan kegiatan
yang merupakan realisasi atau implementasi dari suatu kebijakan, berlangsung
dalam proses yang ber-kesinambungan, dan terjadi dalam suatu organisasi yang
melibatkan sekelompok orang (Suharsimi dan Cepi Safruddin, 2009).
Evaluasi
program memiliki cakupan yang lebih luas dibanding evaluasi hasil pembelajaran
atau evaluasi hasil belajar. Evaluasi pembelajaran hanya difokuskan pada
evaluasi atau penilaian terhadap pencapaian hasil belajar peserta didik,
sedangkan evaluasi program (termasuk diantaranya program pembelajaran) pada
umumnya akan mencakup komponen dari sistem pembelajaran, yang meliputi:
komponen input siswa, input instrumental (seperti: guru, sarana prasarana,
kurikulum dsb.), komponen proses (manajemen sekolah dan proses pem-belajaran),
dan juga komponen output atau hasil pembelajaran.
Evaluasi program termasuk salah satu bentuk penelitian
terapan (applied research), sehingga
sering disebut sebagai penelitian atau riset evaluasi. Oleh karena itu, riset
evaluasi mempunyai kesamaan dengan penelitian pada umumnya, baik dalam langkah-langkahnya,
pemilihan pendekatan, metode, penentuan subyek, sampling maupun prosedur
risetnya. Berkaitan dengan hal tersebut, Nisbet (1999) menyatakan bahwa
perbedaan esensial antara riset evaluasi dan riset konvensional (riset dasar)
adalah lebih pada tujuan daripada dalam pemilihan subyek dan metode.
Dengan demikian, langkah-langkah atau prosedur evaluasi
program adalah sama dengan penelitian pada umumnya, yang meliputi: (1)
merumuskan pertanyaan evaluasi atau rumusan masalah, (2) mengembangkan
instrumen untuk pengumpulan data, (3) melakukan pengumpulan data, (4) analisis
data, dan (5) menyusun laporan hasil evaluasi.
C.
Model-model
Evaluasi Program
Mengingat
bahwa program adalah suatu rangkaian kegiatan sebagai bentuk implementasi dari
suatu kebijakan, maka evaluasi program pada dasarnya merupakan kegiatan
evaluasi terhadap implementasi dari suatu kebijakan.
Mengapa
evaluasi kebijakan perlu dilakukan? Karena pada dasarnya setiap kebijakan negara
(public policy) mengandung resiko
untuk mengalami kegagalan. Abdul Wahab (1990), mengutip pendapat Hogwood dan
Gunn, menjelaskan bahwa penyebab dari kegagalan suatu kebijakan dapat dibagi
menjadi 2 kategori, yaitu: (1) karena “non-implementation”
atau tidak terlaksana sesuai rencana; dan (2) karena “unsuccessful” atau implementasi yang tidak berhasil.
Tidak
terimplementasikannya suatu kebijakan tersebut berarti bahwa kebijakan tersebut
tidak dilaksanakan sesuai dengan yang direncanakan. Sedangkan implementasi yang
tidak berhasil biasanya terjadi bila suatu kebijakan tertentu telah
dilaksanakan sesuai rencana, namun akibat faktor-faktor eksternal yang tidak
mendukung, ternyata kebijakan tersebut tidak berhasil dalam mewujudkan dampak
atau hasil akhir sebagaimana yang dikehendaki.
Isaac seperti dikutip oleh Fernandes (1984)
membedakan model evaluasi program berdasarkan orientasinya, yaitu: (1) model
yang berorientasi pada tujuan (goal-oriented); (2) model yang
berorientasi pada keputusan (decision oriented); (3) model yang
berorientasi pada kegiatan dan orang-orang yang menanganinya; dan (4) model
yang berorientasi pada pengaruh dan dampak program.
Sementara itu, beberapa model evaluasi yang umumnya
diacu antara lain:
1)
Goal Oriented
Evaluation Model, yang dikembangkan oleh Tyler.
2)
Goal Free
Evaluation Model, yang dikembangkan oleh Scriven.
3)
Formatif Sumatif
Evaluation Model, dikembangkan oleh Scriven.
4) CIPP Evaluation Model, yang dikembangkan oleh
Stufflebeam.
1.
Model Evaluasi
yang Berorientasi Pada Tujuan (Goal Oriented)
Model evaluasi yang berorientasi pada tujuan ini
merupakan model yang muncul paling awal. Yang menjadi objek pengamatan pada
model ini adalah tujuan dari program yang sudah ditetapkan sebelum program
tersebut dimulai. Evaluasi ini dilakukan secara berkesinambungan,
terus-menerus, untuk mengevaluasi seberapa jauh tujuan tersebut telah tercapai
dalam proses pelaksanaan program.
2.
Model Evaluasi
Bebas Tujuan (Goal Free Oriented)
Model evaluasi bebas tujuan ini dapat dikatakan
berlawanan dengan model yang pertama. Jika pada model pertama, evaluator secara
terus-menerus memantau tingkat pencapaian tujuan, maka dalam goal free
evaluation evaluator justru seolah-olah berpaling dari tujuan. Menurut Scriven,
dalam melaksanakan evaluasi, evaluator tidak harus hanya terpaku pada tujuan
program, tetapi mereka justru harus mengidentifikasi dampak program, baik
dampak yang positif (hal-hal yang diharapkan) maupun dampak yang negatif
(hal-hal yang tidak diharapkan).
3.
Formatif-Sumatif
Evaluation
Model yang dikembangkan oleh
Scriven ini menunjuk adanya tahapan dan lingkup objek yang dievaluasi, yaitu
evaluasi yang dilakukan pada waktu program tersebut masih berjalan (yang
disebut evaluasi formatif), dan evaluasi yang dilakukan pada saat program
tersebut telah usai (yang disebut evaluasi sumatif).
Evaluasi formatif atau
evaluasi yang dilakukan pada saat program tersebut berjalan, dimaksudkan untuk
mengetahui seberapa jauh program yang telah dirancang tersebut telah berjalan,
dan sekaligus untuk mengidentifikasi hambatan-hambatan yang terjadi secara dini
sehingga dapat melakukan perbaikan-perbaikan guna mendukung kelancaran
pelaksanaan program.
Sementara itu, evaluasi sumatif atau evaluasi yang
dilakukan pada saat program tersebut berakhir, dimaksudkan untuk mengukur
ketercapaian tujuan program.
4.
CIPP Evaluation
Model
Model evaluasi ini merupakan model yang paling
banyak dikenal dan diterapkan oleh para evaluator. Model CIPP ini dikembangkan
oleh Stufflebeam dkk. (1967), yang merupakan singkatan dari:
C à Context
evaluation (evaluasi terhadap konteks)
I à Input
evaluation (evaluasi terhadap masukan)
P à Process
evaluation (evaluasi terhadap proses)
P à Product
evaluation (evaluasi terhadap hasil)
Keempat kata yaitu CIPP
tersebut pada dasarnya merupakan sasaran evaluasi, yang tidak lain adalah
komponen dari suatu program. Dengan kata lain, model CIPP adalah model evaluasi
yang memandang program yang dievaluasi sebagai suatu sistem.
Meskipun model CIPP ini
merupakan model yang memiliki komponen yang cukup lengkap, namun model CIPP
hanya berhenti pada pengukuran output (product). Oleh karena itu, model CIPP
ini telah banyak dikembangkan dengan menambah komponen Outcomes, sehingga model
tersebut menjadi CIPPO. Sebagai contoh, untuk mengevaluasi program diklat,
selain empat komponen konteks (C), masukan atau Input (I), proses (P), dan
hasil atau produk (P), juga diperlukan evaluasi terhadap dampak atau outcomes
(O), yaitu bagaimana keberhasilan lulusan baik di masyarakat ataupun di tempat
kerjanya.
Beberapa model evaluasi yang telah dipaparkan di atas
memiliki banyak kesamaan. Tiap-tiap model evaluasi mempunyai keunggulan yang
cocok untuk diterapkan pada situasi tertentu, namun tidak ada satu modelpun
yang dapat menjawab semua permasalahan evaluasi yang ingin ditelusuri. Selain
model-model evaluasi yang telah dipaparkan oleh para ahli tersebut, pada
dasarnya peneliti juga dapat mengembangkan model evaluasi yang berbeda dengan
yang sudah ada, sesuai dengan kebutuhan akan informasi yang harus mereka
kumpulkan.
D.
CIRI-CIRI PENILAIAN DALAM PENDIDIKAN
Untuk dapat memahami lebih jauh mengenai makna dari
pengukuran dan penilaian hasil belajar tersebut di atas, maka kita harus
mencermati terlebih dahulu mengenai ciri-ciri penilaian dalam pendidikan yaitu
:
1.
Ciri pertama, adalah
bahwa penilaian (pengukuran) pendidikan pada umumnya tidak dapat dilakukan
secara langsung, karena objek yang diukur/ dinilai adalah sesuatu konstruk
psikologis yang tidak tampak (laten). Sebagai contoh, bahwa untuk mengukur
(menilai) pencapaian hasil belajar peserta didik, adalah melalui kemampuannya
dalam mengerjakan soal-soal tes hasil belajar yang disusun oleh guru, yang
mencerminkan indikator dari hasil belajar siswa.
2.
Ciri kedua dari penilaian
pendidikan yaitu penggunaan ukuran atau dimensi kuantitatif. Penilaian pendidikan
yang objektif pada umumnya didahului oleh kegiatan pengukuran yang hasilnya
bersifat kuantitatif, artinya menggunakan simbol-simbol bilangan. Selanjutnya,
hasil pengukuran yang bersifat simbol-simbol bilangan tersebut
diinterprestasikan ke dalam ukuran yang bersifat kualitatif.
3.
Ciri ketiga dari
penilaian pendidikan adalah bersifat relatif, artinya hasilnya tidak selalu
tetap dari satu waktu ke waktu yang lain dan sangat tergantung banyak faktor,
baik yang berasal dari diri peserta didik, penilai maupun situasi yang terjadi
pada saat penilaian berlangsung.
4.
Ciri yang keempat dari
penilaian pendidikan adalah bahwa dalam kegiatan pengukuran dalam rangka
penilaian selalu terjadi adanya kesalahan dalam pengukuran (error). Adapun sumber kesalahan tersebut
dapat berasal dari banyak faktor, yaitu :
a. Kesalahan yang bersumber pada alat ukurnya
Alat yang digunakan untuk mengukur haruslah baik. Sebagai
misal, kita akan mengukur panjang meja tetapi menggunakan pita ukur yang
terbuat dari bahan yang elastis, dan cara mengukurnya dengan ditarik-tarik.
Tentu saja pita ukur semacam itu tidak dapat kita golongkan sebagai alat ukur
yang baik karena gambaran mengenai panjang meja tidak dapat diketahui secara
pasti.
b. Kesalahan yang bersumber pada penilai
1)
Kesalahan yang disebabkan
oleh karena faktor subyektif dari penilai. Sebagai misal, tulisan yang jelek
dan tidak jelas, seringkali akan sangat mempengaruhi subyektivitas dari penilai
dalam memberikan penilaian. Di samping itu, suasana hati dari si penilai juga
akan sangat mempengaruhi penilaian seseorang terhadap suatu obyek.
2)
Kecenderungan dari penilai
untuk memberikan nilai yang cenderung ’murah’ (ceiling-effect) atau cenderung ’mahal’ (floor-effect). Kecenderungan semacam ini pada umumnya terkait erat
dengan pengalaman pribadi si penilai pada saat yang bersangkutan mengikuti
pendidikan yang akan terbawa serta pada saat yang bersangkutan menilai.
3)
Adanya kesan tertentu
dari penilai terhadap peserta didik yang dinilainya, baik yang berasal dari
pengalaman pribadinya mengenai peserta didik tersebut maupun infomasi yang
berasal dari orang lain mengenai peserta didik yang bersangkutan (hallo-effect).
4)
Adanya pengaruh dari
hasil atau prestasi yang telah diperoleh sebelumnya (carry-over-effect). Jika seorang peserta didik sering memperoleh
prestasi yang baik pada waktu-waktu yang lalu,maka kesan ini akan terbawa serta
dan berpengaruh pada penilaian-penilaian selanjutnya.
5)
Kesalahan yang
disebabkan oleh kekeliruan atau kesalahan yang terjadi pada saat menjumlah,
membagi dan sebagainya pada saat pengolahan skor oleh penilai.
c. Kesalahan yang bersumber pada peserta didik yang dinilai:
1)
Peserta didik adalah
manusia biasa yang berperasaan dan memliki suasana hati. Suasana hati seseorang
yang sedang mengikut tes, akan sangat berpengaruh pada hasil pengerjaan tes
tersebut, dan selanjutnya hal ini akan sangat berpengaruh terhadap hasil
penilaian. Sebagai misal, suasana hati yang sedang kalut, risau atau tertekan
akan cenderung memberikan hasil pekerjaan yang kurang memuaskan, sedangkan
suasana hati yang bahagia, ceria, akan cenderung memberikan hasil pekerjaan
yang lebih baik.
2)
Keadaan fisik dari
peserta didik ketika mengikuti tes. Kondisi fisik yang kurang sehat, tentu saja
akan sangat berpengaruh pada hasil pekerjaannya, hal ini sangat berpengaruh
pula pada nilai yang diperolehnya.
3)
Tidak dapat dipungkiri
bahwa faktor nasib ternyata juga dapat berpengaruh terhadap seseorang peserta
didik dalam mengerjakan tes yang sedang diikutinya, hal ini juga akan turut
mempengaruhi hasil yang akan diperolehnya.
d. Kesalahan akibat pengaruh suasana atau situasi di mana penilaian
berlangsung.
1)
Suasana yang gaduh,
baik di dalam maupun di luar ruangan, akan sangat mengganggu konsentrasi
peserta tes dalam mengikut tes, sehingga akan berpengaruh terhadap hasil
pekerjaannya. Selanjutnya, hal ini tentu saja juga akan berpengaruh pada hasil
atau nilai yang diperolehnya.
2)
Pengawasan dalam ujian;
tidak dipungkiri bahwa pengawasan yang dilakukan pada waktu ujian berlangsung
juga akan berpengaruh terhadap peserta didik dalam mengikuti ujian tersebut.
E.
Prinsip-prinsip penilaian
Penilaian hasil belajar peserta didik yang baik
sejauh mungkin didasarkan pada prinsip-prinsip penilaian berikut.
1. Mendidik, yakni mampu memberikan sumbangan positif terhadap peningkatan pencapaian
belajar peserta didik. Hasil penilaian harus dapat memberikan umpan balik dan
memotivasi peserta didik untuk lebih giat belajar.
2. Terbuka/transparan, yakni prosedur penilaian, kriteria penilaian, dan dasar pengambilan
keputusan diketahui oleh pihak yang terkait.
3. Menyeluruh, yakni meliputi berbagai aspek kompetensi yang akan dinilai. Penilaian
yang menyeluruh meliputi ranah pengetahuan (kognitif), keterampilan
(psikomotor), sikap dan nilai (afektif) yang direfleksikan dalam kebiasaan
berfikir dan bertindak.
4. Terpadu dengan pembelajaran, yakni menilai apapun yang dikerjakan peserta didik dalam kegiatan belajar
mengajar itu dinilai, baik kognitif, psikomotorik dan afektifnya. Dengan
demikian, penilaian tidak hanya dilakukan setelah peserta didik menyelesaikan
pokok bahasan tertentu melainkan saat mereka sedang melakukan proses
pembelajaran.
5. Objektif, yakni tidak terpengaruh oleh pertimbangan subjektif penilai.
6. Sistematis, yakni penilaian dilakukan secara berencana dan bertahap untuk memperoleh
gambaran tentang perkembangan belajar peserta didik sebagai hasil kegiatan
belajarnya.
7. Berkesinambungan, yakni dilakukan secara terus menerus sepanjang berlangsungnya kegiatan
pembelajaran.
8. Adil, yakni tidak ada peserta didik yang
diuntungkan atau dirugikan berdasarkan latar belakang sosial-ekonomi,
budaya, agama, bahasa, suku bangsa, warna kulit, dan jender.
9. Menggunakan acuan kriteria, yakni menggunakan kriteria tertentu dalam menentukan kelulusan peserta
didik.
F. Klasifikasi
Hasil Belajar
Menurut Bloom, hasil belajar peserta
didik dapat dikelompokkan ke dalam 3 (tiga) aspek/ranah, yaitu:
1. Hasil belajar yang berkaitan dengan perkembangan kognitif.
2. Hasil belajar yang berkaitan dengan
perkembangan afektif,
3. Hasil belajar yang berkaitan dengan perkembangan keterampilan
(psikomotorik).
Ketiga aspek di atas dapat juga dikelompokkan dengan istilah 3H, yaitu: Head (ranah
kognitif),
Hand (ranah keterampilan motorik), dan Heart (ranah afektif).
Sementara itu, menurut Bloom hasil belajar pada aspek
kognitif (pengetahuan), dapat diklasifikasikan ke dalam 6 tingkatan sesuai degan
kompleksitas/tingkatan berpikir, yaitu:
- Pengetahuan (knowledge), yaitu kemampuan
dalam mengingat kembali: istilah, fakta-fakta, metode, prosedur, proses,
prinsip-prinsip, pola, struktur atau susunan.
- Pemahaman (comprehension), yaitu kemampuan
seseorang dalam: menafsirkan suatu informasi, menentukan
implikasi-implikasi, akibat-akibat maupun pengaruh-pengaruh.
- Aplikasi (application), merupakan
kemampuan menerapkan: hukum, aturan, metoda, prosedur, prinsip, teori yang
bersifat umum dalam situasi yang khusus, atau untuk pemecahan masalah
tertentu.
- Analisis (analysis), merupakan kemampuan
menguraikan suatu informasi yang menyeluruh ke dalam bagian-bagian,
komponen, unsur-unsur yang lebih kecil, sehingga jelas: urutan ide-idenya,
hubungan dan interaksi diantara bagian-bagian atau unsur-unsur tersebut.
- Sintesis (syntesis), merupakan kemampuan
menyusun/mengkombinasikan bagian-bagian, unsur-unsur, menjadi struktur
atau pola yang baru yang koheren, yang sebelumnya tidak ada.
- Evaluasi (evaluation), merupakan kemampuan
untuk menilai ketepatan: teori, prinsip, metoda, prosedur untuk menyelesaikan
masalah tertentu. Adapun kriteria yang digunakan biasanya kualitas,
efektivitas, efisiensi dan konsistensi.
G. JENIS PENILAIAN HASIL BELAJAR
Untuk memperoleh data hasil penilaian yang otentik (mampu
menggambarkan kompetensi yang sebenarnya), pendidik dianjurkan untuk menerapkan
berbagai teknik penilaian secara komplementer (saling melengkapi) sesuai dengan
kompetensi yang akan dinilai. Kombinasi penggunaan berbagai teknik penilaian
akan memberikan informasi yang lebih akurat tentang kemajuan belajar peserta
didik.
Secara garis besar alat penilaian (evaluasi) yang
digunakan dalam bidang pendidikan/pelatihan dapat digolongkan menjadi dua
macam, yaitu : (1) Tes; dan (2) Bukan Tes (Non-Tes).
1. Teknik Non-Tes
Alat penilaian yang tergolong
teknik non-tes adalah :
a)
Skala
bertingkat (rating scale)
b)
Kuesioner/angket
(questionaire)
c)
Wawancara
(interview)
d)
Daftar
Cocok (check-list)
e)
pengamatan
atau observasi
f)
Riwayat
Hidup
|
g)
Portofolio
h)
Jurnal
i)
Inventori
j)
Penilaian
diri (self evaluation)
k)
Penilaian
oleh teman (peer review).
|
2. Teknik Tes
Tes adalah sejumlah pertanyaan yang
memiliki jawaban benar atau salah, sejumlah pertanyaan yang harus dijawab, atau
pernyataan-pernyataan yang harus dipilih, ditanggapi, atau tugas-tugas yang
harus dilakukan oleh orang yang diuji untuk waktu tertentu, dengan tujuan untuk
mengukur suatu aspek tertentu dari orang yang diuji tersebut.
Menurut bentuk pelaksanaannya, secara garis besar dikenal
tiga bentuk tes, yaitu: (1) tes lisan; (2) tes bentuk perbuatan; dan (3) tes
tertulis.
1.
Ujian Lisan
Tes ini pada umumnya berbentuk tanya jawab face to face. Penilai memberikan
pertanyaan (interview) langsung kepada
testi (peserta didik). Ujian lisan pada umumnya digunakan untuk mengevaluasi
hasil belajar dalam bentuk kemampuan dalam mengemukakan ide-ide dan
pendapat-pendapat secara lisan. Bagi bidang studi yang menuntut
keterampilan-keterampilan untuk berbicara atau berhubungan dengan orang lain,
maka ujian lisan ini dirasa mempunyai kedudukan yang cukup penting.Namun,
karena alasan teknis (kepraktisan), ujian lisan ini pada umumnya jarang
digunakan untuk melakukan penilaian kompetensi dalam pembelajaran yang rutin.
a. Keunggulan Tes Lisan :
1) Dapat digunakan untuk melakukan penilaian hasil belajar yang mendalam.
2) Dapat digunakan untuk mengevaluasi kemampuan berpikir bertaraf tinggi.
3) Dapat digunakan untuk menguji pemahaman seseorang terkait dengan hasil
karyanya.
4) Tidak memungkinkan penyontekkan dan bahannya cukup luas.
b. Kelemahan Tes Lisan :
1) Jika pertanyaannya tidak dipersiapkan dengan baik, maka penguji hanya akan
bertanya hal-hal yang diingatnya saja.
2) Sangat mungkin terjadinya ketidak-adilan antara peserta tes, baik yang berkaitan
dengan: lama waktu ujian, tingkat kesukaran soal maupun tolok ukur dalam memberikan
penilaian.
3) Penilaiannya bersifat sangat subyektif.
4) Banyak memakan waktu dalam pelaksanaannya; dan
5) Memungkinkan peserta tes untuk
bersikap ABS, atau mengiyakan semua komentar penguji dengan maksud supaya
diluluskan.
2.
Ujian Perbuatan
Tes bentuk perbuatan ini pada umumnya dilakukan dengan
cara menyuruh peserta didik (peserta tes) untuk melakukan sesuatu pekerjaan
yang bersifat fisik (praktik). Tes bentuk perbuatan ini sangat cocok untuk
melakukan penilaian dalam pelajaran praktik/keterampilan atau praktikum di
laboratorium. Alat yang digunakan untuk melakukan penilaian pada umumnya berupa
lembar pengamat-an (lembar observasi). Tes bentuk perbuatan ini pada umumnya dapat
digunakan untuk menilai proses maupun hasil (produk) dari suatu pekerjaan.
a. Keunggulan Tes
Perbuatan
1) Tes perbuatan dapat digunakan untuk melakukan penilaian sejumlah perilaku
atau penampilan yang kompleks dalam situasi riil.
2) Tes perbuatan dapat digunakan untuk melakukan penilaian penampilan yang
tidak dapat dievaluasi dengan alat-alat evaluasi lainnya.
3) Ujian perbuatan dapat digunakan untuk melihat kesesuaian antara pengetahuan
yang bersifat teoritis dan keterampilan di dalam praktik.
4) Di dalam ujian perbuatan tidak ada peluang untuk saling menyontek.
b. Kelemahan Tes Perbuatan
1) Ujian perbuatan memerlukan waktu yang lebih banyak, karena penilaiannya
hanya dapat dilakukan seorang demi seorang (terutama pada penilaian proses).
2) Ujian perbuatan pada umumnya memerlukan peralatan, mesin-mesin atau
bahan-bahan khusus, sehingga menjadi lebih mahal daripada ujian tertulis.
3) Penilaian dalam ujian perbuatan pada umumnya lebih subyektif, karena akan
selalu melibatkan keputusan penilai.
4) Seringkali sangat membosankan, karena umumnya bersifat monoton.
3.
Ujian Tertulis
Ujian tertulis ini biasanya dilakukan secara berkelompok
dengan mengambil tempat di suatu ruangan tertentu. Dalam ujian tertulis dikenal
dua bentuk tes, yaitu tes essai (uraian) dan tes obyektif.
a. Soal Tes Bentuk
Uraian (Essai)
Pertanyaan yang diajukan dalam soal tes bentuk essai
(uraian) hendaknya benar-benar merupakan soal-soal yang memerlukan waktu dalam
pemikiran jawabannya. Tes ini umumnya memerlukan jawaban yang berbentuk
bahasan. Ciri-cirinya selalu diawali dengan kata-kata ”Bagaimana, Mengapa,
Berikan alasan, Uraikan, Jelaskan, Bandingkan, Simpulkan, Tunjukkan, Bedakan”
dan sebagainya. Soal tes bentuk essai ini mempunyai dua bentuk, yaitu essai
terbatas dan essai bebas.
Soal tes bentuk essai jika disusun dengan baik akan
memiliki beberapa keunggulan yang tidak ditemui pada tes obyektif.
Keunggulan-keunggulan tes bentuk essai tersebut antara lain :
1) Jawaban harus disusun sendiri oleh testi (melatih dalam pemilihan kata-kata
dan menyusun kalimat)
2) Tidak ada
kemungkinan menebak;
3) Dapat mengukur kemampuan yang kompleks;
4) Dapat digunakan untuk mengembangkan penalaran testi;
5) Proses
penyusunan soalnya relatif mudah; dan
6) Proses
berpikir testi dapat dilacak dari jawabannya.
Namun demikian, tes bentuk essai juga mempunyai beberapa
kelemahan, antara lain:
1) Jumlah
soal sangat terbatas, sehingga cakupan materi (validitas isi) lemah;
2) Tingkat
kebenaran jawaban dan penilaiannya subyektif;
3) Jawaban
testi kadang tidak relevan dengan pertanyaan;
4) Pemeriksaannya
sulit, hanya dapat dilakukan oleh penyusunnya;
5) Skor
umumnya kurang reliabel;
6) Kualitas jawaban tergantung pada kemampuan testi dalam memilih kata-kata dan menyusun kalimat; dan
7) Banyak dijumpai soal-soal tes uraian yang hanya mengungkap pengetahuan yang
dangkal.
b. Soal Tes Obyektif
Soal tes obyektif pada umumnya tepat digunakan untuk
mengevaluasi hasil belajar yang berupa kemampuan-kemampuan dalam: mengenal
kembali fakta-fakta, memahami hubungan antara dua hal atau lebih, dan kemampuan
dalam mengaplikasikan prinsip-prinsip. Pada saat ini, penggunaan tes bentuk
obyektif (terutama bentuk pilihan ganda) sudah sangat berkembang, sehingga juga
dapat dikembangkan untuk mengukur kemampuan-kemampuan dalam menganalisis,
mensintesis dan mengevaluasi.
Namun, soal tes obyektif juga banyak dikritik karena
dianggap tidak mampu mengembangkan daya nalar siswa. Beberapa kelemahan tes
obyektif antara lain:
1) Tidak
melatih testi untuk mengemukakan ide-idenya secara tertulis;
2) Kemungkinan menebak besar sekali, dan sulit dilacak;
3) Memungkinkan untuk saling menyontek;
4) Sulit untuk membuat soal yang baik, dan sering hanya mengukur kemampuan
yang dangkal; dan
5) Banyak
waktu yang tersita untuk membaca soal dan jawabannya.
6) Beberapa kemampuan tertentu, seperti: kemampuan dalam mengemuka-kan
pendapat, ide-ide dan sebagainya tak mungkin diukur dengan tes bentuk obyektif.
Namun demikian, soal tes obyektif juga memiliki beberapa
keunggulan yang tidak ditemukan pada soal-soal tes bentuk essai.
Keunggulan-keunggulan tersebut adalah :
1) Jumlah
soal banyak, sehingga dapat mencakup semua isi mata pelajaran (representatif à validitas isi
baik);
2) Penilaiannya
mudah dan obyektif;
3) Tugas
yang harus dilakukan tesi jelas, sehingga tidak ada kemungkinan bagi testi
untuk mengemukakan hal-hal yang tidak relevan dengan pertanyaan;
4) Hasil tes
dapat diinformasikan lebih cepat;
5) Reliabilitas
skor tinggi; dan
6) Memungkinkan
penyelenggaraan tes bersama pada wilayah yang luas (SPMB, UNAS, UAS, UUB dsb).
c.
Bagaimana Menetapkan Bentuk Tes yang Sesuai?
Tes obyektif mempunyai tujuan yang berbeda dengan tes
essai. Oleh karena itu, di antara kedua tes tersebut tidak dapat dibandingkan
karena mengemban misi yang berbeda. Kedua tes tersebut
selain masing-masing memiliki kelebihan juga memiliki kelemahan.
Dalam hal ini, untuk menetapkan sesuai tidaknya bentuk
tes yang digunakan dalam pengukuran (penilaian) akan sangat tergantung pada
beberapa pertimbangan antara lain:
a.
Indikator/kompetensi
dasar yang akan diukur.
b.
Jumlah peserta tes,
bila jumlah peserta tes sangat besar (seperti Unas atau UMPTN), yang mencapai
ratusan ribu orang, maka pilihan untuk menggunakan bentuk tes obyektif adalah
lebih tepat.
c.
Ruang lingkup materi
yang akan diujikan. Untuk tes yang mencakup ruang lingkup materi yang luas,
maka pemakaian tes obyektif dipandang lebih sesuai daripada tes essai.
d.
Sementara itu, jika
jumlah peserta tes tidak terlalu banyak (seperti tes bagi peserta didik pada
kelas tertentu), atau tes dengan ruang lingkup materi yang terbatas (misalnya
tes formatif), maka guru dapat menggunakan tes bentuk uraian atau essai.
Sementara
itu, menurut tahap pelaksanaannya, penilaian dapat dibagi
menjadi dua, yaitu:
a. Penilaian formatif; dilakukan dengan maksud memantau sejauhmanakah suatu proses pendidikan
telah berjalan sebagaimana yang direncanakan.
b. Penilaian sumatif; dilakukan untuk mengetahui sejauhmanakah peserta didik telah dapat
berpindah dari suatu unit pembelajaran ke unit berikutnya.
H. PERSYARATAN TES
Sebuah tes dapat dikatakan baik sebagai alat pengukur,
jika memiliki beberapa persyaratan sebagai berikut: (1) validitas; (2)
reliabilitas; (3) obyekti-vitas; (4) praktikabilitas; dan (5) ekonomis.
1. Validitas
Suatu tes dikatakan valid (sahih) apabila tes tersebut
dapat mengukur apa yang seharusnya diukurnya.
Contoh: untuk mengukur tingkat partisipasi peserta didik dalam proses pembelajaran,
maka bukan diukur berdasarkan nilai atau prestasi yang diperoleh pada saat mengikuti
ujian, akan tetapi akan lebih tepat jika diukur berdasarkan :
a.
Tingkat kehadirannya
b.
Terpusatnya perhatian
pada pelajaran
c.
Selalu menjawab
pertanyaan yang diajukan oleh guru.
2. Reliabilitas
Reliabel berarti dapat dipercaya. Maka tes dikatakan
memiliki reliabilitas, apabila tes tersebut mempunyai sifat dapat dipercaya.
Seseorang dikatakan dapat dipercaya apabila orang tersebut selalu bicara ajeg
(konsisten), tidak plin-plan atau berubah-ubah pembicaraannya dari waktu ke
waktu. Demikian pula halnya, sebuah tes dikatakan dapat dipercaya (reliabel)
jika dapat memberikan hasil yang tetap (konsisten) apabila diteskan
berulang-ulang.
3. Obyektivitas
Dalam pengertian sehari-hari, obyektif berarti tidak
adanya unsur-unsur pribadi (subyektivitas) yang mempengaruhi. Suatu tes
dikatakan memiliki obyektivitas apabila dalam penggunaannya tidak da faktor
subyektif dari pemakainya yang dapat mempengaruhinya, terutama dalam skoringnya.
Apabila dikaitkan dengan reliabilitas, maka obyektivitas
menetapkan keajegan (konsistensi) pada sistem pemberian skor (skoringnya),
sedangkan reliabilitas menekankan keajegan pada hasil tes yang diperoleh oleh
setiap peserta tes.
Dalam hal ini, terdapat dua faktor yang mempengaruhi
obyektivitas suatu tes, yaitu :
a.
Bentuk tes
Tes yang berbentuk uraian (essai), akan memberikan banyak
kemungkinan kepada si penilai untuk memberikan banyak penilaian (skoring)
menurut caranya sendiri. Dengan demikian, maka hasil yang diperoleh seorang
peserta tes, akan dapat berbeda apabila dinilai oleh penilai lainnya. Hal ini
menunjukkan bahwa dengan menggunakan tes bentuk uraian (bentuk subyektif), akan
memungkinkan masuknya unsur subyektivitas dari si penilai dalam melakukan skoring.
b.
Penilai
Dengan menggunakan tes bentuk uraian, faktor
subyektivitas dari seorang penilai akan dapat masuk secara lebih leluasa dan
mempengaruhi dalam pemberian skor (skoring). Faktor-faktor yang dapat
mempengaruhi dalam subyektivitas penilaian tersebut antara lain : kesan penilai
terhadap peserta tes (hallo-effect),
tulisan, bahasa, waktu pelaksanaan penilaian dan sebagainya.
4. Praktikabilitas
Suatu tes dikatakan memiliki praktikabilitas yang tinggi,
apabila tes tersebut bersifat praktis atau mudah digunakan dan mudah pula dalam
pengadministrasiannya. Adapun tes yang praktis adalah tes yang memiliki
ciri-ciri sebagai berikut :
a.
Mudah digunakan,
misalnya tidak menuntut peralatan yang kompleks, mudah pengawasannya, dan
memberikan kemudahan kepada peserta tes untuk mengerjakan terlebih dahulu
bagian-bagian yang dianggapnya mudah.
b.
Mudah pemeriksaannya,
artinya bahwa tes tersebut dilengkapi dengan kunci jawaban maupun pedoman
pemberian skor (skoringnya). Sebagai contoh : tes bentuk obyektif,
pemeriksaannya akan lebih mudah dilakukan jika dikerjakan dalam lembar jawaban
tersendiri. Untuk saat ini, pemeriksaaan tes bentuk obyektif sudah dapat
dilakukan dengan bantuan komputer, sehingga dapat dilakukan dalam waktu yang
lebih cepat dan akurat.
c.
Tes tersebut dilengkapi
dengan petunjuk-petunjuk yang jelas, sehingga dapat diujikan oleh orang lain.
5. Ekonomis
Yang dimaksud dengan ekonomis adalah bahwa dalam
pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, peralatan yang
kompleks dan mahal, tenaga dan waktu yang banyak.
I.
Acuan
Penilaian
Dilihat dari penafsiran hasil tes, pengukuran dalam
bidang pendidikan dapat berdasarkan acuan norma/relatif atau acuan
kriteria/patokan. Kedua acuan tersebut menggunakan asumsi yang berbeda tentang
kemampuan seseorang. Penafsiran hasil tes antara kedua acuan itu juga berbeda,
sehingga menghasilkan informasi yang berbeda maknanya. Pemilihan acuan
ditentukan oleh karakteristik mata pelajaran yang akan diukur dan tujuan yang
akan dicapai.
Penilaian acuan norma berasumsi bahwa kemampuan orang
berbeda dan dapat digambarkan menurut distribusi normal. Perbedaan itu harus
ditunjukkan oleh hasil pengukuran, misalnya setelah mengikuti pembelajaran
selama satu semester, peserta didik dites. Hasil tes seorang peserta didik
dibandingkan dengan kelompoknya, sehingga dapat diketahui posisi peserta didik
tersebut di kelas itu.
Penilaian acuan kriteria berasumsi bahwa hampir semua
orang dapat belajar apa saja, meskipun dengan waktu yang berbeda. Dalam acuan
kriteria, penafsiran skor hasil tes selalu dibandingkan dengan kriteria yang
telah ditetapkan. Bagi peserta didik yang telah mencapai kriteria yang telah
ditetapkan (standar) diberi pelajaran tambahan yang biasa disebut pengayaan,
sedangkan bagi peserta didik yang belum mencapai standar diberi remidi.
Ketuntasan belajar setiap indikator yang telah ditetapkan
dalam suatu kompetensi dasar atau kriteria
ketuntasan minimal (KKM). Satuan pendidikan harus menentukan kriteria
ketuntasan minimal dengan mempertimbangkan tingkat kemampuan rata-rata peserta
didik dan pendukung penyelenggaraan pembelajaran.
J.
Penilaian
Pembelajaran Jarak Jauh
Pembelajaran jarak jauh (distance learning) terutama dilakukan ketika model pembelajaran
konvensional tidak atau sulit dilaksanakan karena terkendala oleh beberapa
sebab.
Secara teoretis, pembelajaran konvensional melalui tatap
muka secara langsung tentulah akan lebih efektif untuk mengubah tingkah laku
peserta didik karena guru-siswa dapat berinteraksi secara langsung untuk
memberikan asah, asih dan asuh. Namun demikian, mengingat berbagai kendala di
atas maka pembelajaran jarak jauh terpaksa harus ditempuh.
Model pembelajaran jarak jauh yang telah lama diterapkan
adalah model belajar mandiri, yang dilaksanakan dengan bantuan modul atau
belajar sistem modul. Di Indonesia, model belajar mandiri ini telah lama
diterapkan oleh Universitas Terbuka. Untuk mengefektifkan belajar peserta
didik, secara periodik dilakukan kegiatan tutorial yang dibimbing oleh seorang
tutor, yang biasanya dilaksanakan pada pusat-pusat kegiatan belajar.
Model evaluasi pembelajaran yang diterapkan umumnya
berupa system evaluasi mandiri, yang berbentuk soal-soal evaluasi atau
penugasan yang terdapat pada modul pembelajaran. Evaluasi yang dilakukan adalah
secara tertulis, yang bentuk soal-soalnya tidak berbeda dengan soal-soal tes
tertuis pada umumnya. Perbedaannya terletak pada kemandirian peserta didik
untuk mengevaluasi penguasaan materi yang telah dipelajarinya secara mandiri
secara jujur. Sedangkan evaluasi akhir yang akan menentukan kompetensi peserta
didik dalam menguasai materi (modul) yang telah dipelajari biasanya dilakukan
oleh penyelenggara pendidikan dalam bentuk ujian secara terjadual.
Dengan demikian, soal-soal evaluasi (baik soal maupun
tugas-tugas) pada system pembelajaran jarak jauh secara mandiri adalah tidak
berbeda dengan soal-soal evaluasi pembelajaran yang konvensional, yang umumnya
hanya mengungkap kompetensi dalam ranah kognitif (pengetahuan).
Sementara itu, model pembelajaran jarak jauh yang saat
ini banyak diterapkan, meskipun masih terbatas pada suplemen, adalah
pembelajaran jarak jauh yang berbasis teknologi informasi dan komunikasi, yang
disebut e-learning. E-learning adalah model pembelajaran jarak jauh yang
berbasis ICT, yang bersifat interaktif antara pendidik dan peserta didik yang
dilakukan melalui dunia maya (komputer jaringan).
Model evaluasi pembelajaran yang dilakukan pada dasarnya
tidak berbeda dengan sistem evaluasi pembelajaran konvensional. Dalam hal ini,
soal-soal atau tugas disusun tidak berbeda dengan evaluasi pembelajaran paper and pencil test yang konvensional,
tetapi dilakukan melalui dunia maya.
Beberapa kendala yang sering dialami dalam penerapan
model pembelajaran jarak jauh dan evaluasi pembelajarannya, adalah berkaitan
dengan permasalahan berikut: (1) kelancaran jaringan untuk berkomunikasi, baik
dalam mengunduh materi, soal-soal tugas, maupun dalam mengunggah jawaban soal,
atau untuk berinteraksi dengan pendidik, (2) faktor kejujuran, karena
pengerjaan soal atau tugas-tugas tidak dapat diawasi sehingga sering
menyebabkan munculnya ketidak-jujuran, (3) ketersediaan perangkat komputer
jaringan yang memadai, sehingga interaksi/komunikasi dapat berjalan lancar.
Artikel Terkait
2 komentar :
artikelnya panjang namun sangat bermanfaat
thanks udah berkunjung,...
Posting Komentar