Evaluasi Pembelajaran

A. Pengertian Penilaian dan Evaluasi Hasil Belajar

Dalam evaluasi pembelajaran terdapat tiga istilah yang saling berkaitan, meskipun ruang lingkupnya berbeda, yaitu: pengukuran (measurement), penilaian (assessment) dan evaluasi (evaluation). Mengukur adalah menentukan dimensi kuantitatif berdasarkan suatu standar/ukuran/instrumen yang telah ditetapkan. Menilai adalah menentukan dimensi kualitatif terhadap suatu hasil pengukuran, berdasarkan kriteria tertentu yang telah ditetapkan. Sedangkan pengertian evaluasi dalam konteks evaluasi hasil belajar adalah sama dengan penilaian.

B. Pengertian Evaluasi Program

Istilah evaluasi juga sering dikaitkan dengan objek yang ruang lingkupnya lebih luas, yaitu evaluasi program. Program adalah suatu rangkaian kegiatan sebagai bentuk implementasi dari suatu kebijakan. Menurut pengertian secara umum, program diartikan sebagai “rencana” yang akan dilakukan/ dikerjakan oleh seseorang atau suatu organisasi dalam rangka mencapai tujuan. Namun apabila program tersebut dikaitkan dengan evaluasi program, maka program didefinisikan sebagai suatu unit atau kesatuan kegiatan yang merupakan realisasi atau implementasi dari suatu kebijakan, berlangsung dalam proses yang ber-kesinambungan, dan terjadi dalam suatu organisasi yang melibatkan sekelompok orang (Suharsimi dan Cepi Safruddin, 2009).

Evaluasi program memiliki cakupan yang lebih luas dibanding evaluasi hasil pembelajaran atau evaluasi hasil belajar. Evaluasi pembelajaran hanya difokuskan pada evaluasi atau penilaian terhadap pencapaian hasil belajar peserta didik, sedangkan evaluasi program (termasuk diantaranya program pembelajaran) pada umumnya akan mencakup komponen dari sistem pembelajaran, yang meliputi: komponen input siswa, input instrumental (seperti: guru, sarana prasarana, kurikulum dsb.), komponen proses (manajemen sekolah dan proses pem-belajaran), dan juga komponen output atau hasil pembelajaran.

Evaluasi program termasuk salah satu bentuk penelitian terapan (applied research), sehingga sering disebut sebagai penelitian atau riset evaluasi. Oleh karena itu, riset evaluasi mempunyai kesamaan dengan penelitian pada umumnya, baik dalam langkah-langkahnya, pemilihan pendekatan, metode, penentuan subyek, sampling maupun prosedur risetnya. Berkaitan dengan hal tersebut, Nisbet (1999) menyatakan bahwa perbedaan esensial antara riset evaluasi dan riset konvensional (riset dasar) adalah lebih pada tujuan daripada dalam pemilihan subyek dan metode.

Dengan demikian, langkah-langkah atau prosedur evaluasi program adalah sama dengan penelitian pada umumnya, yang meliputi: (1) merumuskan pertanyaan evaluasi atau rumusan masalah, (2) mengembangkan instrumen untuk pengumpulan data, (3) melakukan pengumpulan data, (4) analisis data, dan (5) menyusun laporan hasil evaluasi.

C. Model-model Evaluasi Program

Mengingat bahwa program adalah suatu rangkaian kegiatan sebagai bentuk implementasi dari suatu kebijakan, maka evaluasi program pada dasarnya merupakan kegiatan evaluasi terhadap implementasi dari suatu kebijakan.

Mengapa evaluasi kebijakan perlu dilakukan? Karena pada dasarnya setiap kebijakan negara (public policy) mengandung resiko untuk mengalami kegagalan. Abdul Wahab (1990), mengutip pendapat Hogwood dan Gunn, menjelaskan bahwa penyebab dari kegagalan suatu kebijakan dapat dibagi menjadi 2 kategori, yaitu: (1) karena “non-implementation” atau tidak terlaksana sesuai rencana; dan (2) karena “unsuccessful” atau implementasi yang tidak berhasil.

Tidak terimplementasikannya suatu kebijakan tersebut berarti bahwa kebijakan tersebut tidak dilaksanakan sesuai dengan yang direncanakan. Sedangkan implementasi yang tidak berhasil biasanya terjadi bila suatu kebijakan tertentu telah dilaksanakan sesuai rencana, namun akibat faktor-faktor eksternal yang tidak mendukung, ternyata kebijakan tersebut tidak berhasil dalam mewujudkan dampak atau hasil akhir sebagaimana yang dikehendaki.

Isaac seperti dikutip oleh Fernandes (1984) membedakan model evaluasi program berdasarkan orientasinya, yaitu: (1) model yang berorientasi pada tujuan (goal-oriented); (2) model yang berorientasi pada keputusan (decision oriented); (3) model yang berorientasi pada kegiatan dan orang-orang yang menanganinya; dan (4) model yang berorientasi pada pengaruh dan dampak program.

Sementara itu, beberapa model evaluasi yang umumnya diacu antara lain:

1) Goal Oriented Evaluation Model, yang dikembangkan oleh Tyler.

2) Goal Free Evaluation Model, yang dikembangkan oleh Scriven.

3) Formatif Sumatif Evaluation Model, dikembangkan oleh Scriven.

4) CIPP Evaluation Model, yang dikembangkan oleh Stufflebeam.

1. Model Evaluasi yang Berorientasi Pada Tujuan (Goal Oriented)

Model evaluasi yang berorientasi pada tujuan ini merupakan model yang muncul paling awal. Yang menjadi objek pengamatan pada model ini adalah tujuan dari program yang sudah ditetapkan sebelum program tersebut dimulai. Evaluasi ini dilakukan secara berkesinambungan, terus-menerus, untuk mengevaluasi seberapa jauh tujuan tersebut telah tercapai dalam proses pelaksanaan program.

2. Model Evaluasi Bebas Tujuan (Goal Free Oriented)

Model evaluasi bebas tujuan ini dapat dikatakan berlawanan dengan model yang pertama. Jika pada model pertama, evaluator secara terus-menerus memantau tingkat pencapaian tujuan, maka dalam goal free evaluation evaluator justru seolah-olah berpaling dari tujuan. Menurut Scriven, dalam melaksanakan evaluasi, evaluator tidak harus hanya terpaku pada tujuan program, tetapi mereka justru harus mengidentifikasi dampak program, baik dampak yang positif (hal-hal yang diharapkan) maupun dampak yang negatif (hal-hal yang tidak diharapkan).

3. Formatif-Sumatif Evaluation

Model yang dikembangkan oleh Scriven ini menunjuk adanya tahapan dan lingkup objek yang dievaluasi, yaitu evaluasi yang dilakukan pada waktu program tersebut masih berjalan (yang disebut evaluasi formatif), dan evaluasi yang dilakukan pada saat program tersebut telah usai (yang disebut evaluasi sumatif).

Evaluasi formatif atau evaluasi yang dilakukan pada saat program tersebut berjalan, dimaksudkan untuk mengetahui seberapa jauh program yang telah dirancang tersebut telah berjalan, dan sekaligus untuk mengidentifikasi hambatan-hambatan yang terjadi secara dini sehingga dapat melakukan perbaikan-perbaikan guna mendukung kelancaran pelaksanaan program.

Sementara itu, evaluasi sumatif atau evaluasi yang dilakukan pada saat program tersebut berakhir, dimaksudkan untuk mengukur ketercapaian tujuan program.

4. CIPP Evaluation Model

Model evaluasi ini merupakan model yang paling banyak dikenal dan diterapkan oleh para evaluator. Model CIPP ini dikembangkan oleh Stufflebeam dkk. (1967), yang merupakan singkatan dari:

C à Context evaluation (evaluasi terhadap konteks)

I à Input evaluation (evaluasi terhadap masukan)

P à Process evaluation (evaluasi terhadap proses)

P à Product evaluation (evaluasi terhadap hasil)

Keempat kata yaitu CIPP tersebut pada dasarnya merupakan sasaran evaluasi, yang tidak lain adalah komponen dari suatu program. Dengan kata lain, model CIPP adalah model evaluasi yang memandang program yang dievaluasi sebagai suatu sistem.

Meskipun model CIPP ini merupakan model yang memiliki komponen yang cukup lengkap, namun model CIPP hanya berhenti pada pengukuran output (product). Oleh karena itu, model CIPP ini telah banyak dikembangkan dengan menambah komponen Outcomes, sehingga model tersebut menjadi CIPPO. Sebagai contoh, untuk mengevaluasi program diklat, selain empat komponen konteks (C), masukan atau Input (I), proses (P), dan hasil atau produk (P), juga diperlukan evaluasi terhadap dampak atau outcomes (O), yaitu bagaimana keberhasilan lulusan baik di masyarakat ataupun di tempat kerjanya.

Beberapa model evaluasi yang telah dipaparkan di atas memiliki banyak kesamaan. Tiap-tiap model evaluasi mempunyai keunggulan yang cocok untuk diterapkan pada situasi tertentu, namun tidak ada satu modelpun yang dapat menjawab semua permasalahan evaluasi yang ingin ditelusuri. Selain model-model evaluasi yang telah dipaparkan oleh para ahli tersebut, pada dasarnya peneliti juga dapat mengembangkan model evaluasi yang berbeda dengan yang sudah ada, sesuai dengan kebutuhan akan informasi yang harus mereka kumpulkan.

D. CIRI-CIRI PENILAIAN DALAM PENDIDIKAN

Untuk dapat memahami lebih jauh mengenai makna dari pengukuran dan penilaian hasil belajar tersebut di atas, maka kita harus mencermati terlebih dahulu mengenai ciri-ciri penilaian dalam pendidikan yaitu :

1. Ciri pertama, adalah bahwa penilaian (pengukuran) pendidikan pada umumnya tidak dapat dilakukan secara langsung, karena objek yang diukur/ dinilai adalah sesuatu konstruk psikologis yang tidak tampak (laten). Sebagai contoh, bahwa untuk mengukur (menilai) pencapaian hasil belajar peserta didik, adalah melalui kemampuannya dalam mengerjakan soal-soal tes hasil belajar yang disusun oleh guru, yang mencerminkan indikator dari hasil belajar siswa.

2. Ciri kedua dari penilaian pendidikan yaitu penggunaan ukuran atau dimensi kuantitatif. Penilaian pendidikan yang objektif pada umumnya didahului oleh kegiatan pengukuran yang hasilnya bersifat kuantitatif, artinya menggunakan simbol-simbol bilangan. Selanjutnya, hasil pengukuran yang bersifat simbol-simbol bilangan tersebut diinterprestasikan ke dalam ukuran yang bersifat kualitatif.

3. Ciri ketiga dari penilaian pendidikan adalah bersifat relatif, artinya hasilnya tidak selalu tetap dari satu waktu ke waktu yang lain dan sangat tergantung banyak faktor, baik yang berasal dari diri peserta didik, penilai maupun situasi yang terjadi pada saat penilaian berlangsung.

4. Ciri yang keempat dari penilaian pendidikan adalah bahwa dalam kegiatan pengukuran dalam rangka penilaian selalu terjadi adanya kesalahan dalam pengukuran (error). Adapun sumber kesalahan tersebut dapat berasal dari banyak faktor, yaitu :

a. Kesalahan yang bersumber pada alat ukurnya

Alat yang digunakan untuk mengukur haruslah baik. Sebagai misal, kita akan mengukur panjang meja tetapi menggunakan pita ukur yang terbuat dari bahan yang elastis, dan cara mengukurnya dengan ditarik-tarik. Tentu saja pita ukur semacam itu tidak dapat kita golongkan sebagai alat ukur yang baik karena gambaran mengenai panjang meja tidak dapat diketahui secara pasti.

b. Kesalahan yang bersumber pada penilai

1) Kesalahan yang disebabkan oleh karena faktor subyektif dari penilai. Sebagai misal, tulisan yang jelek dan tidak jelas, seringkali akan sangat mempengaruhi subyektivitas dari penilai dalam memberikan penilaian. Di samping itu, suasana hati dari si penilai juga akan sangat mempengaruhi penilaian seseorang terhadap suatu obyek.

2) Kecenderungan dari penilai untuk memberikan nilai yang cenderung ’murah’ (ceiling-effect) atau cenderung ’mahal’ (floor-effect). Kecenderungan semacam ini pada umumnya terkait erat dengan pengalaman pribadi si penilai pada saat yang bersangkutan mengikuti pendidikan yang akan terbawa serta pada saat yang bersangkutan menilai.

3) Adanya kesan tertentu dari penilai terhadap peserta didik yang dinilainya, baik yang berasal dari pengalaman pribadinya mengenai peserta didik tersebut maupun infomasi yang berasal dari orang lain mengenai peserta didik yang bersangkutan (hallo-effect).

4) Adanya pengaruh dari hasil atau prestasi yang telah diperoleh sebelumnya (carry-over-effect). Jika seorang peserta didik sering memperoleh prestasi yang baik pada waktu-waktu yang lalu,maka kesan ini akan terbawa serta dan berpengaruh pada penilaian-penilaian selanjutnya.

5) Kesalahan yang disebabkan oleh kekeliruan atau kesalahan yang terjadi pada saat menjumlah, membagi dan sebagainya pada saat pengolahan skor oleh penilai.

c. Kesalahan yang bersumber pada peserta didik yang dinilai:

1) Peserta didik adalah manusia biasa yang berperasaan dan memliki suasana hati. Suasana hati seseorang yang sedang mengikut tes, akan sangat berpengaruh pada hasil pengerjaan tes tersebut, dan selanjutnya hal ini akan sangat berpengaruh terhadap hasil penilaian. Sebagai misal, suasana hati yang sedang kalut, risau atau tertekan akan cenderung memberikan hasil pekerjaan yang kurang memuaskan, sedangkan suasana hati yang bahagia, ceria, akan cenderung memberikan hasil pekerjaan yang lebih baik.

2) Keadaan fisik dari peserta didik ketika mengikuti tes. Kondisi fisik yang kurang sehat, tentu saja akan sangat berpengaruh pada hasil pekerjaannya, hal ini sangat berpengaruh pula pada nilai yang diperolehnya.

3) Tidak dapat dipungkiri bahwa faktor nasib ternyata juga dapat berpengaruh terhadap seseorang peserta didik dalam mengerjakan tes yang sedang diikutinya, hal ini juga akan turut mempengaruhi hasil yang akan diperolehnya.

d. Kesalahan akibat pengaruh suasana atau situasi di mana penilaian berlangsung.

1) Suasana yang gaduh, baik di dalam maupun di luar ruangan, akan sangat mengganggu konsentrasi peserta tes dalam mengikut tes, sehingga akan berpengaruh terhadap hasil pekerjaannya. Selanjutnya, hal ini tentu saja juga akan berpengaruh pada hasil atau nilai yang diperolehnya.

2) Pengawasan dalam ujian; tidak dipungkiri bahwa pengawasan yang dilakukan pada waktu ujian berlangsung juga akan berpengaruh terhadap peserta didik dalam mengikuti ujian tersebut.

E. Prinsip-prinsip penilaian

Penilaian hasil belajar peserta didik yang baik sejauh mungkin didasarkan pada prinsip-prinsip penilaian berikut.

1. Mendidik, yakni mampu memberikan sumbangan positif terhadap peningkatan pencapaian belajar peserta didik. Hasil penilaian harus dapat memberikan umpan balik dan memotivasi peserta didik untuk lebih giat belajar.

2. Terbuka/transparan, yakni prosedur penilaian, kriteria penilaian, dan dasar pengambilan keputusan diketahui oleh pihak yang terkait.

3. Menyeluruh, yakni meliputi berbagai aspek kompetensi yang akan dinilai. Penilaian yang menyeluruh meliputi ranah pengetahuan (kognitif), keterampilan (psikomotor), sikap dan nilai (afektif) yang direfleksikan dalam kebiasaan berfikir dan bertindak.

4. Terpadu dengan pembelajaran, yakni menilai apapun yang dikerjakan peserta didik dalam kegiatan belajar mengajar itu dinilai, baik kognitif, psikomotorik dan afektifnya. Dengan demikian, penilaian tidak hanya dilakukan setelah peserta didik menyelesaikan pokok bahasan tertentu melainkan saat mereka sedang melakukan proses pembelajaran.

5. Objektif, yakni tidak terpengaruh oleh pertimbangan subjektif penilai.

6. Sistematis, yakni penilaian dilakukan secara berencana dan bertahap untuk memperoleh gambaran tentang perkembangan belajar peserta didik sebagai hasil kegiatan belajarnya.

7. Berkesinambungan, yakni dilakukan secara terus menerus sepanjang berlangsungnya kegiatan pembelajaran.

8. Adil, yakni tidak ada peserta didik yang diuntungkan atau dirugikan berdasarkan latar belakang sosial-ekonomi, budaya, agama, bahasa, suku bangsa, warna kulit, dan jender.

9. Menggunakan acuan kriteria, yakni menggunakan kriteria tertentu dalam menentukan kelulusan peserta didik.

F. Klasifikasi Hasil Belajar

Menurut Bloom, hasil belajar peserta didik dapat dikelompokkan ke dalam 3 (tiga) aspek/ranah, yaitu:

1. Hasil belajar yang berkaitan dengan perkembangan kognitif.

2. Hasil belajar yang berkaitan dengan perkembangan afektif,

3. Hasil belajar yang berkaitan dengan perkembangan keterampilan

(psikomotorik).

Ketiga aspek di atas dapat juga dikelompokkan dengan istilah 3H, yaitu: Head (ranah kognitif), Hand (ranah keterampilan motorik), dan Heart (ranah afektif).

Sementara itu, menurut Bloom hasil belajar pada aspek kognitif (pengetahuan), dapat diklasifikasikan ke dalam 6 tingkatan sesuai degan kompleksitas/tingkatan berpikir, yaitu:

Pengetahuan (knowledge), yaitu kemampuan dalam mengingat kembali: istilah, fakta-fakta, metode, prosedur, proses, prinsip-prinsip, pola, struktur atau susunan.
Pemahaman (comprehension), yaitu kemampuan seseorang dalam: menafsirkan suatu informasi, menentukan implikasi-implikasi, akibat-akibat maupun pengaruh-pengaruh.
Aplikasi (application), merupakan kemampuan menerapkan: hukum, aturan, metoda, prosedur, prinsip, teori yang bersifat umum dalam situasi yang khusus, atau untuk pemecahan masalah tertentu.
Analisis (analysis), merupakan kemampuan menguraikan suatu informasi yang menyeluruh ke dalam bagian-bagian, komponen, unsur-unsur yang lebih kecil, sehingga jelas: urutan ide-idenya, hubungan dan interaksi diantara bagian-bagian atau unsur-unsur tersebut.
Sintesis (syntesis), merupakan kemampuan menyusun/mengkombinasikan bagian-bagian, unsur-unsur, menjadi struktur atau pola yang baru yang koheren, yang sebelumnya tidak ada.
Evaluasi (evaluation), merupakan kemampuan untuk menilai ketepatan: teori, prinsip, metoda, prosedur untuk menyelesaikan masalah tertentu. Adapun kriteria yang digunakan biasanya kualitas, efektivitas, efisiensi dan konsistensi.

G. JENIS PENILAIAN HASIL BELAJAR

Untuk memperoleh data hasil penilaian yang otentik (mampu menggambarkan kompetensi yang sebenarnya), pendidik dianjurkan untuk menerapkan berbagai teknik penilaian secara komplementer (saling melengkapi) sesuai dengan kompetensi yang akan dinilai. Kombinasi penggunaan berbagai teknik penilaian akan memberikan informasi yang lebih akurat tentang kemajuan belajar peserta didik.

Secara garis besar alat penilaian (evaluasi) yang digunakan dalam bidang pendidikan/pelatihan dapat digolongkan menjadi dua macam, yaitu : (1) Tes; dan (2) Bukan Tes (Non-Tes).

1. Teknik Non-Tes

Alat penilaian yang tergolong teknik non-tes adalah :

a) Skala bertingkat (rating scale)

b) Kuesioner/angket (questionaire)

c) Wawancara (interview)

d) Daftar Cocok (check-list)

e) pengamatan atau observasi

f) Riwayat Hidup

g) Portofolio

h) Jurnal

i) Inventori

j) Penilaian diri (self evaluation)

k) Penilaian oleh teman (peer review).

2. Teknik Tes

Tes adalah sejumlah pertanyaan yang memiliki jawaban benar atau salah, sejumlah pertanyaan yang harus dijawab, atau pernyataan-pernyataan yang harus dipilih, ditanggapi, atau tugas-tugas yang harus dilakukan oleh orang yang diuji untuk waktu tertentu, dengan tujuan untuk mengukur suatu aspek tertentu dari orang yang diuji tersebut.

Menurut bentuk pelaksanaannya, secara garis besar dikenal tiga bentuk tes, yaitu: (1) tes lisan; (2) tes bentuk perbuatan; dan (3) tes tertulis.

1. Ujian Lisan

Tes ini pada umumnya berbentuk tanya jawab face to face. Penilai memberikan pertanyaan (interview) langsung kepada testi (peserta didik). Ujian lisan pada umumnya digunakan untuk mengevaluasi hasil belajar dalam bentuk kemampuan dalam mengemukakan ide-ide dan pendapat-pendapat secara lisan. Bagi bidang studi yang menuntut keterampilan-keterampilan untuk berbicara atau berhubungan dengan orang lain, maka ujian lisan ini dirasa mempunyai kedudukan yang cukup penting.Namun, karena alasan teknis (kepraktisan), ujian lisan ini pada umumnya jarang digunakan untuk melakukan penilaian kompetensi dalam pembelajaran yang rutin.

a. Keunggulan Tes Lisan :

1) Dapat digunakan untuk melakukan penilaian hasil belajar yang mendalam.

2) Dapat digunakan untuk mengevaluasi kemampuan berpikir bertaraf tinggi.

3) Dapat digunakan untuk menguji pemahaman seseorang terkait dengan hasil karyanya.

4) Tidak memungkinkan penyontekkan dan bahannya cukup luas.

b. Kelemahan Tes Lisan :

1) Jika pertanyaannya tidak dipersiapkan dengan baik, maka penguji hanya akan bertanya hal-hal yang diingatnya saja.

2) Sangat mungkin terjadinya ketidak-adilan antara peserta tes, baik yang berkaitan dengan: lama waktu ujian, tingkat kesukaran soal maupun tolok ukur dalam memberikan penilaian.

3) Penilaiannya bersifat sangat subyektif.

4) Banyak memakan waktu dalam pelaksanaannya; dan

5) Memungkinkan peserta tes untuk bersikap ABS, atau mengiyakan semua komentar penguji dengan maksud supaya diluluskan.

2. Ujian Perbuatan

Tes bentuk perbuatan ini pada umumnya dilakukan dengan cara menyuruh peserta didik (peserta tes) untuk melakukan sesuatu pekerjaan yang bersifat fisik (praktik). Tes bentuk perbuatan ini sangat cocok untuk melakukan penilaian dalam pelajaran praktik/keterampilan atau praktikum di laboratorium. Alat yang digunakan untuk melakukan penilaian pada umumnya berupa lembar pengamat-an (lembar observasi). Tes bentuk perbuatan ini pada umumnya dapat digunakan untuk menilai proses maupun hasil (produk) dari suatu pekerjaan.

a. Keunggulan Tes Perbuatan

1) Tes perbuatan dapat digunakan untuk melakukan penilaian sejumlah perilaku atau penampilan yang kompleks dalam situasi riil.

2) Tes perbuatan dapat digunakan untuk melakukan penilaian penampilan yang tidak dapat dievaluasi dengan alat-alat evaluasi lainnya.

3) Ujian perbuatan dapat digunakan untuk melihat kesesuaian antara pengetahuan yang bersifat teoritis dan keterampilan di dalam praktik.

4) Di dalam ujian perbuatan tidak ada peluang untuk saling menyontek.

b. Kelemahan Tes Perbuatan

1) Ujian perbuatan memerlukan waktu yang lebih banyak, karena penilaiannya hanya dapat dilakukan seorang demi seorang (terutama pada penilaian proses).

2) Ujian perbuatan pada umumnya memerlukan peralatan, mesin-mesin atau bahan-bahan khusus, sehingga menjadi lebih mahal daripada ujian tertulis.

3) Penilaian dalam ujian perbuatan pada umumnya lebih subyektif, karena akan selalu melibatkan keputusan penilai.

4) Seringkali sangat membosankan, karena umumnya bersifat monoton.

3. Ujian Tertulis

Ujian tertulis ini biasanya dilakukan secara berkelompok dengan mengambil tempat di suatu ruangan tertentu. Dalam ujian tertulis dikenal dua bentuk tes, yaitu tes essai (uraian) dan tes obyektif.

a. Soal Tes Bentuk Uraian (Essai)

Pertanyaan yang diajukan dalam soal tes bentuk essai (uraian) hendaknya benar-benar merupakan soal-soal yang memerlukan waktu dalam pemikiran jawabannya. Tes ini umumnya memerlukan jawaban yang berbentuk bahasan. Ciri-cirinya selalu diawali dengan kata-kata ”Bagaimana, Mengapa, Berikan alasan, Uraikan, Jelaskan, Bandingkan, Simpulkan, Tunjukkan, Bedakan” dan sebagainya. Soal tes bentuk essai ini mempunyai dua bentuk, yaitu essai terbatas dan essai bebas.

Soal tes bentuk essai jika disusun dengan baik akan memiliki beberapa keunggulan yang tidak ditemui pada tes obyektif. Keunggulan-keunggulan tes bentuk essai tersebut antara lain :

1) Jawaban harus disusun sendiri oleh testi (melatih dalam pemilihan kata-kata dan menyusun kalimat)

2) Tidak ada kemungkinan menebak;

3) Dapat mengukur kemampuan yang kompleks;

4) Dapat digunakan untuk mengembangkan penalaran testi;

5) Proses penyusunan soalnya relatif mudah; dan

6) Proses berpikir testi dapat dilacak dari jawabannya.

Namun demikian, tes bentuk essai juga mempunyai beberapa kelemahan, antara lain:

1) Jumlah soal sangat terbatas, sehingga cakupan materi (validitas isi) lemah;

2) Tingkat kebenaran jawaban dan penilaiannya subyektif;

3) Jawaban testi kadang tidak relevan dengan pertanyaan;

4) Pemeriksaannya sulit, hanya dapat dilakukan oleh penyusunnya;

5) Skor umumnya kurang reliabel;

6) Kualitas jawaban tergantung pada kemampuan testi dalam memilih kata-kata dan menyusun kalimat; dan

7) Banyak dijumpai soal-soal tes uraian yang hanya mengungkap pengetahuan yang dangkal.

b. Soal Tes Obyektif

Soal tes obyektif pada umumnya tepat digunakan untuk mengevaluasi hasil belajar yang berupa kemampuan-kemampuan dalam: mengenal kembali fakta-fakta, memahami hubungan antara dua hal atau lebih, dan kemampuan dalam mengaplikasikan prinsip-prinsip. Pada saat ini, penggunaan tes bentuk obyektif (terutama bentuk pilihan ganda) sudah sangat berkembang, sehingga juga dapat dikembangkan untuk mengukur kemampuan-kemampuan dalam menganalisis, mensintesis dan mengevaluasi.

Namun, soal tes obyektif juga banyak dikritik karena dianggap tidak mampu mengembangkan daya nalar siswa. Beberapa kelemahan tes obyektif antara lain:

1) Tidak melatih testi untuk mengemukakan ide-idenya secara tertulis;

2) Kemungkinan menebak besar sekali, dan sulit dilacak;

3) Memungkinkan untuk saling menyontek;

4) Sulit untuk membuat soal yang baik, dan sering hanya mengukur kemampuan yang dangkal; dan

5) Banyak waktu yang tersita untuk membaca soal dan jawabannya.

6) Beberapa kemampuan tertentu, seperti: kemampuan dalam mengemuka-kan pendapat, ide-ide dan sebagainya tak mungkin diukur dengan tes bentuk obyektif.

Namun demikian, soal tes obyektif juga memiliki beberapa keunggulan yang tidak ditemukan pada soal-soal tes bentuk essai. Keunggulan-keunggulan tersebut adalah :

1) Jumlah soal banyak, sehingga dapat mencakup semua isi mata pelajaran (representatif à validitas isi baik);

2) Penilaiannya mudah dan obyektif;

3) Tugas yang harus dilakukan tesi jelas, sehingga tidak ada kemungkinan bagi testi untuk mengemukakan hal-hal yang tidak relevan dengan pertanyaan;

4) Hasil tes dapat diinformasikan lebih cepat;

5) Reliabilitas skor tinggi; dan

6) Memungkinkan penyelenggaraan tes bersama pada wilayah yang luas (SPMB, UNAS, UAS, UUB dsb).

c. Bagaimana Menetapkan Bentuk Tes yang Sesuai?

Tes obyektif mempunyai tujuan yang berbeda dengan tes essai. Oleh karena itu, di antara kedua tes tersebut tidak dapat dibandingkan karena mengemban misi yang berbeda. Kedua tes tersebut selain masing-masing memiliki kelebihan juga memiliki kelemahan.

Dalam hal ini, untuk menetapkan sesuai tidaknya bentuk tes yang digunakan dalam pengukuran (penilaian) akan sangat tergantung pada beberapa pertimbangan antara lain:

a. Indikator/kompetensi dasar yang akan diukur.

b. Jumlah peserta tes, bila jumlah peserta tes sangat besar (seperti Unas atau UMPTN), yang mencapai ratusan ribu orang, maka pilihan untuk menggunakan bentuk tes obyektif adalah lebih tepat.

c. Ruang lingkup materi yang akan diujikan. Untuk tes yang mencakup ruang lingkup materi yang luas, maka pemakaian tes obyektif dipandang lebih sesuai daripada tes essai.

d. Sementara itu, jika jumlah peserta tes tidak terlalu banyak (seperti tes bagi peserta didik pada kelas tertentu), atau tes dengan ruang lingkup materi yang terbatas (misalnya tes formatif), maka guru dapat menggunakan tes bentuk uraian atau essai.

Sementara itu, menurut tahap pelaksanaannya, penilaian dapat dibagi menjadi dua, yaitu:

a. Penilaian formatif; dilakukan dengan maksud memantau sejauhmanakah suatu proses pendidikan telah berjalan sebagaimana yang direncanakan.

b. Penilaian sumatif; dilakukan untuk mengetahui sejauhmanakah peserta didik telah dapat berpindah dari suatu unit pembelajaran ke unit berikutnya.

H. PERSYARATAN TES

Sebuah tes dapat dikatakan baik sebagai alat pengukur, jika memiliki beberapa persyaratan sebagai berikut: (1) validitas; (2) reliabilitas; (3) obyekti-vitas; (4) praktikabilitas; dan (5) ekonomis.

1. Validitas

Suatu tes dikatakan valid (sahih) apabila tes tersebut dapat mengukur apa yang seharusnya diukurnya.

Contoh: untuk mengukur tingkat partisipasi peserta didik dalam proses pembelajaran, maka bukan diukur berdasarkan nilai atau prestasi yang diperoleh pada saat mengikuti ujian, akan tetapi akan lebih tepat jika diukur berdasarkan :

a. Tingkat kehadirannya

b. Terpusatnya perhatian pada pelajaran

c. Selalu menjawab pertanyaan yang diajukan oleh guru.

2. Reliabilitas

Reliabel berarti dapat dipercaya. Maka tes dikatakan memiliki reliabilitas, apabila tes tersebut mempunyai sifat dapat dipercaya. Seseorang dikatakan dapat dipercaya apabila orang tersebut selalu bicara ajeg (konsisten), tidak plin-plan atau berubah-ubah pembicaraannya dari waktu ke waktu. Demikian pula halnya, sebuah tes dikatakan dapat dipercaya (reliabel) jika dapat memberikan hasil yang tetap (konsisten) apabila diteskan berulang-ulang.

3. Obyektivitas

Dalam pengertian sehari-hari, obyektif berarti tidak adanya unsur-unsur pribadi (subyektivitas) yang mempengaruhi. Suatu tes dikatakan memiliki obyektivitas apabila dalam penggunaannya tidak da faktor subyektif dari pemakainya yang dapat mempengaruhinya, terutama dalam skoringnya.

Apabila dikaitkan dengan reliabilitas, maka obyektivitas menetapkan keajegan (konsistensi) pada sistem pemberian skor (skoringnya), sedangkan reliabilitas menekankan keajegan pada hasil tes yang diperoleh oleh setiap peserta tes.

Dalam hal ini, terdapat dua faktor yang mempengaruhi obyektivitas suatu tes, yaitu :

a. Bentuk tes

Tes yang berbentuk uraian (essai), akan memberikan banyak kemungkinan kepada si penilai untuk memberikan banyak penilaian (skoring) menurut caranya sendiri. Dengan demikian, maka hasil yang diperoleh seorang peserta tes, akan dapat berbeda apabila dinilai oleh penilai lainnya. Hal ini menunjukkan bahwa dengan menggunakan tes bentuk uraian (bentuk subyektif), akan memungkinkan masuknya unsur subyektivitas dari si penilai dalam melakukan skoring.

b. Penilai

Dengan menggunakan tes bentuk uraian, faktor subyektivitas dari seorang penilai akan dapat masuk secara lebih leluasa dan mempengaruhi dalam pemberian skor (skoring). Faktor-faktor yang dapat mempengaruhi dalam subyektivitas penilaian tersebut antara lain : kesan penilai terhadap peserta tes (hallo-effect), tulisan, bahasa, waktu pelaksanaan penilaian dan sebagainya.

4. Praktikabilitas

Suatu tes dikatakan memiliki praktikabilitas yang tinggi, apabila tes tersebut bersifat praktis atau mudah digunakan dan mudah pula dalam pengadministrasiannya. Adapun tes yang praktis adalah tes yang memiliki ciri-ciri sebagai berikut :

a. Mudah digunakan, misalnya tidak menuntut peralatan yang kompleks, mudah pengawasannya, dan memberikan kemudahan kepada peserta tes untuk mengerjakan terlebih dahulu bagian-bagian yang dianggapnya mudah.

b. Mudah pemeriksaannya, artinya bahwa tes tersebut dilengkapi dengan kunci jawaban maupun pedoman pemberian skor (skoringnya). Sebagai contoh : tes bentuk obyektif, pemeriksaannya akan lebih mudah dilakukan jika dikerjakan dalam lembar jawaban tersendiri. Untuk saat ini, pemeriksaaan tes bentuk obyektif sudah dapat dilakukan dengan bantuan komputer, sehingga dapat dilakukan dalam waktu yang lebih cepat dan akurat.

c. Tes tersebut dilengkapi dengan petunjuk-petunjuk yang jelas, sehingga dapat diujikan oleh orang lain.

5. Ekonomis

Yang dimaksud dengan ekonomis adalah bahwa dalam pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, peralatan yang kompleks dan mahal, tenaga dan waktu yang banyak.

I. Acuan Penilaian

Dilihat dari penafsiran hasil tes, pengukuran dalam bidang pendidikan dapat berdasarkan acuan norma/relatif atau acuan kriteria/patokan. Kedua acuan tersebut menggunakan asumsi yang berbeda tentang kemampuan seseorang. Penafsiran hasil tes antara kedua acuan itu juga berbeda, sehingga menghasilkan informasi yang berbeda maknanya. Pemilihan acuan ditentukan oleh karakteristik mata pelajaran yang akan diukur dan tujuan yang akan dicapai.

Penilaian acuan norma berasumsi bahwa kemampuan orang berbeda dan dapat digambarkan menurut distribusi normal. Perbedaan itu harus ditunjukkan oleh hasil pengukuran, misalnya setelah mengikuti pembelajaran selama satu semester, peserta didik dites. Hasil tes seorang peserta didik dibandingkan dengan kelompoknya, sehingga dapat diketahui posisi peserta didik tersebut di kelas itu.

Penilaian acuan kriteria berasumsi bahwa hampir semua orang dapat belajar apa saja, meskipun dengan waktu yang berbeda. Dalam acuan kriteria, penafsiran skor hasil tes selalu dibandingkan dengan kriteria yang telah ditetapkan. Bagi peserta didik yang telah mencapai kriteria yang telah ditetapkan (standar) diberi pelajaran tambahan yang biasa disebut pengayaan, sedangkan bagi peserta didik yang belum mencapai standar diberi remidi.

Ketuntasan belajar setiap indikator yang telah ditetapkan dalam suatu kompetensi dasar atau kriteria ketuntasan minimal (KKM). Satuan pendidikan harus menentukan kriteria ketuntasan minimal dengan mempertimbangkan tingkat kemampuan rata-rata peserta didik dan pendukung penyelenggaraan pembelajaran.

J. Penilaian Pembelajaran Jarak Jauh

Pembelajaran jarak jauh (distance learning) terutama dilakukan ketika model pembelajaran konvensional tidak atau sulit dilaksanakan karena terkendala oleh beberapa sebab.

Secara teoretis, pembelajaran konvensional melalui tatap muka secara langsung tentulah akan lebih efektif untuk mengubah tingkah laku peserta didik karena guru-siswa dapat berinteraksi secara langsung untuk memberikan asah, asih dan asuh. Namun demikian, mengingat berbagai kendala di atas maka pembelajaran jarak jauh terpaksa harus ditempuh.

Model pembelajaran jarak jauh yang telah lama diterapkan adalah model belajar mandiri, yang dilaksanakan dengan bantuan modul atau belajar sistem modul. Di Indonesia, model belajar mandiri ini telah lama diterapkan oleh Universitas Terbuka. Untuk mengefektifkan belajar peserta didik, secara periodik dilakukan kegiatan tutorial yang dibimbing oleh seorang tutor, yang biasanya dilaksanakan pada pusat-pusat kegiatan belajar.

Model evaluasi pembelajaran yang diterapkan umumnya berupa system evaluasi mandiri, yang berbentuk soal-soal evaluasi atau penugasan yang terdapat pada modul pembelajaran. Evaluasi yang dilakukan adalah secara tertulis, yang bentuk soal-soalnya tidak berbeda dengan soal-soal tes tertuis pada umumnya. Perbedaannya terletak pada kemandirian peserta didik untuk mengevaluasi penguasaan materi yang telah dipelajarinya secara mandiri secara jujur. Sedangkan evaluasi akhir yang akan menentukan kompetensi peserta didik dalam menguasai materi (modul) yang telah dipelajari biasanya dilakukan oleh penyelenggara pendidikan dalam bentuk ujian secara terjadual.

Dengan demikian, soal-soal evaluasi (baik soal maupun tugas-tugas) pada system pembelajaran jarak jauh secara mandiri adalah tidak berbeda dengan soal-soal evaluasi pembelajaran yang konvensional, yang umumnya hanya mengungkap kompetensi dalam ranah kognitif (pengetahuan).

Sementara itu, model pembelajaran jarak jauh yang saat ini banyak diterapkan, meskipun masih terbatas pada suplemen, adalah pembelajaran jarak jauh yang berbasis teknologi informasi dan komunikasi, yang disebut e-learning. E-learning adalah model pembelajaran jarak jauh yang berbasis ICT, yang bersifat interaktif antara pendidik dan peserta didik yang dilakukan melalui dunia maya (komputer jaringan).

Model evaluasi pembelajaran yang dilakukan pada dasarnya tidak berbeda dengan sistem evaluasi pembelajaran konvensional. Dalam hal ini, soal-soal atau tugas disusun tidak berbeda dengan evaluasi pembelajaran paper and pencil test yang konvensional, tetapi dilakukan melalui dunia maya.

Beberapa kendala yang sering dialami dalam penerapan model pembelajaran jarak jauh dan evaluasi pembelajarannya, adalah berkaitan dengan permasalahan berikut: (1) kelancaran jaringan untuk berkomunikasi, baik dalam mengunduh materi, soal-soal tugas, maupun dalam mengunggah jawaban soal, atau untuk berinteraksi dengan pendidik, (2) faktor kejujuran, karena pengerjaan soal atau tugas-tugas tidak dapat diawasi sehingga sering menyebabkan munculnya ketidak-jujuran, (3) ketersediaan perangkat komputer jaringan yang memadai, sehingga interaksi/komunikasi dapat berjalan lancar.

Artikel Terkait

Arsip Blog

Evaluasi Pembelajaran

F. Klasifikasi Hasil Belajar

G. JENIS PENILAIAN HASIL BELAJAR

H. PERSYARATAN TES

I. Acuan Penilaian

2 komentar :

Posting Komentar

Kategori Artikel

Artikel Lainnya

Artikel Terpopuler