KONSEP
DASAR EVALUASI HASIL BELAJAR
A.
Pengertian Pengukuran, Penilaian dan Evaluasi
Wiersma
dan Jurs membedakan antara evaluasi, pengukuran dan testing. Mereka berpendapat
bahwa evaluasi adalah suatu proses yang mencakup pengukuran dan mungkin juga testing,
yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan
dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan
mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa
evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Ralph
W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi sedikit
berbeda. Ia menyatakan bahwa evaluation as the process of determining to what
extent the educational objectives are actually being realized. Sementara Daniel
Stufflebeam (1971) yang dikutip oleh Nana Syaodih S., menyatakan bahwa
evaluation is the process of delinating, obtaining and providing useful
information for judging decision alternatif. Demikian juga dengan Michael
Scriven (1969) menyatakan evaluation is an observed value compared to some
standard. Beberapa definisi terakhir ini menyoroti evaluasi sebagai sarana
untuk mendapatkan informasi yang diperoleh dari proses pengumpulan dan
pengolahan data.
Sementara
itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian
angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh
orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas,
sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang
menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi
Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto
menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu
keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat
kualitatif. Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh
Norman E. Gronlund (1971) yang menyatakan “Measurement is limited to
quantitative descriptions of pupil behavior”
Pengertian
penilaian yang ditekankan pada penentuan nilai suatu obyek juga dikemukakan
oleh Nana Sudjana. Ia menyatakan bahwa penilaian adalah proses menentukan nilai
suatu obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik ,
Sedang, Jelek. Seperti juga halnya yang dikemukakan oleh Richard H. Lindeman
(1967) “The assignment of one or a set of numbers to each of a set of person or
objects according to certain established rules”
B.
Tujuan Evaluasi
Sebagaimana
diuraikan pada bagian terdahulu bahwa evaluasi dilaksanakan dengan berbagai
tujuan. Khusus terkait dengan pembelajaran, evaluasi dilaksanakan dengan
tujuan:
1.
Mendeskripsikan kemampuan belajar siswa.
2.
mengetahui tingkat keberhasilan PBM
3.
menentukan tindak lanjut hasil penilaian
4.
memberikan pertanggung jawaban (accountability)
C.
Fungsi Evaluasi
Sejalan
dengan tujuan evaluasi di atas, evaluasi yang dilakukan juga memiliki banyak
fungsi, diantaranya adalah fungsi:
1.
Selektif
2.
Diagnostik
3.
Penempatan
4.
Pengukur keberhasilan
Selain
keempat fungsi di atas Asmawi Zainul dan Noehi Nasution menyatakan masih ada
fungsi-fungsi lain dari evaluasi pembelajaran, yaitu fungsi:
1.
Remedial
2.
Umpan balik
3.
Memotivasi dan membimbing anak
4.
Perbaikan kurikulum dan program pendidikan
5.
Pengembangan ilmu
D.
Manfaat Evaluasi
Secara
umum manfaat yang dapat diambil dari kegiatan evaluasi dalam pembelajaran,
yaitu :
1.
Memahami sesuatu : mahasiswa (entry behavior, motivasi, dll), sarana dan
prasarana, dan kondisi dosen
2.
Membuat keputusan : kelanjutan program, penanganan “masalah”, dll
3.
Meningkatkan kualitas PBM : komponen-komponen PBM
Sementara
secara lebih khusus evaluasi akan memberi manfaat bagi pihak-pihak yang terkait
dengan pembelajaran, seperti siswa, guru, dan kepala sekolah.
Bagi Siswa
Bagi Siswa
Mengetahui
tingkat pencapaian tujuan pembelajaran : Memuaskan atau tidak memuaskan
Bagi
Guru
1.
mendeteksi siswa yang telah dan belum menguasai tujuan : melanjutkan, remedial
atau pengayaan
2.
ketepatan materi yang diberikan : jenis, lingkup, tingkat kesulitan, dll.
3.
ketepatan metode yang digunakan
Bagi
Sekolah
1.
hasil belajar cermin kualitas sekolah
2.
membuat program sekolah
3.
pemenuhan standar
E.
Macam-macam Evaluasi
1.
Formatif
Evaluasi
formatif adalah evaluasi yang dilakukan pada setiap akhir pembahasan suatu
pokok bahasan / topik, dan dimaksudkan untuk mengetahui sejauh manakah suatu
proses pembelajaran telah berjalan sebagaimana yang direncanakan. Winkel
menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah penggunaan
tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru
memperoleh informasi (feedback) mengenai kemajuan yang telah dicapai. Sementara
Tesmer menyatakan formative evaluation is a judgement of the strengths and
weakness of instruction in its developing stages, for purpose of revising the
instruction to improve its effectiveness and appeal. Evaluasi ini dimaksudkan
untuk mengontrol sampai seberapa jauh siswa telah menguasai materi yang
diajarkan pada pokok bahasan tersebut. Wiersma menyatakan formative testing is
done to monitor student progress over period of time. Ukuran keberhasilan atau
kemajuan siswa dalam evaluasi ini adalah penguasaan kemampuan yang telah
dirumuskan dalam rumusan tujuan (TIK) yang telah ditetapkan sebelumnya. TIK
yang akan dicapai pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan
mengacu pada tingkat kematangan siswa. Artinya TIK dirumuskan dengan
memperhatikan kemampuan awal anak dan tingkat kesulitan yang wajar yang
diperkiran masih sangat mungkin dijangkau/ dikuasai dengan kemampuan yang
dimiliki siswa. Dengan kata lain evaluasi formatif dilaksanakan untuk
mengetahui seberapa jauh tujuan yang telah ditetapkan telah tercapai. Dari
hasil evaluasi ini akan diperoleh gambaran siapa saja yang telah berhasil dan
siapa yang dianggap belum berhasil untuk selanjutnya diambil tindakan-tindakan
yang tepat. Tindak lanjut dari evaluasi ini adalah bagi para siswa yang belum
berhasil maka akan diberikan remedial, yaitu bantuan khusus yang diberikan
kepada siswa yang mengalami kesulitan memahami suatu pokok bahasan tertentu.
Sementara bagi siswa yang telah berhasil akan melanjutkan pada topik
berikutnya, bahkan bagi mereka yang memiliki kemampuan yang lebih akan
diberikan pengayaan, yaitu materi tambahan yang sifatnya perluasan dan
pendalaman dari topik yang telah dibahas.
2.
Sumatif
Evaluasi
sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang
didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk
mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke
unit berikutnya. Winkel mendefinisikan evaluasi sumatif sebagai penggunaan
tes-tes pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa
atau semua unit pelajaran yang diajarkan dalam satu semester, bahkan setelah
selesai pembahasan suatu bidang studi.
3.
Diagnostik
Evaluasi
diagnostik adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan
dan kelemahan-kelemahan yang ada pada siswa sehingga dapat diberikan perlakuan
yang tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa tahapan, baik
pada tahap awal, selama proses, maupun akhir pembelajaran. Pada tahap awal
dilakukan terhadap calon siswa sebagai input. Dalam hal ini evaluasi diagnostik
dilakukan untuk mengetahui kemampuan awal atau pengetahuan prasyarat yang harus
dikuasai oleh siswa. Pada tahap proses evaluasi ini diperlukan untuk mengetahui
bahan-bahan pelajaran mana yang masih belum dikuasai dengan baik, sehingga guru
dapat memberi bantuan secara dini agar siswa tidak tertinggal terlalu jauh.
Sementara pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat
penguasaan siswa atas seluruh materi yang telah dipelajarinya.
Perbandingan
Tes Diagnostik, Tes Formatif, dan Tes Sumatif
Ditinjau
dari
Tes
Diagnostik
Tes
Formatif
Tes
Sumatif
Fungsinya
*mengelompokkan
siswa berdasarkan kemampuannya
*menentukan
kesulitan belajar yang dialami
*Umpan
balik bagi siswa, guru maupun program untuk menilai pelaksanaan
suatu unit program
*Memberi
tanda telah mengikuti suatu program, dan menentukan posisi
kemampuan siswa dibandingkan dengan anggota kelompoknya
cara
memilih tujuan yang dievaluasi
*memilih
tiap-tiap keterampilan prasarat
*memilih
tujuan setiap program pembelajaran secara berimbang
*memilih
yang berhubungan dengan tingkah laku fisik, mental dan perasaan
Mengukur
semua tujuan instruksional khusus
Mengukur
tujuan instruksional umum
Skoring
(cara menyekor)
*menggunakan
standar mutlak dan relatif
*menggunakan
standar mutlak
*menggunakan
standar relatif
F.
Prinsip Evaluasi
Terdapat
beberapa prinsip yang harus diperhatikan dalam melaksanakan evaluasi, agar
mendapat informasi yang akurat, diantaranya:
1.
Dirancang secara jelas abilitas yang harus dinilai, materi penilaian,
alat penilaian, dan interpretasi hasil penilaian. à
patokan : Kurikulum/silabi.
2.
Penilaian hasil belajar menjadi bagian integral dalam proses belajar mengajar.
3.
Agar hasil penilaian obyektif, gunakan berbagai alat penilaian dan
sifatnya komprehensif.
4.
Hasilnya hendaknya diikuti tindak lanjut.
Prinsip
lain yang dikemukakan oleh Ngalim Purwanto adalah:
1.
Penilaian hendaknya didasarkan pada hasil pengukuran yang komprehensif.
2.
Harus dibedakan antara penskoran (scoring) dengan penilaian (grading)
3.
Hendaknya disadari betul tujuan penggunaan pendekatan penilaian (PAP
dan PAN)
4.
Penilaian hendaknya merupakan bagian integral dalam proses
belajar mengajar.
5.
Penilaian harus bersifat komparabel.
6.
Sistem penilaian yang digunakan hendaknya jelas bagi siswa dan guru.
G.
Pendekatan Evaluasi
Ada
dua jenis pendekatan penilaian yang dapat digunakan untuk menafsirkan sekor
menjadi nilai. Kedua pendekatan ini memiliki tujuan, proses, standar dan juga
akan menghasilkan nilai yang berbeda. Karena itulah pemilihan dengan tepat
pendekatan yang akan digunakan menjadi penting. Kedua pendekatan itu adalah
Pendekatan Acuan Norma (PAN) dan Pendekatan Acuan Patokan (PAP).
Sejalan
dengan uraian di atas, Glaser (1963) yang dikutip oleh W. James Popham
menyatakan bahwa terdapat dua strategi pengukuran yang mengarah pada dua
perbedaan tujuan substansial, yaitu pengukuran acuan norma (NRM) yang berusaha
menetapkan status relatif, dan pengukuran acuan kriteria (CRM) yang berusaha
menetapkan status absolut. Sejalan dengan pendapat Glaser, Wiersma menyatakan
norm-referenced interpretation is a relative interpretation based on an
individual’s position with respect to some group. Glaser menggunakan konsep
pengukuran acuan norma (Norm Reference Measurement / NRM) untuk menggambarkan
tes prestasi siswa dengan menekankan pada tingkat ketajaman suatu pemahaman
relatif siswa. Sedangkan untuk mengukur tes yang mengidentifikasi ketuntasan /
ketidaktuntasan absolut siswa atas perilaku spesifik, menggunakan konsep
pengukuran acuan kriteria (Criterion Reference Measurement).
1.
Penilaian Acuan Patokan (PAP), Criterion Reference Test (CRT)
Tujuan
penggunaan tes acuan patokan berfokus pada kelompok perilaku siswa yang khusus.
Joesmani menyebutnya dengan didasarkan pada kriteria atau standard khusus.
Dimaksudkan untuk mendapat gambaran yang jelas tentang performan peserta tes
dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan dengan
performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk
menyeleksi (secara pasti) status individual berkenaan dengan (mengenai) domain
perilaku yang ditetapkan / dirumuskan dengan baik.
Pada
pendekatan acuan patokan, standar performan yang digunakan adalah standar
absolut. Semiawan menyebutnya sebagai standar mutu yang mutlak.
Criterion-referenced interpretation is an absolut rather than relative
interpetation, referenced to a defined body of learner behaviors. Dalam standar
ini penentuan tingkatan (grade) didasarkan pada sekor-sekor yang telah
ditetapkan sebelumnya dalam bentuk persentase. Untuk mendapatkan nilai A atau
B, seorang siswa harus mendapatkan sekor tertentu sesuai dengan batas yang
telah ditetapkan tanpa terpengaruh oleh performan (sekor) yang diperoleh siswa
lain dalam kelasnya. Salah satu kelemahan dalam menggunakan standar absolut
adalah sekor siswa bergantung pada tingkat kesulitan tes yang mereka terima.
Artinya apabila tes yang diterima siswa mudah akan sangat mungkin para siswa
mendapatkan nilai A atau B, dan sebaliknya apabila tes tersebut terlalu sulit
untuk diselesaikan, maka kemungkinan untuk mendapat nilai A atau B menjadi
sangat kecil. Namun kelemahan ini dapat diatasi dengan memperhatikan secara
ketat tujuan yang akan diukur tingkat pencapaiannya.
Dalam
menginterpretasi skor mentah menjadi nilai dengan menggunakan pendekatan PAP,
maka terlebih dahulu ditentukan kriteria kelulusan dengan batas-batas nilai
kelulusan. Umumnya kriteria nilai yang digunakan dalam bentuk rentang skor
berikut:
Rentang
Skor Nilai
80%
s.d. 100% A
70%
s.d. 79% B
60%
s.d. 69% C
45%
s.d. 59% D
<
44% E / Tidak lulus
2.
Penilaian Acuan Norma (PAN), Norm Reference Test (NRT)
Tujuan
penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi
suatu bidang isi dan tugas belajar yang besar. Tes acuan norma dimaksudkan
untuk mengetahui status peserta tes dalam hubungannya dengan performans
kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria
Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan
patokan adalah pada standar performan yang digunakan.
Pada
pendekatan acuan norma standar performan yang digunakan bersifat relatif.
Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi
relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat
bergantung pada kondisi performan kelompoknya. Dengan kata lain standar
pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari standar
relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa memandang
kesulitan suatu tes secara teliti. Kekurangan dari penggunaan standar relatif
diantaranya adalah (1) dianggap tidak adil, karena bagi mereka yang berada di
kelas yang memiliki sekor yang tinggi, harus berusaha mendapatkan sekor yang
lebih tinggi untuk mendapatkan nilai A atau B. Situasi seperti ini menjadi baik
bagi motivasi beberapa siswa. (2) standar relatif membuat terjadinya persaingan
yang kurang sehat diantara para siswa, karena pada saat seorang atau sekelompok
siswa mendapat nilai A akan mengurangi kesempatan pada yang lain untuk
mendapatkannya.
H.
Bila jumlah pesertanya ratusan, maka untuk memberi nilainya menggunakan
statistik sederhana untuk menentukan besarnya skor rata-rata kelompok dan
simpangan baku kelompok (mean dan standard deviation) sehingga akan terjadi
penyebaran kemampuan menurut kurva normal.
Catatan:
mengacu pada kurikulum 1975
Tidak ada komentar:
Posting Komentar