Marsigit Fhilosofi Wiwin Mistiani

Senin, 13 Januari 2020

REVIEW PERKULIAHAN FILSAFAT PENELITIAN DAN EVALUASI PENDIDIKAN

TUGAS AKHIR MATA KULIAH

REVIEW PERKULIAHAN PENELITIAN DAN EVALUASI PENDIDIKAN

Dosen Pengampu Mata Kuliah :Prof. Dr. Marsigit, MA

Wiwin Mistiani

Perkuliahan Filsafat Penelitian dan Evaluasi Pendidikan Adalah salah satu mata kuliah wajid di perkuliahan S3 PEP. Mata Kuliah filsafat yang di bawakan oleh Prof. Dr.Marsigit MA Sangat Unik, Baik dari Segi Penyampaian maupun Isi materi yang disampaikan. Mungkin banyak diantara kita sampai hari ini masih berfikir bahwa belajar filsafat dapat menjadikan kita jauh dari agama. Namun ternyata setelah mengikuti perkuliahan filsafat yang beliau bawakan, saya mengatakan bahwa dengan belajar filsafat sangat membantu saya dan kita semua dalam memahami agama yang kita yakini. Dari beberapa hal yang di sampaikan oleh Prof. Dr. Marsigit. MA Saya Rangkum dalam Blog ini agar kita dapat belajar bersama.

Dimulai dari Perjalanan Filsafat.

Obyek Filsafat adalah yang ada dan mungkin ada. Yang ada dan mungkin ada itu sifatnya tetap Tokonya adalah Permenindes Yang berubah itu tokohnya Heraclitos. Yang tetap itu yang ada dalam pikiran yang disebut dengan idealisme dan tokohnya adalah Plato, rasionalism tokohnya adalah R Descartes. Sebaliknya yang berubah itu adalah di luar pikiran (realism)kita dan tokonya adalah Aritoteles. Empirism tokohnya David Home. Sementara Imanuel Kant menyatakan ada dan mungkin ad aitu bisa tetap dan bisa berubah (rasionalis Empiris). yang cenderung tetap itu adalah pikiran kita, karena itu pikiran itu cenderung konsisten, absolut, koheren, analitik, dan berlaku hukum Identitas; jika derajatnya dinaikkan lagi menuju spiritual, dan dinaikkan lagi nilai kebenarannya dan nilai Identitasnya adalah tunggal (monoisme atau kuasa Tuhan). Jika ditarik kebawah, dunia pengalaman cenderung Sintetik a posteriori, yaitu dunianya yang nyata, konkret, dan bersifat Kontradiksi. Menurut Immanuel Kant, langit itu konsisten (para dewa, kakak terhadap adik, dosen terhadap mahasiswa, dll, semua tidak punya kesalahan). Semakin tinggi semakin kecil kontradiksi, sebenar benar yang tidak ada kontradiksi atau absolute adalah Tuhan. Semakin turun semakin besar kontradiksi, maka sebenar benar kontradiksi ada dalam predikatnya. Sebenar benar ilmu adalah sintetik a priori menurut Immanuel Kant. Ilmu mu akan lengkap dan kokoh jika bersifat sintetik a priori. Contoh seni hanya untuk seni tidak untuk masyarakat maka itu hanyalah separuh dunia. Oleh karena itu timbullah Metode saintifik, mencoba itu Sintetik, dan menyimpulkan itu a priori.

Filsafat adalah kesadaran akan kedudukan dan implikasinya terhadap ruang & waktu dan Menggunakan Bahasa analog (Rumah kita semua ada di bahasa) dan Filsafat itu adalah dirimu sendiri. ketikan aku berdoa, maka aku adalah seorang spiritualis, tetapi, begitu ada orang yang berbuat aniaya, saya bersikap tegas, determinist, dan otoritarian. Maka demokratik, romantic, pragmatis itu tidak lain tidak bukan adalah dirimu sendiri, inilah yang disebut sebagai Mikrokosmis. Sedangkan makrokosmis adalah pikiran/pendapat para filsuf, ada sejarah dan tanggal lahirnya, dll. Oleh karena filsafat adalah dirimu sendiri maka sah-sah saja jika orang mengemukaan pendapatnya atau berfilsafat. Filsafat peduli dengan ruang dan waktu, dan tujuannya adalah memperoleh kebahagiaan melalui olah pikir. oleh karena itu bersifat kontekstual. Supaya hidup berbahagia itu harus berchemistry dengan kontekstual. Strukturnya jelas yaitu: material, formal, normatik, spiritual.

Objek filsafat adalah yang ada dan mungkin ada, semua yang engkau pikirkan apapun itu adalah sebuah wadah, wadah apapun yang ada dan meliputi yang mungkin ada, ternyata dia juga merupakan isi dan Isi itu itu juga wadah, kenapa seperti itu karena metafisik. Hidup manusia itu metafisik. Metafisik itu apa? Metafisik itu sifat di balik sifat, sifat mendahului sifat, sifat mengikuti sifat, sifat mempunya sifat.Jadi Setelah yang ada itu masih ada yang ada lagi terus begitu seterusnya. Maju tidak selesai mundur tidak selesai kenapa? karena manusia tidak sempurna. Kenapa manusia tidak sempurna agar manusia bisa hidup sebab jika manusia itu sempurna maka manusia tidak akan bisa hidup. misal kita diberi kesempurnaan mendengar, mendengar apapun yang ada dan yang mungkin ada langsung saja kita tidak bisa hidup, kita bisa mendengar siksa neraka misalnya. Itu barulah satu sifat saja, bayangkan manusia yang mempunyai bermilyar-milyar sifat. Maka itulah hebatnya Tuhan memberi ketidaksempurnaan kepada kita untuk hidup. Jadi kesempurnaan manusia itu sebenarnya tidak sempurna atau bisa dikatakan manusia itu sempurna didalam ketidak sempurnaan dan tidak sempurna di dalam kesempurnaan

Law Of The Three Stages Positivisme Menurut A. Compte (1798-1857) adalah Spiritualism (theological Stage), Philosophy (Methaphysical Stage dan Modern (Positive Stage)

Tahap Perkembangan dunia diawali dengan priode Archaic, Tribal , Traditional ,Feodal, Modern, Pos Modern dan Sekarng ini yang disebut dengan Power Now (Contemporary)

Awal kehidupan manusia itu fatal dan fital. Fatal itu terpilih , terpilih itu takdir. Saya akan memilih dua benda warna putih dan hitam saya mengambil yang warna putih. Yang telah terambil itu adalah takdir. Kenapa takdir karena sudah terjadi. Fital itu memilih, memilih itu ikhtiar. Hilang fitalnya tidak ada kehidupan hilang fitalnya tidak ada kehidupan. Urusan akhirat fatal, urusan dunia fital, ternyata susah untuk mendefinikan hidup, bahwa sebenar-benarnya hidup adalah interaksi dinamik antara fatal dan fital. Berikhtiarlah seakan-akan masih hidup seribu tahun lagi, berdoalah seakan-akan besok mau mati, itu sudah kodratnya berinteraksi seperti itu, sifat yang ada dan mungkin ada, kalau ada yang bersifat tunggal itu disebut monoisme disingkat monisme. Monisme itu urusan langit.

Semua yang engkau pikirkan apapun itu adalah sebuah wadah, wadah apapun yang ada dan meliputi yang mungkin ada, ternyata dia juga merupakan isi dan Isi itu itu juga wadah. Sebagaimana dikemukakan oleh Immanuel Kant, isi bisa sekaligus menjadi wadah, tapi isi tidak sama dengan wadahnya. Contohnya tadi rambutnya berwarna hitam, itu yang disebut sebagai kontradiksi dalam filsafat , hidup itu penuh dengan kontradiksi. Prinsip yang kedua adalah prinsip identitas, A sama dengan A itu hanya terjadi didalam pikiran, karna pikiran sudah terbebas dari ruang dan waktu, jadi selagi dia diucapkan maka A yang aku ucapkan pertama dan A yang aku ucapkan kedua, A yang kurus dan A yang gemuk, jadi dalam kehidupan tidak ada A sama dengan A, matematika yang kamu pelajari itu hanya ada sebatas didalam pikiran semata. Padahal Dunia Anak adalah dunia di luar pikiran. Oleh karena itu manusia selalu diwarnai dengan kontradiksi-kontradiksi, saya bisa makan, minum dan bernapas itu semua karna hasil kontradiksi antara oksigen dan darah merah. Dengan kontradiksi itulah maka kita bisa hidup, maka manusia tidak bisa terhindar dari kontradiksi, yang jadi persoalan sekarang adalah bagaimana cara kita mengidentifikasi kontradiksi seperti apa, mana yang produktif dan mana yang kontraproduktif. Selanjutnya, kedudukan kontradiksi itu ada dimana? Isi atau wadah bagian mana yang mengalami kontradiksi ? semakin rendah posisi semakin dia ada didalam predikat semakin tinggi dia mengalami kontradiksinya, semakin tinggi posisinya maka semakin kecil kontradiksinya, paling tinggi dirangkum kedalam kekuasaan Tuhan yang absolut dan tidak ada kontradiksi didalamnya. Tuhan tidak mengenal kontradiksi yang mengenal kontradiksi hanyalah manusia. Manusia siapa? Bagi adikmu kamu sama sekali tidak mempunyai kontradiksi sedangkan bagi dirimu adikmu itu penuh dengan kontradiksi, karna dia adalah keseluruhan penggambaran dari sifat-sifatmu, karna wadah memiliki banyak sifat dan adikmu itu adalah salah satu isinya. Semilyar kali kamu belum bisa menjawab kontradiksi dari adikmu itu. Orang jawa punya solusi, solusinya adalah “ngono yo ngono, neng ojo ngono”, yang artinya “begitu ya begitu, tetapi jangan begitu”, yang satu wadah dan yang satu isi. Minum ya minum (wadahnya) tetapi jangan sambil berdiri (isinya).

Membangun pengetahuan Secara Filsafat itu dapat dimulai dari yang ada dan yang mungkin ada. Yang ada dan yang mungkin ada mempunyai sifat meliputi yang ada dan yang mungkin ada pula, maksudnya adalah bahwa sifat-sifat yang ada dan yang mungkin ada itu jumlahnya banyak sekali; tidak cuma banyak tetapi berdimensi kirarkhis. Setiap yang ada mempunyai sifat, artinya jika ditinjau dari struktur Bahasa, maka yang ada itu berkedudukan sebagai Subjek atau Objek, sedang semua sifat-sifatnya berkedudukan sebagai Objek atau secara khusus disebut Predikat. Jadi di sini, Objek pun mempunyai Predikat, karena setiap Objek mempunyai sifat. Menurut Immanuel Kant, seorang filsuf bangsa Prusia (abad 15), secara pengetahuan atau ilmu pengetahuan atau secara pikir atau secara filsafat, maka di dunia ini hanya ada 2 (dua) prinsip yaitu prinsip Identitas dan prinsip Kontradiksi. Prinsip Identitas ialah keadaan tercapainya A=A, atau Aku = Aku, atau I = I …dst. Ternyata, dikarenakan Filsafat itu adalah sensitif terhadap Ruang dan Waktu, maka selama aku di Dunia, aku tidak pernah mengalami keadaan Identitas. Keadaan Identitas hanyalah terjadi di dalam pikiran kita, atau kalau kita mengandaikan atau kalau kita sudah sampai di akhirat. Di dunia ini memang benar aku tidak dapat mencapai Identitas, karena sebagai contoh belum selesai aku menunjuk diriku, maka dikarenakan ruang dan waktu, diriku yang tadi telah berubah menjadi diriku yang sekarang.

Sifat pengetahuan yang ada dalam pikiran adalah analitik, ukuran kebenarannya adalah konsisten, sedang sifat dari pengetahuan pengalaman adalah sintetik, dan bersifat kontradiksi. Dengan kontradiksi lah bisa ada produk baru. Yang diatas jika ditarik kebelakang adalah selaras dengn hal-hal yang ada dalam pikiran. Benda pikir itu tidak terhalang oleh ruang dan waktu. Itulah dunia pikiran, bersifat ideal, tetap, menuju kesempurnaan. Maka itu akan tersapu habis untuk semua tokoh filsafat yang berchemistry dengan pikiran mulai dari yang bersifat tetap (Permenides), rasionalisme (Descartes), Perfectionism, Formalisme, dll. Tapi itu adalah dunia transenden, semakin keatas semakin bersifat transenden atau beyond (dunianya para dewa). Engkau adalah transenden bagi adikmu, ketua adalah transenden bagi anggotanya, dan subjek juga transenden bagi para predikat-predikatnya. Maka transenden adalah sifatnya para dewa, dan pengalaman/kenyataan adalah dunianya para daksa. Tapi di dalam kehidupan sehari-hari, kita menjumpai, uniknya, hebatnya, dan bersyukurnya dunia pendidikan itu karena kita mengelola, berjumpa serta berinteraksi dengan anak kecil.Anak kecil adalah dunia bawah, dunia diluar pikiran, dunia konkret, dunia pengalaman. Ilmu bagi anak kecil bukanlah ilmu bagi orang dewasa. Tapi untuk anak kecil, pameran seni tidak hanya untuk dipandang tapi harus bisa dipegang/disentuh karena itu adalah dunia anak. Hakekat ilmu bagi anak adalah aktifitas/kegiatan. Mendidik bukanlah suatu ambisi agar semua murid kita bisa seperti kita. Fungsi guru adalah memfasilitasi anak didiknya. Ada= potensi mengada= ikhtiar pengada= produk. Dunia mengalami dilema (anomaly) karena kekuatan pikir itu adalah hebat, kekuatan pikir memproduksi resep/rumus untuk digunakan, jika dinaikkan bisa menjadi postulat-postulat kehidupan. The power of mind (Francis Bacon) bisa merekayasa pikiran bisa mengkonstruk konsep sebagai resep kehidupan. Dan hasilnya menakjubkan sehingga lahirlah peradaban. Jadi peradaban adalah produk dari the power of mind.

Ada 2 (dua) macam terjadinya konsep. Pertama, konsep terjadi tidak dengan permulaan/landasan; kedua, konsep terjadi dengan permulaan/landasan. Segala macam bentuk permulaan/landasan misalnya: janji, kesepakatan, konvensi, mou, hasil rapat, ketetapan Menteri. jikalau seseorang membangun konsep dengan menetapkan suatu awal atau suatu landasan atau suatu pondamen, maka sadar atau tidak sadar, dia telah menjadi pengikut filsafat Foundationalisme. Sebenar-benar manusia, hanyalah berusaha menetapkan awalnya atau landasannya atau pondamennya; sebena-benar awal atau awal absolut hanyalah milik Tuhan YME. Namun Ternyata kita memunyai ada banyak sekali pengertian-pengertian yang memunyai sifat tidak memunyai awal/landasan/pondamen. Kita yang menyadarinya hal tersebut kemudian mengakuinya maka sadar atau tidak sadar kita termasuk ke dalam orang-orang yang Anti-foundationalisme. Tokoh dari filsafat Anti-foundationalisme adalah Brouwer; selanjutnya disebut juga sebagai aliran Intuitionisme.

Jika objek pikir berada di dalam pikira kita, maka kita akan menemukan bahwa dia antara lain bersifat: absolut, bersifat tetap, statis, bersifat, tunggal, bersifat, formal, bersifat sempurna, bersifat ideal, bersifat abstrak, bersifat immanent, bersifat transenden, bersifat reduksionisme, bersifat analitik, bersifat a priori, bersifat rigor,bersifat apodiktik, bersifat konseptual, bersifat normatif, bersifat spekulatif, bersifat hypothetical, bersifat imeginer, bersifat rasional, bersifat logis-tak logis, bersifat aksiomatis, bersifat paralogis, bersifat teleologis, bersifat murni, bersifat analog, bersifat deduksi, bersifat dialektik, bersifat Identitas, tidak terikat oleh ruang, tidak terikat oleh waktu. Kita dapat menemukan bahwa objek yang berada di luar pikiran memunyai sifat-sifat: relatif, berubah atau tidak tetap, dinamis, plural atau jamak, berfifat tidak sempurna, bersifat tidak ideal, bersifat nyata, berkedudukan sebagai contoh, bersifat sintetik, bersifat a posteriori, bersifat dinamik, diperoleh dari penginderaan, bersifat kontradiksi, bersifat empiris, bersifat sensasi, berlaku hukum sebab-akibat, terikat oleh ruang, terikat oleh waktu, bersifat kontingen, bersifat konkrit.

Membangun pengetahuan adalah separuh pengalaman dan separuh logika. Maka berfilsafat adalah praktikkanlah pikiran anda dan pikirkanlah pengalaman anda. Dan ini dinamik setiap hari. Sebenar benar hidup adalah interaksi antara pikiran dan pengalaman. Karena ini olah pikir kita bisa praktik, praktiknya didalam laboratorium. Praktiknya filsafat, misalnya dengan bertanya dan memikirkan bagaimana/apakah kita bisa hidup dengan pengalaman saja, dan bagaimana kita hidup dengan pikiran saja. Contohnya dalam aplikasi halo dokter, dokter melayani keluhan pasienya Hanya dengan mendengarkan keluhan pasien, ia bisa mendiagnosa penyakitnya dengan analisis dari pengetahuan yang telah ia miliki sebelumnya. Dokter ini menggunakan metode Analitik Apriori yaitu bisa memikirkan walaupun tidak melihat secara langsung objeknya. Hanya dari pengetahuan yang sebelumnya sudah pernah ia dapatkan. Sebaliknya seorang bapak yang ingin mengetahui calon menantunya, , ia harus melihatnya dan berkenalan dengan dengan anak manantunya, maka bapak tersebut itu menggunakan metode Sintetik a posteriori (kehidupan pengalaman).

Segala sesuatu itu berpasang-pasangan dan selalu mencari jodohnya, setiap yang ada dan mungkin ada itu adalah tesis, dan selain yang ada satu itu merupakan anti tesisnya, diriku merupakan tesis, maka semua selain diriku merupakan anti tesisnya. Dalam agama semua ketetapan yang telah diatur merupakan tesis sedangkan anti tesisnya merupakan ikhtiar. Tesisnya takdir maka anti tesisnya fital, tesisnya fatal maka anti tesisnya potensi, sehingga motivator itu mengembangkan potensi supaya manusia itu punya potensi, dan sebenar-benarnya hidup adalah berkembang menjadi suatu potensi dari ada menjadi pengada melalui mengada. Maka segala sesuatu yang berubah diikhtiarkan semua keatas, disitulah duduk yang namanya keikhlasan.

Tetapkanlah hatimu sebagai komandanmu sebelum engkau mengembarakan pikiranmu. Karena jika engkau mengembarakn pikiranmu tanpa menetapkan hatimu/spiritualmu sebagai komandanmu, bisa jadi pikiranmu tidak akan bisa kembali. Itulah fenomena linear (lurus tak berujung), maka orang yang hanya mengandalkan pikiran saja, hidupnya linear seperti garis lurus, tidak mengerti hidupnya akan berhenti sampai dimana, dan tidak bisa kembali (merefleksikan hidup=bersyukur). Namun jika hidupnya dituntun oleh spiritualitas maka pada setiap titiknya akan terjadi hermenitika kehidupan: pertama, fenomena menajam (dengan saintifik), fenomena mendatar (membudayakan), dan fenomena mengembang (konstruksi-membangun hidup) Manfaat berfilsafat kita mampu menjelaskan posisi kita secara berstruktur dunia”.

Hidup merupakan suatu interaksi antara yang tetap dan yang berubah. Hidup itu tetap didalam perubahan, dan berubah didalam ketetapan. Didalam hidup manusia memiliki objek filsafat yang ada dan mungkin ada. Yang ada berada didalam dan diluar pikiran, yang bersifat tetap dan berubah, dan yang bersifat satu dan banyak. Yang tetap dan satu berada didalam pikiran, karena lebih sering terjadi didalam pikiran. Semua yang dipikirkan merupakan suatu wadah dan memiliki isi. Isi dapat menjadi wadah, tetapi isi selamanya tidak akan sama dengan wadahnya. Hidup manusia merupakan pilihan dan hidup manusia dipenuhi dengan kontradiksi, itulah mengapa manusia dikatakan tidak sempurna dan jika manusia sempurna maka ia tidak akan hidup didunia ini. Begitu pentingnya filsafat untuk memahami semua hal tentang kehidupan ini, semakin banyak engkau belajar berfilsafat maka semakin banyak engkau dapat mengetahui tentang arti kehidupan.

“Dunia itu berstruktur. Pagi-sore itu struktur dunia, laki-laki-perempuan adalah struktur dunia, logika-pengalaman itu struktur dunia. Kita harus bisa mengabstraksi (memilih) yang mana struktur yang dipakai untuk membangun perkuliahan ini. Perkuliahan ini menggunakan struktur pikiran para filsuf. Jadi dunia dan akhirat penuh dengan struktur (full of structure). Jadi, secara filsafat untuk menjawab sebuah pertanyaan, begitu ada pertanyaan di suatu tempat dengan kesadaran full of structure, maka pertanyaanmu itu terang benderang kedudukannya, dilihat dari berbagai macam kedudukan struktur. Misal, wadah itu ada dimana? Tergantung strukturnya, bisa siang bisa malam. Kelembutan, wadahnya perempuan, ketegasan itu wadahnya laki-laki, Wadah itu ada dimana-mana, yang engkau pikirkan, katakan, sebutkan itu adalah wadah sekaligus isi. Kenapa isi? Karena setiap yang engkau sebut itu mempunyai sifat dan engkau tidak dapat menyebut sesuatu dimana dia tidak mempunyai sifat. Maka sebenar benarnya dunia adalah penuh dengan sifat. Jadi, hidup adalah sifat itu sendiri, dari yang ada dan yang mungkin ada. Tujuan filsafat adalah menyadari struktur dunia.

TUGAS AKHIR PROPOSAL FILSAFAT PENELITIAN & EVALUASI PENDIDIKAN

TUGAS AKHIR MATA KULIAH

FILSAFAT PENELITIAN DAN EVALUASI PENDIDIKAN

Dosen Pengampu Mata Kuliah :Prof. Dr. Marsigit, MA

RANCANGAN PROPOSAL DISERTASI

1. Judul

PENGEMBAGAN ASSESSMENT PORTOFOLIO PADA MATA PELAJARAN PENDIDIKAN AGAMA ISLAM DI SMA

2. Latarbelakang Masalah

Undang-Undang No 20 tahun 2003 pasal 3 menyatakan bahwa pendidikan nasional berfungsi untuk mengembangkan kemampuan dan membentuk watak serta peradaban bangsa yang bermartabat dalam rangka mencerdaskan kehidupan bangsa, yang tujuanya untuk berkembangnya potensi peserta didik agar menjadi manusia yang beriman dan bertakwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri dan menjadi warga negara yang demokratis serta bertanggung jawab (Depdiknas, 2003:5).

Fungsi pendidikan nasional Indonesia tersebut sesungguhnya berpijak pada landasan ideologi Pancasila sebagai falsafah bangsa Indonesia, yang menempatkan sila Ketuhanan Yang Maha Esa sebagai sila pertama, yang menunjukkan bahwa sila ketuhanan ini harus melandasi dan menjiwai seluruh sila-sila lainnya. Ini berarti bahwa seluruh gerak kehidupan bangsa Indonesia dan seluruh aspek kegiatan dalam segala bidangnya harus dilandasi oleh nilai-nilai ketuhanan. Atas dasar itulah, sudah seharusnya nilai-nilai keagamaan itu senantiasa ditransfer dan diinternalisasikan pada setiap warga negara secara sungguh-sungguh melalui pendidikan, agar terwujud warga negara yang berwatak atau berkepribadian yang kaffah (utuh/paripurna), yakni beriman dan bertakwa kepada Tuhan Yang Maha Esa, berakhlak mulia, dan memiliki rasa tanggung jawab.

Proses internalisasi nilai-nilai keagamaan dapat dilakukan sekurang-kurangnya melalui implementasi mata pelajaran agama dan budi pekerti pada semua jenjang pendidikan.. Keberadaan Pendidikan Agama lslam di sekolah Umum pada semua jenjang mengalami proses perkembangan yang relatif panjang, mulai dari kedudukannya sebagai pelajaran pilihan (lokal), kemudian menjadi mata pelajaran pilihan (berlaku secara nasional), dan akhimya menjadi mata pelajaran wajib untuk semua jenjang pendidikan dan berlaku secara nasional. Penguatan institusi PAI di sekolah umum terus mengalami perkembangan dan mendapat momentumnya dengan ditetapkannya Undang-undang Nomor 2 tahun 1989 tentang Sistem Pendidikan Nasional, dan Undang-undang nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional. Kedudukan PAl di sekolah umum sebagai mata pelajaran merupakan bagian integral dari pendidikan nasional di samping berfungsi sebagai pengajaran agama Islam (transfer of knowledge), sosialisasi dan intemalisasi nilai nilai agama Islam juga rekonstruksi nilai-nilai baru. Tujuan akhir PAI adalah terbentuknya peserta didik yang berkepribadian muslim yang memiliki kemampuan, kognitif, afektif, dan psikomotor.

Karena itu, secara sosiologis PAI memiliki andil yang sangat besar bagi proses pembangunan karakter (character building). Bagi bangsa Indonesia yang mayoritas muslim, PAl merupakan benteng moralitas bangsa dan pembimbing hidup peserta didik serta meningkatkan mutu danmartabat hidupnya. Karena itu, jika PAl di sekolah umum merupakan bagian integral dari sistem pendidikan Nasional, berarti tidak kurang dari 75 % (35 juta) peserta didik di seluruh Indonesia secara terprogram dan teratur mempelajari agama Islam untuk diamalkan dalam kehidupan sehari-hari. Jika PAl di dilaksanakan secara efektif, maka tujuan pendidikan yang diamanatkan UU Sisdiknas, yaitu terbentuknya manusia yang beriman dan bertaqwa kepada Allah, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri, dan menjadi warga negara demokratis serta bertanggung jawab niscaya akan tercapai.

Namun pada kenyataanya Pembelajaran PAI secara umum belum dapat menghasilkan lulusan (outcome) seperti yang diharapkan. Hal itu mengindikasikan adanya kesenjangan antara harapan dengan kenyataan (tujuan dan hasil) atau dengan kata lain adanya kesenjangan antara gnosis dengan praxis. PAI selama ini telah menghasilkan lulusan yang secara kognitif relatif baik Namun Dalam kenyataannya terdapat indikasi bahwa hasil PAI dalam aspek kognitif tidak selalu paralel dengan pengamalan ajaran dan nilai nilai agama Islam. Kesenjangan itu menunjukkan bahwa PAI di Sekolah belum efektif mengintegrasikan pengetahuan keagamaan siswa dengan pengamalannya, bahkan berbagai fenomena dekadensi moral yang terjadi dalam kehidupan remaja dan pelajar akhir-akhir ini seringkali dijadikan sebagai barometer penilaian akan kekurangan pendidikan agama di sekolah.

Oleh karena itu, untuk dapat melihat tingkat pencapaian tujuan Pendidikan secara menyeluruh perlu dikembangkan alat ukur yang mampu memotret secara komprehensif kemampuan dan keterampilan peserta didik baik secara kognitif afektif maupun Psikomotorik .Di sinilah letak pentingnya peran asesmen pembelajaran karena dengan asesmen dapat menentukan umpan balik yang konstruktif bijaksana yang merupakan salah satu penentu dari proses pembelajaran yang efektif (Subramanian & et.al., 2012). Perbaikan kualitas pendidikan dapat dilakukan melalui peningkatan kualitas proses pembelajaran dan kualitas sistem asesmennya (Mardapi, 2012: 4). Asesmen merupakan komponen yang penting dalam pembelajaran (Russell & Airasian, 2012: 2), karena asesmen memiliki pengaruh yang kuat dalam meningkatkan proses pembelajaran (Raymond, et al., 2012; Bers, 2008), bahkan penggunaan prosedur asesmen yang benar dapat memberikan kontribusi langsung kepada peningkatan belajar peserta didik (Miller, et al., 2009: 34). Oleh karena itu, guru harus mampu mengembangkan alat asesmen yang baik yang mampu memotret secara tepat kompetensi yang telah dicapai peserta didik.

Salah satu instrument yang penting dalam mengembangkan ketrampilan dan sikap peserta didik adalah portofolio. Sebagaimna Pada Peraturan Mentri Pendidikan dan Kebudayaan, Permendikbud (2013) bahwa penilaian berbasis portofolio merupakan penilaian yang dilaksanakan untuk menilai keseluruhan entitas proses belajar peserta didik termasuk penugasan perseorangan dan/atau kelompok di dalam dan/atau di luar kelas khususnya pada sikap/perilaku dan keterampilan.

Portofolio sebagai penilaian menurut Departemen Pendidikan Nasional (Depdiknas, 2004) adalah kumpulan hasil karya seorang peserta didik sebagai hasil pelaksanaan tugas kinerja yang ditentukan oleh guru atau peserta didik bersama guru, sebagai bagian dari usaha mencapai tujuan belajar, atau mencapai kompetensi yang ditentukan dalam kurikulum. Jadi portofolio merupakan kumpulan dari karya peserta didik yang dikumpulkan berdasarkan tugas yang diberikan oleh guru di dalam pembelajaran dan dikumpulkan dalam kurun waktu tertentu, dalam hal ini penilaian berfokus kepada keterampilan dan sikap. Setelah kumpulan karya peserta didik dan bukti kegiatan dalam proses pembelajaran terkumpul, kemudian dinilai dengan menggunakan rubrik. Rubrik berkedudukan sebagai pedoman penilaian, mengingat penilaian yang dilakukan bersifat subyektif, sehingga menjadi perlu untuk dibuat sebuah pedoman dalam pengambilan keputusan agar di dalam penilaian dilakukan secara lebih transparan dan bisa dipertanggungjawabkan serta mempunyai acuan-acuan yang jelas.

Namun dalam prakteknya dilapangan ada beberapa masalah terkait dengan penggunaan penilaian portofolio. Masalah tersebut antara lain adalah adanya anggapan guru yang merasa penilaian portofolio belum cocok dengan pembelajaran sehingga belum menggunakannya, dan untuk guru yang sudah menggunkan, ada yang masih mencari format yang pas dan sesuai untuk melakukan penilaian portofolio. Berangkat dari masalah tersebut penulis tertarik untuk melakukan penelitian tentang Pengembangan Assessment Portofolio pada Mata Pelajaran Pendidikan Agama Islam di SMA.

3. Rumusan Masalah

a. Bagaimanakah Pengembangan Assessmen Portofolio pada mata Pelajaran Pendidikan Agama Islam di tinjau dari cakupan isi dan kepraktisan serta manfaatnya ?

b. Apakah Assessment Portofolio sudah efektif mengukur ketrampilan dan sikap peserta didik?

Metodologi Penelitian

a. Jenis Penelitian

Penelitian ini menggunakan model penelitian dan pengembangan (Research & Development). Adapun model yang digunakan adalah model pengembangan dari Plomp yang dikombinasikan dengan model Borg & Gall. Pengertian kombinasi dalam hal ini adalah langkah-langkah penelitian dan pengembangan menggunakan acuan pokok dari Plomp, sedangkan penentuan jumlah subjek ujicoba menggunakan acuan dari Borg & Gall, yaitu jumlah subjek ujicoba dari yang pertama, kedua dan seterusnya semakin meningkat Pengembangan model Pembelajaran PAI menempuh langkah-langkah: 1) analisis teori dan hasil penelitian sebelumnya, 2) penyusunan desain dan perangkat model yang didasarkan pada hasil analisis beragam teori model dan hasil-hasil penelitian sebelumnya, 2) validasi pakar (expert judgement), yang dilakukan dengan menggunakan model focus group dicussion (FGD) dan delphi, 3) uji coba produk, 4) analisis data, dan 5) uji implementasi. Pakar atau ahli yang telibat dalam kegiatan FGD terdiri dari 4 orang dosen PPs S3 dengan bidang keahlian masing-masing: pendidikan PAI, pendidikan nilai, metodologi penelitian, dan pengukuran, 9 orang guru PAI SMA dan 3 orang kepala/wakil kepala SMA.

b. Ujicoba produk

Aspek yang divalidasi dalam tahap uji model ini meliputi uji model dan aplikasi model Assessment portofolio pada Pembelajaran PAI, Ujicoba model dilakukan dalam tiga tahap, yaitu: uji coba tahap pertama, tahap kedua dan tahap ketiga sebagai uji implementasi. Subjek ujicoba yang terlibat dalam penelitian ini terdiri dari siswa SMA, guru PAI, serta Kepala Sekolah maupun Wakil Kepala Sekolah sebagai representasi dari pimpinan sekolah dan mahasiswa PEP S3.

c. Pengumpulan Dan Analisis Data

Pengumpulan data menggunakan inventory dan rating scale Instrumen pengumpulan data dianalis dengan CFA (Confirmatory Factor Analysis), model dianalisis secara deskriptif berdasarkan penilaian guru PAI dan pimpinan sekolah serta dengan SEM (Structural Equation Modeling) untuk membuktikan asumsi model PAI. Untuk menguji kecocokan antara model Assessment portofolio secara teoritis dengan data empiris, baik model pengukuran maupun model assessment didasarkan pada empat indikator, yaitu: 1) Chi-Square 2) ρ-value; 3) RMSEA; dan 4) GFI. Pada analisis deskriptif, data kuantitatif yang diperoleh melalui instrumen penilaian dicari skor reratanya kemudian dikonversikan ke data kualitatif dengan skala 5, dan akhirnya dideskripsikan. Hasil deskripsi tersebut dijadikan sebagai dasar untuk menentukan Assessment portofolio yang dikembangkan beserta panduan dan perangkatnya. Konversi data kuantitatif ke data kualitatif dengan skala 5 menggunakan aturan yang merupakan modifikasi dari aturan yang dikembangkan oleh Sudijono (2003: 329 – 339). Aturan tersebut dapat dilihat dalam tabel berikut di bawah ini.

Tabel . Standar Konversi Data Kuantitatif ke Data Kualitatif

Rerata Skor	Klasifikasi	Kesimpulan
> 4,2	Sangat Baik	Dapat dijadikan contoh
> 3,4 – 4,2	Baik	Dapat digunakan tanpa perbaikan
> 2,6 – 3,4	Cukup	Dapat digunakan dengan sedikit perbaikan
> 1,8 – 2,6	Kurang	Dapat digunakan dengan banyak perbaikan
≤ 1,8	Sangat Kurang	Belum dapat digunakan

REFERENSI

Depdikbud. (2013). Kerangka dasar dan struktur kurikulum Sekolah Menengah Atas/Madrasah Aliyah. Jakarta: Depdikbud.

Depdikbud. (2014). Pedoman penilaian hasil belajar oleh pendidik. Lampiran Permendikbud Nomor 104 Tahun 2014 tentang Penilaian Hasil Belajar Oleh Pendidik pada Pendidikan Dasar dan Menengah. Jakarta: Depdikbud

Mardapi, D. (2012). Pengukuran penilaian dan evaluasi pendidikan. Yogyakarta: Nuha Medika

Raymond, J. E., Homer, C. S., Smith, R., & Gray, J. E. (2012). Learning through authentic assessment: An evaluation of new development in the undergraduate midwifery curriculum. Nurse Education in Practice, 13(5), 471-476

Russell, M. K., & Airasian, P. W. (2012). Classroom assessment: concepts and applications (7th edition). New York: McGraw-Hill.

Subramanian, J.,& et.al. (2012). Improving the quality of educational strategies in postgraduate dental education using student ang graduate feedback: findings from a qualitative study in New Zealand. European Journal of Dental Education, 1-8.

IDENTIFIKASI PERMASALAHAN PEMBELAJARAN PENDIDIKAN AGAMA ISLAM DI SEKOLAH

TUGAS AKHIR MATA KULIAH FILSAFAT PENELITIAN DAN EVALUASI PENDIDIKAN

Dosen Pengampu Mata Kuliah :Prof. Dr. Marsigit, MA

A. IDENTIFIKASI PERMASALAHAN FILSAFAT DALAM PEMBELAJARAN PENDIDIKAN AGAMA ISLAM DI SEKOLAH

1. Tidak kurang dari 75 % (35 juta) peserta didik di seluruh Indonesia secara terprogram dan teratur mempelajari agama Islam untuk diamalkan dalam kehidupan sehari-hari. Namun pada kenyataanya Pembelajaran PAI secara umum belum dapat menghasilkan lulusan (outcome) seperti yang diharapkan.

2. Adanya kesenjangan / Kontradiksi antara harapan dengan kenyataan (tujuan dan hasil) yaitu antara penguasaan pengetahuan dan pengamalan agama Islam.

3. Terdapat indikasi bahwa hasil PAI dalam aspek kognitif tidak selalu paralel dengan pengamalan ajaran dan nilai nilai agama Islam.

4. PAI di Sekolah belum efektif mengintegrasikan pengetahuan keagamaan siswa dengan pengamalannya,

5. Fenomena dekadensi moral yang terjadi dalam kehidupan remaja dan pelajar akhir-akhir ini Menjadi barometer penilaian akan kekurangan pendidikan agama di sekolah

6. Pengembangan kurikulum PAI selama ini cenderung lebih banyak ditentukan oleh kebijakan politik Pendidikan dari pada pertimbangan filosofis-pedagogis, sehingga berimplikasi pada formulasi kurikulum maupun implementasinya dalam proses pembelajaran.

7. Pendekatan saintific dalam Kurikulum 2013 diberlakukan kepada semua mata pelajaran termasuk pada mata pelajaran PAI pada semua jenjang. Salah satu wujud yang tampak nyata penerapan metode saintifik muncul pada pedoman pengembangan RPP, yaitu sebagai EEK (Elaborasi, Eksplorasi dan Konfirmasi) yang harus muncul pada setiap kegiatan pembelajaran. Pertanyaan kemudian muncul, secara psikologis- filosofis apakah benar bahwa EEK dapat diterapkan untuk semua disiplin ilmu (termasuk ilmu-ilmu humaniora) Seperti Pada Mata Pelajaran PAI di Sekolah, Hal ini menjadi persoalan baru bagi guru PAI dalam pelaksanaanya di sekolah.Sehingga mereka merasa kesulitaan dalam penerapanya terutama pada kasus pembelajaran Aqidah.

8. Kurikulum 2013 masih memuat banyak persoalan controversial dan secara ontologis, pedagogis, psikologis dan empiris.

9. Isu sentral dalam menyusun materi kurikulum Pal yaitu yang berkaitan dengan sumber yang dijadikan sebagai dasar menetapkan materi pelajaran, ruang lingkup (skop) materi pelajaran, dan sistematika urut-urutan (sekuens) yang dinilai kurang jelas dan terkesan mengulang ulang materi yang sama dan tidak mendalam.

10. Sehingga membuat peserta didik bosan dengan materi yang telah diberikan secara berulang ulang, namun disisi lain mereka tidak paham ajaran agama secara menyeluruh.

11.Selanjutnya ditinjau dari sumber belajar yang digunakan oleh guru selama ini praktek pembelajaran didominasi dengan Textbook oriented. Walaupun sudah disarankan agar terdapat variasi sumber belajar, tetapi belum secara eksplisit disebutkan pentinnya Pengembangan RPP dan LKS yang sesuai dengan paradigm Explorasi dan Membangun Hidup (Life Skill).

12. Demikian juga Walaupun sudah disebut pentingnya Portofolio dalam Penilaian, Namun Pada kenyataanya guru masih menjadikan test kognitif menjadi rujukan utama dalam menilai keberhasilan siswa dalam pembelajaran.

13. Kompetesi guru PAI yang selama ini masih dinilai masih kurang, Hal ini dapat dilihat dari kedalaman materi yang di sampaikan dalam proses pembelajaran

14. Metode pembelajaran yang digunkan oleh Guru PAI kurang berfariatif

15. Sarana prasarana pembelajaran masih sangat kurang serta Kerja sama orang tua dan pendidik dalam proses Pendidikan anak baik di rumah dan sekolah belum jerjalin baik.

B. BERDASARKAN PERMASALAH DIATAS MAKA PENULIS TERTARIK UNTUK MELAKUKAN PENELITIAN TERKAIT DENGAN :

1. Pengembangan Assessment Fortofolio Pada Mata Pelajaran Pendidikan Agama Islam di SMA

2. Pengembagan Autentik Assessmemt Pada Mata Pelajaran Pendidikan Agama Islam Berbasis Komputer.

3. Model Pendidikan di Era Distrubsi ( Pendekatan Filosofis Imam Al Gazali dan Ibn Rusyd)

4. Model Pendidikan di Era Distrubsi (Explorasi Model Pendidikan Agama Islam di Berbagai Pusantren )

5. Penerapan Logic Model dalam Evaluasi Pembelajaran Pendidikan Agama Islam Di Sekolah.

Kamis, 14 November 2019

METODE PENELITIAN EKSPERIMEN DAN EX POST FACTO

KARAKTERISTIK STATISTIK HASIL PENGUKURAN: RERATA (MEAN), MEDIAN,

TES BENAR-SALAH, PILIHAN GANDA, DAN ISIAN SINGKAT PADA KETERAMPILAN BERPIKIR TINGKAT TINGGI

Senin, 23 September 2019

Mengevaluasi Koefisien Reliabilitas

A. Mengevaluasi Koefisien Reliabilitas

Pertanyaan penting lain ketika mempertimbangkan koefisien reliabilitas adalah “seberapa besar seharusnya koefisien reliabilitas?” mengingat, kita mengatakan uji koefisien reliabilitas dapat diartikan sebagai tafsiran proporsi varian skor tes yang di akibatkan oleh varian skor murni.

Idealnya koefisien reliabilitas adalah 1.0 sebab hal ini mengindikasikanbahwa 100 % dari skor tes varian adalah mutlak karena perbedaan antara individu. Akan tetapi, karena kesalahan pengukuran, reliabilitas yang sempurna tidak dapat dicapai. Koefisien reliabilitas dipengaruhi oleh beberapa faktor yaitu Konstruk yang di ukur, jumlah waktu yang tersedia untuk testing, cara pemberian skor, dan metode estimasi reliabilitas.

1. Konstruk. Beberapa konstruk lebih sulit untuk diukur dari pada konstruk lain karena daerah pokok lebih sulit untuk menyampel secara memadai. Kebiasaan pada umumnya, variabel – variabel personal lebih sulit untuk di ukur dari pada pengetahuan akademik. Akibatnya, level reliabilitas yang diterima untuk mengukur “dependency / ketergantungan” dianggap ditolak untuk mengukur komprehensi/pemahaman membaca. Dalam mengevaluasi penerimaan suatu koefisien reliabilitas harus mempertimbangkan sifat dari variabel penelitian dan bagaimana kesulitan dalam mengukurnya. Dengan meninjau dan membandingkan estimasi reliabilitas dari instrumen – instrumen yang tersedia untuk mengukur suatu konstruk, dapat ditentukan mana ukuran konstruk yang paling dipercaya.

2. Waktu yang tersedia untuk testing. Jika waktu yang tersedia untuk testing terbatas, jumlah item yang bisa diatur terbatas pula dan sampling dari domain tes membuka peluang bagi terjadinya error yang lebih besar. Ini dapat terjadi dalam sebuah proyek penelitian yang kepala sekolahnya mengijinkan anda untuk melakukan study disekolahnya tetapi waktu yang diperkenankan untuk mengukur semua variabel dalam penelitian anda hanya 20 menit. Contoh lain, penyaringan untuk masalah membaca yang dihadapi siswa dimana waktu yang diberikan tiap siswa hanya 15 menit. Sedangkan seorang psikolog mungkin butuh waktu 2 jam untuk tes kecerdasan individual yang terstandarisasi. Adalah tidak mungkin diharapkan level reliabilitas yang sama dari perbedaan signifikan proses pengukuran yang berbeda. Namun demikian, membandingkan koefisien reliabilitas yang terkait dengan instrumen yang dapat diatur dalam parameter situasi testing bisa membantu seseorang memilih instrumen yang terbaik untuk situasi ini.

3. Penggunaan skor tes. Cara penggunaan skor tes merupakan pertimbangan pokok lainnya ketika mengevaluasi kecukupan koefisien reliabilitas. Tes diagnostik yang membentuk dasar untuk keputusan – keputusan utama tentang individu harus dilakukan dengan standar yang lebih tinggi dari pada tes yang digunakan pada penelitian kelompok atau untuk penyaringan sejumlah besar individu. Contoh, diberikan tes kecerdasan individual yang digunakan dalam diagnosis keterbelakangan mental akan diharapkan untuk menghasilkan skor level reliabilitas yang sangat tinggi. Dalam konteks ini, kinerja pada tes kecerdasan memberikan informasi kritis yang digunakan untuk menentukan apakah seseorang memenuhi kriteria diagnostik. Sebaliknya, tes yang digunakan untuk menyaring semua siswa di sekolah dalam masalah membaca, diadakan untuk standar yang kurang ketat. Dalam keadaan ini, instrumen yang digunakan hanya untuk tujuan penyaringan dan tidak ada keputusan yang dibuat. Hal ini mengingatkan walaupun reliabilitas tinggi yang diinginkan dalam semua penilaian, standar yang dapat diterima bervariasi dengan cara tes skor yang bisa digunakan. Keputusan yang tinggi menuntut reliabilitas yang tinggi.

4. Metode estimasi reliabilitas. Ukuran koefisien reliabilitas juga berhubungan dengan cara memilih pada estimasi reliabilitas. Beberapa metode cenderung menghasilkan estimasi yang tinggi dari pada metode lain. Sebagai akibatnya, ini sangat penting untuk mempertimbangkan metode yang akan digunakan untuk menghasilkan korelasi koefisien ketika mengevaluasi dan membandingkan reliabilitas tes – tes yang berbeda. Contoh, KR-20 dan koefisien tipe alfa biasanya menghasilkan reliabilitas estimasi lebih kecil dari pada yang diperoleh dengan menggunakan metode split – half (bagi dua). dalam tabel 4.5, reliabilitas bentuk alternatif yang pelaksanaannya ditunda/tertunda memiliki banyak sumber eror dari pada metode lain yang dan biasanya menghasilkan koefisien reliabilitas yang rendah. Ringkasnya, beberapa metode estimasi reliabilitas lebih tepat dan cenderung menghasilkan koefisien yang lebih besar, dan variabel ini seharusnya menjadi pertimbangan ketika mengevaluasi koefisien reliabilitas.

Pedoman Umum. Meskipun sudah jelas bahwa banyak faktor pertimbangan yang pantas ketika mengevaluasi koefisien reliabilitas, kita akan tetap menyediakan / memberikan beberapa pedoman umum.

1. Jika sebuah tes digunakan dalam mengambil keputusan penting yang berdampak secara signifikan terhadap seseorang, koefisien reliabilitasnya 0.90 atau 0.95.

Jika sebuah tes digunakan dalam mengambil keputusan penting yang memungkinkan pengaruh signifikan terhadap seseorang dan tidak mudah sebaliknya, itu layak untuk mengira koefisien reliabilitasnya 0.90 atau 0.95.

Level ini secara teratur bisa diperoleh dalam tes kecerdasan individual. Contoh, reliabilitas skala kecerdasan orang – orang dewasa wechsler- edisi ketiga (wechsler, 1997), hasil tes kecerdasan individual diperoleh 0.98.

2. Estimasi reliabilitas 0.80 atau lebih, dapat diterima dalam situasi tes apapun dan biasanya pada laporan – laporan dari tes prestasi dan kepribadian menunjukkan hal ini. Contoh, The California Achievement Test/5 (CAT/5)(CTB/Macmillan/McGraw-Hill, 1993), sebuah kumpulan grup pengaturan tes prestasi yang sering digunakan dalam sekolah umum, koefisien reliabilitasnya melebihi 0.80 untuk sebagian besar sub tes.

3. Tes kelas yang dibuat oleh guru dan tes yang digunakan untuk penyaringan, reliabilitas estimasi sekurang - kurangnya 0.70. Tes dalam kelas sering dikombinasikan untuk membentuk gabungan dari hasil tes untuk menentukan nilai akhir, dan reliabilitas gabungan tersebut diharapkan menjadi lebih besar dari pada reliabilitas tes individu. Koefisien sebesar 0.70an juga dapat diterima ketika prosedur pendugaan yang diteliti tersedia berkaitan dengan kasus-kasus individual.

Menurut beberapa penulis koefisien reliabilitas 0.60 masih bisa diterima untuk penelitian grup, penilaian, dan pengukuran proyektif, tapi kami tidak menyarankan penggunaan penilaian – penilaian yang menghasilkan skor estimasi reliabilitasnya dibawah 0.70. untuk diingat kembali, koefisien reliabilitas 0.60 mengindikasikan bahwa 40 % dari varian yang di observasi dapat merupakan random erorr. Seberapa besar kepercayaan anda terhadap hasil sebuah penilaian ketika anda tahu bahwa 40 % dari varian merupakan random error?

Petunjuk terdahulu dalam koefisien reliabilitas dan besarnya keputusan kualitatif juga menjadi pertimbangan dalam konteks ini. Beberapa konstruk lebih sulit diukur secara reliabel dari pada yang lain. Dari sudut pandang/perspektif pembangunan atau perkembangan, kita tahu bahwa munculnya ketrampilan - ketrampilan atau sikap dalam diri anak lebih sulit di ukur dari pada orang dewasa atau perkembangan ketrampilannya. Ketika suatu konstruk sulit di ukur, beberapa koefisien reliabilitas lebih besar dari 0.50 mungkin baik diterima karena masih terdapat lebih banyak lagi varian skor murni yang berkaitan dengan error varian. Namun demikian, sebelum memilih untuk mengukur dengan koefisien reliabilitas dibawah 0.70, pastikan memang tidak ada instrumen pengukuran yang lebih baik yang tersedia.

B. Bagaimana Meningkatkan Reliabilitas

Pertanyaan pokok pada poin ini adalah “apa yang bisa kita lakukan untuk meningkatkan reliabilitas hasil penilaian kita?” pada intinya kita bertanya langkah – langkah apa yang dapat di ambil untuk memaksimalkan skor varian murni dan meminimalkan varian error, bisa jadi pendekatan yang paling umum untuk meningkatkan reliabilitas pengukuran adalah dengan menambah jumlah item tes. Dalam konteks tes individu, Jika penambahan jumlah item tes dilakukan sambil tetap menjaga kesamaan kualitas dengan item aslinya, makakita bisa meningkatkan reliabilitas tes. Konsep ini telah diperkenalkan sebelumnya pada saat membahas tentang reliabilitas belah dua dan presentasi Formula Spearman-Brown. Pada kenyataannya, fariasi Formula Spearman-Brown dapat digunakan untuk memprediksi efek penambahan item tes terhadap reliabilitas tes:

r = n x r_xx

1 + (n-1)r_xx

Dimana:

r : Estimasi reliabilitas dalam tes dengan item baru

n : Faktor yang menunjukkan penambahan item tes

rxx : Reliabilitas tes awal (sebelumnya)

Untuk contoh, digunakan 25 bentuk soal tes matematika. Jika reliabilitas tesnya ada 0.80 dan kita mengestimasi untuk meningkatkan reliabilitas kita dengan cara menambah 30 bentuk tes (faktor 1.2) rumusnya menjadi :

r = 1,2 x 0,80 = 0,96 = 0,83

1+(1,2-1)0,80 1,16

Tabel 4.6 menyediakan contoh – contoh lain yang menggambarkan akibat dari penambahan item tes terhadap reliabilitas. Pada baris pertama dari tabel tersebut terlihat bahwa penambahan jumlah item tes pada tes yang reliabilitasnya 0.50 dengan faktor 1.25 menghasilkan reliabilitas prediksi sebesar 0.56. Menambah jumlah item dengan faktor 2.0 (i.e., menggandakan jumlah item tes) meningkatkan reliabilitas menjadi 0.67.

Table 4.6 reliability expected when increasing the number of items

Current reliability	The reliability expected when the number of items is increased by:
Current reliability	× 1,25	× 1,50	× 2,0	× 2,5
0,50	0,56	0,60	0,67	0,71
0,55	0,60	0,65	0,71	0,75
0,60	0,65	0,69	0,75	0,79
0,65	0,70	0,74	0,79	0,82
0,70	0,74	0,78	0,82	0,85
0,75	0,79	0,82	0,86	0,88
0,80	0,83	0,86	0,89	0,91
0,85	0,88	0,89	0,92	0,93
0,90	0,92	0,93	0,95	0,96

Dalam situasi tertentu beberapa faktor akan membatasi jumlah item yang bisa dimasukkan dalam sebuah tes. Contoh, guru pada umumnya mengembangkan tes yang diselenggarakan dalam interval waktu tertentu, biasanya waktu yang di alokasikan untuk jam pelajaran tertentu. Dalam situasi tersebut, reliabilitas dapat ditingkatkan dengan menggunakan beberapa pengukuran yang dikombinasikan untuk memperoleh skor rata – rata atau skor gabungan. Sebagaimana yang telah dikemukakan sebelumnya, mengkombinasikan beberapa tes multipel dalam sebuah komposit linear akan meningkatkan reliabilitas pengukuran komponen tes. Singkatnya, apapun yang kita lakukan untuk memperoleh sample yang memadai akan meningkatkan reliabilitas pengukuran kita.

Pada chapter 6 kita akan membahas prosedur – prosedur secara bersama tentang “bentuk – bentuk analisis” prosedur tersebut membantu kita untuk memilih, mengembangkan dan mempertahankan karakteristik pengukuran dengan baik. Sebelum diskusi tentang prosedur – prosedur secara detail, harusdicatat bahwa pilihan atau pengembangan bentuk yang bagus merupakan hal penting dalam tahap pengembangan tes yang baik. Memilih dan mengembangkan bentuk tes yang baik akan mempertinggi karakteristik pengukuran dari penilaian yang anda gunakan.

Cara lain untuk mengurangi akibat error pengukuran adalah apa yang Ghiselli, Campbell, dan Zedeck (1981) kemukakan mengenai “prosedur berumah tangga yang baik”. Menurut mereka pengembang tes seharusnya mengembangkan item tes dengan seksama dan jelas. Mereka harus mengembangkan prosedur - prosedur yang tepat mengenai pelaksanaan dan pemberian skor tes. Contohnya memasukan instruksi yang jelas untuk penyelenggaraan terstandar, mengembangan rubrik dengan kualitas tinggi untuk memfasilitasi skor yang reliabel, dan menuntut pelatihan yang luas sebelum seseorang dapat menyelenggarakan, memeriksa, atau menafsirkan tes.

C. Masalah-Masalah Spesifik dalam Mengestimasi Reliabilitas

1. Reliabilitas Tes Kecepatan. Sebuah tes kecepatan umumnya terdiri dari item-item yang relatif mudah namun dengan waktu yang terbatas sehingga tidak memungkinkan bagi setiap peserta tes untuk dapat menjawab dengan benar seluruh pertanyaan. Akibatnya, skor peserta tes pada tes kecepatan pada dasarnya merefleksikan kecepatan performans. Pada saat mengestimasi reliabilitas dari hasil tes kecepatan, estimasi yang diturunkan dari sebuah tes tunggal adalah tidak tepat. Karena itu, tes ulang atau reliabilitas bentuk paralel dalam tes kecepatan adalah tepat, sedangkan tes belah dua, koefisien alpha, dan KR 20 harus dihindarkan.

2. Reliabilitas sebagai fungsi level skor. Meski merupakan sesuatu yang sangat diharapkan, namun sebuah tes tidaklah selalu dapat mengukur dengan tingkat ketelitian yang sama dalam keseluruhan range skor. Jika suatu kelompok individu diberikan tes yang terlalu mudah atau terlalu sulit bagi mereka, sangat mungkin terjadi kita akan memiliki tambahan eror dalam skor. Akurasi yang rendah terjadi pada distribusi yang ekstrim di mana skor tes yang diperoleh menunjukan hasil yang semua benar atau semua salah. Dalam situasi seperti ini, adalah tidak cermat jika kita kemudian mengambil kesimpulan bahwa siswa yang gagal menjawab dengan benar semua pertanyaan yang diberikan pada tes intelektual adalah siswa yang tidak memiliki kecerdasan intelektual. Karena bisa saja yang terjadi adalah tes yang digunakan ternyata tidak cukup memadai untuk memberikan penilaian atas “kecakapan tingkat rendah” (low-level skill) yang diperlukan untuk mengukur kecerdasan intelektual anak. Hal ini berhubungan dengan kedaaan dimana tes tidak memiliki “lantai” (batas bawah) yang memadai. Sebaliknya, adalah juga tidak cermat jika membuat laporan bahwa siswa yang mampu menjawab dengan benar semua pertanyaan pada tes intelektual adalah siswa yang memiliki kecerdasan luar biasa. Bisa saja terjadi bahwa tesnya benar-benar terlalu mudah untuk sebuah pengukuran yang memadai, berkaitan dengan situasi dimana tes tidak memiliki “plafon” (batas atas) yang cukup. Jadi, untuk kedua kasus ini kita membutuhkan tes yang lebih cocok. Pada umumnya, tes bakat dan tes prestasi dirancang untuk digunakan pada individu dengan level kemampuan tertentu. Ketika sebuah tes digunakan pada individu, baik dengan hasil yang ekstrim maupun di luar itu, skornya mungkin tidak akan seakurat estimasi reliabilitas yang ditunjukkan. Dalam situasi seperti ini, studi lebih lanjut tentang reliabilitas dari skor ditunjukan pada level ini.

3. Pembatasan rentangan (range). Nilai yang kita peroleh ketika menghitung koefisien reliabilitas tergantung pada karakteristik sampel atau kelompok individu yang menjadi basis analisis. Salah satu karakteristik sampel yang berpengaruh signifikan (penting) terhadap koefisien reliabilitas adalah “tingkat/derajat variasi yang ditunjukan” (varian). Lebih tepatnya, koefisien reliabilitas yang didasarkan pada sampel dengan varian yang besar (mengacu pada heterogenitas sampel) umumnya akan menghasilkan estimasi reliabilitas yang lebih tinggi daripada koefisien reliabilitas yang berbasis pada sampel dengan varian yang lebih kecil (berhubungan dengan homogenitas sampel). Ketika koefisien reliabilitas didasarkan pada sampel dengan range (rentangan) variabilitas yang dibatasi, koefisien mungkin sebenarnya lebih rendah dari perkiraan reliabilitas pengukuran. Sebagai contoh, jika anda mendasarkan analisis reliabilitas pada siswa di kelas anak - anak berbakat di mana praktis semua skor menunjukan hasil yang patut dicontoh (misalnya >90% benar), anda akan mendapatkan estimasi reliabilitas yang lebih rendah ketimbang analisis yang sama yang dilakukan pada kelas dengan distribusi skor yang lebih luas dan mendekati normal.

4. Tes Penguasaan (Mastery Testing).

Tes yang mengacu pada criteria tertentu (criterion-referenced test) digunakan untuk membuat interpretasi relatif terhadap level performance tertentu. Contoh dari tes ini adalah tes penguasaan untuk mengevaluasi performance dalam arti lebih sebagai pencapaian suatu skor yang dipotongdaripada sekedar mengukur tingkat pencapaian. Perhatian dari tes ini lebih kepada klasifikasi. Setiap peserta, baik yang memiliki skor yang sama dengan skor yang dipotong maupun yang memiliki skor di atasnya, diklasifikasikan sebagai telah menguasai skill atau domain. Sebaliknya, mereka yang memiliki skor di bawah skor yang dipotong diklasifikasikan sebagai belum menguasai. Tes penguasaan sering menghasilkan variabilitas terbatas antar peserta tes juga antar hasil performance dengan koefisien reliabilitas yang kecil. Akibatnya, estimasi reliabilitas yang didiskusikan pada bab ini tidak cukup untuk menilai reliabilitas skor tes penguasaan. Dengan penekanan pada klasifikasi tersebut, pendekatan yang direkomendasikan adalah dengan menggunakan indeks yang merefleksikan konsistensi klasifikasi (AERA, dkk, 1999).

D. Standar Kesalahan Pengukuran

Koefisien Reliabilitas diinterpretasikan dalam bentuk proporsi dari variansi pengamatan yang terkait dengan variansi kebenaran dan cara yang bermanfaat untuk membandingkan skor realibitas yang dihasilkan dari prosedur penilaian yang berbeda. Hal lain dijadikan sama, kamu akan meyeleksi tes yang menghasilkan skor dengan reliabilitas yang terbaik.Akan tetapi, segera setelah tes itu diseleksi dan fokusnya pada menafsirkanskor, standar kesalahan Pengukuran (SEM) adalah suatu cara statistik yang lebih praktis. SEM adalah standar deviasi dari distribusi skor yang diperoleh dari seseorang jika dites dalam jumlah yang tak terbatas, dan dari bentuk test paralel yang terdiri dari item-item yang secara random dijadikan sampling dari kandungan/isi domain yang sama. Dengan kata lain jika kita mengkreasikan jumlah yang tidak terbatas dari bentuk paralel sebuah test dan memiliki orang yang sama tanpa efek2 yang dibawa, kehadiran dari kesalahan pengukuran mencegah seseorang dalam memperoleh skor yang sama setiap waktu. Meskipun setiap tes kemungkinannya memiliki kandungan domain yang sama, pengambil tes akan tampil lebih baik pada beberapa tes dan lebih buruk pada tes lainnya, hal ini disebabkan karena kesalahan random. Pengambilan skor yang diperoleh pada semua tes akan menghasilkan distribusi skor. Pengertian dari distribusi tersebut di atas adalah skor individual sebenarnya (T) dan SEM adalah deviasi standar dari distribusi skor yang eror. Jelasnya, kita tidak akan mudah untuk mengikuti prosedur-prosedur ini dan harus mengestimasi SEM menggunakan informasi yang tersedia untuk kita.

1. Mengevaluasi Standar Kesalahan Pengukuran

SEM adalah fungsi dari reliabilitas (r_xx) dan deviasi standar (SD) dari test. Ketika mengkalkulasi SEM, koefisien reliabilitas mempertimbangkan pengukuran eror yang terdapat dalam skor test, dan deviasi standar merefleksikan variabilitas dari skor-skor dalam sebuah distribusi. SEM diestimasikan menggunakan formula berikut :

SEM = SD√1-r_xx

Dimana SD = deviasi standar dari skor-skor yang diperoleh

r_xx = reliabilitas dari tes

Mari melalui 2 contoh. Pertama, mari kita anggap sebuah test dengan deviasi standar 10 dan reliabilitas 0,90.

Contoh 1: SEM = √1- 0,90

=√0,10

SEM = 3,2

Sekarang mari kita anggap sebuah test dengan deviasi standar 10 dan reabilitas 0,80. Standar Deviasi sama dengan contoh sebelumnya, tetapi reliabilitas lebih rendah.

Contoh 2: SEM = √ 1- 0,80

= √ 0,20

SEM = 4,5

Perhatian, bahwa reliabilitas dari sebuah skor test menurun , SEM meningkat, Karena koefisien reliabilitas bagian dari variansi skor yang diamati , karena variansi skor yang benar dan SEM adalah sebuah estimasi jumlah yang eror dalam skor test, hubungan terbalik ini yang diharapkan dalam ketelitian sebuah skor tes. Semakin bagus realibilitas skor test semakin kecil SEM dan semakin kita yakin atau percaya akan ketelitian dari sebuah test, semakin besar SEM, dan semakin kita tidak yakin atau percaya akan ketelitian sebuah skor test.

Tabel 4.7. menunjukan SEM sebagai sebuah fungsi dari deviasi standard dan reliabilitas. Pada baris pertama dalam tabel menunjukan bahwa sebuah tes dengan deviasi standar 30 dan koefisien reabilitas dari skor test 0.90 SEM adalah 9,5; jika realibilitas dari test 0,85, SEM 11,6; dan sebagainya. SEM digunakan dalam menghitung interval-interval atau merek (brand) disekitar skor yang diamati dimana skor yang benar diperkirakan turun. Sekarang kita akan beralih ke aplikasi SEM.

Table 4.7 Standard Error of Measurement for Values of reliability and Standard Deviation

SD	Reliability Coefficients
SD	0,95	0,90	0,85	0,80	0,75	0,70
30	6,7	9,5	11,6	13,4	15,0	16,4
28	6,3	8,9	10,8	12,5	14,0	15,3
26	5,8	8,2	10,1	11,6	13,0	14,2
24	5,4	7,6	9,3	10,7	12,0	13,1
22	4,9	7,0	8,5	9,8	11,0	12,0
20	4,5	6,3	7,7	8,9	10,0	11,0
18	4,0	5,7	7,0	8,0	9,0	9,9
16	3,6	5,1	6,2	7,2	8,0	8,8
14	3,1	4,4	5,4	6,3	7,0	7,7
12	2,7	3,8	4,6	5,4	6,0	6,6
10	2,2	3,2	3,9	4,5	5,0	5,5
8	1,8	2,5	3,1	3,6	4,0	4,4
6	1,3	1,9	2,3	2,7	3,0	3,3
4	0,9	1,3	1,5	1,8	2,0	2,2
2	0,4	0,6	0,8	0,9	1,0	1,1

2. Menghitung Interval Kepercayaan.

Interval kepercayaan mencerminkan kisaran skor dimana mengandung skor individual yang benar dengan probabilitas yang ditentukan (AERA, dkk,1999). Kita menggunakan SEM untuk mengkalkulasi intervalkepercayaan. Ketika memperkenalkan SEM, kita mengatakan SEM menyediakan informasi tentang distribusi dari skor yang diamati disekitar skor yang benar. Lebih tepatnya, kita mendefenisikan SEM sebagai deviasi standar dari distribusi skor-skor yang eror. Seperti deviasi standar lainnya SEM dapat diinterpretasikan ke dalam bentuk frekuensi-frekuensi yang dipresentasikan dalam bentuk distribusi normal.

Pada bab sebelumnya kita tunjukan bahwa kira2 68% dari skor dalam distribusi normal terletak diantara satu deviasi standar dibawah rata-rata(mean) dan satu deviasi standar diatas rata (mean). Hasilnya kira-kira 68% dari waktu skor individual yang diamati diharapkan menjadi ± 1 SEM dari skor yang benar. Contohnya, jika seorang memiliki skor yang benar yaitu 70 dalam sebuah test dengan SEM 3 kemudian kita mengharapkan orang itu memperoleh skor diantara 67 dan 73, (skor yang diperoleh ±1 SEM) 68% dari waktu. Jadi kita dapat berharap skornya diantara 64,12 dan 75,88 dengan interval kepercayaan 95% (diperoleh skor ± 1,96 SEM).

Hal ini menjadi catatan akan hubungan antara reliabilitas dari skor tes, SEM, dan interval kepercayaan. Ingat, kita mencatat bahwa skor reliabilitas bertambah, SEMnya berkurang. Hubungan yang sama terjadi antara reliabilitas tes dan interval kepercayaan. Bila reliabilitas skor tes bertambah (menunjukkan kurangnya kesalahan pengukuran), interval kepercayaan menjadi lebih kecil. (menunjukkan ketelitian dalam pengukuran).

Keuntungan dari SEM dan penggunaan interval kepercayaan adalah bahwa mereka menyajikan dan mengingatkan kita bahwa kesalahan pengukuran ada dalam semua skor dan kita seharusnya menginterpretasikan skor dengan hati-hati. Suatu skor tunggal sering diinterpresatikan jika itu tepat dan tidak terkait dengan eror. Contoh, jika Susie memiliki skala IQ 113, orangtuanya mungkin menyatakan secara tidak langsung IQnya Susie persis 113. Jika kita menggunakan tes IQ tingkat tinggi seperti Wechsler Intelligence Scale for Children- edisi IV atau Reynolds Intellectual Assessment Scales, kemungkinan diperoleh estimasi yang bagus dari IQnya tersebut. Akan tetapi, instrument penilaian yang baik diperoleh skor yang mengandung beberapa tingkat kesalahan dan SEM, dan interval kepercayaan membantu kita mengilustrasikan itu. Informasi ini dapat dilaporkan dengan cara yang berbeda dalam laporan-laporan tertulis. Contohnya, Kaufman dan Lichtenberger (1999) merekomendasikan format berikut ini:

Susie memperoleh skala IQ 113 ( antara 108 dan 118 dengan kepercayaan 95%).

Kamphaus (2001) merekomendasikan format yang sedikit berbeda: Susie memperoleh skala IQ diatas rata-rata, dengan 95% kemungkinan IQnya turun antara 108 dan 118.

Terlepas dari format tepat yang digunakan, cakupan interval kepercayaan menyoroti fakta bahwa skor tes mengandung beberapa derajat kesalahan pengukuran dan harus diinterpretasikan dengan hati-hati. Kebanyakan tes profesional yang dipublikasikan baik skor-skor yang dilaporkan di mana pengambil skor tes kemungkinan surut atau memberikan informasi dalam menghitung interval kepercayaan ini.

E. Reliabilitas: Strategi Praktis untuk Guru

Sekarang Anda menyadari pentingnya reliabilitas pengukuran, pertanyaanmendasar adalah "Bagaimana saya bisa mengestimasi reliabilitas skor pada teskelas saya?" Kebanyakan guru memiliki beberapa pilihan untuk mengestimasireliabilitas skor tes. Pertama, jika Anda menggunakan tes pilihan ganda atau lainnya yang bisa dinilai oleh sebuah program komputer penilaian, hasil cetak skor biasanya akan melaporkan beberapa estimasi reliabilitas (misalnya, koefisien alpha atau KR-20). Jika Anda tidak memiliki akses ke skor komputer, tetapi item pada tes adalah kesulitan kurang lebih sama dan nilai / skor (yaitu, benar / salah), ), Anda dapat menggunakan estimasi reliabilitas konsistensi internal yang dikenal sebagai rumus Kuder-Richardson 21 (KR-21). Formula ini sebenarnya perkiraan KR.20 yang dibahas sebelumnya dan biasanya cukup untuk tes kelas. Untuk menghitung KR-21 Anda hanya perlu mengetahui mean, varians, dan jumlah item pada tes:

Dimana :

X = Mean

= Varian

n = Nomor item

Pertimbangkan set berikut skor 20: 50, 48,47,46,42,42,41,40, 40, 38,37,36,36, 35, 34, 32,32,31,30, dan 28. Di sini X = 38.25, ot = 39,8, dan n = 50. Oleh karena itu,

1 0.23

Seperti yang Anda lihat, ini adalah prosedur yang cukup sederhana. Jika Anda memiliki akses ke komputer dengan program spread-sheet atau kalkulator dengan fungsi mean dan varians, Anda dapat memperkirakan reliabilitas tes kelas dengan mudah dalam hitungan menit dengan formula ini.

Minat Khusus Topik 4.4 menyajikan pendekatan pintas untuk menghitungformula 2l Kuder-Richardson (KR-21):

Cara Cepat untuk Mengestimasi Reliabilitas untuk Ujian Kelas
Saupe (1961) memberikan metode yang cepat bagi guru untuk menghitung releabilitas untuk ujian kelas di era sebelum mengakses ke kalkulator atau komputer. Hal ini sesuai untuk tes di mana setiap item diberi bobot yang sama dan masing-masing item dinilai benar atau salah. Pertama, deviasi standar ujian harus diestimasi dari pendekatan sederhana:

Kemudian reliabilitas dapat di estimasi dari :

Reliabilitas [ 0.19 x jumlah item] / SD²

Jadi, misalnya, di kelas dengan 24 nilai tes siswa, yang atas seperenam dari skor 98. 92,
87, dan 86, sedangkan bagian bawah seperenam skor 48,72,74, dan 75 dengan 25 item tes, perhitungannya adalah:

[ 363 ]/ 11.5

94 / 11.5

= 8.17

Jadi,

Reliabilitas [ 0.19 x 25] / 8.17²

0.07

0.93

Koefisien reliabilitas 0,93 untuk tes adalah baik sekali! Jangan cemas jika hasil dalam ruangan tes Anda tidak mencapai tingkat reliabilitas yang tinggi.

Tabel 4.8 KR – 21 Estimasi Reliabilitas untuk tes dengan Mean 80 %

Standar Deviasi Tes

Nomor Item (n) 0.10(n) 0.15(n) 0.20(n)

10 - 0.29 0.60

20 0.20 0.64 0.80

30 0.47 0.76 0.87

40 0.60 0.82 0.90

50 0.68 0.86 0.92

75 0.79 0.91 0.95

100 0.84 0.93 0.96

Jika Anda ingin menghindari bahkan perhitungan ini terbatas, kamimempersiapkan Tabel 4.8, yang memungkinkan Anda untuk mengestimasireliabilitas KR-21 untuk tes kelas dengan skor dikotomus jika Anda tahudeviasi standar dan jumlah item (tabel ini adalah model setelah tabel awalnyadisajikan oleh Deiderich, 1973). Tabel ini cocok untuk tes dengan rata-rata sekitar 80% benar (kita menggunakan rata-rata 80% benar karena cukup mewakili banyak tes kelas). Untuk mengilustrasikan penerapannya, pertimbangkan contoh berikut. ( jika tes Anda memiliki 50 item dan SD 8, pilih "Jumlah item" baris untuk 50 item dan "Standar Deviasi" kolom untuk 0.l5n, karena 0,15 (50) = 7,5, yang dekat dengan Anda yang sebenarnya SD 8. Nomor di persimpangan adalah 0,86, yang merupakan reliabilitas sangatpantas untuk tes kelas (atau tes profesional yang dikembangkan untuk hal ini).

Jika Anda memeriksa Tabel 4.8, Anda mungkin akan mendeteksikecenderungan dengan cukup jelas :

Pertama, Semakin banyak item pada tes tersebut, estimasi koefisienreliabilitas semakin tinggi.

Kedua, Tes dengan standar deviasi yang lebih besar (yaitu, varians)menghasilkan hasil yang lebih dapat diandalkan. Misalnya, tes 30-item denganSD 3-yaitu 0,10 (n) - hasil estimasi reliabilitas 0,47, sementara yang lainnyaSD 4,5 - yaitu 0,15(n) - hasil dalam estimasi reliabilitas 0,76. Hal inimencerminkan kecenderungan kita yang dijelaskan sebelumnya bahwa hasilvarian skor dibatasi oleh koefisien reliabilitas yang lebih kecil.

Kita harus mencatat bahwa ketika kita memasukan dalam kolom untuk standar deviasi 0,20 (n), standar deviasi yang besar ini jarang ditemukan dalamtes kelas (Deiderich, 1973). kenyataannya, dari pengalaman kita lazim untuk tes kelas dengan standar deviasi mendekati 0.10 (n). Sebelum meninggalkan diskusi kita tentang KR-21 dan aplikasinya untuk tes kelas, kami ingin mengingatkan Anda bahwa KR-21 hanyalah sebuah pendekatan dari KR-20 atau koefisien alpha. KR-21 mengasumsikan item-item tes kesulitannya sama dan biasanya sedikit lebih rendah dari KR-20 atau koefisien alpha (Hopkins, 1998). Namun demikian, jika asumsi tersebut tidak terlalu dilanggar, itu mungkin estimasi reliabilitas yang cukup baik untuk aplikasi di banyak kelas.

Diskusi pintas kita tentang estimasi reliabilitas ini telah dibatasi pada tes yang di skor dikotomus. banyak penilaian guru menggunakan skor yang tidak dikotomus dan ini membuat situasi sedikit lebih rumit. Jika item Anda tidakdiskor dikotomus, Anda dapat menghitung koefisien alpha dengan relatif mudah menggunakan spreadsheet yang umum tersedia seperti Microsoft Excel.Dengan sedikit usaha Anda harus dapat menggunakan spreadsheet untuk melakukan perhitungan yang diilustrasikan sebelumnya pada Tabel 4.3 dan4.4.

Ringkasan
Reliabilitas mengacu pada konsistensi skor tes. Jika tes atau prosedur penilaian lainnya menghasilkan pengukuran yang konsisten, skornya dapat dipercaya. Mengapa reliabilitas begitu penting? Sebagaimana yang telah kita tekankan, penilaian berguna karena memberikan informasi yang membantu pendidik membuat keputusan yang lebih baik. Namun, reliabilitas (dan validitas) merupakan informasi pokok yang penting.

Bagi kita untuk membuat keputusan yang baik, kita perlu informasi yang dapat dipercaya. Dengan mengestimasi reliabilitas hasil penilaian, kita mendapatkan indikasi seberapa banyak kepercayaan kita dapat ditempatkan di dalamnya. Jika kita memiliki informasi yang sangat reliabel dan valid, kemungkinan besar kita dapat menggunakan informasi tersebut untuk membuat keputusan yang lebih baik. Jika hasil tidak reliabel, informasinya merupakan nilai yang kecil bagi kita.

Kesalahan pengukuran mengurangi reliabilitas pengukuran dan karena itu mengurangi kegunaan pengukuran. Meskipun ada beberapa sumber kesalahan pengukuran, yang utama adalah pengambilan sampel konten dan kesalahan waktu sampling. Kesalahan sampling konten mengurangi kesempurnaan sampling dari domain konten.

Tes yang lebih representatif dari domain konten, mengurangi kesalahan dalam sampling konten yang mengancam reliabilitas tes. Kesalahan waktu sampling merupakan hasil dari perubahan acak pengambil tes atau lingkungan dari waktu ke waktu. Para ahli dalam pengujian dan pengukuran telah mengembangkan metode estimasi kesalahan ini dan sumber lainnya, termasuk pendekatan utama untuk mengestimasi reliabilitas berikut ini:

· Test-retes Releiability melibatkan administrasi pengujian yang sama kepadasekelompok orang pada dua kesempatan yang berbeda. Korelasi antara keduaset nilai adalah tes-tes ulang koefisien reliabilitas dan mencerminkan kesalahankarena waktu sampling

· Alternative-form Reliability melibatkan administrasi bentuk paralel tes untuk Kelompok individu. korelasi antara skor pada dua bentuk adalah koefisien reliabilitas. Jika dua bentuk yang diberikan pada saat yang sama, mencerminkan koefisien reliabilitas kesalahan sampling konten. Jika dua bentuk tes yang diberikan pada waktu yang berbeda, koefisien reliabilitas mencerminkan baik konten dan kesalahan waktu sampling.

· Internal-consistency reliabilitas berasal dari pelaksanaan tes tunggal. Reliabilitas belah dua membagi tes menjadi dua bagian dan menghitung korelasi antara dua bagian tersebut. Perbandingkan kinerja pada dua bagian tes, koefisien alpha dan pendekatan Kuder-Richardson memeriksa konsistensi antara semua item tes individu. Reliabilitas belah dua mencerminkan kesalahan sampling konten sedangkan koefisien alpha dan pendekatan Kuder-Richardson mencerminkan heterogenitas item dan kesalahan sampling konten.

· Inter-rater reliability diperkirakan dengan pelaksanaan tes sekali tetapi memiliki respon dinilai oleh pemeriksa yang berbeda. Dengan membandingkan nilai yang diberikan oleh pemeriksa yang berbeda, kita dapat menentukan pengaruh dari perbedaan penilai atau skornya. Inter-rater reliability penting untuk memeriksa ketika pemberian skor melibatkanpenilaian yang cukup subjektif.

Meskipun koefisien reliabilitas berguna ketika membandingkan reliabilitas darites yang berbeda, standard error pengukuran (SEM) lebih berguna ketika menginterpretasikan skor. SEM adalah suatu indeks jumlah kesalahan dalamskor tes dan digunakan dalam menghitung interval kepercayaan di mana kitadapat menentukan nilai nilai yang benar. Suatu keuntungan dari SEM danpenggunaan interval keyakinan bahwa SEM mengingatkan kita bahwakesalahan pengukuran hadir dalam semua skor dan kita harus berhati-hatiketika menginterpretasikan skor.