Jak lze ověřit kvalitu vytvořeného didaktického testu?
Ukázka z knihy Zdeňka Kalhouse, Otto Obsta a kolektivu Školní didaktika.
I když plánování a konstrukci didaktického testu věnujeme značnou pozornost (postupujeme poučeně a pečlivě), přesto si nemůžeme být nikdy jisti tím, jaké vlastnosti bude nakonec test mít. Relativně definitivní představu o vlastnostech testu můžeme získat až po důkladném vyzkoušení (ověření) testu na vzorku žáků. Toto ověřování se ovšem neprovádí pouze za účelem získání informací o kvalitě vytvořeného testu, nýbrž zejména proto, abychom mohli případné nevhodné vlastnosti testu odstranit, zmírnit nebo korigovat. Jestliže vytváříme didaktický test jen pro vlastní potřebu (nestandardizovaný test), potom zpravidla vystačíme s ověřením testu u těch žáků, které vyučujeme. U nestandardizovaných testů také autor většinou vystačí s pouhým odhadem vlastností testu a nemusí provádět jejich přesné stanovení. U testů standardizovaných se však každý uživatel s přesnými údaji o vlastnostech testu setkává a je proto třeba, aby jim rozuměl a dokázal je správně interpretovat.
Ověřováním vytvořeného didaktického textu můžeme získat informace jednak o vlastnostech z jednotlivých úloh v textu, jednak o vlastnostech testu jako celku (Chráska, 1999).
Jaké vlastnosti by měla mít dobrá testová úloha?
Při posuzování vlastností jednotlivých testových úloh je věnována pozornost zejména tomu, jak dalece jsou vytvořené úlohy pro žáky obtížné a jakou mají tzv. citlivost (Mráz, 1977).
Obtížnost testových úloh
To, jak dalece je testová úloha pro žáky obtížná, je jednou z jejich základních charakteristik. Obtížnost jednotlivých testových úloh můžeme posoudit podle toho, kolik žáků je dokáže správně vyřešit. Při analýze obtížnosti se vypočítává buď hodnota obtížnosti Q a nebo index obtížnosti P.
Hodnota obtížnosti udává procento žáků ve vzorku, kteří danou úlohu zodpověděli nesprávně nebo vynechali. Index obtížnosti je procento žáků ve skupině, kteří danou úlohu zodpověděli správně.
Za velmi obtížné lze pokládat testové úlohy, u nichž hodnota obtížnosti Q je vyšší než 80. Velmi snadné jsou naopak ty úlohy, které vykazují hodnotu obtížnosti Q nižší než 20. Velmi obtížných ani velmi snadných úloh by nemělo být v testu příliš mnoho. Úlohy extrémně obtížné, u nichž se hodnota obtížnosti Q blíží ke 100, jsou nevyhovující a je nutno je z testu vyloučit. Úlohu extrémně snadnou, u níž se hodnota obtížnosti Q blíží k nule, je možno z psychologických důvodů doporučit jako úvodní úlohu v testu. Může totiž přispět k uklidnění žáků a k vytvoření potřebného pocitu jistoty. Zkušenosti ukazují, že nejvhodnější vlastnosti mají testové úlohy s hodnotou obtížnosti kolem Q = 50 (platí pro testy rozlišující).
Citlivost testových úloh
Citlivost úloh bývá často označována také jako rozlišovací hodnota, diskriminační hodnota, rozlišovací ostrost nebo jako rozlišovací schopnost úloh. Vysokou citlivost má taková úloha, kterou řeší s velkým úspěchem žáci, kteří mají celkově lepší vědomosti, zatímco žáci, kteří mají celkově horší vědomosti, v této úloze dosahují výsledků špatných. Citlivost úlohy tedy vyjadřuje, jak dalece daná úloha zvýhodňuje žáky, mající lepší vědomosti, před žáky, kteří mají vědomosti horší. K rozlišení žáků na žáky »s lepšími vědomostmi« a na žáky »s horšími vědomostmi« se většinou používá celkových výsledků ověřovaného didaktického testu.
Citlivost úlohy se dá exaktně posoudit pomocí výpočtu některého z koeficientů citlivosti, kterých byla navržena celá řada. Všechny tyto koeficienty mohou nabývat hodnot od – 1 přes nulu do + 1, přičemž platí, že čím vyšší hodnotu koeficient má, tím lépe úloha rozlišuje mezi žáky s lepšími vědomostmi a mezi žáky s horšími vědomostmi. Pokud koeficient citlivosti dosahuje hodnoty 0, znamená to, že úloha vůbec nerozlišuje mezi oběma skupinami žáků (žáci s lepšími i žáci s horšími vědomostmi jsou v této úloze stejně úspěšní). Záporné hodnoty koeficientu citlivosti vypovídají o tom, že úloha zvýhodňuje žáky, kteří mají v testu celkově horší výsledky. Kladné hodnoty koeficientu citlivosti naopak vypovídají o tom, že v úloze dosahují lepších výsledků žáci, kteří mají v testu lepší celkové výsledky (úloha zvýhodňuje žáky, kteří mají lepší vědomosti). Za přijatelné jsou většinou považovány hodnoty koeficientu citlivosti větší než +0,20. Podrobnější poučení o metodách výpočtů koeficientů citlivosti nalezne čtenář např. v práci Chrásky (1998).
Velice nízkých (případně záporných) hodnot nabývá koeficient citlivosti např. v úlohách, které jsou příliš komplikovaně formulovány a kdy obě skupiny žáků (skupina »lepších« a skupina »horších«) mohou volit rozdílné strategie řešení. Zatímco žáci »lepší« se snaží k řešení komplikované úlohy dojít složitými úvahami, při kterých se snadno dopouštějí chyb, žáci »horší« se složitými úvahami příliš neznepokojují a odpověď s větším či menším štěstím hádají. Nízké hodnoty koeficientu citlivosti se objevují také u některých velmi obtížných úloh s výběrovými odpověďmi nebo u úloh, kde se zkouší formálně zvládnuté učivo.
Při posuzování citlivosti úloh u nestandardizovaných didaktických testů není třeba vypočítávat koeficienty citlivosti. Postačí, když si všimneme, jak v jednotlivých testových úlohách odpovídali žáci celkově »lepší« a žáci celkově »horší«. Jestliže zjistíme, že v některé úloze dosáhli lepších výsledků spíše »horší« žáci, znamená to, že s úlohou není něco v pořádku a že zřejmě má malou (nebo zápornou) citlivost.
Jaké vlastnosti by měl mít dobrý didaktický test jako celek?
Při posuzování testu jako celku se zpravidla věnuje pozornost jeho validitě a reliabilitě (Mráz, 1977).
Validita didaktického testu
Test je validní tehdy, pokud se jím zkouší skutečně to, co má být zkoušeno. U testů studijních výsledků zkoumáme, jak dalece se shoduje obsah testu s cílem a obsahem vyučování. V těchto případech nám jde především o tzv. obsahovou validitu testu. Obsah úloh didaktického testu by měl být v těchto případech reprezentativním vzorkem zkoušeného učiva. Pro testy výsledků výuky jsou proto kritériem validity příslušná kurikula vyučovacích předmětů.
Při posuzování validity u testů studijních předpokladů je situace podstatně složitější, protože je nutno zvážit, ze kterých vědomostí nebo dovedností je možno usuzovat na budoucí úspěšnost ve studiu. [Testy studijních předpokladů] by měly mít především tzv. [predikční validitu], tj. schopnost předpovídat budoucí úspěšnost v učení.
Posouzení stupně validity testu se v praxi většinou ponechává na příslušném odborníkovi (ještě lépe na skupině odborníků). Jen výjimečně je možno posoudit validitu nově vytvořeného testu tak, že se srovnávají v něm dosažené výsledky s výsledky nějakého jiného testu, jehož validita je nesporná.
Reliabilita didaktického testu
Aby byl didaktický test reliabilní, je třeba, aby byl spolehlivý. Spolehlivost spočívá v tom, že za týchž podmínek by měl poskytovat stejné (velmi podobné) výsledky. Další podmínkou dobré reliability je přesnost testu. Didaktický test je přesný tehdy, jestliže při jeho použití nedochází k velkým chybám měření. Oba požadavky, tj. spolehlivost a přesnost, zahrnujeme pod společný pojem reliabilita.
K exaktnímu posouzení míry reliability didaktického testu slouží koeficient reliability. Tento koeficient v praxi nabývá hodnot od 0 (pro případ naprosté nespolehlivosti a nepřesnosti) až po hodnoty blízké 1 (pro případ dokonalé spolehlivosti a přesnosti didaktického testu).
Pro individuální pedagogickou diagnostiku se většinou požaduje koeficient reliability minimálně 0,80. Reliabilita testu je odvislá od kvality testových úloh, z nichž je vytvořen, a závisí také podstatně na jejich počtu. Obecně platí, že čím více úloh test obsahuje, tím má větší reliabilitu. U testů s malým počtem úloh (např. 10 nebo méně) koeficient reliability zpravidla dosahuje maximálně hodnoty kolem 0,60. Z uvedeného vyplývá, že dobrý didaktický test by měl vždy obsahovat dostatečný počet úloh (za spodní hranici lze ve většině případů považovat zhruba 10 úloh).
Reliabilita didaktického testu je velmi důležitým ukazatelem jeho technické kvality. Čím nižší je reliabilita testu, tím skeptičtěji je nutno výsledky testování posuzovat.
Aby didaktický test byl dostatečně validní, musí mít vysokou reliabilitu. Vysoká reliabilita didaktického testu však ještě není zárukou toho, že test bude validní. Test může spolehlivě a přesně (reliabilně) měřit určité vědomosti nebo dovednosti i tehdy, jestliže měří něco úplně jiného, než měřit má. Např. budeme-li u žáků základní školy didaktickým testem z matematiky zkoušet, jak umí řešit kvadratické rovnice, může být toto testování sice vysoce reliabilní, ale jeho validita bude velmi nízká (test zkouší jiné učivo než to, které mají žáci ovládat). Koeficient reliability je možné vypočítat několika způsoby.
Podrobnější informace nalezne čtenář např. v práci Chrásky (1998).
Jaké jsou možnosti využívání didaktických testů v praxi?
Z výsledků didaktického testu by měl učitel získat co nejvíce informací pro hodnocení žáků, ale také (a to zejména) pro optimalizaci svého dalšího pedagogického působení.
Prakticky po každém použití testu by měl následovat tzv. diagnostický rozbor výsledků žáků. Při tomto rozboru si učitel všímá především chyb, kterých se žáci dopustili, a hledá jejich pravděpodobné příčiny. Forma diagnostického rozboru výsledků testu závisí na druhu použitého didaktického testu, zejména na druhu použitých testových úloh. Doporučené postupy tohoto rozboru lze nalézt v odborné literatuře (např. Chráska, 1998).
Dosažené výsledky testování třídy je výhodné znázornit také graficky, pomocí sloupkového diagramu zvaného histogram četností. Z histogramu četností lze získat představu o rozložení výsledků ve třídě, tzn. informaci o tom, kolik žáků ze třídy v testu dosáhlo velmi dobrých výsledků, výsledků dobrých, průměrných atd. U histogramu četností se na vodorovnou osu nanášejí dosažené výsledky testování (počty bodů) a na svislou osu počty žáků, kteří daného výsledku dosáhli (četnosti). Podrobnosti tohoto postupu lze nalézt opět v literatuře (např. Chráska, 1998).
Klasifikace výsledků testu
Mnoho nejasností je mezi učiteli v otázce převodu bodového hodnocení na klasifikační stupně. Je to vcelku pochopitelné, když uvážíme, že ani v teorii nebyl tento problém doposud spolehlivě a jednoznačně rozřešen. Uvedeme některé přístupy, které se v této oblasti nejčastěji uplatňují (Chráska, 1999).
Někteří učitelé přistupují k převodu bodových výsledků na klasifikační stupně zcela subjektivně a sami víceméně intuitivně určují, kolik bodů je potřeba na dosažení určité známky. Pokud se jedná o učitele s velkou pedagogickou a odbornou zkušeností, většinou je toto hodnocení vcelku odpovídající.
Někteří odborníci doporučují jako optimální řešení otázky převodu bodového hodnocení na klasifikační stupně normativní přiřazování klasifikačních stupňů, které se provádí na základě posudku skupiny odborníků. Tato technika je ve školní praxi dobře použitelná. Vytvořený didaktický test necháme posoudit co možná největšímu počtu učitelů – odborníků v daném předmětu – s tím, že je požádáme o návrh klasifikační stupnice. Z jednotlivých posudků možno určit průměr, čímž se eliminují extrémní názory.
Někdy se při převodu bodových výsledků na klasifikační stupně vychází z procenta správných odpovědí, kterého žák v testu dosáhl. Jeden z možných postupů (Sedláčková, 1993) je ten, že pokud žák odpoví v testu:
· 91–100 % úloh správně, klasifikujeme jej stupněm výborně;
· 81–90 % úloh správně, klasifikujeme jej stupněm chvalitebně;
· 71–90 % úloh správně, klasifikujeme jej stupněm dobře;
· 61–70 % úloh správně, klasifikujeme jej stupněm dostatečně;
· 0–60 % úloh správně, klasifikujeme jej stupněm nedostatečně.
Učitelé touto metodou často postupují při hodnocení písemných prací (např. z matematiky). Zadávají např. celkem 4 rozsáhlejší úlohy a hodnotí takto: všechny vyřešené úlohy – výborně, tři vyřešené úlohy – chvalitebně, dvě vyřešené úlohy – dobře, jedna vyřešená úloha – dostatečně, žádná vyřešená úloha – nedostatečně.
Užívání této metody převodu bodových výsledků na klasifikační stupně je v některých případech diskutabilní, protože nepřihlíží ke skutečnosti, že úlohy v testu mohou mít rozdílnou obtížnost. Odpoví-li např. žák 50 % úloh správně v testu s velmi obtížnými úlohami, může to znamenat dobrý výkon, zatímco stejný výsledek v testu velmi snadném může být výkonem velmi slabým. Tento způsob klasifikace může vcelku vyhovovat u testů, které neobsahují extrémně snadné ani extrémně obtížné úlohy.
Hodnocení výkonu žáka podle procenta správně vyřešených úloh se důsledně používá u testů ověřujících (kriteriálních). Tyto testy jsou konstruovány tak, aby zkoušely jen nezbytné učivo a výkon žáků se hodnotí většinou pouze dichotomicky, tj. vyhověl – nevyhověl. Aby žák v testu vyhověl, musí zodpovědět správně zpravidla 80–90 % všech úloh.
Bodové výsledky žáků v testu můžeme klasifikovat také na základě normálního rozdělení četností. U tohoto postupu se vychází z předpokladu, že výkony dosažené v testu u dostatečně velké skupiny žáků odpovídají tzv. Gaussově křivce. To znamená, že nejvíce je vždy výkonů průměrných a na obě strany od průměru potom četností symetricky ubývá. Jestliže klasifikujeme ve shodě s touto zákonitostí, potom nejvíce žáků klasifikujeme stupněm 3, poněkud méně žáků stupněm 2 a 4 a nejméně žáků stupněm 1 a 5. Mezi jednotlivými autory není shoda v tom, kolik procent žáků by mělo být jednotlivými stupni klasifikováno. Všechny návrhy se však shodují v tom, že rozdělení jsou symetrická kolem stupně 3 a tento klasifikační stupeň má také největší četnost. Jedno z nejčastěji doporučovaných rozdělení je např.
· výborný (1) – 7 % nejlepších žáků,
· chvalitebný (2) – 24 % žáků,
· dobrý (3) – 38 % žáků,
· dostatečný (4) – 24 % žáků,
· nedostatečný (5) 7 % nejhorších žáků.
Jestliže se učitel rozhodne pro klasifikaci podle normálního rozdělení, může k tomu s výhodou používat tzv. percentilové hodnoty. Podrobnosti uvádí např. práce Chrásky (1998).
Některé standardizované testy vyjadřují výkon žáků přímo pomocí klasifikačních stupňů, jiné ho vyjadřují pomocí různých druhů standardních škál, např. percentilové škály, C-škály, T-škály apod. Poučení o těchto otázkách nalezne čtenář např. v citované práci.
___________________________
Ukázka z knihy Z. Kalhouse, O. Obsta a kol. školní didaktika. Vývoj didaktiky ve 20. století. Žák a učitel v sekundární škole, učivo, škola a komunita. Základní nástroje učitele. Výuka: příprava – realizace – hodnocení – řešení problémů
Učebnice širokého týmu našich předních didaktiků pokrývá všechny základní aspekty vzdělávání v dnešní škole se zvláštním zřetelem k sekundární škole (2. stupeň základních škol a všechny typy středních škol). Kromě teoretických koncepcí obsahuje velké množství praktických nástrojů pro každodenní činnost učitelů v praxi.
Recenzi knihy najdete ZDE. Další ukázku ZDE.
Knihu právě dotisklo nakladatelství Portál, stojí 497 Kč a můžete si ji objednat na adrese:
Zásilkové knihkupectví Agentury STROM, e-mail: knihy@ucitelske-listy.cz, tel./fax: 257 940 236, Skype: agentura.strom, Dolomitová 8, 159 00 Praha 5
Kompletní nabídku knih našeho zásilkového knihkupectví si můžete stáhnout v komprimované formě ZDE.
___________________________
OBSAH KNIHY
1 Úvod: Didaktika jako věda a jako nástroj učitele
1.1 Je vůbec didaktika k něčemu?
1.2 Dvě pojetí vzdělávání: Komenský a Dewey
1.3 Vývoj didaktiky ve dvacátém století
1.4 Didaktika jako exaktní, anebo humanitní obor?
1.5 Didaktika preskriptivní, deskriptivní, anebo normativní?
1.6 Klasifikace teorií v didaktice
1.7 Teorie učení – východisko didaktických teorií
1.8 Konstruktivismus v současné didaktice
Závěr
Případová studie: Mýty, dogmata a empirické argumenty v didaktice
Otázky a úkoly
Klíčová slova
ČÁST I
Činitele výuky
2 Žák sekundární školy
2.1 Dospívání jako biologická fáze a sociální konstrukt
2.2 Vývoj inteligence v období dospívání
2.3 Identita a učení
2.4 Socioekonomická diferenciace žáků
2.5 Nadaný žák ve výuce
2.6 Handicapovaný žák ve výuce
2.7 Žák jiného etnika a žák s jiným mateřským jazykem ve výuce
Závěr
Případová studie
Otázky a úkoly
Klíčová slova
3 Učitel ve výuce
3.1 Učitel jako expert
3.2 Kompetence učitele
3.3 Učitel jako pracovník pomáhajících profesí
3.4 Rozhodování v pedagogické praxi a jeho problémy
3.5 Sebereflexe a sebezdokonalování v pedagogické činnosti učitele
3.6 Učitelovo pojetí výuky
3.7 Vyhasínání (burnout) a jeho prevence
3.8 Standardy výkonu učitelské profese
Závěr
Případová studie
Otázky a úkoly
Klíčová slova
4 Učivo
4.1 Vzdělání
4.2 Učivo a jeho struktura
4.3 Zprostředkující a vstřícný přístup k učivu
4.4 Kurikulum
4.5 Konkretizace učiva v pedagogických dokumentech
4.6 Didaktická analýza učiva
4.7 Učebnice
Závěr
Otázky a úkoly
Případová studie
Případová studie – kurikulum očima výzkumu TIMSS
Klíčová slova
5 Sekundární škola: citlivé místo vzdělávacího systému
5.1 Škola a společnost
5.2 Specifika situace sekundární školy
5.3 Svět jednotlivé školy
Závěr
Otázky a úkoly
Klíčová slova
6 Mimoškolní prostředí – rodina, komunita, společnost a kultura
6.1 Situované a autentické učení
6.2 Rodina žáka
6.3 Region školy
6.4 Prostředky masové komunikace
Závěr
Případová studie – Sociokulturní proud v didaktice: Kognitivní učňovství
Otázky a úkoly
Klíčová slova
ČÁST II
Teoretické základy vyučování a učení
7 Pedagogickopsychologická diagnostika a evaluace ve školní didaktice
7.1 Diagnostika vnitřních podmínek výuky
7.2 Hodnocení vzdělávacích výsledků žáků
7.3 Evaluace klimatu třídy
7.4 Evaluace učebnic
Případová studie
Otázky a úkoly
Klíčová slova
8 Pedagogická komunikace a interakce ve výuce
8.1 Verbální komunikace
8.2 Neverbální komunikace
8.3 Komunikace činem
Případová studie
Otázky a úkoly
Klíčová slova
9 Didaktické zásady
9.1 Co jsou didaktické zásady
9.2 Přehled didaktických zásad
Otázky a úkoly
Klíčová slova
10 Výukové cíle a jejich taxonom
10.1 Požadavky na výukové cíle
10.2 Taxonomie výukových cílů
10.3 Vymezování výukových cílů
Závěr
Otázky a úkoly
Klíčová slova
11 Organizační formy výuky
11.1 Individuální výuka
11.2 Hromadná a frontální výuka
11.3 Individualizovaná výuka
11.4 Projektová výuka
11.5 Diferencovaná výuka
11.6 Skupinová a kooperativní výuka
11.7 Týmová výuka
11.8 Otevřené vyučování
Závěr
Otázky a úkoly
Klíčová slova
12 Výukové metody
12.1 Klasifikace metod výuky
12.2 Komplexní klasifikace základních skupin metod výuky (Maňák, 1990)
12.4 Stručná charakteristika některých metod výuky
Volba metody výuky
Otázky a úkoly
Klíčová slova
13 Učební úlohy ve výuce
13.1 Definice a role učebních úloh ve výuce
13.2 Z teorie učebních úloh
13.3 Posuzování a projektování souborů učebních úloh
Případová studie
Otázky a úkoly
Klíčová slova
14 Materiální didaktické prostředky
14.1 Klasifikace materiálních didaktických prostředků
14.2 Výpočetní technika ve výuce
Otázky a úkoly
Klíčová slova
ČÁST III
Projektování, realizace a evaluace výuky
15 Význam jednotlivých faktorů ve výuce
15.1 Školou ovlivnitelné faktory výuky
15.2 Vzájemné vztahy mezi faktory výuky
Závěr
Klíčová slova
16 Projektování výuky
16.1 Proč projektovat (plánovat) výuku?
16.2 Kroky při plánování výuky
16.3 Příprava na vyučování
Závěr
Případová studie
Otázky a úkoly
Klíčová slova
17 Realizace výuky
17.1 Motivace
17.2 Vedení žáků v průběhu výuky
17.3 Komunikace ve výuce, učitelova řeč
Závěr
Případová studie
Klíčová slova
18 Kázeň ve výuce
18.1 Příčiny nekázně ve škole
18.2 Postupy pro budování ukázněného prostředí
18.3 Šikana
18.4 Řešení konfliktů a situační myšlení
18.5 Klima třídy
18.6 Autorita učitele
Závěr
Případová studie
Otázky a úkoly
Klíčová slova
19 Hodnocení výsledků výuky
19.1 Co rozumíme hodnocením a jaké jsou jeho funkce
19.2 Typy hodnocení
19.3 Aktuální problémy školního hodnocení
Závěr
Případová studie
Otázky a úkoly
Klíčová slova
20 Závěr
Co budou potřebovat mladí lidé ve 21. století?
Kompetence pro Evropu
|