Učitelské listy

ukázka - 3.6.2007

Jak lze ověřit kvalitu vytvořeného didaktického testu?

Ukázka z knihy Zdeňka Kalhouse, Otto Obsta a kolektivu Školní didaktika.

I když plánování a konstrukci didaktického testu věnujeme značnou pozornost (postupujeme poučeně a pečlivě), přesto si nemůžeme být nikdy jisti tím, jaké vlastnosti bude nakonec test mít. Relativně definitivní představu o vlastnostech testu můžeme získat až po důkladném vyzkoušení (ověření) testu na vzorku žáků. Toto ověřování se ovšem neprovádí pouze za účelem získání informací o kvalitě vytvořeného testu, nýbrž zejména proto, abychom mohli případné nevhodné vlastnosti testu odstranit, zmírnit nebo korigovat. Jestliže vytváříme didaktický test jen pro vlastní potřebu (nestandardizovaný test), potom zpravidla vystačíme s ověřením testu u těch žáků, které vyučujeme. U nestandardizovaných testů také autor většinou vystačí s pouhým odhadem vlastností testu a nemusí provádět jejich přesné stanovení. U testů standardizovaných se však každý uživatel s přesnými údaji o vlastnostech testu setkává a je proto třeba, aby jim rozuměl a dokázal je správně interpretovat.

Ověřováním vytvořeného didaktického textu můžeme získat informace jednak o vlastnostech z jednotlivých úloh v textu, jednak o vlastnostech testu jako celku (Chráska, 1999).

Jaké vlastnosti by měla mít dobrá testová úloha?

Při posuzování vlastností jednotlivých testových úloh je věnována pozornost zejména tomu, jak dalece jsou vytvořené úlohy pro žáky obtížné a jakou mají tzv. citlivost (Mráz, 1977).

Obtížnost testových úloh

To, jak dalece je testová úloha pro žáky obtížná, je jednou z jejich základních charakteristik. Obtížnost jednotlivých testových úloh můžeme posoudit podle toho, kolik žáků je dokáže správně vyřešit. Při analýze obtížnosti se vypočítává buď hodnota obtížnosti Q a nebo index obtížnosti P.

Hodnota obtížnosti udává procento žáků ve vzorku, kteří danou úlohu zodpověděli nesprávně nebo vynechali. Index obtížnosti je procento žáků ve skupině, kteří danou úlohu zodpověděli správně.

Za velmi obtížné lze pokládat testové úlohy, u nichž hodnota obtížnosti Q je vyšší než 80. Velmi snadné jsou naopak ty úlohy, které vykazují hodnotu obtížnosti Q nižší než 20. Velmi obtížných ani velmi snadných úloh by nemělo být v testu příliš mnoho. Úlohy extrémně obtížné, u nichž se hodnota obtížnosti Q blíží ke 100, jsou nevyhovující a je nutno je z testu vyloučit. Úlohu extrémně snadnou, u níž se hodnota obtížnosti Q blíží k nule, je možno z psychologických důvodů doporučit jako úvodní úlohu v testu. Může totiž přispět k uklidnění žáků a k vytvoření potřebného pocitu jistoty. Zkušenosti ukazují, že nejvhodnější vlastnosti mají testové úlohy s hodnotou obtížnosti kolem Q = 50 (platí pro testy rozlišující).

Citlivost testových úloh

Citlivost úloh bývá často označována také jako rozlišovací hodnota, diskriminační hodnota, rozlišovací ostrost nebo jako rozlišovací schopnost úloh. Vysokou citlivost má taková úloha, kterou řeší s velkým úspěchem žáci, kteří mají celkově lepší vědomosti, zatímco žáci, kteří mají celkově horší vědomosti, v této úloze dosahují výsledků špatných. Citlivost úlohy tedy vyjadřuje, jak dalece daná úloha zvýhodňuje žáky, mající lepší vědomosti, před žáky, kteří mají vědomosti horší. K rozlišení žáků na žáky »s lepšími vědomostmi« a na žáky »s horšími vědomostmi« se většinou používá celkových výsledků ověřovaného didaktického testu.

Citlivost úlohy se dá exaktně posoudit pomocí výpočtu některého z koeficientů citlivosti, kterých byla navržena celá řada. Všechny tyto koeficienty mohou nabývat hodnot od – 1 přes nulu do + 1, přičemž platí, že čím vyšší hodnotu koeficient má, tím lépe úloha rozlišuje mezi žáky s lepšími vědomostmi a mezi žáky s horšími vědomostmi. Pokud koeficient citlivosti dosahuje hodnoty 0, znamená to, že úloha vůbec nerozlišuje mezi oběma skupinami žáků (žáci s lepšími i žáci s horšími vědomostmi jsou v této úloze stejně úspěšní). Záporné hodnoty koeficientu citlivosti vypovídají o tom, že úloha zvýhodňuje žáky, kteří mají v testu celkově horší výsledky. Kladné hodnoty koeficientu citlivosti naopak vypovídají o tom, že v úloze dosahují lepších výsledků žáci, kteří mají v testu lepší celkové výsledky (úloha zvýhodňuje žáky, kteří mají lepší vědomosti). Za přijatelné jsou většinou považovány hodnoty koeficientu citlivosti větší než +0,20. Podrobnější poučení o metodách výpočtů koeficientů citlivosti nalezne čtenář např. v práci Chrásky (1998).

Velice nízkých (případně záporných) hodnot nabývá koeficient citlivosti např. v úlohách, které jsou příliš komplikovaně formulovány a kdy obě skupiny žáků (skupina »lepších« a skupina »horších«) mohou volit rozdílné strategie řešení. Zatímco žáci »lepší« se snaží k řešení komplikované úlohy dojít složitými úvahami, při kterých se snadno dopouštějí chyb, žáci »horší« se složitými úvahami příliš neznepokojují a odpověď s větším či menším štěstím hádají. Nízké hodnoty koeficientu citlivosti se objevují také u některých velmi obtížných úloh s výběrovými odpověďmi nebo u úloh, kde se zkouší formálně zvládnuté učivo.

Při posuzování citlivosti úloh u nestandardizovaných didaktických testů není třeba vypočítávat koeficienty citlivosti. Postačí, když si všimneme, jak v jednotlivých testových úlohách odpovídali žáci celkově »lepší« a žáci celkově »horší«. Jestliže zjistíme, že v některé úloze dosáhli lepších výsledků spíše »horší« žáci, znamená to, že s úlohou není něco v pořádku a že zřejmě má malou (nebo zápornou) citlivost.

Jaké vlastnosti by měl mít dobrý didaktický test jako celek?

Při posuzování testu jako celku se zpravidla věnuje pozornost jeho validitě a reliabilitě (Mráz, 1977).

Validita didaktického testu

Test je validní tehdy, pokud se jím zkouší skutečně to, co má být zkoušeno. U testů studijních výsledků zkoumáme, jak dalece se shoduje obsah testu s cílem a obsahem vyučování. V těchto případech nám jde především o tzv. obsahovou validitu testu. Obsah úloh didaktického testu by měl být v těchto případech reprezentativním vzorkem zkoušeného učiva. Pro testy výsledků výuky jsou proto kritériem validity příslušná kurikula vyučovacích předmětů.

Při posuzování validity u testů studijních předpokladů je situace podstatně složitější, protože je nutno zvážit, ze kterých vědomostí nebo dovedností je možno usuzovat na budoucí úspěšnost ve studiu. [Testy studijních předpokladů] by měly mít především tzv. [predikční validitu], tj. schopnost předpovídat budoucí úspěšnost v učení.

Posouzení stupně validity testu se v praxi většinou ponechává na příslušném odborníkovi (ještě lépe na skupině odborníků). Jen výjimečně je možno posoudit validitu nově vytvořeného testu tak, že se srovnávají v něm dosažené výsledky s výsledky nějakého jiného testu, jehož validita je nesporná.

Reliabilita didaktického testu

Aby byl didaktický test reliabilní, je třeba, aby byl spolehlivý. Spolehlivost spočívá v tom, že za týchž podmínek by měl poskytovat stejné (velmi podobné) výsledky. Další podmínkou dobré reliability je přesnost testu. Didaktický test je přesný tehdy, jestliže při jeho použití nedochází k velkým chybám měření. Oba požadavky, tj. spolehlivost a přesnost, zahrnujeme pod společný pojem reliabilita.

K exaktnímu posouzení míry reliability didaktického testu slouží koeficient reliability. Tento koeficient v praxi nabývá hodnot od 0 (pro případ naprosté nespolehlivosti a nepřesnosti) až po hodnoty blízké 1 (pro případ dokonalé spolehlivosti a přesnosti didaktického testu).

Pro individuální pedagogickou diagnostiku se většinou požaduje koeficient reliability minimálně 0,80. Reliabilita testu je odvislá od kvality testových úloh, z nichž je vytvořen, a závisí také podstatně na jejich počtu. Obecně platí, že čím více úloh test obsahuje, tím má větší reliabilitu. U testů s malým počtem úloh (např. 10 nebo méně) koeficient reliability zpravidla dosahuje maximálně hodnoty kolem 0,60. Z uvedeného vyplývá, že dobrý didaktický test by měl vždy obsahovat dostatečný počet úloh (za spodní hranici lze ve většině případů považovat zhruba 10 úloh).

Reliabilita didaktického testu je velmi důležitým ukazatelem jeho technické kvality. Čím nižší je reliabilita testu, tím skeptičtěji je nutno výsledky testování posuzovat.

Aby didaktický test byl dostatečně validní, musí mít vysokou reliabilitu. Vysoká reliabilita didaktického testu však ještě není zárukou toho, že test bude validní. Test může spolehlivě a přesně (reliabilně) měřit určité vědomosti nebo dovednosti i tehdy, jestliže měří něco úplně jiného, než měřit má. Např. budeme-li u žáků základní školy didaktickým testem z matematiky zkoušet, jak umí řešit kvadratické rovnice, může být toto testování sice vysoce reliabilní, ale jeho validita bude velmi nízká (test zkouší jiné učivo než to, které mají žáci ovládat). Koeficient reliability je možné vypočítat několika způsoby.

Podrobnější informace nalezne čtenář např. v práci Chrásky (1998).

Jaké jsou možnosti využívání didaktických testů v praxi?

Z výsledků didaktického testu by měl učitel získat co nejvíce informací pro hodnocení žáků, ale také (a to zejména) pro optimalizaci svého dalšího pedagogického působení.

Prakticky po každém použití testu by měl následovat tzv. diagnostický rozbor výsledků žáků. Při tomto rozboru si učitel všímá především chyb, kterých se žáci dopustili, a hledá jejich pravděpodobné příčiny. Forma diagnostického rozboru výsledků testu závisí na druhu použitého didaktického testu, zejména na druhu použitých testových úloh. Doporučené postupy tohoto rozboru lze nalézt v odborné literatuře (např. Chráska, 1998).

Dosažené výsledky testování třídy je výhodné znázornit také graficky, pomocí sloupkového diagramu zvaného histogram četností. Z histogramu četností lze získat představu o rozložení výsledků ve třídě, tzn. informaci o tom, kolik žáků ze třídy v testu dosáhlo velmi dobrých výsledků, výsledků dobrých, průměrných atd. U histogramu četností se na vodorovnou osu nanášejí dosažené výsledky testování (počty bodů) a na svislou osu počty žáků, kteří daného výsledku dosáhli (četnosti). Podrobnosti tohoto postupu lze nalézt opět v literatuře (např. Chráska, 1998).

Klasifikace výsledků testu

Mnoho nejasností je mezi učiteli v otázce převodu bodového hodnocení na klasifikační stupně. Je to vcelku pochopitelné, když uvážíme, že ani v teorii nebyl tento problém doposud spolehlivě a jednoznačně rozřešen. Uvedeme některé přístupy, které se v této oblasti nejčastěji uplatňují (Chráska, 1999).

a) Intuitivní přístup ke klasifikaci

Někteří učitelé přistupují k převodu bodových výsledků na klasifikační stupně zcela subjektivně a sami víceméně intuitivně určují, kolik bodů je potřeba na dosažení určité známky. Pokud se jedná o učitele s velkou pedagogickou a odbornou zkušeností, většinou je toto hodnocení vcelku odpovídající.

Někteří odborníci doporučují jako optimální řešení otázky převodu bodového hodnocení na klasifikační stupně normativní přiřazování klasifikačních stupňů, které se provádí na základě posudku skupiny odborníků. Tato technika je ve školní praxi dobře použitelná. Vytvořený didaktický test necháme posoudit co možná největšímu počtu učitelů – odborníků v daném předmětu – s tím, že je požádáme o návrh klasifikační stupnice. Z jednotlivých posudků možno určit průměr, čímž se eliminují extrémní názory.

b) Klasifikace na základě procenta správných odpovědí

Někdy se při převodu bodových výsledků na klasifikační stupně vychází z procenta správných odpovědí, kterého žák v testu dosáhl. Jeden z možných postupů (Sedláčková, 1993) je ten, že pokud žák odpoví v testu:

· 91–100 % úloh správně, klasifikujeme jej stupněm výborně;

· 81–90 % úloh správně, klasifikujeme jej stupněm chvalitebně;

· 71–90 % úloh správně, klasifikujeme jej stupněm dobře;

· 61–70 % úloh správně, klasifikujeme jej stupněm dostatečně;

· 0–60 % úloh správně, klasifikujeme jej stupněm nedostatečně.

Učitelé touto metodou často postupují při hodnocení písemných prací (např. z matematiky). Zadávají např. celkem 4 rozsáhlejší úlohy a hodnotí takto: všechny vyřešené úlohy – výborně, tři vyřešené úlohy – chvalitebně, dvě vyřešené úlohy – dobře, jedna vyřešená úloha – dostatečně, žádná vyřešená úloha – nedostatečně.

Užívání této metody převodu bodových výsledků na klasifikační stupně je v některých případech diskutabilní, protože nepřihlíží ke skutečnosti, že úlohy v testu mohou mít rozdílnou obtížnost. Odpoví-li např. žák 50 % úloh správně v testu s velmi obtížnými úlohami, může to znamenat dobrý výkon, zatímco stejný výsledek v testu velmi snadném může být výkonem velmi slabým. Tento způsob klasifikace může vcelku vyhovovat u testů, které neobsahují extrémně snadné ani extrémně obtížné úlohy.

Hodnocení výkonu žáka podle procenta správně vyřešených úloh se důsledně používá u testů ověřujících (kriteriálních). Tyto testy jsou konstruovány tak, aby zkoušely jen nezbytné učivo a výkon žáků se hodnotí většinou pouze dichotomicky, tj. vyhověl – nevyhověl. Aby žák v testu vyhověl, musí zodpovědět správně zpravidla 80–90 % všech úloh.

c) Klasifikace na základě normálního rozdělení

Bodové výsledky žáků v testu můžeme klasifikovat také na základě normálního rozdělení četností. U tohoto postupu se vychází z předpokladu, že výkony dosažené v testu u dostatečně velké skupiny žáků odpovídají tzv. Gaussově křivce. To znamená, že nejvíce je vždy výkonů průměrných a na obě strany od průměru potom četností symetricky ubývá. Jestliže klasifikujeme ve shodě s touto zákonitostí, potom nejvíce žáků klasifikujeme stupněm 3, poněkud méně žáků stupněm 2 a 4 a nejméně žáků stupněm 1 a 5. Mezi jednotlivými autory není shoda v tom, kolik procent žáků by mělo být jednotlivými stupni klasifikováno. Všechny návrhy se však shodují v tom, že rozdělení jsou symetrická kolem stupně 3 a tento klasifikační stupeň má také největší četnost. Jedno z nejčastěji doporučovaných rozdělení je např.

· výborný (1) – 7 % nejlepších žáků,

· chvalitebný (2) – 24 % žáků,

· dobrý (3) – 38 % žáků,

· dostatečný (4) – 24 % žáků,

· nedostatečný (5) 7 % nejhorších žáků.

Jestliže se učitel rozhodne pro klasifikaci podle normálního rozdělení, může k tomu s výhodou používat tzv. percentilové hodnoty. Podrobnosti uvádí např. práce Chrásky (1998).

Některé standardizované testy vyjadřují výkon žáků přímo pomocí klasifikačních stupňů, jiné ho vyjadřují pomocí různých druhů standardních škál, např. percentilové škály, C-škály, T-škály apod. Poučení o těchto otázkách nalezne čtenář např. v citované práci.

___________________________

Ukázka z knihy Z. Kalhouse, O. Obsta a kol. školní didaktika. Vývoj didaktiky ve 20. století. Žák a učitel v sekundární škole, učivo, škola a komunita. Základní nástroje učitele. Výuka: příprava – realizace – hodnocení – řešení problémů

Učebnice širokého týmu našich předních didaktiků pokrývá všechny základní aspekty vzdělávání v dnešní škole se zvláštním zřetelem k sekundární škole (2. stupeň základních škol a všechny typy středních škol). Kromě teoretických koncepcí obsahuje velké množství praktických nástrojů pro každodenní činnost učitelů v praxi.

Recenzi knihy najdete ZDE. Další ukázku ZDE.

Knihu právě dotisklo nakladatelství Portál, stojí 497 Kč a můžete si ji objednat na adrese:

Zásilkové knihkupectví Agentury STROM, e-mail: knihy@ucitelske-listy.cz, tel./fax: 257 940 236, Skype: agentura.strom, Dolomitová 8, 159 00 Praha 5

Kompletní nabídku knih našeho zásilkového knihkupectví si můžete stáhnout v komprimované formě ZDE.

___________________________

OBSAH KNIHY

1 Úvod: Didaktika jako věda a jako nástroj učitele

1.1 Je vůbec didaktika k něčemu?

1.2 Dvě pojetí vzdělávání: Komenský a Dewey

1.3 Vývoj didaktiky ve dvacátém století

1.4 Didaktika jako exaktní, anebo humanitní obor?

1.5 Didaktika preskriptivní, deskriptivní, anebo normativní?

1.6 Klasifikace teorií v didaktice

1.7 Teorie učení – východisko didaktických teorií

1.8 Konstruktivismus v současné didaktice

Závěr

Případová studie: Mýty, dogmata a empirické argumenty v didaktice

Otázky a úkoly

Klíčová slova

ČÁST I

Činitele výuky

2 Žák sekundární školy

2.1 Dospívání jako biologická fáze a sociální konstrukt

2.2 Vývoj inteligence v období dospívání

2.3 Identita a učení

2.4 Socioekonomická diferenciace žáků

2.5 Nadaný žák ve výuce

2.6 Handicapovaný žák ve výuce

2.7 Žák jiného etnika a žák s jiným mateřským jazykem ve výuce

Závěr

Případová studie

Otázky a úkoly

Klíčová slova

3 Učitel ve výuce

3.1 Učitel jako expert

3.2 Kompetence učitele

3.3 Učitel jako pracovník pomáhajících profesí

3.4 Rozhodování v pedagogické praxi a jeho problémy

3.5 Sebereflexe a sebezdokonalování v pedagogické činnosti učitele

3.6 Učitelovo pojetí výuky

3.7 Vyhasínání (burnout) a jeho prevence

3.8 Standardy výkonu učitelské profese

Závěr

Případová studie

Otázky a úkoly

Klíčová slova

4 Učivo

4.1 Vzdělání

4.2 Učivo a jeho struktura

4.3 Zprostředkující a vstřícný přístup k učivu

4.4 Kurikulum

4.5 Konkretizace učiva v pedagogických dokumentech

4.6 Didaktická analýza učiva

4.7 Učebnice

Závěr

Otázky a úkoly

Případová studie

Případová studie – kurikulum očima výzkumu TIMSS

Klíčová slova

5 Sekundární škola: citlivé místo vzdělávacího systému

5.1 Škola a společnost

5.2 Specifika situace sekundární školy

5.3 Svět jednotlivé školy

Závěr

Otázky a úkoly

Klíčová slova

6 Mimoškolní prostředí – rodina, komunita, společnost a kultura

6.1 Situované a autentické učení

6.2 Rodina žáka

6.3 Region školy

6.4 Prostředky masové komunikace

Závěr

Případová studie – Sociokulturní proud v didaktice: Kognitivní učňovství

Otázky a úkoly

Klíčová slova

ČÁST II

Teoretické základy vyučování a učení

7 Pedagogickopsychologická diagnostika a evaluace ve školní didaktice

7.1 Diagnostika vnitřních podmínek výuky

7.2 Hodnocení vzdělávacích výsledků žáků

7.3 Evaluace klimatu třídy

7.4 Evaluace učebnic

Případová studie

Otázky a úkoly

Klíčová slova

8 Pedagogická komunikace a interakce ve výuce

8.1 Verbální komunikace

8.2 Neverbální komunikace

8.3 Komunikace činem

Případová studie

Otázky a úkoly

Klíčová slova

9 Didaktické zásady

9.1 Co jsou didaktické zásady

9.2 Přehled didaktických zásad

Otázky a úkoly

Klíčová slova

10 Výukové cíle a jejich taxonom

10.1 Požadavky na výukové cíle

10.2 Taxonomie výukových cílů

10.3 Vymezování výukových cílů

Závěr

Otázky a úkoly

Klíčová slova

11 Organizační formy výuky

11.1 Individuální výuka

11.2 Hromadná a frontální výuka

11.3 Individualizovaná výuka

11.4 Projektová výuka

11.5 Diferencovaná výuka

11.6 Skupinová a kooperativní výuka

11.7 Týmová výuka

11.8 Otevřené vyučování

Závěr

Otázky a úkoly

Klíčová slova

12 Výukové metody

12.1 Klasifikace metod výuky

12.2 Komplexní klasifikace základních skupin metod výuky (Maňák, 1990)

12.4 Stručná charakteristika některých metod výuky

Volba metody výuky

Otázky a úkoly

Klíčová slova

13 Učební úlohy ve výuce

13.1 Definice a role učebních úloh ve výuce

13.2 Z teorie učebních úloh

13.3 Posuzování a projektování souborů učebních úloh

Případová studie

Otázky a úkoly

Klíčová slova

14 Materiální didaktické prostředky

14.1 Klasifikace materiálních didaktických prostředků

14.2 Výpočetní technika ve výuce

Otázky a úkoly

Klíčová slova

ČÁST III

Projektování, realizace a evaluace výuky

15 Význam jednotlivých faktorů ve výuce

15.1 Školou ovlivnitelné faktory výuky

15.2 Vzájemné vztahy mezi faktory výuky

Závěr

Klíčová slova

16 Projektování výuky

16.1 Proč projektovat (plánovat) výuku?

16.2 Kroky při plánování výuky

16.3 Příprava na vyučování

Závěr

Případová studie

Otázky a úkoly

Klíčová slova

17 Realizace výuky

17.1 Motivace

17.2 Vedení žáků v průběhu výuky

17.3 Komunikace ve výuce, učitelova řeč

Závěr

Případová studie

Klíčová slova

18 Kázeň ve výuce

18.1 Příčiny nekázně ve škole

18.2 Postupy pro budování ukázněného prostředí

18.3 Šikana

18.4 Řešení konfliktů a situační myšlení

18.5 Klima třídy

18.6 Autorita učitele

Závěr

Případová studie

Otázky a úkoly

Klíčová slova

19 Hodnocení výsledků výuky

19.1 Co rozumíme hodnocením a jaké jsou jeho funkce

19.2 Typy hodnocení

19.3 Aktuální problémy školního hodnocení

Závěr

Případová studie

Otázky a úkoly

Klíčová slova

20 Závěr

Co budou potřebovat mladí lidé ve 21. století?

Kompetence pro Evropu

Učitelské listy poskytují svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce Učitelských listů a jsou uveřejňovány jako podnět k dalším diskusím. Rubriku Zaujalo nás připravujeme ve spolupráci s Newton I. T.
	© 2005 Agentura STROM, CP Books, a.s. Technický kontakt: Michal Kwolek Šéfredaktor: Jana Hrubá Všechna práva vyhrazena Tento server dodržuje právní předpisy o ochraně osobních údajů. ISSN 1210-6313