Продължете към съдържанието

Как се правят стандатизираните тестове в САЩ

От Марк Динарски

Новата учебна година е в пълна сила, така че училищата започват да мислят дали учениците са на път да изпълнят академичните стандарти на щата. Те също така вероятно обмислят предварително държавните тестове за постижения, независимите и обективни изпити, които учениците полагат, за да определят дали учат на подходящо ниво.

В същото време някои родители може би се чудят дали да откажат детето си от тези тестове. Като индивидуален акт отказът от тестове е като отказ от годишни медицински прегледи – не дава информация и не прави човека по-здрав. Като колективен акт отказът ерозира това, което може да се научи от резултатите от тестовете. Ако всички родители на ученици с високи резултати в едно училище се откажат, средният резултат на това училище ще бъде по-нисък (и обратното за учениците с ниски резултати). На кого е оказана помощ, не е ясно.

Какъв изпитен тест отразява това, което държавите искат техните ученици да научат – стандартите. Сравняването на средните резултати между училища и области е възможно само защото се прави един и същ тест. При измерването на това, което учениците знаят, тестовете са огромно предимство, предоставяйки важна и надеждна информация, която не може да бъде научена по други начини.

Разбира се, не много хора очакват с нетърпение да се явят на тестове. Но когато погледнем на стената на нашия лекар и видим табела, че тя е сертифицирана от борда, може да си помислим, че сертифицирането е нещо добро. Лекарят премина тест. Или адвокат може да бъде приет в адвокатската колегия, което означава, че е издържал държавния адвокатски изпит — тест. Дипломираният експерт-счетоводител трябва да е преминал набор от тестове. Никой не иска лекар, адвокат или счетоводител, чиито знания са под приетия стандарт.

Същото трябва да важи и в училищата. Така че е полезно да направите крачка назад и да зададете важен въпрос: резултатът от теста отразява ли това, което детето знае? Ако е така, то прави това, за което е предназначено. Резултатите от изпитите често се осмиват като резултат от „преподаване на теста“, но това, от което хората, които използват тази фраза, наистина се оплакват, е наизустното и безжизнено преподаване. Безжизненото преподаване и преподаването на теста са две различни неща. Истинското преподаване на теста е от основно значение за ефективното преподаване, тъй като изпитите отразяват това, което студентите трябва да научат.

Как се създават тестове

За родители, които не са преподаватели, процесът на създаване на стандартизирани тестове може да изглежда като голяма черна кутия. Всъщност това е строг и силно научен процес, който е разработван в продължение на 100 години и отразява изследванията на поколения уважавани учени. Има свое собствено подполе, психометрия, и всяка година университетите дипломират нови докторанти в това подполе.

Можем да мислим за мащабно разработване на тестове, като първо мислим за разработване на тестове в миниатюра. Помислете как един гимназиален учител може да се заеме с проектирането на тест, свързан с, да речем, линейни уравнения в алгебрата.

Учителят предостави определено количество материал по темата под формата на инструкции в класната стая, домашна работа и други задачи като групови дейности или онлайн уроци. Най-важното е, че това, което учителят преподава, трябва да е свързано с набор от стандарти за съдържание, които всяка държава е разработила и обикновено публикува онлайн.

Ето стандарт за алгебра от Common Core : Решете линейни уравнения и неравенства в една променлива, включително уравнения с коефициенти, представени с букви. (Заинтересованите читатели могат да видят други стандарти за алгебра тук и могат да намерят всички стандарти тук .)

За учител този стандарт показва, че нейните ученици трябва да могат да правят това: За уравнението 3x + 4 = 13 определете, че x е равно на 3. Или, ако уравнението е ax + b = c , да можете да решите x е равно на (c – b)/a . В това второ уравнение коефициентите са представени като букви, както изисква стандартът.

За учителя, който иска да знае дали нейните ученици отговарят на стандарта, тя може да реши, че разумен въпрос е да ги помоли да решат 15y + 10 = 40 . Тестовият въпрос включва фина разлика – учениците трябва да решат за y , а не за x – но това все още е уравнение с една променлива. Учителят може малко да повиши нивото на трудност, като помоли учениците да решат y + 3y + 10 = 50 . Учениците трябва да добавят двата члена у , но това все още е уравнение с една променлива.

Тези трудни въпроси трябва да бъдат там

Ако тестът съдържа твърде много трудни въпроси и нито един студент не получи правилни отговори, изпитът има това, което дизайнерите на тестове наричат ​​под. Тъй като всички ученици са отбелязали 0, учителят не може да различи какво знаят учениците му: Подът блокира учителя да разбере кои ученици имат ниско ниво на знания и кои имат високо ниво.

По същия начин, ако учителят направи теста толкова лесен, че много ученици да получат всички отговори правилни, той ще създаде ефект на тавана. Някои ученици имат истински способности над техния резултат, но таванът блокира учителя да го разбере, защото когато всички резултати от тестовете са 100 процента, всички ученици изглеждат еднакво.

За да се избегнат ефектите на тавана и пода, тестовете се нуждаят от въпроси с по-висока и по-ниска степен на трудност. Студентите със силни познания могат да отговорят на по-трудните въпроси; учениците с по-слаби знания не са.

Същият процес на разработка се използва в много по-голям мащаб за оценки като теста PARCC (акронимът означава Партньорство за оценка на готовността за колеж и кариера), Smarter Balanced и теста Texas STAAR , оценката на щата Тексас Академична готовност. Тук стандартите са отправна точка за проектиране на тестовете ( ето визуализация на процеса).

Преподаватели и експерти по тестване разработват банки от въпроси, свързани с тези стандарти, като въпросите по алгебра по-горе. Те се проверяват внимателно, за да се гарантира, че тестват какво изискват стандартите и че формулировката им е ясна и не е неподходяща или предубедена към която и да е раса или пол.

Например, математически въпрос, който включва изчисляване на средната стойност на ударите на бейзболен играч, може да представлява проблем за ученици, които не играят бейзбол или не са запознати с неговите правила. Преразглеждането на формулировката, така че да се отнася за изчисляване на проста средна стойност, без да се споменава бейзбол, може да бъде решението, както и простото заместване на друг въпрос.

В тези тестове са вложени усърдни усилия. Всеки въпрос от изпитите PARCC, например, се преглежда от 30 или повече души, преди да бъде използван. След това въпросите, които се класират, се тестват пилотно в 14 щата и близо 16 000 училища. Smarter Balanced следва подобен процес, като тества повече от 5000 елемента в 21 щата и повече от 5000 училища.

На всяко ниво на клас тестът вероятно ще включва поне няколко наистина трудни въпроса, които може да изглеждат далеч отвъд способностите на учениците в този клас. Студентите (и учителите) са склонни да запомнят този тип въпроси, но те не са на теста просто за да създадат болка и дискомфорт. По-скоро засяването на теста с трудни въпроси избягва ефекта на тавана и помага да се разграничат учениците, които имат основно ниво на владеене, и тези на напреднало ниво. Все още може да има ученици, които отговарят на всички въпроси грешно или правилно, но дизайнът на тестовете прави малко вероятно това да се случи.

Някои оплаквания са заслужени, други не

Някои аспекти на тестовете заслужено предизвикват оплаквания. Например докладите за резултатите от тестовете до родителите често са натоварени със статистически жаргон като норми, процентили, еквиваленти на нормални криви, станини, лексили и нива на владеене, които се основават на… кой знае какво.

Родител, чието дете има 65-ти персентил в четвърти клас и 65-ти персентил в пети клас, може да се чуди дали той или тя стои на едно място. Детето не е – всъщност ученикът е научил материал за една година, защото детето е постигнало по-добър резултат от 65 процента от четвъртокласниците и след това, година по-късно, по-добър от 65 процента от петокласниците. Но дизайнерите на тестове не са си направили услуга, като са предоставили отчети, които изискват родителите да се борят със статистически концепции, за да осмислят резултатите.

Някои родители може да видят резултата от теста на дете и да си помислят, че трябва да е грешен, защото знаят, че детето им е по-добро по математика (или четене, или наука) от това. Може би ученикът е имал почивен ден – болест, разсейване на семейството, пропусната закуска. Родителите трябва да гледат на резултатите на фона на други показатели за това как се справя детето им в училище, като например оценките в картоните.

Родителите също може да се притесняват, че резултатите от тестовете на детето им се използват като основа за оценка на учителя на детето им, развитие през последното десетилетие, което се появи в отговор на натиска върху щатите и училищните квартали да повишат резултатите от тестовете. Няма ли учителят на детето да се интересува повече от резултата, отколкото от детето?

Е, не – повечето системи за оценяване на учители дават само умерена тежест на резултатите, докато организирането и управлението на класните стаи получават по-голяма тежест. И идеята, че учителите, които се грижат за по-високите резултати, е нещо лошо, отразява един обърнат поглед върху образованието, в който учителите постигат целите си – да накарат учениците си да научат това, което е в стандартите – по някакъв начин е проблем.

Някои дебати относно тестовете са изградени на крехка основа. Например годишните държавни изпити не отнемат много време за обучение. Родителите може да се притесняват, че учителят на детето им преподава на теста, но, както е описано по-горе, тестовете са предназначени да измерват знания за същите стандарти, на които се основават учебните програми в класната стая.

И така, докато тази учебна година се развива, нека си припомним защо щатите тестват учениците: за да видят дали учат на подходящо ниво на клас. И нека разберем, че тестовете се създават чрез надежден процес, подобно на изпитите, които нашите лекари, адвокати и счетоводители трябва да вземат.

Марк Динарски, основател и президент на Pemberton Research, е сътрудник по образование в Института Джордж У. Буш.