Să analizăm acum în detaliu un istoric mai precis al dezvoltării evaluării în context școlar.
A încerca să ne imaginăm imaginea dezvoltării domeniului evaluării este o sarcină complexă, deoarece evaluarea a fost întotdeauna un lucru pe care oamenii l-au folosit în mod informal timp de mii de ani. Evaluarea este o practică veche, dar, în același timp, este o disciplină foarte tânără, este ceva care a fost o practică comună.
Din acest punct de vedere, în ultimii ani, domeniul evaluării s-a maturizat.
Putem descrie evoluția întregului domeniu în funcție de șapte etape diferite de dezvoltare, numite perioade de evaluare a programelor. În primul rând, perioada de dinainte de 1900, pe care autorii o numesc Epoca Reformei; în al doilea rând, de la 1900 până în 1930, pe care o numesc Epoca Eficienței; în al treilea rând, de la 1930 la 1945, numită Epoca Tyleriană; în al patrulea rând, de la 1946 până în jurul anului 1957, numită Epoca Inocenței; în al cincilea rând, de la 1958 la 1972, Epoca Dezvoltării; în al șaselea rând, de la 1973 la 1983, Epoca Profesionalizării; și în al șaptelea rând, de la 1983 la 2000, Epoca Expansiunii și Integrării.
Prima utilizare formală documentată a evaluării a avut loc în 1792, când William Farish a utilizat nota cantitativă pentru a evalua performanța studenților (Hoskins, 1968). Nota cantitativă a permis clasificarea obiectivă a candidaților, precum și calcularea mediei și cumularea punctajelor. În plus, marca cantitativă a fost relevantă din punct de vedere istoric în legătură cu fructificarea evaluării programelor ca disciplină din două motive:
(a) a fost pasul inițial în dezvoltarea psihometriei; și (b) întrebările sale au fost concepute pentru a măsura competența tehnică factuală în domenii care au înlocuit treptat întrebările menite să evalueze stilul retoric (Madaus & O’Dyer, 1999).
Să dăm câteva exemple din diferite țări:
În această perioadă, în Marea Britanie, educația a fost reformată prin evaluare. De exemplu, Comisia Powis a recomandat ca performanța elevilor la citire, ortografie, scriere și aritmetică să determine salariile profesorilor. Nu era neobișnuit să se facă evaluări anuale ale rezultatelor elevilor (Madaus & Kellaghan, 1982).
În schimb, în Statele Unite, cea mai veche metodă de evaluare formală din Statele Unite a apărut în 1815, când armata a dezvoltat un sistem de politici pentru „uniformizarea ordonanței producătorilor” (Smith, 1987, p.42). Aceste politici au stabilit procese de producție standardizate care au încurajat conformitatea materialelor, a tehnicilor de producție, a inspecțiilor și a specificațiilor produselor pentru toți furnizorii de armament pentru armată. Prima evaluare formală a educației din Statele Unite a avut loc în Boston, Massachusetts, în 1845. Teste tipărite la diferite materii au fost folosite pentru a evalua rezultatele elevilor în sistemul de învățământ din Boston. Horace Mann, secretar al Consiliului de Stat al Educației, a dorit o evaluare cuprinzătoare a rezultatelor elevilor pentru a evalua calitatea unui sistem școlar mare. Potrivit lui Stufflebeam, Madaus și Kellaghan (2000), acest eveniment a reprezentat un moment important în istoria evaluării, deoarece a dat startul unei lungi tradiții de utilizare a scorurilor obținute la testele elevilor ca sursă principală de evaluare a eficacității școlii sau a programelor de instruire. Între 1887 și 1898, un reformator educațional pe nume Joseph Rice a efectuat o evaluare similară, realizând un studiu comparativ privind predarea ortografiei într-un număr de districte școlare. El era preocupat de metodele de predare a ortografiei, deoarece elevii americani nu învățau să scrie corect. Rice a reușit să determine că nu există nicio relație între timpul dedicat ortografiei și competența. Și-a raportat descoperirile în The Forum în 1897, într-un articol intitulat „The Futility of the Spelling Grind” (Colwell, 1998). Evaluarea lui Rice a fost recunoscută ca fiind prima evaluare oficială a unui program educațional din America (Stufflbeam et al., 2000).
Lucrările lui Fredrick W. Taylor privind managementul științific au devenit influente pentru administratorii din educație (Biddle & Ellena, 1964). Managementul științific al lui Taylor se baza pe observație, măsurare, analiză și, cel mai important, pe eficiență (Russell & Taylor, 1998). Testele bazate pe obiective au fost esențiale pentru a determina calitatea instruirii. Testele au fost elaborate de departamentele înființate pentru a îmbunătăți eficiența districtului educațional. Potrivit lui Ballou (1916), testele elaborate pentru școlile publice din Boston au fost descrise ca fiind cu referință obiectivă. Testele au fost folosite pentru a face deducții cu privire la eficiența districtului. În această perioadă, educatorii considerau măsurarea și evaluarea ca fiind sinonime, cea din urmă fiind considerată ca fiind rezumarea performanțelor elevilor la teste și atribuirea de note (Worthen, Sanders și Fitzpatrick, 1997).
Ralph Tyler, considerat părintele evaluării educaționale, a adus contribuții considerabile la evaluare. Tyler, după cum probabil vă amintiți, a condus un studiu de opt ani (1932-1940) care a evaluat rezultatele programelor din 15 licee progresiste și 15 licee tradiționale. Tyler a constatat că obiectivele de instruire pot fi clarificate prin formularea lor în termeni comportamentali, iar aceste obiective pot servi drept bază pentru evaluarea eficienței instruirii (Tyler, 1975).
Tyler a scris: „fiecare obiectiv trebuie definit în termeni care să clarifice tipul de comportament pe care cursul ar trebui să contribuie la dezvoltareaacestuia” (citat în Walbesser & Eisenberg, 1972). Stufflebeam et al. (2000) au concluzionat că evaluarea tyleriană implică comparații interne ale rezultatelor cu obiectivele; nu este necesar să prevadă comparații costisitoare și perturbatoare între grupurile experimentale și cele de control, așa cum au fost utilizate de studiile comparative folosite de Rice.
Potrivit lui Worthen et al. (1997), lucrările lui Tyler au stat la baza testării bazate pe criterii de referință.
Începând cu mijlocul anilor 1940, americanii au trecut mental dincolo de război (al Doilea Război Mondial) și de marea depresiune. Potrivit lui Madaus & Stufflebeam (1984), societatea a cunoscut o perioadă de mare creștere; a existat o modernizare și o extindere a ofertelor educaționale, a personalului și a facilităților. Din cauza acestui optimism național, nu s-a acordat prea mult interes responsabilității fondurilor naționale cheltuite pentru educație; de aici și eticheta acestei perioade de evaluare, „Epoca inocenței”. La începutul anilor 1950, în timpul epocii Inocenței, punctul de vedere al lui Tyler privind evaluarea a fost rapid adoptat. Bloom, Engelhart, Furst, Hill și Krathwohl (1956) au făcut progrese în domeniul testării bazate pe obiective atunci când au publicat Taxonomia obiectivelor educaționale. Autorii au indicat că în cadrul domeniului cognitiv există diferite tipuri de rezultate ale învățării. Obiectivele pot fi clasificate în funcție de tipul de comportament al elevului descris în acestea și că există o relație ierarhică între diferitele tipuri de rezultate. Mai mult, aceștia au indicat că testele ar trebui să fie concepute pentru a măsura fiecare tip de rezultat (Reiser, 2001).
În 1957, lansarea cu succes a satelitului rusesc Sputnik I a declanșat o criză națională. Ca urmare, a fost adoptată o legislație pentru a îmbunătăți instruirea în domenii considerate cruciale pentru apărarea și securitatea națională. În 1958, Congresul a promulgat Legea privind educația pentru apărare națională (NDEA), care a investit milioane de dolari în noi proiecte de dezvoltare curriculară și a prevăzut noi programe educaționale în matematică, științe și limbi străine (Stufflebeam, Madaus și Kellaghan, 2000). Evaluările au fost finanțate pentru a măsura succesul noilor programe de studii. La începutul anilor ’60, un alt factor important în dezvoltarea evaluării a fost apariția testelor bazate pe criterii de referință. Până la acel moment, majoritatea testelor, numite teste cu referire la norme, erau concepute pentru a discerne între performanțele elevilor. În schimb, un test bazat pe criterii a fost conceput pentru a măsura performanța individuală în funcție de criterii stabilite. Ea discerne cât de bine poate un individ să realizeze un anumit comportament sau un set de comportamente, indiferent de cât de bine realizează ceilalți (Reiser, 2001). Adoptarea Legii privind educația primară și secundară (ESEA) din 1965 a fost recunoscută ca fiind cea care a dat naștere evaluării contemporane a programelor și a inclus cerințe de evaluare. Potrivit lui Ferguson (2004), ESEA a fost menită să suplimenteze resursele academice pentru copiii cu venituri mici care aveau nevoie de sprijin suplimentar în clasele primare. Educatorilor li s-a cerut să își evalueze eforturile. Senatorul Robert Kennedy a sponsorizat această lege pentru că dorea să autentifice faptul că banii federali nu urmau să sprijine practicile epuizate ale școlilor, ci mai degrabă să ajute elevii dezavantajați în moduri noi (Weiss, 1998).
În anii 1970, evaluarea a apărut ca profesie. Au fost publicate o serie de reviste, printre care: Educational Evaluation and Policy Analysis, Studies in Educational Evaluation, CEDR Quarterly, Evaluation Review, New Directions for Program Evaluation, Evaluation and Program Planning și Evaluation News (Stufflebeam et al., 2000). În plus, universitățile au început să recunoască importanța evaluării, oferind cursuri de metodologie de evaluare. Printre acestea se numărau Universitatea din Illinois, Universitatea Stanford, Boston College, UCLA, Universitatea din Minnesota și Universitatea Western Michigan (Stufflebeam et al., 2000).
La începutul anilor ’80, evaluarea a avut probleme în timpul administrației Reagan. Au avut loc reduceri de fonduri pentru evaluare și s-a pus accentul pe reducerea costurilor. Potrivit lui Weiss (1998), fondurile pentru noi inițiative sociale au fost reduse drastic. Până la începutul anilor 1990, evaluarea și-a revenit odată cu economia. Domeniul s-a extins și a devenit mai integrat. S-au dezvoltat asociații profesionale și standarde de evaluare. În plus, Comitetul comun pentru standarde de evaluare educațională a elaborat criterii pentru evaluarea personalului. Abordări de evaluare pentru secolul XXI Începând cu anii 1930, au apărut numeroase abordări de evaluare, de la liste de sugestii până la rețete complete. Worthen et al., (1997) au clasificat diferitele abordări de evaluare în următoarele cinci categorii: (a) orientate spre obiective, (b) orientate către management, (c) orientate către consumator, (d) orientate spre expertiză, (e) orientate către adversar și (f) abordări de evaluare orientate către participanți.