5.3 Evoluzione storica della valutazione dei programmi

Vediamo ora nel dettaglio una storia più accurata dello sviluppo della valutazione all’interno dei contesti scolastici.

Cercare di immaginare l’evoluzione del campo della valutazione è davvero un compito complesso, perché la valutazione è sempre stata qualcosa che l’uomo ha utilizzato in modo informale per migliaia di anni. La valutazione è una pratica antica ma, allo stesso tempo, è una disciplina molto giovane, è qualcosa che è stata una pratica comune condivisa.

In quest’ottica, negli ultimi anni il campo della valutazione è maturato.

Possiamo descrivere l’evoluzione dell’intero campo secondo sette diversi stadi di sviluppo, chiamati periodi di valutazione dei programmi. In primo luogo, il periodo precedente al 1900, che gli autori chiamano Età della Riforma; in secondo luogo, dal 1900 al 1930, l’Età dell’Efficienza; in terzo luogo, dal 1930 al 1945, l’Età Tyleriana; in quarto luogo, dal 1946 al 1957 circa, l’Età dell’Innocenza; in quinto luogo, dal 1958 al 1972, l’Età dello Sviluppo; in sesto luogo, dal 1973 al 1983, l’Età della Professionalizzazione; in settimo luogo, dal 1983 al 2000, l’Età dell’Espansione e dell’Integrazione.

Periodo di tempo 1: L’età della riforma (1792-1900)

Il primo utilizzo formale documentato della valutazione risale al 1792, quando William Farish utilizzò il voto quantitativo per valutare il rendimento degli studenti (Hoskins, 1968). Il voto quantitativo permetteva di classificare oggettivamente gli esaminati e di fare la media e l’aggregazione dei punteggi. Inoltre, il marchio quantitativo è stato storicamente rilevante in relazione alla realizzazione della valutazione dei programmi come disciplina per due motivi:

(a) è stato il passo iniziale nello sviluppo della psicometria; e (b) le sue domande sono state progettate per misurare la competenza tecnica fattuale in aree tematiche che hanno gradualmente sostituito le domande volte a valutare lo stile retorico (Madaus & O’Dyer, 1999).

Facciamo qualche esempio da diversi paesi:

Durante questo periodo in Gran Bretagna, l’istruzione fu riformata attraverso la valutazione. Ad esempio, la Commissione Powis ha raccomandato che i risultati degli studenti in lettura, ortografia, scrittura e aritmetica determinino lo stipendio degli insegnanti. Non era raro che ci fossero valutazioni annuali dei risultati ottenuti dagli studenti (Madaus & Kellaghan, 1982).

Negli Stati Uniti, invece, il primo metodo di valutazione formale risale al 1815, quando l’esercito sviluppò un sistema di politiche per “l’uniformità delle ordinanze dei produttori” (Smith, 1987, p.42). Queste politiche stabilirono processi di produzione standardizzati che promuovevano la conformità dei materiali, delle tecniche di produzione, delle ispezioni e delle specifiche dei prodotti per tutti i fornitori di armi alle forze armate. La prima valutazione formale dell’istruzione negli Stati Uniti ebbe luogo a Boston, nel Massachusetts, nel 1845. Per valutare i risultati degli studenti nel sistema educativo di Boston venivano utilizzati test stampati di varie materie. Horace Mann, segretario dello State Board of Education, voleva una valutazione completa dei risultati degli studenti per valutare la qualità di un grande sistema scolastico. Secondo Stufflebeam, Madaus e Kellaghan (2000), questo evento è stato un momento importante nella storia della valutazione perché ha dato il via a una lunga tradizione di utilizzo dei punteggi dei test degli alunni come fonte principale per valutare l’efficacia della scuola o del programma educativo. Tra il 1887 e il 1898, un riformatore dell’istruzione di nome Joseph Rice condusse una valutazione simile effettuando uno studio comparativo sull’insegnamento dell’ortografia in diversi distretti scolastici. Era preoccupato per i metodi di insegnamento dell’ortografia, perché gli studenti statunitensi non imparavano l’ortografia. Rice è stato in grado di stabilire che non c’era alcuna relazione tra il tempo dedicato all’ortografia e la competenza. Egli riportò i suoi risultati su The Forum nel 1897, in un articolo intitolato “The Futility of the Spelling Grind” (Colwell, 1998). La valutazione di Rice è stata riconosciuta come la prima valutazione formale di un programma educativo in America (Stufflbeam et al., 2000).

Periodo di tempo 2: L’era dell’efficienza e dei test (1900-1930)

Il lavoro di Fredrick W. Taylor sulla gestione scientifica ha influenzato gli amministratori del settore educativo (Biddle & Ellena, 1964). La gestione scientifica di Taylor si basava sull’osservazione, la misurazione, l’analisi e, soprattutto, l’efficienza (Russell & Taylor, 1998). I test basati su obiettivi sono stati fondamentali per determinare la qualità dell’istruzione. I test sono stati sviluppati da dipartimenti istituiti per migliorare l’efficienza del distretto educativo. Secondo Ballou (1916), i test sviluppati per le scuole pubbliche di Boston venivano descritti come oggettivi. I test sono stati utilizzati per fare inferenze sull’efficacia del distretto. In questo periodo, gli educatori consideravano la misurazione e la valutazione come sinonimi, e quest’ultima era intesa come una sintesi dei risultati dei test degli studenti e l’assegnazione di voti (Worthen, Sanders, & Fitzpatrick, 1997).

Periodo di tempo 3: L’era tyleriana (1930-1945)

Ralph Tyler, considerato il padre della valutazione educativa, ha dato un notevole contributo alla valutazione. Tyler, come forse ricorderai, ha diretto uno studio di otto anni (1932-1940) che ha valutato i risultati dei programmi in 15 scuole superiori progressiste e in 15 scuole superiori tradizionali. Tyler scoprì che gli obiettivi didattici potevano essere chiariti dichiarandoli in termini comportamentali e che tali obiettivi potevano servire come base per valutare l’efficacia dell’istruzione (Tyler, 1975).

Tyler scrisse: “Ogni obiettivo deve essere definito in termini che chiariscano il tipo di comportamento che il corso dovrebbe aiutare a sviluppare” (citato in Walbesser & Eisenberg, 1972). Stufflebeam et al. (2000) hanno concluso che la valutazione tyleriana prevede il confronto interno dei risultati con gli obiettivi; non è necessario che preveda confronti costosi e dispendiosi tra gruppi sperimentali e di controllo, come quelli utilizzati dagli studi comparativi di Rice.

Secondo Worthen et al. (1997), il lavoro di Tyler ha costituito la base dei test basati sui criteri.

Periodo di tempo 4: L’età dell’innocenza (1946-1957)

A partire dalla metà degli anni ’40, gli americani hanno superato mentalmente la guerra (la Seconda Guerra Mondiale) e la grande depressione. Secondo Madaus & Stufflebeam (1984), la società ha vissuto un periodo di grande crescita; c’è stato un miglioramento e un’espansione delle offerte educative, del personale e delle strutture. A causa di questo ottimismo nazionale, non ci si interessava molto alla responsabilità dei fondi nazionali spesi per l’istruzione; da qui l’etichetta di questo periodo di valutazione, “L’età dell’innocenza”. All’inizio degli anni ’50, durante L’età dell’innocenza, il punto di vista di Tyler sulla valutazione fu rapidamente adottato. Bloom, Engelhart, Furst, Hill e Krathwohl (1956) fecero progredire i test basati sugli obiettivi quando pubblicarono la Tassonomia degli obiettivi educativi. Gli autori hanno indicato che all’interno del dominio cognitivo ci sono vari tipi di risultati di apprendimento. Gli obiettivi potevano essere classificati in base al tipo di comportamento dell’allievo in essi descritto e che esisteva una relazione gerarchica tra i vari tipi di risultati. Inoltre, hanno indicato che i test dovrebbero essere progettati per misurare ogni tipo di risultato (Reiser, 2001).

Periodo di tempo 5: L’età dello sviluppo (1958-1972)

Nel 1957, il successo del lancio dello Sputnik I da parte dei russi scatenò una crisi nazionale. Di conseguenza, è stata approvata una legislazione per migliorare l’istruzione in aree considerate cruciali per la difesa e la sicurezza nazionale. Nel 1958, il Congresso promulgò il National Defense Education Act (NDEA), che stanziava milioni di dollari per lo sviluppo di nuovi progetti curriculari e prevedeva nuovi programmi educativi in matematica, scienze e lingue straniere (Stufflebeam, Madaus, & Kellaghan, 2000). Sono state finanziate delle valutazioni per misurare il successo dei nuovi programmi. All’inizio degli anni ’60, un altro fattore importante nello sviluppo della valutazione fu l’emergere dei test basati su criteri. Fino a quel momento, la maggior parte dei test, chiamati test normoreferenziati, erano progettati per distinguere le prestazioni degli studenti. Al contrario, un test riferito ai criteri ha lo scopo di misurare le prestazioni individuali in termini di criteri stabiliti. Rileva la capacità di un individuo di mettere in atto un particolare comportamento o un insieme di comportamenti, indipendentemente dalle prestazioni degli altri (Reiser, 2001). L’approvazione dell’Elementary and Secondary Education Act (ESEA) del 1965 è stata riconosciuta come la nascita della valutazione dei programmi contemporanea e ha incluso i requisiti per la valutazione. Secondo Ferguson (2004), l’ESEA aveva lo scopo di integrare le risorse accademiche per i bambini a basso reddito che necessitavano di un supporto extra nei primi anni di scuola. Gli educatori dovevano valutare i loro sforzi. Il senatore Robert Kennedy sponsorizzò la legge perché voleva dimostrare che i fondi federali non sarebbero serviti a sostenere le pratiche scolastiche ormai esaurite, ma piuttosto ad aiutare gli studenti svantaggiati in modi nuovi (Weiss, 1998).

Periodo di tempo 6: L’età della professionalizzazione (1973-1983)

Negli anni ’70 la valutazione è diventata una professione. Sono state pubblicate diverse riviste, tra cui Educational Evaluation and Policy Analysis, Studies in Educational Evaluation, CEDR Quarterly, Evaluation Review, New Directions for Program Evaluation, Evaluation and Program Planning e Evaluation News (Stufflebeam et al., 2000). Inoltre, le università hanno iniziato a riconoscere l’importanza della valutazione offrendo corsi di metodologia valutativa. Tra queste, l’Università dell’Illinois, l’Università di Stanford, il Boston College, l’UCLA, l’Università del Minnesota e la Western Michigan University (Stufflebeam et al., 2000).

Periodo di tempo 7: L’età dell’espansione e dell’integrazione (1983-oggi)

All’inizio degli anni ’80, la valutazione ha avuto difficoltà sotto l’amministrazione Reagan. Si sono verificati tagli ai finanziamenti per la valutazione e si è posto l’accento sulla riduzione dei costi. Secondo Weiss (1998), i fondi per le nuove iniziative sociali sono stati drasticamente tagliati. All’inizio degli anni ’90, la valutazione era rimbalzata insieme all’economia. Il campo si è ampliato ed è diventato più integrato. Sono state sviluppate associazioni professionali e standard di valutazione. Inoltre, il Joint Committee on Standards for Educational Evaluation ha sviluppato dei criteri per la valutazione del personale. Approcci alla valutazione per il 21° secolo Dagli anni ’30 sono emersi molti approcci alla valutazione che vanno da liste di suggerimenti a prescrizioni complete. Worthen et al. (1997) hanno classificato i diversi approcci di valutazione nelle seguenti cinque categorie: (a) orientati agli obiettivi, (b) orientato alla gestione, (c) orientato al consumatore, (d) orientato alle competenze, (e) orientati all’avversario e (f) approcci di valutazione orientati alla partecipazione.