5.3 Ιστορική εξέλιξη της αξιολόγησης προγραμμάτων

Ας δούμε τώρα λεπτομερώς μια πιο ακριβή ιστορία της ανάπτυξης της αξιολόγησης στο σχολικό πλαίσιο.

Το να προσπαθήσει κανείς να απεικονίσει την εικόνα της εξέλιξης του τομέα της αξιολόγησης είναι πραγματικά ένα πολύπλοκο εγχείρημα, επειδή η αξιολόγηση ήταν πάντα κάτι που οι άνθρωποι χρησιμοποιούσαν με άτυπο τρόπο εδώ και χιλιάδες χρόνια. Η αξιολόγηση είναι μια παλιά πρακτική, αλλά, ταυτόχρονα, είναι ένας πολύ νέος κλάδος, είναι κάτι που αποτελεί κοινή πρακτική.

Από την άποψη αυτή, τα τελευταία χρόνια, ο τομέας της αξιολόγησης έχει ωριμάσει.

Μπορούμε να περιγράψουμε την εξέλιξη ολόκληρου του πεδίου σύμφωνα με επτά διαφορετικά στάδια ανάπτυξης, που ονομάζονται περίοδοι αξιολόγησης προγραμμάτων. Πρώτον, η περίοδος πριν από το 1900, την οποία οι συγγραφείς αποκαλούν Εποχή της Μεταρρύθμισης- δεύτερον, από το 1900 έως το 1930, την αποκαλούν Εποχή της Αποτελεσματικότητας- τρίτον, από το 1930 έως το 1945, την αποκαλούν Τυλεριανή Εποχή- τέταρτον, από το 1946 έως το 1957 περίπου, την αποκαλούν Εποχή της Αθωότητας- πέμπτον, από το 1958 έως το 1972, την Εποχή της Ανάπτυξης- έκτον, από το 1973 έως το 1983, την Εποχή του Επαγγελματισμού- και έβδομον, από το 1983 έως το 2000, την Εποχή της Επέκτασης και της Ολοκλήρωσης.

 
Χρονική περίοδος 1: Η εποχή της μεταρρύθμισης (1792-1900)

Η πρώτη τεκμηριωμένη επίσημη χρήση της αξιολόγησης έγινε το 1792, όταν ο William Farish χρησιμοποίησε τον ποσοτικό βαθμό για να αξιολογήσει την απόδοση των μαθητών (Hoskins, 1968). Η ποσοτική βαθμολογία επέτρεπε την αντικειμενική κατάταξη των εξεταζομένων, τον μέσο όρο και την άθροιση των βαθμολογιών. Επιπλέον, το ποσοτικό σήμα ήταν ιστορικά σημαντικό σε σχέση με την καρποφορία της αξιολόγησης προγραμμάτων ως επιστημονικού κλάδου για δύο λόγους:

(α) ήταν το αρχικό βήμα στην ανάπτυξη της ψυχομετρίας- και (β) οι ερωτήσεις της σχεδιάστηκαν για να μετρήσουν την πραγματολογική τεχνική επάρκεια σε θεματικές περιοχές που σταδιακά αντικατέστησαν τις ερωτήσεις που αποσκοπούσαν στην αξιολόγηση του ρητορικού ύφους (Madaus & O’Dyer, 1999).

Ας δούμε μερικά παραδείγματα από διάφορες χώρες:

Κατά τη διάρκεια αυτής της περιόδου στη Μεγάλη Βρετανία, η εκπαίδευση μεταρρυθμίστηκε μέσω της αξιολόγησης. Για παράδειγμα, η Επιτροπή Powis συνέστησε οι επιδόσεις των μαθητών στην ανάγνωση, την ορθογραφία, τη γραφή και την αριθμητική να καθορίζουν τους μισθούς των εκπαιδευτικών. Δεν ήταν ασυνήθιστο να γίνονται ετήσιες αξιολογήσεις των επιδόσεων των μαθητών (Madaus & Kellaghan, 1982).

Στις Ηνωμένες Πολιτείες, αντίθετα, η πρώτη μέθοδος επίσημης αξιολόγησης εμφανίστηκε το 1815, όταν ο στρατός ανέπτυξε ένα σύστημα πολιτικών για την “ομοιομορφία των κανονισμών των κατασκευαστών” (Smith, 1987, σ. 42). Οι πολιτικές αυτές καθόρισαν τυποποιημένες διαδικασίες παραγωγής που προωθούσαν τη συμμόρφωση των υλικών, των τεχνικών παραγωγής, της επιθεώρησης και των προδιαγραφών των προϊόντων για όλους τους προμηθευτές όπλων για τον στρατό. Η πρώτη επίσημη αξιολόγηση της εκπαίδευσης στις Ηνωμένες Πολιτείες πραγματοποιήθηκε στη Βοστώνη της Μασαχουσέτης το 1845. Για την αξιολόγηση των επιδόσεων των μαθητών στο εκπαιδευτικό σύστημα της Βοστώνης χρησιμοποιήθηκαν τυπωμένα τεστ διαφόρων μαθημάτων. Ο Horace Mann, Γραμματέας του Κρατικού Συμβουλίου Παιδείας, ήθελε μια ολοκληρωμένη αξιολόγηση της επίδοσης των μαθητών για να εκτιμήσει την ποιότητα ενός μεγάλου σχολικού συστήματος. Σύμφωνα με τους Stufflebeam, Madaus, & Kellaghan (2000), το γεγονός αυτό αποτέλεσε μια σημαντική στιγμή στην ιστορία της αξιολόγησης, διότι ξεκίνησε μια μακρά παράδοση της χρήσης των αποτελεσμάτων των μαθητικών δοκιμασιών ως κύρια πηγή για την αξιολόγηση της αποτελεσματικότητας του σχολείου ή του εκπαιδευτικού προγράμματος. Από το 1887 έως το 1898, ένας εκπαιδευτικός μεταρρυθμιστής, ο Τζόζεφ Ράις, διεξήγαγε μια παρόμοια αξιολόγηση, διεξάγοντας μια συγκριτική μελέτη σχετικά με τη διδασκαλία της ορθογραφίας σε διάφορες σχολικές περιφέρειες. Ανησυχούσε για τις μεθόδους διδασκαλίας της ορθογραφίας, επειδή οι μαθητές των ΗΠΑ δεν μάθαιναν ορθογραφία. Ο Rice μπόρεσε να διαπιστώσει ότι δεν υπήρχε σχέση μεταξύ του χρόνου που αφιερώνεται στην ορθογραφία και της ικανότητας. Ανέφερε τα ευρήματά του στο The Forum το 1897, σε ένα άρθρο με τίτλο “The Futility of the Spelling Grind” (Colwell, 1998). Η αξιολόγηση του Rice έχει αναγνωριστεί ως η πρώτη επίσημη αξιολόγηση εκπαιδευτικού προγράμματος στην Αμερική (Stufflbeam et al., 2000).

Χρονική περίοδος 2: Η εποχή της αποτελεσματικότητας και των δοκιμών (1900-1930)

Το έργο του Fredrick W. Taylor για την επιστημονική διοίκηση άσκησε επιρροή στους διοικητικούς υπαλλήλους της εκπαίδευσης (Biddle & Ellena, 1964). Το επιστημονικό μάνατζμεντ του Taylor βασιζόταν στην παρατήρηση, τη μέτρηση, την ανάλυση και, κυρίως, την αποτελεσματικότητα (Russell & Taylor, 1998). Τα τεστ που βασίζονται σε αντικειμενικά κριτήρια ήταν κρίσιμα για τον προσδιορισμό της ποιότητας της διδασκαλίας. Τα τεστ αναπτύχθηκαν από τμήματα που δημιουργήθηκαν για να βελτιώσουν την αποτελεσματικότητα της εκπαιδευτικής περιφέρειας. Σύμφωνα με τον Ballou (1916), τα τεστ που αναπτύχθηκαν για τα δημόσια σχολεία της Βοστώνης χαρακτηρίστηκαν ως αντικειμενικά. Τα τεστ χρησιμοποιήθηκαν για την εξαγωγή συμπερασμάτων σχετικά με την αποτελεσματικότητα της περιφέρειας. Κατά τη διάρκεια αυτής της περιόδου, οι εκπαιδευτικοί θεωρούσαν τη μέτρηση και την αξιολόγηση ως συνώνυμα, με τη δεύτερη να θεωρείται ως η σύνοψη των επιδόσεων των μαθητών σε τεστ και η απόδοση βαθμών (Worthen, Sanders, & Fitzpatrick, 1997).

Χρονική περίοδος 3: Η Τυλεριανή Εποχή (1930-1945)

Ο Ralph Tyler, που θεωρείται ο πατέρας της εκπαιδευτικής αξιολόγησης, συνέβαλε σημαντικά στην αξιολόγηση. Ο Tyler, όπως ίσως θυμάστε, διηύθυνε μια οκταετή μελέτη (1932-1940), η οποία αξιολόγησε τα αποτελέσματα των προγραμμάτων σε 15 προοδευτικά λύκεια και 15 παραδοσιακά λύκεια. Ο Tyler διαπίστωσε ότι οι διδακτικοί στόχοι μπορούν να αποσαφηνιστούν με τη διατύπωσή τους με όρους συμπεριφοράς και ότι οι στόχοι αυτοί μπορούν να χρησιμεύσουν ως βάση για την αξιολόγηση της αποτελεσματικότητας της διδασκαλίας (Tyler, 1975).

Ο Tyler έγραψε, “κάθε στόχος πρέπει να ορίζεται με όρους που να αποσαφηνίζουν το είδος της συμπεριφοράς που το μάθημα πρέπει να βοηθήσει να αναπτυχθεί” (αναφέρεται στο Walbesser & Eisenberg, 1972). Οι Stufflebeam κ.ά. (2000) κατέληξαν στο συμπέρασμα ότι η αξιολόγηση κατά Tyler περιλαμβάνει εσωτερικές συγκρίσεις των αποτελεσμάτων με τους στόχους- δεν χρειάζεται να προβλέπει δαπανηρές και αποδιοργανωτικές συγκρίσεις μεταξύ πειραματικών ομάδων και ομάδων ελέγχου, όπως χρησιμοποιούνταν από συγκριτικές μελέτες που χρησιμοποιούσε ο Rice.

Σύμφωνα με τους Worthen κ.ά. (1997), το έργο του Tyler αποτέλεσε τη βάση των δοκιμασιών με κριτήριο αναφοράς.

Χρονική περίοδος 4: Η εποχή της αθωότητας (1946-1957)

Ξεκινώντας από τα μέσα της δεκαετίας του 1940, οι Αμερικανοί ξεπέρασαν ψυχικά τον πόλεμο (Β’ Παγκόσμιος Πόλεμος) και τη μεγάλη ύφεση. Σύμφωνα με τους Madaus & Stufflebeam (1984), η κοινωνία γνώρισε μια περίοδο μεγάλης ανάπτυξης- υπήρξε αναβάθμιση και επέκταση των εκπαιδευτικών προσφορών, του προσωπικού και των εγκαταστάσεων. Λόγω αυτής της εθνικής αισιοδοξίας, ελάχιστο ενδιαφέρον δόθηκε για την αιτιολόγηση των εθνικών κονδυλίων που δαπανήθηκαν για την εκπαίδευση- εξ ου και η ονομασία αυτής της περιόδου αξιολόγησης, Η εποχή της αθωότητας. Στις αρχές της δεκαετίας του 1950, κατά τη διάρκεια της Εποχής της Αθωότητας, η άποψη του Τάιλερ για την αξιολόγηση υιοθετήθηκε γρήγορα. Οι Bloom, Engelhart, Furst, Hill και Krathwohl (1956) έδωσαν πρόοδο στις εξετάσεις που βασίζονται σε αντικειμενικά κριτήρια όταν δημοσίευσαν την Ταξινόμηση των Εκπαιδευτικών Στόχων. Οι συγγραφείς ανέφεραν ότι στον γνωστικό τομέα υπάρχουν διάφοροι τύποι μαθησιακών αποτελεσμάτων. Οι στόχοι μπορούν να ταξινομηθούν ανάλογα με τον τύπο της συμπεριφοράς του μαθητή που περιγράφεται σε αυτούς και ότι υπάρχει ιεραρχική σχέση μεταξύ των διαφόρων τύπων αποτελεσμάτων. Επιπλέον, ανέφεραν ότι οι δοκιμασίες πρέπει να σχεδιάζονται για τη μέτρηση κάθε τύπου αποτελέσματος (Reiser, 2001).

Χρονική περίοδος 5: Η εποχή της ανάπτυξης (1958-1972)

Το 1957, η επιτυχής εκτόξευση του Σπούτνικ Ι από τους Ρώσους προκάλεσε εθνική κρίση. Ως αποτέλεσμα, ψηφίστηκε νομοθεσία για τη βελτίωση της διδασκαλίας σε τομείς που θεωρούνταν ζωτικής σημασίας για την εθνική άμυνα και ασφάλεια. Το 1958, το Κογκρέσο θέσπισε τον Νόμο για την Εθνική Αμυντική Εκπαίδευση (National Defense Education Act – NDEA), ο οποίος διοχέτευσε εκατομμύρια δολάρια σε νέα προγράμματα ανάπτυξης προγραμμάτων σπουδών και προέβλεπε νέα εκπαιδευτικά προγράμματα στα μαθηματικά, τις θετικές επιστήμες και τις ξένες γλώσσες (Stufflebeam, Madaus, & Kellaghan, 2000). Για τη μέτρηση της επιτυχίας των νέων προγραμμάτων σπουδών χρηματοδοτήθηκαν αξιολογήσεις. Στις αρχές της δεκαετίας του 1960, ένας άλλος σημαντικός παράγοντας για την ανάπτυξη της αξιολόγησης ήταν η εμφάνιση των δοκιμασιών με κριτήριο αναφοράς. Μέχρι τότε, οι περισσότερες δοκιμασίες, οι οποίες ονομάζονταν δοκιμασίες με αναφορά σε πρότυπα, είχαν σχεδιαστεί για να διακρίνουν τις επιδόσεις των μαθητών. Αντίθετα, μια δοκιμασία που αναφέρεται σε κριτήρια είχε ως στόχο να μετρήσει την ατομική επίδοση με βάση καθορισμένα κριτήρια. Διακρίνει πόσο καλά ένα άτομο μπορεί να εκτελέσει μια συγκεκριμένη συμπεριφορά ή ένα σύνολο συμπεριφορών, ανεξάρτητα από το πόσο καλά εκτελούν οι άλλοι (Reiser, 2001). Η ψήφιση του νόμου για τη στοιχειώδη και δευτεροβάθμια εκπαίδευση (ESEA) του 1965 αναγνωρίστηκε ως η γέννηση της σύγχρονης αξιολόγησης προγραμμάτων και περιλάμβανε απαιτήσεις για την αξιολόγηση. Σύμφωνα με τον Ferguson (2004), το ESEA είχε ως στόχο να συμπληρώσει τους ακαδημαϊκούς πόρους για τα παιδιά με χαμηλό εισόδημα που χρειάζονταν πρόσθετη υποστήριξη στις πρώτες τάξεις. Οι εκπαιδευτικοί έπρεπε να αξιολογήσουν τις προσπάθειές τους. Ο γερουσιαστής Ρόμπερτ Κένεντι υποστήριξε τον νόμο επειδή ήθελε να πιστοποιήσει ότι τα ομοσπονδιακά χρήματα δεν θα υποστήριζαν τις εξαντλημένες πρακτικές των σχολείων, αλλά θα βοηθούσαν τους μειονεκτούντες μαθητές με νέους τρόπους (Weiss, 1998).

Χρονική περίοδος 6: Η εποχή του επαγγελματισμού (1973-1983)

Κατά τη δεκαετία του 1970, η αξιολόγηση αναδύθηκε ως επάγγελμα. Εκδόθηκε ένας αριθμός περιοδικών, συμπεριλαμβανομένων των Educational Evaluation and Policy Analysis, Studies in Educational Evaluation, CEDR Quarterly, Evaluation Review, New Directions for Program Evaluation, Evaluation and Program Planning και Evaluation News (Stufflebeam et al., 2000). Επιπλέον, τα πανεπιστήμια άρχισαν να αναγνωρίζουν τη σημασία της αξιολόγησης προσφέροντας μαθήματα στη μεθοδολογία της αξιολόγησης. Μεταξύ αυτών ήταν το Πανεπιστήμιο του Ιλινόις, το Πανεπιστήμιο του Στάνφορντ, το Boston College, το UCLA, το Πανεπιστήμιο της Μινεσότα και το Πανεπιστήμιο του Δυτικού Μίσιγκαν (Stufflebeam et al., 2000).

Χρονική περίοδος 7: Η εποχή της επέκτασης και της ολοκλήρωσης (1983-σήμερα)

Στις αρχές της δεκαετίας του 1980, η αξιολόγηση αντιμετώπισε δυσκολίες υπό τη διοίκηση Ρέιγκαν. Έγιναν περικοπές στη χρηματοδότηση της αξιολόγησης και δόθηκε έμφαση στην περικοπή του κόστους. Σύμφωνα με τον Weiss (1998), η χρηματοδότηση νέων κοινωνικών πρωτοβουλιών περικόπηκε δραστικά. Μέχρι τις αρχές της δεκαετίας του 1990, η αξιολόγηση είχε ανακάμψει μαζί με την οικονομία. Ο τομέας επεκτάθηκε και έγινε πιο ολοκληρωμένος. Αναπτύχθηκαν επαγγελματικές ενώσεις και πρότυπα αξιολόγησης. Επιπλέον, η Κοινή Επιτροπή για τα Πρότυπα Εκπαιδευτικής Αξιολόγησης ανέπτυξε κριτήρια για την αξιολόγηση του προσωπικού. Προσεγγίσεις αξιολόγησης για τον 21ο αιώνα Από τη δεκαετία του 1930 έχουν εμφανιστεί πολλές προσεγγίσεις αξιολόγησης, οι οποίες κυμαίνονται από λίστες ελέγχου προτάσεων έως ολοκληρωμένες συνταγές. Οι Worthen et al., (1997) κατέταξαν τις διάφορες προσεγγίσεις αξιολόγησης στις ακόλουθες πέντε κατηγορίες: (α) προσανατολισμένη στους στόχους, (β) προσανατολισμένη στη διαχείριση, (γ) προσανατολισμένη στον καταναλωτή, (δ) προσανατολισμένη στην εμπειρογνωμοσύνη, (ε) προσανατολισμένη στον αντίπαλο, και (στ) προσεγγίσεις αξιολόγησης προσανατολισμένες στη συμμετοχή.