universidades, Estandardização da avaliação das

Hugo Aboites Aguilar

O uso generalizado das provas estandardizadas aplicadas aos estudantes, mais conhecidas como exames de múltipla escolha, acompanhou na América Latina e no Caribe as iniciativas de modernização educacional que se multiplicaram no final do século XX. Na Argentina, a Lei Federal de Educação (1993) incorporou a avaliação e foi criada a Diretoria Nacional de Avaliação, que utiliza essas provas em escolas selecionadas por amostragem. No Brasil, desde os anos 90, aplica-se esse tipo de teste para o exame vestibular ou de ingresso à educação superior; o mesmo acontece na Colômbia. No Chile está extremamente difundida a elaboração de ordenamentos (rankings) de escolas de nível médio e superior, das melhores às piores, com base nos resultados obtidos pelos estudantes em uma prova estandardizada. No México, esses exames se generalizaram a partir da aprovação da Lei Geral de Educação (1993), que incorporou a avaliação, e, sobretudo, com a criação do Centro Nacional de Avaliação para a Educação (Ceneval, 1994) e do Instituto Nacional de Avaliação para a Educação (INEE, 2002), este para a educação básica. Em El Salvador, no ano de 1995, foi estabelecida a Prova de Aptidões de Estudantes de Nível Secundário (PAES), que mede a aprendizagem de conhecimentos e as aptidões dos alunos na área de ciências e matemática.

Desenvolvidas em 1904 pelo francês Louis Binet para detectar crianças com deficiências de aprendizagem, essas provas logo foram transformadas em medições da inteligência e levadas para os Estados Unidos. Como ofereciam a promessa de uma aferição objetiva e precisa da inteligência, foram adaptadas e utilizadas para diferenciar os imigrantes e classificar recrutas durante a Primeira Guerra Mundial. No entanto, desde essa época mostraram uma persistente tendência a avaliar como retardados ou portadores de deficiência mental não apenas os imigrantes procedentes de países do Mediterrâneo, eslavos, judeus, mexicanos e africanos, mas também os afro-americanos e os recrutas anglo-saxões provenientes dos estados sulistas. Quando deixaram de ser utilizados em massa na década de 1930, devido às reações negativas que provocavam, os testes sofreram adaptações e deram origem à Prova de Aptidão Escolar (SAT, por sua sigla em inglês). Em 1947 surgiu o Educational Testing Service (ETS), organismo privado que se encarrega ainda hoje de selecionar, por meio do SAT, os jovens que podem ter acesso à educação superior nos Estados Unidos.

O uso escolar dessas aferições, nos Estados Unidos e depois em outros países, suavizou algumas das expressões do começo do século, mas não a tese de que era possível determinar o futuro das pessoas com base em uma medição exata de sua inteligência. Os que obtêm baixas pontuações já não são qualificados como “inferiores mentais”, e sim como “carentes da aptidão necessária” para desenvolver estudos superiores. No entanto, continua inalterada, depois de quase um século, a tendência a que as crianças e os jovens de famílias pobres – pertencentes a determinados grupos étnicos ou de determinada origem nacional – apareçam seguidamente como menos talentosos. Por essas razões, e pelo fato de os medidores se atribuírem o poder de determinar quem tem ou não talento, passando por cima das avaliações dos professores e de trajetórias acadêmicas satisfatórias, essas provas foram questionadas e foram objeto de fortes críticas. Por exemplo, a Associação de Psicólogos dos Estados Unidos expressamente recomenda que, tratando-se desses exames, “deve-se evitar o uso do número de acertos como única base para tomar decisões importantes que afetem a vida dos indivíduos […]” (College Board, 1988).

A aplicação dos testes em países como México e Chile parece confirmar tendências aparecidas há quase cem anos. Segundo dados dos próprios avaliadores, correspondentes ao período 1994-2000, no México a pontuação média nacional para os homens sempre foi superior à das mulheres. Também desde o começo detectou-se que, “em termos gerais, à maior renda familiar corresponde maior porcentagem de acertos” (Informe Ceneval, 1995). O mesmo aconteceu no Chile, onde os alunos mais destacados nesses exames são de escolas privadas. Com efeito, dos 108 colégios do país com a pontuação mais alta, apenas sete dependem de recursos públicos; os demais são privados e de alto custo (“Ranking Geral”, Qué Pasa , abr. 2003).

O resultado discriminativo foi atribuído à estrutura das provas, que se fundamentam principalmente em perguntas destinadas a medir a amplitude do vocabulário. No entanto, como já foi comprovado, este varia consideravelmente segundo a classe social do estudante, a escolaridade e a ocupação dos pais, o tipo de escola que frequentou, a região do país, a língua materna distinta do espanhol (indígena) e se vive no campo ou na cidade. O desconhecimento de uma palavra não diz muito sobre a capacidade para cursar estudos superiores; fala sobretudo do entorno social. Por mais que os avaliadores aleguem utilizar o vocabulário que “jovens desse nível de escolaridade” devem conhecer, essa categoria é em geral uma abstração resultante de se testar o instrumento com um grupo mais ou menos reduzido e não necessariamente representativo de todas as variantes existentes no país. É o grupo de referência que se toma como standard (daí o nome de “prova estandardizada”), mas se trata de um parâmetro que não se ajusta a todos e, na maioria das vezes, reflete melhor o vocabulário dos estudantes de classe média urbana, com alta escolaridade, não indígenas e, além disso, do sexo masculino.

Os avaliadores negam que os exames de múltipla escolha sejam discriminatórios, sustentando que estes não fazem mais do que apresentar a desigualdade social e escolar tal como existe nos países latino-americanos. Os críticos, por sua vez, argumentam que efetivamente existe uma tremenda desigualdade nos sistemas educativos, mas que esse tipo de prova contribui para exacerbá-la, já que coloca em primeiro plano as diferenças sociais na hora de tomar decisões de acesso à educação superior. Eles assinalam que as avaliações outorgadas pelos professores ao longo de um ciclo escolar (quer dizer, a média escolar resultante de outros tipos de teste), em uma escala de zero a um, têm uma correlação de apenas 0,037 com o fator ou variável ingresso econômico familiar. No entanto, a medição estandardizada aparece com uma correlação quase sete vezes maior, de 0,239, o que mostra sua sensibilidade à origem socioeconômica. Correlações semelhantes são encontradas a respeito da educação dos pais, gênero e origem indígena.

O fundamento teórico das provas é igualmente frágil. O inglês Charles Edward Spearman sustentava, no início do século XX, que habilidades específicas (tais como vocabulário, compreensão de leitura, habilidades matemáticas e problemas verbais) estavam correlacionadas com uma habilidade mais ampla e geral, chamada precisamente de G. Assim, para conhecer a inteligência de uma pessoa, bastava medir sua capacidade nessas rubricas específicas (ainda que se agregassem aos testes perguntas sobre os programas de estudo realizados: história, geografia, biologia etc.). No entanto, transcorrido mais de um século, não foi demonstrada essa correlação, nem a existência, no cérebro, do fator G que, como inteligência única e geral, explique a capacidade intelectual de uma pessoa. As teorias vigentes apontam, em sentido contrário, em direção a uma multiplicidade de inteligências.

À luz dos problemas de medição discriminatória e da questionável aferição que as provas de múltipla escolha fazem da aptidão, multiplicaram-se, na América Latina, as críticas ao fato de esses exames de três horas de duração serem utilizados como único elemento para determinar quem ingressa ou não na educação superior e quem recebe, ao fim dos estudos universitários, um atestado com a qualificação de “meritório”, “suficiente” ou “insuficiente”. Critica-se também que sejam empregados para estabelecer uma concorrência entre escolas e professores, com base nesses frágeis resultados, ou que sirvam como instrumento de uma espécie de “engenharia social” para determinar o destino escolar e social de muitos jovens. No caso da capital do México, a cada ano mais de 250 mil aspirantes à educação pública são medidos pelo Ceneval com uma prova desse tipo e, segundo o resultado, encaminhados a escolas de capacitação para o trabalho, ou a escolas que conduzem à universidade, ou, pura e simplesmente, excluídos da educação pública.

Talvez o caso mais notório de contestação aos testes de múltipla escolha tenha sido a greve de 1999-2000 na Universidade Nacional Autônoma do México (UNAM). Em sua origem estava a oposição dos estudantes ao aumento de mensalidades e também à utilização dos exames do Ceneval para determinar o acesso a essa instituição pública e a saída dela. A partir dos protestos, essa e outras universidades mexicanas deixaram de utilizar as provas desse organismo privado, versão local do ETS dos Estados Unidos.