Сбой в системе оценки эссе в Массачусетсе
В результате сбоя в системе оценки, основанной на искусственном интеллекте, тестовые эссе в почти 200 школьных округах Массачусетса были неправильно оценены. Об этом сообщает NBC Boston, выявив, что около 1,400 работ получили оценки, значительно ниже ожидаемых: некоторые эссе были оценены на уровне 0, тогда как по шкале от 1 до 7 им полагалась оценка до 6.
Реакция Департамента образования
Департамент начального и среднего образования Массачусетса (DESE) сообщил о том, что все затронутые работы были переоценены, округа были уведомлены, а данные были обновлены. Результаты тестов MCAS, опубликованные в прошлом месяце, показывают, что дефицит обучения, возникший в период пандемии COVID-19, по-прежнему представляет собой серьезную проблему для обучающихся на всех уровнях.
Причины сбоя и использование ИИ
Согласно DESE, проблема с оценками возникла из-за «временной технической неисправности в процессе», и эти ошибки составляют всего лишь небольшую долю от приблизительно 750,000 эссе, оцененных на уровне штата. Искусственный интеллект используется для помощи в оценке тестов MCAS в течение последних двух лет, при этом около 10% эссе затем дополнительно проверяются и переоцениваются людьми, чтобы обеспечить согласованность в выставлении оценок.
Отказ от пороговых значений
Заблуждения в оценке происходят на фоне того, что жители Массачусетса на всеобъемлющем голосовании отказались от внедрения пороговых значений для прохождения тестов MCAS как условия для получения аттестата о среднем образовании. Почти 60% избирателей отвергли стандарты, существовавшие в штате на протяжении двух десятилетий.
Разработка новых требований
Дополнительно, в это время Совет по выпускным требованиям K-12 в штате разрабатывает новые требования, которые могут вернуть некоторые стандартизированные «итоговые оценочные задания» по основным предметам, чтобы определить, является ли ученик приемлемым для получения диплома о среднем образовании. Черновые рекомендации Совета включают положение о «итоговых оценочных заданиях», которые будут «разработаны, проведены и оценены государством, что будет способствовать единому стандарту по всему штату Массачусетс».
Выводы и перспективы
Данные инциденты ставят под вопрос надежность внедрения технологий искусственного интеллекта в образовательную практику и подчеркивают необходимость тщательной проверки системы оценивания. Несмотря на технологический прогресс, важно помнить о роли человеческого фактора в сфере образования. Эксперты подчеркивают, что уроки, извлеченные из данного скандала, должны привести к более тщательному контролю за автоматизированными системами оценивания. Важно помнить, что в образовании нельзя полагаться исключительно на технологию; необходима комплексная оценка, которая учитывает все аспекты обучения.





