Обоснование перехода к КАТ

Главная / Методические материалы /

Обоснование необходимости перехода к Компьютерному адаптивному тестированию

Контроль уровня учебных достижений студентов основан на дидактических измерениях. В традиционном понимании дидактическое измерение есть ни что иное, как анализ и преобразование преподавателями ответов экзаменующихся на задачи или вопросы различной меры трудности. В смысловом отношении результат измерений содержит оценку (традиционно отметку) совокупности ответов студентов, которая отображается на шкалу отдельного преподавателя. Поскольку каждый преподаватель имеет собственную шкалу оценивания, измерения такого рода будут всегда субъективными. Для устранения субъективизма дидактических измерений иногда прибегают к групповому контролю, когда уровень учебных достижений студента оценивается сразу несколькими преподавателями, а отметка формируется экспертным путем. Это в определенной степени повышает объективность оценивания, но приводит к резкому возрастанию учебной нагрузки профессорско-преподавательского состава института. Более того, даже при экспертном подходе к проверкам достижений невозможно избежать ошибок, которые связаны с ограниченным числом вопросов, предъявляемых экзаменующемуся. В результате субъективизма и ограниченного числа вопросов ошибка в установлении уровня учебных достижений на экзамене достигает 38%.

Следующим этапом повышения эффективности дидактических измерений явился переход к тестированию – «бумажному», «аппаратному», «компьютерному». Каждый из этих способов обладает как своими достоинствами, так и недостатками, но основной целью любого из этих способов является получение оценки уровня достижений студента с заданной верностью или точностью. Точность полученной в результате тестирования оценки можно достигнуть за счет повышения информативности (различающей мощности) всех заданий теста или увеличения количества заданий, перекрывающие все допустимые уровни подготовки тестируемых. Повышение информативности теста – путь наиболее эффективный и реализуется за счет внедрения адаптивных процедур тестирования.

Наверное, нет необходимости доказывать преимущество компьютерного тестирования, однако отметим некоторые моменты:

оценивание результатов тестирования осуществляется мгновенно, автоматически фиксируется и сохраняется на длительное время;

возможность формирования достаточно большого количества вариантов теста, которое ограничено лишь размером банка тестовых заданий;

возможность реализации удобных процедур ввода, модификации тестовых материалов;

возможность формирования тестов, различных по уровню обученности испытуемых;

возможность управления как содержимым теста, так и стратегией проверок в ходе тестирования;

отсутствует необходимость в бумажных носителях и листах ответа. Это скорее важно не с точки зрения экономии средств (бумага, множительная техника, подготовленный персонал, технические средства сканирования листов ответа, программное обеспечение для сканирования и распознавания результатов, занесение результатов для дальнейшей обработки и хранения), а скорее – обеспечения секретности (надежности, безопасности), так как подготовка бумажных вариантов теста требует достаточно большого времени и доступа определенного количества обслуживающего персонала, что может служит утечкой информации до начала процесса тестирования;

нет необходимости в синхронизации процесса тестирования для группы испытуемых. Каждый тестируемый выбирает самостоятельный темп работы с тестом;

при компьютерном тестировании легко ввести временные ограничения или временное отслеживание процесса тестирования, что трудно осуществимо при бумажном тестировании; это позволяет учитывать психомоторные аспекты тестируемого;

использование мультимедийных компонент и графических изображений высокого качества (объем, цвет) доступные при компьютерном тестировании обеспечивает правильное и быстрое восприятия содержания задания, а с психологической точки зрения снимает напряжение с тестируемого;

повышается эффективность тестирования: уменьшается время тестирования (до 50% по сравнению с бумажной формой тестирования) для достижения того же уровня надежности оценивания, что ведет к уменьшению усталости тестируемого во время сеанса тестирования, что также является важным показателем в результатах тестируемых.

Необходимо отметить, что все вышеперечисленные преимущества достижимы лишь при правильной организации технологии компьютерного тестирования и наличия программных средств, их реализующих. В настоящее время еще активно используются программные оболочки, которые не могут обеспечить всех указанных преимуществ.

Адаптивное тестирование применялось и для технологий бумажного тестирования, однако активное развитие оно получило с широким внедрением компьютерного тестирования. Существуют различные алгоритмы и технологии КАТ, в дальнейшем мы ориентируемся на продвинутые технологии КАТ.

Основной особенностью КАТ является то, что тестовая последовательность формируются в процессе тестирования в соответствии с уровнем достижений каждого конкретного индивида, динамически оцениваемого (а в лучшем случае и прогнозируемого) в процессе, а не по окончании тестирования. В результате можно говорить о том, что:

каждый конкретный тест уникален и не был ранее опубликован, что также повышает его секретность (и надежность);

эффективность КАТ выше обычного компьютерного тестирования, так как трудность предъявляемых заданий стремиться соответствовать уровню достижений тестируемого, следовательно, повышается информативность теста и быстрее достигается заданная точность оценивания результата, что также может сократить длительность теста;

КАТ позволяет распознавать не только испытуемых со средним уровнем достижений, но и дает возможность выявить наиболее яркие, выдающиеся личности.

Перечисленные достоинства КАТ в совокупности с преимуществами вообще компьютерного тестирования обуславливают обоснованность перехода к КАТ для оценки уровня учебных достижений студентов.

Следует отметить некоторые ограничения использования КАТ:

Технические параметры компьютеров могут ограничивать возможности:
- реализации алгоритмов адаптивного тестирования,
- формирования и ведения большого объема банка тестовых заданий, на основе которого формируются тесты,
- реализации форм, графических и мультимедийных компонент тестовых заданий.

КАТ требует точной калибровки заданий по мере трудности. Для каждого индивида формируется индивидуальный тест, состоящий их некоторого множества заданий, являющимся подмножеством всего банка тестовых заданий. Получаемые каждым тестируемым оценки сильно зависят от точности оценивания характеристик каждого задания, ему предъявленного. Поэтому для получения как можно более точных характеристик заданий необходимы большие выборки – Тест должны пройти от 1000 до 2000 испытуемых. Поэтому использование КАТ иногда недопустимо для локально разрабатываемых тестов.

Использовать КАТ как стандартную практику возможно в организациях (учебных заведениях), обладающих достаточным парком компьютерной техники и возможностью сбора достаточно большого объема статистики или возможностью приобретения такого банка для использования

Переход к КАТ