Как семантические технологии улучшают онлайн-образование: проект ученых Университета ИТМО

Учиться у преподавателей Университета ИТМО можно и без поступления – достаточно записаться на массовый онлайн-курс. Такие курсы Университет выпускает не только на отечественных платформах (таких как «Открытое образование»), но и на платформе edX, которая была создана силами MIT и Гарварда в 2012 году.
Например, в прошлом году на платформе edX стартовал англоязычный курс «How to Win Coding Competitions: Secrets of Champions». Однако Университет ИТМО не только создает интересные курсы, но и стремится улучшить работу самих образовательных платформ. Ученые из Университета ИТМО совместно с коллегой из Yandex LLC разработали решение, позволяющее внедрить семантические технологии в образовательный процесс на edX.

Как семантические технологии улучшают онлайн-образование: проект ученых Университета ИТМО/ Фото Craig Sunter / CC

Возможность анализировать данные, получаемые от тысяч студентов – одно из преимуществ массовых онлайн-курсов. Однако с массовостью связан и ряд сложностей – платформам необходимо учитывать все больше требований от своей разнородной аудитории. Часть вопросов, возникающих при создании курсов и работе со слушателями, решается силами сообщества разработчиков, преподавателей и ученых, проектирующих и ведущих курсы, – для этого у edX есть open source-платформа Open edX. Именно ее возможности и использовали в своей работе наши исследователи.

Команда проекта

Над проектом работали ученые международной лаборатории «Интеллектуальные методы обработки информации и семантические технологии» (Information Science and Semantic Technologies, ISST) Университета ИТМО совместно со своим коллегой из Яндекса. В России ISST – одна из передовых команд, которые занимаются вопросами семантических технологий и онтологического инжиниринга.

Задача

До недавнего времени курсы на образовательных платформах воспринимались как «неделимый комплекс знаний» – чтобы разобраться в каком-то узком вопросе, который затрагивается в курсе, необходимо пройти курс целиком (или, как минимум, дойти до нужной лекции). В этой связи «слушателям-междисциплинарникам» приходилось нелегко: в таком формате затруднительно искать ответы на конкретные вопросы, которые освещаются только в небольшой части того или иного курса. И тем более непросто изучить вопрос, который рассматривается в нескольких смежных областях (а значит, в нескольких несвязанных между собой курсах).

Как семантические технологии улучшают онлайн-образование: проект ученых Университета ИТМО
/ Структура онлайн-курса. Материал из презентации «Metadata Extraction from Open edX Online Courses Using Dynamic Mapping of NoSQL Queries» (Дмитрий Муромцев, Алексей Романов, Дмитрий Волчек, Федор Козлов)

Задачей ученых из Университета ИТМО стало помочь слушателям и создать решение, которое не только позволит формировать «кастомный набор курсов» в соответствии с интересующим вопросом, но и сделать это с учетом всех технологических особенностей современной образовательной платформы.

Решение

Ученые решали задачу семантического представления образовательного контента онлайн-курса. В результате им удалось создать модель, которая описывает все характеристики курса: его содержание, сценарии использования, участников и т.д. Такой подход позволяет «разобрать» курс на компоненты, описать и структурировать его контент в соответствии с разработанной онтологией.

Как рассказывает Дмитрий Волчек, аспирант кафедры информатики и прикладной математики Университета ИТМО, алгоритм анализирует контент курса (текстовые материалы, субтитры видеолекций), выделяет ключевые слова («концепты предметной области»), после чего концепты размечаются на подготовленной онтологии. В итоге становится возможным показать, как связаны между собой курсы из разных дисциплин, найти в них общие темы, проверить, используется ли выбранный контент повторно в других лекциях и материалах.

Такой подход позволяет создателям учебных материалов оценить качество курса: сопоставление концептов в тестах и лекционных материалах дает представление о том, соответствует ли уровень контрольных задач тому объему теории, который был выдан на лекциях. А у слушателей появляется возможность находить курсы из смежных областей или взглянуть на изучаемый вопрос по-новому: например, разобраться в том, как ту или иную концепцию рассматривают в рамках различных дисциплин.

Как семантические технологии улучшают онлайн-образование: проект ученых Университета ИТМО
/ Онтологическая модель (курс и пользователи). Материал из презентации «Metadata Extraction from Open edX Online Courses Using Dynamic Mapping of NoSQL Queries» (Дмитрий Муромцев, Алексей Романов, Дмитрий Волчек, Федор Козлов)

Сейчас проект находится на стадии тестирования, однако первые результаты ученые уже представили на профильной конференции Open EdX Conference 2017 (конференция прошла в мае этого года в Мадриде и собрала разработчиков, аналитиков и специалистов в области образования, работающих с платформой edX). Кроме того, по результатам исследований уже были опубликованы и научные работы (12).

Читайте также: