Интеллектуальный поиск в системах управления обучением

Развитие средств массовой коммуникации и всемирной сети Интернет уже в течение десятка лет оказывает непосредственное влияние на существующие методики образования. Появившаяся возможность передачи знаний от преподавателя к студенту посредством всемирной сети активно используется большинством ВУЗов. Однако в сфере электронного обучения до сих пор существует ряд проблем, для которых не найдено эффективных решений.

Наиболее остро на данный момент стоит вопрос о поиске необходимой информации среди многочисленных электронных учебно-методических материалов (ЭУММ). Более того, поскольку знание не ограничивается ЭУММ, ставится вопрос о поиске релевантных материалов по всей сети WWW. На данный момент существует ряд разработок, позволяющих осуществлять поиск по базе данных ЭУММ, однако качество получаемых результатов оставляет желать лучшего [1]. В первую очередь это связано с тем, что до сих пор не разработано эффективных способов автоматизированного наполнения баз знаний.

Современные поисковые системы (в широком смысле) поддерживают два взаимодополняющих типа поиска: сверху вниз от темы к материалу (каталоги) и снизу вверх от ключевых слов к материалу и теме (непосредственный поиск). Наиболее популярны автоматические каталогизаторы на основе частотного метода анализа текста, однако также существуют интеллектуальные каталогизаторы, в некоторой мере поддерживающие функцию самообучения. Для непосредственного поиска большая часть современных поисковых систем использует вероятностные функции релевантности [2]. Вследствие подобной организации при некорректной постановке запроса количество информационного мусора в результирующих данных может достигнуть значительного количества. Для улучшения качества результата используются дополнительные интеллектуальные фильтры, основанные на онтологиях и семантических связях. Данные механизмы дают хороший результат при условии наличия достаточного количества метаинформации в объектах, по которым осуществляется поиск.

Совокупность каталога и непосредственного поиска может дать значительно лучшее качество результата в случае наличия большого количества специальных терминов в материалах, по которым производится поиск. Это служит достаточным основанием для применения такого рода систем для поиска по учебным материалам. Кроме того, при использовании поисковой системы в составе системы управления обучением существует возможность использования дополнительных параметров, улучшающих качество поиска, например ключевых слов, характерных для данного предмета, темы занятия или задания.

Предметом исследования является организация работы интеллектуальной поисковой системы на регулярно обновляемых входных данных ограниченного объема. Для решения поставленной задачи требуется, во-первых, построить сеть семантических связей между существующими ЭУММ с последующей иерархической кластеризацией как самих текстов ЭУММ [3], так и наборов ЭУММ. Во-вторых, нужно связать с каждой семантической единицей описывающую ее метаинформацию путем анализа текста семантической единицы (формирование индексов) и путем ее непосредственного назначения (назначение смысловой нагрузки на выделенные кластеры и семантические единицы). По получившейся структуре можно осуществлять эффективный поиск как по вхождению, так и по ассоциациям, к тому же данная структура подходит для построения тематического каталога с возможностью автоматической каталогизации. Обновление данной структуры сводится к обновлению индексов метаинформации.

Не менее важным моментом является разработка либо обоснованный выбор существующего метода выбора ключевых слов, характеризующих документ, поскольку от правильного выбора ключевых слов зависит качество поиска в целом. Предлагается осуществлять выбор из набора ключевых слов, которые уже известны системе поиска (и являются главными компонентами, идентифицирующими кластер). Данный набор может храниться в дополнительном индексе, который должен перестраиваться при добавлении новых документов (фактически, этим реализуется функция самообучения). К тому же, выбранные ключевые слова могут быть использованы для предоставления непосредственного доступа к документам (например, в виде т.н. «облака меток»). Еще один перспективный вариант их использования — создание автоматизированных запросов к сетевым поисковым машинам с целью получения дополнительных релевантных документов, не содержащихся в базе ЭУММ, но существующих во всемирной сети.

Реализация данной системы поиска в составе системы управления обучением существенно ускорит процесс получения необходимой методической информации студентами как по требуемой, так и по смежным дисциплинам.

     

    ЛИТЕРАТУРА:

     

  1. Microsoft в образовании: продукты, Class Server. // Эл. ресурс. — Загл. с экрана. Режим доступа: свободный,: http://www.microsoft.com/Rus/Education/ClassServer/Default.mspx
  2. Современные поисковые системы. // Эл. ресурс. — Загл. с экрана. Режим доступа: свободный,: http://book.itep.ru/4/45/retr4514.htm
  3. Ф.В. Борисюк, В.И.Швецов. Новый метод поиска на основе иерархической кластеризации по областям текстовых докумен¬тов. // Эл. ресурс. — Загл. с экрана. Режим доступа: свободный,: http://www.unn.ru/pages/issues/vestnik/99999999_West_2009_4/26.pdf
01.01.2009 Информационно-телекоммуникационные системы и управление «ИТКСУ–2009» : шк. молодых ученых, Новосиб. гос. техн. ун-т, 16–21 нояб. 2009 г. : сб. докл. и ст. – Новосибирск, 2009. – С. 53-54.