<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Центр развития онлайн-обучения НГТУ &#187; поиск</title>
	<atom:link href="https://ido.nstu.ru/tag/%d0%bf%d0%be%d0%b8%d1%81%d0%ba/feed/" rel="self" type="application/rss+xml" />
	<link>https://ido.nstu.ru</link>
	<description>Центр развития онлайн-обучения НГТУ</description>
	<lastBuildDate>Fri, 10 Apr 2026 08:44:27 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.2.38</generator>
	<item>
		<title>Интеллектуальный поиск в системах управления обучением</title>
		<link>https://ido.nstu.ru/publications/%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d0%b2-%d1%81%d0%b8%d1%81%d1%82%d0%b5%d0%bc%d0%b0%d1%85-%d1%83%d0%bf/</link>
		<comments>https://ido.nstu.ru/publications/%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d0%b2-%d1%81%d0%b8%d1%81%d1%82%d0%b5%d0%bc%d0%b0%d1%85-%d1%83%d0%bf/#comments</comments>
		<pubDate>Mon, 13 Dec 2010 09:18:57 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[искусственный интеллект]]></category>
		<category><![CDATA[обучение]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[управление]]></category>

		<guid isPermaLink="false">http://ido.nstu.ru/new/publications/%d0%98%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d0%b2-%d1%81%d0%b8%d1%81%d1%82%d0%b5%d0%bc%d0%b0%d1%85-%d1%83%d0%bf%d1%/</guid>
		<description><![CDATA[Развитие средств массовой коммуникации и всемирной сети Интернет уже в течение десятка лет оказывает непосредственное влияние на существующие методики образования. Появившаяся возможность передачи знаний от преподавателя к студенту посредством всемирной сети активно используется большинством ВУЗов. Однако в сфере электронного обучения до сих пор существует ряд проблем, для которых не найдено эффективных решений.]]></description>
				<content:encoded><![CDATA[<p>Развитие средств массовой коммуникации и всемирной сети Интернет уже в течение десятка лет оказывает непосредственное влияние на существующие методики образования. Появившаяся возможность передачи знаний от преподавателя к студенту посредством всемирной сети активно используется большинством ВУЗов. Однако в сфере электронного обучения до сих пор существует ряд проблем, для которых не найдено эффективных решений. </p>
<p>Наиболее остро на данный момент стоит вопрос о поиске необходимой информации среди многочисленных электронных учебно-методических материалов (ЭУММ). Более того, поскольку знание не ограничивается ЭУММ, ставится вопрос о поиске релевантных материалов по всей сети WWW. На данный момент существует ряд разработок, позволяющих осуществлять поиск по базе данных ЭУММ, однако качество получаемых результатов оставляет желать лучшего [1]. В первую очередь это связано с тем, что до сих пор не разработано эффективных способов автоматизированного наполнения баз знаний. </p>
<p>Современные поисковые системы (в широком смысле) поддерживают два взаимодополняющих типа поиска: сверху вниз от темы к материалу (каталоги) и снизу вверх от ключевых слов к материалу и теме (непосредственный поиск). Наиболее популярны автоматические каталогизаторы на основе частотного метода анализа текста, однако также существуют интеллектуальные каталогизаторы, в некоторой мере поддерживающие функцию самообучения. Для непосредственного поиска большая часть современных поисковых систем использует вероятностные функции релевантности [2]. Вследствие подобной организации при некорректной постановке запроса количество информационного мусора в результирующих данных может достигнуть значительного количества. Для улучшения качества результата используются дополнительные интеллектуальные фильтры, основанные на онтологиях и семантических связях. Данные механизмы дают хороший результат при условии наличия достаточного количества метаинформации в объектах, по которым осуществляется поиск. </p>
<p>Совокупность каталога и непосредственного поиска может дать значительно лучшее качество результата  в случае наличия большого количества специальных терминов в материалах, по которым производится поиск. Это служит достаточным основанием для применения такого рода систем для поиска по учебным материалам. Кроме того, при использовании поисковой системы в составе системы управления обучением существует возможность использования дополнительных параметров, улучшающих качество поиска, например ключевых слов, характерных для данного предмета, темы занятия или задания.</p>
<p>Предметом исследования является организация работы интеллектуальной поисковой системы на регулярно обновляемых входных данных ограниченного объема. Для решения поставленной задачи требуется, во-первых, построить сеть семантических связей между существующими ЭУММ с последующей иерархической кластеризацией как самих текстов ЭУММ [3], так и наборов ЭУММ. Во-вторых, нужно связать с каждой семантической единицей описывающую ее метаинформацию путем анализа текста семантической единицы (формирование индексов) и путем ее непосредственного назначения (назначение смысловой нагрузки на выделенные кластеры и семантические единицы). По получившейся структуре можно осуществлять эффективный поиск как по вхождению, так и по ассоциациям, к тому же данная структура подходит для построения тематического каталога с возможностью автоматической каталогизации. Обновление данной структуры сводится к обновлению индексов метаинформации. </p>
<p>Не менее важным моментом является разработка либо обоснованный выбор существующего метода выбора ключевых слов, характеризующих документ, поскольку от правильного выбора ключевых слов зависит качество поиска в целом. Предлагается осуществлять выбор из набора ключевых слов, которые уже известны системе поиска (и являются главными компонентами, идентифицирующими кластер). Данный набор может храниться в дополнительном индексе, который должен перестраиваться при добавлении новых документов (фактически, этим реализуется функция самообучения). К тому же, выбранные ключевые слова могут быть использованы для предоставления непосредственного доступа к документам (например, в виде т.н. &laquo;облака меток&raquo;). Еще один перспективный вариант их использования &mdash; создание автоматизированных запросов к сетевым поисковым машинам с целью получения дополнительных релевантных документов, не содержащихся в базе ЭУММ, но существующих во всемирной сети.</p>
<p>Реализация данной системы поиска в составе системы управления обучением существенно ускорит процесс получения необходимой методической информации студентами как по требуемой, так и по смежным дисциплинам.</p>
<ol>
<p>&nbsp;</p>
<h3>ЛИТЕРАТУРА:</h3>
<p>&nbsp;</p>
<li>Microsoft в образовании: продукты, Class Server. // Эл. ресурс. &#8212; Загл. с экрана. Режим доступа: свободный,: <a target="_blank" class="go" href="http://www.microsoft.com/Rus/Education/ClassServer/Default.mspx">http://www.microsoft.com/Rus/Education/ClassServer/Default.mspx</a></li>
<li>Современные поисковые системы. // Эл. ресурс. &#8212; Загл. с экрана. Режим доступа: свободный,: <a target="_blank" class="go" href="http://book.itep.ru/4/45/retr4514.htm">http://book.itep.ru/4/45/retr4514.htm</a></li>
<li>Ф.В. Борисюк, В.И.Швецов. Новый метод поиска на основе иерархической кластеризации по областям текстовых докумен&not;тов. // Эл. ресурс. &#8212; Загл. с экрана. Режим доступа: свободный,: <a target="_blank" class="go" href="http://www.unn.ru/pages/issues/vestnik/99999999_West_2009_4/26.pdf">http://www.unn.ru/pages/issues/vestnik/99999999_West_2009_4/26.pdf</a></li>
</ol>
]]></content:encoded>
			<wfw:commentRss>https://ido.nstu.ru/publications/%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d0%b2-%d1%81%d0%b8%d1%81%d1%82%d0%b5%d0%bc%d0%b0%d1%85-%d1%83%d0%bf/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Технология интеллектуального поиска по электронным обучающим материалам</title>
		<link>https://ido.nstu.ru/publications/%d1%82%d0%b5%d1%85%d0%bd%d0%be%d0%bb%d0%be%d0%b3%d0%b8%d1%8f-%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d0%b3%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0/</link>
		<comments>https://ido.nstu.ru/publications/%d1%82%d0%b5%d1%85%d0%bd%d0%be%d0%bb%d0%be%d0%b3%d0%b8%d1%8f-%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d0%b3%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0/#comments</comments>
		<pubDate>Thu, 16 Sep 2010 04:12:31 +0000</pubDate>
		<dc:creator><![CDATA[admin]]></dc:creator>
				<category><![CDATA[информационные технологии]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[электронный ресурс]]></category>

		<guid isPermaLink="false">http://ido.nstu.ru/new/publications/%d0%a2%d0%b5%d1%85%d0%bd%d0%be%d0%bb%d0%be%d0%b3%d0%b8%d1%8f-%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d0%b3%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0/</guid>
		<description><![CDATA[По мере роста количеств информации вследствие технического прогресса, все большую важность приобретают технологии поиска необходимой информации среди больших ее объемов. В том числе это касается и учебного процесса: получаемые студентом знания часто оказываются устаревшими, в лучшем случае - на несколько лет, тогда как для применения их на практике требуется иметь хорошее представление о текущем состоянии технологии и ее направлениях развития. Наиболее остро эта проблема стоит для студентов специальностей, связанных с вычислительной техникой. К тому же, для преподавателей профильных предметов на этих специальностях также стоит задача предельной актуализации своих знаний.]]></description>
				<content:encoded><![CDATA[<p>По мере роста количеств информации вследствие технического прогресса, все большую важность приобретают технологии поиска необходимой информации среди больших ее объемов. В том числе это касается и учебного процесса: получаемые студентом знания часто оказываются устаревшими, в лучшем случае &#8212; на несколько лет, тогда как для применения их на практике требуется иметь хорошее представление о текущем состоянии технологии и ее направлениях развития. Наиболее остро эта проблема стоит для студентов специальностей, связанных с вычислительной техникой. К тому же, для преподавателей профильных предметов на этих специальностях также стоит задача предельной актуализации своих знаний.Хорошим источником информации как для студентов, так и для преподавателей являются информационные поисковые системы. Однако современные поисковые системы имеют одну общую проблему: зачастую количество информационного мусора в получаемом результате на порядки превышает количество полезной информации. Предлагаемая в данной статье методика поиска не является принципиально новой, однако по каким-то причинам не разработано ни одной действующей реализации поисковой системы на основе данной методики.Рассмотрим процесс работы современной поисковой системы. Поисковый робот-&laquo;паук&raquo; по очереди скачивает текстовые данные из сети, просматривает, находит ссылки и повторяет то же самое для найденных ссылок. При этом каждый документ индексируется тем или иным образом, чаще всего методом сопоставления документа со словами в словаре (установление отношения &laquo;слово N встречается в документе M&raquo;), либо подсчета частот вхождений слов (установление отношения &laquo;слово N встречается в документе M X раз&raquo;) [1]. После этого становится возможным поиск по индексам на основании некоторого запроса к поисковой системе. Современные поисковые системы также имеют функции исправления ошибок в запросе, опережающий ввод и прочие полезные дополнения. Однако это все равно не спасает от неправильно сформированных запросов и субъективно преобладающего количества информационного мусора.Предлагаемая методика поиска состоит в нахождении документов, содержащих слова запроса в качестве наиболее характерных слов, которыми можно описать документ. Одним из подходов к реализации данной методики является описание каждого документа при помощи метаинформации (поле типа &laquo;ключевые слова&raquo;). Однако зачастую количество документов настолько велико, что назначать ключевые слова вручную нецелесообразно. В этом случае может помочь следующий подход.Примем утверждение, что каждый документ описывается набором характерных слов-терминов. Если слово часто встречается в данном документе и при этом не является общеупотребительным, то данное слово будем считать характерным термином. Поскольку документы содержат очень большое количество слов, для организации поиска желательно выделить максимальное количество информации в минимальном объеме данных. Для этого предлагается использовать подсчет частот встречаемости слов и характерных контекстов (сочетаний из 2-3 слов). Каждый характерный контекст в дальнейшем будем также называть &laquo;словом&raquo; для упрощения изложения. Перед подсчетом частот требуется, как минимум, исключить из документа так называемые стоп-слова (предлоги, местоимения, общеупотребительные глаголы), а также привести слова в начальную форму. Этим занимается специальная программа &mdash; стеммер. После этого при помощи достаточно простой процедуры выполняется подсчет частот. Полученный набор соответствий типа &laquo;слово k &mdash; частота v&raquo; будем называть образом документа:  I1 = {k1 &rarr; v1, k2 &rarr; v2, k3 &rarr; v3}.&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; (1)  Если vn &lt; 2, то с большой вероятностью слово kn представляет собой информационный мусор, который только ухудшит результат поиска. Такие слова следует исключить из дальнейшего рассмотрения. Так как в различных документах различное число слов, имеет смысл операция нормирования частот вхождений. Относительные частоты&nbsp;&nbsp; вычислим по формуле: &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;   <img border="0" alt="" src="/public/images/publication/article38/image003.png" />&nbsp; (2)  Таким образом, после нормирования получаем:  <img border="0" alt="" src="/public/images/publication/article38/image005.png" />&nbsp; (3)    <img border="0" alt="" src="/public/images/publication/article38/image007.png" />&nbsp; (4)  По набору образов документов, полученных данным способом, уже можно осуществлять поиск, однако не вполне понятно по какому критерию оценивать релевантность результатов запросу. Кроме того, количество образов скорее всего будет очень значительным и выполнять поиск на основе линейного перебора окажется очень затратно.Для разрешения этой проблемы предлагается строить иерархический индекс (таксономию) по всему набору документов. В качестве алгоритма автоматической таксономии предлагается использовать универсальный алгоритм FRiS-Tax [2].Для использования данного алгоритма требуется ввести меру различия между двумя документами. Пусть сравниваются образы I1 и I2 документов D1 и D2 :   I1 = {k1 &rarr; v1R, k2 &rarr; v2R, k3 &rarr; v3R} &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; (5)    I2 = {k2 &rarr; v2R, k3 &rarr; v3R, k4 &rarr; v4R}&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; (6)  Дополним каждый образ недостающими ключами другого образа:   I1 = {k1 &rarr; v1R, k2 &rarr; v2R, k3 &rarr; v3R, k4 &rarr; 0} &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; (7)    I2 = {k1 &rarr; 0, k2 &rarr; v2R, k3 &rarr; v3R, k4 &rarr; v4R}&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp; (8)  Введем меру различия между образами:   <img border="0" alt="" src="/public/images/publication/article38/image009.png" />&nbsp; (9)  где v1R и v2R &#8212; относительные частоты вхождений n-ных слов в 1 и 2 документе соответственно. Чем больше эта мера, тем больше различаются частотные спектры документов. Если положить, что слова каждого документа не встречаются в другом документе, то  <img border="0" alt="" src="/public/images/publication/article38/image011.png" />&nbsp;&nbsp; (10)  Если же документы совпадают, то   <img border="0" alt="" src="/public/images/publication/article38/image013.png" />&nbsp; (11)  Поэтому,  <img border="0" alt="" src="/public/images/publication/article38/image015.png" />&nbsp; (12)  Пусть рассматривается образ I3 документа D3. Согласно [2], вводится мера конкурентного сходства:  <img border="0" alt="" src="/public/images/publication/article38/image017.png" />&nbsp; (13)  Если F12 &gt; 0, то I3 ближе к I1, чем к I2, если F12 &lt; 0 &#8212; то наоборот. Если F12 = 0, то образ равноудален от I1 и I2. Если F12 = 1, то I1 = I3. Если F12 = -1, то I2 = I3.Согласно введенной мере сходства при помощи алгоритма FRiS-Tax образы документов группируются в кластеры. Каждый кластер имеет как минимум один наиболее характерный документ (т.н. столп, см. [2]), относительно которого остальные документы кластера имеют минимальное различие. Алгоритм строит несколько наборов кластеров для разных степеней детализации и вычисляет оценку качества кластеризации. Согласно [2], эта оценка локально максимальна тогда, когда разбиение может быть признано человеком-экспертом &laquo;разумным&raquo;. Результаты, характеризующиеся локально максимальным качеством кластеризации, можно принять в качестве разных уровней иерархического индекса. В процессе поиска из запроса к поисковой системе аналогичным способом формируется характеристический образ. Этот образ сравнивается со всеми столпами верхнего уровня индекса, определяется наиболее близкий столп по мере близости и осуществляется переход на более низкий уровень индекса. Возможно, задать некоторый предел, при превышении которого документ будет считаться релевантным запросу. В этом случае требуется рекурсивный обход индекса. Сортировку документов по релевантности можно осуществлять по возрастанию меры различия между запросом и документом. Впрочем, как правило, если столп кластера релевантен запросу, то и остальные документы кластера так или иначе ему релевантны. После выяснения набора документов, можно провести полнотекстовый поиск по словам запроса, чтобы выяснить конкретные местоположения вхождений. Однако эта операция довольно затратна и как правило необязательна, поэтому необходимость ее использования под вопросом.Использование данного алгоритма и данной технологии дает три интересных побочных эффекта. Во-первых, для некоторого набора документов автоматически составляется каталог, поиск по которому зачастую может быть более продуктивным, чем посредством поискового запроса. Требуется только назначить названия для полученных кластеров. Во-вторых, получаем возможность использовать уточнение ключевых слов для выполнения запросов к внешним поисковым системам. Это актуально, поскольку увеличение количества ключевых слов при запросе к поисковой системе, как правило, ведет к увеличению количества полезных результатов. В-третьих, появляется возможность ассоциативного поиска, т.е. поиска похожих документов, как в исходном наборе, так и в сети посредством внешних поисковых систем. Данные возможности существенно улучшают функциональность поисковой системы. На данный момент автор занимается реализацией поисковой системы по описанной технологии с целью использования ее в составе системы управления учебными курсами ИДО НГТУ. Список литературы
<ul>
<li>Term frequency and weighting. [Электронный ресурс] &ndash; Электрон. текстовые дан. &ndash; Режим доступа: http://nlp.stanford.edu/IR-book/html/htmledition/term-frequency-and-weighting-1.html , свободный. &ndash; Загл. с экрана &ndash; Англ. </li>
<li>Борисова И.А. Алгоритм таксономии FRiS-Tax. Научный вестник НГТУ, 2007, №3(28), стр. 3-12.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>https://ido.nstu.ru/publications/%d1%82%d0%b5%d1%85%d0%bd%d0%be%d0%bb%d0%be%d0%b3%d0%b8%d1%8f-%d0%b8%d0%bd%d1%82%d0%b5%d0%bb%d0%bb%d0%b5%d0%ba%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d0%b3%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
