Автоматизированное обучение в образовательном процессе

Применение методов оптимизации стохастических процессов с дискретным контролем для решения задачи автоматизированного обучения в образовательном процессе

Автор: Д.Н. Буторин

Обучение есть динамический процесс, в котором решения о дальнейшем ходе обучения принимается исходя из состояния обучаемого и трудоемкости (или адекватности) применения метода в конкретном случае. Во время обучения преподаватель формально, а иногда и на интуитивном уровне оценивает состояние ученика, затем принимает решение о том, каким образом лучше всего воздействовать на него, чтобы достигнуть наилучшего результата. Для этого преподаватель выбирает некоторый метод воздействия исходя из его адекватности, возможности применения и т.д. Естественно, что в одном случае использующийся метод может способствовать улучшению качества знаний, в другом нет. Поэтому в реальной жизни преподаватель производит наблюдения и принимает решения, основываясь на своем жизненном опыте, статистике и интуиции.

Есть предположение, что процесс обучения субъекта можно формализовать, создать модель и, таким образом, реализовать автоматизированную обучающую систему. Одной из положительных сторон которой, должна быть возможность самообучения системы в ходе принятия решений преподавателем или самой системой.

Модель оптимизации обучения. Состояния обучаемого можно описать вектором признаков в N-мерном пространстве. Адекватность (трудоемкость, возможность, необходимость) применения метода для перехода из одного состояния в другое можно описать некоторой нечеткой величиной в пределах 0..1.

Приняв это, необходимо определить зависимость между применяемыми воздействиями на обучаемого субъекта, и вероятностью перехода в то или иное состояние. Иными словами, необходимо выработать систему методов, которая бы приводила к требуемому состоянию из некоторого исходного состояния. Для того чтобы определять уровень того, на сколько состояние является желаемым, введем функцию принадлежности для множества состояний, в которых может находиться обучаемый.

Таким образом, процесс обучения можно свести к оптимизации стохастического процесса с дискретным контролем времени при нечетко заданных условиях. Поскольку обучаемый контролируется в определенные (дискретные) промежутки времени, в эти моменты измеряются его параметры, исходя из которых, планируется достижение определенной цели, то есть переход в некоторое конечное состояние, через серию транзитных.

Объявление:

В этом случае мы имеем:

•    Множество состояний в момент времени t: y(t) = (S1..Sm), каждое состояние описывается вектором признаков d = (x1..xn), в N-мерном пространстве
•    Множество методов воздействий: u(t) = (a1..ak)
•    Модель переходов между состояниями: y(t) = ?(y(t–1), u(t)). Описывает вероятность u(t) перехода из состояния y(t-1) в момент времени t-1, в состояние y(t) в момент времени t.

Необходимо определить оптимальную серию управляющих воздействий. Задача решается методом Заде-Белмана [1].

Для того чтобы модель самообучалась, необходимо периодически обновлять возможные состояния и модель вероятностей переходов. Кроме того, можно и нужно вводить новые методы (управляющие воздействия) и задавать их параметры.

Модель вероятностей переходов, задается следующим образом, для каждого метода определяется вероятность перехода из состояния y(t-1) в y(t).

Общая схема работы системы. Первый цикл обучения системы происходит с учителем. Педагог показывает, какому классу обучаемых необходимо применять тот или иной метод для их дальнейшего обучения. Обучение происходит, до тех пор, пока определенная совокупность обучаемых не покажет хорошие результаты, то есть не придет в определенное удовлетворительное состояние. Это состояние описывается преподавателем в виде диапазона разброса каждого признака.

Обучение системы с учителем продолжается пока не будет собрано удовлетворительное количество данных.

Когда модель переходов построена и определены основные состояния обучаемых, система готова к автономному обучению и автоматической коррекции модели с течением времени.
Обновление состояний производится путем автоматической кластеризации совокупности обучаемых в определенный момент времени после сбора данных.

Коррекция модели производится после применения управляющего воздействия на всех циклах системы, кроме первого. Предлагается проводить коррекцию с учетом объема выборки или уровня доверия к ней.

Применяя данный метод для построения самообучающейся обучаемой системы необходимо качественно выбрать контролируемые характеристики обучаемых субъектов и адекватность методов.

Кроме того, система сможет указывать наиболее оптимальные серии воздействий для каждого класса обучаемых субъектов. Предоставлять серии наиболее неудачных воздействий, то есть показывать, как не нужно действовать. Реализованную методику представляется возможным использовать в дистанционном образовании.

Библиографический список

1. Беллман Р., Заде Л. Принятие решений в расплывчатых условиях. — В кн.: Вопросы анализа и процедуры принятия решений. — М.:Мир, 1976. — c. 172-215 (Bellman R.E., Zadeh L.A. Decision-making in a fuzzy environment.- Management Sci., 1970. V.17, 4, 141-164.)

Новости по теме:

< Предыдущая		Следующая >

Последние материалы:

Игровой ассортимент в онлайн казино Вулкан: во что можно поиграть на реальные деньги ?

Как начать играть в автоматы на деньги на примере казино Вулкан Делюкс

Лучшие игровые автоматы на азиатскую тематику на 2021 год

Тренды онлайн казино в 2021 году

Что требуется для победы в казино Play Fortuna

Что такое зеркало сайта букмекерских контор и как на него попасть, обходя блокировки?

Как не попасть под санкции букмекера при игре на вилках

Почему нужно играть в казино

Что нужно знать об игровых автоматах онлайн - казино

Применение методов оптимизации стохастических процессов с дискретным контролем для решения задачи автоматизированного обучения в образовательном процессе