Грибченков А.Н.

Носкова Т.Н.

РГПУ им. А.И. Герцена,

г. Санкт-Петербург


Применение технологий генеративных нейронных сетей в процессах обучении студентов колледжа


В ходе исследования было опробовано несколько языковых моделей для использования в образовательном процессе колледжа, проведено дообучение модели и проанализированы результаты применения ИИ в образовательных целях. 


Gribchenkov A. N.

Noskova T.N.

HSPU

St. Petersburg, Russia


The use of generative neural network technologies in the learning processes of college students


During the study, several language models were tested for use in the college educational process, additional training of the model was carried out, and the results of using AI for educational purposes were analyzed.


Введение    

В последние десятилетия наблюдается стремительное развитие искусственного интеллекта (ИИ) и его проникновение в различные сферы человеческой жизни. Применение технологий ИИ в образовании выходит за рамки автоматизированного обучения, используются инновационные методы, способствующие улучшению процесса обучения и повышению его эффективности. Одним из перспективных направлений в использовании ИИ в образовательном процессе является применение генеративных моделей, способных создавать обучающие материалы. Настоящая статья направлена на анализ применения генеративных систем искусственного интеллекта на учебных занятиях, с опорой на персонализацию генерируемых образовательных ресурсов, автоматизацию оценивания выполненных студентами работ, автоматизированное консультирование обучающихся в рамках прохождения учебной программы в образовательной среде [1].

Актуальность. В применении искусственного интеллекта (ИИ) в образовании можно выделить несколько ключевых факторов.

1. Современное образование сталкивается с вызовами, связанными с индивидуализацией обучения и адаптацией учебных программ к разнообразным потребностям и способностям студентов. Использование технологий ИИ позволяет создавать персонализированные образовательные программы, учитывающие уровень знаний, скорость усвоения материала, а также предпочтения и интересы каждого учащегося.

2. ИИ способен обрабатывать и анализировать большие объемы данных, что открывает новые возможности для анализа образовательных практик и эффективности учебных методик. Это позволяет обнаруживать тенденции, выявлять успешные стратегии обучения и предоставлять ценную обратную связь для улучшения качества образования.

3. Использование ИИ в образовании способствует созданию более интерактивных и увлекательных учебных материалов, что стимулирует интерес учащихся к учебному процессу и способствует более глубокому усвоению знаний.

4. Рост технологического развития в современном мире требует от образовательных систем адаптации к новым требованиям. Внедрение ИИ в образование позволяет подготовить студентов к цифровой экономике и обеспечить им необходимые навыки для успешной карьеры в будущем.

Таким образом, использование искусственного интеллекта в образовании представляет собой не только способ совершенствования учебного процесса, но и стратегическое решение для обеспечения качественного и доступного образования в условиях быстро меняющегося мира.

Применение технологий генеративных нейронных сетей в обучении студентов. Применение искусственного интеллекта (ИИ) в образовании представляет собой важный шаг в эволюции образовательной среды по нескольким причинам:

Индивидуализация обучения: ИИ позволяет создавать персонализированные образовательные программы, учитывая уровень знаний, индивидуальные потребности и особенности каждого ученика. Это способствует более эффективному усвоению материала и повышению успеваемости.

Автоматизация рутинных задач: ИИ может автоматизировать ряд рутинных задач, таких как проверка тестов, оценка домашних заданий, формирование индивидуальных планов обучения и даже предоставление обратной связи ученикам.

Аналитика данных и прогнозирование: использование ИИ позволяет анализировать большие объемы данных, выявлять паттерны и тенденции в обучении, что помогает учителям и администраторам развивать более эффективные стратегии обучения и принимать более обоснованные управленческие решения.

В целом, применение искусственного интеллекта в образовании не только повышает эффективность обучения, но и способствует развитию образовательной сферы в целом, делая ее более доступной, инновационной и адаптированной к современным потребностям обучающихся и общества.

В процессе проведения экспериментального внедрения генеративной модели ИИ в процесс обучения студентов колледжа по дисциплине «Защита информации в информационно-телекоммуникационных системах и сетях с использованием технических средств защиты» выбрана модель LLaMA (Large Language Model Meta AI). Выбор модели обусловлен тем что она находится в свободном доступе и имеет широкие возможности для обучения.

LLaMA (Large Language Model Meta AI) — большая языковая модель (LLM), выпущенная Meta AI в феврале 2023 года [4]. Были обучены модели различных размеров в диапазоне от 7 до 65 миллиардов весов. Разработчики LLaMA сообщили, что производительность модели с 13 миллиардами весов в большинстве тестов NLP превышает производительность гораздо более крупной модели GPT-3 (со 175 миллиардами весов) и рассматриваемая модель может конкурировать с такими как PaLM и Chinchilla. В то время самые мощные LLM как правило были ограниченно доступны (если вообще были доступны). Meta предоставила исследовательскому сообществу веса моделей LLaMA под некоммерческой лицензией. В течение недели после выпуска LLaMA её веса были выложены в открытый доступ на 4chan через BitTorrent.

В рамках эксперимента было принято решение использовать общедоступную версию LLaMA и обучить её под необходимые образовательные задачи. Для запуска модели используется ПО KoboldCpp ver. 1.57.1.

KoboldCpp это простое в использовании программное обеспечение для генерации текста с использованием искусственного интеллекта для моделей GGML и GGUF. Это отдельный дистрибутив от Concedo, который построен на основе llama.cpp и добавляет универсальную Kobold API, дополнительную поддержку форматов, обратную совместимость, а также необычный пользовательский интерфейс с постоянными историями, инструментами редактирования, форматами сохранения, памятью и миром. информация, примечаниями автора, персонажами, сценариями и всем, что могут предложить Kobold и Kobold Lite. В качестве базовой модели была использована стандартная языковая модель с поддержкой русского языка [2].

На первом этапе эксперимента модель не проходила дообучения на каком-либо материале. Студентам было предложено использовать данный сервис для консультаций по направлению обучения (Информационная безопасность). После анализа 400 запросов, выяснилось, что стандартная языковая модель не способна генерировать корректную информацию для целей консультирования студентов. Результаты генерации не соответствовали действительности во всех 400 запросах.

На втором этапе эксперимента было принято решение произвести дообучение модели. Для этой цели использовались оцифрованные материалы обучающего курса, дипломные проекты студентов данного направления обучения, курсовые работы, научные статьи. Всего 1231 документ. Дообучение выполнялось на ПО LLaMA-LoRA Tuner запущенным в сервисе Google Coolab.

Google Colaboratory — бесплатная среда, чтобы писать код в jupyter notebook. Она функционирует по принципу облака, поэтому над одним проектом могут работать одновременно несколько человек. Программа предоставляет доступ к графическим процессорам GPU и TPU. Благодаря их мощности можно исследовать искусственный интеллект и развивать приложения на основе нейросетей. Дообучение длилось 17 часов после чего была выгружена и установлена дообученная языковая модель и запущена. Студентам были даны такие же инструкции как и в предыдущую попытку. Обученная модель показала более позитивный результат [3]. Из 400 запросов на 346 запросов был сгенерирован корректный ответ. Далее было проведено ещё несколько экспериментов, проверка заданий, создание конспектов.

На рис. 1 представлен график показывающий правильные ответы на запросы студентов в сравнении с облачными генеративными сервисами ИИ (Yandex GPT, ChatGPT). 


Рис. 1 – Диаграмма результатов эксперимента

 

Выводы. Результаты исследования показали, что использование стандартной модели не обученной на специализированных источниках (в зависимости от цели использования) не результативно. Однако, при обучении модели под конкретную задачу качество её работы кратно увеличивается, позволяя тем самым использовать для поставленных задач, в частности для консультирования студентов и проверки заданий. Это позволяет на данном этапе развития внедрять дообученные модели ИИ в цифровые образовательные среды. В результате эксперимента так же было выяснено что общедоступные GPT сервисы работают намного лучше локальных только в некоторых аспектах (как правило без конкретной дисциплинарной специфики). Однако следует учитывать, что ресурсы, использованные для обучения моделей и YandexGPT и ChatGPT, значительно выше, чем для обучения данной экспериментальной модели. В целом, перспективы развития ИИ в образовании предоставляют возможности для создания более эффективных, доступных и инновационных образовательных практик, способствующих развитию индивидуальных способностей и потенциала каждого ученика.

 

Литература:

1. Искусственный интеллект в образовании: Изменение темпов обучения. Аналитическая записка ИИТО ЮНЕСКО / Стивен Даггэн; ред. С.Ю. Князева; пер. с англ.: А.В. Паршакова. — Москва : Институт ЮНЕСКО по информационным технологиям в образовании, 2020.

2. Тарасов В.Б., Новости искусственного интеллекта // Российская ассоциация искусственного интеллекта. М., 2014. 132 с.

3. Осипов Г.С., Лекции по искусственному интеллекту. М.: Либроком, 2014. 272 с.

4. LLaMA: Open and Efficient Foundation Language Models URL: https://www.researchgate.net/publication/368842729_LLaMA_Open_and_Efficient_Foundation_Language_Models

вопросы и комментарии: