Нейросетевые методы обработки изображений (В.В.Китов)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Материалы лекций)
Текущая версия (08:27, 11 февраля 2026) (править) (отменить)
 
(64 промежуточные версии не показаны)
Строка 3: Строка 3:
==О курсе==
==О курсе==
-
Спецкурс проходит на ф-те ВМиК в весеннем семестре и посвящен задаче автоматической стилизации изображений, в которой входное изображение необходимо преобразовать так, чтобы сохранить изображенные на нем предметы, но стилистику их отображения взять из другого изображения или группы изображений. Например, это может быть стилизация семейной фотографии под стиль известного художника, либо стилизация дневного фото в ночное, либо изменение зимней панорамы в летнюю. Эта задача может применяться в мультипликации, наложении спецэффектов в фильмах и видеоиграх, симуляторах и средствах дополненной реальности, а также для более точной настройки методов машинного обучения работе с изображениями за счет расширения обучающей выборки путем вариации стиля и адаптации стиля под целевую предметную область. Помимо отдельных изображений указанный подход применим для видеопоследовательностей и данных из других предметных областей (текст, речь и т.д.). Основные методы стилизации были предложены в последние 5 лет и опираются на глубинные нейронные сети, базовому изучению которых посвящена существенная часть курса.
+
Спецкурс познакомит слушателей с нейросетями, методами их обучения и регуляризации, задачами обработки изображений, последовательностей и текстов. Будут изучены как задачи классификации и регрессии, так и генеративные модели порождения новых изображений и текстов.
-
==Лектор==
+
Изложение будет вестись с самых основ, поэтому спецкурс подойдет бакалаврам 2 и 3 курса. Бакалаврам 4 курса спецкурс будет интересен тем, что в нём особый акцент будет сделан на практическую реализацию нейросетей.
-
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф.-м.н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ]. Почта: v.v.kitov(at)yandex.ru.
+
-
==Взаимодействие==
+
В частности, будут практические семинары на Python+PyTorch по сравнению методов оптимизации и регуляризации нейросетей, классификации/локализации/стилизации и генерации изображений. Применим продвинутые архитектуры для распознавания пользовательских действий по данным акселерометров, создадим систему автодополнения поисковых запросов и развернём чат-бота локально на компьютере.
-
[https://t.me/joinchat/CqyNIvwz1NE2YTk6 Группа в телеграмме]
+
-
==Расписание==
+
==Лектор==
-
Занятия проходят удалённо по средам (18-30 - 20-00) и по пятницам (19-00 - 20-30) через zoom по [https://zoom.us/j/8043842932?pwd=SUlMOFNRRDRXOG5kcm9pamZMWXdBdz09 ссылке].
+
[[Участник:Victor Kitov|Виктор Владимирович Китов]], к.ф..н., преподаватель кафедры [[Mmp|математических методов прогнозирования]] [http://cmc.msu.ru ВМК МГУ].
-
 
+
-
=Материалы лекций=
+
-
+
-
[https://disk.yandex.ru/i/DahA9a6xJACndA Введение в машинное обучение.]
+
-
 
+
-
[https://disk.yandex.ru/i/KTNghJL8y9SWPA Многослойный персептрон (записи).]
+
-
 
+
-
[https://disk.yandex.ru/i/yLIS882WZvWuJA Градиентный спуск]
+
-
 
+
-
[https://disk.yandex.ru/i/C0OUGYCt2YXCKg Метод обратного распространения ошибки (записи)]
+
-
 
+
-
[https://disk.yandex.ru/i/i_BnuYAjWChnQg Расширение выборки изображений.]
+
-
 
+
-
[https://disk.yandex.ru/i/gph7FwVAtNQ9Dw Сверточные нейросети.]
+
-
 
+
-
[https://disk.yandex.ru/i/cpmM9us878oT7g Основные архитектуры сверточных нейросетей (классификация).]
+
-
[https://disk.yandex.ru/i/vDkARFFSAE2Dhw Семантическая сегментация.]
+
Почта: v.v.kitov(at)yandex.ru.
-
[https://disk.yandex.ru/i/RFZmN0Y14q4nqA Оптимизационный метод переноса стиля.]
+
==Требования к слушателям==
-
[https://disk.yandex.ru/i/wvcSzT2NEay_zQ Трансформационный метод переноса стиля.]
+
Необходимы базовые знания по математическому анализу, линейной алгебре и теории вероятностей. Предварительных знаний по нейронным сетям и методам обработки изображений не требуется.
-
[https://disk.yandex.ru/i/1GM8VR-hyxgsMw Мульти-стилевые трансформационные модели.]
+
==Программа курса==
-
[https://disk.yandex.ru/i/lT4wdWb7Pu47Aw Перенос стиля, основанный на патчах.]
+
* Введение в глубокое обучение.
 +
* Многослойный персептрон. Основные функции активации и функции потерь.
 +
* Автокодировщик.
 +
* Работа в среде Jupyter Lab, Jupyter Notebook. Средства отладки кода.
 +
* Методы оптимизации нейросетей.
 +
* Основы работы с PyTorch, автоматическое дифференцирование, реализация простейших нейросетей.
 +
* Операции свёртки и пулинга. Свёрточные нейросети для обработки текстов и изображений.
 +
* Основные свёрточные архитектуры для классификации изображений.
 +
* Реализация свёрточных сетей и использование предобученных сетей в PyTorch.
 +
* Сегментация изображений.
 +
* Реализация задачи супер-разрешения (super-resolution) и сиамских сетей в PyTorch.
 +
* Задача переноса стиля и её практическая реализация.
 +
* Генеративно-состязательные сети.
 +
* Рекуррентные сети, трансформеры, обработка текстов.
-
[https://disk.yandex.ru/i/A31uPFZJtw3ZoA Генеративно-состязательные сети.]
+
==Практикум==
 +
В рамках практикума необходимо реализовать улучшенния базовых архитектур, разобранных на практических семинарах. От студентов второго курса дополнительно требуется сделать презентацию научной статьи.
-
[https://disk.yandex.ru/i/XC-1YMWi2gE9fg Приложения генеративно-состязательных сетей.]
+
==Прохождение спецкурса==
 +
Для успешной сдачи спецкурса необходимо сдать практикум и устный экзамен.
-
[https://disk.yandex.ru/i/ZURITznAGYBSSA Технические улучшения стилизации.]
+
==Регистрация на курс==
 +
Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.
-
[https://disk.yandex.ru/i/cr8W3R3MguemNw Концептуальные улучшения стилизации.]
+
==Время занятий==
-
[https://disk.yandex.ru/i/pav8WPuuxyfqyA Расширение обучающей выборки.]
+
По понедельникам 18:00 - 19:30 (можем немного позже заканчивать), ауд. 658.
-
[https://disk.yandex.ru/i/N1TWXuRkctQgzQ Стилизация видео.]
+
Первое занятие - 16.02.2026.
-
=Рекомендуемые ресурсы=
+
==Рекомендуемые ресурсы==
-
* Примеры переноса стиля для видео: [https://www.youtube.com/watch?v=Khuj4ASldmU пример 1], [https://www.youtube.com/watch?v=vMyMUNvsGfQ пример 2], [https://www.youtube.com/watch?v=BcflKNzO31A пример 3].
+
* [https://deepmachinelearning.ru Авторсий онлайн-учебник по машинному и глубокому обучению]
-
* [https://arxiv.org/pdf/1705.04058.pdf Обзорная статья по переносу стиля для изображений.]
+
* [https://education.yandex.ru/handbook/ml Учебник школы анализа данных Яндекса по машинному и глубокому обучению]
-
* [https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv Лекции курса в Стэнфорде по сверточным нейронным сетям.]
+
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке PyTorch]
-
* [http://www.pittnuts.com/2015/07/top-conferences-on-machine-learning-and-computer-vision/ Топовые конференции по машинному обучению и компьютерному зрению] (самые интересные статьи там)
+
* [https://scholar.google.ru/ Поиск google по научным статьям]
-
* [https://scholar.google.ru/ Поиск google по статьям.]
+
-
* [https://pytorch.org/tutorials/ Образовательные материалы по библиотеке глубинного обучения PyTorch.]
+
-
* [http://d2l.ai/index.html Книга по глубинному обучению.]
+

Текущая версия


О курсе

Спецкурс познакомит слушателей с нейросетями, методами их обучения и регуляризации, задачами обработки изображений, последовательностей и текстов. Будут изучены как задачи классификации и регрессии, так и генеративные модели порождения новых изображений и текстов.

Изложение будет вестись с самых основ, поэтому спецкурс подойдет бакалаврам 2 и 3 курса. Бакалаврам 4 курса спецкурс будет интересен тем, что в нём особый акцент будет сделан на практическую реализацию нейросетей.

В частности, будут практические семинары на Python+PyTorch по сравнению методов оптимизации и регуляризации нейросетей, классификации/локализации/стилизации и генерации изображений. Применим продвинутые архитектуры для распознавания пользовательских действий по данным акселерометров, создадим систему автодополнения поисковых запросов и развернём чат-бота локально на компьютере.

Лектор

Виктор Владимирович Китов, к.ф.-м.н., преподаватель кафедры математических методов прогнозирования ВМК МГУ.

Почта: v.v.kitov(at)yandex.ru.

Требования к слушателям

Необходимы базовые знания по математическому анализу, линейной алгебре и теории вероятностей. Предварительных знаний по нейронным сетям и методам обработки изображений не требуется.

Программа курса

  • Введение в глубокое обучение.
  • Многослойный персептрон. Основные функции активации и функции потерь.
  • Автокодировщик.
  • Работа в среде Jupyter Lab, Jupyter Notebook. Средства отладки кода.
  • Методы оптимизации нейросетей.
  • Основы работы с PyTorch, автоматическое дифференцирование, реализация простейших нейросетей.
  • Операции свёртки и пулинга. Свёрточные нейросети для обработки текстов и изображений.
  • Основные свёрточные архитектуры для классификации изображений.
  • Реализация свёрточных сетей и использование предобученных сетей в PyTorch.
  • Сегментация изображений.
  • Реализация задачи супер-разрешения (super-resolution) и сиамских сетей в PyTorch.
  • Задача переноса стиля и её практическая реализация.
  • Генеративно-состязательные сети.
  • Рекуррентные сети, трансформеры, обработка текстов.

Практикум

В рамках практикума необходимо реализовать улучшенния базовых архитектур, разобранных на практических семинарах. От студентов второго курса дополнительно требуется сделать презентацию научной статьи.

Прохождение спецкурса

Для успешной сдачи спецкурса необходимо сдать практикум и устный экзамен.

Регистрация на курс

Регистрация на курс происходит на самом спецкурсе по факту посещения, дополнительные действия не требуются.

Время занятий

По понедельникам 18:00 - 19:30 (можем немного позже заканчивать), ауд. 658.

Первое занятие - 16.02.2026.

Рекомендуемые ресурсы

Личные инструменты