Алгебра над алгоритмами и эвристический поиск закономерностей
Материал из MachineLearning.
м (→Задание участникам на осенний семестр 2011 года) |
(→Задание участникам на осенний семестр 2011 года) |
||
Строка 8: | Строка 8: | ||
# '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно). | # '''Прикладное.''' Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно). | ||
- | == | + | == Заcедания 2011 года (осенний семестр) == |
- | + | ||
{{tip| | {{tip| | ||
Третье заседание спецсеминара запланировано на субботу - 29 октября в 10:30. | Третье заседание спецсеминара запланировано на субботу - 29 октября в 10:30. | ||
Строка 25: | Строка 24: | ||
}} | }} | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Число | ||
+ | ! Докладчик | ||
+ | ! Доклад | ||
+ | |- | ||
+ | | 15.10.11 | ||
+ | | '''Остапец Андрей''' (317) | ||
+ | | Доклад «'''Фракталы, аттракторы, нейронные сети'''» по одноименной [http://www.niisi.ru/iont/ni/Library/School-2002/Makarenko-2002.pdf лекции] | ||
+ | |- | ||
+ | | 15.10.11 | ||
+ | | '''Фонарёв Александр''' (317) | ||
+ | | Доклад «'''Эмбедология и нейропрогноз'''» по одноименной [http://www.niisi.ru/iont/ni/Library/School-2003/Makarenko-2003.pdf лекции] | ||
+ | |- | ||
+ | | 15.10.11 | ||
+ | | '''Кондрашкин Дмитрий''' (317) | ||
+ | | Доклад «'''Стохастическая динамика, марковские модели и прогноз'''» по одноименной [http://www.niisi.ru/iont/ni/Library/School-2007/Makarenko-2007.pdf лекции] | ||
+ | |- | ||
+ | | 18.10.11 | ||
+ | | '''Нижибицкий Евгений''' (317) | ||
+ | | Доклад «'''Временные ряды из геометрии и топологии пространственных паттернов'''» по одноименной [http://www.niisi.ru/iont/ni/Library/School-2004/Makarenko-2004.pdf лекции] | ||
+ | |} | ||
+ | == Задание участникам на осенний семестр 2011 года == | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- |
Версия 12:12, 20 октября 2011
Руководитель спецсеминара: д.ф.-м.н. Дьяконов Александр Геннадьевич
|
Работа на спецсеминаре
В рамках работы на спецсеминаре есть два направления исследования:
- Теоретическое. Проводится в рамках алгебраического подхода к решению задач распознавания. Суть подхода: на алгоритмах, которые решают задачи обработки и анализа данных, специальным образом вводятся алгебраические операции. Например, можно складывать алгоритмы (получается опять алгоритм), умножать и т. д. Доказано (Ю. И. Журавлёвым), что среди получаемых алгебраических выражений над «естественными» алгоритмами есть высокоэффективные алгоритмы. На спецсеминаре рассматриваются вопросы: как их строить, анализировать, реализовывать на ЭВМ и т. д. и т. п. Данное направление представляет особую ценность студентам, которые хотят получить самостоятельные результаты в науке и продолжить обучение в аспирантуре.
- Прикладное. Решаются реальные прикладные задачи анализа данных (data mining). Например, классификация сигналов головного мозга, классификация сигналов-показаний работы механизмов, настройка спам-фильтров, автоматическая рубрикация текстов, прогнозирование финансовых временных рядов. От студентов требуется желание глубоко понять задачу (данные и скрытые в них закономерности), умение быстро осваивать новые методы (в незнакомой области), хорошо программировать, выдвигать гипотезы и фантазировать (последнее очень важно).
Заcедания 2011 года (осенний семестр)
Третье заседание спецсеминара запланировано на субботу - 29 октября в 10:30.
Материалы к докладу Дьяконова А.Г.: О двух алгоритмах рекомендательной системы. Необходимо ознакомиться перед докладом. Автор будет признателен за найденные неточности и опечатки. |
18 октября в 08:45 второе заседание спецсеминара!
Сбор у кафедры - 680 ауд. |
15 октября в 10:30 первое заседание спецсеминара!
Сбор у кафедры - 680 ауд. |
Число | Докладчик | Доклад |
---|---|---|
15.10.11 | Остапец Андрей (317) | Доклад «Фракталы, аттракторы, нейронные сети» по одноименной лекции |
15.10.11 | Фонарёв Александр (317) | Доклад «Эмбедология и нейропрогноз» по одноименной лекции |
15.10.11 | Кондрашкин Дмитрий (317) | Доклад «Стохастическая динамика, марковские модели и прогноз» по одноименной лекции |
18.10.11 | Нижибицкий Евгений (317) | Доклад «Временные ряды из геометрии и топологии пространственных паттернов» по одноименной лекции |
Задание участникам на осенний семестр 2011 года
Участник | Задание (каждый сам заполняет свою ячейку) | Комментарий |
---|---|---|
Бобрик Ксения (417) | Выбрать на сайте http://www.sigkdd.org/awards_dissertation.php тему доклада по одной из диссертаций. Темы не должны пересекаться. Можно использовать другие диссертации по согласованию с руководителем. | |
Ермушева Александра (417) | Доклад по диссертации Dr. Wenjun Zhou "Correlation analysis: from computational hardness to practical success" | |
Кириллов Александр (417) | Доклад по диссертации Dr. Tianyi Wu “A Framework for Promotion Analysis in Multi-Dimensional Space” | |
Фигурнов Михаил (417) | Доклад по диссертации Dr. Michael Hay “Enabling Accurate Analysis of Private Network Data” | |
Кондрашкин Дмитрий (317) | Доклад «Стохастическая динамика, марковские модели и прогноз» по одноименной лекции | Состоялся 15.10.2011 в 14:00 |
Нижибицкий Евгений (317) | Доклад «Временные ряды из геометрии и топологии пространственных паттернов» по одноименной лекции | Состоится 18.10.2011 в 8:45 |
Остапец Андрей (317) | Доклад «Фракталы, аттракторы, нейронные сети» по одноименной лекции | Состоялся 15.10.2011 в 10:30 |
Фонарёв Александр (317) | Доклад «Эмбедология и нейропрогноз» по одноименной лекции | Состоялся 15.10.2011 в 12:10 |
Доклады 2011(весна) года
Дата | Докладчик | Название доклада |
---|---|---|
13.04.2011 | Кириллов Александр | Предсказание связности графов |
20.04.2011 | Ермушева Александра | Задачи и методы коллаборативной фильтрации |
04.05.2011 | Платонова Елена | Задачи и методы информационного поиска |
11.05.2011 | Бобрик Ксения | Прогнозирование временных рядов |
Участники спецсеминара
Год выпуска | Участники: |
---|---|
Аспирант, 2010 |
Карпович Павел
Диссертация: «K-сингулярные системы точек в алгебраическом подходе к распознаванию образов» (2010, успешно защищена 18.02.2011 по специальности 01.01.09) |
2013 |
Бобрик Ксения
Ермушева Александра
Кириллов Александр
|
2012 |
|
Выпускники: | |
2010 |
Ахламченкова Ольга
Токарева (Одинокова) Евгения
|
2009 |
Власова Юлия
Логинов Вячеслав
Фёдорова Валентина
Чучвара Алексндра (бакалавр)
|
2008 |
Ломова Дарья
Вершкова Ирина
|
2007 |
Кнорре Анна
Карпович Павел
Сиваченко Евгений
|
2006 |
Ховратович (Курятникова) Татьяна
Мошин Николай
|
2005 |
Каменева Наталия
Силкин Леонид
|
Некоторые решаемые прикладные задачи
- Прогнозирование временных рядов По характеристикам процесса в прошлом предсказать поведение в будущем. Знание о прошлом может быть неполным или ошибочным. Типичный пример: прогнозирование денежных сумм, которые будут сниматься с банкомата в течение следующей недели.
- Классификация технических сигналов и сигналов головного мозга По описанию изменения некоторой характеристики процесса необходимо определить её класс. Например, по электрокортикограмме определить ментальное состояние человека. При этом обучающая выборка (данные, которые у нас есть) была собрана достаточно давно, а тестирование алгоритма будет проводиться потом (при изменённых внешних условиях, а следовательно, при изменённых характеристиках данных).
- Фильтрация спама Настроить спам-фильтр на некотором универсальном обучающем множестве (данных спам-ловушек) так, чтобы он хорошо работал на компьютере конкретного пользователя (без дополнительной донастройки).
- Иерархическая классификация текстов Написать алгоритм автоматической категоризации документов. Например, новостные рассылки необходимо распределить по каталогам «спорт/футбол», «спорт/биатлон», «музыка/концерты», «музыка/рок/исполнители» и т. д.
- Ранжирование документов на основе обучающего множества Написать алгоритм, который оценивает релевантность документа поисковому запросу. Для фиксированного запроса упорядочить документы (используя их признаковые описания) так, чтобы порядок отражал «адекватность» запроса.