Практикум на ЭВМ (317)/2011-2012
Материал из MachineLearning.
(→Задания 2012 года (весна)) |
(→Задания 2012 года (весна)) |
||
Строка 13: | Строка 13: | ||
}} | }} | ||
= Задания 2012 года (весна) = | = Задания 2012 года (весна) = | ||
+ | * Работа с пакетом [http://cran.gis-lab.info/ R] | ||
+ | ** [http://alexanderdyakonov.narod.ru/upR.pdf Базовые команды системы R] '''пособие находится в стадии постоянной правки''' | ||
+ | ** Задание будет связано с работой с одним (на выбор) пакете системы R. | ||
* Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner] | * Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner] | ||
** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''. | ** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''. | ||
Строка 20: | Строка 23: | ||
** '''ВАЖНО''' При регистрации на [http://tunedit.org] в названии команды должна присутствовать Ваша фамилия! | ** '''ВАЖНО''' При регистрации на [http://tunedit.org] в названии команды должна присутствовать Ваша фамилия! | ||
** Работа по заданию происходит на вкладке [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение]. | ** Работа по заданию происходит на вкладке [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение]. | ||
+ | ** По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию. | ||
+ | ** Отчёт (см. [Media:z2012v-1.pdf| требования к отчёту ]) должен быть выложен на вкладку [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D0%BA%D1%83%D0%BC_%D0%BD%D0%B0_%D0%AD%D0%92%D0%9C_%28317%29 обсуждение] до '''16:05''' 9 апреля 2012 года. | ||
= Задания 2011 года (осень) = | = Задания 2011 года (осень) = |
Версия 10:40, 28 марта 2012
|
- Обязательный курс для студентов каф. ММП 3 курса, 5-6 семестр.
- Зачёт с оценкой
- Семинарист: А. Г. Дьяконов
- Учебное пособие: Анализ данных, обучение по прецедентам, логические игры, системы WEKA, RapidMiner и MatLab (практикум на ЭВМ кафедры математических методов прогнозирования).
Последние новости
Выложено первое задание весеннего семестра -
решение реальной задачи. Необходима регистрация на ресурсе [1] |
Задания 2012 года (весна)
- Работа с пакетом R
- Базовые команды системы R пособие находится в стадии постоянной правки
- Задание будет связано с работой с одним (на выбор) пакете системы R.
- Работа с пакетами Weka и RapidMiner
- Необходимо до 16:20 19 марта 2012 года предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах doc, rtf, pdf, ps.
- Файлы для тестов в классе
- Решение реальной задачи «Topical Classification of Biomedical Research Papers»
- «Постановка задачи»
- ВАЖНО При регистрации на [2] в названии команды должна присутствовать Ваша фамилия!
- Работа по заданию происходит на вкладке обсуждение.
- По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
- Отчёт (см. [Media:z2012v-1.pdf| требования к отчёту ]) должен быть выложен на вкладку обсуждение до 16:05 9 апреля 2012 года.
Задания 2011 года (осень)
- «Решение реальной задачи»
- «Данные» (2.5Мб-zip-архив) Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.
- К четвергу 15.12.11 надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
- Также студенты к четвергу 15.12.11 представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
- «Восстановление плотности» (вторая сдача - 24 ноября 2011)
- «Игра» (первая сдача - 6 октября 2011, окончательная сдача - 20 октября 2011)
- «Постановка задачи»
- Первая игра (описание)
- Вторая игра (описание)
- Третья игра (описание)
- Новинка! Игроки (zip-архив) (возможно, не все они корректно играют. К сожалению, были подготовлены в спешке.)
Правила сдачи практикума на ЭВМ для студентов 317 группы
- В течение семестра будет несколько заданий.
- На выполнение каждого задания студентам отводится определённый срок (не меньше 2х недель).
- Задания бывают трёх типов: стандартные, соревновательные и зачёты (по пройденным темам).
- Выполнение каждого задания оценивается некоторым кол-вом баллов (стоимость каждого задания заранее объявляется). При проставлении оценки в конце семестра учитывается сумма набранных баллов (например, ОТЛИЧНО ~ 25 баллов и выше, ХОРОШО ~ от 20 до 24 баллов, УДОВЛЕТВОРИТЕЛЬНО ~ от 15 до 19 баллов).
- Для получения оценки ОТЛИЧНО по практикуму достаточно решения всех стандартных задач и сдачи всех промежуточных зачётов.
- Стандартные задания, в основном, являются заданиями реализации алгоритмов, которые изучаются студентами в курсе ММРО и ПА (в весеннем семестре они все являются таковыми).
- Стандартные задания оцениваются фиксированным кол-ом баллов.
- Сдача этих заданий возможна до определённой даты (позже задания не принимаются).
- Соревновательные задания сдаются в один день! За выполнение такого задания студенты получают символическое кол-во баллов (1-2, часто само выполнение является стандартным заданием). Однако все работы студентов упорядочиваются (критерий упорядочивания заранее оговорен) и лучшие три работы получают "вознаграждения" (например, I место - 5 баллов [с учётом цены задания], II место - 4 балла, III место - 3 балла).
- Все задания принимаются только в машзале и только в часы занятий (см. расписание). Соревновательные задания принимаются только на компьютерах машзала (не на ноутбуках). В крайнем случае, задания могут приниматься на кафедре, но только в часы занятий.
- Задание принимается «за один заход». Преподаватель подходит к студенту, сидящему за компьютером, и принимает задание. Если «что-то не работает», то задание не засчитывается. Преподаватель не ждёт, пока студент исправит задание (исправит настройки, внесёт изменения в листинг и перекомпилирует)! В отдельных случаях разрешается доработать задание тут же в компьютерном классе.
- Если в задание входит написание отчёта, то программа без отчёта не принимается. Отчёт можно сдавать в электронной форме (файл *.doc), если не оговорено противное.
- При сдаче необходим исходный код программы, запускающийся файл (*.exe), отчёт (если требуется).
Требования к отчёту
Обязательные разделы и комментарии:
- Титульный лист
Факультет, кафедра, Ф.И.О. студента, название задания, год выполнения.
- Постановка задачи
Поощряется текстуальное (но не формальное) отличие от официальной постановки.
- Алгоритм решения
Точное чёткое описание.
- Прагматика (не обязательно оформлять в виде отдельного раздела)
ПОЧЕМУ и ЗАЧЕМ выбран именно этот метод решения? Какие есть ещё алгоритмы? Сравнение.
- Примеры работы алгоритма
На модельных и «реальных» задачах. Задачи не должны быть слишком тривиальные.
- Руководство пользователя
Интерфейс работы с программой.
- Руководство программиста
Особенности реализации. Интерфейс встраивания Вашего алгоритма в другие программы. Возможности такого встраивания.
- Список использованной литературы.
Включая ссылки на Web-ресурсы.
- Заключение (не обязательно оформлять в виде отдельного раздела)
Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».