Практикум на ЭВМ (317)/2011-2012

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
(Задания 2012 года (весна))
Текущая версия (06:55, 5 сентября 2017) (править) (отменить)
 
(14 промежуточных версий не показаны.)
Строка 7: Строка 7:
= Последние новости =
= Последние новости =
 +
 +
{{tip|
 +
Для тех, кто не сдал задачу '''5 мая'''
 +
добавлены файлы с заданием (теперь они доступны для скачивания)!
 +
}}
 +
 +
{{tip|
{{tip|
-
Смотрите внимательно перечень заданий!
+
Сдача задания по модельной задаче (презентация исследований) состоится '''5 мая'''.
 +
Необходимо до этого числа (!) прислать файл ''' [''Имя файла с задачей'']z.mat ''' (пример имени файла: mat317n21trainz.mat),
 +
в котором содержатся 2 переменные: '''ANS''' (вектор-столбец с ответами для всех объектов),
 +
'''FEAT''' (логическая вектор-строка с пометками существенных признаков).
 +
Если задача решена не в Матлабе и ответ не может быть переконвертирован в нужный формат,
 +
присылаются два txt-файла ''' [''Имя файла с задачей'']ANS.txt ''', ''' [''Имя файла с задачей'']FEAT.txt '''.
-
Там появились новые требования.
 
}}
}}
= Задания 2012 года (весна) =
= Задания 2012 года (весна) =
 +
* Модельные задачи. [[Media:z2012v-2.pdf| '''Постановка задачи и перечень модельных задач''']]
* Работа с пакетом [http://cran.gis-lab.info/ R]
* Работа с пакетом [http://cran.gis-lab.info/ R]
** [http://alexanderdyakonov.narod.ru/upR.pdf Базовые команды системы R] '''пособие находится в стадии постоянной правки'''
** [http://alexanderdyakonov.narod.ru/upR.pdf Базовые команды системы R] '''пособие находится в стадии постоянной правки'''
-
** Задание будет связано с работой с одним (на выбор) пакетом системы [http://cran.gis-lab.info/ R].
+
** Задание: сделать обзор одного из пакетов системы [http://cran.gis-lab.info/ R]. [http://cran.gis-lab.info/web/views/ Здесь] находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории [http://cran.gis-lab.info/web/views/MachineLearning.html Machine Learning]. '''Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.'''
* Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner]
* Работа с пакетами [http://www.cs.waikato.ac.nz/~ml/weka/ Weka] и [http://www.rapidminer.com/ RapidMiner]
** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''.
** Необходимо до '''16:20 19 марта 2012 года''' предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах ''doc, rtf, pdf, ps''.
Строка 79: Строка 91:
* Заключение (не обязательно оформлять в виде отдельного раздела)
* Заключение (не обязательно оформлять в виде отдельного раздела)
''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».''
''Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».''
 +
 +
[[Категория:Кафедра Математические методы прогнозирования ВМиК МГУ]]
 +
[[Категория:Учебные практикумы]]

Текущая версия

Содержание

Последние новости

Для тех, кто не сдал задачу 5 мая

добавлены файлы с заданием (теперь они доступны для скачивания)!



Сдача задания по модельной задаче (презентация исследований) состоится 5 мая.

Необходимо до этого числа (!) прислать файл [Имя файла с задачей]z.mat (пример имени файла: mat317n21trainz.mat), в котором содержатся 2 переменные: ANS (вектор-столбец с ответами для всех объектов), FEAT (логическая вектор-строка с пометками существенных признаков). Если задача решена не в Матлабе и ответ не может быть переконвертирован в нужный формат, присылаются два txt-файла [Имя файла с задачей]ANS.txt , [Имя файла с задачей]FEAT.txt .


Задания 2012 года (весна)

  • Модельные задачи. Постановка задачи и перечень модельных задач
  • Работа с пакетом R
    • Базовые команды системы R пособие находится в стадии постоянной правки
    • Задание: сделать обзор одного из пакетов системы R. Здесь находится список пакетов "по тематикам". Предпочтителен выбор пакетов из категории Machine Learning. Выложить отчёт на вкладку "обсуждение" до 23 апреля 2012 года.
  • Работа с пакетами Weka и RapidMiner
    • Необходимо до 16:20 19 марта 2012 года предоставить отчёт о решении задачи анализа данных в этих системах (с описанием задачи, действий по решению, результатов, приложениями скрин-сейвов, выводами). Отчёт принимается в форматах doc, rtf, pdf, ps.
    • Файлы для тестов в классе
  • Решение реальной задачи «Topical Classification of Biomedical Research Papers»
    • «Постановка задачи»
    • ВАЖНО При регистрации на [1] в названии команды должна присутствовать Ваша фамилия!
    • Работа по заданию происходит на вкладке обсуждение.
    • По условию конкурса необходимо предоставить краткий отчёт организаторам! Без него команда выбывает из соревнования. Возможно, это повлечёт удаление из рейтинга, за который студенты также получают баллы по этому заданию.
    • Отчёт (см. требования к отчёту) должен быть выложен на вкладку обсуждение до 16:05 9 апреля 2012 года.

Задания 2011 года (осень)

  • «Решение реальной задачи»
    • «Данные» (2.5Мб-zip-архив) Объекты записаны по строкам в текстовых файлах, первый признак целевой, X1.txt - обучение, X2.txt - контроль.
    • К четвергу 15.12.11 надо реализовать в среде MATLAB байесовский классификатор и метрический классификатор. Решить с их помощью реальную задачу. В результате экспериментов выбрать оптимальные параметры алгоритмов (например, тип метрического алгоритма, k, веса и т.п.). Функционал качества - ROC AUC. Написать краткий отчёт (сдача допускается в электронной форме).
    • Также студенты к четвергу 15.12.11 представляют вектор ответов реальной задачи (его не обязательно получить методом kNN или байесовским классификатором). По результатам сдачи проводится соревнование (I место - 5 баллов, II - 3, III - 2).
  • «Восстановление плотности» (вторая сдача - 24 ноября 2011)
  • «Игра» (первая сдача - 6 октября 2011, окончательная сдача - 20 октября 2011)

Правила сдачи практикума на ЭВМ для студентов 317 группы

  • В течение семестра будет несколько заданий.
  • На выполнение каждого задания студентам отводится определённый срок (не меньше 2х недель).
  • Задания бывают трёх типов: стандартные, соревновательные и зачёты (по пройденным темам).
  • Выполнение каждого задания оценивается некоторым кол-вом баллов (стоимость каждого задания заранее объявляется). При проставлении оценки в конце семестра учитывается сумма набранных баллов (например, ОТЛИЧНО ~ 25 баллов и выше, ХОРОШО ~ от 20 до 24 баллов, УДОВЛЕТВОРИТЕЛЬНО ~ от 15 до 19 баллов).
  • Для получения оценки ОТЛИЧНО по практикуму достаточно решения всех стандартных задач и сдачи всех промежуточных зачётов.
  • Стандартные задания, в основном, являются заданиями реализации алгоритмов, которые изучаются студентами в курсе ММРО и ПА (в весеннем семестре они все являются таковыми).
  • Стандартные задания оцениваются фиксированным кол-ом баллов.
  • Сдача этих заданий возможна до определённой даты (позже задания не принимаются).
  • Соревновательные задания сдаются в один день! За выполнение такого задания студенты получают символическое кол-во баллов (1-2, часто само выполнение является стандартным заданием). Однако все работы студентов упорядочиваются (критерий упорядочивания заранее оговорен) и лучшие три работы получают "вознаграждения" (например, I место - 5 баллов [с учётом цены задания], II место - 4 балла, III место - 3 балла).
  • Все задания принимаются только в машзале и только в часы занятий (см. расписание). Соревновательные задания принимаются только на компьютерах машзала (не на ноутбуках). В крайнем случае, задания могут приниматься на кафедре, но только в часы занятий.
  • Задание принимается «за один заход». Преподаватель подходит к студенту, сидящему за компьютером, и принимает задание. Если «что-то не работает», то задание не засчитывается. Преподаватель не ждёт, пока студент исправит задание (исправит настройки, внесёт изменения в листинг и перекомпилирует)! В отдельных случаях разрешается доработать задание тут же в компьютерном классе.
  • Если в задание входит написание отчёта, то программа без отчёта не принимается. Отчёт можно сдавать в электронной форме (файл *.doc), если не оговорено противное.
  • При сдаче необходим исходный код программы, запускающийся файл (*.exe), отчёт (если требуется).

Требования к отчёту

Обязательные разделы и комментарии:

  • Титульный лист

Факультет, кафедра, Ф.И.О. студента, название задания, год выполнения.

  • Постановка задачи

Поощряется текстуальное (но не формальное) отличие от официальной постановки.

  • Алгоритм решения

Точное чёткое описание.

  • Прагматика (не обязательно оформлять в виде отдельного раздела)

ПОЧЕМУ и ЗАЧЕМ выбран именно этот метод решения? Какие есть ещё алгоритмы? Сравнение.

  • Примеры работы алгоритма

На модельных и «реальных» задачах. Задачи не должны быть слишком тривиальные.

  • Руководство пользователя

Интерфейс работы с программой.

  • Руководство программиста

Особенности реализации. Интерфейс встраивания Вашего алгоритма в другие программы. Возможности такого встраивания.

  • Список использованной литературы.

Включая ссылки на Web-ресурсы.

  • Заключение (не обязательно оформлять в виде отдельного раздела)

Выводы, сделанные для себя. Ответ на вопрос «Если бы у меня было больше времени…», ожидаемый результат. Возможности улучшения Вашего алгоритма. Советы «новичкам».

Личные инструменты