система для массового тестирования алгоритмов
классификации на реальных задачах

Напомнить

  Войти  
Регистрация позволяет загружать и тестировать свои алгоритмы и задачи, а также публиковать результаты тестирования. В общем, регистрация — полезная штука. Рекомендуем :)
Зарегистрироваться
  Вход и регистрация

Отчет: Все алгоритмы Weka на задаче UCI.LiverDisorders

demo, 22 Сен 2009 11:02
[Автор не указал описание отчета]
на разбиении отображать доверительный интервал
— Средняя ошибка на разбиениях, полученных при скользящем контроле.
— Переобученность - это разность между средними ошибками на контроле и на обучении. Чем больше разность, тем больше вероятность переобучения.
— Среднее смещение характеризует степень несогласованности данного объекта с алгоритмом обучения. Чем меньше смещение, тем лучше алгоритм подходит для решения конкретной задачи.
— Средняя вариация характеризует степень изменчивости результата обучения на данном объекте при варьировании состава обучающей выборки. Чем меньше вариация, тем устойчивее алгоритм классификации.
— Объект называется пограничным, если его отступ находится вблизи нуля. При наличии доверительного интервала мы используем более строгое определение пограничного объекта: объект называется пограничным, если нуль входит в его доверительный интервал.
— Шумовым объект называется, если его отступ меньше нуля. В нашем случае, когда мы имеем ещё доверительный интервал, считаем, что объект шумовой это тот объект, у которого весь доверительный интервал лежит меньше нуля.\n Чем меньше шумовых объектов, тем лучше работает алгоритм классификации и (или) тем лучше сама выборка (содержит мало выбросов).
— Объект называется эталонным, если его отступ находится вблизи единицы. В нашем случае, когда мы имеем ещё доверительный интервал, считаем, что эталонный это тот объект, у которого весь доверительный интервал около единицы.
Транспонировать таблицу отчета
UCI_Liver_Disorders
functions.SMO
0.4200
0.4058 - 0.4493
lazy.KStar
0.3496
0.2174 - 0.4638
bayes.NaiveBayes
0.4467
0.2609 - 0.5797
trees.J48
0.3643
0.2464 - 0.4928
bayes.BayesNet
functions.MultilayerPerceptron
0.3072
0.1884 - 0.4203
functions.Logistic
0.3142
0.2174 - 0.3913
meta.AdaBoostM1
0.3362
0.2174 - 0.4783
meta.Bagging
0.3171
0.1884 - 0.4638
meta.LogitBoost
0.3026
0.2174 - 0.4493
rules.DecisionTable
0.4214
0.3478 - 0.5507
rules.JRip
0.3496
0.2609 - 0.4348
trees.LADTree
0.3336
0.2464 - 0.4928
trees.RandomForest
0.3174
0.2174 - 0.4348
trees.RandomTree
0.3681
0.2609 - 0.4928
random
0.4954
0.3623 - 0.6377
const
0.4203
0.4203 - 0.4203