Статьи по дате последнего редактирования

Материал из MachineLearning.

Перейти к: навигация, поиск

Ниже показаны 30 результатов, начиная с № 1151.

Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)

  1. Методы обучения с подкреплением ‎(06:25, 16 июня 2026)
  2. Direct Preference Optimization ‎(06:35, 16 июня 2026)
  3. Group Relative Policy Optimization ‎(06:41, 16 июня 2026)
  4. Трансформер (модель) ‎(07:56, 16 июня 2026)
  5. Большая языковая модель ‎(07:58, 16 июня 2026)
  6. Механизм внимания ‎(07:59, 16 июня 2026)
  7. Диффузионная модель ‎(08:00, 16 июня 2026)
  8. RubricRL ‎(08:25, 16 июня 2026)
  9. Нейросетевое встраивание ‎(08:26, 16 июня 2026)
  10. Обучение с подкреплением из обратной связи человека (RLHF) ‎(08:59, 16 июня 2026)
  11. Chain-of-thoughts ‎(09:24, 16 июня 2026)
  12. Искусственный интеллект ‎(09:34, 16 июня 2026)
  13. Научная школа в области искусственного интеллекта ‎(09:45, 16 июня 2026)
  14. Coconut (implicit reasoning) ‎(10:54, 16 июня 2026)
  15. Self-Distillation Policy Optimization ‎(11:00, 16 июня 2026)
  16. Промпт-инжиниринг ‎(11:49, 16 июня 2026)
  17. Ранжирование ‎(18:50, 16 июня 2026)
  18. Решающее дерево ‎(18:55, 16 июня 2026)
  19. Вариационный байесовский вывод ‎(04:53, 17 июня 2026)
  20. Философия. Введение в ИИ (курс лекций, К.В.Воронцов)/Задание 1 ‎(07:15, 17 июня 2026)
  21. Дистилляция моделей ‎(08:27, 17 июня 2026)
  22. Компьютерное зрение ‎(08:43, 17 июня 2026)
  23. Зима искусственного интеллекта ‎(11:51, 17 июня 2026)
  24. Прогнозирование ‎(15:09, 17 июня 2026)
  25. Философия. Введение в ИИ (курс лекций, К.В.Воронцов)/Задание 1/Выполнение ‎(15:24, 17 июня 2026)
  26. Супервыравнивание ‎(16:06, 17 июня 2026)
  27. Метод радиальных базисных функций ‎(16:22, 17 июня 2026)
  28. Условия Каруша–Куна–Таккера ‎(16:22, 17 июня 2026)
  29. Дивергенция Йенсена — Шеннона ‎(16:22, 17 июня 2026)
  30. Дивергенция Кульбака–Лейблера ‎(17:46, 17 июня 2026)

Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)