Статьи по дате последнего редактирования
Материал из MachineLearning.
Ниже показаны 30 результатов, начиная с № 1151.
Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)
- Методы обучения с подкреплением (06:25, 16 июня 2026)
- Direct Preference Optimization (06:35, 16 июня 2026)
- Group Relative Policy Optimization (06:41, 16 июня 2026)
- Трансформер (модель) (07:56, 16 июня 2026)
- Большая языковая модель (07:58, 16 июня 2026)
- Механизм внимания (07:59, 16 июня 2026)
- Диффузионная модель (08:00, 16 июня 2026)
- RubricRL (08:25, 16 июня 2026)
- Нейросетевое встраивание (08:26, 16 июня 2026)
- Обучение с подкреплением из обратной связи человека (RLHF) (08:59, 16 июня 2026)
- Chain-of-thoughts (09:24, 16 июня 2026)
- Искусственный интеллект (09:34, 16 июня 2026)
- Научная школа в области искусственного интеллекта (09:45, 16 июня 2026)
- Coconut (implicit reasoning) (10:54, 16 июня 2026)
- Self-Distillation Policy Optimization (11:00, 16 июня 2026)
- Промпт-инжиниринг (11:49, 16 июня 2026)
- Ранжирование (18:50, 16 июня 2026)
- Решающее дерево (18:55, 16 июня 2026)
- Вариационный байесовский вывод (04:53, 17 июня 2026)
- Философия. Введение в ИИ (курс лекций, К.В.Воронцов)/Задание 1 (07:15, 17 июня 2026)
- Дистилляция моделей (08:27, 17 июня 2026)
- Компьютерное зрение (08:43, 17 июня 2026)
- Зима искусственного интеллекта (11:51, 17 июня 2026)
- Прогнозирование (15:09, 17 июня 2026)
- Философия. Введение в ИИ (курс лекций, К.В.Воронцов)/Задание 1/Выполнение (15:24, 17 июня 2026)
- Супервыравнивание (16:06, 17 июня 2026)
- Метод радиальных базисных функций (16:22, 17 июня 2026)
- Условия Каруша–Куна–Таккера (16:22, 17 июня 2026)
- Дивергенция Йенсена — Шеннона (16:22, 17 июня 2026)
- Дивергенция Кульбака–Лейблера (17:46, 17 июня 2026)
Просмотреть (предыдущие 50) (следующие 50) (20 | 50 | 100 | 250 | 500)

