Промпт-инжиниринг
Материал из MachineLearning.
Версия 11:17, 16 июня 2026
| | Статья написана с использованием LLM Claude Sonnet 4 и проверена участником Emil Petrov 15:17, 16 июня 2026 (MSD)
Промпт приводится полностью в Обсуждение:Промпт-инжиниринг |
|
Про́мпт-инжини́ринг (англ. prompt engineering) — дисциплина, изучающая методы составления текстовых инструкций (промптов) для управления поведением больших языковых моделей и других генеративных систем искусственного интеллекта с целью получения точных, релевантных и полезных ответов[1]. В отличие от традиционного программирования, промпт-инжиниринг не требует знания языков программирования — взаимодействие с моделью осуществляется на естественном языке.
История
Понятие «промпт» появилось вместе с первыми языковыми моделями, работающими по принципу дополнения текста (text completion). GPT-2 (2019) и GPT-3 (2020) от OpenAI показали, что формулировка запроса существенно влияет на качество ответа. С выходом ChatGPT в 2022 году промпт-инжиниринг оформился в самостоятельную практическую дисциплину: появились руководства, исследовательские работы и специализированные курсы.
Ключевые вехи:
- 2020 — «few-shot learning» в GPT-3: демонстрация того, что несколько примеров в промпте резко улучшают качество[1];
- 2022 — «chain-of-thought prompting»: пошаговые рассуждения в промпте улучшают решение математических задач[1];
- 2023 — выход руководства DAIR.AI «Prompt Engineering Guide»;
- 2024 — интеграция методов промпт-инжиниринга в корпоративные RAG-системы.
Базовые техники
Zero-shot prompting
Простейший вид: задача формулируется без примеров. Модель полагается исключительно на знания, полученные при предобучении.
Few-shot prompting
В промпт включается несколько пар «вход→выход» (shots), которые задают желаемый формат ответа.
Формально, если — входной запрос, а
— демонстрационные примеры, то промпт строится как конкатенация:
и модель максимизирует .
Chain-of-Thought (CoT)
Добавление фразы «Давай думать шаг за шагом» побуждает модель строить промежуточные рассуждения перед финальным ответом. В нотации:
где — цепочка рассуждений (chain of thought).
Self-consistency
Метод, при котором модель несколько раз генерирует цепочку рассуждений с температурой , а финальный ответ выбирается большинством голосов (majority voting).
Tree of Thoughts (ToT)
Расширение CoT: вместо линейной цепочки рассуждений строится дерево возможных шагов. На каждом узле модель оценивает перспективность ветки, что позволяет реализовать поиск по пространству рассуждений.
ReAct
Сочетает рассуждение (Reasoning) с действием (Acting): модель чередует шаги «мысль→действие→наблюдение». Используется в агентных системах, где модель вызывает инструменты (поиск, калькулятор, API).
Системные промпты и роли
Большинство современных трансформерных моделей поддерживают три типа сообщений:
- system — задаёт контекст, роль и ограничения модели;
- user — запрос пользователя;
- assistant — ответ модели.
Системный промпт задаёт «личность» модели и правила взаимодействия.
Продвинутые методы
Prompt chaining
Разбиение сложной задачи на несколько последовательных промптов, где выход одного служит входом следующего. Позволяет справляться с задачами, требующими многошагового планирования.
Retrieval-Augmented Generation (RAG)
Комбинация поиска по базе знаний с генерацией: в промпт динамически включаются релевантные фрагменты документов, найденных по запросу пользователя. Позволяет снизить галлюцинации LLM.
Автоматический промпт-инжиниринг (APE)
Автоматическая оптимизация промпта с помощью самой языковой модели. Формально задача — найти
где — модель с промптом
.
Prompt injection и защита
Атаки типа «prompt injection» — попытки злоумышленника через пользовательский ввод переопределить системный промпт. Защитные меры включают разделение доверенного и недоверенного контекстов и фильтрацию ввода.
Метрики и оценка
Качество промпта оценивается по:
- точности ответа на задачах-бенчмарках (MMLU, GSM8K, HumanEval);
- консистентности (self-consistency rate);
- стоимости токенов;
- латентности (время до первого токена, TTFT).
Связь с дообучением
Промпт-инжиниринг и RLHF-дообучение дополняют друг друга: дообучение фиксирует желаемое поведение модели в её весах, тогда как промпт управляет поведением без изменения весов. Векторные представления (embeddings) промптов используются в «soft prompting» — обучаемых непрерывных префиксах, оптимизируемых градиентным спуском.
Инструменты и фреймворки
- LangChain — популярная библиотека для создания цепочек промптов и RAG-пайплайнов;
- LlamaIndex — специализирован на индексировании и поиске по документам;
- DSPy — декларативный подход к оптимизации промптов;
- PromptFlow — инструмент Microsoft для промпт-инжиниринга в Azure.
Применения
Промпт-инжиниринг применяется в широком спектре задач:
- обработка текстов (суммаризация, перевод, классификация);
- генерация кода и отладка;
- создание контента и творческое письмо;
- агентные системы с инструментами;
- корпоративные чат-боты на основе RAG.
См. также
- Трансформер (модель)
- Большая языковая модель
- Механизм внимания
- Нейросетевое встраивание
- Обучение с подкреплением из обратной связи человека (RLHF)
Примечания
Литература
- Brown T. B. et al. Language Models are Few-Shot Learners // Advances in Neural Information Processing Systems. — 2020. — Т. 33. — С. 1877–1901.
- Wei J. et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models // NeurIPS. — 2022.
- Yao S. et al. ReAct: Synergizing Reasoning and Acting in Language Models // ICLR. — 2023.
- Zhou D. et al. Large Language Models Are Human-Level Prompt Engineers // ICLR. — 2023.
- Sahoo P. et al. A Systematic Survey of Prompt Engineering in Large Language Models // arXiv. — 2024.
- Liu P. et al. Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in NLP. — ACM Computing Surveys. — 2023 T. 55. — С. 1–35.

