Краткое содержание
В этом видео представлен обзор последних исследований в области промт-инжиниринга за январь-март 2025 года. Автор проанализировал 4000 исследований и выделил 300 наиболее полезных и применимых. В видео рассматриваются новые подходы и методы, такие как ролевой подход, цепочка мыслей, контрастное рассуждение, промежуточное резюмирование и другие. Также демонстрируется, как использовать Telegram-бота, созданного на основе этих исследований, для получения консультаций и доступа к материалам.
- Ролевой подход с использованием мультиагентности для разделения задач.
- Различные методы цепочки мыслей, включая программное размышление.
- Техники самопроверки и верификации для повышения точности ответов.
- Важность порядка слов в промптах и использование промежуточного резюмирования.
Введение [0:00]
Автор рассказывает о том, что потратил значительные средства на анализ 4000 научных исследований по промт-инжинирингу, опубликованных в январе-марте 2025 года. Из них было отобрано 300 наиболее полезных и применимых, которые были тщательно изучены и протестированы в течение трех недель. В видео будут представлены самые важные концепции, извлеченные из этих исследований, а также информация о том, как получить доступ к самим исследованиям и созданному на их основе боту.
Новое в ролевом подходе [0:39]
В исследованиях подчеркивается важность указания конкретной роли, которая может помочь в решении конкретной задачи. Вместо общей роли, например, "будь математиком", рекомендуется указывать "будь экспертом в линейной алгебре". Более продвинутый подход - использование мультиагентности, когда задача разделяется на несколько частей, и для каждой части назначается своя роль. Например, при планировании отпуска можно использовать роли турагента для семей с детьми, финансового консультанта, логиста по поездкам и тревел-блогера.
Методы и фреймворки [2:44]
Цепочка мыслей является одним из самых эффективных методов промт-инжиниринга. Нейросети даже создают специализированные модели, обученные на размышлении с использованием цепочек мыслей. Ключевые элементы этого метода включают постепенное рассуждение, вывод промежуточных шагов, определение причинно-следственных связей и самопроверку в процессе рассуждения. Можно не только просить модель рассуждать шаг за шагом, но и самостоятельно прописывать шаги для размышления, контролируя каждый этап.
Причинное CauCot [3:45]
Предварительное улучшение понимания задачи повышает качество рассуждения. Можно дать задание модели понять, что необходимо для ответа на вопрос, расписать шаги, а затем вставить эти шаги в промт.
Структурный Cot [4:12]
Пользователь дает задачу и просит определить все шаги, необходимые для ее решения. Модель обозначает участников, переписывает условия в виде логических импликаций и предлагает приступить к проверке. Это позволяет пользователю видеть все шаги и влиять на ход решения, особенно если он не знает, как решить задачу.
Программное размышление [5:16]
Этот метод предполагает реализацию решения в виде псевдокода Python. Модель должна сформировать функцию, с помощью которой можно решить задачу, не запуская Python. Она записывает код и пошаговое выполнение в псевдокоде. Этот метод обеспечивает максимальную точность, особенно для финансового анализа.
Дерево мыслей [7:49]
Задачи разбиваются на несколько альтернативных вариантов развития, и модели дается возможность вернуться, если она зашла в тупик. Задачу разбивают на подзадачи, и для каждой подзадачи предлагается два-три возможных решения. Модель оценивает эффективность каждой ветки и возвращается на ветку выше, если заходит в тупик.
Контрастный промтинг [8:51]
Языковую модель просят генерировать как правильный, так и неправильный ответ. Этот контраст можно использовать в сочетании с цепочкой мыслей. Это активирует критическое мышление, позволяя модели генерировать противоположные ответы, чтобы избежать неправильных путей.
Цепочка черновиков [10:26]
Модель просят делать минималистичные обобщения, используя не более пяти слов для каждого шага рассуждения. Это позволяет максимально лаконично выражать информацию.
Цепочка размышлений [11:05]
Для решения задачи используются множественные парадигмы. Сначала используется естественное языковое рассуждение, затем алгоритмическое и символическое рассуждение. Это похоже на множественный ролевой промтинг, когда модель сначала думает как психолог, потом как маркетолог, а затем как эсэмэмщик.
Методы самопроверки [11:45]
Внутри промпта закладывается необходимость провести анализ и самокритику. Модель должна оценить свой ответ, найти возможные ошибки и представить улучшенное решение.
Цепочка верификаций [12:21]
Этот метод использует цепочку мыслей и самокритику. Модель должна решить задачу, показывая каждый шаг, и произвести верификацию, проверив, все ли данные и условия корректны.
Порядок слов в промптах [14:36]
Расположение ключевой информации в промте имеет значение. Самую важную информацию рекомендуется помещать в начало или в конец (метасэндвич). В начале задается контекст, активизируются нужные нейроны, а в конце можно продублировать информацию другими словами, чтобы исключить недопонимание. Также можно использовать сужающуюся воронку детализации, начиная с общей задачи и сужая ее до конкретных требований.
Промежуточное резюмирование [16:15]
Модель просят делать обобщающие выводы после значимой информации. Каждый блок информации самаризируется, чтобы модель ориентировалась в этих блоках, особенно если они размечены при помощи булетов, букв или цифр.
Про исследования и бот [19:52]
Автор создал обобщающую PDF-книгу, тематические статьи и Telegram-бота на основе этих исследований. Бот работает на базе модели 4o и может отвечать на вопросы по методам промт-инжиниринга. Пользователи могут задавать боту вопросы, получать краткие объяснения и примеры промтов. Также бот предоставляет ссылки на исследования, чтобы пользователи могли получить более подробную информацию.