Все статьи

90% AI-продуктов — это один промпт в красивой обёртке. Почему это проблема и что с ней делать

90% AI-продуктов — один промпт

Зайдите на Product Hunt и посмотрите раздел AI. Девять из десяти продуктов устроены одинаково: один запрос к ChatGPT/Claude/YandexGPT, обёрнутый в симпатичный интерфейс. Подписка $29 в месяц. «AI делает магию».

Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ. И первые полгода делали ровно то же самое — один промпт, который должен был делать всё. Вот чем это закончилось и почему пришлось переделывать.

Один сотрудник на пять ролей

Представьте, что вы наняли одного человека и сказали: ты теперь журналист, фактчекер, архивариус, редактор и корректор. Одновременно. За одну зарплату.

Именно это мы делали с AI. Один промпт должен был:

  • Вытащить все факты из исходной статьи
  • Проверить, что ничего не переврано
  • Найти, писало ли издание об этом раньше
  • Переписать в стиле конкретного СМИ
  • Не соврать, не додумать и уложиться в объём

Результат: 60% текстов — терпимо. 30% — заметно плохо. 10% — публиковать нельзя. Для демки на созвоне — ок. Для продукта, который отправляет тексты в реальные редакции — катастрофа.

Почему «просто улучшить промпт» не работает

Главная боль не в том, что тексты плохие. А в том, что непонятно, почему они плохие. Факт неверный? Стиль не тот? Контекст потерялся? Когда всё в одном промпте — это чёрный ящик. Крутишь формулировки наугад: чуть сюда — поехал стиль, чуть туда — начал врать.

Это фундаментальная проблема монопромптных продуктов: они не масштабируются по качеству. Можно бесконечно полировать один запрос, но модель всё равно компромиссит. Везде по чуть-чуть, нигде до конца.

Что мы сделали вместо этого

Разобрали одного «универсального сотрудника» на пять специалистов. Каждый умеет одну вещь — и делает её хорошо.

Извлечение фактов. Первый агент получает статью и вытаскивает всё проверяемое: даты, имена, цифры, цитаты. Не пишет, не стилизует. Только извлекает.

Проверка. Второй сверяет каждый факт с исходником. Не додумал ли AI лишнего? Не потерял ли цитату? Каждому факту — процент уверенности.

Контекст. Третий ищет в архиве издания: писали ли они об этом раньше? Если да — формирует отсылки. Это отличает живой рерайт от механического пересказа.

Написание. Четвёртый получает проверенные факты, контекст и стилевой профиль издания. Пишет черновик. Только он работает со стилем — длина предложений, лексика, характерные обороты. Всё выучено на архиве конкретного СМИ.

Критика. Пятый читает черновик и оценивает. Если не одобрил — возвращает на доработку с конкретными замечаниями. До трёх итераций. Не одобрил после третьей — текст уходит на ручную проверку.

Почему это меняет всё для продукта

Можно найти проблему за минуту. Текст плохой — открываем лог. Видим: факты извлечены верно, проверка прошла, контекст найден, а черновик — вступление на 400 слов вместо 80. Проблема найдена, чиним конкретный модуль. С монопромптом: «текст плохой, хз почему, перегенерим и будем надеяться».

Можно улучшать по частям. Стиль поплыл? Меняем только модуль написания. Факты проскакивают? Добавляем источник в модуль проверки. Нужен адаптатор под Telegram? Вставляем в цепочку. Ничего не ломается. С монопромптом каждое изменение — рулетка.

Можно показать клиенту, что именно сделал AI. «AI написал текст» — это чёрный ящик и кринж. «Система проверила 14 фактов, 2 отклонила, нашла 3 связанные публикации в вашем архиве, вот ссылки» — это инструмент, которому можно доверять.

Сколько это стоит

Справедливый вопрос: пять вызовов вместо одного — это же дороже?

Да. Один рерайт через полный пайплайн обходится в ~14 центов. Монопромпт стоил бы ~3 цента. Разница — 11 центов.

Наши клиенты платят 30–55 тысяч рублей в месяц за сотни рерайтов. Себестоимость генерации — доли процента от выручки. А цена фактической ошибки в публикации — репутация издания.

Экономить на вызовах модели, когда на кону репутация — как экономить на тормозных колодках, потому что бензин дорогой.

Когда это не нужно

Если ваш AI-продукт решает одну простую задачу — пересказать текст, сгенерировать заголовок, написать саммари — один промпт справится. Не городите.

Мультиагентная архитектура нужна, когда:

  • Задача распадается на 3+ подзадачи с разными требованиями
  • Нужны внешние инструменты: поиск, база данных, API
  • Ошибки дорогие (в нашем случае — репутация СМИ)
  • Нужно понимать, где сломалось, а не гадать
  • Система должна расти без переписывания с нуля

Один хороший промпт лучше пяти плохих агентов. Но пять хороших агентов лучше одного хорошего промпта — если задача того требует.

Техническую версию с архитектурой пайплайна мы разобрали в отдельной статье.