90% AI-продуктов — это один промпт в красивой обёртке. Почему это проблема и что с ней делать
Зайдите на Product Hunt и посмотрите раздел AI. Девять из десяти продуктов устроены одинаково: один запрос к ChatGPT/Claude/YandexGPT, обёрнутый в симпатичный интерфейс. Подписка $29 в месяц. «AI делает магию».
Мы строим AI-систему для автоматизации рерайта новостей в региональных СМИ. И первые полгода делали ровно то же самое — один промпт, который должен был делать всё. Вот чем это закончилось и почему пришлось переделывать.
Один сотрудник на пять ролей
Представьте, что вы наняли одного человека и сказали: ты теперь журналист, фактчекер, архивариус, редактор и корректор. Одновременно. За одну зарплату.
Именно это мы делали с AI. Один промпт должен был:
- Вытащить все факты из исходной статьи
- Проверить, что ничего не переврано
- Найти, писало ли издание об этом раньше
- Переписать в стиле конкретного СМИ
- Не соврать, не додумать и уложиться в объём
Результат: 60% текстов — терпимо. 30% — заметно плохо. 10% — публиковать нельзя. Для демки на созвоне — ок. Для продукта, который отправляет тексты в реальные редакции — катастрофа.
Почему «просто улучшить промпт» не работает
Главная боль не в том, что тексты плохие. А в том, что непонятно, почему они плохие. Факт неверный? Стиль не тот? Контекст потерялся? Когда всё в одном промпте — это чёрный ящик. Крутишь формулировки наугад: чуть сюда — поехал стиль, чуть туда — начал врать.
Это фундаментальная проблема монопромптных продуктов: они не масштабируются по качеству. Можно бесконечно полировать один запрос, но модель всё равно компромиссит. Везде по чуть-чуть, нигде до конца.
Что мы сделали вместо этого
Разобрали одного «универсального сотрудника» на пять специалистов. Каждый умеет одну вещь — и делает её хорошо.
Извлечение фактов. Первый агент получает статью и вытаскивает всё проверяемое: даты, имена, цифры, цитаты. Не пишет, не стилизует. Только извлекает.
Проверка. Второй сверяет каждый факт с исходником. Не додумал ли AI лишнего? Не потерял ли цитату? Каждому факту — процент уверенности.
Контекст. Третий ищет в архиве издания: писали ли они об этом раньше? Если да — формирует отсылки. Это отличает живой рерайт от механического пересказа.
Написание. Четвёртый получает проверенные факты, контекст и стилевой профиль издания. Пишет черновик. Только он работает со стилем — длина предложений, лексика, характерные обороты. Всё выучено на архиве конкретного СМИ.
Критика. Пятый читает черновик и оценивает. Если не одобрил — возвращает на доработку с конкретными замечаниями. До трёх итераций. Не одобрил после третьей — текст уходит на ручную проверку.
Почему это меняет всё для продукта
Можно найти проблему за минуту. Текст плохой — открываем лог. Видим: факты извлечены верно, проверка прошла, контекст найден, а черновик — вступление на 400 слов вместо 80. Проблема найдена, чиним конкретный модуль. С монопромптом: «текст плохой, хз почему, перегенерим и будем надеяться».
Можно улучшать по частям. Стиль поплыл? Меняем только модуль написания. Факты проскакивают? Добавляем источник в модуль проверки. Нужен адаптатор под Telegram? Вставляем в цепочку. Ничего не ломается. С монопромптом каждое изменение — рулетка.
Можно показать клиенту, что именно сделал AI. «AI написал текст» — это чёрный ящик и кринж. «Система проверила 14 фактов, 2 отклонила, нашла 3 связанные публикации в вашем архиве, вот ссылки» — это инструмент, которому можно доверять.
Сколько это стоит
Справедливый вопрос: пять вызовов вместо одного — это же дороже?
Да. Один рерайт через полный пайплайн обходится в ~14 центов. Монопромпт стоил бы ~3 цента. Разница — 11 центов.
Наши клиенты платят 30–55 тысяч рублей в месяц за сотни рерайтов. Себестоимость генерации — доли процента от выручки. А цена фактической ошибки в публикации — репутация издания.
Экономить на вызовах модели, когда на кону репутация — как экономить на тормозных колодках, потому что бензин дорогой.
Когда это не нужно
Если ваш AI-продукт решает одну простую задачу — пересказать текст, сгенерировать заголовок, написать саммари — один промпт справится. Не городите.
Мультиагентная архитектура нужна, когда:
- Задача распадается на 3+ подзадачи с разными требованиями
- Нужны внешние инструменты: поиск, база данных, API
- Ошибки дорогие (в нашем случае — репутация СМИ)
- Нужно понимать, где сломалось, а не гадать
- Система должна расти без переписывания с нуля
Один хороший промпт лучше пяти плохих агентов. Но пять хороших агентов лучше одного хорошего промпта — если задача того требует.
Техническую версию с архитектурой пайплайна мы разобрали в отдельной статье.