Виталий Кравцов
AI-разработкаАвтоматизация

AI-автоматизация создания и публикации контента

Для медиа, экспертных каналов и корпоративных рассылок.

Система собирает источники, убирает повторы, оценивает релевантность и готовит выпуск для редакторской проверки.

Хочу так же

Контекст

Команде нужно регулярно выпускать материалы по узкой теме: отраслевые новости, экспертные посты, внутренние дайджесты или подборки для аудитории.

Раньше редактор вручную открывал источники, сравнивал инфоповоды, проверял повторы, выбирал тему, писал текст и отдельно готовил иллюстрацию. Каждый выпуск занимал несколько часов, а уже разобранная тема могла вернуться под другим заголовком.

Бизнес-задача

Нужно было сократить время подготовки выпуска без потери редакторского контроля. Задача состояла не в том, чтобы просто сгенерировать пост, а в том, чтобы собрать управляемый производственный процесс.

  • Быстро находить подходящие материалы.
  • Не публиковать смысловые повторы.
  • Сохранять голос бренда.
  • Получать собранный выпуск в понятном формате.
  • Оставлять финальную проверку человеку.

Что было реализовано

Собран локальный пайплайн полного цикла. Он получает материалы по теме через Perplexity Sonar, сохраняет данные до генерации, проверяет смысловые повторы, оценивает релевантность и выбирает формат выпуска. После этого система готовит текст в голосе бренда и документальную иллюстрацию.

Редактор получает готовый файл для проверки и публикации. Автопостинг намеренно не используется: факты, акценты и финальное решение остаются под контролем человека.

  • Сбор источников по заданной теме.
  • Семантическая дедупликация за 30 дней.
  • LLM-скоринг релевантности от 0 до 100.
  • Один ключевой материал или связный обзор нескольких источников.
  • Текст и документальная иллюстрация в одном процессе.

Как решения помогают бизнесу

РешениеЗадачаПольза
Сбор источников по темеУбирает ручной мониторинг десятков страниц и лент.Редактор быстрее получает рабочий пул материалов.
Сохранение данных до генерацииНе даёт потерять результат при сбое одного шага.Работу можно продолжить без повторного сбора.
Смысловая дедупликацияНаходит один инфоповод в разных формулировках.Аудитория не получает повторные пересказы.
LLM-скоринг 0–100Отделяет релевантные материалы от формально похожих.Меньше шума, быстрее редакторское решение.
Два режима выпускаПодстраивает структуру под материал дня.Можно выпустить глубокий пост или связный обзор.
Голос бренда в правилах генерацииСтабилизирует стиль регулярных материалов.Канал звучит последовательно при частом выпуске.
Иллюстрация в том же контуреЗакрывает базовую визуальную задачу выпуска.Не нужен отдельный производственный цикл.
Ручной запуск и проверкаНе отдаёт публикацию полностью автоматике.Редактор контролирует факты и финальный акцент.

Почему выбрана такая архитектура

Повторы сравниваются по смыслу

Один инфоповод часто появляется в разных источниках с другими заголовками. Поэтому система использует эмбеддинги и поиск в PostgreSQL с pgvector, а не только сравнение ссылок и строк.

Скоринг помогает, но не решает за редактора

Отдельный LLM-слой быстрее отсеивает формально похожие материалы. Окончательная оценка смысла и фактов остаётся у редактора.

Локальный запуск снижает риск случайной публикации

Ручной запуск и отсутствие автопостинга сохраняют редакторскую ответственность и дают понятную точку контроля перед выпуском.

Результат

Подготовка выпуска занимает около 1–2 минут вместо нескольких часов ручной работы. Редактор получает тему, структуру, текст и визуал в одном собранном материале.

Повторы за последние 30 дней отсекаются до публикации. Система забирает сбор, первичный отбор и проверку повторов, а человеку оставляет проверку фактов, смысл и финальное решение.

Где это применимо

Подход подходит регулярным контент-потокам, где важны скорость отбора, единый голос и отсутствие повторов.

  • Отраслевые дайджесты.
  • Экспертные Telegram-каналы.
  • Корпоративные рассылки.
  • Внутренние аналитические сводки.
  • Новостные подборки для команды.
  • Контентные продукты с узкой тематикой.

Вывод

AI здесь работает как редакционный производственный контур, а не как замена экспертизе. Он снимает повторяющуюся работу и делает выпуск предсказуемее.

Если регулярный контент каждый раз собирается вручную, похожий пайплайн может снизить нагрузку на редактора и сохранить контроль над качеством.

Следующий шаг

Хочу так же

Опишите задачу. Я посмотрю контекст и предложу, с чего лучше начать.

Данные используются только для ответа на обращение