КонтекстContext
Команде нужно регулярно выпускать материалы по узкой теме: отраслевые новости, экспертные посты, внутренние дайджесты или подборки для аудитории.The team needs to publish focused material regularly: industry news, expert posts, internal digests or curated updates.
Раньше редактор вручную открывал источники, сравнивал инфоповоды, проверял повторы, выбирал тему, писал текст и отдельно готовил иллюстрацию. Каждый выпуск занимал несколько часов, а уже разобранная тема могла вернуться под другим заголовком.Previously, an editor opened sources manually, compared stories, checked for repeats, chose a topic, wrote the text and prepared an illustration separately. Each issue took several hours, and an old story could return under a different headline.
Бизнес-задачаBusiness task
Нужно было сократить время подготовки выпуска без потери редакторского контроля. Задача состояла не в том, чтобы просто сгенерировать пост, а в том, чтобы собрать управляемый производственный процесс.The goal was to shorten issue preparation without losing editorial control. This was not simply about generating a post; it required a manageable production process.
- Быстро находить подходящие материалы.Find suitable material quickly.
- Не публиковать смысловые повторы.Avoid publishing semantic duplicates.
- Сохранять голос бренда.Preserve the brand voice.
- Получать собранный выпуск в понятном формате.Deliver an assembled issue in a clear format.
- Оставлять финальную проверку человеку.Keep the final review with a person.
Что было реализованоWhat was built
Собран локальный пайплайн полного цикла. Он получает материалы по теме через Perplexity Sonar, сохраняет данные до генерации, проверяет смысловые повторы, оценивает релевантность и выбирает формат выпуска. После этого система готовит текст в голосе бренда и документальную иллюстрацию.A local end-to-end workflow was built. It retrieves topic material through Perplexity Sonar, saves data before generation, checks semantic duplicates, scores relevance and chooses an issue format. It then prepares copy in the brand voice and a documentary-style illustration.
Редактор получает готовый файл для проверки и публикации. Автопостинг намеренно не используется: факты, акценты и финальное решение остаются под контролем человека.The editor receives a ready file for review and publication. Automatic posting is deliberately excluded: facts, emphasis and the final decision remain under human control.
- Сбор источников по заданной теме.Topic-based source collection.
- Семантическая дедупликация за 30 дней.Semantic deduplication across 30 days.
- LLM-скоринг релевантности от 0 до 100.LLM relevance scoring from 0 to 100.
- Один ключевой материал или связный обзор нескольких источников.A single lead story or a coherent multi-source review.
- Текст и документальная иллюстрация в одном процессе.Copy and documentary illustration in one process.
Как решения помогают бизнесуHow the decisions help the business
| РешениеDecision | ЗадачаProblem | ПользаBusiness value |
|---|---|---|
| Сбор источников по темеTopic-based source collection | Убирает ручной мониторинг десятков страниц и лент.Removes manual monitoring of dozens of pages and feeds. | Редактор быстрее получает рабочий пул материалов.The editor gets a usable source pool faster. |
| Сохранение данных до генерацииSaving data before generation | Не даёт потерять результат при сбое одного шага.Prevents losing progress when one step fails. | Работу можно продолжить без повторного сбора.Work can resume without collecting everything again. |
| Смысловая дедупликацияSemantic deduplication | Находит один инфоповод в разных формулировках.Finds the same story despite different wording. | Аудитория не получает повторные пересказы.The audience does not receive repeated retellings. |
| LLM-скоринг 0–100LLM scoring from 0–100 | Отделяет релевантные материалы от формально похожих.Separates relevant material from superficial matches. | Меньше шума, быстрее редакторское решение.Less noise and faster editorial decisions. |
| Два режима выпускаTwo issue modes | Подстраивает структуру под материал дня.Fits structure to the day’s material. | Можно выпустить глубокий пост или связный обзор.The team can publish a deep post or a coherent roundup. |
| Голос бренда в правилах генерацииBrand voice in generation rules | Стабилизирует стиль регулярных материалов.Stabilises the style of recurring material. | Канал звучит последовательно при частом выпуске.The channel stays consistent at a high publishing cadence. |
| Иллюстрация в том же контуреIllustration in the same workflow | Закрывает базовую визуальную задачу выпуска.Covers the issue’s basic visual requirement. | Не нужен отдельный производственный цикл.No separate production cycle is required. |
| Ручной запуск и проверкаManual start and review | Не отдаёт публикацию полностью автоматике.Keeps publication from becoming fully automatic. | Редактор контролирует факты и финальный акцент.The editor controls facts and final emphasis. |
Почему выбрана такая архитектураWhy this architecture
Повторы сравниваются по смыслуDuplicates are compared by meaning
Один инфоповод часто появляется в разных источниках с другими заголовками. Поэтому система использует эмбеддинги и поиск в PostgreSQL с pgvector, а не только сравнение ссылок и строк.One story often appears across sources under different headlines. The system therefore uses embeddings and PostgreSQL with pgvector rather than comparing only links and strings.
Скоринг помогает, но не решает за редактораScoring assists rather than replaces the editor
Отдельный LLM-слой быстрее отсеивает формально похожие материалы. Окончательная оценка смысла и фактов остаётся у редактора.A separate LLM layer quickly removes superficial matches. Final judgement of meaning and facts remains with the editor.
Локальный запуск снижает риск случайной публикацииLocal execution reduces accidental publishing risk
Ручной запуск и отсутствие автопостинга сохраняют редакторскую ответственность и дают понятную точку контроля перед выпуском.Manual execution and no autoposting preserve editorial responsibility and provide a clear control point before publication.
РезультатResult
Подготовка выпуска занимает около 1–2 минут вместо нескольких часов ручной работы. Редактор получает тему, структуру, текст и визуал в одном собранном материале.Preparing an issue takes about 1–2 minutes instead of several hours of manual work. The editor receives the topic, structure, copy and visual as one assembled package.
Повторы за последние 30 дней отсекаются до публикации. Система забирает сбор, первичный отбор и проверку повторов, а человеку оставляет проверку фактов, смысл и финальное решение.Stories repeated within the last 30 days are removed before publication. The system handles collection, initial selection and duplicate checks; the person keeps fact checking, judgement and the final decision.
Где это применимоWhere it applies
Подход подходит регулярным контент-потокам, где важны скорость отбора, единый голос и отсутствие повторов.The approach suits recurring content flows where selection speed, a consistent voice and avoiding repeats matter.
- Отраслевые дайджесты.Industry digests.
- Экспертные Telegram-каналы.Expert Telegram channels.
- Корпоративные рассылки.Corporate newsletters.
- Внутренние аналитические сводки.Internal analytical briefings.
- Новостные подборки для команды.Curated news for teams.
- Контентные продукты с узкой тематикой.Focused content products.
ВыводConclusion
AI здесь работает как редакционный производственный контур, а не как замена экспертизе. Он снимает повторяющуюся работу и делает выпуск предсказуемее.Here, AI works as an editorial production layer rather than a substitute for expertise. It removes repetitive work and makes publishing more predictable.
Если регулярный контент каждый раз собирается вручную, похожий пайплайн может снизить нагрузку на редактора и сохранить контроль над качеством.If recurring content is assembled manually each time, a similar workflow can reduce editorial load while preserving quality control.