В Таймлист AI мы тоже прошли свой путь. Когда-то мы использовали чужие сервисы, но поняли два момента:
1. Встречи часто содержат конфиденциальную информацию - этим нельзя рисковать.
2. Ни одна готовая система не идеально работала «
из коробки» с русскими деловыми разговорами.
Тогда команда начала собирать свой инструмент.
Мы взяли одну из лучших открытых моделей (
Whisper от OpenAI) и начали адаптировать её под наши нужды. Сразу стало ясно: просто скачать модель недостаточно. Пришлось делать много доработок:
- собрали корпус наших записей: реальные переговоры IT-компаний и госструктур. Это позволило «тонко настроить» модель на русский язык и местную специфику. По результатам тестов точность в хороших условиях у нас – 95-98%;
- модели постобработки: мы добавили проверку ошибок и терминов, нормализацию аудио и фильтрацию лишних слов. Есть модуль, который улавливает внутренние названия и расставляет их корректно (не путать «Проект Альфа» с буквой «А»). Другой убирает «эээ» и «ну». Третий разбивает текст на логичные абзацы по смыслу;
- диаризация и идентификация: чтобы гарантированно знать, кто говорит, мы используем голосовые «эмбеддинги» и ML-кластеризацию. Так удаётся выделить, скажем, голоса менеджеров и разработчиков из одной дорожки. Если нужны именно имена (Игорь, Дина), то система может прикреплять известные образцы голоса;
- безопасность и локальность: наш сервис работает и в облаке, и на локальных серверах заказчика. Для корпоративного клиента мы можем развернуть Таймлист в его инфраструктуре – все данные никуда не улетят. Это важно, ведь встреча не должна «прилететь» к посторонним. Более того, мы не делаем онлайн-стенографию «вживую», а запускаем более точные алгоритмы после встречи. Так достигается максимальное качество и минимизация «глюков».
В итоге Таймлист отличается вниманием к российским реалиям. Наш ИИ специально обучен на русском: он понимает падежи, аббревиатуры, сленг и даже безоблачные дни на северных широтах. Мы интегрировали всё с популярными сервисами (
Zoom, Google Meet, Яндекс.Телемост, 1С, amoCRM и др.), чтобы встреча записывалась автоматически и попадала в нашу систему. Когда я смотрю на нашу транскрипцию встречи, то вижу не просто текст, а уже готовый протокол - красиво и удобно.