Блог им. VyacheslavRyumin
В России решили разработать технологичный продукт. Вот что из этого вышло.
Сейчас вы можете прикрепить к рюкзаку устройство — и вечером посмотреть, как вашего ребёнка травили в школе, какие уроки о важном он послушал и что говорила учительница. Или повесить такой диктофон на бариста и увидеть, предлагает ли он сиропы, как учили на тренинге. Или дать доставщику и понять, вежлив ли он с клиентами.
ДИСКЛЕЙМЕР: статья написана на основе интервью с Павлом Баздыревым, основателем бренда «Союз», и Наташей Флокси, создателем Dailo, речевых тренажёров.
Умный диктофон пишет речь, анализирует её и даёт рекомендации. Это замкнутый цикл: устройство слушает, показывает проблемы, связывает их с обучением и проверяет, изменилось ли что-то.

Делают его двое опытных предпринимателей, которые думали, что их опыт поможет. Влетели на два года и 30 миллионов рублей, на выходе получили 30 устройств.
Вот их история.
Я — Паша, больше 10 лет делаю микрофоны под брендом «Союз». Аналоговое железо, студия в Туле, глубокая экспертиза в акустике и схемотехнике — классная история, я вложил в нее душу, но я понимал, что рынок узкий и большие деньги тут не заработать. А амбиции есть.
Наташа — 8 лет делает Dailo, речевые тренажёры для корпораций. Человек берёт телефон, общается с виртуальным агентом, тренирует навыки разговора — клиенты крупные. Dailo — номер один в России в этой нише.
Проблема у Dailo такая: компании покупают обучение, сотрудники тренируются, но никто потом не знает, изменилось ли поведение на местах. Вроде чеки выросли, вроде адаптация быстрее, но клиент говорит: «У нас там столько всего внедрено, скорее всего не вы помогли». Наташа знала, что эффект есть, но доказать не могла.
В 2022 году Билайн позвонил клиентам Dailo и предложил им попробовать аудиобейдж от компании VocaTech — устройство с E-ink экраном, которое крепится на магнит, пишет речь и анализирует.
Идея в том, что бейдж носит продавец или кассир, записывает всё, что говорит, как общается с покупателями — вечером можно послушать, посмотреть метрики. Вечный тайный покупатель.
Наташа посмотрела на этот бейдж и подумала: идея классная, если подключить к Dailo — можно увидеть, что было до обучения и что стало после, доказать эффект, замкнуть цикл. Аудит → обучение → контроль.
Но сам бейдж её не устроил — неудобный, некрасивый, работает некруто. Даунгрейд какой-то.
Мы с Наташей знакомы давно, с 2010 года. Живём в разных городах, периодически созваниваемся.
В декабре 2023 она звонит:
— Паш, слушай, у меня идея. Нужны бейджи, но клёвые. У тебя микрофоны, у меня софт. Может, вместе сделаем?
Я подумал: логично. У меня звук и железо, у неё софт и продукт, осталось добавить бейдж к тому, что уже умеем.
Потом я это сформулировал одной фразой:
«Я думал, если умею делать скрипки, смогу сделать холодильник. Задачи похожие, а всё остальное — другое».
Новичок бы перепроверил сто раз. Мы были уверены и влетели.
Это 2023 год, ChatGPT только начал активно проникать в жизнь. Я думал: сейчас разберусь, попрошу схему — станет понятно.
Говорю ему: «Нарисуй схему диктофона». Рисует. Вроде понятно. Говорю пацану: «Давайте напаяем».
Начинаем складывать — ни хрена не работает. Говнище какое-то: шипит, кряхтит, не пишет.
Снова иду в чат, говорю: «Не работает, что не так?».
А он мне: «Да, извини, я ошибся. Давай разработаем действительно хорошую схему, которая идеально подойдет под твои запросы, без ошибок и осечек»
GPT отбросили, время потеряли. Поняли — делаем с нуля.
Первые траты: месяц времени, около 200 тысяч на макеты.
Вторая мысль была простая: на Алиэкспрессе наверняка есть готовые решения, китайцы уже делают такие штуки. Ничего нет.
Я такой: ладно, поеду на выставку. Гонконг, Electronics, супер-хай-тек — там точно найду.
На всю выставку две конторы с диктофонами. Одна делает ручку-диктофон для учителей, вторая — магнитную карту с E-ink и диктофоном. Две конторы на всё.

Нашли в Гонконге контору с диктофонами-ручками. Я такой: ладно, хоть у них есть понимание темы. Говорю: «Где фабрика?» — «В Шэньчжэне».
Едем в Шэньчжэнь, приезжаем на фабрику. Первое, что вижу — домофоны «Визит», вот эти пластиковые трубки.

Вывод простой: кажется, что всё придумано и где-то производится. А копнёшь — ничего нет на самом деле.
Траты на поездку: около 300 тысяч.
На каком-то этапе подумали: может, не надо всё делать самим? Есть же Игорь, который диктофоны делает много лет, у него опыт и компетенции.
Он производитель самых маленьких в мире диктофонов, которые даже попали в книгу рекордов Гиннеса. Я понял — это же то что нам нужно. Мы сразу поехали в Зеленоград.
Записи с диктофонов Игоря имели вес в суде, поэтому в 90-е хорошо пользовались спросом, 90-е кончились и сейчас никому не нужно кого-то массово писать. И спрос на такие диктофоны упал.
Предложили ему долю: «Ты за хард отвечаешь, мы за софт, делим процент». Наташа ездила к Игорю в Зеленоград, я позвал его к себе в Тулу. Умасливали, водили в ресторан, объясняли перспективы.
Игорь сильный чувак с большими компетенциями, но он говорит: «Мне интересно продавать своё». Принципиально разные позиции — мы хотим развивать вместе, он хочет поставлять готовое.
Когда зависишь от человека, которого не контролируешь — это всегда ограничение. Если понадобится версия с экраном зелёного цвета, я не спрашиваю ни у кого, сам отвечу за свои слова.
Не поругались, но не сошлись.
Траты на переговоры: два месяца времени.
Пошли делать сами.
10 лет делаю микрофоны, думал — диктофон похожая история, справлюсь. Оказалось: микрофоны — это аналоговая схемотехника, резисторы, конденсаторы, транзисторы, всё понятно и знакомо.
А здесь микроконтроллер, прошивка, контроллер заряда — совсем другое устройство, другого уровня сложности. Само устройство технически сложнее, чем кажется.
Микроконтроллер понимает, когда человек говорит, а когда вокруг просто шум. От этого зависит и качество записи, и время работы батареи. Ещё настраивается чувствительность под условия: тихий офис, громкий цех или самолёт с постоянным гулом — устройство может слышать только речь носителя или захватывать звук на три метра вокруг.

Специалисты из «Союза» не подходят — они аналоговые, тут нужна цифра. Людей с такими компетенциями в Туле просто нет, пришлось искать с нуля.
Нашли ребят в Москве из Бауманки: «Мы шарим, всё сделаем». Делали долго, сделали криво, пришлось переделывать.
Каждая переделка — это минус месяц времени. Заказываем печатную плату, ждём 2-3 недели, паяем, тестируем — оказывается, забыли резистор или не тот номинал поставили, или контроллер вообще не подходит. Переразвести схему, тесты, новый заказ, производство, тестирование, новая прошивка под всё это — месяц ушёл.

Потом выяснилось: нормальные микроконтроллеры под санкциями. Любой хороший контроллер ты просто не купишь официально, надо везти из Китая в чемоданах, кто как может. Купим 5-10 штук для прототипа, но если масштабироваться на 2000 устройств — это уже проблема. От таких компонентов отказывались, чтобы не попадать в зону риска.
Первые прототипы делали в России на 3D-принтерах — печатали корпуса, паяли платы, тестировали. Потом поехали в Китай — проще заказать там, потому что комплектующие всё равно оттуда едут. Плюс обработка алюминия, ЧПУ, анодирование у нас в разы дороже.
Плюс мы не знали, какую форму хотим — она стала понятна только со временем. Сначала хотели бейдж с e-ink экраном, потом думали сделать устройство из двух частей, как iPendant, но это сложновато и дороже. Под каждый форм-фактор своя плата, свои размеры — всё приходилось переделывать.
Форму меняли четыре раза — и каждый раз это новая плата.
Первый вариант — квадрат 55×55×8 мм с e-ink экраном. Как у конкурентов. Сделали макет — получилось громоздко и старомодно. Экран убрали.
Второй вариант — квадрат-клипса из двух корпусов, соединённых перемычкой. Идея красивая, но пришлось бы переделывать всю схемотехнику. Остановились вовремя.
Дальше пробовали круг, овал, ещё десяток форм. Сгенерировали больше ста макетов через ChatGPT и Manus — часть выглядела непривлекательно, часть слишком футуристично. Но это помогло понять направление.
В итоге сделали проще всего: корпус по размеру платы. Прямоугольник 57×32×13 мм,. Крепится вертикально — так эстетичнее, чем горизонтально.

Первые макеты печатали на 3D-принтере из пластика. BGA-компоненты паяли вручную — микроскопические детали под лупой.
Магнитные крепления заказывали на Ozon — стандартные, для бейджей. Кустарно, и мы искали альтернативу.

Купили два устройства конкурентов: Plaud Note Pin и Limitless Pendant.

Миниатюрные, эффектные — больше похожи на модный аксессуар, чем на рабочий инструмент. Ориентиром выбрали Plaud.
Производство корпусов тоже непросто: обработка алюминия на ЧПУ и анодирование в России стоят намного дороже, чем в Китае. Поэтому финальную сборку делали там.

На данный момент выпуск возможен в черном и серебристом варианте. Вес всего 33 грамма.
В ноябре 2025 получили из Китая партию 30 железок. Реально два года шли к этой первой партии из тридцати устройств.
Траты на железо: около 15 миллионов (команда, прототипы, производство).
Когда начинали, казалось: железо сложно, а софт у Наташи уже есть, доработаем немножко. Оказалось наоборот — софт оказался сложнее.
Софт — это два больших блока. Первый — сервер, который принимает аудиофайл с устройства и расшифровывает его правильно. Второй — личный кабинет с метриками, то что видит клиент.
Блок 1: сервер
Есть транскрибация — превратить речь в текст. Это несложно, базовый speech-to-text.
Но есть диаризация — разделить поток речи по спикерам. Когда у тебя просто запись разговора, надо понять, где говорил продавец, а где покупатель — программа анализирует частоты голосов, темпы речи, паузы между фразами. Это на порядок сложнее простой расшифровки, требует больше вычислительной мощности и специальных алгоритмов. Мы довели точность до 95 процентов, можем распознать до восьми спикеров одновременно.
Дальше идёт аналитика. Больше ста метрик: время разговора, паузы, вежливость, возражения, соблюдение скриптов, эмоциональная окраска.
Корпораты хотят видеть разные метрики в зависимости от задачи. Одним важно, предлагают ли сотрудники допродажи. Другим — используют ли мат в разговоре с клиентами. Кто-то хочет отслеживать эмоции — чтобы в магазине все были позитивные.
Есть интеграция с обучением. Если система видит, что сотрудник не предлагает допродажи, она должна отправить его на соответствующий тренинг. После тренинга — снова контроль. Цикл повторяется.
Отдельная инженерная задача — как данные попадают с бейджа на сервер. Само устройство не выходит в интернет, это сознательное решение: меньше энергопотребление, проще схемотехника, выше безопасность.
Сделали два способа передачи. Первый — подключить бейдж к компьютеру кабелем, данные уходят через программу BadgeManager. Она снимает аудио с десяти устройств одновременно и отправляет на сервер в несколько потоков. Без этого корпоративный пилот невозможен — никто не будет подключать бейджи по одному.
Второй — док-станция. Работает по Wi-Fi или через LAN-кабель, к одной станции подключается до шести бейджей одновременно. Положил устройства в конце смены — они сами передали записи и начали заряжаться. Станция настраивается удалённо: клиенту не нужно ничего конфигурировать, специалисты AlloeTech делают всё дистанционно.

Всё передаётся в зашифрованном виде. На сервере запускается транскрибация, потом диаризация — разнесение по спикерам. Система понимает, где говорит сотрудник, а где клиент, даже если голоса похожи по тембру.
Дальше — аналитика. В личном кабинете виден рабочий день каждого сотрудника: сколько времени провёл на адресе, как информировал клиента, какой эмоциональный тон, индекс вежливости, индекс конфликтности. Можно провалиться в конкретный диалог, прослушать запись, прочитать транскрипт. Метрики настраиваются под задачи клиента — курьерской службе важно одно, банку другое.
В процессе пилотов нашли неожиданное применение. Док-станция с подключённым микрофоном отлично протоколирует совещания. Бейдж не нужен — ставишь микрофон в переговорке, система пишет, разделяет по спикерам, выдаёт готовый протокол. Об этом сценарии изначально не думали, но спрос оказался реальным.
Развернуть систему можно двумя способами: SaaS на серверах AlloeTech или on-premise на серверах заказчика. Крупные корпораты выбирают второе — не хотят выпускать данные наружу.
Критичная штука — шифрование и закрытый контур. Корпораты сразу спрашивают: «Можете встроиться в наш контур, чтобы данные не уходили наружу?»
Мы не стучимся к ChatGPT или другим зарубежным API, разворачиваем всё локально внутри системы клиента. Данные шифруются на устройстве, передаются на сервер клиента и там обрабатываются.
Блок 2: личный кабинет
Получить данные — это одно, вопрос в том, что с ними делать дальше.
Личный кабинет переделывали дважды.

Пример: продавец в супермаркете носит бейдж, мы записываем его разговоры с покупателями. Хотим проверять, соблюдает ли он скрипт продаж: поздоровался ли в начале, предложил ли карту лояльности, поблагодарил ли за покупку в конце. Если человек не поздоровался — на сколько процентов он скрипт не соблюдал? На 10 процентов или на 5? Как это считать?
У каждого клиента свои скрипты и свои приоритеты. премиальный ритейл хочет одно, дискаунтеры другое, рестораны — вообще третье. Надо настраивать шаблоны под каждого клиента, это целая работа методолога.
Есть базовые метрики, которые нужны всем: время общения, обработка возражений, общая вежливость. Но клиенты приходят и говорят: «Хотим измерять эмоциональную окраску разговора, чтобы в магазине все сотрудники были позитивны и улыбчивы». Или: «Хотим считать, сколько раз сотрудники ругались матом при клиентах».
Макет нового фронтенда собрали через нейросеть Lovable — он и стал прототипом текущего личного кабинета.

Метрики настраиваются под задачи клиента. Для курьерской службы — сколько времени провёл на адресе, информировал ли клиента заранее, сколько запросов на подъём на этаж. Для банка — другие. Для ритейла — третьи. Плюс универсальные: эмоциональный тон, индекс вежливости, индекс конфликтности — это составная метрика, которая учитывает несколько параметров сразу.
Из дашборда можно провалиться в рабочий день конкретного сотрудника, оттуда — в отдельный диалог: прослушать запись, прочитать транскрипт, понять, что пошло не так.
Мы собрали больше 100 разных метрик, клиент выбирает нужные. Но он сам не всегда понимает, что выбрать — дали огромную палитру возможностей, а человек не знает, что с ней делать. Мы помогаем разобраться, какие конкретно метрики решат его бизнес-задачу.
Каждый большой клиент в России хочет проектную доработку под себя — это пока не продукт из коробки в рамках B2B. Мы честно заявляем, что делаем проектную доработку внутри программного обеспечения, надо смотреть на задачу клиента. За один день такое не внедришь.
Траты на софт: около 10 миллионов (команда, сервер, личный кабинет).
Устройство работает — записывает речь, передаёт на сервер, батарея держит 25 часов. Шифрование настроено, подключается к компу, данные сразу улетают на сервер.
Основной канал продаж — это клиенты Dailo. Компания Наташи 8 лет работает с крупными корпорациями, у неё стабильная база клиентов. К тем же компаниям заносим бейдж как дополнительный продукт — они уже понимают идею, видят, как можно измерить эффект от обучения.
Но у Наташи высокий репутационный риск. Если клиенты Dailo купят бейдж, а он не заработает как надо — они спросят, зачем она это предлагала, доверие к основному продукту пошатнётся. Поэтому пилоты проводим очень аккуратно — устройство появилось только в конце октября, их всего 30 штук. Смотрим, кому давать на тест, с кем работать, что дорабатывать.
Есть клиенты, которые говорят: «Нам надо тысячу устройств». В очереди стоит крупный ритейл. Запросов больше, чем устройств в наличии.
Чтобы произвести больше — нужно больше ресурсов.
За два года — с декабря 2023 по ноябрь 2025 — потратили около 30 млн рублей.
Разбивка такая:
— 10 млн на софт (серверная часть для обработки речи + личный кабинет с метриками)
— 10 млн на команду hardware (конструктор, схемотехник, менеджер проекта за два года)
— 5 млн на производство (прототипы на 3D-принтере + партия из Китая)
— 5 млн на прочее (командировки в Китай, тесты, исправление ошибок)
Откуда деньги: 25 миллионов вложила компания Наташи — Cerevrum зарабатывает на продаже Dailo корпорациям. Ещё около 5 миллионов — мои личные накопления.
Уже два года я раз в неделю беру интервью у предпринимателей про реальный бизнес, а не этот ваш успешный успех.
Может показаться, что «Упал, поднялся» – это весёлые истории о том, как пожарить косточки, насушить листья, склеить картон, чтобы заработать миллионы на маркетплейсах. Но на самом деле в блоге уже больше 120 статей из разных ниш с подробными выкладками по цифрам.
Подписывайтесь на блог «Упал, поднялся – интервью про бизнес».
Этот блог я веду для себя, а с командой мы решаем задачу роста продаж для среднего и крупного бизнеса. Наша работа эффективна в трех случаях:
– Ваш продукт сложный, спрос не сформирован, но ценность для узкой целевой аудитории высока.
– Вы выводите новый продукт на рынок и хотите об этом рассказать рынку.
– Вы хотите поднять продажи по текущему продукту, но весь поисковой спрос выбран, и дальнейшее увеличение рекламного бюджета, – резко повышает цену лида.
Мы уже решаем такие задачи для B2B, в том числе SaaS, агентств недвижимости и производств.
Красавцы!