Блог им. VyacheslavRyumin

Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов

В России решили разработать технологичный продукт. Вот что из этого вышло.

Сейчас вы можете прикрепить к рюкзаку устройство — и вечером посмотреть, как вашего ребёнка травили в школе, какие уроки о важном он послушал и что говорила учительница. Или повесить такой диктофон на бариста и увидеть, предлагает ли он сиропы, как учили на тренинге. Или дать доставщику и понять, вежлив ли он с клиентами.

ДИСКЛЕЙМЕР: статья написана на основе интервью с Павлом Баздыревым, основателем бренда «Союз», и Наташей Флокси, создателем Dailo, речевых тренажёров. 

Умный диктофон пишет речь, анализирует её и даёт рекомендации. Это замкнутый цикл: устройство слушает, показывает проблемы, связывает их с обучением и проверяет, изменилось ли что-то.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Эволюция диктофонов за 90 лет

Делают его двое опытных предпринимателей, которые думали, что их опыт поможет. Влетели на два года и 30 миллионов рублей, на выходе получили 30 устройств.

Вот их история.


Кто делает

Я — Паша, больше 10 лет делаю микрофоны под брендом «Союз». Аналоговое железо, студия в Туле, глубокая экспертиза в акустике и схемотехнике — классная история, я вложил в нее душу, но я понимал, что рынок узкий и большие деньги тут не заработать. А амбиции есть.

Наташа — 8 лет делает Dailo, речевые тренажёры для корпораций. Человек берёт телефон, общается с виртуальным агентом, тренирует навыки разговора — клиенты крупные. Dailo — номер один в России в этой нише.

Проблема у Dailo такая: компании покупают обучение, сотрудники тренируются, но никто потом не знает, изменилось ли поведение на местах. Вроде чеки выросли, вроде адаптация быстрее, но клиент говорит: «У нас там столько всего внедрено, скорее всего не вы помогли». Наташа знала, что эффект есть, но доказать не могла.

 

Триггер: звонок от Билайна

В 2022 году Билайн позвонил клиентам Dailo и предложил им попробовать аудиобейдж от компании VocaTech — устройство с E-ink экраном, которое крепится на магнит, пишет речь и анализирует.

Идея в том, что бейдж носит продавец или кассир, записывает всё, что говорит, как общается с покупателями — вечером можно послушать, посмотреть метрики. Вечный тайный покупатель.

Наташа посмотрела на этот бейдж и подумала: идея классная, если подключить к Dailo — можно увидеть, что было до обучения и что стало после, доказать эффект, замкнуть цикл. Аудит → обучение → контроль.

Но сам бейдж её не устроил — неудобный, некрасивый, работает некруто. Даунгрейд какой-то.

 

«Давай вместе»

Мы с Наташей знакомы давно, с 2010 года. Живём в разных городах, периодически созваниваемся.

В декабре 2023 она звонит:

— Паш, слушай, у меня идея. Нужны бейджи, но клёвые. У тебя микрофоны, у меня софт. Может, вместе сделаем?

Я подумал: логично. У меня звук и железо, у неё софт и продукт, осталось добавить бейдж к тому, что уже умеем.

Потом я это сформулировал одной фразой: 

«Я думал, если умею делать скрипки, смогу сделать холодильник. Задачи похожие, а всё остальное — другое».

Новичок бы перепроверил сто раз. Мы были уверены и влетели.

 

Попытка 1: «ChatGPT всё нарисует»

Это 2023 год, ChatGPT только начал активно проникать в жизнь. Я думал: сейчас разберусь, попрошу схему — станет понятно.

Говорю ему: «Нарисуй схему диктофона». Рисует. Вроде понятно. Говорю пацану: «Давайте напаяем».

Начинаем складывать — ни хрена не работает. Говнище какое-то: шипит, кряхтит, не пишет.

Снова иду в чат, говорю: «Не работает, что не так?».

А он мне: «Да, извини, я ошибся. Давай разработаем действительно хорошую схему, которая идеально подойдет под твои запросы, без ошибок и осечек»

GPT отбросили, время потеряли. Поняли — делаем с нуля.

Первые траты: месяц времени, около 200 тысяч на макеты.

 

Попытка 2: «В Китае всё есть»

Вторая мысль была простая: на Алиэкспрессе наверняка есть готовые решения, китайцы уже делают такие штуки. Ничего нет.

Я такой: ладно, поеду на выставку. Гонконг, Electronics, супер-хай-тек — там точно найду.

На всю выставку две конторы с диктофонами. Одна делает ручку-диктофон для учителей, вторая — магнитную карту с E-ink и диктофоном. Две конторы на всё.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Вот такая ручка

Нашли в Гонконге контору с диктофонами-ручками. Я такой: ладно, хоть у них есть понимание темы. Говорю: «Где фабрика?» — «В Шэньчжэне».

Едем в Шэньчжэнь, приезжаем на фабрику. Первое, что вижу — домофоны «Визит», вот эти пластиковые трубки.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов

Говорю: «А где вы диктофоны делаете?» — «А, это мы разово прототип сделали». Ничего нет.

Вывод простой: кажется, что всё придумано и где-то производится. А копнёшь — ничего нет на самом деле.

Траты на поездку: около 300 тысяч.

 

Попытка 3: «Партнёрство срежет путь»

На каком-то этапе подумали: может, не надо всё делать самим? Есть же Игорь, который диктофоны делает много лет, у него опыт и компетенции.

Он производитель самых маленьких в мире диктофонов, которые даже попали в книгу рекордов Гиннеса. Я понял — это же то что нам нужно. Мы сразу поехали в Зеленоград.

Записи с диктофонов Игоря имели вес в суде, поэтому в 90-е хорошо пользовались спросом, 90-е кончились и сейчас никому не нужно кого-то массово писать. И спрос на такие диктофоны упал.

Предложили ему долю: «Ты за хард отвечаешь, мы за софт, делим процент». Наташа ездила к Игорю в Зеленоград, я позвал его к себе в Тулу. Умасливали, водили в ресторан, объясняли перспективы.

Игорь сильный чувак с большими компетенциями, но он говорит: «Мне интересно продавать своё». Принципиально разные позиции — мы хотим развивать вместе, он хочет поставлять готовое.

Когда зависишь от человека, которого не контролируешь — это всегда ограничение. Если понадобится версия с экраном зелёного цвета, я не спрашиваю ни у кого, сам отвечу за свои слова.

Не поругались, но не сошлись.

Траты на переговоры: два месяца времени.

 

Попытка 4: «Я же в железе разбираюсь»

Пошли делать сами.

10 лет делаю микрофоны, думал — диктофон похожая история, справлюсь. Оказалось: микрофоны — это аналоговая схемотехника, резисторы, конденсаторы, транзисторы, всё понятно и знакомо.

А здесь микроконтроллер, прошивка, контроллер заряда — совсем другое устройство, другого уровня сложности. Само устройство технически сложнее, чем кажется. 

Микроконтроллер понимает, когда человек говорит, а когда вокруг просто шум. От этого зависит и качество записи, и время работы батареи. Ещё настраивается чувствительность под условия: тихий офис, громкий цех или самолёт с постоянным гулом — устройство может слышать только речь носителя или захватывать звук на три метра вокруг.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Основная плата диктофона с микроконтроллером и памятью


Специалисты из «Союза» не подходят — они аналоговые, тут нужна цифра. Людей с такими компетенциями в Туле просто нет, пришлось искать с нуля.

Нашли ребят в Москве из Бауманки: «Мы шарим, всё сделаем». Делали долго, сделали криво, пришлось переделывать.

Каждая переделка — это минус месяц времени. Заказываем печатную плату, ждём 2-3 недели, паяем, тестируем — оказывается, забыли резистор или не тот номинал поставили, или контроллер вообще не подходит. Переразвести схему, тесты, новый заказ, производство, тестирование, новая прошивка под всё это — месяц ушёл.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Платы паяют и собирают вручную

Потом выяснилось: нормальные микроконтроллеры под санкциями. Любой хороший контроллер ты просто не купишь официально, надо везти из Китая в чемоданах, кто как может. Купим 5-10 штук для прототипа, но если масштабироваться на 2000 устройств — это уже проблема. От таких компонентов отказывались, чтобы не попадать в зону риска.

Первые прототипы делали в России на 3D-принтерах — печатали корпуса, паяли платы, тестировали. Потом поехали в Китай — проще заказать там, потому что комплектующие всё равно оттуда едут. Плюс обработка алюминия, ЧПУ, анодирование у нас в разы дороже.

Плюс мы не знали, какую форму хотим — она стала понятна только со временем. Сначала хотели бейдж с e-ink экраном, потом думали сделать устройство из двух частей, как iPendant, но это сложновато и дороже. Под каждый форм-фактор своя плата, свои размеры — всё приходилось переделывать.

Форму меняли четыре раза — и каждый раз это новая плата.

Первый вариант — квадрат 55×55×8 мм с e-ink экраном. Как у конкурентов. Сделали макет — получилось громоздко и старомодно. Экран убрали.

Второй вариант — квадрат-клипса из двух корпусов, соединённых перемычкой. Идея красивая, но пришлось бы переделывать всю схемотехнику. Остановились вовремя.

Дальше пробовали круг, овал, ещё десяток форм. Сгенерировали больше ста макетов через ChatGPT и Manus — часть выглядела непривлекательно, часть слишком футуристично. Но это помогло понять направление.

В итоге сделали проще всего: корпус по размеру платы. Прямоугольник 57×32×13 мм,. Крепится вертикально — так эстетичнее, чем горизонтально.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Рабочий макет устройства ECHO-1

Первые макеты печатали на 3D-принтере из пластика. BGA-компоненты паяли вручную — микроскопические детали под лупой. 

Магнитные крепления заказывали на Ozon — стандартные, для бейджей. Кустарно, и мы искали альтернативу.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
В итоге пришли к такому типу магнитного крепления — две пластины, чтобы крепить с обеих сторон ткани, не портит одежду и внешний вид


Купили два устройства конкурентов: Plaud Note Pin и Limitless Pendant.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Устройство PLAUD Note Pin – прототип Alloe Pin

Миниатюрные, эффектные — больше похожи на модный аксессуар, чем на рабочий инструмент. Ориентиром выбрали Plaud. 

Производство корпусов тоже непросто: обработка алюминия на ЧПУ и анодирование в России стоят намного дороже, чем в Китае. Поэтому финальную сборку делали там.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов


На данный момент выпуск возможен в черном и серебристом варианте. Вес всего 33 грамма.

В ноябре 2025 получили из Китая партию 30 железок. Реально два года шли к этой первой партии из тридцати устройств.

 Траты на железо: около 15 миллионов (команда, прототипы, производство).
 

Софт оказался сложнее железа

Когда начинали, казалось: железо сложно, а софт у Наташи уже есть, доработаем немножко. Оказалось наоборот — софт оказался сложнее.

Софт — это два больших блока. Первый — сервер, который принимает аудиофайл с устройства и расшифровывает его правильно. Второй — личный кабинет с метриками, то что видит клиент.


Блок 1: сервер

Есть транскрибация — превратить речь в текст. Это несложно, базовый speech-to-text.

Но есть диаризация — разделить поток речи по спикерам. Когда у тебя просто запись разговора, надо понять, где говорил продавец, а где покупатель — программа анализирует частоты голосов, темпы речи, паузы между фразами. Это на порядок сложнее простой расшифровки, требует больше вычислительной мощности и специальных алгоритмов. Мы довели точность до 95 процентов, можем распознать до восьми спикеров одновременно.

Дальше идёт аналитика. Больше ста метрик: время разговора, паузы, вежливость, возражения, соблюдение скриптов, эмоциональная окраска. 

Корпораты хотят видеть разные метрики в зависимости от задачи. Одним важно, предлагают ли сотрудники допродажи. Другим — используют ли мат в разговоре с клиентами. Кто-то хочет отслеживать эмоции — чтобы в магазине все были позитивные.

Есть интеграция с обучением. Если система видит, что сотрудник не предлагает допродажи, она должна отправить его на соответствующий тренинг. После тренинга — снова контроль. Цикл повторяется.

Отдельная инженерная задача — как данные попадают с бейджа на сервер. Само устройство не выходит в интернет, это сознательное решение: меньше энергопотребление, проще схемотехника, выше безопасность.

Сделали два способа передачи. Первый — подключить бейдж к компьютеру кабелем, данные уходят через программу BadgeManager. Она снимает аудио с десяти устройств одновременно и отправляет на сервер в несколько потоков. Без этого корпоративный пилот невозможен — никто не будет подключать бейджи по одному.

Второй — док-станция. Работает по Wi-Fi или через LAN-кабель, к одной станции подключается до шести бейджей одновременно. Положил устройства в конце смены — они сами передали записи и начали заряжаться. Станция настраивается удалённо: клиенту не нужно ничего конфигурировать, специалисты AlloeTech делают всё дистанционно.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Так выглядит док-станция

Всё передаётся в зашифрованном виде. На сервере запускается транскрибация, потом диаризация — разнесение по спикерам. Система понимает, где говорит сотрудник, а где клиент, даже если голоса похожи по тембру.

Дальше — аналитика. В личном кабинете виден рабочий день каждого сотрудника: сколько времени провёл на адресе, как информировал клиента, какой эмоциональный тон, индекс вежливости, индекс конфликтности. Можно провалиться в конкретный диалог, прослушать запись, прочитать транскрипт. Метрики настраиваются под задачи клиента — курьерской службе важно одно, банку другое.

В процессе пилотов нашли неожиданное применение. Док-станция с подключённым микрофоном отлично протоколирует совещания. Бейдж не нужен — ставишь микрофон в переговорке, система пишет, разделяет по спикерам, выдаёт готовый протокол. Об этом сценарии изначально не думали, но спрос оказался реальным.

Развернуть систему можно двумя способами: SaaS на серверах AlloeTech или on-premise на серверах заказчика. Крупные корпораты выбирают второе — не хотят выпускать данные наружу.

Критичная штука — шифрование и закрытый контур. Корпораты сразу спрашивают: «Можете встроиться в наш контур, чтобы данные не уходили наружу?» 

Мы не стучимся к ChatGPT или другим зарубежным API, разворачиваем всё локально внутри системы клиента. Данные шифруются на устройстве, передаются на сервер клиента и там обрабатываются.


Блок 2: личный кабинет

Получить данные — это одно, вопрос в том, что с ними делать дальше.

Личный кабинет переделывали дважды.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Первая версия была простой — список записей и базовые метрики. Потом поняли, что корпоратам нужны дашборды с метриками по коммуникациям: кто сколько говорил, какие эмоции, где провалы в скриптах. 

Пример: продавец в супермаркете носит бейдж, мы записываем его разговоры с покупателями. Хотим проверять, соблюдает ли он скрипт продаж: поздоровался ли в начале, предложил ли карту лояльности, поблагодарил ли за покупку в конце. Если человек не поздоровался — на сколько процентов он скрипт не соблюдал? На 10 процентов или на 5? Как это считать?

У каждого клиента свои скрипты и свои приоритеты. премиальный ритейл хочет одно, дискаунтеры другое, рестораны — вообще третье. Надо настраивать шаблоны под каждого клиента, это целая работа методолога.

Есть базовые метрики, которые нужны всем: время общения, обработка возражений, общая вежливость. Но клиенты приходят и говорят: «Хотим измерять эмоциональную окраску разговора, чтобы в магазине все сотрудники были позитивны и улыбчивы». Или: «Хотим считать, сколько раз сотрудники ругались матом при клиентах».

Макет нового фронтенда собрали через нейросеть Lovable — он и стал прототипом текущего личного кабинета.

 
Мы потратили два года и 30 млн, чтобы сделать 30 диктофонов
Добавили круговые диаграммы, числовые показатели, «паутинку» для сравнения сотрудников по нескольким метрикам сразу.


Метрики настраиваются под задачи клиента. Для курьерской службы — сколько времени провёл на адресе, информировал ли клиента заранее, сколько запросов на подъём на этаж. Для банка — другие. Для ритейла — третьи. Плюс универсальные: эмоциональный тон, индекс вежливости, индекс конфликтности — это составная метрика, которая учитывает несколько параметров сразу.

Из дашборда можно провалиться в рабочий день конкретного сотрудника, оттуда — в отдельный диалог: прослушать запись, прочитать транскрипт, понять, что пошло не так.

Мы собрали больше 100 разных метрик, клиент выбирает нужные. Но он сам не всегда понимает, что выбрать — дали огромную палитру возможностей, а человек не знает, что с ней делать. Мы помогаем разобраться, какие конкретно метрики решат его бизнес-задачу.

Каждый большой клиент в России хочет проектную доработку под себя — это пока не продукт из коробки в рамках B2B. Мы честно заявляем, что делаем проектную доработку внутри программного обеспечения, надо смотреть на задачу клиента. За один день такое не внедришь.

Траты на софт: около 10 миллионов (команда, сервер, личный кабинет).

 

Сейчас: 30 устройств и очередь на тысячу

Устройство работает — записывает речь, передаёт на сервер, батарея держит 25 часов. Шифрование настроено, подключается к компу, данные сразу улетают на сервер.

Основной канал продаж — это клиенты Dailo. Компания Наташи 8 лет работает с крупными корпорациями, у неё стабильная база клиентов. К тем же компаниям заносим бейдж как дополнительный продукт — они уже понимают идею, видят, как можно измерить эффект от обучения.

Но у Наташи высокий репутационный риск. Если клиенты Dailo купят бейдж, а он не заработает как надо — они спросят, зачем она это предлагала, доверие к основному продукту пошатнётся. Поэтому пилоты проводим очень аккуратно — устройство появилось только в конце октября, их всего 30 штук. Смотрим, кому давать на тест, с кем работать, что дорабатывать.

Есть клиенты, которые говорят: «Нам надо тысячу устройств». В очереди стоит крупный ритейл. Запросов больше, чем устройств в наличии.

Чтобы произвести больше — нужно больше ресурсов.

 

Итого: два года и 30 миллионов рублей

За два года — с декабря 2023 по ноябрь 2025 — потратили около 30 млн рублей.

Разбивка такая:

— 10 млн на софт (серверная часть для обработки речи + личный кабинет с метриками)

— 10 млн на команду hardware (конструктор, схемотехник, менеджер проекта за два года)

— 5 млн на производство (прототипы на 3D-принтере + партия из Китая)

— 5 млн на прочее (командировки в Китай, тесты, исправление ошибок)

Откуда деньги: 25 миллионов вложила компания Наташи — Cerevrum зарабатывает на продаже Dailo корпорациям. Ещё около 5 миллионов — мои личные накопления.

Уже два года я раз в неделю беру интервью у предпринимателей про реальный бизнес, а не этот ваш успешный успех.

Может показаться, что «Упал, поднялся» – это весёлые истории о том, как пожарить косточки, насушить листья, склеить картон, чтобы заработать миллионы на маркетплейсах. Но на самом деле в блоге уже больше 120 статей из разных ниш с подробными выкладками по цифрам.

Подписывайтесь на блог «Упал, поднялся – интервью про бизнес».

Этот блог я веду для себя, а с командой мы решаем задачу роста продаж для среднего и крупного бизнеса. Наша работа эффективна в трех случаях:

– Ваш продукт сложный, спрос не сформирован, но ценность для узкой целевой аудитории высока.

– Вы выводите новый продукт на рынок и хотите об этом рассказать рынку.

– Вы хотите поднять продажи по текущему продукту, но весь поисковой спрос выбран, и дальнейшее увеличение рекламного бюджета, – резко повышает цену лида.

Мы уже решаем такие задачи для B2B, в том числе SaaS, агентств недвижимости и производств.

Мой сайт

3.4К | ★4
6 комментариев
Так если надо кому 1000 штук, пусть авансом платят, через полгода получают, условно 
прокормить население не можем. про пенсов вообще молчу. с этого начать…
Тема глухая.
avatar
Вместо того чтобы просто накатить ии-агента на смартфон и быстро проверить, взлетит ли идея… идеальный кейс, как не надо делать бизнес)
avatar

Красавцы!

А вот вложили бы тридцать милльонов в офз и вдо, щас бы были миллиардерами
avatar

Читайте на SMART-LAB:
Фото
AUD/NZD: быки вошли во вкус, подтягивая котировки к новым высотам
Кросс-курс AUD/NZD после пробоя локального уровня 1.1692 откатился к нему и сейчас активно «топчется», осваивая свежую поддержку. Также стоит...
Фото
Россети Урал. Отчет об исполнении инвестпрограммы за Q4 2025г. Считаем дивиденды!
Компания Россети Урал опубликовала отчет об исполнении инвестпрограммы за Q4 2025г., где показаны финансовые показатели компании по РСБУ в...
⚙️ Лензолото: закат "пустышки"
Акции Лензолота резко упали. Что происходит — рассказывают аналитики Market Power   Лензолото (LNZL) ➡️ Инфо и показатели     Возможно,...
Фото
Интер РАО. Неужели дивиденды будут минимальными за 3 года? Обзор производственных результатов и отчета РСБУ за Q4 2025г.
Вышел отчет по РСБУ за Q4 2025г. от компании Интер РАО: 👉Выручка — 15,49 млрд руб.(-14,0% г/г) 👉Себестоимость — 12,79 млрд руб.(-10,8%...

теги блога Слава Рюмин

....все тэги



UPDONW
Новый дизайн