Блог им. evrybakov

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

Любой специалист по закупкам или тендерам знает эту боль: открываешь техническое задание (ТЗ) заказчика, а там спецификация на 100 позиций. Причем каждая позиция описана не четким артикулом, а целым абзацем сплошного текста: смесь габаритов, материалов, ссылок на ГОСТы и допусков.

Задача специалиста — найти под эти пространные требования подходящие товары в своей базе или в прайс-листах дистрибьюторов (где могут быть десятки тысяч строк), сопоставить их и просчитать экономику. А если человек новый в нише? А если специфика сложная? Обычно это решается вычленением ключевых слов и бесконечным нажатием Ctrl+F по вкладкам Excel. Это долго, дорого и ведет к ошибкам из-за банальной усталости.

Я решил автоматизировать этот процесс и собрал B2B-инструмент на стыке локальных баз данных, алгоритмов обработки естественного языка (NLP) и больших языковых моделей (LLM).

В этой статье я расскажу, как устроен продукт «под капотом», с какими проблемами я столкнулся при сопоставлении неструктурированных данных и как выстроил архитектуру, которая заменяет рутину машинным интеллектом.

Откуда брать и как структурировать данные?

Чтобы ИИ искал точно, ему нужна структурированная база. Если у компании есть выгрузки из 1С, CSV или готовые прайсы в Excel — проблема решается простой загрузкой в нужную директорию.

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

 

Но на практике прайс-листы есть не всегда. Часто товары представлены только в веб-каталоге производителя. Писать кастомный парсер под каждый сайт — утопия. Поэтому в систему пришлось интегрировать модуль автоматического сбора данных.

Как это работает сейчас:

  1. Пользователь просто дает ссылку на сайт-донор.
  2. ИИ самостоятельно анализирует DOM-дерево и понимает структуру страницы. Он сам определяет, где находится карточка товара, где цена, а где технические характеристики, игнорируя «инфошум» (новости, баннеры, контакты).
  3. Для обхода защит от парсинга система использует виртуальный браузер, имитируя поведение реального пользователя.
  4. На выходе получается стандартизированная Excel-таблица, которая сразу интегрируется в поисковую базу инструмента. Без привлечения программистов.

Как работает поиск (Pipeline обработки запроса)

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

 

Обычный полнотекстовый или даже векторный поиск здесь пасует. В тендерном ТЗ слишком много «мусорных» слов, которые сбивают алгоритм. Поэтому сопоставление требований заказчика с доступным ассортиментом я реализовал через многоступенчатый конвейер.

Вот как выглядит флоу обработки одной позиции:

  1. AI-Диспетчер (роутинг). Сначала модель анализирует запрос и сужает зону поиска. Если в ТЗ ищут «микроскоп», диспетчер отсекает загруженные прайс-листы с офисной мебелью и направляет запрос только в файлы с лабораторным оборудованием. Это экономит время и ресурсы.
  2. AI-Помощник (извлечение сущностей). Абзац из ТЗ разбивается на смысловые группы. Например: Группа 1 [ноутбук, лэптоп], Группа 2 [15 дюймов], Группа 3 [intel core].
  3. Математический скоринг. На этом этапе подключается математика. Программа сканирует лемматизированную базу данных. Товар получает баллы: точное совпадение по артикулу дает максимум, совпадение характеристик в начале описания ценится выше, чем в конце. Формируется топ-20 кандидатов.
  4. AI-Ранжировщик. Здесь LLM включает логику. Простой пример: в ТЗ требуется «стол». Математический скоринг нашел идеальное текстовое совпадение в позиции «Комплект мебели: стол и 4 стула». Ранжировщик применяет правило «анти-комплект» и пессимизирует этот результат, опуская его вниз списка.
  5. AI-Эксперт. Для финального топа (например, 3 лучших позиций) ИИ генерирует аналитическое заключение. Он сравнивает исходное ТЗ с найденным товаром и выдает вердикт.

Пользовательский опыт: 2 режима работы

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

 Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

 

Чтобы инструмент был применим в реальном бизнесе, я разделил логику интерфейса на два сценария.

Режим 1: Точечный подбор (Одиночный поиск)Идеально для сложных, единичных запросов. Пользователь не вычленяет слова, он просто копирует весь огромный абзац из документации и вставляет в поиск. Можно задать фильтр источников (например, искать совпадения только в каталоге конкретного завода). Система выдает карточку лучшего кандидата.

Режим 2: Пакетная обработка (Batch-режим)Основная «киллер-фича» для снабженцев. Специалист загружает в систему файл со сметой (десятки или сотни строк). Программа считывает колонку с требованиями и выстраивает очередь. Дальше процесс идет полностью в фоне. На глубокий машинный анализ одной сложной позиции уходит около минуты. Пока программа автономно перебирает базы и сопоставляет характеристики, человек может вести переговоры или заниматься другими задачами.

Что на выходе? Интерфейс vs. Excel

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

Одиночный вывод результатовЗаменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

Вывод результатов в списочном режимеЗаменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

Выгрузка в эксель

Я понимал, что выдавать просто «сырые» ссылки на совпадения — бессмысленно. Цель B2B-продукта — дать готовую аналитику для принятия решений.

В интерфейсе результаты группируются по папкам: исходная строка ТЗ → раскрывающийся блок с товарами-кандидатами. Подтягиваются фотографии с сайтов доноров, цены и артикулы.

Но главное происходит при экспорте. Итоговым продуктом работы программы является сводная таблица Excel. И здесь я внедрил цветовую индикацию (систему «Светофор»), основанную на выводах AI-Эксперта:

  1. Зеленая заливка: ИИ уверен, что найденный товар полностью совпадает с ТЗ. Специалист может не тратить время на перепроверку и сразу брать эту цену для расчета рентабельности.
  2. Желтая заливка: Найден аналог, но есть технические расхождения. В колонке «Вердикт» ИИ пишет причину («⚠ Оговорка: запрошен стол из дерева, а найденный вариант из ЛДСП»). Внимание специалиста фокусируется только на этих строках — нужно решить, пропустит ли заказчик такой аналог.
  3. Красная заливка: Программа честно говорит, что подходящего товара в ваших базах нет.

Такой подход меняет парадигму работы: человек больше не ищет товары, он работает по принципу исключений, проверяя только «желтые» спорные позиции.

Бизнес-кейсы: где это применяется?

Заменил Ctrl+F в экселе на нейросети: как я автоматизировал подбор товаров для тендеров

 

 

Помимо первичного просчета тендеров (когда нужно за час понять маржинальность спецификации на 70 пунктов), архитектура отлично решает еще две задачи:

  1. Подбор аналогов: Когда в ТЗ жестко прописан ушедший с рынка бренд, система по характеристикам подбирает релевантный отечественный или китайский аналог.
  2. Мониторинг конкурентов: Загружаете прайс конкурента как поисковую базу, прогоняете через нее свой каталог и получаете таблицу точных аналогов для выстраивания ценовой стратегии.

Итоги

Внедрение AI-пайплайна превращает задачу, на которую раньше уходили дни механической работы, в фоновый процесс на пару часов. Человеческий фактор (усталость, потеря концентрации) сводится к минимуму.

Сейчас проект активно развивается. Если вы работаете в закупках, тендерах, оптовых продажах, или вам просто интересно обсудить архитектуру LLM-решений для B2B и протестировать инструмент на своих базах данных — буду рад пообщаться.
Более подробно я написал алгоритм здесь

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
2.3К | ★3
3 комментария
Любой специалист по закупкам или тендерам знает эту боль:
готовься к тому, что не будет специалистов по закупкам или тендерам и этой боли не будет!
шикарно 
не спец, но понял парадигмы решения проблемы 
ИИ рулит тут несомненно
по мне сейчас сильна пара человек -ИИ
вспомнил с тоской советские конторы с бесконечными данными   для обработки  и получения итоговых выводов 
было жуть, хотя платили хорошо
удачи 
Дeнег не дам.
avatar

Читайте на SMART-LAB:
Фото
Доллар теряет поддержку ставок: евро и фунт используют слабость NFP
Заметный разрыв в направлениях монетарной политики ФРС и других ключевых центробанков начал сокращаться в четверг. Триггером стала статистика по...
Инвестиции без спешки: торгуем в выходные
Алексей Девятов Рынок часто движется импульсами, и тем важнее оценивать активы без спешки, не отвлекаясь на инфошум. Для этого отлично...
Фото
Акционеры ПАО «АПРИ» приняли решения по вопросам годового Общего собрания
Акционеры ПАО «АПРИ» приняли решения по вопросам годового Общего собрания Сегодня состоялось годовое заседание Общего собрания...
Фото
Мой инвест портфель. Структура портфеля, последние действия по портфелю. Состав портфеля валютных облигаций
Сегодня делал действия по портфелю. Кроме того, решил пособирать инфу по счетам и посмотреть как там дела.  

теги блога evrybakov

....все тэги



UPDONW
Новый дизайн