Блог им. KonstantinChaschegorov

Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

На данный момент голосовое управление в 1С в самом развитии. Пока реализовано только распознавание речи в конфигурации 1С Документооборот корп версия 3.
speech.1c.ai/apps/1c-do_30/
Достаточно удобная интеграция, помогает связать распознавание речи и голосовое управление.


1 Для итого необходимо сделать типовые настройки работы с речью в конфигурации 1С Документооборот корп 3
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


2 Дополнить их настройками детализации процесса распознавания (выводить или нет сообщения)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

3 Создадим справочник «Голосовые команды»
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

4  В котором будут содержаться варианты произношения фраз
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

5 Так же в этом справочнике будет последовательность выполняемых действий на встроеннном языке 1С
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

6 Общий внешний вид рабочего места отображает строку, в которую вписывается распознанный текст
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
7 Сама строка распознавания содержит кнопки запуска процесса распознавания
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

8 Индикатор распознавания меняет цвет 
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

9 Процесс распознавания так же отображается визуально
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
10 Распознанные фразы отображаются на экране (при включенной настройке на шаге 2)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

11 Так как у нас пример действий это вывод сообщений (Описано на шаге 5), то мы увидим результат.
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
12 Итоговый общий внешний вид рабочего места
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


На данный момент распознавание речи пока реализовано не во всех конфигурациях.
В нашем конкретном случае можем воспользоваться еще и типовыми возможностями соответствующей конфигурации
1С Документооборот 3 КОРП
v8.1c.ru/doc8/vozmozhnosti-1s-dokumentooborota/




616
13 комментариев
О, коллеги программисты:) Тоже такое делал на qt5, но в итоге не нашёл заказчика и забил
avatar
Ivan Gurov, В одиночку наверно только на 1С можно большие проекты делать. Скорость разработки большая. Наработок много интерфейсных и т.п. На других языках как говорят можно сделать все, но на них и придется делать это все.
Да, на самом деле особой разницы нет, единственное в 1с, да чуть быстрее конфигурацию можно своять. Зато с qt5 и qml можно под мобильные перенести и будет работать. :)
avatar
Ivan Gurov, 1с даже не надо переносить. Просто опубликовать и работает с мобильного
v8.1c.ru/platforma/mobilnyi-klient/
Но только надо везде таскать с собой приложение 1с:)
avatar
Вот правильное направление www.anthropic.com/news/3-5-models-and-computer-use

youtu.be/2Yjsl8vDebc демонстрация на русском.
avatar
Gambler , Если я правильно понял суть, то это что-то типа съемки фильма на камеру с экрана кинотеатра. Будут потери качества картинки и звука. Мне так кажется. Все таки лучше с диска на диск переписывать и по скорости и по качеству.
Биржевой Спекулянт Инвестор, он не записывает экран, он понимает как человек, что на экране. И делает манипуляции согласно своему пониманию и внешним командам (от человека).
avatar
Gambler , Да спасибо. Я так и понял. Я неточно выразился. Именно при этом процессе и будет происходить потеря точности. Аналогия со съемкой экрана просто пример. Типа как «испорченный телефон» игра между людьми.
Биржевой Спекулянт Инвестор, если говорить про «узкие» места, то в случае ИИ «распознавание» будет иметь куда меньшие потери, чем у Speech-2-Text старым нейро сетевым способом. Дело в том, что у вашего подхода всего один источник — это микрофон (убираю за скобки саму устаревшую технологию).

В случае ИИ чем больше источников, тем точнее целевое действие. У ИИ в распоряжении и микрофон, и монитор, и данные (да, да, он анализирует и сами данные, а не просто расположение окон относительно друг друга).

Поэтому ИИ лучше распознает текст, даже если человек ошибается в словах. Например, вмесло Налево сказал Направо. ИИ распознает по контексту ошибочную команду.

Плюс ИИ не просто управляем кнопками. Он может и заполнять данными форму ввода, может вносить формулы (он их поймет, если сказать какой формат), внести контент.
avatar

Читайте на SMART-LAB:
Фото
Сегодня будем смотреть в боль, потому что стартует «Рентген рынка»
🚀 Сегодня будем смотреть в боль, потому что стартует «Рентген рынка» Запускаем классный бесплатный практикум, конечно всё для вас! Три дня...
Российский рынок вышел из минуса
Торги 10 февраля на российских фондовых площадках начались на положительной территории. К 12:30 мск индекс Мосбиржи поднялся на 0,27%, до 2733...
Фото
Вторичный рынок золота в России растет
РБК опубликовал материал о том, как рекордные цены на золото запустили рост внутреннего вторичного оборота драгметалла в России. 📊 По...
Фото
РУСАГРО: выкупить акции и спасти Мошковича - могут ли акции вырасти на 100% от текущих ценах, подробный разбор 
Начинаем покрытие компании РУСАГРО этим постом, надеюсь удастся под микроскопом разглядеть инвестиционную привлекательность или хотя бы сделать...

теги блога Биржевой Спекулянт Инвестор

....все тэги



UPDONW
Новый дизайн