Kot_Begemot
Kot_Begemot личный блог
22 февраля 2020, 22:12

Нейронные сети и ученье о данных


Когда вы занимаетесь искусственным интеллектом, то вам и в голову не приходит использовать нейронные сети! Да… такова их внутренняя сущность — к интеллекту они не имеют ровным счётом никакого отношения. В своё время NN (нейронные сети, Neural Networks) прочно ассоциировались со спиновыми стёклами — аналогом магнитной плёнки — на которую при желании можно записать ту или иную информацию. Да… в то время ещё не было ученых… как бы это правильнее перевести… ученых по данным… и в литературе часто можно было встретить выражение «образец, хранящийся в памяти сети». Другими словами, с самого своего рождения нейронные сети ассоциировались совершенно не с интеллектом, а с обычным хранилищем, своеобразной библиотекой.


Всё «обучение» нейронной сети, в те времена, сводилось к тому, чтобы загрузить в её память наиболее репрезентативную выборку образцов, чтобы с ней, в конце-концов, не случилось конфуза и она не смогла бы с завидной регулярностью идентифицировать афроамериканцев как горилл, как это случилось у Data Scientist'ов из Google Photos. Поэтому, помимо школьной  алгебры мы, как квалифицированные специалисты, изучали ещё и прикладной предмет, чтобы в любой момент, когда практика не согласовывалась бы с теорией, отметать… практику.


Нейронные сети и ученье о данных
Классификация чернокожих людей от Google Photos.




У нас тогда ещё не было современных технологий позволяющих заменить учёных датасайнтистами так, чтобы не зная предмета можно было бы успешно с ним работать и поэтому нам приходилось ещё и учиться. Это сегодня, ученье о данных пренебрегает даже простейшими формами регуляризации «Out of Range» и полагает, что умеет экстраполировать. Мы же, в свое время, понимали, что всё обучение нейронной сети — это чистой воды overfitting (чтобы учёным по данным было понятно) или, говоря тяжёлым, непонятным языком — подгонка. 



А чтобы сделать подгонку не просто «тупой», а… научной… нам требовалась непосредственная теория — о связи спроса и предложения, антропологических признаках человека и обезьяны, о физических процессах в твердых телах и протекании ядерных реакций — словом, в зависимости от задачи. Так, мы придумывали разные «фичи» или, говоря сложным, непонятным языком — принимали научные гипотезы, основанные на нашем научно-априорном знании о предмете, а потом приводили их в настолько формальный вид, чтобы нейронные сети могли с ними справиться. В этом, по-сути, и заключалась наша работа.


Другими словами, мы производили регуляризацию. Не стоит пугаться, что регуляризация (preprocessing) у нас была до «входа» и вообще до работы нейронной сети. Это только в ученье о данных существуют апостериорные регуляризации типа (L1, L2-тихонова и пр.), потому что именно оно, ученье о данных, не имеет никакого представления об объекте с которым работает, а для устаревших ВУЗовских наук — эти все регуляризации вообще не нужны, так как изначально все модели строятся и подгоняются правильно. 


Нейронные сети и ученье о данных
Иллюстрация применения науки ботаники, разделяющей растение на объекты-признаки (лист, цветок, стебель) при обучении нейронной сети.



Так, нам приходилось думать вместо «искусственного интеллекта», который за нами только запоминал и, таким образом, «обучался». Мы делали всё — структурировали данные, рассчитывали признаки, масштабировали, нормировали, делали «нарезки» и только после всех этих процедур, когда каждой «книге» в нашей «библиотеке» был по-сути присвоен свой, уникальный регистрационный номер, и искусственному библиотекарю уже просто негде было ошибаться, — в дело вступали нейронные сети. 


Может быть, сегодняшние технологии шагнули далеко вперед и искусственный библиотекарь может теперь уже  самостоятельно  отличить роман от беллетристики, так что никакие литературоведы ему и подавно не нужны… разве что, обслуживающий персонал в виде учёных по данным. Но в наше далёкое время дело обстояло совершенно иначе.

36 Комментариев
  • 3Qu
    22 февраля 2020, 22:31
    Как оказалось, ANN, леса-деревья и пр. Байесы — это уже ИИ. Кто бы раньше мог подумать.
    Кстати, открою свою маленькую тайну — все это прекрасно работает в качестве обучаемой логики. ПЛМ, если хотите.
    • shprots
      22 февраля 2020, 22:55
      Интересно, но многовато стеба.

      Шахматы, старкрафт, дота, ГО, автопилот в автомобилях, постановка диагнозов...

      Интеллектом пока не пахнет, но это всего лишь 2020 год.
        • shprots
          23 февраля 2020, 10:14
          Kot_Begemot, в шахматах тупо брутфорс, там мало вариантов, там нечего особо придумывать. Я имел ввиду в целом современный AI. Если речь только о NN, то да — они могут решать только определенные задачи.
  • Roman Resner
    23 февраля 2020, 01:50
    Диплёрнинг за поледний 10 лет реально прорыв совершил.  Теперь вот какие вопросы стоят. А что если я например сделаю такой текст, что он будет романом, но определится как сказка. Или например сгенерирую звук, который человек из за особенносетй уха не услышит, но алиса от амазана спишит с карты денег) Как короче защититься от атак и как узнать что это была атака, а не действия пользователя.
    • Roman Resner
      23 февраля 2020, 01:53
      Gravizapa, 

    • Roman Resner
      23 февраля 2020, 01:53
      Gravizapa, 

      • Roman Resner
        23 февраля 2020, 01:56
        Gravizapa, Так что теперь не только регулеризацию делать нужно, но в отдельных случаях еще и на таких примерах учить, чтобы сеть могла их отличать. Проблема только в том, что никто не знает что это за примеры могут быть) 
  • GrayFox
    23 февраля 2020, 04:22
    ага… старую новость про 99 мобильников в тележке и проход с ней по трассе найдёте сами?
    ИИ должен был отфильтровать такое сразу… или присмотреться… а по факту дикая пробка, когда проезжали 5 машин в минуту…
  • GrayFox
    23 февраля 2020, 04:25

    Как Google отреагировал на парня, который имитировал пробки при помощи тележки и 99 телефонов?4 февраля158 тыс. дочитываний40 сек.176 тыс. просмотров. Уникальные посетители страницы.158 тыс. дочитываний, 90%. Пользователи, дочитавшие до конца.40 сек. Среднее время дочитывания публикации.

     

    Ранее мы писали, как художник Саймон Векерт обманул карты Google, создав на них пробки. Для этого он медленно перемещал в тележке 99 смартфонов с запущенными Google Maps. Теперь у нас есть официальное заявление от Google относительно «взлома» карт Google, подробно описанного в оригинальной статье ниже. Теперь у нас также есть некоторая ясность относительно того, как художник выполнил «взлом».

    В интервью для немецкой газеты Frankfurter Allgemeine художник Саймон Векерт рассказал, что у каждого из 99 смартфонов в тележке была своя собственная SIM-карта, и каждый активно использовал Google Maps для навигации. Он обнаружил, что если тележка перестанет двигаться, на Google Maps не появится пробка, поэтому тележка должна постоянно двигаться, чтобы пробка зафиксировалась в сервисе.

    Кроме того, если транспортное средство проезжало мимо тележки с нормальной скоростью, карты также регистрировали движение в обычном режиме. Только когда тележка двигалась, а улица была пуста, на Google Картах появлялись пробки.

    Google ответил в ответ на «взлом» с использованием 99 смартфонов и регистрацией ложных пробок:

    Будь то автомобиль, тележка или  верблюд, нам нравится видеть творческое использование Карт Google, поскольку оно помогает нам улучшать работу карт с течением времени.

    Компания также подтвердила свое стремление сделать Карты максимально точными. Google также насмешливо указал на то, что он может различать автомобили и мотоциклы в некоторых регионах мира, но еще не определил формулу тележек.



  • chizhan
    23 февраля 2020, 06:30
    Нет никакого искусственного интеллекта. Чтоб он мог так называться, ему требуется пройти тест Тьюринга. Все остальные поделки есть всего лишь дополненный интеллект.

    Что до искусственных нейросетей, то они тоже весьма далеки до естественных. Фактически это система сжатия N-мерной таблицы. Например, обычная двумерная таблица это нейросеть с двумя входами и одним выходом. Только она видит какую-то закономерность в организации данных, например, соседние ячейки таблицы ничем не отличаются, значит можно сократить объем информации в этом месте и т.д.
  • П М
    23 февраля 2020, 09:30
    Вы очень смешные и немного жалкие. Каждый пользуется Гугл транслейтом, говорит адрес в навигаторе голосом, чтобы проложить дорогу, разговаривает с роботом, если звонит в какое нибудь МФЦ, но нет, никаких искусственных интеллектов не существует, а люди которые ими занимаются дурачки и шарлатаны, конечно.
    Может быть дело в кажущейся лёгкости. До рождения детей я думал что большой разницы между человеком и кошкой нету. Мозг у тех и других, какие-то мысли, желания. Но собственные дети за пару тройку лет наглядно демонстрируют пропасть между человеком и животными. Когда например понимают что чёрточки и пятна на бумаге это реальные объекты и объединяют их в классы. Дальше, больше. Собаки и кошки, невероятно тупы. При этом кое какой интеллект у них есть. Больше чем у крокодилов  или птиц. Но в шахматы они у вас не выиграют, это очевидно. А ваш смартфон может.
      • Roman Resner
        23 февраля 2020, 12:07
        Kot_Begemot, Если программа создает фото людей никогда ранее не существовавших, то это ИИ.  Естествено что ее нужно обучить, так же как любого человека. Если его обучит стая собак, то жить он будет по собачьи, но это же не гворит что у него инттелект отчутсвует.
    • Roman Ivanov
      23 февраля 2020, 13:30
      ПBМ, я пользуюсь гуглтранслейтом и он хороший показатель того, что искусственного интеллекта нет.
      • ch5oh
        23 февраля 2020, 15:13

        ivanovr, может быть, это просто доказывает, что русский язык черезчур сложен?..

         

        Как известно, "Косил косой косой косой".

         

        • Roman Ivanov
          24 февраля 2020, 19:24
          ch5oh, но он не понимает и смысл английского
  • MixStyleTrader
    23 февраля 2020, 15:40
    Успех NN сейчас во многом определяется как человек находит возможность их применить, чтобы получить пользу. Например в играх компьютер может играть сам с собой и накапливать статистику, а с автопилотом сложнее — нам важно как он поведет себя в необычных редких ситуациях по которым статистики мало.

    С точки зрения интеллекта человека NN очень нерациональны в плане обучения.
  • Kapeks
    23 февраля 2020, 17:06
    Когда одна дура спросила у Фарадея, какой толк от вашего электричества, он ответил: «Мадам, какой толк от новорожденного младенца?».
  • МХ
    23 февраля 2020, 18:36
    Ни с каким хранилищем или библиотекой нейронные сети с самого рождения не ассоциировались. Они решали, и довольно успешно, задачи распознавания образов. И обучение конечно же не сводилось к загрузке в память образцов, оно сводилось к подбору нужных коэффициентов (связей) между слоями сети, если речь идёт о персептроне.
    Ассоциировать нейросети с искуственным интеллектом тоже мало кому приходило в голову. Тут вы что-то своё придумали.
      • ch5oh
        23 февраля 2020, 21:09
        Kot_Begemot, но сеть — это не только память. Сети можно давать картинку, которую она раньше не видела — и она сделает правильную классификацию.
          • Sergey Pavlov
            24 февраля 2020, 14:43
            Kot_Begemot, всё так, но чего вы хотите? Если интеллект не запоминание+комбинаторика, то что остается? ГСЧ?
              • Sergey Pavlov
                25 февраля 2020, 06:51
                Kot_Begemot, у вас хороший пафос о том, что машинный «интеллект» тупой, поскольку тупо работает на запоминании и использовании запомненного по алгоритму в отличие от человеческого интеллекта, который не тупой. Пафос хороший, но давайте внесем ясность. Что может делать интеллект кроме того как запоминать (хранение) и комбинировать (мышление)? У меня только одно дополнение: еще возможна генерации случайности. Про ИИ мы знаем, что там вся случайность это псевдослучайность. Итого, что может быть отличием нетупого человеческого от тупого машинного интеллекта? Наличие подлинной случайности в мышлении и памяти?
                  • Bairam Osmanov
                    29 декабря 2021, 10:37
                    Kot_Begemot, Добрый день! А как с вами можно списаться? У меня 1 вопрос и 1 предложение к вам.
                      • Bairam Osmanov
                        29 декабря 2021, 22:31

                        Kot_Begemot, Чтобы написать первому вам в ЛС нужен рейтинг, которого у меня нет. Может телеграмм или вы мне напишите в личику?)

                        В ином случае придется захламлять смартлаб любительскими статьями, чтобы заработать минимальный рейтинг для переписки с вами =)

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн