Блог им. kurd

Биг-Дата - это новый мусор

Источник «Данные — это новый мусор» expert.ru/2020/08/6/dannyie---eto-novyij-musor/
"… еще хуже то, что все большее число исследований показывает, - объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора. Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна — мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора."

Все это стало понятно довольно давно. Когда началось помешательство с компьютеризацией математических моделей экономики. Каждая новая модель была лучше прежней и проваливалась примерно в тот же срок, что и прежняя. Штамповка новых, всё «лучших и лучших» моделей не прекращалась, как и обязательные конфузы с их предсказательной способностью.
Неплохо об этом написано «Why Economic Models Are Always Wrong» www.scientificamerican.com/article/finance-why-economic-models-are-always-wrong/

Наконец пришла идея — поставить это дело на поток за ширму Искусственного Интеллекта. Раньше бесконечные провалы экономистов-математиков
подрывали престиж их профессии. Теперь непогрешимость Нового Оракула — ИИ — не подлежит обсуждению.

Нассим Талеб в «Антихрупкости» заметил, что в достаточно большом массиве данных можно выявить сколько угодно статистических зависимостей, характерных только для данного массива и не имеющих ничего общего с реальными законами материального мира (та же проблема у разработчиков торговых стратегий на бирже).
А Ха Джун Чхан, профессор экономики Лондонского университета, сказал совсем просто — где в экономике начинается математика, там начинается уход от реальности и шарлатанство.

PS Либертарианцы — либералы-ортодоксы, либеральные фундаменталисты фон Мизес, фон Хайек, Мюррей Ротбард — никогда не впадали в математическое шельмовство. За это и за приверженность твёрдым, золотым деньгам — хвала либертарианцам!
★2
14 комментариев
Всегда занятно смотреть как кто-то, кто явно не в теме, пытается рассуждать о чем-то, о чем он не имеет понятия).
avatar
Rostislav Kudryashov, опять ерунду пишете. Для прогнозирования рынка/экономики «лишних» данных не бывает, чем больше — тем лучше. Все новое развивается пузыреподобно, огромное количество экономистов-шарлатанов, включая Нобелевских — признак естественного развития (пузыря), иначе не бывает.  AI, big data — аналогично. Чхан, Талеб, Карелов и проч., включая авторов известных математических моделей,  далеки от реального рынка, не умеют прогнозировать, но тоже занимаются делом — пишут околорыночные статьи.
Работающие модели не публикуют, но они есть.
avatar
kosyamba, я в теме, автор далек от истины
avatar
Подозреваю, что мысль спионерена из книги Хейзинга «Homo Ludens» («Человек играющий», кстати советую к прочтению): ученые приводят миллионы фактов в своих научных книгах, которые без толкования никому не нужны и образуют огромные груды бесполезного мусора. В любом случае мысль здравая и полезная.
avatar
главное не биг дата, а способы обработки
avatar
Биг-Дата — это новый мусор

Абсолютно верно. Это разводка для хомячков и дебилов.
avatar
Если модель будет работать, какая разница, на мусоре или на чем-то другом?( на мусоре дешевле=)
avatar
Alex Gold (Oracle), машинных алгоритмистов. 
Ручками-то коли алгоритмизируешь и торгуешь — не больно-то переоптимизируешь. Приходится идеи продумывать, а не перебирать. 

А то нас тут за нашу ловлю удочками уже совсем затретировали. 
зашёл посмотреть на срач австрийцев и мейнстрима, а его нет(((
Rostislav а Вам сколько лет!?)
Дайте угадать не больше 25 ) Верно?
Верно… мат стат вашей жизни ещё не успела накопится и вы в принципе не можете оценить что это такое)
avatar

теги блога Rostislav Kudryashov

....все тэги



UPDONW
Новый дизайн