Блог им. MarinaEconomist
Дорогие друзья!
может быть среди смартлабовцев найдутся те, кто пользуется и разбирается в этом вопросе.
Какие из перечисленных средств (а может и что-то другое) посоветуете для анализа данных и прогнозирования?
Чем они друг от друга отличаются, какой для чего лучше использовать, какой проще в использовании?
R, Matlab, Julia, Python, Eviews, Stata, SAS, SQL
Спасибо!
Кстати, зачем вам 20-30 лет? Рынки меняются значительно быстрее, и оч старые данные — это уже ни о чем.
3Qu, спасибо!
Да, про рынок согласна, что меняется гораздо быстрее. Даже больше скажу, мне близка позиция, что на ретроспективной информации прогноз не построить.
20-30 лет. Ну все равно же хочется протестить гипотезы :)
10 наиболее полезных библиотек Python для data scientist'ов и инженеров указано в ссылке: https://datastart.ru/blog/read/top-10-bibliotek-python-dlya-data-science
SQL — это язык для запросов в базы данных, откуда в большинстве случаев данные для анализа и достаются. Какие-то сложные штуки в нем посчитать нельзя, но простые и умеренно сложные агрегации (суммы, количество), расчеты средних (медианы, перцентили, доверительные интервалы) посчитать можно. Если речь не про трейдинг, а про обычную работу аналитиком, то это must have, учится с нуля до приемлемого уровня за неделю (максимум, за 2-3).
Python — практически безграничный по своим возможностям язык. Можно сделать и крутую сложную визуализацию, и прогнозирование, и алгоритимические вычисления с циклами и прочими прелестями, и матстат, и спарсить данные с сайтов, и нейросети/деревья решений построить, и распознование текста/изображений. На любой чих есть готовая библиотека, которая позволяет делать сложные вещи в несколько строк кода. Учится с нуля до приемлемого уровня за 2-3 месяца. Потом в основном работаешь с документацией по новым для тебя библиотекам.
R — с точки зрения анализа данных побратим Python. Визуализация, матстат, работа с датафреймами, прогнозирование. Синтаксис похож на питоновский, используется в основном дата саентистами (хотя они как правило и на R, и на Python умеют). Есть узконаправленные нишевые библиотеки, аналогов которых нет на питоне. Я рекомендую начинать с Python, так как а) его возможности значительно шире б) про него больше материалов в) ошибки и прочие проблемы на питоне гуглятся за секунды. Если у тебя возникла ошибка на питоне, почти наверняка уже есть тред с ее решением на stackoverflow. По R найти инфу сложнее
Python — мощный язык — не только для статистики, визуализации, машин-ленинга и прочего сопутствующего, но на нем легко и приятно запиливать разные скрипты и утилиты, кои часто нужны для разных задач — ну там спарсить что-то или переформатировать и т.д. Кроме того, по факту это самый распространенный инструмент из перечисленных и по факту отраслевой стандарт — это значит море библиотек, море ответов в инете на любые вопросы и т.д.
Ну а SQL (как минимум он) — из другой серии — это просто про получение данных.
Replikant_mih, получение данных самое важное.
5 баллов за тонкий троллинг )))
С R лучше не связываться, он уже не актуален. Питон его удавил.))
задумайтесь, пожалуйста, это очень важный вопрос
хочу чтоб эта прекрасная и содержательная ветка не остывала.
Специально для вас:
In 1995, Martin Mächler made an important contribution by convincing Ross and Robert to use the GNU General Public License to make R free software. This was critical because it allowed for the source code for the entire R system to be accessible to anyone who wanted to tinker with it
Alexey, пока не очевидно )
До этого вопроса на форуме я к R склонялась, но сейчас сейчас задумалась о Python. Его действительно больше рекомендуют
вообще ваш вопрос на троллинг похож )). Потому что вы смешали то, что смешивать нельзя (например python и sql). И вопрос то получился почти как — что лучше С++ или Java )).
Раз вы такие вопросы задаете, то вам однозначно python нужен и ничего более.
Alexey, нет никакого подвоха в моем вопросе :)
да 100% есть )) Иначе как можно в один ряд матлаб и sql поставить.
еще уберите R, Matlab, Julia, Eviews, Stata, SAS, SQL и тогда норм будет, по делу!
дайте плз ссылку на источник. Хочется посмотреть, где, кто и зачем все это в один котел кладет
да 100% не понадобится. Данный топик — троллинг или вброс гов*а на вентилятор. Будь тут побольше ИТшников, то можно было бы попкорн доставать
но лучше забей. не для бабы это.
для бабы лучше выйти за банкира.
или за силовика, в россии это даже ценнее.
успехов.
Языки программирования схожи в одном: везде старая добрая логика.
В основном разница в синтаксисе и области применений.
Мой первый язык был Паскаль. С питоном у меня проблема только с синтаксисом: знаю как решить, не знаю как написать.
На мой взгляд можно начать с любого языка, который ближе к потребностям.
Каждый следующий станет изучать гораздо проще. А так или иначе придется
Винни Пух, спасибо за комментарий! Всего не изучишь, и не надо ))
Да, под потребности и задачи — это правильно