Дорогие друзья!
может быть среди смартлабовцев найдутся те, кто пользуется и разбирается в этом вопросе.
Какие из перечисленных средств (а может и что-то другое) посоветуете для анализа данных и прогнозирования?
Чем они друг от друга отличаются, какой для чего лучше использовать, какой проще в использовании?
R, Matlab, Julia, Python, Eviews, Stata, SAS, SQL
Спасибо!
SQL — это язык для запросов в базы данных, откуда в большинстве случаев данные для анализа и достаются. Какие-то сложные штуки в нем посчитать нельзя, но простые и умеренно сложные агрегации (суммы, количество), расчеты средних (медианы, перцентили, доверительные интервалы) посчитать можно. Если речь не про трейдинг, а про обычную работу аналитиком, то это must have, учится с нуля до приемлемого уровня за неделю (максимум, за 2-3).
Python — практически безграничный по своим возможностям язык. Можно сделать и крутую сложную визуализацию, и прогнозирование, и алгоритимические вычисления с циклами и прочими прелестями, и матстат, и спарсить данные с сайтов, и нейросети/деревья решений построить, и распознование текста/изображений. На любой чих есть готовая библиотека, которая позволяет делать сложные вещи в несколько строк кода. Учится с нуля до приемлемого уровня за 2-3 месяца. Потом в основном работаешь с документацией по новым для тебя библиотекам.
R — с точки зрения анализа данных побратим Python. Визуализация, матстат, работа с датафреймами, прогнозирование. Синтаксис похож на питоновский, используется в основном дата саентистами (хотя они как правило и на R, и на Python умеют). Есть узконаправленные нишевые библиотеки, аналогов которых нет на питоне. Я рекомендую начинать с Python, так как а) его возможности значительно шире б) про него больше материалов в) ошибки и прочие проблемы на питоне гуглятся за секунды. Если у тебя возникла ошибка на питоне, почти наверняка уже есть тред с ее решением на stackoverflow. По R найти инфу сложнее