Marina Sakovich
Marina Sakovich личный блог
30 октября 2020, 19:18

R, Matlab, Julia, Python, Eviews, Stata, SAS, SQL - что выбрать?

Дорогие друзья!

может быть среди смартлабовцев найдутся те, кто пользуется и разбирается в этом вопросе.

Какие из перечисленных средств (а может и что-то другое) посоветуете для анализа данных и прогнозирования?

Чем они друг от друга отличаются, какой для чего лучше использовать, какой проще в использовании? 

R, Matlab, Julia, Python, Eviews, Stata, SAS, SQL

Спасибо!

60 Комментариев
  • Himno a la paz
    30 октября 2020, 19:25
    1С забыли!!!
  • Извините, но Вы собрали все в кучу. Выбор инструмента зависит от бэкграунда дата-сайентиста (анализа больших данных) и специфики его задач.
  • Дмитрий
    30 октября 2020, 19:37
    Отвечу про то, что сам использую в ежедневной работе:

    SQL — это язык для запросов в базы данных, откуда в большинстве случаев данные для анализа и достаются. Какие-то сложные штуки в нем посчитать нельзя, но простые и умеренно сложные агрегации (суммы, количество), расчеты средних (медианы, перцентили, доверительные интервалы) посчитать можно. Если речь не про трейдинг, а про обычную работу аналитиком, то это must have, учится с нуля до приемлемого уровня за неделю (максимум, за 2-3).

    Python — практически безграничный по своим возможностям язык. Можно сделать и крутую сложную визуализацию, и прогнозирование, и алгоритимические вычисления с циклами и прочими прелестями, и матстат, и спарсить данные с сайтов, и нейросети/деревья решений построить, и распознование текста/изображений. На любой чих есть готовая библиотека, которая позволяет делать сложные вещи в несколько строк кода. Учится с нуля до приемлемого уровня за 2-3 месяца. Потом в основном работаешь с документацией по новым для тебя библиотекам.

    R — с точки зрения анализа данных побратим Python. Визуализация, матстат, работа с датафреймами, прогнозирование. Синтаксис похож на питоновский, используется в основном дата саентистами (хотя они как правило и на R, и на Python умеют). Есть узконаправленные нишевые библиотеки, аналогов которых нет на питоне. Я рекомендую начинать с Python, так как а) его возможности значительно шире б) про него больше материалов в) ошибки и прочие проблемы на питоне гуглятся за секунды. Если у тебя возникла ошибка на питоне, почти наверняка уже есть тред с ее решением на stackoverflow. По R найти инфу сложнее
  • TSLab

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн