Alex Craft
Alex Craft личный блог
22 июня 2026, 11:52

ИИ за полдня переписал весь мой код получения данных

Запутанный код парсеров и кравлеров, вытаскивающий данные с разных сайтов.

С полноценной эмуляцией браузера и иммитацией нажатий кнопок, сложного парсинга разных кусков данных и т.п.  Не то что кнопку сложно нажать — но там куча разных таймаутов, повторов, событий, ротацией прокси и т.п. 

И код отдельного, необычного парсера, обертки над емулятором браузера.

И сохранение данных в базу и в разных форматах.

Еб… ть он мочит…
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
19 Комментариев
  • Михаил Шардин
    22 июня 2026, 11:58
    Давно уж так
  • Михаил
    22 июня 2026, 12:03
    Вопрос насколько правильно. Парсинг это такая мутная вещь, часто без четких контрактов — обычно нужно очень осторожно все это делать и понимание edge case(ов) приходит только во время копания во всем этом
  • Viacheslav Ivanenkov
    22 июня 2026, 12:16
    проверял как работает ?

    на тему парсинга. 
    завтра админ сервера поменяет настройки и сервер будет слать вам отличающиеся страницы авторизации.
    например включит или отключит керберос. или сменит метод авторизации. или имена полей ввода изменятся
     
    Парсинг сломается
    • Auximen
      22 июня 2026, 13:26
      Viacheslav Ivanenkov, для этого создаётся отдельный класс парсера, который инкапсулирует интерпретацию кода по принципу одной ответственности, в случае изменения кода на сервере изменения вносятся только в этот класс. Именно поэтому одного ИИ для написания кода недостаточно, необходимо понимать общую структуру приложения, основы ООП программирования, понимать, что такое абстракция, наследование, инкапсуляция и полиморфизм, понимать, когда лучше использовать базу данных, а когда достаточно использовать оперативную память через Redis, чтобы лишний раз не изнашивать SSD и т.д. В целом, ИИ делает программирование не нудным, а интересным, вместо корпения над нудным синтаксисом вайбкодерам приходится решать интересные логические и архитектурные задачи.
      • Viacheslav Ivanenkov
        22 июня 2026, 13:36
        Auximen, 
        в случае изменения кода на сервере изменения вносятся только в этот класс.
        Только узнаешь это постфактум, когда все сломается
        необходимо понимать общую структуру приложения, основы ООП программирования, понимать, что такое абстракция, наследование, инкапсуляция и полиморфизм, понимать, когда лучше использовать базу данных, а когда достаточно использовать оперативную память через Redis
        Мы про парсинг HTML страничек сейчас говорим ? 
    • Synthetic
      22 июня 2026, 14:57
      Viacheslav Ivanenkov, 
      завтра админ сервера поменяет настройки и сервер будет слать вам отличающиеся страницы авторизации.
      например включит или отключит керберос. или сменит метод авторизации. или имена полей ввода изменятся
      Поэтому парсинг — тупик.
        • Synthetic
          22 июня 2026, 19:44
          Alex Craft, 
          Нет, парсинг совсем не проблема

          Например, на сайте MOEX некоторые ценные данные (таблицы) представлены в формате GIF. Парсите на здоровье…
            • Synthetic
              Вчера в 10:47
              Alex Craft, 
              Заметьте — я не говорю  парсинг плохо. Я говорю — парсинг — тупик. Раз уж есть ИИ, который видит экран и может  кнопки нажимать, надо ему и  поручать с сайтами разбираться. Локальный ИИ конечно. Пока один не справляется, и нужно минимум три разных в конвейере. Особенно OCR -весьма специализированный skill.
  • tradeformation
    22 июня 2026, 12:49
    А как ты правильность работы проверяешь?
  • Auximen
    22 июня 2026, 13:19
    Да, особенно впечатляют такие модели, как Claude 4.6, что там в 4.8 и тем более в Fable 5 сложно представить.
  • Юрий Долгополов
    Сегодня в 06:51
    Нихрена не понял, но прочитал и вроде как стал умнее. 

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн