TurboQuant от Alphabet (GOOG): почему сжатие данных — топливо, а не тормоз для полупроводникового цикла
Уже успело завонять этой новостью в духе Анкориджа, но не всё так линейно как рисуют вам, те кто как всегда сеют панику. Давайте разбираться...
Многие сейчас паникуют из-за TurboQuant, видя в нем «убийцу спроса» на чипы. Но если вы посмотрите на это моими глазами — глазами инженера NVIDIA — картина меняется на 180 градусов. Вот технологический разбор ситуации:
1. Парадокс Джевонса в действии. В полупроводниковой промышленности действует следующее правило: когда ресурс становится дешевле или эффективнее, его потребление не уменьшается, а резко возрастает. Сжатие в 6 раз означает, что компании, которые раньше не могли позволить себе запуск мощных Llama или Gemini из-за нехватки VRAM, теперь начнут активно использовать эти технологии. Снижения спроса на H100/H200 не произойдет, скорее всего, будет наблюдаться взрывной рост внедрений в сегментах, где это раньше было экономически невыгодно (Edge-вычисления, частные облака).
2. Смещение акцента с объема на чистую вычислительную мощность (Compute).
Авто-репост. Читать в блоге
>>>