Война на истощение - на кого поставить в битве ИИ?

02 декабря 2025, 16:38
|
spydell

Если среди американских производителей, я бы поставил на Google и объясню почему.

▪️ Ресурсы определяют долгосрочную устойчивость – Google имеет колоссальный операционный денежный поток в 150 млрд долларов в год, который может без потери стратегической устойчивости отгружать в «плантации ИИ фабрик», чего не может себе позволить OpenAI, Anthropic и xAI, сидящие на подсосе у венчурных инвесторов.

▪️ Мощнейшая инженерная школа DeepMind (практически все ведущие ученые в LLM являются выходцами из DeepMind). Работают медленнее и менее рисково, чем стартапы, но зато системно и последовательно.

▪️Общемировая корпоративная и потребительская клиентская база в несколько миллиардов уникальных пользователей, удерживая через развитую сеть цифровых сервисов Google на всех уровнях (от развлекательных, поисковых, навигационных до бизнес сервисов) и слоях, платформах (мобильные, web, PC, серверные и IDE среды).

▪️ Full-stack платформа: собственное железо, которое выкупает само у себя по себестоимости (Google производит TPU Trillium / v6e) + имеет развитые облачные технологии Google Cloud Platform (GCP) + среда разработки Vertex AI и Google AI Studio с развитыми библиотеками и фреймфорками (Project IDX, Kotlin, Firebase Genkit и т.д. ) + уникальный поисковый движок Google Search, платформу Youtube для сбора данных, дата-сетов и медиа трендов.

▪️ Индустриальный стандарт в WEB технологиях: архитектура Chromium, на котором базируются все современные веб браузеры и сам браузер Chrome с доминирующей рыночной долей, позволяющий отслеживать пользовательские предпочтения, вкусы, запросы и тренды во всех странах, всех возрастов и социальных групп (феноменальный дата сет).

▪️ Корпус данных и индексируемый набор данных последние 20 лет. Сейчас ни одна компания в мире не имеет настолько емкого и обширного доступа к текстовому и медиа контенту, как Google. Пока OpenAI третируют по судам из-за нелицензированного использованных данных многих веб-изданий, Google уже давно проиндексировали практически ВЕСЬ интернет и успешно кэшировали данные.

Практически все, что когда-либо было передано или написано в публичном пространстве – уже знает Google и хранит на специальных серверах. Теперь задача правильно все эти данные извлечь и разместить.

Эти уникальные характеристики и ресурсное обеспечение позволит Google доминировать (финансы, инженеры, платформа, датасеты, общемировая клиентская база и сквозная интеграция ИИ сервисов), здесь любой компании сложно перехватить лидерство.

Данные особо важны.

Gemini 3 обучалась, по моим оценкам (на основе данных обучения предыдущих моделей и аппроксимации с учетом расширенной мультимодальности), на50-70 трлн токенов данных (большая часть видео-контент, где у Google абсолютное преимущество за счет Youtube) или почти 230 Терабайт чистого текста.

Какое количество качественных данных обучили в Gemini 3 – неизвестно, но сейчас вся мировая емкость интернета оценивается в следующей пропорции:

• Научная, техническая и специализированная литература всех дисциплин – 2 трлн токенов

• Научные статьи всех специальностей –0.7 трлн токенов

• Мировая художественная литература всех жанров и времен – 3 трлн токенов

• Образовательная литература, методички – 1 трлн токенов

• Прочая литература, в том числе развлекательных – 3.5 трлн токенов среди относительно качественных

• Энциклопедии, справочники – 0.2 трлн токенов

• Код (в основном GitHub, StackOverflow с учетом техдокументации) – 2 трлн токенов среди относительно качественного кода

• Патенты, техническая документация, стандарты, законы – 2-2.5 трлн токенов.

Относительно качественный пласт данных оценивается около 15 трлн токенов за всю историю человечества, где качественных данных и источников не более 5-10%.

Цифровые новости, блоги и аналитические статьи около 40-45 трлн токенов, плюс еще 200-220 трлн емкость мировых соцсетей в публичной части, большая часть (свыше 99.8%) из которых скам, срач, копипасты, репосты, SEO-мусор.

Все это без медиа контента (графика, аудио, видео), только текст.

https://t.me/spydell_finance/

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.

спецраздел:
Акции

Ключевые слова:
ИИ,
акции

5.6К | ★1

6 комментариев

Шортить человечество).

Replikant_mih

02 декабря 2025, 16:44
Ответить

кстати в апреле этого года ии прошел расширенный тест тьюринга...

ves2010

02 декабря 2025, 17:00
Ответить

Есть, выходит, предел сверху и он уже достигнут. Нет смысла обучать модели на миллиардах квадриллионах токенов, если вся полезная информация помещается в 15 триллионов.

Роман

02 декабря 2025, 18:05
Ответить

Роман, собственно да, подобное было высказано ещё в 2024 году. Данных для обучения больше нет. Далее пошло совершенствование архитектур, что очень громко и дёшево получилось у дипсика, который отрезал всё ненужное. Так что продолжаем эксперименты с архитектурой.

shprots

02 декабря 2025, 18:37
Ответить

ИИ, в т.ч. Gemini 3, до сих пор не имеют… интеллекта: если от них требуется рассуждение в областях, где нельзя просто пересказать чужие мысли, то они плывут и выдают откровенную чушь.

SilentTrader

02 декабря 2025, 18:11
Ответить

SilentTrader, это же эволюция. Потерпите. Не всё сразу

Дмитрий-Димас Ермаков

30 декабря 2025, 08:48
Ответить

Читайте на SMART-LAB:

Итоги первичных размещений ВДО и некоторых розничных выпусков на 22 июня 2026 г.

Следите за нашими новостями в удобном формате: Telegram , Youtube , RuTube, Smart-lab , ВКонтакте , Сайт

Андрей Хохрин

18:44

GBP/USD: пара продолжила снижение под давлением укрепляющегося доллара

Первоначальная попытка роста британского фунта с недельных минимумов в рамках консолидации быстро сменилась резким разворотом и новой волной...

Арман Бейсембаев (Tickmill)

16:41

Где ловить дно фондового рынка?

Российский фондовый рынок 22 июня скорректировался до минимумов 2024 года. Индекс Московской биржи опустился до 2344 пунктов, в моменте теряя 3,2%....

Freedom Global

17:04

Обвал рынка: что делать? Мой личный план. Weekly #122

В целом, то, что мы наблюдаем, происходит в рамках сложившихся ранее тенденций . Ранее, я уже неоднократно отмечал, что все тренды — негативные....

Тимофей Мартынов

18:53

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Война на истощение - на кого поставить в битве ИИ?

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога spydell

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Война на истощение - на кого поставить в битве ИИ?

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога spydell