В продолжение темы про Ии, добавлю несколько тезисов:
Часть 1.
Современные Ии(Llm) это Large Language Model (в переводе на русский — Большая языковая модель).
В базовую модель DeepSeek-V3 при обучении загрузили 14,8 триллиона токенов, это примерно 11 триллионов слов (1 токен ≈ 0,75 слова).
Когда слово попадает в DeepSeek, нейросеть переводит его в математический вектор — длинный ряд из сотен или тысяч чисел.
Эти числа определяют «координаты» слова в виртуальном пространстве смыслов. Близкие по смыслу слова (например, «собака» и «щенок») получают похожие координаты и оказываются рядом друг с другом.
Веса (параметры) — это коэффициенты внутри самой нейросети. Их можно сравнить с силой синапсов (связей между клетками) в человеческом мозге.
В DeepSeek-V3 таких весов 671 миллиард.Когда вы задаете вопрос, координаты ваших слов проходят через эти 671 миллиард весов-фильтров.Каждый вес либо усиливает, либо ослабляет сигнал.На выходе сеть вычисляет, какое следующее слово имеет наибольшую вероятность стать продолжением текста.
Часть 2.
Сложные, абстрактные правила морали (законы, этические кодексы) и формальную логику (математику, философию) человек так же формулирует и передает через слова.
Книги стали главным ускорителем прогресса, поскольку они превратили человеческие знания из индивидуального и смертного опыта в коллективную, вечную и накапливаемую память.
Через слова (лекции, учебники, методички) студент вуза получает около 70–80% объема входящей информации.
В науке влияние языка на поведение и мышление описывается гипотезой лингвистической относительности (Сепира — Уорфа). Согласно ей, структура языка определяет то, как человек категоризирует мир, расставляет приоритеты и в конечном счете действует в бытовых ситуациях.
Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.