Dobriy_Dob
Dobriy_Dob личный блог
21 июня 2026, 22:54

Ии как генератор слов

В продолжение темы про Ии, добавлю несколько тезисов:

Часть 1.
Современные Ии(Llm) это Large Language Model (в переводе на русский — Большая языковая модель).
В базовую модель DeepSeek-V3 при обучении загрузили 14,8 триллиона токенов, это примерно 11 триллионов слов (1 токен ≈ 0,75 слова).
Когда слово попадает в DeepSeek, нейросеть переводит его в математический вектор — длинный ряд из сотен или тысяч чисел.
Эти числа определяют «координаты» слова в виртуальном пространстве смыслов. Близкие по смыслу слова (например, «собака» и «щенок») получают похожие координаты и оказываются рядом друг с другом.
Веса (параметры) — это коэффициенты внутри самой нейросети. Их можно сравнить с силой синапсов (связей между клетками) в человеческом мозге.
В DeepSeek-V3 таких весов 671 миллиард.Когда вы задаете вопрос, координаты ваших слов проходят через эти 671 миллиард весов-фильтров.Каждый вес либо усиливает, либо ослабляет сигнал.На выходе сеть вычисляет, какое следующее слово имеет наибольшую вероятность стать продолжением текста.

Часть 2.
Сложные, абстрактные правила морали (законы, этические кодексы) и формальную логику (математику, философию) человек так же формулирует и передает через слова.
Книги стали главным ускорителем прогресса, поскольку они превратили человеческие знания из индивидуального и смертного опыта в коллективную, вечную и накапливаемую память.
Через слова (лекции, учебники, методички) студент вуза получает около 70–80% объема входящей информации.
В науке влияние языка на поведение и мышление описывается гипотезой лингвистической относительности (Сепира — Уорфа). Согласно ей, структура языка определяет то, как человек категоризирует мир, расставляет приоритеты и в конечном счете действует в бытовых ситуациях.


Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
5 Комментариев
  • tradeformation
    21 июня 2026, 22:58
    Через слова (лекции, учебники, методички) студент вуза получает около 70–80% объема входящей информации.
    Отнюдь не через слова, а через релевантный этим словам свой собственный опыт. И через слова ещё получают структуры.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн