dr.Brain

doctor Brain

мир глазами веб-разработчика

Если кратко: большая языковая модель

большие языковые модели на простых примерах

dr.Brain

время чтения 1 мин.

Photo by AI

Большая языква модель (Large Language Model, LLM) является очень большой моделью глубокого обучения (набором нейросетей), обучаемой на огромных объемах данных, и способной предсказывать следующий токен, опираясь на информацию о предсказанных ранее токенах.

Токен - это смысловой отрывок: слово, словосочетание, предложение, часть фразы - последовательность символов, характерных для естественного языка.

Благодаря токенам, большие языковые модели общаются «как люди», создавая определенные шаблоны обработки естественного языка. Но они ограничены, так как для создания шаблонов используются только обучающие данные, даже несмотря на то, что такие обучающие данные являются огромными наборами информации, значительно превышающими изученные возможности памяти среднестатистического человека.

llm

образ какой-то ерунды в представлении искусственного интеллекта

Кстати, как и обычные школьники и студенты, большие языковые модели начинают выдумывать, когда чего-то не знают.


Спасибо за внимание.

Новые публикации

Далее

Категории

О нас

Frontend & Backend. Статьи, обзоры, заметки, код, уроки.