Глоссарий AI терминов
LLM
Large Language Model
LLM — это нейросетевая модель для обработки естественного языка (NLP), обученная на гигантских массивах текста (книги, статьи, интернет-контент). Она использует архитектуру трансформеров, что позволяет анализировать контекст, генерировать связные ответы, выполнять перевод, суммаризацию и диалог.
Обучение LLM включает два этапа:
- Предобучение — модель изучает языковые закономерности, предсказывая пропущенные слова в тексте.
- Дообучение — тонкая настройка под конкретные задачи, например, этичные ответы или специфические форматы.
Особенности LLM:
- Масштаб: миллиарды параметров.
- Требуют мощных вычислительных ресурсов.
- Склонны к «галлюцинациям» (генерация вымышленной информации).
Примеры моделей: GPT-4, LLaMA, PaLM, Claude.
Применение: чат-боты, аналитика данных, креативные тексты, обучение. Требуют проверки результатов из-за риска ошибок или смещений в данных.