Бинаризация языковых моделей
Получена: 25.03.2026
Опубликована: 2025 год, том 29, выпуск 3, С. 119–145
Аннотация
В последние годы в сфере обработки естественного языка широкое распространение получили большие языковые модели. Но, несмотря на их востребованность, их применение становится затруднительным из-за больших затрат времени, энергии и памяти. Одним из способов решения этой проблемы является квантизация нейронных сетей - преобразование весов и активаций сети к представлению с более низкой точностью. Частным случаем квантизации является бинаризация - приведение параметров сети к разрядности 1 бит. В работе рассмотрена структура бинарных нейронных сетей, приведен обзор текущих методов бинаризации языковых моделей, описаны полученные результаты.
Ключевые слова: обработка естественного языка, бинарные нейронные сети, бинаризация, квантизация, большие языковые модели.
BibTeX
@article{IS-Davydova2025,
author = {Давыдова, Дарья Николаевна},
title = {{Бинаризация языковых моделей}},
journal = {Интеллектуальные системы. Теория и приложения},
year = {2025},
volume = {29},
number = {3},
pages = {119--145},
}
AMSBIB
\RBibitem{IS-Davydova2025}
\by Д.\,Н.~Давыдова
\paper Бинаризация языковых моделей
\jour Интеллектуальные системы. Теория и приложения
\yr 2025
\vol 29
\issue 3
\pages 119--145
English