Бинаризация языковых моделей

Аннотация

В последние годы в сфере обработки естественного языка широкое распространение получили большие языковые модели. Но, несмотря на их востребованность, их применение становится затруднительным из-за больших затрат времени, энергии и памяти. Одним из способов решения этой проблемы является квантизация нейронных сетей - преобразование весов и активаций сети к представлению с более низкой точностью. Частным случаем квантизации является бинаризация - приведение параметров сети к разрядности 1 бит. В работе рассмотрена структура бинарных нейронных сетей, приведен обзор текущих методов бинаризации языковых моделей, описаны полученные результаты.

Ключевые слова: обработка естественного языка, бинарные нейронные сети, бинаризация, квантизация, большие языковые модели.

BibTeX
@article{IS-Davydova2025,
  author  = {Давыдова, Дарья Николаевна},
  title   = {{Бинаризация языковых моделей}},
  journal = {Интеллектуальные системы. Теория и приложения},
  year    = {2025},
  volume  = {29},
  number  = {3},
  pages   = {119--145},
}
AMSBIB
\RBibitem{IS-Davydova2025}
\by Д.\,Н.~Давыдова
\paper Бинаризация языковых моделей
\jour Интеллектуальные системы. Теория и приложения
\yr 2025
\vol 29
\issue 3
\pages 119--145
Опубликовано на условиях лицензии Creative Commons Attribution 4.0 International (CC BY 4.0)

← К номеру журнала

× Issue cover