przełom w kwantyzacji modeli językowych - BLOG TECHNOLOGICZNY Gadzety360.pl

Od Teorii do Praktyki: Jak BitNet b1.58 zmienia zasady gry w Sztucznej Inteligencji

11 kwietnia 202410 kwietnia 2024

Od Teorii do Praktyki: Jak BitNet b1.58 zmienia zasady gry w Sztucznej Inteligencji Modele językowe, zbudowane na architekturze Transformera, typowo operują w precyzji 16-bitowej (FP-16 lub BF-16), gdzie głównymi kosztami obliczeniowymi są operacje dodawania i mnożenia macierzy zmiennoprzecinkowych. W tych pełnoprecyzyjnych modelach, ładowanie wag z DRAM do pamięci akceleratora na chipie (np. SRAM) generuje wysokie …

Czytaj dalej