Przejdź do treści

DeepSpeed

logo DeepSpeed

Wprowadzenie

DeepSpeed to stworzona przez Microsoft biblioteka do efektywnego trenowania modeli AI oraz inferencji. Jako trzon wykorzystuje bibliotekę Pytorch. Niektóre elementy, jak na przykład strategie treningu rozproszonego, są zintegrowane z innymi technologiami takimi jak Lightning czy HuggingFace Transformers.

Dostępność

DeepSpeed jest dostępny dla języka Python. Instalacja jest możliwa przy wykorzystaniu popularnych menadżerów oprogramowania, takich jak pip czy conda. Szczegóły dotyczące instalacji znajdują się na stronie projektu.

Szczegóły

DeepSpeed oferuje szeroki wachlarz narzędzi. Szczególnie warte uwagi są funkcjonalności dotyczące kompresji modelu pozwalające na użycie modeli w środowiskach o ograniczonych zasobach obliczeniowych. Kolejnym wartym uwagi elementem są narzędzia do zrównoleglenia i optymalizacji procesu treningu. Umożliwiaja one zwiększenie prędkości przetwarzania oraz dalsze obniżenie wymagań sprzętowych.

Informacje o wydaniu

Obecna wersja to 0.12.4 wydana w grudniu 2023 roku. Biblioteka jest regularnie rozwijana, aktualizacje pojawiają się kilka razy w roku.

Linki


Ostatnia aktualizacja: 6 grudnia 2023