Running a 26B MoE model on an 8GB GPU