РЕШЕНИЕ: https://landwatersun.ru/viewtopic.php?id=510#p1819
Известно, что в архитектуре GK110 в одном SMX имеется 192 ядра, однако планировщиков Warp всего 4. Насколько целесообразно такое архитектурное решение? Ведь при начальной загрузке можно занять сразу только 4*32=128 ядер, остальные 64 будут ожидать следующей загрузки нитей от планировщика.