МОГУТ ЛИ GPU-АКСЕЛЕРАТОРЫ СУЩЕСТВЕННО ПОВЫСИТЬ ЭФФЕКТИВНОСТЬ КОНСЕРВАТИВНЫХ СУБД ЗНАЧИТЕЛЬНЫХ ОБЪЕМОВ НА КЛАСТЕРНОЙ ПЛАТФОРМЕ?
В.А. Райхлин, Р.К. Классен (КНИТУ-КАИ)
Обсуждаются вопросы построения СУБД консервативного типа (с эпизодическим обновлением данных в специально выделяемое время) на платформе GPU-кластеров при объемах баз данных – VБД не менее 100GB. Их актуальность определяется современными тенденциями интеллектуальной обработки больших информационных массивов с применением графических ускорителей – GPU. По условию обработка запросов ведется по регулярному плану. В узлах кластера под управлением СУБД MySQL функционируют многоядерные процессоры. В динамике обработки запросов узловая БД оказывается в оперативной памяти узла объемом до 128 GB. Рассматриваются случаи средних VБД – вблизи 100GB, реплицируемых по узлам, и достаточно больших VБД – от сотен GB до единиц TB, хешируемых на множестве узлов. В первом случае анализируются два варианта функционирования СУБД: 1) на CPU – операции «select-project», на GPU – «join»; 2) на CPU – «project» и «join», на GPU – «select», БД хранится в сжатом виде. Установлено, что оба варианта использования ускорителей неконкурентоспособны. Во втором случае хешируется сжатая БД по узлам IO с ускорителями, на которых выполняются операции «select-project», операции «join» реализуются на узлах JOIN без GPU. Приведено теоретическое обоснование такой организации. Экспериментальное подтверждение значительного превышения ее эффективности по сравнению с ранее разработанной СУБД Clusterix-M без GPU связывается с разработкой натурной модели Clusterix-G.
ВИДЕО ДОКЛАДА: