ВЫБОР ЛУЧШИХ ВАРИАНТОВ ИЗ СГЕНЕРИРОВАННЫХ МНОЖЕСТВ
РЕГУЛЯРНЫХ ПЛАНОВ ВЫПОЛНЕНИЯ ЗАПРОСОВ И ФУНКЦИЙ
ДИНАМИЧЕСКОЙ СЕГМЕНТАЦИИ CLUSTERIX-NEW

Р.К. Классен(КНИТУ-КАИ)

Ранее представленные доклады по теме автоматического претранслятора показали, что его эффективность оставляет желать лучшего. Для поиска более эффективного регулярного плана в претранслятор добавлена схема БД с указанием размера полей и количества строк в отношениях. Как показали экспериментальные исследования. учет этих параметров дает уменьшение влияния сетевых передач за счет более уместного выбора размерности полей и выполнения операций JOIN с порядком отношений от меньшего к большему. Дальнейший рост эффективности СУБД Clusterix-New связан с поиском лучшей функции хеширования для процессов динамической сегментации. Основной критерий выбора хеш-функции – возможность хеширования не только по целым числам, но и по строкам, и байтам. В докладе рассматриваются популярные хеш-функции: CRC32, MurMurHash2 и MOD (целочисленный остаток от деления). Производится оценка качества хеширования с помощью специальной метрики, вычисляемая по данным экспериментам. Дается заключение по выбору хеш-функции.

ПРЕЗЕНТАЦИЯ ДОКЛАДА