+
ПРОГРАММНЫЕ СРЕДСТВА ВЫСОКОУРОВНЕВОГО СИНТЕЗА ДЛЯ МНОГОКРИСТАЛЬНЫХ РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
стр.5-21
Дордопуло А.И., Левин И.И., Гудков В.А., Гуленок А.А.
В статье описывается оригинальный комплекс высокоуровневого синтеза, преобразующий последовательные программы в схемотехническую конфигурацию специализированных аппаратных средств для реконфигурируемых вычислительных систем. Из исходной последовательной программы строится абсолютно-параллельная форма - информационный граф. Далее, граф преобразуется в ресурсонезависимую параллельно-конвейерную форму - кадровую структуру, которую можно адаптировать к различному аппаратному ресурсу. Преобразование кадровой структуры в информационно-эквивалентную, но занимающую меньший аппаратный ресурс, структуру выполняется с помощью формализованных методов редукции производительности, что позволяет автоматически получить рациональное решение для заданной многокристальной реконфигурируемой вычислительной системы. В отличие от известных средств высокоуровневого синтеза результатом преобразования является не IP-ядро вычислительно-трудоемкого фрагмента, а автоматически синхронизированное решение прикладной задачи для всех кристаллов ПЛИС реконфигурируемой вычислительной системы. По сравнению с распараллеливающими компиляторами, число анализируемых вариантов синтеза рационального решения существенно меньше, что является отличительной особенностью описываемого комплекса. Применение программных средств высокоуровневого синтеза рассматривается на примере задачи решения системы линейных алгебраических уравнений методом Гаусса, содержащей информационно-взаимозависимые вычислительные фрагменты с существенно разной степенью параллелизма.
Загружаем данные из библиотечной системы...
Ключевые слова
+
МЕТОД ОПИСАНИЯ ТОПОЛОГИЧЕСКОЙ СТРУКТУРЫ ВЫЧИСЛИТЕЛЬНЫХ КЛАСТЕРОВ, ОСНОВАННЫЙ НА ОПЕРАЦИЯХ ПРОИЗВЕДЕНИЙ ПОДГРАФОВ
стр.22-44
Хабирова Э.Р., Сальников А.Н.
Топологическая структура коммуникационных сетей суперкомпьютерных систем при увеличении размера и сложности суперкомпьютеров соответственно усложняется. Для ее описания существует множество методов, однако такие описания являются громоздкими, что усложняет манипулирование ими. В статье предложен подход к описанию коммуникационной среды суперкомпьютера, когда коммуникационная сеть описывается как конструктор, где элементами конструктора являются типовые топологические структуры, часто встречающиеся в различных вычислительных системах. С этой целью разработан язык описания топологической структуры, основанный на операции произведения подграфов. Язык идейно схож в своих принципах с языками NetML и OMNeT++. Отдельное внимание в работе уделяется исключениям в регулярности сетей реальных суперкомпьютеров; с целью добавления возможности описания данного факта в язык внесены специальные конструкции. Для поддержки работы с языком описания разработана библиотека на языке программирования Си и специальная оболочка над ней написанная на языке Python3, которая затем может использоваться для визуализации описываемых языком графов. Выразительная мощность языка была продемонстрирована на описании вычислительных кластеров: Tianhe-2A, AI Bridging Cloud Infrastructure и Ломоносов-2. Метод был проверен и сравнен с GraphViz DOT показано многократное сокращение необходимых объема записи для некоторых крупных систем из Top500.
Загружаем данные из библиотечной системы...
Ключевые слова
+
УЧЕБНЫЙ КУРС "ПРОГРАММИРОВАНИЕ С ИСПОЛЬЗОВАНИЕМ МОДЕЛИ ONEAPI"
стр.45-58
Сысоев А.В., Горшков А.В., Волокитин В.Д., Шестакова Н.В., Мееров И.Б.
Современные высокопроизводительные вычислительные системы в массе своей являются гетерогенными. Разработка параллельных программ, способных использовать весь потенциал таких систем, сопряжена со значительными сложностями - требуется не только применять соответствующие языки и технологии программирования, но и учитывать особенности центральных и графических процессоров, влияющие в том числе на схемы организации параллелизма и работу с памятью. На упрощение процесса разработки таких программ направлена модель гетерогенного программирования oneAPI, представленная компанией Intel, и ее ключевой компонент - язык Data Parallel C++, позволяющий разрабатывать переносимые высокопроизводительные программы для CPU, GPU, FPGA и других устройств. В статье представлен учебный курс по oneAPI, разработанный в ННГУ им. Н. И. Лобачевского. Курс направлен на изучение широкого спектра вопросов, связанных с высокопроизводительными вычислениями с использованием моделей, методов и инструментов параллельного программирования на платформах Intel. В статье представлена концепция курса, описана его структура, категории слушателей, которым он может быть интересен, и варианты построения курса в зависимости от уровня подготовки аудитории.
Загружаем данные из библиотечной системы...
Ключевые слова
+
МАСШТАБИРУЕМОСТЬ КВАНТОВОХИМИЧЕСКИХ РАСЧЕТОВ КРИСТАЛЛИЧЕСКИХ МАТЕРИАЛОВ НА СУПЕРКОМПЬЮТЕРЕ "ТОРНАДО ЮУРГУ"
стр.59-68
Юшина И.Д., Матвейчук Ю.В., Барташевич Е.В.
В работе обсуждаются рекомендации по рациональному использованию вычислительных ресурсов суперкомпьютера "Торнадо ЮУрГУ" для решения квантовохимических расчетных задач c учетом периодических граничных условий в программе CRYSTAL17. Решение таких задач необходимо для моделирования структуры и свойств кристаллов и, углеродных материалов. Проанализированы данные о временных характеристиках квантовохимических расчетов материалов различного состава и структуры, как для простых систем, таких, как трехмерный силицированный графит, так и для двумерных поверхностей углеродных материалов с диглицидиловым эфиром бисфенола A в роли сорбированной молекулы. Определены различия в масштабируемости расчетов в зависимости от их типа, размера периодически повторяющегося фрагмента структуры (элементарной ячейки), ее симметрии и входных параметров многоэлектронной системы, моделируемой на основе теории функционала электронной плотности в различных приближениях. Установлены рекомендуемые оптимальные параметры для различных типов химических и материаловедческих задач, решаемых в целях разработки цифровых двойников материалов. Обнаружено, что для относительно больших систем критическим является существенное увеличение требующегося объема временных файлов с увеличением числа используемых узлов, что приводит к неоптимальному режиму расчетов и возможному сбою. Показано, что масштабируемость расчетов колебательных характеристик кристаллов существенно ниже, чем для расчетов, направленных на поиск наиболее энергетически выгодной структуры кристалла, независимо от числа атомов в элементарной ячейке вычисляемой структуры.
Загружаем данные из библиотечной системы...
Ключевые слова
+
ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ ВОССТАНОВЛЕНИЯ СЕНСОРНЫХ ДАННЫХ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ ДЛЯ МНОГОЯДЕРНОГО ПРОЦЕССОРА
стр.69-90
Цымблер М.Л., Полуянов А.Н., Краева Я.А.
В настоящее время во многих предметных областях обработка сенсорных данных в режиме реального времени связана с необходимостью синтеза значения соответствующего временного ряда, которое было пропущено ввиду технического сбоя или человеческого фактора. В данной статье предлагается параллельный алгоритм восстановления пропущенных значений потокового временного ряда в режиме реального времени для многоядерного процессора. Алгоритм использует набор опорных временных рядов, которые имеют семантическую связь с исходным рядом. Алгоритм применяет следующую эвристику: если в опорных рядах имеют место повторяющиеся (схожие) подпоследовательности, то в ряде, содержащем пропущенное значение, повторяющиеся подпоследовательности возникают в тех же временных интервалах. Образцами поиска для каждого опорного ряда полагаются подпоследовательности заданной длины, оканчивающиеся в момент пропуска значения в исходном ряде. Схожесть подпоследовательностей с образцом определяется на основе меры DTW (Dynamic Time Warping), имеющей квадратичную вычислительную сложность относительно длины подпоследовательности. Применяется техника нижних границ схожести, позволяющая отбрасывать подпоследовательности, заведомо непохожие на образец, без вычисления DTW. Нижние границы имеют меньшую, чем у DTW сложность, и вычисляются параллельно. Восстановленное значение вычисляется как среднее арифметическое последних элементов найденных интервалов. В вычислительных экспериментах предложенный алгоритм демонстрирует высокую точность восстановления в сравнении с аналогами и быстродействие, приемлемое для применения алгоритма в режиме реального времени.
Загружаем данные из библиотечной системы...
Ключевые слова