Новости
-
Конференция "Russian ‒ German Conference: Supercomputing in Scientific and Industrial Problems ‒ 2018" проходила 23 - 27 Апреля 2018 г. по адресу Россия, Светлогорск, Отель "Универсал".
Доклады
DVM-system was developed in Keldysh Institute of Applied Mathematics, Russian Academy of Sciences, with the active participation of graduate students and students of Faculty of Computational Mathematics and Cybernetics of Lomonosov Moscow State University. It is designed to create parallel programs of scientific-technical calculations in C-DVMH and Fortran-DVMH languages. These languages use the same model of parallel programming (DVMH-model) and are the extensions of standard C and Fortran languages by parallelism specifications, implemented as compiler directives. The directives are invisible to standard compilers, so a programmer can have one program for sequential and for parallel execution on computers of different architectures.
Докладчик: В.А. Бахтин.
-
Конференция "Параллельные вычислительные технологии 2018" проходила 2 - 6 Апреля 2018 г. по адресу Россия, Ростов-на-Дону, Донской государственный технический университет.
Доклады
Оптимизация обработки изображений с использованием ГПУ
Оптимизация обработки изображений с использованием ГПУ
В данной статье рассмотрены подходы к оптимизации обработки изображений на графическом процессоре на примере алгоритма медианной фильтрации. Производится сравнение со свободно распространяемой библиотекой обработки изображений на центральном процессоре, в которой используются векторные инструкции AVX2. Достигнутая скорость фильтрации квадратом 3х3 в 100 GPixels/sec для GPU Titan Pascal и удельная скорость фильтрации квадратом 3х3 в 10.2 GPixels/sec на 1 TFlops для одинарной точности на данное время являются самыми высокими из всех известных в мире.
Докладчик: А.С. Колганов.
Самая быстрая и энергоэффективная реализация алгоритма поиска в ширину на одноузловых различных параллельных архитектурах согласно рейтингу Graph500
Самая быстрая и энергоэффективная реализация алгоритма поиска в ширину на одноузловых различных параллельных архитектурах согласно рейтингу Graph500
Поиск в ширину (BFS) является одним из основных алгоритмов обхода графа и базовым для многих алгоритмов анализа графов более высокого уровня. Поиск в ширину на графах является задачей с нерегулярным доступом к памяти и с нерегулярной зависимостью по данным, что сильно усложняет его распараллеливание на все существующие архитектуры. В статье будет рассмотрена реализация алгоритма поиска в ширину (основного теста рейтинга Graph500) для обработки больших графов на различных архитектурах: Intel х86, IBM Power8+, Intel KNL и NVidia GPU. Будут описаны особенности реализации алгоритма на общей памяти, а также преобразования графа, которые позволяют достичь рекордных показателей производительности и энергоэффективности на данном алгоритме среди всех одноузловых систем рейтинга Graph500 и GreenGraph500.
Докладчик: А.С. Колганов.
Статический анализ приватных переменных в системе автоматизированного распараллеливания Фортран-программ
Статический анализ приватных переменных в системе автоматизированного распараллеливания Фортран-программ
Ресурс параллелизма в программах в основном сосредоточен в циклах. Для того, чтобы цикл мог выполняться параллельно, необходимо обеспечить отсутствие зависимостей по данным. К одному виду таких зависимостей относятся зависимости по скалярным переменным, которые могут быть приватизированы для каждого витка цикла, так как используются только в рамках одного витка. В настоящей статье анализируется проблема автоматического определения и расстановки приватизируемых переменных в циклах для их последующего параллельного выполнения в Фортран-программах. Предлагается алгоритм их определения, основанный на методах анализа потока данных, его расширение для межпроцедурного анализа. Приводятся результаты проверки алгоритма на ряде программ из пакета тестов NASA, а также на композиционной модели многокомпонентной фильтрации при разработке месторождений нефти и газа.
Работа выполнена при поддержке грантов РФФИ №№17-01-00820, 18-01-00851 А.
Докладчик: А.С. Колганов.
Преобразование последовательных Си-программ для их распараллеливания
Преобразование последовательных Си-программ для их распараллеливания
Распараллеливание часто требует значительного преобразования программы, в том числе и на уровне исходного кода, а необходимость преобразования определяется возможностями выбранной технологии параллельного программирования. Одним из важных преобразований является подстановка процедур в Си-программах, а именно, замена вызова процедуры ее непосредственным телом со всеми подставленными аргументами. Данное преобразование позволяет при выполнении программы снизить накладные расходы, связанные с вызовом процедуры, а на этапе статического анализа и компиляции делает возможным применение различных оптимизаций, в том числе и распараллеливающих, без фактического межпроцедурного анализа. Применение данной оптимизации на уровне исходного кода позволит системе САПФОР определять более эффективные схемы распараллеливания пользовательской программы. Соответствующий модуль для системы САПФОР был реализован на языке C++ с применением инфраструктуры LLVM и Clang и проверен на тестах из набора NAS Parallel Benchmarks.
Работа выполнена при поддержке Российского фонда фундаментальных исследований, проекты 16-07-01067, 17-01-00820 и 18-01-00851.
Докладчик: А.С. Колганов.
Опыт решения прикладных задач, использующих нерегулярные сетки, с использованием DVM-системы
Опыт решения прикладных задач, использующих нерегулярные сетки, с использованием DVM-системы
DVM-система предназначена для разработки параллельных программ научнотехнических расчетов на языках C-DVMH и Fortran-DVMH. Эти языки используют единую модель параллельного программирования (DVMH-модель) и являются расширением стандартных языков Си и Фортран спецификациями параллелизма, оформленными в виде директив компилятору. DVMH-модель позволяет создавать эффективные параллельные программы для гетерогенных вычислительных кластеров с ускорителями. В статье описывается опыт использования DVM-системы для распараллеливания прикладных программ, использующих нерегуляные сетки.
Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов № 16-07-01014, 16-07-01067 и 17-01-00820.
Докладчик: В.А. Бахтин.
-
Конференция "Суперкомпьютерные дни в России 2017" проходила 25 - 26 Сентября 2017 г. по адресу Россия, Москва, гостиница Holiday Inn Moscow - Sokolniki.
Доклады
Опыт решения прикладных задач с использованием DVM-системы
Опыт решения прикладных задач с использованием DVM-системы
DVM-система предназначена для разработки параллельных программ научно-технических расчетов на языках C-DVMH и Fortran-DVMH. Эти языки используют единую модель параллельного программирования (DVMH-модель) и являются расширением стандартных языков Си и Фортран спецификациями параллелизма, оформленными в виде директив компилятору. DVMH-модель позволяет создавать эффективные параллельные программы для гетерогенных вычислительных кластеров, в узлах которых в качестве вычислительных устройств наряду с универсальными многоядерными процессорами могут использоваться ускорители (графические процессоры или сопроцессоры Intel Xeon Phi). В статье описывается опыт использования DVM-системы для распараллеливания различных прикладных программ.
Работа поддержана грантами РФФИ № 16-07-01014, 16-07-01067, 16-37-00266 и 17-01-00820.
Докладчик: В.А. Бахтин.
-
Конференция "XIX Всероссийская конференция Научный сервис в сети Интернет 2017" проходила 18 - 23 Сентября 2017 г. по адресу Россия, Новороссийск, пос. Абрау-Дюрсо, пансионат Моряк, НМП.
Доклады
Инкрементальное распараллеливание для кластеров в системе САПФОР
Инкрементальное распараллеливание для кластеров в системе САПФОР
Опыт использования системы САПФОР показал, что при распараллеливании на кластер больших программ и программных комплексов необходимо уметь распараллеливать их инкрементально, начиная с наиболее времяемких ее фрагментов и постепенно добавляя новые фрагменты, пока не достигнем желаемого уровня эффективности параллельной программы. Данная статья посвящена рассмотрению принципов организации инкрементального распараллеливания программных комплексов.
Работа выполнена при поддержке РФФИ (проекты № 16-07-01067, 16-07-01014, 17-01-00820).
Докладчик: Н.А. Катаев.
Система САПФОР является в первую очередь системой автоматизированного распараллеливания программ, что предполагает организацию взаимодействия с пользователем для принятия некоторых решений по распараллеливанию. Существующая версия системы обладает средством визуализации автоматически принимаемых решений, а также позволяет пользователю участвовать в распараллеливании через задание специальных указаний в исходном коде программы. При этом возможности, предоставляемые указанными средствами, ограничены и требуют от пользователя либо явного указания всех особенностей программы до начала ее распараллеливания, либо многократного перезапуска всех компонент системы после каждого небольшого уточнения свойств. В данной статье рассматривается новый подход к организации интерактивного взаимодействия с пользователем в системе САПФОР, который позволит предоставлять пользователю информацию о ходе распараллеливания и учитывать его рекомендации по ходу работы системы.
Работа выполнена при поддержке Российского фонда фундаментальных исследований, проект 17-01-00820-a
Докладчик: Н.А. Катаев.
Развитие метода сравнительной отладки DVMH-программ
Развитие метода сравнительной отладки DVMH-программ
Отладка параллельных программ является трудоемкой и нетривиальной задачей. Для автоматизации этого процесса DVM-система предоставляет механизм сравнительной отладки, который позволяет обнаруживать расхождения промежуточных результатов параллельного и последовательного выполнения DVMH-программы. Сравнительная отладка в DVM-системе реализована посредством трассировки при выполнении программы следующих событий: чтения и модификации переменных, итерации циклов и т.п. Получаемые при параллельном выполнении промежуточные результаты сравниваются с эталонными, в качестве которых обычно рассматриваются результаты последовательного выполнения, ранее сохраненными в виде файлов с трассами. Но при отладке реальных программ размер этих файлов может значительно превысить возможности файловой системы. Для таких случаев требуется другой способ организации сравнительной отладки – одновременный запуск последовательного и параллельного выполнения программы и сравнение их промежуточных результатов «на лету». В данной статье описываются принципы реализации в DVM-системе такого режима отладки.
Работа выполнена при поддержке Российского фонда фундаментальных исследований, проект проекты 16-07-01067 и 17-01-00820.
Докладчик: А.А. Ермичев.
-
Конференция "14th International Conference on Parallel Computing Technologies" проходила 4 - 8 Сентября 2017 г. по адресу Россия, Нижний Новгород, Нижегородский государственный университет им. Н.И. Лобачевского.
Доклады
Automated Parallelization of a Simulation Method of Elastic Wave Propagation in Media with Complex 3D Geometry Surface on High-Performance Heterogeneous Clusters
Automated Parallelization of a Simulation Method of Elastic Wave Propagation in Media with Complex 3D Geometry Surface on High-Performance Heterogeneous Clusters
The paper considers application of DVM and SAPFOR in order to automate mapping of 3D elastic waves simulation method on high-performance heterogeneous clusters. A distinctive feature of the proposed method is the use of a curved three-dimensional grid, which is consistent with the geometry of free surface. Usage of curved grids considerably complicates both manual and automated parallelization. Technique to map curved grid on a structured grid has been presented to solve this problem. The sequential program based on the finite difference method on a structured grid, has been parallelized using Fortran-DVMH language. Application of SAPFOR analysis tools simplified this parallelization process. Features of automated parallelization are described. Authors estimate efficiency and acceleration of the parallel program and compare performance of the DVMH based program with a program obtained after manual parallelization using MPI programming technology.
The reported study was funded by RFBR according to the research projects 17-01-00820, 16-07-01067, 16-07-01014, 17-41-543003, 16-01-00455, 16-07-00434.
Докладчик: Н.А. Катаев.