Проект распределенной сети суперкомпьютерных центров коллективного пользования
Основной целью проекта является создание сетевой инфраструктуры, объединяющей ресурсы суперкомпьютерных ЦКП.
Для достижения поставленной цели необходимо решение следующих задач по созданию:
- Децентрализованной автоматизированной системы управления заданиями и ресурсами. Система управления будет поддерживать глобальную очередь пользовательских заданий и обеспечивать за счет этого оперативное перераспределение вычислительной нагрузки в сети СКЦ.
- Единой системы мониторинга, которая позволит оперативно получать информацию о текущих состоянии и загруженности суперкомпьютерных ресурсов распределенной сети.
- Единой системы доступа на основе удостоверяющей федерации суперкомпьютерных центров. Система доступа обеспечит пользователей унифицированным интерфейсом к суперкомпьютерным ресурсам распределенной сети, причем авторизоваться в сети можно будет с использованием только личной учетной записи в своей организации.
- Общей облачной системы хранения данных, обеспечивающей единое файловое пространство для всех СКЦ сети.
В деятельности любого центра коллективного пользования научным оборудованием можно выделить три основные категории участников научно-организационного процесса: пользователей ЦКП (потребителей услуг), владельцев научного оборудования (поставщиков услуг), руководителей и представителей учредителей — государственных органов исполнительной власти (регуляторов процесса предоставления услуг). Ожидаемые результаты от реализации и внедрения проекта:
Для пользователей
- повышение качества доступа к суперкомпьютерным ресурсам различных архитектур
- рост результативности научной деятельности
Для суперкомпьютерных ЦКП
- оптимизация использования суперкомпьютерных ресурсов сети за счет возможности оперативного перераспределения вычислительной нагрузки
- рост показателей эффективности деятельности ЦКП
Для учредителей и регуляторов
- появление принципиально нового инструмента для оперативного мониторинга и контроля использования объединенных суперкомпьютерных ресурсов
Подробное описание проекта изложено в публикации:
Б. М. Шабанов, А. П. Овсянников, А. В. Баранов, С. А. Лещев, Б. В. Долгов, Д. Ю. Дербышев. Проект распределенной сети суперкомпьютерных центров коллективного пользования. Программные системы: теория и приложения, №4(35), 2017, с. 245–262. DOI: 10.25209/2079-3316-2017-8-4-245-262
Российская инфраструктура для суперкомпьютерных приложений (РИСП)
Российская инфраструктура для суперкомпьютерных приложений (РИСП) является непосредственным предшественником проекта распределенной сети суперкомпьютерных ЦКП и представляет собой гетерогенную вычислительно-информационную грид-инфраструктуру для организации высокопроизводительных распределенных вычислений в сетевой среде. Инфраструктура предназначена для выполнения расчетов в различных областях науки как сотрудниками организаций-участников проекта РИСП, так и представителями других научно-исследовательских организаций и вузов.
РИСП обеспечивает:
- Динамическое выделение ресурсов по принципу наименьшей загруженности;
- Общую очередь задач;
- Защиту от несанкционированного доступа;
- Единую точка входа.
В 2008-2013 годах РИСП объединяла следующие вычислительные системы: МВС-10П, МВС-100К, а также компоненты распределенной вычислительной системы МВС-15000BMD, размещенные в МСЦ РАН (г. Москва), СПбО МСЦ РАН (г. Санкт-Петербург) и КазО МСЦ РАН (г. Казань). Структура сегмента РИСП представлена на рисунке.
Каждая вычислительная система, входящая в состав сегмента РИСП, представляет собой кластер, состоящий из файлового сервера, управляющей машины и решающего поля. Каждый кластер находится под управлением собственной системы пакетной обработки СУППЗ и инструментальной ЭВМ – сервера доступа к вычислительным ресурсам.
Реализация РИСП описана в следующих статьях:
- Савин Г.И., Шабанов Б.М., Корнеев В.В., Телегин П.Н., Семенов Д.В., Киселев А.В., Кузнецов А.В., Вдовикин О.И., Аладышев О.С., Овсянников А.П. Создание распределенной инфраструктуры для суперкомпьютерных приложений. – Программные продукты и системы, 2008, No2, с.2–7;
- Victor Korneev, Dmitry Semenov, Andrey Kiselev, Boris Shabanov, Pavel Telegin. Multiagent distributed grid scheduler. (Мультиагентный распределенный ГРИД–планировщик).Proceedings of the Federated Conference on Computer Science and Information Systems. Szczecin, Poland, 18-21 September, 2011 pp. 577–580;
- Корнеев В.В., Семенов Д.В., Телегин П.Н., Шабанов Б.М. Отказоустойчивое децентрализованное управление ресурсами грид. // Известия вузов. Электроника. -М.:МИЭТ, 2015,N No 1.-с.83-89.