Проект распределенной сети суперкомпьютерных центров коллективного пользования

Основной целью проекта является создание сетевой инфраструктуры, объединяющей ресурсы суперкомпьютерных ЦКП.

Для достижения поставленной цели необходимо решение следующих задач по созданию:

  1. Децентрализованной автоматизированной системы управления заданиями и ресурсами. Система управления будет поддерживать глобальную очередь пользовательских заданий и обеспечивать за счет этого оперативное перераспределение вычислительной нагрузки в сети СКЦ.
  2. Единой системы мониторинга, которая позволит оперативно получать информацию о текущих состоянии и загруженности суперкомпьютерных ресурсов распределенной сети.
  3. Единой системы доступа на основе удостоверяющей федерации суперкомпьютерных центров. Система доступа обеспечит пользователей унифицированным интерфейсом к суперкомпьютерным ресурсам распределенной сети, причем авторизоваться в сети можно будет с использованием только личной учетной записи в своей организации.
  4. Общей облачной системы хранения данных, обеспечивающей единое файловое пространство для всех СКЦ сети.

В деятельности любого центра коллективного пользования научным оборудованием можно выделить три основные категории участников научно-организационного процесса: пользователей ЦКП (потребителей услуг), владельцев научного оборудования (поставщиков услуг), руководителей и представителей учредителей — государственных органов исполнительной власти (регуляторов процесса предоставления услуг). Ожидаемые результаты от реализации и внедрения проекта:

Для пользователей

  • повышение качества доступа к суперкомпьютерным ресурсам различных архитектур
  • рост результативности научной деятельности

Для суперкомпьютерных ЦКП

  • оптимизация использования суперкомпьютерных ресурсов сети за счет возможности оперативного перераспределения вычислительной нагрузки
  • рост показателей эффективности деятельности ЦКП

Для учредителей и регуляторов

  • появление принципиально нового инструмента для оперативного мониторинга и контроля использования объединенных суперкомпьютерных ресурсов

 

Подробное описание проекта изложено в публикации:

Б. М. Шабанов, А. П. Овсянников, А. В. Баранов, С. А. Лещев, Б. В. Долгов, Д. Ю. Дербышев. Проект распределенной сети суперкомпьютерных центров коллективного пользования. Программные системы: теория и приложения, №4(35), 2017, с. 245–262. DOI: 10.25209/2079-3316-2017-8-4-245-262

 

Российская инфраструктура для суперкомпьютерных приложений (РИСП)

Российская инфраструктура для суперкомпьютерных приложений (РИСП) является непосредственным предшественником проекта распределенной сети суперкомпьютерных ЦКП и представляет собой гетерогенную вычислительно-информационную грид-инфраструктуру для организации высокопроизводительных распределенных вычислений в сетевой среде. Инфраструктура предназначена для выполнения расчетов в различных областях науки как сотрудниками организаций-участников проекта РИСП, так и представителями других научно-исследовательских организаций и вузов.

РИСП обеспечивает:

  • Динамическое выделение ресурсов по принципу наименьшей загруженности;
  • Общую очередь задач;
  • Защиту от несанкционированного доступа;
  • Единую точка входа.

В 2008-2013 годах РИСП объединяла следующие вычислительные системы: МВС-10ПМВС-100К, а также компоненты распределенной вычислительной системы МВС-15000BMD, размещенные в МСЦ РАН (г. Москва), СПбО МСЦ РАН (г. Санкт-Петербург) и КазО МСЦ РАН (г. Казань). Структура сегмента РИСП представлена на рисунке.

 

 

Каждая вычислительная система, входящая в состав сегмента РИСП, представляет собой кластер, состоящий из файлового сервера, управляющей машины и решающего поля. Каждый кластер находится под управлением собственной системы пакетной обработки СУППЗ и инструментальной ЭВМ – сервера доступа к вычислительным ресурсам.

 

Реализация РИСП описана в следующих статьях:

  1. Савин Г.И., Шабанов Б.М., Корнеев В.В., Телегин П.Н., Семенов Д.В., Киселев А.В., Кузнецов А.В., Вдовикин О.И., Аладышев О.С., Овсянников А.П. Создание распределенной инфраструктуры для суперкомпьютерных приложений. – Программные продукты и системы, 2008, No2, с.2–7;
  2. Victor Korneev, Dmitry Semenov, Andrey Kiselev, Boris Shabanov, Pavel Telegin. Multiagent distributed grid scheduler. (Мультиагентный распределенный ГРИДпланировщик).Proceedings of the Federated Conference on Computer Science and Information Systems. Szczecin, Poland, 18-21 September, 2011 pp. 577–580;
  3. Корнеев В.В., Семенов Д.В., Телегин П.Н., Шабанов Б.М. Отказоустойчивое децентрализованное управление ресурсами грид. //  Известия вузов. Электроника. -М.:МИЭТ, 2015,N No 1.-с.83-89.