В качестве системы пакетной обработки заданий (СПО) на кластерах используется менеджер ресурсов Torque и планировщик Moab HPC Suite Enterprise Edition. Подробнее о системе Torque см. в разделе "Программное обеспечение"
Команды на кластерах СКЦ СГАУ можно выполнять только через систему пакетной обработки заданий, как в пакетном, так и в интерактивном режиме. Удаленный вход пользователей на вычислительные ноды кластеров запрещен.
Основные команды работы с СПО:
Основные опции команды qsub, часто используемые при формировании пакетного задания:
Опция | Назначение |
-N job | Имя задания |
-A account | Аккаунт или код проекта |
-l walltime=время | Время выполнения задания в формате чч:мм:сс (например 1час: walltime=01:00:00) |
-l procs=процессы | Количество вычислительных процессоов (ядер)
Примеры: |
-l nodes=ноды:ppn=процессы | Количество вычислительных нодов nodes, с ppn процессов на каждом ноде.
Примеры: |
-l software=имя_ресурса[+n] | Запрос использования n лицензий определенного программного обеспечения. |
-l pmem=N[kb|mb|gb|tb] |
Запрос количества физической памяти на каждый процесс задачи. Примеры: -l procs=16 -l pmem=4gb - запрос 16 процессов по 4ГБ ОЗУ на каждый процесс. |
-j oe | Перенаправлять поток стандартного вывода ошибок в стандартный вывод. |
-m ae | Посылать электронные сообщения о окончании и ошибках выполнения задания |
-M user@mail.ru | Адрес электронной почты, на который отправляются сообщения СПО. |
Основные опции команды qstat
Основные опции команды qdel
Для получения списка узлов с параметрами и состоянием рекомендуется использовать команду pestat.
Чтобы посмотреть какое количество узлов или ядер свободно на данный момент, можно использовать команду showbf. Команда отображет сколько ядер (Tasks) и узлов (Nodes) свободны для запуска задач.