1. Если ваши задачи не запускаются на расчет, с ошибкой "server rejected request with status code 740 - Insufficient funds: There are no valid allocations against which to make the lien" значит у вас недостаточно процессорного времени для выполнения проекта. Для решения проблемы:
- если вы ранее не получали код проекта для запуска задач нужно написать электронное письмо в техподдержку в котором указать свой логин и название проекта для которого требуются ресурсы суперкомпьютерного центра.
- если код проекта у вас имеется нужно также обратиться по электронной почте в техподдержку с просьбой предоставить дополнительное процессорное время.
2. Если ваши задачи завершаются с состоянием "killed by user ..." - это означает что задача завершена принудительно либо вами по команде qdel либо администратором кластера. Чаще всего администратор кластера принудительно завершает задачи которые вышли за лимит физической памяти на вычислительных узлах. Напоминаем что вам необходимо следить за выполнением своих задач, например с помощью команды pestat -u username. Если значение в столбце resi больше чем в pmem - это значит что задача использует больше оперативной памяти чем есть на вычислительном узле. В этом случае нужно самостоятельно остановить задачу командой qdel job_id и пересмотреть конфигурацию вычислительного поля задачи. Например уменьшить число процессов на один узел (ppn) или использовать узлы с большей памятью (bigmem, mem32, mem48).