Friday, May 9, 2014

Symantec Backup EXEC + NDMP + Queued state jobs

Мало кому будет интересно. Эпическая борьба с Семантеком -- техническая статья с ругательствами :)

Итак дано:
1) Symantec Backup EXEC 2010r3 -> 2012
2) NDMP backups from Netapp filers OnTap 8.1* -> 8.2.1
3) SAN инфрасруктура на основе Fiber HP свитча
4) Quantum Tape library i80 с тремя Tape Drive приводами от HP

Проблема:
1) Бэкапы с Netapp по NDMP не работают -- ошибок нет, просто задача висит в Queued state. Она может висеть пока вам не надоест -- день, два, три, неделю. Иногда "отваливается" первый привод - который Control Path, и соответственно ВСЯ библиотека ложится.

Troubleshooting:
1) Бэкапы с NDMP на локальный диск работают
2) Бэкапы на ленты с серверов, на которых установлен агент (не NDMP), работают
3) SAN свитч показывает, что все зеленые - т.е. подключены и связь есть
4) Netapp может "видеть" Medium Changer и 100% "видит" все три привода -- команда sysconfig -m и sysconfig -t
filer> sysconfig -m
    Medium changer ()  QUANTUM  Scalar i40-i80
    mc0 - medium changer device
5) Quantum не сообщает об ошибках
6) У нас были не сертифицированные версии (старые) Backup EXEC 2010r3, OnTap 8.2.*

Причина (в моем случае):
- я подозреваю, что она для всех подобных случаев одинаковая
1) Netapp filers должны, обязаны видеть Medium Changer -- желательно чтобы они общались с роботом ДО того как сервер резервного копирования (Backup EXEC) будет загружен
2) Сам сервер резервного копирования (windows) ОБЯЗАН видеть medium changer и все подключенные приводы (Tape Drives). Драйвера, в соответствии с рекомендациями Семантека, должны быть: на робот от Майкрософта, на приводы от Семантека.































Почему это важно? Потому, что при выполнении NDMP-задач роботом управляет NETAPP. Для выполнения других задач: удаление информации с ленты, бэкап с агентов - роботм управляет Windows/Backup EXEC. Т.е. если Windows не "видит" робот то все задачи по удалению или бэкапу с систем с агентами будут в Queued. И наоборот, если Netapp файлер не видит робот, то все NDMP задачи будут в Queued.

Для того чтобы выяснить это мне потребовалось 3 раза открывать кейс в Семантеке, 2 раза в Квантуме и 2 раза в Нетаппе. Мои выводы я сделал сам, как и решил сам свою проблему. Что показывает ПОЛНУЮ НЕСОСТОЯТЕЛЬНОСТЬ техподдержки компании Семантек. Они закрывают кейс когда ПОЧЕМУ-ТО бэкапы вдруг начинают работать, хотя НИЧЕГО сделано не было. Не известно почему. Я два раза был на 3 уровне техподдержки Семантека. :)

Техподдержка в Квантуме отличная :)
Техподдержка в Нетаппе на 4 -- из-за времни реакции :)

Проблема была "плавающая" и на выяснение причин потребовалось 6 месяцев.

No comments:

Post a Comment