Проблемы с контроллером Adaptec 3805 (3405) часть 2
Не так давно писал о проблемах с которыми столкнулся при использовании контроллеров Adaptec.
А точнее – подвисание сервера и возникновение следующих ошибок в dmesg лог файле:
aacraid: Host adapter abort request (4,0,1,0)
aacraid: Host adapter reset request. SCSI hang ?
Кажется удалось решить ее путем low level форматирования всех винчестеров и пересоздания RAID массива путем Build/Verify. На 1 сервере данные действия были выполнены + была установлена новая ОС и вот уже более 11 суток сервер работает без проблем, а до этого стабильно на 9-ый день работы подвисал с ошибкой указанной выше. На этой неделе попробую провести данные работы на еще 3-х серверах, если это поможет, то проблема будет считаться решеной.
Какие действия предпринимались для выявления причины проблемы:
1) Замена контроллера.
2) Обновление прошивки контроллера.
3) Обновление драйверов ОС RHEL 5 для данного контроллера.
4) Переустанка ОС RHEL 5 на сервере.
5) Замена кабелей для подключения RAID контроллера к backplane и выставление джамперов на backplane в режим SGPIO.
6) Low level format всех винчестеров на сервере + пересоздание RAID массивов через Build/Verify.

