Ребутится сервак - BSOD 0x0f4

Запарились уже искать проблему. В общем, что известно:
Ребутится рандомно, то каждые десять минут, то трое суток без ребутов.
При ребуте вылетает BSOD 0x0f4. Делали Memtest, Винты проверяли. всё ок.

В логе Kernel Power:

<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331C3B3A-2005-44C2-AC5E-77220C37D6B4}" /> 
<EventID>41</EventID> 
<Version>2</Version> 
<Level>1</Level> 
<Task>63</Task> 

Кто встречался с таким? Какие есть варианты?)

----_
Ах да, перепрошивали BIOS, Перекатывали ОСь

Привет, включи отладку, как написано здесь - http://forum.sys-admin.kz/index.php/topic,2474.msg10630.html#msg10630, после парочки BSOD’ов (желательно 3 -5) вышли дампы, посмотрим в чем может быть дело…

Для начала попробуй:

  • Проверить диски на наличие ошибок
  • Проверить состояние оригинальных файлов Windows - выполнить команду в командной строке - sfc /scannow
  • Отключить антивирусное ПО
  • Отключить лишние устройства если таковые имеются
  • Проверить в диспетчере устройств состояние устройств
  • Попробуй обновить свою ОС последними обновлениями
  • Попробуй проверить и если необходимо обновить драйвера для устройств - verifier.exe (стандартная утилита Windows, посредством которой можно выбрать драйвера и проверить их на операции ввода/вывода (I/O), IRP прерывания, настройки, если необходимо могу написать небольшой мануальчик).

Производитель сервера, модель сервера? Дрова стоят с официального сайта?

Дампы выставил… Только вот сколько теперь ждать BSOD’ы?)) ещё и 3-5шт)) Пока что молчит)

Ну первый вышли посмотрим те по ходу можно будет посмотреть, просто не всегда нужная информация проскальзывает в дампе, поэтому нужно несколько файлов, в данный момент времени у тебя на диске должны быть файлы дампов (большие) поищи файлы с расширением *.dmp , если что куда нибудь выложи, попробуем глянуть…

Пока что могу прикрепить вот такую вещь.
Кстати, BSOD ни разу не указал ни адрес, ни драйвер.

-Диски на наличие ошибок проверены. ОК.
-Проверять состояние Win не требуется, перекатывали ОСь(Несколько раз), перепрошивали BIOS.
-Из ПО только Aida64 на 3 раз поставили
-Лишних устройств не имеется
-Состояние устройств проверено. ОК.
-Нет возможности обновить (впрочем этот вариант по моему бесполезен, ибо на серве стояли 7 и 2008)
-verifier.exe заинтересовал. можно попробовать =)
Редактировать сообщение

Сервер собирали по заказу - Мать - SuperMicro (X10SLL-F), БП 300W (Ablecom), ОЗУшки вроде Kingston’овские, не помню. Винты Seagate. Прошивка и дрова - последние стоят. Неделю назад поставили. Ловить ещё дампы?

Так точно
Вот первый мини:
http://rghost.ru/55170398


Из этого дампа трудно что либо понять, но есть подозрение на проблему управления питанием для начала рекомендую зайти сюда, загрузить и установить последние версии драйверов и прошивок для своей мат. платы. Со стороны блока питания не рассматривали вариант? 300 ватт как то маловато, события генерируются со стороны power возможно это является источником проблемы? Есть возможность поставить иной БП поставить более мощный?
Редактировать сообщение

Вот и второй мини:
http://rghost.ru/55208389

З.Ы. Вариант с БП рассматривали. 300Втт достаточно, но есть подозрение на неисправность БП. Проверить никак не можем =)

В каждом дампе бросается в глаза файл - e1r63x64.sys, этот файл связан с сетевыми драйверами, в одном дампе присутствует так же HTTP.sys… Расскажи мне какие сетевые адаптеры используются на этой плате и есть ли возможность одну (если их две) отключить?

Из сетевых… Только встроенная. Можем отключить её и оставить на тест в выходные

Давай попробуем… Отключайте в BIOS карту…

Жень, тут неожиданная ситуация такая. Представления не имею, как с этим. В общем: сервер явно ребутился (отсутствие оставленных открытых окон), но дампов нет, аида показывает последний ребут в пятницу, когда мы ещё здесь были. Но счетчик ребутов в аиде увеличился. Есть мысли по этому поводу?
Всё, что могу предложить - это ошибку Kernel.


KernelXML.txt (838 Bytes)

Залезь в логи сервера (Application Log) найди последние события:
WMI 5611
WMI 5615
User Profile Service 1531

Детали сюда.

На всякий прикрепил WMI 10, не понравился он мне.


UPS_1531.txt (562 Bytes)

WMI_10.txt (748 Bytes)

WMI_5611.txt (572 Bytes)

WMI_5615.txt (572 Bytes)

Судя по логам (на сколько помню именно такие Event ID должны возникать в моменты старта этих служб) если это брать за основу, то время старта - 2014-05-16T15:52:20 т.е. в пятницу…

Наловил 3й дамп. Всё в кучке.
З.Ы. насчет ивентов: перед бсодом ивентов нет.


3Dumps.rar (62.5 KB)

Посмотрим дампы, эвенты надо смотреть после бсода ) Систему активируешь каким образом, случайно не ODIN’ом? Сам синий экран видел, есть фото экрана?

В общем… каждый бсод вылетает WMI 10… Насколько я могу судить, кусок ““Win32_Processor” AND TargetInstance.LoadPercentage > 99” говорит о том, что проц перегружается. Но разве из-за этого могут быть бсоды? мы запускали тест на 100% ЦП, сутками стоял. Видимо чего-то я не понимаю.

Пробовали разные ОСи, активаторы разные. Везде вылетают. Синь видел. Фото нет.


WMI_10.txt (748 Bytes)

Без активатора не пробовали ось гонять? Во всех дампа присутствует файл драйвер активатора, у многих из-за него бсоды…

Пробовали… И разные оси, и разные активаторы, и без активации. Без толку.

4 дампа


4Dumps.rar (84.2 KB)