Автор Тема: Внезапное отключение ноутбука MSI GT60 2OC (с в/к NV GTX 980m)  (Прочитано 762 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
Всех приветствую. Буквально месяц назад ноутбук MSI GT60 2OC стал внезапно отключаться при играх. Так, через несколько минут либо через час-полтора ноутбук отключается (как если бы его выключили от сети). В декабре 2016 года заменил родную видеокарту (Nvidia GeForce GTX 770m) на новую (Nvidia GeForce GTX 980m 8 Гб, от Clevo).

Поначалу подумал, что неисправен блок питания (далее - БП), т.к. ему уже 5 лет, 2,5 года из которых он проработал в усиленном режиме. Под усиленным режимом я понимаю то, что его мощности (180 Вт) без батареи не хватало на нормальное функционирование ноутбука (без подключения батареи в ноутбук fps  в играх падал в 2-3 раза), БП грелся очень сильно (как батареи отопления). После того, как ноутбук стал внезапно отключаться я приобрёл новый БП от Asus на 230 Вт. Использовал под нагрузкой данный БП как с батареей, так и без неё; но результата один - внезапное отключение ноутбука.

В свою очередь заметил, что за несколько минут до отключения ноутбука на короткое время (2-3 секунды) проседает fps и значок зарядки батареи моргает (такое проседание происходит не всегда): в панели задач Windows 10 (справа внизу) сначала показывает просто иконку батареи (без вилки с левой стороны; как если бы ноутбук был отключён от блока питания), после вышеуказанного "проседания" - возвращается в норму (иконка показывает, что идёт заряд батареи (анимация заполнения пустой батареи)). Ноутбук отключается также при использовании (на видеокарте GTX 980m) других ресурсоёмких приложений (например, Adobe Premiere Pro, Photoshop и др.). В режиме обычной работы (просмотр Интернета, видео в 4K 60 fps и др.) такого не происходит.

Сразу отмечу, что дело не в перегреве, т.к. после нескольких таких отключений сразу же производил чистку системы охлаждения, а также производил замену термопасты и термопрокладок на процессоре и видеокарте. Следил за температурами всех элементов ноутбука (использовал SpeedFan, AIDA64, GPU-Z) при игре, запущенной в оконном режиме. Все температуры были нормальными (температура процессора не поднималась выше 75 °C, а видеокарты - 84 °C).

После нескольких подобных систематических отключений решил посмотреть журнал событий Windows и выяснить какое именно событие предшествовало внезапному отключению ноутбука. В основном это подобные ошибки типа "Kernel Power" (Система перезагрузилась, завершив работу с ошибками), "iaStorA" (Был произведен возврат к устройству \Device\RaidPort0.), BTHUSB (Локальный адаптер не поддерживает важное состояние контроллера энергосбережения для поддержки режима периферийного устройства) и др. Один раз ноутбук перезагрузился с BSOD со следующим сообщением кода остановки системы: DRIVER_POWER_STATE_FAILURE. Синий экран более не появлялся, но проблемы с внезапным выключением ноутбука никуда не ушли.

Для наглядности процесса отключения я заснял видео, где при использовании блока питания (с подключённой батареей; без батареи ноутбук просто отключится) происходит внезапное отключение ноутбука.

Когда производил тест, то режим "Cooler Boost" не включал. При просмотре видео прошу обратить внимание на иконку батареи (в панели задач) перед выключением, а также на температуру компонентов системы (очевидно, что перегрева быть не может). Отмечу, что проведение такого же теста в FurMark'е, но только с использованием батареи (без БП) также приводит к аналогичному отключению. FurMark всегда использовался в режиме "GPU stress test".

Теперь я думаю, что проблема может скрываться в видеокарте Nvidia GeForce GTX 980m. Объясню почему. Например, если  я использую FurMark на интегрированной видеокарте (Intel HD4600), то бенчмарк может проработать долгое время без выключений, в то время как на GTX 980m ноутбук отключается не проработав даже одной минуты. Однако, в игре Destiny 2 (настройки специально понизил на самые минимальные и запускал в оконном режиме в разрешении 1368х768) ноутбук не отключается в течение, как минимум 10 минут (но через определённое количество времени ноутбук всё равно отключается). Пробовал откатывать драйвера видеокарты Nvidia с новой версии (411.70) до относительно старой (398.11), где такого внезапного отключения не было (подумал, что может быть виноваты новые драйвера). Откат к старым проверенным драйверам не помог - ноутбук всё равно отключается. Возможно, что причина кроется в поломке (перегреве?) какого-либо элемента(-ов) видеокарты (например, чипа памяти или каких-нибудь мелких деталей).

Температура компонентов системы при использовании FurMark'а на интегрированной карте (Intel HD 4600) в течение 10 минут без использования режима "Cooler Boost" не превышает рабочие температуры. Таким образом, отключение ноутбука не происходит, когда системой используется интегрированная видеокарта.

Действительно ли описанные выше симптомы могут служить доказательством неисправности видеокарты? Я не исключаю, что неисправность может быть и вовсе не в видеокарте, а, например, в материнской плате, процессоре и др.

P.S. Проверить на практике неисправность видеокарты не представляется возможным, т.к. отсутствует какая-либо вторая дискретная видеокарта.
« Последнее редактирование: Февраль 28, 2019, 06:13:07 pm от PeaceMaker »

 

Оффлайн sysadmin

  • Administrator
  • сисадми́н
  • *****
  • Сообщений: 8746
  • Karma: +121/-0
  • Пол: Мужской
    • Share Post
    • сайт для сис. админов и не только...
Здесь скорее проблемы не с самой картой, а либо с питанием, либо с ее охлаждением.
дорогу осилит идущий...
......................
MCP, MCTS, RHCSA
......................
also aka xck...

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
Здесь скорее проблемы не с самой картой, а либо с питанием, либо с ее охлаждением.

Вряд ли проблемы с охлаждением, т.к. менял термоинтерфейсы меньше месяца назад (Термопаста Thermal Grizzly Kryonaut (теплопроводность 12.5 Вт/мК)
 и термопрокладка Gelid GP Extreme (теплопроводность 12 Вт/мК)).  Все температуры при тестах держаться на приемлемой отметке (температура процессора не поднималась выше 75 °C, а видеокарты - 84 °C). Может ли быть так, что какая-нибудь маленькая деталь, на которую не попала термопрокладка, перегревается и ноутбук из-за этого отключается?

Можно поточнее про проблемы с питанием? Это связано с каким-либо контроллером питания, находящемся на материнской плате или что-то другое (какие-нибудь конденсаторы "вздулись"; хотя когда менял термоинтерфейсы ничего подобного не видел (может просто не там смотрел :smile3:))?

Также иногда замечаю в журнале событий Windows ошибки типа Microsoft-Windows-Kernel-Processor-Power (код события 55). Отмечу, что эти ошибки появляются либо после отключения либо до него, но не перед самим внезапным выключением (а, например, спустя некоторое время после включения ноутбука). Данные ошибки как-то связаны с энергопотреблением процессора или это что-то из "другой оперы"?
« Последнее редактирование: Февраль 28, 2019, 06:11:14 pm от PeaceMaker »

Оффлайн sysroman

  • Сообщество ИТ-Специалистов
  • сисадми́н
  • *****
  • Сообщений: 1024
  • Karma: +42/-0
  • Пол: Мужской
  • Абра-Кадабра
    • Share Post
  • ЗВАНИЕ: Развивающийся айтишник
а тесты на проц производились? Так же есть смысл замерить температуру фаз питания проца!
по ролику видно что что то не то с питанием, но если бы он вырубался менее чем за секунду можно было бы сказать что блок уходит в защиту
а так похоже проблема именно в цепи питания мамки

еще поставить linux и на нем погонять систему
« Последнее редактирование: Февраль 28, 2019, 09:54:10 pm от sysroman »
I5 4670k/Asus z87 pro/rx580/16 gb ram/1+1TB+240ssd/600W
T430/3320m/8 gb ram/1 TB+128ssd - Sold

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
а тесты на проц производились? Так же есть смысл замерить температуру фаз питания проца!
по ролику видно что что то не то с питанием, но если бы он вырубался менее чем за секунду можно было бы сказать что блок уходит в защиту
а так похоже проблема именно в цепи питания мамки

еще поставить linux и на нем погонять систему

Пока что использовал встроенные в AIDA64 тесты в разделе "Тест". Прогонял эти тесты по порядку. После  завершения теста "FP32 Ray-Trace" и запуска теста под названием "FP64 Ray-Trace" ноутбук отключился аналогичным образом. Потом, когда я второй раз запустил данный тест, то при помощи программы "SpeedFan" заметил, что показатель температуры процессора "Temp1" достиг отметки 99 градусов, хотя другие показатели температуры процессора (показатели, отмеченные с "Core0" по "Core3") оставались в пределах 80 °C (в этом случае, вероятнее всего, ноутбук выключился из-за достижения процессором 100 °C). При тестах я не использовал режим "Cooler Boost" (включение кулера на максимальную мощность). После такого выключения ноутбук поработал около 15 минут и сам отключился (прилагаю скриншот во вложении 2; выделенное событие - примерное время отключения ноутбука (около 20:52)). На данный момент (второе включение после прогона вышеуказанного теста) система работает стабильно и не отключается (если опять не нагрузить систему ресурсоёмким приложением).

В ближайшие дни также планирую провести тест при помощи программы LinX.

P.S. Какие дополнительные на ваш взгляд программы для теста процессора нужно ещё использовать?
« Последнее редактирование: Февраль 28, 2019, 11:21:26 pm от PeaceMaker »

Оффлайн sysroman

  • Сообщество ИТ-Специалистов
  • сисадми́н
  • *****
  • Сообщений: 1024
  • Karma: +42/-0
  • Пол: Мужской
  • Абра-Кадабра
    • Share Post
  • ЗВАНИЕ: Развивающийся айтишник
а тесты на проц производились? Так же есть смысл замерить температуру фаз питания проца!
по ролику видно что что то не то с питанием, но если бы он вырубался менее чем за секунду можно было бы сказать что блок уходит в защиту
а так похоже проблема именно в цепи питания мамки

еще поставить linux и на нем погонять систему

Пока что использовал встроенные в AIDA64 тесты в разделе "Тест". Прогонял эти тесты по порядку. После  завершения теста "FP32 Ray-Trace" и запуска теста под названием "FP64 Ray-Trace" ноутбук отключился аналогичным образом. Потом, когда я второй раз запустил данный тест, то при помощи программы "SpeedFan" заметил, что показатель температуры процессора "Temp1" достиг отметки 99 градусов, хотя другие показатели температуры процессора (показатели, отмеченные с "Core0" по "Core3") оставались в пределах 80 °C (в этом случае, вероятнее всего, ноутбук выключился из-за достижения процессором 100 °C). При тестах я не использовал режим "Cooler Boost" (включение кулера на максимальную мощность). После такого выключения ноутбук поработал около 15 минут и сам отключился (прилагаю скриншот во вложении 2; выделенное событие - примерное время отключения ноутбука (около 20:52)). На данный момент (второе включение после прогона вышеуказанного теста) система работает стабильно и не отключается (если опять не нагрузить систему ресурсоёмким приложением).

В ближайшие дни также планирую провести тест при помощи программы LinX.

P.S. Какие дополнительные на ваш взгляд программы для теста процессора нужно ещё использовать?
https://www.tomshardware.com/reviews/stress-test-cpu-pc-guide,5461.html
рекомендуемое ПО есть в конце приведенной статьи, также стоит произвести тестирование с "Cooler Boost" на cpu и gpu
физически замерить температуру есть чем? 

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
Цитировать
https://www.tomshardware.com/reviews/stress-test-cpu-pc-guide,5461.html
рекомендуемое ПО есть в конце приведенной статьи, также стоит произвести тестирование с "Cooler Boost" на cpu и gpu
физически замерить температуру есть чем?

Физически замерить температуру, к сожалению, нечем.

Нагрузил процессор LinX'ом (версия 0.7.1 (Intel MKL 2017 Update 2); настройки программы можно увидеть на прикреплённом скриншоте) с включенным режимом "Cooler Boost", т.к. без него процессор нагреется до 100 °C и ноутбук отключится.  За период тестирования (8 мин. 23 сек.) ноутбук не отключился. Максимальная температура процессора была 92 °C, а минимальная- 63 °C (колебания температуры можно увидеть на скриншоте). Максимальная нагрузка на центральный процессор (ЦП) составляла 100 %, а минимальная - 93 %.

Под спойлером находится лог LinX'а. Программой никаких ошибок выявлено не было.
Спойлер
Intel(R) LINPACK 64-bit data - LinX v0.7.1

Current date/time: Fri Mar 01 11:24:37 2019

CPU frequency:    3.272 GHz
Number of CPUs: 1
Number of cores: 4
Number of threads: 8

Parameters are set to:

Number of tests: 1

Number of equations to solve (problem size) : 23118
Leading dimension of array                  : 23128
Number of trials to run                     : 5   
Data alignment value (in Kbytes)            : 4   
Maximum memory requested that can be used=4277851488, at the size=23118

=================== Timing linear equation system solver ===================

Size   LDA    Align. Time(s)    GFlops   Residual     Residual(norm) Check
23118  23128  4      62.570     131.6584 4.840293e-10 3.216481e-02   pass
23118  23128  4      64.537     127.6451 4.840293e-10 3.216481e-02   pass
23118  23128  4      64.794     127.1387 4.840293e-10 3.216481e-02   pass
23118  23128  4      64.881     126.9689 4.840293e-10 3.216481e-02   pass
23118  23128  4      73.494     112.0892 4.840293e-10 3.216481e-02   pass

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
23118  23128  4       125.1001 131.6584

Residual checks PASSED

End of tests

[свернуть]

Также представляю скриншот журнала событий Windows (вложение 2). Тестирование LinX'ом  началось примерно в 11:24 (выделенное событие является последним в журнале).

Добавлю дополнительную информацию, может как-то поможет выявить причину неисправности. Где-то в середине 2017 у меня стал глючить Wi-Fi на ноутбуке - то не мог подключиться к своей сети (через несколько попыток присоединения к точке доступа она пропадала; хотя чужие точки доступа Wi-Fi находил), то отсоединялся от точки доступа Wi-Fi через какое-то время (хотя это было всего один раз). В дальнейшем, когда в один прекрасный момент я попробовал включить ноутбук после "спящего" режима ноутбук завис на логотипе MSI и спустя какое-то время выключился. Потом ноутбук перестал загружать систему (Windows 10) вообще: когда ноутбук включался, то зависал на логотипе MSI на секунд 30 и выключался. Чтобы узнать, что случилось, я в BIOS'е ноутбука поставил "Legacy" режим. Результат после попытки включения Вы можете наблюдать на фото (вложение 3). Данную проблемы решил случайным образом: в параметрах запуска BIOS'а поставил с режима запуска "UEFI" на "UEFI with CSM". В дальнейшем, когда ситуация повторялась,я просто переключал режим (Boot mode) обратно (с "UEFI with CSM" на "UEFI") и так после каждого такого сбоя (их было как минимум около 15-ти; но с декабря 2018 года я их специально стал записывать и пока насчитал 6 штук). Последняя ошибка датируется 11.01.2019, как раз в десятых числах января 2019 года у меня возникла подобная проблема. Пробовал аналогичные действия проделать, но это результатов не дало.

P.S.  На данный момент у меня стоит режим запуска "UEFI with CSM".
« Последнее редактирование: Март 01, 2019, 02:28:02 pm от PeaceMaker »

Оффлайн Pantryk

  • Сообщество ИТ-Специалистов
  • Опытный пользователь
  • ***
  • Сообщений: 146
  • Karma: +25/-0
    • Share Post
По поводу неудачных загрузок - проверь напряжение батарейки CMOS
Нет ничего более вечного, чем то, что обмотано синей изолентой

Оффлайн sysroman

  • Сообщество ИТ-Специалистов
  • сисадми́н
  • *****
  • Сообщений: 1024
  • Karma: +42/-0
  • Пол: Мужской
  • Абра-Кадабра
    • Share Post
  • ЗВАНИЕ: Развивающийся айтишник
По поводу неудачных загрузок - проверь напряжение батарейки CMOS
а так же какая версия bios ? Как выставлены параметры биоса по энергосбережению?

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
По поводу неудачных загрузок - проверь напряжение батарейки CMOS
а так же какая версия bios ? Как выставлены параметры биоса по энергосбережению?

Что касается версии BIOS'а, то она следующая: E16F4IMS.71A (сборка от 20.01.2015; была взята с официального сайта MSI (https://www.msi.com/Laptop/support/GT60-2OC.html#down-bios) . После обновления BIOS'а ноутбук определяется как "MSI GT60 2QE" (было "MSI GT60 2OC"). Отмечу, что когда менял видеокарту в декабре 2016 года, то обновлял только BIOS для того, чтобы ноутбук корректно определил видеокарту (без обновления на указанную версию ноутбук попросту не распознавал видеокарту Nvidia GeForce GTX 980m 8Гб: она определялась как "стандартный (базовый) видеоадаптер Майкрософт"). EC Firmware не обновлял (версия 16F4EMS1 Ver. 5.05; сборка от 23.07.2013), т.к. всё остальное функционировало нормально.

Что-то я не нахожу в BIOS'е параметров по энергосбережению (она же "Power Management Option" называется, верно?), т.е. их там вообще нет. Если Вы про схему управления питанием, то она стоит на схеме "высокой производительности".

P.S. По поводу батарейки CMOS- если будет возможность, то посмотрю на выходных.
P.P.S. Пока набирал это сообщение ноутбук отключился (на фоне происходило обновление игр, а также была запущена программа AIDA64 и, конечно же, открыт браузер со множеством вкладок). В журнале событий новых, ранее не упоминавшихся ошибок нет.

Оффлайн sysroman

  • Сообщество ИТ-Специалистов
  • сисадми́н
  • *****
  • Сообщений: 1024
  • Karma: +42/-0
  • Пол: Мужской
  • Абра-Кадабра
    • Share Post
  • ЗВАНИЕ: Развивающийся айтишник
По поводу неудачных загрузок - проверь напряжение батарейки CMOS
а так же какая версия bios ? Как выставлены параметры биоса по энергосбережению?

Что касается версии BIOS'а, то она следующая: E16F4IMS.71A (сборка от 20.01.2015; была взята с официального сайта MSI (https://www.msi.com/Laptop/support/GT60-2OC.html#down-bios) . После обновления BIOS'а ноутбук определяется как "MSI GT60 2QE" (было "MSI GT60 2OC"). Отмечу, что когда менял видеокарту в декабре 2016 года, то обновлял только BIOS для того, чтобы ноутбук корректно определил видеокарту (без обновления на указанную версию ноутбук попросту не распознавал видеокарту Nvidia GeForce GTX 980m 8Гб: она определялась как "стандартный (базовый) видеоадаптер Майкрософт"). EC Firmware не обновлял (версия 16F4EMS1 Ver. 5.05; сборка от 23.07.2013), т.к. всё остальное функционировало нормально.

Что-то я не нахожу в BIOS'е параметров по энергосбережению (она же "Power Management Option" называется, верно?), т.е. их там вообще нет. Если Вы про схему управления питанием, то она стоит на схеме "высокой производительности".

P.S. По поводу батарейки CMOS- если будет возможность, то посмотрю на выходных.
P.P.S. Пока набирал это сообщение ноутбук отключился (на фоне происходило обновление игр, а также была запущена программа AIDA64 и, конечно же, открыт браузер со множеством вкладок). В журнале событий новых, ранее не упоминавшихся ошибок нет.
Firmware стоило бы тоже обновить! Хорошо было бы замерить напряжения входящие по блоку питания в момент отключения. технологий энергосбережения много основные это intel speedstep cstate s1-s5 в мануале нет настроек биоса так бы подсказал. Их все стоит выключить, часто бывает что они влияют на стабильную работу!

Оффлайн PeaceMaker

  • Юзер
  • *
  • Сообщений: 6
  • Karma: +0/-0
    • Share Post
Цитировать
Firmware стоило бы тоже обновить! Хорошо было бы замерить напряжения входящие по блоку питания в момент отключения. технологий энергосбережения много основные это intel speedstep cstate s1-s5 в мануале нет настроек биоса так бы подсказал. Их все стоит выключить, часто бывает что они влияют на стабильную работу!

Всё-таки нашёл в BIOS'е во вкладке расширенные настройки (Advanced) опцию "Intel(R) SpeedStep (TM)". На данный момент она находится во включенном режиме. Нужно ли мне отключить эту опцию и произвести тест на FurMark'е?

По поводу EC Firmware. Действительно ли стоит обновлять его (до версии 16F4EMS1.517)? В случае, если после обновления положение усугубиться я не смогу сделать откат к прежней версии, т.к. в Интернете текущую версию EC Firmware (5.05) я найти не могу (находил похожие темы по данному обновлению, где у людей были проблемы после установки 16F4EMS1.517 версии).

P.S. Дополнительно выкладываю скриншот после очередного теста в FurMark'е (выключение показано критической ошибкой "Kernel_Power" со временем 10:35:37). Специально выделил ошибку, которая практически всегда появляется в журнале событий. Также представляю вашему вниманию видео с двойной перезагрузкой после очередного сбоя (такое происходит редко):
Спойлер
[свернуть]
« Последнее редактирование: Март 02, 2019, 01:55:04 pm от PeaceMaker »


xx
Эксплуатация батареи ноутбука

Автор lol

5 Ответов
2138 Просмотров
Последний ответ Февраль 03, 2016, 02:48:46 pm
от sysadmin
xx
Пропадает WiFi у ноутбука

Автор MFlyagin

4 Ответов
2034 Просмотров
Последний ответ Июнь 18, 2014, 02:15:53 pm
от CyberPunk 2050
xx
Продам подставку для ноутбука

Автор kenguru7

0 Ответов
646 Просмотров
Последний ответ Июль 19, 2018, 01:51:10 pm
от kenguru7
question
Видеокарта для ноутбука - отдельно купить?

Автор ildar31

2 Ответов
610 Просмотров
Последний ответ Ноябрь 18, 2017, 12:06:51 pm
от ildar31