WHEA UNCORRECTABLE ERROR蓝屏错误

WHEA UNCORRECTABLE ERROR 解释

WHEA(Windows硬件错误体系结构)(英文:Windows Hardware Error Architecture)
UNCORRECTABLE(不能修复的)
完整解释:无法自动修复的硬件故障

错误原因分析

  • 首先,想一下最近硬件有什么改动,驱动改动,或者软件改动;
  • 是否运行特定软件才导致其错误;
  • 重新拔插一下 内存条、硬盘,可能主板问题(如果以前没问题,这个也基本可以排除);
  • 进入安全模式,看是否蓝屏;

可能错误原理分析

  • WHEA UNCORRECTABLE ERROR(0x124),转储进度100%,考虑CPU故障,关闭c-state能够有所缓解
  • WHEA UNCORRECTABLE ERROR(0x124),转储进度永远0%,且是NVME硬盘,考虑硬盘掉盘。因为SSD闪存转换层停止工作,掉盘相当于拔掉硬盘,所以永远不会有转储进度
  • 最常见是CPU故障,如果用windbg加载DMP蓝屏文件,指向的是INTELPPM.SYS或GenuineIntel
    那么尝试以下两个方法:①进主板BIOS关闭Intel C-State功能,以及其它所有的CPU节能选项,可能会有所缓解②将CPU核心电压增加0.1V,这有助于增加稳定性,可能会有所缓解CPU超频(请恢复默认设置)、主板CPU供电故障(更换主板)也会导致相同的蓝屏。笔者曾经遇到两台硬件配置相同的服务器出现WHEA_UNCORRECTABLEERROR,WINDBG分析指向CPU_CACHE(CPU缓存),最后从经销商口中得知内存颗粒出了批次问题,更换内存条解决。另外NVME掉盘也会产生这个代码,通常转储进度是0%(CPU和内存故障通常是可以成功转储的)。再讲一点,并不一定所有的WHEA_UNCORRECTABLE_ERROR都是硬件引发的,比如腾讯游戏的TP反外挂就曾经导致WHEA_UNCORRECTABLE_ERROR蓝屏和clock watchdog timeout 蓝屏,腾讯的驱动开发人员能把Windows时钟看门狗搞挂,也是让人醉了维修硬件后一定要做aida64稳定性测试,外加3Dmark
  • 只有蓝屏转存进度100%才能分析DMP蓝屏文件,有时你电脑收集数据会卡到0-99%不动;
  • 创建蓝屏转储文件方法:控制面板>>系统>>高级系统设置>>高级>>启动和故障恢复>>设置,写入调试信息>>选择“小内存转储(256KB)”,路径选择默认,确定并重启您的计算机。再次异常关机后,前往C:\Windows\Minidump提取即可;
  • 无法得到dump文件,最近也没有什么打补丁,系统升级等原因,那就一个个排除硬件问题:1、驱动;2、超频;3、硬盘;4、内存;5、系统;
  • 还没有解决就送修检查;

网上看到的解决方式

  • 我解决了,拔掉一根内存后正常了,换另外一个也正常。再把两根插上就好了[好奇]
  • 在低负载的时候经常出现蓝屏,比如看网页,电脑待机的时候。玩游戏,高负载的时候反而没有任何问题,最后一朋友说可能是CPU的C-state节能功能造成的,我想很有可能,毕竟每次都是低负载的时候出问题。于是BIOS里面关闭“C状态”。目前待机测试了一天,没有在出现蓝屏的问题。
  • 无论是高负载,还是待机,随机遇到题目中的蓝屏现象。在网上查找过无解,反复排查各硬件、调整超频设置(如电压、cpu选项)、恢复默认设置,一概无效,依然不定时蓝屏。后来,看cpu选项时发现一个选项,名为“intel speed shift technology”。经查说明书及网络,大概意思是“让操作系统可以控制cpu的节能模式”。之前一直没有关闭,关闭后问题解决,没有再出现不定时蓝屏。
  • 把固态硬盘拆了,擦擦金手指,重新插进去,用螺丝固定,拧紧。然后笔记本就太平了,用了好几天都没再出现蓝屏状况。
  • 把原装三星的nvme盘重新插了一下,解决了蓝屏问题。但是今天,就在刚刚,他又突然卡死了,这会把电源选项调到高性能,这会没有卡死。

其他测试方法

此处评论已关闭