Surface Laptop 3 AMD Ryzen BSOD

Original ist  besser

Nach dem letzten Update ging mein Surface Laptop 3 (der den es noch mit dem AMD Ryzen 7 und 32GB RAM gab) in einem BSOD (Bluescreen, Stop-Fehler)

SYNTHETIC_WATCHDOG_TIMEOUT (1ca)

Auf den ich mir so richtig keinen Reim machen konnte.

AMD-Ryzen-7-CPUID

Windows hatte einen Mini-Dump geschrieben und so konnte ich mich auf die Suche nach dem Problem machen. Eine Blick in den Debugger offerierte den amdppm.sys als Verursacher, die Version des Treibers war aber mit 10.0.22621.1180 aktuell.

image

Windows Update lieferte hier keine neuere Version und auch die Surface App meldete, dass alles im grünen Bereich ist.

Eine Suche im Internet lieferte (wie fast immer) eine Reihe obskurer Ideen, wie zum Beispiel die Deaktivierung des Treibers in der Registry (Startwert 3 auf 4 setzen), was zur folge hatte das ich 8 unbekannte CPUs im Geräte-Manager sah und das Laptop postum nach einem weiteren BSOD neu startete.

Für eine gute Idee, hielt ich die Aktualisierung des AMD-Chipsatzes, gab es doch zu Beginn mit Windows 11 einige Probleme, auch mit der Performance des Surface Devices.

Auch danach war keine Besserung festzustellen. Interessant war, dass wenn ich nichts tat, das Laptop lief.

Da ich mein neues Arbeitsgerät einrichten wollte, stellte ich das Surface Laptop auf einem Stuhl neben mich und versorgte es durch ein anderes Ladegerät mit Strom. Die ersten beiden Stunden haben ich nicht drauf geachtet, aber die Neustarts durch einen BSOD waren verschwunden obwohl eine Reihe von Anwendungen nebenher auf dem Teil arbeiteten, die Frage war nur wieso? Auch eine Reihe von Last-Tests konnten das Laptop nicht in die Knie zwingen. Am nächsten Morgen begrüßte mich das Surface Laptop 3 und lief, wie wenn nie etwas gewesen wäre.

Beim Aufräumen des Schreibtisches sah ich auf einmal, dass ich das Laptop ursprünglich an ein NoName-Ladegerät angeschlossen hatte. Dieses zeigte zwar ebenfalls 65W und lieferte diese kurioser Weise auch, führte aber in Verbindung mit dem Surface Laptop 3 zu den BSOD. Mit dem original Microsoft Surface 65W Ladegerät, traten die Probleme nicht auf.

So genau wusste ich nicht einmal, woher dieses NoName-Ladegerät kam, letztendlich war es aber der Grund für die Probleme.

Am originalen Microsoft Ladegerät und auch per USB-C läuft das Surface Laptop 3 ohne Probleme.

Enjoy it, b!

WinDbg, wie man in einem Dump den Computernamen findet

Vor einiger Zeit war ich damit beschäftigt einige Dumps zu analysieren um nach einem Fehler zu suchen. Dabei hätte mich brennend interessiert auf welchem Computer der Dump geschrieben wurde.

Bis zu Windows 10 war das auch nicht so schwer herauszubekommen, aber Microsoft hat hier etwas geändert. Nach einigem Suchen im Netz bin ich dann auf die folgende Lösung gestoßen, die nebenher noch die Domain/Workgroup, sowie das Betriebssystem ermittelt.

In WinDbg muss dazu der folgende Aufruf erfolgen:
r @$t0 = @@masm(mrxsmb!SmbCeContext); dx (nt!_UNICODE_STRING[4])(@$t0)

# r @$t0 = @@masm(mrxsmb!SmbCeContext); dx (nt!_UNICODE_STRING[4])(@$t0)

2: kd> r @$t0 = @@masm(mrxsmb!SmbCeContext); dx (nt!_UNICODE_STRING[4])(@$t0) (nt!_UNICODE_STRING[4])(@$t0) [Type: _UNICODE_STRING [4]] [0] : "Workgroup" [Type: _UNICODE_STRING] [1] : "NB-LP1-1" [Type: _UNICODE_STRING] [2] : "Windows 10 Enterprise 18363" [Type: _UNICODE_STRING] [3] : "Windows 10 Enterprise 6.3" [Type: _UNICODE_STRING]

[1] liefert dann den Computer auf dem der Dump erstellt wurde.

Enjoy it, b!

BlueScreen / Stopp, Windows 10 CSC reset

Nach dem Update auf Windows 10 Version 20H2, der Herbstversion 2020 hatte ich auf einer Reihe von Lenovo Notebooks und auf zwei Microsoft Surface Pro Tablets das Problem, dass sich im Verlauf der Anmeldung das Betriebssystem mit einem Bluescreen (BSOD, Stopp-Fehler) verabschiedete.

IMG-20201209-WA0000_ON1_Cloud

Für alle die hier nicht mehr weiterlesen wollen, könnte das Setzen des folgenden Parameters in der Registry von Windows 10 und ein damit verbundener Neustart das Problem beheben.

Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\CSC\Parameters]
"FormatDatabase"=dword:00000001

Neustart nicht vergessen Smile

Alle Interessierten dürfen gerne den Rest des Beitrags lesen.

Fehlerbild(er)

Eine Reihe mir zugesandter Screenshots die von den Anwendern mit dem Smartphone erstellt wurden, zeigten ein diffuses Fehlerbild.

Unterschiedlich war dabei immer die Fehlerursache, dabei tauchten verschiedene Komponenten des Betriebssystems auf:

  • mrxsmb20.sys (7x), mountmgr.sys (1x) und auch der volume.sys (1x)
  • Lenovo L460, L470 und T14L
  • Surface Pro 4 und Surface Pro 7

Gleich waren auf allen Windows 10 Systemen die folgenden Parameter

  • Der BSOD tauchte immer während der Anmeldung auf
  • Windows 10 Version 20H2
  • kürzlich auf die Version 20H2 aktualisiert
  • Nach dem Update lief der Computer im Netzwerk (Firma) stabil!
  • Der Computer ist Mitglied einer Domäne, aber die Anmeldung erfolgte ohne Verbindung zum Domain Controller im HomeOffice
  • Konfiguriertes OneDrive for Business

Workarounds

Eine schnelle Lösung brachte die Verwendung eines lokalen Benutzers auf den Endgeräten. Der Computer war zwar nach wie vor Mitglied der Domäne, aber von Benutzer wurde im HomeOffice ein lokales Konto verwendet. Dieses hatte ich entweder im Vorfeld schon angelegt, konnte es über Teamviewer “nachrüsten” oder der Anwender war dazu selbst in der Lage.

Damit war ein Zugang per RDP auf den eigentlichen PC innerhalb der Firma möglich und der Druck erst einmal weg.

Darüber hinaus brachte das Zurücksetzen von Windows auf die vorherige Version bei allen Surface Geräten Abhilfe. Der BSOD war verschwunden! Ich muss aber gestehen, dass ich das auf den Lenovo Notebooks nicht in Betracht ziehen wollte.

Zusammenfassend konnte das Problem schnell mit den beiden folgenden Ansätzen gelöst werden.

  1. Verwenden eines lokalen Benutzers (den ich inzwischen generell immer anlege, zusätzlich zu einem lokalen Admin) und auch einrichte (Outlook, OneDrive, …)
  2. Rückkehr auf die vorherige Version von Windows 10

Zufrieden war ich aber mit beiden Lösungen nicht. Zum einen führen lokale Benutzerprofile dazu, dass irgendwann Daten darin verschwinden und nicht mehr auf dem Server gespeichert werden. Eine Rückkehr auf die vorherige Version von Windows kann nur temporär eine Lösung sein, das nächste Update kommt bestimmt. Also musste dafür eine ordentliche Lösung gefunden werden und kein Workaround. Durch die Workarounds konnten alle Anwender zunächst einmal arbeiten.

Die eigentliche Lösung

Durch das Auftauchen von Komponenten die mit dem Speicher (Festplatte) und Cache von Windows zu tun hatten, dachte ich zuerst an einen Defekt des Notebooks. Da der BSOD aber nach der Verwendung des lokalen Benutzer-Kontos nicht mehr auftrat, konnte ich diesen Verdacht beiseitelegen und außerdem hatte ich inzwischen das Problem auf mehreren Geräten.

Geblieben waren aber der mrxsmb20.sys und das der STOPP-Fehler der generell bei einer Anmeldung ohne Domain Controller erfolgte.

Das zeigte mir auch ein Blick in den memory.dmp (PROCESS_NAME: winlogon.exe ist der Anmelde-Prozess von Windows)image

Dazu bekommen wir gleich zu Beginn der Analyse den Hinweis, dass etwas beim Zugriff auf das Dateisystem schief gegangen ist, nämlich als eine RDR (ReDirection) stattgefunden hat.

image

Das ist der Fall, wenn ein Computer sich Offline anmeldet. Inzwischen konnte ich nachvollziehen, dass die Anmeldung direkt im Firmennetzwerk ohne Probleme funktioniert und lediglich im HomeOffice der BSOD auftritt.

Im ersten Screenshot des Debuggers ist zu sehen, dass es sich um einen ExceptionCode c0000005 handelt und der Zugriff auf den Offline Cache fehl schlägt. Der entsprechende Ordner dafür liegt im Windows Verzeichnis mit dem Namen CSC.

# Windows Client Side Cache Ordner (Offline Files)

%WINDIR%\CSC

Die Berechtigungen auf diesen sind einfach gehalten und mit SYSTEM:F überschaubar. Allerdings lassen sie sich nur im passenden Kontext überprüfen. Ich verwende dazu Psexec.exe von Sysinternals, welches mit dem Parameter –s im Systemkontext gestartet werden kann.

# Start von Psexec.exe unter Local System

C:\Temp> "\Program Files (x86)\Windows Sysinternals Tools\psexec.exe" -s cmd.exe

# Kontrolle der Berechtigungen

C:\Windows> cacls csc /t

image
Nachdem die Berechtigungen richtig angezeigt wurden, erinnerte ich mich an frühere Migrationen von Dateiservern wo im Anschluss der CSC Cache Probleme gemacht hat und zurück gesetzt werden musste. Korrekter Weise dessen Datenbank und ein Upgrade von Windows 10 auf eine höhere Version könnte hier durchaus ebenfalls zu Problemen oder Inkompatibilitäten führen.

Ein Rücksetzen des CSC ist über den folgenden Registry-Eintrag möglich. Natürlich verbunden mit einem notwendigen Neustart des Computers.

image

Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\CSC\Parameters]
"FormatDatabase"=dword:00000001

Damit war auch eine Anmeldung im HomeOffice möglich und damit die Lösung des Problem gefunden.

Alle nun folgenden Notebooks habe ich gleich im Anschluss nach dem Upgrade ebenfalls mit diesem Eintrag versehen und die CSC Datenbank gelöscht. Das Problem ist danach nicht mehr aufgetreten.

Enjoy it, b!

WinDBG aus dem Microsoft Store

Schon vor knapp 2 Jahren hatte ich auf die Verfügbarkeit des Windows Debuggers (als Preview) im Microsoft Store hingewiesen.

image

Der Windows Debugger ist dort immer noch zu haben uns als Preview vom 28.08.2017 ausgewiesen, was aber nicht korrekt ist. Die App hat im Lauf der Zeit einige Updates erfahren und wird von Microsoft auch offiziell im Download gelistet.

An der Installation über den Microsoft Store schätze ich vor allen die Geschwindigkeit, da nicht das komplette SDK besorgt werden muss.

Die Symbole lassen sich dann übrigens wie gewohnt konfigurieren.

image

image

Der zu verwendende Symbolpfad kann entweder von hier:

http://msdl.microsoft.com/download/symbols

oder von der Microsoft Webseite verwendet werden.

Happy Debugging, b!

WinDbg Preview

Microsoft ist gerade dabei den Windows Debugger zu überarbeiten.An der GUI hat sich in den letzten 20 Jahren nichts geändert, wurde also Zeit Smile

Viel Interessanter als die neue Oberfläche finde ich, dass der Debugger über den Windows Store angeboten wird, was zumindest aktuell den Download des kompletten SDKs überflüssig macht. Darüber hinaus halten eine Reihe von coolen Features Einzug, wie z.B. das Time Travel Debugging. Mehr Infos dazu sind hier zu finden.

Enjoy it, b!