Windows 中的存放裝置類別記憶體(NVDIMM-N) 健全狀況管理

文章推薦指數: 80 %
投票人數:10人

NVDIMM-N 裝置是以DRAM 為基礎。

當參考損毀的DRAM 位址時,大部分的CPU 會起始電腦檢查,然後重新啟動伺服器。

部分伺服器平台會 ... 跳到主要內容 已不再支援此瀏覽器。

請升級至MicrosoftEdge,以利用最新功能、安全性更新和技術支援。

下載MicrosoftEdge 其他資訊 目錄 結束焦點模式 閱讀英文 儲存 目錄 閱讀英文 儲存 Twitter LinkedIn Facebook 電子郵件 目錄 Windows中的存放裝置類別記憶體(NVDIMM-N)健全狀況管理 發行項 08/08/2022 14位參與者 本文內容 適用于:Windowsserver2022、WindowsServer2019、WindowsServer2016、Windows10 本文向系統管理員和IT專業人員提供Windows中存放裝置類別記憶體(NVDIMM-N)裝置特定的錯誤處理與健全狀況管理相關資訊,強調說明存放裝置類別記憶體與傳統存放裝置之間的差異。

如果您不熟悉Windows對存放裝置類別記憶體裝置的支援,這些短片可提供概觀: 在WindowsServer2016中使用非揮發性記憶體(NVDIMM-N)做為區塊存放裝置 在WindowsServer2016中使用非揮發性記憶體(NVDIMM-N)做為位元組可定址存放裝置 使用WindowsServer2016的持續性記憶體加速SQLServer2016效能 另請參閱瞭解和部署儲存空間Direct中的持續性記憶體。

從WindowsServer2016和Windows10(版本1607)開始,Windows中使用原生驅動程式支援JEDEC相容的NVDIMM-N存放裝置類別記憶體裝置。

雖然這些裝置的行為類似於其他磁碟(HDD與SSD),還是有一些差異。

這裡所列出的所有狀況都預期是非常罕見的,但還是要根據硬體使用的狀況而定。

以下各種案例可能會參考儲存空間組態。

令人感興趣的特定組態是其中使用兩個NVDIMM-N裝置做為儲存空間中的鏡像回寫式快取。

若要設定這類組態,請參閱使用NVDIMM-N回寫式快取設定儲存空間。

在WindowsServer2016中,儲存空間GUI會將NVDIMMN匯流排類型顯示為「未知」。

這在建立集區、儲存空間VD時不會發生任何功能中斷或失效。

您可以執行下列命令來驗證匯流排類型: PSC:\>Get-PhysicalDisk|fl Cmdlet輸出中的參數BusType會正確地將匯流排類型顯示為「SCM」 檢查存放裝置類別記憶體的健全狀況 若要查詢存放裝置類別記憶體的健全狀況,請在WindowsPowerShell工作階段中使用下列命令。

PSC:\>Get-PhysicalDisk|whereBusType-eq"SCM"|selectSerialNumber,HealthStatus,OperationalStatus,OperationalDetails 這麼做會產生此範例輸出︰ SerialNumber HealthStatus OperationalStatus OperationalDetails 802c-01-1602-117cb5fc Healthy 確定 802c-01-1602-117cb64f 警告 預測性失敗 超過{閾值,NVDIMM_N錯誤} 注意 若要尋找事件中指定之NVDIMM-N裝置的實體位置,請在[事件檢視器]中事件的\[詳細資料\]索引標籤上,移至\[EventData\]\[位置\]。

請注意,WindowsServer2016會列出不正確的NVDIMM-N裝置位置,但這已在WindowsServer版本1709中修正。

如需了解各種健全狀況的說明,請參閱下列各節。

「警告」健全狀況狀態 這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]列為[警告]的情況,如下列範例輸出中所示︰ SerialNumber HealthStatus OperationalStatus OperationalDetails 802c-01-1602-117cb5fc Healthy 確定 802c-01-1602-117cb64f 警告 預測性失敗 超過{閾值,NVDIMM_N錯誤} 下表列出有關此情況的部分資訊。

朝向 說明 可能的情況 違反NVDIMM-N警告閾值 根本原因 NVDIMM-N裝置可追蹤各種臨界值,例如溫度、NVM存留期,及/或能量來源存留期。

當超過這些閾值的其中一個時,作業系統會收到通知。

一般行為 裝置維持完全正常運作。

這是警告,而不是錯誤。

儲存空間行為 裝置維持完全正常運作。

這是警告,而不是錯誤。

其他資訊 PhysicalDisk物件的OperationalStatus欄位。

EventLog–Microsoft-Windows-ScmDisk0101/Operational 解決方式 根據違反的警告閾值,為謹慎起見,可能需要考慮取代整個或部分的NVDIMM-N。

例如,如果NVM存留期達到閾值時,取代NVDIMM-N很合理。

寫入NVDIMM-N會失敗 這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]列為[狀況不良],且[操作狀態]提及[IO錯誤]的情況,如下列範例輸出中所示︰ SerialNumber HealthStatus OperationalStatus OperationalDetails 802c-01-1602-117cb5fc Healthy 確定 802c-01-1602-117cb64f Unhealthy {過時的中繼資料、IO錯誤、暫時性錯誤} {遺失資料持續性、遺失資料、NV...} 下表列出有關此情況的部分資訊。

朝向 說明 可能的情況 遺失持續性/備份電源 根本原因 NVDIMM-N裝置仰賴備份電源以維持其持續性–通常是電池或超級電容器。

如果無法使用此備份電源來源或者裝置因為任何原因無法執行備份(控制器/Flash錯誤),資料就會有風險,Windows會防止對受影響的裝置進行任何進一步寫入作業。

仍可能會進行讀取以撤除資料。

一般行為 NTFS磁碟區將會卸載。

[PhysicalDisk健全狀況狀態]欄位會針對所有受影響的NVDIMM-N裝置顯示「狀況不良」。

儲存空間行為 只要僅有一個NVDIMM-N受影響,儲存空間將會維持運作。

如果多個裝置受到影響,寫入儲存空間將會失敗。

[PhysicalDisk健全狀況狀態]欄位會針對所有受影響的NVDIMM-N裝置顯示「狀況不良」。

其他資訊 PhysicalDisk物件的OperationalStatus欄位。

EventLog–Microsoft-Windows-ScmDisk0101/Operational 解決方式 建議您備份受影響的NVDIMM-N的資料。

若要取得讀取權限,您可以手動讓磁碟重新上線(它會顯示為唯讀NTFS磁碟區)。

若要完全清除這種情況,則必須解決根本原因(也就是,根據問題來維修電源供應器或是更換NVDIMM-N),且NVDIMM-N上的磁碟區必須離線並重新上線,或者系統必須重新啟動。

若要讓NVDIMM-N可再度於儲存空間中使用,請使用Reset-PhysicalDiskCmdlet,這會重新整合裝置並啟動修復程序。

NVDIMM-N會顯示容量為'0'位元組或是「一般實體磁碟」 這是當存放裝置類別記憶體裝置顯示容量為0位元組且無法使用,或者公開為「一般實體磁碟」物件且[操作狀態]為[遺失通訊]的情況,如下列範例輸出中所示︰ SerialNumber HealthStatus OperationalStatus OperationalDetails 802c-01-1602-117cb5fc Healthy 確定 警告 遺失通訊 下表列出有關此情況的部分資訊。

朝向 說明 可能的情況 BIOS未向作業系統公開NVDIMM-N 根本原因 NVDIMM-N裝置是以DRAM為基礎。

當參考損毀的DRAM位址時,大部分的CPU會起始電腦檢查,然後重新啟動伺服器。

部分伺服器平台會取消對應NVDIMM,以防止作業系統存取它並防止可能因此導致執行另一次電腦檢查。

如果BIOS偵測到NVDIMM-N已經失敗且需要更換時,這也可能發生。

一般行為 NVDIMM-N會顯示為未初始化,容量為0位元組且無法讀取或寫入。

儲存空間行為 儲存空間會維持運作(前提是只有1個 NVDIMM-N受到影響)。

NVDIMM-NPhysicalDisk物件會顯示[健全狀況狀態]為[警告],且為「一般實體磁碟」 其他資訊 PhysicalDisk物件的OperationalStatus欄位。

EventLog–Microsoft-Windows-ScmDisk0101/Operational 解決方式 NVDIMM-N裝置必須更換或受到妥善處理,這樣伺服器平台才能將它重新公開給主機作業系統。

建議更換裝置,因為可能發生其他無法修正的錯誤。

將更換裝置新增到儲存空間組態的作業,可以使用Add-PhysicaldiskCmdlet來完成。

在重新開機後,NVDIMM-N會顯示為RAW或空的磁碟 這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]為[狀況不良],且[操作狀態]為[無法識別的中繼資料]的情況,如下列範例輸出中所示︰ SerialNumber HealthStatus OperationalStatus OperationalDetails 802c-01-1602-117cb5fc Healthy 確定 {不明} 802c-01-1602-117cb64f Unhealthy {無法識別的中繼資料、過時的中繼資料} {不明} 下表列出有關此情況的部分資訊。

朝向 說明 可能的情況 備份/還原失敗 根本原因 備份或還原程序失敗可能會造成NVDIMM-N上所有的資料遺失。

作業系統載入時,會顯示為沒有磁碟分割或檔案系統的全新NVDIMM-N,並呈現為RAW,代表它沒有檔案系統。

一般行為 NVDIMM-N會處於唯讀模式。

需要明確的使用者動作,才能再次使用它。

儲存空間行為 如果只有一個NVDIMM受到影響,儲存空間會維持運作)。

NVDIMM-N實體磁碟物件會顯示[健全狀況狀態]為[狀況不良]且儲存空間不會使用。

其他資訊 PhysicalDisk物件的OperationalStatus欄位。

EventLog–Microsoft-Windows-ScmDisk0101/Operational 解決方式 如果使用者不想要更換受影響的裝置,他們可以使用Reset-PhysicalDiskCmdlet來清除受影響NVDIMM-N的唯讀狀況。

在儲存空間環境中,這也會嘗試將NVDIMM-N重新整合至儲存空間,並啟動修復程序。

交錯式集合 交錯式集合通常可以在平台的BIOS中建立,使多個NVDIMM-N裝置向主機作業系統顯示為單一裝置。

WindowsServer2016和Windows10AnniversaryEdition不支援NVDIMM-N的交錯式集合。

在撰寫本文時,還沒有任何機制可讓主機作業系統正確地識別類似集合中的個別NVDIMM-N,並清楚地告知使用者哪一個特定裝置造成錯誤或需要維修。

本文內容



請為這篇文章評分?