Windows 中的存放裝置類別記憶體(NVDIMM-N) 健全狀況管理
文章推薦指數: 80 %
NVDIMM-N 裝置是以DRAM 為基礎。
當參考損毀的DRAM 位址時,大部分的CPU 會起始電腦檢查,然後重新啟動伺服器。
部分伺服器平台會 ...
跳到主要內容
已不再支援此瀏覽器。
請升級至MicrosoftEdge,以利用最新功能、安全性更新和技術支援。
下載MicrosoftEdge
其他資訊
目錄
結束焦點模式
閱讀英文
儲存
目錄
閱讀英文
儲存
Twitter
LinkedIn
Facebook
電子郵件
目錄
Windows中的存放裝置類別記憶體(NVDIMM-N)健全狀況管理
發行項
08/08/2022
14位參與者
本文內容
適用于:Windowsserver2022、WindowsServer2019、WindowsServer2016、Windows10
本文向系統管理員和IT專業人員提供Windows中存放裝置類別記憶體(NVDIMM-N)裝置特定的錯誤處理與健全狀況管理相關資訊,強調說明存放裝置類別記憶體與傳統存放裝置之間的差異。
如果您不熟悉Windows對存放裝置類別記憶體裝置的支援,這些短片可提供概觀:
在WindowsServer2016中使用非揮發性記憶體(NVDIMM-N)做為區塊存放裝置
在WindowsServer2016中使用非揮發性記憶體(NVDIMM-N)做為位元組可定址存放裝置
使用WindowsServer2016的持續性記憶體加速SQLServer2016效能
另請參閱瞭解和部署儲存空間Direct中的持續性記憶體。
從WindowsServer2016和Windows10(版本1607)開始,Windows中使用原生驅動程式支援JEDEC相容的NVDIMM-N存放裝置類別記憶體裝置。
雖然這些裝置的行為類似於其他磁碟(HDD與SSD),還是有一些差異。
這裡所列出的所有狀況都預期是非常罕見的,但還是要根據硬體使用的狀況而定。
以下各種案例可能會參考儲存空間組態。
令人感興趣的特定組態是其中使用兩個NVDIMM-N裝置做為儲存空間中的鏡像回寫式快取。
若要設定這類組態,請參閱使用NVDIMM-N回寫式快取設定儲存空間。
在WindowsServer2016中,儲存空間GUI會將NVDIMMN匯流排類型顯示為「未知」。
這在建立集區、儲存空間VD時不會發生任何功能中斷或失效。
您可以執行下列命令來驗證匯流排類型:
PSC:\>Get-PhysicalDisk|fl
Cmdlet輸出中的參數BusType會正確地將匯流排類型顯示為「SCM」
檢查存放裝置類別記憶體的健全狀況
若要查詢存放裝置類別記憶體的健全狀況,請在WindowsPowerShell工作階段中使用下列命令。
PSC:\>Get-PhysicalDisk|whereBusType-eq"SCM"|selectSerialNumber,HealthStatus,OperationalStatus,OperationalDetails
這麼做會產生此範例輸出︰
SerialNumber
HealthStatus
OperationalStatus
OperationalDetails
802c-01-1602-117cb5fc
Healthy
確定
802c-01-1602-117cb64f
警告
預測性失敗
超過{閾值,NVDIMM_N錯誤}
注意
若要尋找事件中指定之NVDIMM-N裝置的實體位置,請在[事件檢視器]中事件的\[詳細資料\]索引標籤上,移至\[EventData\]\[位置\]。
請注意,WindowsServer2016會列出不正確的NVDIMM-N裝置位置,但這已在WindowsServer版本1709中修正。
如需了解各種健全狀況的說明,請參閱下列各節。
「警告」健全狀況狀態
這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]列為[警告]的情況,如下列範例輸出中所示︰
SerialNumber
HealthStatus
OperationalStatus
OperationalDetails
802c-01-1602-117cb5fc
Healthy
確定
802c-01-1602-117cb64f
警告
預測性失敗
超過{閾值,NVDIMM_N錯誤}
下表列出有關此情況的部分資訊。
朝向
說明
可能的情況
違反NVDIMM-N警告閾值
根本原因
NVDIMM-N裝置可追蹤各種臨界值,例如溫度、NVM存留期,及/或能量來源存留期。
當超過這些閾值的其中一個時,作業系統會收到通知。
一般行為
裝置維持完全正常運作。
這是警告,而不是錯誤。
儲存空間行為
裝置維持完全正常運作。
這是警告,而不是錯誤。
其他資訊
PhysicalDisk物件的OperationalStatus欄位。
EventLog–Microsoft-Windows-ScmDisk0101/Operational
解決方式
根據違反的警告閾值,為謹慎起見,可能需要考慮取代整個或部分的NVDIMM-N。
例如,如果NVM存留期達到閾值時,取代NVDIMM-N很合理。
寫入NVDIMM-N會失敗
這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]列為[狀況不良],且[操作狀態]提及[IO錯誤]的情況,如下列範例輸出中所示︰
SerialNumber
HealthStatus
OperationalStatus
OperationalDetails
802c-01-1602-117cb5fc
Healthy
確定
802c-01-1602-117cb64f
Unhealthy
{過時的中繼資料、IO錯誤、暫時性錯誤}
{遺失資料持續性、遺失資料、NV...}
下表列出有關此情況的部分資訊。
朝向
說明
可能的情況
遺失持續性/備份電源
根本原因
NVDIMM-N裝置仰賴備份電源以維持其持續性–通常是電池或超級電容器。
如果無法使用此備份電源來源或者裝置因為任何原因無法執行備份(控制器/Flash錯誤),資料就會有風險,Windows會防止對受影響的裝置進行任何進一步寫入作業。
仍可能會進行讀取以撤除資料。
一般行為
NTFS磁碟區將會卸載。
[PhysicalDisk健全狀況狀態]欄位會針對所有受影響的NVDIMM-N裝置顯示「狀況不良」。
儲存空間行為
只要僅有一個NVDIMM-N受影響,儲存空間將會維持運作。
如果多個裝置受到影響,寫入儲存空間將會失敗。
[PhysicalDisk健全狀況狀態]欄位會針對所有受影響的NVDIMM-N裝置顯示「狀況不良」。
其他資訊
PhysicalDisk物件的OperationalStatus欄位。
EventLog–Microsoft-Windows-ScmDisk0101/Operational
解決方式
建議您備份受影響的NVDIMM-N的資料。
若要取得讀取權限,您可以手動讓磁碟重新上線(它會顯示為唯讀NTFS磁碟區)。
若要完全清除這種情況,則必須解決根本原因(也就是,根據問題來維修電源供應器或是更換NVDIMM-N),且NVDIMM-N上的磁碟區必須離線並重新上線,或者系統必須重新啟動。
若要讓NVDIMM-N可再度於儲存空間中使用,請使用Reset-PhysicalDiskCmdlet,這會重新整合裝置並啟動修復程序。
NVDIMM-N會顯示容量為'0'位元組或是「一般實體磁碟」
這是當存放裝置類別記憶體裝置顯示容量為0位元組且無法使用,或者公開為「一般實體磁碟」物件且[操作狀態]為[遺失通訊]的情況,如下列範例輸出中所示︰
SerialNumber
HealthStatus
OperationalStatus
OperationalDetails
802c-01-1602-117cb5fc
Healthy
確定
警告
遺失通訊
下表列出有關此情況的部分資訊。
朝向
說明
可能的情況
BIOS未向作業系統公開NVDIMM-N
根本原因
NVDIMM-N裝置是以DRAM為基礎。
當參考損毀的DRAM位址時,大部分的CPU會起始電腦檢查,然後重新啟動伺服器。
部分伺服器平台會取消對應NVDIMM,以防止作業系統存取它並防止可能因此導致執行另一次電腦檢查。
如果BIOS偵測到NVDIMM-N已經失敗且需要更換時,這也可能發生。
一般行為
NVDIMM-N會顯示為未初始化,容量為0位元組且無法讀取或寫入。
儲存空間行為
儲存空間會維持運作(前提是只有1個 NVDIMM-N受到影響)。
NVDIMM-NPhysicalDisk物件會顯示[健全狀況狀態]為[警告],且為「一般實體磁碟」
其他資訊
PhysicalDisk物件的OperationalStatus欄位。
EventLog–Microsoft-Windows-ScmDisk0101/Operational
解決方式
NVDIMM-N裝置必須更換或受到妥善處理,這樣伺服器平台才能將它重新公開給主機作業系統。
建議更換裝置,因為可能發生其他無法修正的錯誤。
將更換裝置新增到儲存空間組態的作業,可以使用Add-PhysicaldiskCmdlet來完成。
在重新開機後,NVDIMM-N會顯示為RAW或空的磁碟
這是當您檢查存放裝置類別記憶體裝置的健全狀況,並看到其[健全狀況狀態]為[狀況不良],且[操作狀態]為[無法識別的中繼資料]的情況,如下列範例輸出中所示︰
SerialNumber
HealthStatus
OperationalStatus
OperationalDetails
802c-01-1602-117cb5fc
Healthy
確定
{不明}
802c-01-1602-117cb64f
Unhealthy
{無法識別的中繼資料、過時的中繼資料}
{不明}
下表列出有關此情況的部分資訊。
朝向
說明
可能的情況
備份/還原失敗
根本原因
備份或還原程序失敗可能會造成NVDIMM-N上所有的資料遺失。
作業系統載入時,會顯示為沒有磁碟分割或檔案系統的全新NVDIMM-N,並呈現為RAW,代表它沒有檔案系統。
一般行為
NVDIMM-N會處於唯讀模式。
需要明確的使用者動作,才能再次使用它。
儲存空間行為
如果只有一個NVDIMM受到影響,儲存空間會維持運作)。
NVDIMM-N實體磁碟物件會顯示[健全狀況狀態]為[狀況不良]且儲存空間不會使用。
其他資訊
PhysicalDisk物件的OperationalStatus欄位。
EventLog–Microsoft-Windows-ScmDisk0101/Operational
解決方式
如果使用者不想要更換受影響的裝置,他們可以使用Reset-PhysicalDiskCmdlet來清除受影響NVDIMM-N的唯讀狀況。
在儲存空間環境中,這也會嘗試將NVDIMM-N重新整合至儲存空間,並啟動修復程序。
交錯式集合
交錯式集合通常可以在平台的BIOS中建立,使多個NVDIMM-N裝置向主機作業系統顯示為單一裝置。
WindowsServer2016和Windows10AnniversaryEdition不支援NVDIMM-N的交錯式集合。
在撰寫本文時,還沒有任何機制可讓主機作業系統正確地識別類似集合中的個別NVDIMM-N,並清楚地告知使用者哪一個特定裝置造成錯誤或需要維修。
本文內容
延伸文章資訊
- 1NVDIMM_百度百科
非易失性雙列直插式內存模塊(英語:non-volatile dual in-line memory module,縮寫NVDIMM)是一種用於計算機的隨機存取存儲器。非易失性存儲器是即使斷電也能...
- 2NVDIMM | Micron Technology, Inc
NVDIMM. Designed for applications that are sensitive to down time and require high performance to...
- 3NVDIMM - 維基百科,自由的百科全書
非揮發性雙列直插式記憶體模組(英語:non-volatile dual in-line memory module,縮寫NVDIMM)是一種用於電腦的隨機存取記憶體。非揮發性記憶體是即使斷電也能...
- 4HPE 16 GB NVDIMM 單排x4 DDR4-2666 模組套件
HPE NVDIMM 是HPE Persistent Memory 產品類別中的最新、非揮發性記憶體產品。它們可提供適當大小的容量來消除較小儲存空間產生的瓶頸,從而顯著縮短延遲並提高處理 ...
- 5兼顧DRAM耐用及Flash持續儲存,HPE發布NVDIMM記憶體
針對伺服器環境的應用,HPE推出8GB容量的NVDIMM持續儲存記憶體,當中結合了DRAM與NAND Flash的優點,並整合伺服器端的電力備援功能。