合傑M.2 SSD固態硬碟雙重容錯如何保障數據穩定?

一次微不足道的數據錯誤,可能導致數十萬的虧損風險。在嚴苛的工業環境中,數據的精准不是優選項,而是生死線。合傑 (HEROSYS) 憑藉自研主控晶片和深厚的固件技術積累,結合自研演算法,將產品的UBER(不可糾正錯誤比特率)降至超低的 10^(-17),為核心數據鑄就堅不可摧的屏障。

壞塊

要理解SSD為什麼需要ECC (Error-Correcting Code;糾錯碼),就需要先理解什麼是壞塊。壞塊指含有一個或多個無效位的記憶體塊,可能出廠即存在或在使用中產生,導致數據不可訪問、容量降低、性能下降,直至設備故障。

NAND閃存性能下降和位錯誤

為了管理壞塊,固態硬碟會通過編程實現 ECC 和 NAND 塊映射。當檢測到壞塊時,壞 塊中的數據將傳輸至空閒塊,並執行特定的糾錯碼來檢測和糾正位錯誤,以減少無效數據。隨著單元尺寸縮小和每單元比特數增加,以下因素會加劇性能下降和誤碼率上升:

(P/E)週期:寫入和擦除的恒定週期要求對NAND單元施加高壓,從而在隧穿氧化層上造成應力並削弱隧穿氧化層。這會導致電子從浮柵洩漏,NAND閃存單元性能下降。

每單元更多位: 新的閃存技術為提高密度,每單元存儲更多位會縮小電壓閾值分佈的間隙,引起電壓偏移,並因單元間更緊湊而產生干擾,導致誤碼。

NAND閃存設備中的錯誤檢測和糾正

ECC是糾正NAND錯誤的關鍵技術。與其他採用簡單糾錯演算法的產品不同。

 

LDPC(低密度奇偶校驗)

LDPC碼,也稱Gallagher碼,它們具有解碼軟位數據和硬位數據的能力。在Gallagher的論文中,低密度奇偶校驗碼被定義為“一種校驗矩陣中1的分佈非常稀疏的線性二進位分組碼”,這意味著1比0要少。其具有以下優勢:

1.低解碼複雜度

2.能夠同時利用NAND中的硬位和軟位資訊進行解碼

3.良好的短塊性能

4.為長塊提供“近容量”(接近香農極限)性能

LDPC碼是目前最先進的糾錯演算法。而合傑自主研發的演算法技術,則在原有技術基礎上進一步強化,實現了更低的數據錯誤率,增強了產品可靠性:

糾錯強度倍增:我們通過優化奇偶校驗矩陣密度和解碼演算法,糾錯能力較傳統LDPC提升數倍,尤其在處理高誤碼率場景(如極端溫度、輻照環境)時表現更穩定。

適配高密度閃存:針對長江存儲等3D NAND的高密度架構,我們優化了電壓閾值分佈偏移的容錯性,減少因單元干擾導致的數據錯誤。