AEC-Q100文件,是芯片開展車規等級驗證的重要標準和指導文件。
B組驗證是ACCELERATED LIFETIME SIMULATION TESTS 加速生命周期模擬驗證
本文將重點對B組的第3項EDR - NVM Endurance, Data Retention, and Operational Life非易失性存儲耐久性、數據保持性、工作壽命驗證項目,進行展開討論。
這個驗證名字太長了。。。首先大家要知道什么是NVM非易失性存儲。
非易失性存儲器(英語:non-volatile memory,縮寫為NVM)是指當電流關掉后,所存儲的數據不會消失的電腦存儲器。非易失性存儲器中,依存儲器內的數據是否能在使用電腦時隨時改寫為標準,可分為二大類產品,即ROM和Flash memory。
非易失性存儲器主要有以下類型:
- ROM(Read-only memory,只讀內存)
PROM(Programmable read-only memory,可編程只讀內存)
EAROM(Electrically alterable read only memory,電可改寫只讀內存)
EPROM(Erasable programmable read only memory,可擦可編程只讀內存)
EEPROM(Electrically erasable programmable read only memory,電可擦可編程只讀內存)
- Flash memory(閃存)
此部分中間內容來自百度百科:非易失性存儲器詞條。
NVM就是斷電后,存儲內容不會丟失的存儲器,比如電腦中的硬盤、手機中的存儲卡、U盤,這些存儲器都是獨立的。還有一些存儲功能是集成在其他器件中的,比如在MCU中也有EEPROM等功能,原則上只要帶有NVM功能的芯片產品,都需要進行EDR項的驗證。
還記得B1 HTOL和A6 HTSL中附件條件中的一句話嗎?所有帶有NVM的器件,在HTOL和HTSL之前需要進行AEC-Q100-005文件規定中的預處理,Q100-005文件提到了多次但是我還沒有進行解讀,就是在等B3 EDR。
讓我們看一下表格2中的信息:
EDR
EDR - NVM Endurance, Data Retention, and Operational Life非易失性存儲耐久性、數據保持性、工作壽命驗證項目 (此時此景忍不住吟詩一首:北冥有魚其名為鯤,鯤之大,一鍋放不下;EDR名之長,題目一行也放不下)
表格中信息介紹和解讀
表格中的信息給出,ELFR的分類是B3,Notes中包含了H、P、B、D、G、K也就是說要求密封器件、塑封器件、要求BGA器件、破壞性測試、承認通用數據、使用AEC-Q100-005文件中的方法來對獨立非易失性存儲器集成電路或帶有非易失性存儲器模塊的集成電路進行預處理(記得是005的預處理,不是完成整個005流程)。
需求的樣品數量是每批次800顆樣品,要求來自3個批次;
接受標準就是0失效;
測試標準就是AEC Q100-005;
附加需求:
EDR驗證前后的電性能測試需要在常溫和高溫條件下進行。樣品數量的選擇要根據005文件中的定義。
下面讓我們看一下EDR的標準文件AEC Q100-005,這是AEC-Q100標準自身的第5個附件。
AEC - Q100-005-REV-D1介紹
目的
該驗證旨在評估獨立的非易失性存儲器(NVM)集成電路或帶有非易失性存儲器模塊(如微處理器閃存)的集成電路的存儲器陣列的能力:可以承受反復的數據更改而不發生故障(寫入/擦除耐力),在非易失性存儲器的預期壽命(數據保留)內數據的穩定性,并在施加電偏置的情況下承受恒定溫度的能力(工作壽命)。
NVM供應商要求的變更驗證流程的話,包括但不限于寫入/擦除周期測序、數據保留時間和溫度以及獨立NVM器件上的校驗測試內容,必須得到用戶的批準。
對于寫入/擦除耐力循環,當存儲的“1”更改為“0”或存儲的“0”更改為“1”時,就會發生數據更改。當寫或擦除指令在最大指定時間內未完成,或當指令完成但內存數組中的數據塊與預期的數據塊不對應時,就會發生失敗。
數據保持是NVM陣列中存儲單元在沒有施加外部偏置的情況下保持其電荷狀態的能力的一種度量。當存儲單元失去或獲得電荷以至于達到一種檢測到實際狀態和預期數據狀態不符合時,就會認為發生數據保留故障。
位bit翻轉定義為該位bit在寫入或擦除操作后未能保留其數據狀態。
在工作壽命壓力測試中,可發生三類故障。分別是非易失性存儲器可能超過其規定的參數限制;它可能不再滿足器件規格書的要求;或者它可能無法保持其預期的數據狀態。
注意:OTP(一次性程序)非易失性內存是一種特殊情況,此測試方法的某些部分可能不適用。同樣的道理也適用于作為器件運行不可或缺部分的存儲器。供應商和用戶應就針對這些特殊情況進行的測試驗證項目達成一致。
驗證設備
測試所需的設備應包括一個可控溫度室,能夠將溫度條件維持在規定的溫度或以上(例如:125°C -0/+5°C 箱內公差)。
腔內應提供插座或其他安裝方式,以便在指定的電路配置中與器件引腳進行可靠的電接觸。
在整個測試過程中,電源和偏置網絡應能夠保持規定的運行條件。
此外,測試電路的設計應使異常或故障器件的存在不會改變其他被測試器件的實驗條件。
應注意避免瞬時電壓尖峰或其他可能導致電氣、熱或機械超應力的條件可能造成的樣品損壞。
編者注:為什么在這里特意提到了實驗設備,因為這個設備很特別,他特別是因為特別在特別貴。。。實際上大功率芯片器件的HTOL設備也不便宜,HTOL和EDR可以理解為就是一類驗證,只是EDR針對存儲器數據。
驗證流程
對含有NVM的器件在進行高溫數據保留(HTDR)、高溫工作壽命(HTOL)和低溫數據保留(LTDR)測試驗證之前,應首先通過寫入/擦除耐久性測試進行預處理(參見下圖)
AEC Q100-005 圖1
通過圖1可以看出,NVM高溫測試前,要先進行3.1章節定義的寫入擦除循環驗證(005預處理),然后要分別進行高溫數據保持HTDR和HTOL驗證。
AEC Q-100-005 圖2
圖2介紹了低溫數據保持的流程要參照3.3章節進行。
為什么需要對高溫和低溫失效過程進行單獨測試,因為雖然有一些失效過程會因溫度而加速,但其他一部分失效過程(例如,應力誘導泄漏電流(Flash SILC))會隨溫度而愈合,并且這些失效可能不會在高溫嚴重中出現。
經用戶批準,供應商可以減小預處理NVM存儲陣列的數量,或者將耐久性驗證數據段縮短到合理的長度以減少驗證時間。在這種情況下,縮短后存儲段的寫入/擦除循環次數不得小于規格書中的最大數量。縮短后的存儲段持久性驗證應基于高耐久性實際應用中通常使用的數據段而定。被保留下來的數據段應為在不增加不合理鑒定時間的情況下,對寫入/擦除循環進行最大可能的循環次數來進行預處理或耐久性測試。寫入/擦除循環應遵循本文件中第3.1節中要求。
3.1 寫入/擦除 耐久性循環流程
a. 樣品應放置在實驗箱中間,這樣就不會對流經和圍繞每個器件的空氣流動造成阻礙。應施加電源并進行適當的檢查,以確保所有器件都正確通電。當需要特殊安裝定位或散熱時,具體細節應在適用的器件規范書中規定。
b. 樣品應使用器件規格書中規定的最少的循環次數進行寫入/擦除耐力循環測試。耐久性測試應在以下溫度和循環頻率條件下進行:
1 高溫循環:循環應在T≥85°C的溫度下進行,總循環時間不超過加速產品壽命時間的15%。有關在選定循環應力溫度下計算最大循環時間的例子,請參閱附錄A。
2 低溫循環:循環應在T≤55℃的溫度下進行
在以上兩項驗證中,循環之間或循環周期組之間允許延遲,只要延遲均勻地分布在循環周期內,并且循環總持續時間(包括延遲)不超過上述規則(15%的產品壽命)。
這里面提到了附錄A,先插入對附錄A的介紹:
Calculating High Temperature Endurance Stress Time
假設產品的目標生命周期是15年。讓我們假設最壞的情況(最快的)循環頻率是在前3年執行的全部程序/擦除循環規范(時間越快越是循環誘導損傷的最壞情況)。假設循環過程中和循環之間的最壞使用溫度為Tu = 55°C(溫度越低損傷可能越嚴重)。讓我們假設所測試的器件是硅/溝道-氧化物/浮動柵極器件,用于修復氧化物缺陷的電荷脫阱活化能為Eaa = 1.1 eV (該值是產品特定的,必須由供應商提供/證明)。
我們假設選擇的應力循環溫度是Ts=90°C,那么加速因子為:
其中Kb為玻爾茲曼常數 = 0.00008617 eV/K
所以最長的驗證循環總時間為,
編者注:也就是說在616*(1+15%)小時內,需要把所有規格書中規定的循環都做完,確實挺苛刻的,越快越容易出問題。。。
c. 循環是連續進行的,其中一個循環被定義為從一個狀態到另一個狀態并返回到原始狀態的轉換(即從“1”到“0”再返回到“1”;或者從“0”到“1”,然后返回到“0”)。在持久性測試期間,必須驗證每個寫入和擦除操作已成功完成,并通過讀取操作驗證預期的數據狀態。耐力測試循環描述如下。
可能的循環模式可能包括以下方式:
1 棋盤格循環:棋盤式寫入陣列;讀取棋盤格內容;刪除所有數據;讀取所有數值為1。
2 所有0或所有1循環:寫入0到所有矩陣;讀取所有數據為0;擦除所有數據;讀取所有數據為1
3 棋盤格/反向棋盤格循環:
奇數循環:寫入棋盤格數據;讀取棋盤格數據;擦除所有數據;讀取所有數值為1;
偶數循環:寫入反向棋盤格;讀取反向的棋盤格數據;擦除所有數據;讀取值為1.
請注意:當不需要考慮過度寫入或過度擦除,但可能發生位與位之間的互相影響時,應選用流程#3。
在供應商和用戶之間達成協議后,可以使用替代的寫入/擦除算法或驗證模式。
對于較大的矩陣數量產品,至少三分之一的總循環時間應該花在循環到規定的全部陣列持久能力驗證上,三分之一的總循環時間應該用在循環到10%規定的全陣列持久能力的數據塊上,其余的循環時間應該花在其余數據塊上。對于采用片上磨損均衡(WL)算法的存儲器(該算法強制所有塊均勻循環),必須禁用WL算法,這樣陣列中的單元就可以按陣列規范施加壓力。如果這是不可能的,供應商和用戶必須商定一個替代的驗證方式。
對于使用糾錯碼(error correction code, ECC)進行容錯的存儲器,必須禁用這種編碼算法,以便在不使用糾錯技術的情況下對陣列中的所有單元進行壓力和測試。
然而,對于陣列數量非常大的存儲器,采用深度縮放技術的器件或設計有內置ECC的設備,供應商可以請求用戶批準在用戶模式(ECC激活)下執行循環。在后一種情況下,應用戶要求,供應商應提供停用/繞過ECC操作的測試數據,以允許在極端條件下推斷誤碼率。
d. 在完成指定數量的寫入/擦除循環后,應根據第3.6節對器件規格的功能進行驗證。
編者注:至此005文件規定的預處理完成,一定記住含有NVM的器件,比如MCU在進行HTOL和HTSL之前,要進行這個處理。
3.2 HTDR 高溫數據保存驗證流程
a. 在完成第3.1節所述的寫入/擦除耐力循環測試后,器件應按照特定技術規范的最壞情況模式進行寫入,如拓撲棋盤(即每個位被其補位包圍)或所有位單元進行編程。在用戶和供應商同意的情況下,可接受其他模式。在用戶接受的情況下,還可以使用與數據表中指定的不同的編程模式寫入數據,以修改單元格的邊緣并獲得額外的加速。對于多層級單元(MLC)存儲器,驗證模式必須包括所有可能的單元+單元最近鄰組合。
b. 根據章節3.1.b,這些器件在高溫下做循環。根據指定的等級和用戶的預期需求,進行高溫數據保留測試(HTDR)。數據保留烘烤時間和溫度由用戶指定的需求和技術的數據保留活化能確定,如附錄B所述。
c. 為了保持Data Retention的持續應力,只在中間驗證點時間去執行數據內容的驗證和非數組變化功能的測試。這主要是為了排除對NVM數組的任何寫入或擦除測試的影響。
d. 在認證的時間點,器件首先進行測試,以驗證數據內容已在供應商證明的溫度下完善保存。根據AEC-Q100測試B3,隨后進行器件規格的全功能測試。此時,全功能測試包括數組修改寫入和擦除事件。
e. 如果按照AEC-Q100表2對按照3.1.b.1節循環的器件進行高溫存儲壽命(HTSL)壓力測試。HTSL測試的認證結果也可用于HTDR,不需要再單獨的進行HTDR測試。但這只有當HTSL烘烤實際應力范圍不低于HTDR烘烤要求時,這才適用,如下面附錄B所示。用戶應指定HTDR和HTSL都必須滿足的所需時間/溫度驗證參數。
在這里進行附錄2的介紹:Equivalent Bake Time Examples
等效的烘烤時間計算是基于公式 tu=t*exp[Eaa/kB(1/Ts-1/Tu)],這里t為在溫度T環境下的持續時間,tu是在Ts溫度下應力施加的時間,kB是常數0.00008617 eV/K
如上兩個表格介紹了,HTDR的驗證溫度和時間,還有對應HTSL的溫度和時間。
大家在實際認證中根據產品自身的活化能有針對性的選擇就可以。
3.3 LTDR 低溫數據保存驗證流程
a. 同3.2.a
b. 按照3.1.b.2節的規定,這些器件在低溫下循環,在最高55°C的環境下儲存1000小時。根據用戶要求,供應商應提供基于指數時間間隔(如10小時、100小時、1000小時等)對應參數的預期結果。最好的情況下,對位閾值電壓或讀電流退化率進行追溯,并應展示出每個樣品最差存儲單位在規定的產品壽命內可以順利通過。對于大型器件,收集所有數位的參數退化數據是不現實的,應選擇統計上可行的數位集合,供應商應證明數位集合如何選擇。
c. 同3.2.c和3.2.d
3.4 HTOL 高溫工作壽命驗證流程
a. 同3.2.a
b. 采用嵌入式和獨立NVM的器件應根據AEC-Q100表2進行高溫運行壽命(HTOL)測試,使用的溫度和持續時間條件應滿足或超過器件規定的工作溫度等級對應的HTOL要求。在這個測試中,NVM數組中的所有地址都應該被訪問(讀)到,并盡可能多的讀取次數(根據AEC-Q100測試B3),而不要影響HTOL的邏輯部分驗證(根據AEC-Q100測試B1)。否則,將對NVM和邏輯部分塊執行單獨的HTOL測試。在測試期間,對于包含嵌入式flash微處理器的器件,必須連續快速執行全存儲數組校驗(例如“位翻轉”)測試。獨立flash(或分體的控制器)可以在供應商-客戶協議中豁免此校驗和要求。
c. 只在中間驗證點時間去執行數據內容的驗證和非數組變化功能的測試。這主要是為了排除對NVM數組的任何寫入或擦除測試的影響。
d. 在認證的時間點,器件首先進行測試,以驗證數據內容已在供應商證明的溫度下完善保存。根據AEC-Q100測試B1,隨后進行器件規格的全功能測試。此時,全功能測試包括數組修改寫入和擦除事件。
e. 如果供應商證明所選器件等級的HTOL的應力持續時間大于相應的HTDR應力持續時間,在用戶接受的情況下,供應商可以降低循環位的HTOL驗證周期。在這種情況下,在HTOL測試期間發生的可恢復(軟)位數據錯誤在等效HTDR生命周期時間以外的部分將不計入HTOL失效,而是計入HTDR在超過認證應力時間要求的時間點之外的故障。
3.5 驗證流程
應采取預防措施,以確保器件或測試機的熱變化不會損壞樣品,并防止因此帶來的電氣損壞。一個測試系統應在樣品驗證初始和間隔結束時進行監控,以確定所有樣品都按規定的要求施加壓力。
每個樣品上的偏置電壓和電流應在進一步的溫度壓力前加以注意和修正。如果在測試間隔結束時檢查器件的偏置不正確,則必須確定器件是否已更改或測試電路是否已更改,以便確定用于認證數據的有效性。
3.6 衡量通過方法
3.6.1 電性能測試
電性能測量應按器件規格書的間隔進行。
中期和最終電性能測量應在樣品從規定的測試條件下取出后96小時內完成。
3.6.2 需要的測試內容
電性能測量應包括器件規格書中規定的參數和功能測試。
3.6.3 測量條件
在將器件從實驗箱取出之前,應將實驗箱溫度恢復到室溫,同時保持樣品上規定的電壓。測試應按AEC-Q100章節1.3.3中列出的認證等級,在通常條件下,在每個器件規定的的最低和最高溫度范圍內進行。
4 認證失敗的條件
如果樣品超出參數限制,器件不再滿足規格書要求,或器件無法保持其預期數據狀態,則將被定義為失效。
在寫入/擦除耐力循環測試中,當寫或擦除指令在最大指定時間內未完成,或當指令完成但存儲數組中的數據內容與預期的數據內容不對應時,就會認為認證失敗。
總結
EDR是針對存儲器和存儲模塊而開展的可靠性驗證內容,包含器件本身的耐久性測試,也包括存儲器中數據的保存能力和工作壽命。
本文對AEC-Q100 B組的第3項內容EDR進行了介紹和解讀,希望對大家有所幫助。
補充依據,為什么這個解讀這么長呢,因為平時EDR驗證用的很少,原因是國內車規等級的獨立存儲器太少了。還有就是驗證有點復雜, 成本太高,很多實驗室都沒有對應的認證設備。
所以嘛,這也導致我也不熟悉,不熟悉就得仔細研究標準,基本一字不落的翻譯和解讀,導致這篇6000多字的文檔出現。另外一個超長的是A1 PC預處理的解讀,PC是因為步驟確實太多了。
如果有不正確的地方,也歡迎指正并交流。
材料整理制作不易,轉發請注明出處,文章中不對的地方歡迎指教和交流溝通。