0
新智駕按:本文由新智駕編譯自 semiengineering,原文標題為 Finding Faulty Auto Chips。由于本文涉及諸多技術細節(jié)與專業(yè)術語,有不妥之處敬請專業(yè)讀者指摘。
作為輔助駕駛和自動駕駛的關鍵組成部分,新一代汽車芯片正在快速推動異常檢測技術的發(fā)展。
據(jù)新智駕了解,半導體設備供應商 KLA-Tencor、半導體數(shù)據(jù)分析服務商Optimal+和EDA巨頭 Mentor (2016年被西門子收購)正在擴大異常檢測領域的相關工作。
異常檢測技術在各行業(yè)已經(jīng)使用多年,是保證芯片生產(chǎn)質量零缺陷的主要技術之一,而零缺陷對汽車行業(yè)至關重要。
通常來說,異常檢測是采用硬件和統(tǒng)計篩選算法來定位的。一些芯片可能會通過各種標準測試,但是有時會表現(xiàn)出功能異常。這種芯片可能會影響系統(tǒng)性能或導致系統(tǒng)失效。
異?;蛉毕菪酒某霈F(xiàn)有諸多原因,一些潛在可靠性缺陷在設備發(fā)貨時不會出現(xiàn),但它們在不同環(huán)境中會以某種方式激活,最終影響整個系統(tǒng)的運行。
為了發(fā)現(xiàn)芯片出現(xiàn)的各種問題,業(yè)界多種使用異常檢測的方法,如零件平均測試法(PAT)。
PAT的測試流程如下:
首先,對晶圓進行電氣測試;
其次,把硬件和PAT算法組合,檢測出違反特定測試規(guī)范的異常或故障芯片;
最后,將異常芯片去除。
*PAT中極限和異常值的圖形表示 來源:Automotive Electronics Council
但是,PAT方法很難滿足汽車行業(yè)的苛刻要求。Optimal+公司CTO Michael Schuldenfrei表示:“汽車和其他類型的關鍵型設備的半導體產(chǎn)品使用量正在呈指數(shù)級增長,這對芯片質量和可靠性提出了更高要求。PAT等異常檢測技術作為保證質量和可靠性的主要手段,已經(jīng)存在了幾十年。但在很多情況下,它們并不是非常有效,在防止漏檢方面測試成本過高?!?/p>
漏檢是指故障芯片通過了晶圓廠測試。為了避免這種情況的發(fā)生,異常檢測專家們開發(fā)出了新的更先進的技術來防止芯片漏檢及其它問題。比如,異常檢測通常是在芯片封裝測試階段進行,但KLA-Tencor采取了新的解決方案,開發(fā)了一種用于在晶圓廠中測試的技術。
盡管如此,該行業(yè)仍面臨一系列重大挑戰(zhàn),主要包括:
隨著許多先進芯片用于汽車中,迫切需要先進的異常檢測算法
異常檢測技術必須符合輔助駕駛和自動駕駛技術的發(fā)展趨勢
英偉達和其它沒有異常檢測經(jīng)驗的IC制造商正在蜂擁進入汽車市場,這意味著他們需要提高學習曲線
此外,飛速增長的汽車半導體市場還面臨很多其它挑戰(zhàn)。除了汽車市場,異常檢測也應用在醫(yī)療和其它領域中。根據(jù)西門子的子公司Mentor的說法,總體而言,商業(yè)性的異常檢測軟件業(yè)務的規(guī)模在每年2500萬美元到5000萬美元之間。Mentor Quantix事業(yè)部總經(jīng)理Bertrand Renaud表示:“這個數(shù)字可能僅代表實際軟件的三分之一,因為許多大型IDM廠商已經(jīng)構建了自己的專有工具,他們的軟件沒有統(tǒng)計在內(nèi)。”
目前,KLA-Tencor、Mentor、Optimal+和yieldWerx等公司也在競爭之列。
2018年,汽車市場可能會放緩增速。
據(jù)IHS Markit的數(shù)據(jù),2018年輕型汽車的全球總銷量預計將達到9590萬輛,同比2017年增長1.5%。作為對比,2017年同比2016年增長了2.4%。因此,汽車銷量的增長如何對應汽車半導體市場增速目前尚不完全清楚。
根據(jù)IHS Markit的數(shù)據(jù),每輛汽車電子元件的價值將從2013年的312美元增長到2022年的460美元,年復合增長率為7.1%。
“10年前的汽車,只有幾百個控制器和其他類型電子元件,現(xiàn)在的汽車可能包含超過3500個半導體產(chǎn)品,這些半導體器件的總成本正在持續(xù)上升?!盞LA-Tencor高級營銷總監(jiān)Rob Cappel表示。
通常來說,一輛高端汽車配備超過7000顆芯片。而芯片廠商正在向高端車型中引入14nm和10nm芯片,同時也正在研發(fā)7nm芯片。
在汽車領域,有兩個恒定的因素——可靠性和質量。
對于消費級芯片而言,消費者對缺陷尚有一定的容忍度。但是,汽車芯片對缺陷和故障則屬于零容忍。比如ABS系統(tǒng),由于事關人身安全,汽車的可靠性要求總是更高。
因此,汽車芯片制造商和代工廠必須遵守各種質量標準,如AEC-Q100,這項標準主要涉及芯片的失效機理壓力測試。
ADAS(高級駕駛輔助系統(tǒng))和自動駕駛汽車對可靠性的要求更加嚴苛。ADAS涉及汽車中的各種安全功能,如自動緊急制動、車道檢測和后方物體警告。
例如,全球最大的汽車芯片制造商NXP(恩智浦)最近推出了一款用于汽車應用的高分辨率雷達芯片。這款芯片被稱為MR3003雷達收發(fā)器,是一款77GHz雷達器件。該器件基于硅鍺(SiGe)工藝,適用于需要高分辨率和遠距離功能的自動駕駛系統(tǒng)的前端或轉角雷達應用。
此雷達技術能夠同時跟蹤數(shù)千個目標,能夠實時感測周圍環(huán)境,這正是高級別自動駕駛所必需的。
“這些類型的應用對我們和芯片本身都提出了較高的要求。我們非常謹慎地設計了系統(tǒng)內(nèi)部的安全協(xié)議,以便傳感器和汽車能夠在某些情況下進行自我診斷,”恩智浦ADAS調(diào)制解調(diào)器產(chǎn)品線副總裁兼總經(jīng)理Patrick Morgan表示。
毋庸置疑,汽車安全非常關鍵。
例如,根據(jù)Optimal+提供的數(shù)據(jù),奧迪的高檔汽車中擁有7000個芯片。假設每個芯片的故障率達到百萬分之一,那么奧迪每生產(chǎn)1000輛汽車就會有7輛故障車。如果奧迪每天生產(chǎn)4000輛汽車,這意味著,它每個小時都會生產(chǎn)一輛故障車。
所以,汽車行業(yè)正在努力實現(xiàn)零缺陷,但隨著系統(tǒng)、芯片甚至軟件變得越來越復雜,這一目標很難實現(xiàn)。
在最新的車輛可靠性研究工作中, 市場研究機構J.D. Power對過去一年2015年款車型和2017年款車型每100輛車遇到的問題進行了統(tǒng)計調(diào)查,結果發(fā)現(xiàn),2017年款汽車整體可靠性提高了9%,但是各種電子系統(tǒng)依然存在問題。據(jù)調(diào)查,內(nèi)置語音識別和藍牙連接是最大的問題。
出現(xiàn)的問題可能與采用最新的半導體器件有關。異常檢測中,在晶圓廠處理完晶圓后,首先進行電氣測試,然后送到測試部門進行評估。但評估方法只能解決一部分潛在問題。
“你不可能測試器件的每一條執(zhí)行路徑,也不能覆蓋完整的場景。有時候,測試結果也不是很明確。我們只是知道,目前的方法還不夠好?!盞LA-Tencor戰(zhàn)略合作高級主管Jay Rathert說。
此外,測試可能會發(fā)現(xiàn)潛在可靠性缺陷?!皾撛诘目煽啃匀毕菔侵鸽x開了晶圓廠才暴露出來的缺陷,它們在某種程度上是通過環(huán)境激活的,包括振動、濕度、電流、電遷移或熱量。隨著時間的推移,它們可能暴露出來?!盧athert說。
*隨機缺陷 來源: KLA-Tencor
既然如此,為什么不在這些芯片離開晶圓廠之前就檢測出來這些缺陷呢?
根據(jù)加州大學伯克利分校的統(tǒng)計,一月產(chǎn)5萬片晶圓的晶圓廠需要以下設備:
50臺掃描儀/步進器和晶圓軌道
10個高電流離子注入器和8個中等電流離子注入器
40臺蝕刻機
30個CVD工具
晶圓廠一般采用自動化技術分步處理晶圓。一個先進工藝的晶圓制造過程可能有多達600-1000個步驟,甚至更多,相比之下,成熟工藝的步驟更少。
先進工藝中,半導體設備必須處理更小且更加精確的特征,隨著工藝尺寸的縮減,缺陷也變得越來越難找到。
其實,每種應用都有各自不同的缺陷要求。一般來說,面向消費者的OEM們對缺陷的控制要求不是太嚴格,但是,在汽車領域,芯片制造商們必須在其器件的制造工藝中實施更加嚴苛的控制措施,并部署持續(xù)的缺陷改進計劃。
“有一些先決條件(汽車領域中),”聯(lián)電副總裁溫文婷說。“你必須有一個管理良好的工廠和維護好的工具。 最重要的是,需要一個強大的質量體系,并貫徹高質量的理念,才能夠獲得制造汽車產(chǎn)品所需的認證。汽車行業(yè)里,質量控制始于工藝設計和工廠規(guī)劃,并一直延伸到實際生產(chǎn)芯片。”
晶圓廠中,人們使用檢測系統(tǒng)定位晶圓缺陷。一般來講,芯片制造商不會檢查每一片晶圓,因為那樣需要很長時間,而且成本較高,他們會抽樣檢測某些晶圓或者部分芯片。
對于消費級芯片來說,過程簡單。“當我們開發(fā)一項技術時,我們會認證它,通常來講,抽樣的樣本數(shù)量總是有限的。”溫文婷表示。
汽車級芯片要求就不同了?!澳惚仨殰y試大量的樣本才能得出故障率,這個過程的成本非常高。”溫文婷接著說道?!叭藗冋诳紤]如何在成本可承受的程度下實現(xiàn)目標,每個方面都存在很多挑戰(zhàn)。”
所有問題和挑戰(zhàn)都是需要大量時間和資金去解決。如果芯片在經(jīng)過檢測和其它過程之后符合規(guī)范,就可以把晶圓從晶圓廠分發(fā)到封測廠。
同時,存在的壓力就轉給封測廠了。為了幫助測試,KLA-Tencor設計了一種技術方案來捕捉晶圓廠中的問題。該技術被稱為在線零件平均測試(I-PAT),它利用了PAT的概念。但是,與在測試部門進行的PAT及其變體不同,I-PAT在晶圓廠中執(zhí)行。
I-PAT不一定會與傳統(tǒng)的第三方異常檢測供應商競爭。它的目標是提供更多的測試數(shù)據(jù),補充既有的測試組合。通常來講,仍然需要執(zhí)行傳統(tǒng)的異常檢測。
KLA-Tencor的技術涉及硬件和數(shù)據(jù)分析軟件包。簡言之,先把檢驗數(shù)據(jù)輸入到計算機建模程序中,然后分解數(shù)據(jù),并查看晶圓圖上的硅片,最后在晶圓廠的多個檢查步驟中查找異常缺陷。
舉一個簡單例子,該技術將顯示具有五個層的芯片晶圓圖,包括源區(qū)、柵極、觸點層、金屬層1和金屬層2。假設金屬層1上可能會有800個缺陷。計算機從晶圓上隨機選擇10個芯片,然后,使用各種I-PAT算法,系統(tǒng)最終確定這10個芯片中有9個存在潛在的可靠性缺陷。
此過程可重復好幾遍。“你可以一遍又一遍重復上述步驟,”KLA-Tencor高級營銷總監(jiān)David Price說。 “通過不斷重復,可以看到缺陷的統(tǒng)計性質如何幫助你找到有可能包含可靠性缺陷的芯片?!?/p>
I-PAT可用于挑選有問題的芯片。 另外,這些數(shù)據(jù)可以與其他異常檢測方法結合使用,以改進測試通過或不通過的決策。Price說:“通過在晶圓廠中實施I-PAT技術,你將能夠減少傳統(tǒng)PAT方法所帶來的矯枉過正和不足之處?!?/p>
晶圓從晶圓廠移動到測試廠后,在那里進行晶圓分類、最終測試,有時也會進行系統(tǒng)級測試。
檢查和測試會產(chǎn)生巨大的數(shù)據(jù)量。但是,在大量數(shù)據(jù)面前,如何知道器件是否仍存在潛在的可靠性缺陷或其他問題呢?
其實就是回答為什么汽車OEM們希望他們的供應商在測試過程中執(zhí)行傳統(tǒng)異常檢測?
Mentor的Renaud說:“整個晶圓經(jīng)過測試之后,在晶圓分類中進行的PAT分揀,是在服務器上作為離線處理完成的。對每個部分進行測試后,最終測試中的PAT分揀是在測試儀上在線執(zhí)行的,當然,整個流程都是由服務器管理并控制的?!?/p>
實際上,異常檢測技術從晶圓廠取得電子數(shù)據(jù),然后分析數(shù)據(jù)。KLA-Tencor的新技術將向測試混合提供更多數(shù)據(jù)?!拔覀兡軌驈腒LA等公司的機器中收集檢測數(shù)據(jù),”O(jiān)ptimal+的Schuldenfrei說?!皩⑺袛?shù)據(jù)結合在一起使用,顯然會進一步提高檢測的準確度。”
PAT是最基本的邊界檢測形式,應該可以檢測出一個超出不合格閾值的芯片。測試閾值可以設置為靜態(tài)(SPAT)或動態(tài)(DPAT)模式。
在SPAT中,測試閾值是基于該批次的數(shù)量決定的,在DPAT中,則會在每次晶圓測試時計算閾值。在SPAT和DPAT中,都會執(zhí)行一個算法,最終得出測試通過或失敗的結果。
但是,這些算法可能在某些情況下會失敗。有的器件的特征可能和其它器件明顯不同,但是它也在合理范圍內(nèi)。有的器件可能是遠離正態(tài)分布的極端異常?!斑@種情況可能會嚴重影響整個特征分布,會漏掉接近特征分布中心的異常?!監(jiān)ptimal+的Schuldenfrei說。
雖然異常檢測專家已經(jīng)加入了一些程序來解決這些問題。但是,多年來,這些芯片變得越來越復雜,因此需要更先進的異常檢測技術。
據(jù)雷鋒網(wǎng)新智駕了解,有一些基于幾何分布、多變量和其它方案的復雜異常檢測算法可以和DPAT和SPAT結合一起使用。
一種先進類型的幾何分布PAT(GPAT)可以根據(jù)它的幾何分布鄰近度來查看芯片質量。
據(jù)雷鋒網(wǎng)新智駕了解,GPAT有一個復雜版本,稱為GDBN。GDBN基于一種理念:缺陷總是趨向于集中出現(xiàn)在晶圓的某些特定位置上。簡單來講,缺陷較多的區(qū)域可能會找出一些不合格芯片。
還有一種被稱為最差殘差(NNR)技術。“最差殘差技術是在每個芯片的每一次測試中檢查所有值,它不僅考慮整體晶圓,還考慮臨近芯片的情況。”O(jiān)ptimal+ Schuldenfrei說。
還有一些其他方法,如多變量技術?!暗乩砜臻g算法檢查晶圓上的失效模式,以確定掩模版缺陷和失效芯片的集群。同時,多變量算法測量多次測試之間的相關性,而不是一次只考慮一個測試結果,”Mentor Renaud說。
通常,所有上述方法都可以結合使用。
展望未來,ADAS和自動駕駛將進一步推動檢測技術的需求。Optimal+ Schuldenfrei表示:“隨著汽車的自主化程度越來越高,芯片缺陷檢測也將變得越來越重要。”
此外,機器學習和人工智能的運算能力與功能也日益強大,我們相信,它們也會更多地參與到異常檢測中來。
最后,把所有的數(shù)據(jù)集成在一起也許是最大的挑戰(zhàn)。“想象一下,從芯片獲取數(shù)據(jù),并將其與多個不同公司的電路板數(shù)據(jù)關聯(lián)起來,”Schuldenfrei表示。“需要共享數(shù)據(jù)才能實現(xiàn)更好的異常檢測。”
PS:看遍這一年中國與全球智能駕駛領域的技術前沿與商業(yè)探索,雷鋒網(wǎng)新智駕年度推薦,掃描下圖二維碼或點擊 http://m.ozgbdpf.cn/special/custom/AIdrive.html 了解更多信息。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。