久久夜色精品国产噜噜av小说,国产草莓视频无码a在线观看,中文乱伦三级综合

IP新銳芯耀輝多點破局DDR PHY技術瓶頸

2021-04-20 15:11 芯耀輝

導讀：本文從新銳IP企業(yè)芯耀輝的角度，談談DDR PHY，以及芯耀輝在DDR PHY上的技術突破，助力服務芯片設計企業(yè)。

引言

近幾年，云計算、5G、物聯(lián)網(wǎng)、人工智能等產(chǎn)業(yè)的迅速發(fā)展使得對內(nèi)存的需求大增。作為內(nèi)存技術的關鍵模塊，DDR PHY的市場需求也在高速增長。本文從新銳IP企業(yè)芯耀輝的角度，談談DDR PHY，以及芯耀輝在DDR PHY上的技術突破，助力服務芯片設計企業(yè)。

什么是DDR PHY

DDR PHY是DRAM和內(nèi)存控制器通信的橋梁，它負責把內(nèi)存控制器發(fā)過來的數(shù)據(jù)轉(zhuǎn)換成符合DDR協(xié)議的信號，并發(fā)送到DRAM；相反地，其也負責把DRAM發(fā)送過來的數(shù)據(jù)轉(zhuǎn)換成符合DFI協(xié)議的信號并發(fā)送給內(nèi)存控制器。DDR PHY和內(nèi)存控制器統(tǒng)稱為DDR IP，他們保證了SoC和DRAM之間的數(shù)據(jù)傳輸，如圖1所示。

圖1 DDR PHY和內(nèi)存控制器在SoC中的作用

DDR IP 市場需求強勁

作為重要的接口IP，DDR IP的市場需求強勁。據(jù)IP Nest機構(gòu)預測，2015-2024年全球接口類IP保持16%的平均年復增長率。未來幾年，在5大類接口IP（USB、PCIe、DDR、D2D&Ethernet、MIPI）市場份額上，DDRIP將持續(xù)保持前三的市場份額。

目前在DDR IP的市場上，國際廠商占據(jù)較高的市場份額，而國內(nèi)IP企業(yè)占比很小，究其原因，主要是由于DDR PHY具有較高的技術門檻，要在這類PHY上實現(xiàn)突破并不容易。

首先與其說DDR PHY是一個芯片技術，不如說DDR PHY是一門系統(tǒng)工程。DDR的數(shù)據(jù)傳輸采用并行多位、單端突發(fā)的傳輸模式，對電源完整性PI（Power Integrity，電源完整性）和信號完整性SI （Signal Integrity，信號完整性）的要求很高。另一方面，DDR可以說是對訓練(Training)要求最多的接口。各種訓練是否獲得最佳的結(jié)果直接影響DDR工作的可靠性。對于PHY開發(fā)人員來說，既要懂物理層的設計，也要懂訓練算法的設計，只有這樣才能開發(fā)出可靠的產(chǎn)品，然而這又無形中抬高了設計的門檻。最后，如何實現(xiàn)高速的單端信號傳輸，是DDR IO設計的一大考驗。

多點著力，攻克DDR PHY技術瓶頸

作為一家專注于半導體IP研發(fā)和服務的高科技公司，芯耀輝科技看準了企業(yè)的需求和市場機遇，通過可靠的SI和PI分析、優(yōu)化的訓練算法設計、高性能的IO設計等一系列技術創(chuàng)新，成功突破了DDR PHY的技術瓶頸。

關鍵技術點一：可靠的SI和PI分析指導

DDR數(shù)據(jù)傳輸?shù)奶攸c是：多位并行傳輸，單端數(shù)據(jù)突發(fā)模式。目前SoC可以集成多達72位（DDR4帶ECC）的DDR接口，多位并行傳輸在封裝和PCB上的布線是非常復雜的，很多走線有一定等長要求，同時還要盡量減小線間串擾，所以合格的封裝和PCB設計是一大挑戰(zhàn)。另外突發(fā)模式的傳輸，SSO（Simultaneous Switching Output）噪聲也會嚴重影響DDR的性能。所以DDR穩(wěn)定的工作需要可靠的SI和PI分析。

在芯片開發(fā)早期，確定好芯片的PAD規(guī)劃和封裝規(guī)劃，對于設計后期優(yōu)化DDR的SI和PI性能至關重要。芯耀輝在系統(tǒng)級芯片設計早期、IO準備階段就開展SI和PI的分析，提前幫助客戶規(guī)劃，以確保集成的DDR PHY的量產(chǎn)性能。如下圖2所示為芯耀輝的SI和PI流程示意圖。

圖2 芯耀輝SI和PI流程示意圖

另外，芯耀輝團隊還開發(fā)出了一套特殊碼流分析技術。通過該技術，在設計階段可以高效地分析封裝和PCB設計是否滿足DDR眼圖的要求，可以快速定位缺陷，并指導客戶優(yōu)化完善。圖3給出了一個實際合作案例，展示了系統(tǒng)設計最終完成后的眼圖質(zhì)量。

圖3 芯耀輝LPDDR4X-3733仿真寫數(shù)據(jù)眼圖

關鍵技術點二：高可靠性訓練設計

DDR系統(tǒng)的穩(wěn)定工作離不開各種訓練。在啟動的時候需要做初始化的CA Training，Write Leveling，Read Leveling和 Write Eye Training等一系列訓練，對于DDR4、LPDDR4及以上的更高協(xié)議，還需要VREF的二維訓練。基于純硬件的方式無法提供復雜的訓練范式。例如JEDEC的DDR4協(xié)議里面規(guī)定了DRAM只能提供簡單的01010101等范式，這對于高速DDR的訓練是不足夠的，因為這些范式頻率單一，無法反映數(shù)據(jù)通道衰減帶來的碼間串擾（ISI）。另外，不同范式在終端的反射也會不一樣。所以如果采用JEDEC規(guī)定的簡單范式來訓練DDR，特別是在較高速率下，不能得到一個最優(yōu)化的訓練結(jié)果。

芯耀輝的DDR PHY采用基于固件的訓練方法，可以設置不同的范式，如PRBS范式、特殊設計的掃頻范式等。顯然此類范式能更全面的反映數(shù)據(jù)通道特性，因為它包含了高頻、中頻、低頻信息，以及長0和長1帶來的碼間串擾等問題，可以保證獲得更優(yōu)的訓練結(jié)果。

初始化的訓練完成之后，芯片內(nèi)部溫度和電壓會隨著工作狀態(tài)和環(huán)境溫度的變化而變化，此溫度和電壓的變化會讓訓練的結(jié)果偏移理想值，使得DDR的讀寫裕量減小，嚴重的情況還會造成讀寫數(shù)據(jù)錯誤。芯耀輝開發(fā)了一種可以動態(tài)檢測芯片內(nèi)部溫度和電壓變化的技術，通過實時補償各種訓練結(jié)果，保證數(shù)據(jù)的讀寫具有足夠的裕量，確保DDR工作的穩(wěn)定性。

關鍵技術點三：高性能DDR IO設計

信號碼間串擾和走線的阻抗不匹配帶來的信號反射嚴重影響數(shù)據(jù)通信。為了保證DDR數(shù)據(jù)讀寫的可靠性，在DDR IO設計中，芯耀輝采用了FFE（前向反饋均衡）和DFE（判決反饋均衡）技術。

FFE 前端預均衡

FFE前端預均衡是在DDR TX端采用的技術。因為數(shù)據(jù)通道有衰減，使得信號高頻部分被抑制較大，低頻部分被抑制較小，所以在RX端看到的眼圖眼高和眼寬均比較小。FFE的思想就是減小低頻分量的能量，使得信號的高頻低頻部分在信道之后達到均衡。圖4展示了FFE原理，如果信號有0->1的或者1->0的變化，則輸出滿強度(Full Strength)的信號，如果信號是連續(xù)的1或者0，則輸出均衡強度的信號(EQ Strength)。

圖4 FFE前端預均衡原理示意圖

圖5 展示了在RX端，數(shù)據(jù)速率是6400Mbps時，關閉FFE和打開FFE的仿真示意圖?？梢钥吹?，打開FFE的眼圖質(zhì)量明顯好于關閉FFE的眼圖質(zhì)量。

圖5 芯耀輝仿真效果示意圖(6400Mbps)，左圖沒有打開FFE，右圖打開FFE

芯耀輝采用可編程的前端預均衡方案，通過設置不同參數(shù)可以獲得不同的均衡效果，以適應各種應用場景的需要。

自適應算法支持的接收端DFE(判決反饋均衡)

信號的碼間串擾可通過脈沖響應(pulse response)示意圖理解，如下圖6所示。

圖6 經(jīng)過信道的脈沖響應

當脈沖信號經(jīng)過信道時，因為高頻衰減和信道反射，會形成一個拖尾的波形，前一個bit的信號會影響將來bit的信號質(zhì)量。DFE的原理是：判斷之前幾個bit的信號是1或者0，然后通過加權(quán)和反饋相加，減弱前bit信號的拖尾影響，以達到改善當前bit信號質(zhì)量的目的。相比于CTLE等均衡技術，DFE不會放大噪聲信號，因此固態(tài)技術協(xié)會在JEDEC79-5 規(guī)范中正式引入了DFE技術，目的就是為了增強接收端的能力。

圖7是常見的4 tap DFE架構(gòu)，也是JEDEC規(guī)范推薦的架構(gòu)之一。因為DQS的上升沿和下降沿均會采樣DQ，所以采樣電路分為上下兩個數(shù)據(jù)通路。兩個數(shù)據(jù)通路的4個采樣值經(jīng)過加權(quán)系數(shù)處理后會反饋到每一個數(shù)據(jù)通路對應的求和器(∑)，從而減去這4個之前信號對當前信號的ISI影響。這種結(jié)構(gòu)采用了兩個求和器，會加大DQ_Buf端的負載。另外4個采樣值均需要直接反饋到兩個求和器，會使得芯片內(nèi)部連線比較復雜，影響高速性能。圖8是DFE的另一種架構(gòu)，這種結(jié)構(gòu)通過MUX選擇兩路數(shù)據(jù)通路的采樣值，并把選擇后的值送到求和器進行EQ處理。因為只用到了一個求和器，減小了芯片內(nèi)部的連線復雜性，最重要的是減小了DQ_Buf端的負載，提升了高速性能。

圖7 常見的4-tap DFE架構(gòu)

圖8 另一種常見的4-tap DFE架構(gòu)

DFE各級tap的加權(quán)系數(shù)可以通過手動設置，前提條件是要得到信道的參數(shù)，這樣做不適合產(chǎn)品的大規(guī)模量產(chǎn)，因為對不同的產(chǎn)品來說，它的IO特性、信道參數(shù)是有隨機偏差的，同樣的一套設置不能保證每個產(chǎn)品都有最佳的DFE性能。通過自適應訓練得到DFE各級tap的系數(shù)是目前主流的方式。芯耀輝的DDR PHY提供了一套特殊的固件訓練機制，DFE的各級tap的反饋系數(shù)可以通過訓練快速得到，自適應程度高，可保證每一顆芯片都有更優(yōu)的DFE性能，有效減小碼間串擾和反射造成的影響。

關鍵技術點四：支持多頻點的快速頻率切換技術實現(xiàn)低功耗設計

DDR是SoC系統(tǒng)中的功耗大戶，如何減小DDR的功耗一直是DDR技術革新的動力和方向之一。最直接的方法就是降低供電電壓，而這正是DRAM規(guī)范的演進之路。另一方面，從DDR4和LPDDR4開始，DRAM規(guī)范定義了POD IO 架構(gòu)（針對DDR4和DDR5）、LVSTL IO架構(gòu)（針對LPDDR4和LPDDR5）和數(shù)據(jù)總線倒置(DBI)技術，能有效地減小IO端的功耗。

以上降低功耗的方法是JEDEC規(guī)范限定的技術，芯耀輝還開發(fā)出一種動態(tài)頻率切換技術，能有效降低系統(tǒng)總功耗。該技術在DRAM初始化的時候可以訓練多達多個頻率點的配置，并保存相關訓練結(jié)果。當系統(tǒng)確定不需要DRAM工作在高頻率時，可以通知DDR控制器，然后DDR控制器會通知DFI，并讓DRAM進入自刷新狀態(tài)，之后頻率切換就會自動在DFI和DDR PHY內(nèi)部進行，頻率切換完成之后DDR控制器則會讓DRAM退出自刷新，這樣DDR就可以切換到一個較低的工作頻率，從而降低功耗。相較于同類產(chǎn)品，該技術最大特點是整個過程無需固件接入，在新的頻率點無需重新做訓練，從而快速穩(wěn)定地實現(xiàn)頻率切換。

總結(jié)

未來，市場對DDR PHY的需求持續(xù)增長，在先進制程上的需求更加突出。芯耀輝較早切入了基于FinFET工藝的IP開發(fā)，通過不斷的技術創(chuàng)新，成為目前少數(shù)能提供先進制程、優(yōu)越性能，穩(wěn)定可靠的DDR PHY的本土企業(yè)之一。

百尺竿頭，更進一步，芯耀輝人必將以提供高性能的接口類IP，高品質(zhì)的設計服務為己任，奮發(fā)圖強，助力攜手合作廣大芯片設計公司及晶圓代工廠，推出更優(yōu)秀的產(chǎn)品，助力提升中國芯片產(chǎn)業(yè)的發(fā)展。

IP新銳芯耀輝多點破局DDR PHY技術瓶頸

相關閱讀