广告

软硬结合的智能DDR PHY训练技术

时间:2021-07-06 阅读:
DDR接口速率越来越高,每一代产品都在挑战工艺的极限,对DDR PHY的训练要求也越来越严格。本文从新锐IP企业芯耀辉的角度,谈谈DDR PHY训练所面临的挑战,介绍芯耀辉DDR PHY训练的主要过程和优势,解释了芯耀辉如何解决DDR PHY训练中的问题。
广告

引言

DDR接口速率越来越高,每一代产品都在挑战工艺的极限,对DDR PHY的训练要求也越来越严格。本文从新锐IP企业芯耀辉的角度,谈谈DDR PHY训练所面临的挑战,介绍芯耀辉DDR PHY训练的主要过程和优势,解释了芯耀辉如何解决DDR PHY训练中的问题。

DDR PHY训练简介

高可靠性是系统级芯片SoC重要的质量和性能要求之一。SoC的复杂在于各个IP模块都对其产生至关重要的影响。从芯耀辉长期服务客户的经验来看,在客户的SoC设计中,访问DDR SDRAM是常见的需求,所以DDR PHY则成为了一个非常关键的IP,其能否稳定可靠的工作决定了整个SoC芯片的质量和可靠性。

制定DDR协议的固态技术协会(JEDEC)标准组织并没有在规范中要求动态随机存取存储器(DRAM)需要具备调整输入输出信号延时的能力,于是通常DDR PHY就承担起了输入和输出两个方向的延时调整工作,这个调整的过程称为训练(training)。训练是为了使DDR PHY输出信号能符合固态技术协会标准的要求,DDR PHY通过调节发送端的延迟线(delay line),让DRAM颗粒能在接收端顺利地采样到控制信号和数据信号;相对应的,在DDR PHY端,通过调整内部接收端的延迟线,让DDR PHY能顺利地采样到DRAM颗粒的输出信号。从而在读写两个方向,DDR接口都能稳定可靠地工作。

图1:DDR PHY承担了输入和输出两个方向的延时调整工作

然而,随着DDR工作频率提高,DDR PHY训练的准确性和精度要求也随之提高。训练的准确性和精度决定了DDR系统能否稳定可靠地工作在较高的频率。

DDR PHY训练所面临的挑战

DDR训练的种类繁多,每个训练的结果都不能出错。同时固态技术协会定义的训练序列都比较单一,如果只使用这些默认序列的话,训练结果在实际工作中并不是一个最优值。

目前绝大多数DDR PHY都采用硬件训练的方式,如果硬件算法有问题,会导致训练出错,DDR无法正常稳定地工作,导致整个SoC的失败。同时,硬件训练模式很难支持复杂的训练序列和训练算法,从而无法得到训练结果的最优解。

芯耀辉的DDR PHY采用软硬件结合的固件(firmware)训练方式跳出了上述DDR PHY训练模式的固定思维。

芯耀辉DDR PHY在训练上的优势

解决写入均衡(write leveling)的难题

写入均衡是为了计算出flyby结构下命令通路和数据通路的走线延迟的差值,在DDR PHY中把这个差值补偿到数据通路上,从而最终让数据通路和命令通路的延迟达到一致。

图2:DDR flyby拓扑结构示意图

在实际的应用中,命令(command)路径上的延时会超过数据(DQ)路径的延时。假设路径差值 = 命令路径延时 – 数据路径延时,一般路径差值在0~5个时钟周期之间。可以把路径差值分为整数部分和小数部分(单位是0.5个时钟周期)。

图3:命令路径延时、数据路径延时和路径差值

根据固态技术协会标准(如JESD79-4C)的写入均衡的要求,DRAM在写入均衡模式下会用DDR PHY发送过来的DQS沿去采样CK,并把采样的值通过DQ返回给DDR PHY。

图4:写入均衡模式下调整DQS时延的示意图

通过该训练,DDR PHY可以计算出命令与数据路径延时差值的小数部分,却没有办法训练出命令与数据路径延时差值的整数部分(把DQS多延迟一个时钟周期或者少延迟一个时钟周期,用DQS采样CK的采样值是相同的)。

为了解决这个问题,通常会根据版图设计估算出大概的路径差值,从而自行得到路径差值的整数部分,直接配置到DDR PHY的寄存器中。这种做法在频率比较低、量产一致性比较好的时候问题不大。但在大规模量产的时候,如果平台之间的不一致性超过一个时钟周期(LPDDR4最高频下周期为468ps)的话,上述直接配置整数部分的方法就没法进行工作了,必然会导致部分芯片无法正常工作。

芯耀辉采用固件的训练方式,通过DDR写操作时特殊调节方法,能够帮助客户计算出路径差值整数加小数部分,无需客户根据版图设计估算路径差值范围。

图5:路径差值整数部分训练和小数部分训练

过滤训练时DQS的高阻态

读操作时,DQS信号在前导(preamble)前是高阻态,同时DQS信号的前导部分也不能达到最稳定的状态,所以需要训练出读DQS的gate信号来过滤掉前面的高阻态和前导,恰好得到整个读突发(Read Burst)操作的有效DQS,这就是读DQS gate训练。

芯耀辉采用特定的方法,在训练的时候,排除不稳定DQS的干扰,用读DQS的gate信号得到读突发数据对应的第一个DQS的上升沿位置,从而得到gate的位置。图6:读DQS gate训练

延迟DQS提高读DQ训练的准确性

一般在DDR PHY中没有这个训练,因为该训练不是固态技术协会标准要求的,可是在实际应用中,这个训练却有着比较重要的意义。

图7:LPDDR4突发读(来源固态技术协会标准JESD209-4B)

读DQS和读DQ之间的偏差为tDQSQ,这个值的范围是0~0.18UI(在高频下约为0~42ps)。读训练的时候,采用延迟DQS的方法,找到DQ的左右窗口,最后把DQS放在DQ窗口的中心点。由于DDR PHY内部的DQS-DQ延迟偏差、封装的pad延迟偏差、以及PCB走线偏差,虽然DRAM端输出的tDQSQ为正数(DQ的延迟比DQS大),但在DDR PHY内部看到的tDQSQ却可能为负数(DDR PHY内部DQS的延迟比DQ大),如图8上半部分所示。

在这种情况下,即使DQS的延迟为0,DQS也落在DQ的窗口内,PHY内部会通过从0延迟开始增加DQS的延迟来搜索DQ的左右窗口,这样必然导致最终搜索到的DQ的窗口比实际的窗口要小,读训练后的DQS的采样点不在DQ的正中间,而在偏右的位置,最终读余量(margin)变小。

芯耀辉通过特定的方法,能让每个DQ的窗口都在DQS右边,这样做读训练的时候,可以搜索到DQ的完整窗口,提高了读训练的准确性,提升DDR的读性能。

图8:Read DQ skew training

用固件的训练方法获取读数据眼图(Read data eye)的优化值

读数据眼图训练通过延迟读DQS的方法,把读DQS放在DQ窗口的中间。目前最大的问题是固态技术协会标准对读数据眼图的读序列定义的比较简单,比如对于DDR4,定义的序列是01010101的固定序列。因为高速信号的符号间干扰以及信号反射,在不同的读序列的情况下DQ窗口是有差异的,所以采用简单固定的序列并不能很好地覆盖实际的使用场景,导致训练结果在实际工作时并不是一个优化值。

芯耀辉采用固件的训练方法,可以设置不同的范式(pattern),如PRBS范式、特殊设计的扫频范式等。显然此类范式能更好地反映数据通道的特性,因为它包含了高频、中频、低频信息,以及长0和长1带来的码间串扰等问题,可以获得较优的训练结果,从而得到一个能覆盖实际工作场景的可靠值。

二维训练模式下优化的参考电压(Vref)电压和地址线(CA)延迟

LPDDR3中引入了地址线训练,DRAM把采样到的地址信号通过数据通路反馈给DDR PHY,DDR PHY可以通过这个反馈去调节地址线的延迟。在LPDDR4中,还加入了地址线参考电压的训练,所以不仅需要调节地址线的延迟,还需要找到一个最优的参考电压值。传统使用硬件训练的方式在面对这种两个维度的训练时就会显得捉襟见肘,同时硬件算法也没法做得太复杂。

芯耀辉采用固件的二维训练模式,可以绘制出完整的以地址线延迟为横坐标和以参考电压为纵坐标的二维图像,从而得到较优的参考电压和对应的地址线延迟。

二维训练模式下优化的DQ参考电压和DQ延迟

DDR4的固态技术协会标准中引入了DQ参考电压,可是对于如何训练并没有给出说明和支持,所以大多数DDR PHY并不支持DDR4的DQ参考电压训练,只能配置一个固定参考电压值。

LPDDR4的固态技术协会标准增加了写DQS-DQ训练(调整写DQ相对于写DQS的相位)和DQ参考电压训练协议上的支持。

芯耀辉采用固件的方式,不仅支持了DDR4的DQ参考电压训练,同时对于LPDDR4的写DQS-DQ和DQ参考电压训练,也采用了固件的二维训练模式,绘制出完整的以DQ延迟为横坐标和以DQ参考电压为纵坐标的二维图像,在整个二维图像中找到较优的DQ参考电压和对应的DQ延迟。

总结

随着工艺节点的提升和DDR颗粒技术的演进,DDR的工作频率越来越高,DDR颗粒的训练要求也越来越高。同时对于DDR PHY来说,内部的模拟电路(FFE,DFE等)随着频率的提升也需要做各种高精度的训练。芯耀辉采用软硬结合的智能训练方法不仅可以支持DDR颗粒的各种必要的复杂训练,也同时可以支持DDR PHY内部模拟电路的各种训练。通过不断优化训练算法,持续挑战每一代DDR产品的速率极限。

责编:Amy Guan

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 车载通讯芯片厂商裕太微电子:华为投完,小米投 裕太微电子工商信息于8月31日发生变更,新增股东湖北小米长江产业基金合伙企业(有限合伙),上海浦东海望集成电路产业私募基金合伙企业(有限合伙)等,同时注册资本由778.13万元增加至812.24万元。值得注意的是,2019年10月,裕太微电子还获得了华为哈勃的投资。
  • 桌上型显示器面板竞争版图生变:三星退出,中国崛起 韩国面板巨头三星显示 (Samsung Display) 2020年上半年宣布计划在2020年年底前退出液晶面板市场,并将专注于扩大其QD-OLED业务。继乐金显示 (LG Display) 减产液晶面板电视产能之后,三星显示也在2021年二季度正式退出桌上型显示器面板市场。韩国企业“战略撤退”,意味着中国大陆将占据液晶面板市场主导……
  • TI多协议与FSI、SORTE高速低延迟接口助力伺服驱动工业 TI把多通信协议和控制集成在一个芯片上面,提供统一技术支持,不用再做其他的Licence授权和认证,这是芯片设计的一个超大杯应用。同时提供了高速低延迟的接口解决方案:FSI和SORTE,能够助力和加速伺服驱动工业多协议总线通信的部署。
  • 拆解Realme Q2i 5G手机:通过硬件控制成本,实现998的售价 首先,Q2i 的屏幕采用6.5英寸1600x720分辨率的LCD屏,720P分辨率的智能手机已经比较少见了,而且这块屏幕的生产厂商未知。再加上未知厂商电芯+OV主摄都进一步降低了整机成本……
  • 拜登政府或批准向华为出售汽车芯片,反华议员跳脚 路透社援引两位知情人士的消息称,美国政府已经批准向被列入实体清单的华为出售价值数亿美元的汽车零部件芯片的许可证申请。拜登总统入主白宫后,仍然坚持对华为的强硬政策,一律拒绝向华为出售可用于5G网络设备或器具的芯片的许可证申请。不过最近一段时间以来……
  • 中国智能手机厂商为Costdown,LTPS open cell采购量大增 采购Open cell对智能手机厂商有利,因为他们可以向LCD厂商支付最少的钱,并委托方案商进行整机方案开发,显示模组由模组厂制造,从而控制材料成本和LCD模块单元的设计形式。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • EMC对策产品: TDK推出用于移动设备 TDK株式会社(TSE:6762)推出用于移动设备的TCM0403M系列小型薄膜共模滤波器
  • 比科奇ORANIC板卡获行业大奖,5G小基 比科奇(Picocom)日前宣布:该公司荣获全球小基站论坛(SCF)一项大奖,其全新的ORANIC板卡赢得了全球小基站论坛(SCF)2021年度“小基站芯片及组件杰出创新金奖”。
  • 为什么DDR电源设计时需要VTT电源 往期精彩1、超全超详细Mos管元件特性及工作原理介绍;2、超详细开关电源芯片内部电路解析;3、70G硬件设计资料汇总分享;【友情推荐】4、分享一份老工程师(某为工作15年)经常使用的pcb企业封装库包
  • 国产半导体传来好消息,集成电路设备产量大涨,中芯国际也在加速! 我国不断提高芯片产业的竞争力,对很多国产半导体企业都采取较大的扶持力度,还计划不断提升芯片产能。但是提升芯片产能的前提是加大半导体设备产量。好消息是,我国集成电路设备产量大涨,国产芯片制造商中芯国际也
  • 惊艳!大佬用200个LED做了一个智能手表(附PCB) 最近在hackaday上逛的时候,看到一个还在制作中的非常炫酷的手表项目,分享给大家。背景作者正在造的这个ESP32 Pico Watch有WIFI、BT、Mesh、一个振动马达、一个RTC、4个按钮
  • 【求职必备干货】电子工程师面试笔试题汇总 ▲ 更多精彩内容 请点击上方蓝字关注我们吧!金九银十,又到一年毕业求职季,面对人生的第一份工作,既兴奋又担心。每位学子都希望能进入大厂历练,为自己的职业生涯打下坚实基础。每年这个时
  • AI技术专题之二|机器学习模型设计过程和MEMS MLC ‍‍‍‍‍‍‍‍人工智能与边缘计算的融合与突破,将重新定义未来科技的发展新方向,边缘机器学习已成为通往智能世界的发力点。想要不输在起跑线上吗?想获得更大的加速度吗?五大步骤,一个对策,意法半导体助你驾
  • 国产替代之痛,这款超高性价比的MCU堪称“翘楚”! MCU涨价缺货是埋在工程师心头的一根刺,从晶圆产能告急再到疫情天灾不断,MCU市场命途多舛。而究其市场国外产品占据超过70%,加之地缘政治摩擦加剧,国产化和国产替代成为当代电子必谈之需。记者获悉,从去
  • 一代国民神车落寞,宝马中国收购华晨中华工厂 点击蓝字关注我们据财经汽车报道,8月31日,华晨集团等12家企业实质合并重整案召开第二次债权人大会,会上共有三项议案,包括财产管理及变价方案、成立债权人委员会两项议案,以及核心议案宝马中国收购华晨中华
  • LED显示屏企业站上“新零售”赛道 2016年阿里云栖大会上,新零售这一概念被提出。何为新零售?简单来说,就是以数据为驱动,通过新科技发展和用户体验的升级,来改造零售业形态,其本质是通过线上销售和线下销售的相互融合,更好地提升顾客的购物
  • 如何将Flash模拟成EEPROM ↑点击上方蓝色字体,关注“嵌入式软件实战派”获得更多精彩内容。温馨提示:本文参考《EEPROM Emulation with Qorivva MPC55xx, MPC56xx, and MPC57xx
  • 半导体产业之污染控制(一) 这几节小编将为大家解释污染对器件工艺、器件性能和器件可靠性的影响,以及芯片生产区域存在的污染类型和主要的污染源。同时,也将对净化间规划、主要的污染控制方法和晶片表面的清洗工艺进行讨论。首先来看看什么是
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了