高效机器人拣选系统:莱迪思FPGA与结构光扫描技术的结合之道

原创 Latticesemi 2025-05-30 10:48


摘要



使用结构光三维扫描技术进行随机抓取在工厂自动化中发挥着重要作用。它使机器人能够从料箱中拾取具有随机姿态的已知物体,并将物体分类,以便进行下一步装配。本白皮书介绍了莱迪思FPGA如何赋能系统设计,特别是如何降低系统的BOM成本。通过集成莱迪思的FPGA解决方案,您可以构建一个经济高效的随机拣选系统。

01

结构光三维扫描

结构光三维扫描通过将网格或条纹等光图案投射到物体表面,来捕捉物体的三维形状。这些图案的变形由摄像头记录,并通过专用算法处理生成详细的三维模型(见图1)。

该技术广泛应用于工业设计、质量控制、增强现实游戏和医学成像等领域。与基于激光的三维扫描相比,结构光扫描仪使用LED或投影仪等非相干光源,可实现更快的数据采集,并消除了激光可能带来的安全隐患。然而,结构光扫描的精度可能受外部因素影响,包括环境光照条件和被扫描物体的反射特性。

将窄带光投射到三维表面时,会产生一条照明线,从投影仪以外的视角观察时,该照明线会呈现扭曲形态。通过分析这种扭曲可重建表面几何形状,这一技术被称为光切法。

一种更高效通用的方法是同时投射由多条条纹或任意条纹组成的图案。该方法可一次性获取大量数据点,显著提高扫描速度。从不同角度观察时,投射的图案会因物体表面形状而出现几何扭曲,从而实现精确的表面重建。

尽管存在多种结构光投射技术,但平行条纹图案是最常用的技术之一。通过分析这些条纹的位移,可准确确定表面细节的三维坐标。

图1:结构光3D扫描

02

随机料箱抓取


随机抓取是计算机视觉与机器人学的核心问题。其目标是让搭载传感器和摄像头的机器人,使用真空吸盘、平行夹爪或其他类型的机器人末端执行器,从料箱中拾取随机位姿的已知物体。这种拾取功能主要用于工厂,从随机堆叠物体的料箱中分拣出物体,以便进行下一步装配。

现代的随机料箱抓取取通常采用结构光三维扫描技术,获取每个物体的详细三维信息。系统从三维信息中恢复物体形状并确定其空间方位。计算机视觉在目标识别和抓取点计算中起主要作用。对于复杂物体,还会利用用户提供的CAD信息(如详细形状信息),通过几何匹配辅助目标检测。近年来,基于机器学习的目标检测与分割等方法被用于处理更复杂的情况。计算中的一个重要因素是识别物体的重叠情况,确保机械臂拾取的是未被其他物体遮挡的目标。否则,由于目标物体上方存在其他物体,抓取可能失败。基于计算结果,机械臂将物体拾取并移动至目标位置。

该解决方案通常由通过以太网连接的两个模块组成:传感器模块和计算模块。传感器模块向料箱投射结构光,并通过摄像头捕获反射图像。捕获的图像传输至具备强大计算资源(如CPUGPU)的计算模块,执行上述所有计算。最终目标坐标将被传输至机器人控制模块(见图2)。

2:传感器模块向料箱投射结构光

03

莱迪思的解决方案

在我们的解决方案中,我们通过以下方式对设计进行划分:传感器模块中的FPGA分担计算模块的计算任务,并通过发送一张编码图像而非一系列原始图像,降低两个模块之间的以太网连接带宽。这不仅加快了感知环节的速度,还降低了计算模块的物料成本(BOM)。

在传感器模块中,针对结构光三维扫描,FPGA生成图像序列并逐张发送至投影仪。发送一张图像后,FPGA触发摄像头传感器,采集与刚发送至投影仪的图像对应的料箱图像。这确保了逐帧同步,并支持每帧更换图像以实现快速扫描。

我们在生成的图像中使用的灰度二进制图案包括正、负、水平、垂直图案以及全白和全黑图案,图像数量为41张。摄像头捕获的图像序列通过MIPI CSI链路返回至FPGAFPGA将这些图像编码为10位编码图像,该图像可标识生成图像中对应像素的位置。此编码图像将传输至计算模块。这种编码方式显著降低了与计算模块之间的以太网链路带宽需求。例如,在1080p分辨率下,若发送原始图像需传输1920×1080×8b×41=680MB数据,编码图像仅需1920×1080×10b×2=41MB(减少16倍),这大幅降低了以太网链路的带宽要求。

在计算模块中,三角测量算法根据给定的编码图像生成深度图像。该深度图像用于目标检测(分割)和抓取点计算(见图3)。

3:莱迪思解决方案

为获取每个像素的深度信息,需对每个像素执行三角测量,这是高度重复的像素级计算,可并行处理。莱迪思FPGA可通过执行三角测量并生成深度图,将此任务从计算模块中分担出来。生成的深度图可传输至计算模块,从而降低计算模块的计算需求,减少计算资源的使用并降低物料成本(BOM)。或者,用户可在使用相同计算资源的同时拓展额外功能,因为三角测量部分已转移至FPGA。类似地,FPGA可执行全部或部分基于机器学习的目标检测与分割,进一步减轻计算模块的负担(见图4)。

完成编码图像生成任务的FPGA是莱迪思CrossLink™-NXCertus™-NX,而若需进一步分担任务,则需要莱迪思CertusPro™-NXAvant™Certus™-N2Nexus™ 2)系列FPGA。此外,系统需要HyperRAMLPDDR等外部存储器来存储采集的图像并生成编码图像;若要通过生成的深度图进一步分担计算任务,则需要配备LPDDR存储器。

莱迪思FPGA的小尺寸和低功耗特性使其能够集成于塑料外壳内,无需风扇、散热器等额外散热组件,从而实现小型化、低成本的传感器模块设计。

4:莱迪思FPGA的优势

作为验证相关概念和算法的开发平台,我们构建了一个概念验证演示系统。当前的概念验证演示系统基于通用投影仪(NEC NP-M300X LCD投影仪)和CPNX VVML开发板搭建,计算模块采用NVIDIA Jetson Orin Nano,机械臂则使用UFACTORY LITE6,通过Python代码进行控制。

通用投影仪的使用存在一定局限性。例如,投影仪会执行逐帧图像补偿以提升人眼观看清晰度,但这会影响图案形状和亮度,因此我们需要等待补偿效果消失,导致最多只能每隔一帧更换图像(而非每帧更换)。此外,投影仪的原生输入分辨率为 XGA1024×768),若输入1080p图像,投影仪内部的缩放器会产生抖动并破坏图案,因此演示中使用XGA分辨率。对于产品场景,建议采用DLP快速帧率投影仪(见图5)。

5:概念验证演示系统

04

结论

莱迪思FPGA支持基于结构光三维扫描的随机料箱抓取技术。莱迪思FPGA的使用能够降低两个模块的物料成本(BOM):
1
)计算模块(任务分担至FPGA
2
)传感器模块(塑料外壳内无需散热组件)


Latticesemi 莱迪思半导体(NASDAQ: LSCC)提供基于低功耗FPGA、视频ASSP、60 GHz毫米波无线技术以及各类IP的智能互连解决方案,服务于全球消费电子、通信、工业、计算和汽车市场。我们致力于帮助客户加速创新,构建一个更智能互连的世界。
评论
  • 想要UI更加美观灵动,实现一些高级动态效果是必不可少的。这一期我们利用Giraffe IDE的逻辑和功能的组合,来实现图标环形循环滑动效果。如何用Giraffe IDE实现图标环形循环动效教程使用tileview控件和image控件,将tileview控件按图片大小设置大小,并在编辑子界面中按顺序添加图片,打开无限循环模式。将左、右对应的image图片摆放至tilevie旁,将暂时不用显示的图片置底放至tileview后,如上图所示。        &nb
    冠显光电MicroOLED代理视涯 2025-06-26 10:23 9748浏览
  •   去年底,整理旧物,扔的扔了,留的留了,这不,十四个几十年前留下来的工业级小型排风扇,下图左上角处,又拿出来,下决心把它们再利用发挥余热。  呵呵,这回不是拆而是装了。怎么装呢?组装、固定、机架、接线,简单,也不简单,原则是一切都用手头现有废旧材料,争取做到一个不买!DIY,废物利用,如今时髦的话,以旧换新!摆上台面,找来木条,策划怎么做?  比一比,看一看,觉得合适,按尺寸锯开木条。  咋走线?想到了,在有限空间内弯转,从一个螺丝孔穿出来,整体拼凑整齐。   咋固定风扇呢?找来木片条,锯断,
    自做自受 2025-07-06 21:37 261浏览
  • 在万物互联浪潮席卷全球的时代背景下,数字气压传感器作为物联网环境感知层的核心硬件之一,正凭借精准、实时的数字化气压测量能力,快速消融着现实世界与数字世界之间的沟通壁垒,其不仅能为物联网终端提供与环境进行对话的“媒介语言”,还能与其他环境感知技术形成协同效应,是物联网社会实现高效沟通的基石之一。数字气压传感器主要通过检测压敏元件在不同环境气压下的电信号变化,实现对气压的测量,并能直接输出数字信号以满足物联网终端对气压数据的传输、储存与记录等需求。现阶段,由于数字气压传感器具备着低功耗、高精度、快速
    华普微HOPERF 2025-07-01 09:20 1550浏览
  • 曾经靠“砍一刀”撕裂传统电商格局的拼多多,如今疲态尽显。数据显示,拼多多今年第一季度实现营收957亿元,同比增长10%,市场预估1016亿元,相比预期低了近60亿元;经营利润为161亿元,相比去年同期下降38%;归属于普通股股东的净利润为147亿元,同比下降47%。与此同时,拼多多市值也坐上了“过山车”。去年市值一度突破 2180 亿美元,力压国内电商巨头阿里,今年(7月1日收盘)市值仅余 1497.59 亿美元,已不足阿里(市值2718.63亿美元)一半
    用户1742991715177 2025-07-05 14:24 221浏览
  • 现代人对于影音效果的追求持续增加,在多数影音产品中,HDMI是最为重要的接口,而HDMI 2.1中有一新增功能eARC可以透过HDMI线材来传输数字Audio,除了支持Dolby TrueHD、Atoms等声音格式外,也可以支持8声道喇叭,满足消费者对于声音的追求。新时代的高阶电视都具备支援eARC的功能,然而却有些号称支持的电视产品,因为在设计上的疏忽,造成eARC无法输出8声道Audio,以致eARC的功能大打折扣,对于花大钱欲享受高规格电视的消费者来说自然难以接受,对于该电视品牌也会产生负
    百佳泰测试实验室 2025-07-04 14:42 1958浏览
  • 在物联网无线通信领域,随着行业应用场景的不断拓宽,同一频段下的设备通信需求正呈指数级增长,然而这一增长趋势却与频谱资源的有限性形成了鲜明对立,信道拥挤、信号串扰与非线性失真等不良现象所造成的“通信压力”正在持续放大。从智能家居的设备互联到工业物联网的实时控制,从智慧楼宇的广域组网到智慧城市的海量数据传输,有限的频谱资源不仅需要满足不断增长的设备通信需求,还需要适配不同场景对速率、时延与可靠性等差异化要求。在此背景下,如何在有限的频谱资源中实现更为稳定的无线通信质量,已成为物联网行业发展路径中的核
    华普微HOPERF 2025-07-07 16:13 180浏览
  • 在数字化、自动化高速发展的今天,光电耦合器正以一种低调却不可或缺的方式,悄然改变着我们的生活。它不仅是电子电路中的“安全卫士”,更是连接信号世界的“桥梁”,凭借出色的电气隔离能力,为各类设备提供稳定可靠的信号传输保障。电气隔离——让系统更安全在工业控制系统中,安全始终是重中之重。光电耦合器通过光信号进行电气隔离,能够有效防止高压电流侵入低压控制电路。例如,在智能电网系统中,它广泛应用于电表与通信模块之间,确保数据传输的安全性,防止电网高压对低压设备造成冲击。在电动汽车的电池管理系统(BMS)中,
    腾恩科技-彭工 2025-07-05 13:56 248浏览
  • 北京贞光科技有限公司作为紫光国芯的核心代理商,贞光科技在车规级存储和工业控制领域深耕多年,凭借专业的技术服务能力为汽车电子、ADAS系统等高可靠性应用提供稳定供应保障。近期DDR4内存价格出现大幅上涨,引发市场广泛关注。这背后反映的是整个DRAM产业链的深层次变化,从上游芯片制造到下游应用市场,各个环节都在经历重新洗牌,国产供应链正面临前所未有的发展机遇。作为紫光国芯的核心代理商,贞光科技在车规级存储和工业控制领域深耕多年,凭借专业的技术服务能力为汽车电子、ADAS系统等高可靠性应用提供稳定供应
    贞光科技 2025-06-27 09:48 1458浏览
  • 工业物联网时代,作为一种普遍应用在汽车电子、工业控制与医疗器械等领域中的串行总线通信技术——CAN(Controller Area Network)总线基于消息广播模式,通过双绞线传输差分信号,是一种多主控(Multi-Master)的总线系统,具备极强的抗干扰能力、极低的传输延迟和高速数据传输性能。一种典型的CAN总线网络示意图在CAN总线通信过程中,CAN收发器作为物理层上的接口芯片,位于CAN控制器(MCU)和CAN总线之间,主要负责将来自CAN控制器(MCU)的数字信号与总线上的差分信号
    华普微HOPERF 2025-07-04 14:44 1842浏览
  • SPI概述ESP IDF中SPI LCD的相关API简单使用LVGL完整代码总结SPI概述当进入嵌入式行业开始,SPI总线是最需要且基础的知识了,它是高速全双工串行总线,可做到同时收发数据。时序和控制根据各家的芯片或者屏幕等设备的数据手册进行阅读和进行编程,比如总线模式就有四种,通过寄存器CPOL和CPHA配置模式CPOLCPHA数据采样时刻适用场景000SCK下降沿,第1个跳变沿采样多数传感器(如BME280)101SCK下降沿,第2个跳变沿采样部分ADC芯片210SCK上升沿,第1个跳变沿采
    二月半 2025-06-29 20:40 1393浏览
我要评论
1
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦