近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

近日,曾因恶意攻击其实习公司字节跳动的模型训练集群,而被起诉索赔800万元人民币的前实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。因其戏剧性和涉及道德及职业行为的问题,引起了广泛的关注和讨论。

田柯宇为何被字节跳动起诉?

两个月前,字节跳动的大模型训练集群遭到北京大学实习生的恶意攻击,导致公司蒙受了巨大的损失。

据称,田柯宇本科毕业于北航软件学院,研究生就读于北大,师从王立威教授,研究兴趣为深度学习的优化与算法。

自2021年起,开始在字节跳动实习研究,具体包括超参数优化、强化学习算法、自监督的新型算法。

因为对团队内部的一些情况不满,出于泄愤的心理采取了报复行动。

他巧妙地利用了Hugging Face平台上用于加载检查点(checkpoint)文件的函数中的一个漏洞,制作了一个表面无害但实际上包含了恶意负载的检查点文件。通过这种方式,他实现了远程代码执行,能够篡改模型权重、调整训练参数或窃取模型数据。

根据知名博主“Jack Cui”的分析,该实习生可能使用的就是这种方法:通过注入恶意代码动态修改其他人的优化器设置,改变参数梯度的方向,并且在训练过程中随机插入暂停指令(sleep)。这使得模型在反向传播时计算出的梯度被篡改,从而朝着错误的方向进行优化;同时,插入的暂停指令也显著减缓了模型训练的速度。

面对舆论的质疑,田某本人曾出面否认与此事有关,声称自己在发布论文后已经从字节离职,真正的幕后黑手可能是趁其离职之际嫁祸于他。

然而,一个多月后, 媒体报道显示,法院正式受理了字节跳动针对前实习生田某某提起的诉讼。最终判决要求田某某赔偿侵权造成的损失800万元人民币及合理费用2万元,并公开道歉。

字节官方进一步澄清,此次受到破坏的是研究项目,而非商业化的正式项目或公司的大型模型业务。

结果,这名实习生不仅被字节跳动辞退,而且案件也被移交至其所在学校处理。

最佳论文说了啥?

据悉,这篇NeurIPS 2024第六高分的论文(7,8,8,8)是田柯宇在字节跳动商业化技术部门实习期间,与团队合作发表的,题目为《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》(视觉自回归建模:通过Next-Scale预测生成可扩展图像)。

该研究重新定义了图像上的自回归学习,采用了从粗到细的“下一个尺度预测”或“下一个分辨率预测”的方法,而非传统的光栅扫描“下一个token预测”。这种多尺度的方法不仅模拟了人类感知图像的过程,即先捕获全局结构再逐步添加局部细节,而且在多个方面超越了当前主流的扩散模型。

根据论文报告,在ImageNet 256×256条件生成基准测试中,新模型——视觉自回归建模(VAR),将Fréchet Inception距离(FID)从18.65降低到了1.73,并且Inception得分(IS)从80.4提高到了350.2。此外,推理速度提高了20倍,展示了显著的性能提升和效率改进。

值得注意的是,VAR模型还在数据效率、零样本泛化能力以及下游任务应用等方面表现优异。例如,在图像修复、外延和编辑等任务中也展现了其价值。为了进一步推动这一领域的研究,田柯宇团队已将所有模型和代码开源至GitHub平台,获得了超过4.4k的星标关注。

尽管田柯宇因早前对实习公司的恶意攻击行为而面临法律诉讼,此次获奖无疑彰显了他的学术才能和技术实力。此事件也引发了关于个人行为与职业成就之间关系的讨论。

责编:Demi
阅读全文,请先
您可能感兴趣
很多人以为,今年CES上老黄演讲的主角是GeForce显卡,但其实是他手里握有的机器人相关的“时间宝石”...
OpenAI认为,芯片、数据、能源和人才是赢得人工智能的关键,且建议美国政府大幅增加对这些领域的投资。
索尼新专利利用人工智能(AI)技术来预测玩家的操作输入,从而显著减少在线游戏中常见的延迟问题。这项创新技术被称为“定时输入/动作释放”,通过智能AI模型提前判断玩家的意图,并在实际操作完成之前执行相应的指令,从而提升游戏的流畅度和响应速度......
目前,这些故障主要影响了首批搭载Blackwell芯片的机架,从而引发了客户的担忧。其中,微软、亚马逊网络服务公司(AWS)、谷歌和Meta这四大主要客户已经削减了对Blackwell GB200机架的订单。
最近华硕在景德镇召开了一场新品发布会,而这次发布的AI PC大概能代表2025一整年的AI PC走向...
人类的发明,即工程系统,依赖于物理学和数学基本原理,如麦克斯韦方程、量子力学和信息论等,以实现特定目标。然而,随着工程系统复杂性和规模迅速增长,其子组件的功能可能呈现出非线性特性,这使得基于第一原理的设计方法受到限制。
• 2024欧洲电动汽车销售遭遇增长瓶颈,多家车企将面临因无法满足欧七排放标准而带来的巨额罚款风险。 • 汽车厂商将电动汽车销售贡献作为降低旗下所有车辆平均排放量的关键。 • 汽车制造商需要解决消费者对电动汽车价格高、相关保险费和充电体验差的看法,以提高电动汽车的销量。
• 2024 年第三季度,全球智能手机市场同比增长 2%,出货量达到 3.07 亿部。 • 全球智能手机收入同比增长 10%,平均售价增长 7%。收入和平均售价均创下历史新高。 • 三星在出货量方面继续领跑市场,占据 19% 的销量份额。 • 苹果在营收方面领先,并创下了其历年第三季度出货量、收入和平均售价的最高记录。 • 小米位居第三,收入增长超过出货量增长比例,而 OPPO 则位居第四。vivo 在前五大手机品牌厂商 中同比增长最快。
芯联集成发布2024年全年业绩预告,多项关键指标继续保持高速增长,均呈现出积极向好态势。
廿载峥嵘追芯路,求实鼎新启新程。2025 年 1 月 10 日,轻寒料峭难掩勃勃生机,以 “新时代,大有可为” 为主题,大普技术二十周年庆典暨乔迁仪式于东莞市松山湖圆满举行。
2022年下半年以来,需求下降,芯片价格跳水,芯片行情趋向寒冷,拼价格、拼服务、拼账期成为常态,持续的低迷之下,芯片人都开始靠省钱过日子。同时,我们发现,行情冷淡的时候,订货、配单、PPV(Purch
  中宇联云计算服务(上海)有限公司掌门人康俊燕,深耕通信领域多年,是“云边端”领域绝对的资深专家。不过,他所在意的,不是用新技术去替代旧技术,而是如何让新技术与旧技术更好地融合,
1月14日,OPPO、小米分别与松下控股就手机使用的蜂窝通信标准必要专利签署了一项全球专利交叉许可协议。与此同时,松下控股撤回了 2023 年对 OPPO 和小米在中国和欧洲提起的诉讼。松下控股表示,
我是芯片超人花姐,入行20年,有40W+芯片行业粉丝。有很多不方便公开发公众号的,关于芯片买卖、关于资源链接等,我会分享在朋友圈。扫码加我本人微信👇年末了,大家都忙着业务收尾,好安心回家过年。但是最近
1月15日,小米公司在韩国首尔举行了首次发布会,正式推出其旗舰手机,标志着小米正式进军韩国市场并开启业务运营。           小米在发布会上展示了两款最新的智能手机机型,分别为小米 14T 和红
1月15日晚,“为中国经济点赞——企业家之夜”在北京举行。地平线创始人、CEO余凯出席并发表演讲,余凯表示,地平线是中国现在最大规模的智能汽车、智能驾驶芯片跟软件方案的供应商。简而言之,汽车未来是四个
 智能汽车网络与数据安全新媒体 转眼间,2024年已经落下帷幕,它终于过去了,这或许是很多汽车网安从业者失眠最多的一年。在降本增效已成为行业常态的大背景下,经济下行、市场内卷、技术革新、强标发布等多重
遵循大赛的宗旨和既定流程,2025年1月13日上午9:30,赛前培训在电子信息专业国家级实验教学中心(南京大学)丙409顺利开展。本次大赛成功吸引了来自电子学院、物理学院、集成电路学院以及毓琇书院的4
 △广告 与正文无关 据昆山发布1月14日消息,江苏省昆山高新区的群启科技厂区目前二期厂房已进入主体建设阶段,预计2月将完成厂房主体结构的封顶作业。群启科技项目由鼎鑫电子投资建设总投资52亿元总建筑面
近日,野村证券在报告中指出,英伟达因多项产品需求放缓,将大福削减在台积电、联电等CoWoS-S订单量高达80%,预计将导致台积电营收减少1%至2%。野村半导体产业分析师郑明宗指出,英伟达Hopper平