荣誉与背叛:字节AI算法荣誉之战
在2024年12月3日的NeurIPS大会上,一场颇具戏剧性的事件成为人们关注的焦点。北京大学研究生田柯宇凭借其在视觉生成领域的开创性工作获得了大会最佳论文奖,然而,就在颁奖当天,主办方大概率会面对一张空椅子,因为获奖者田柯宇正面临着字节跳动八百万元的诉讼,原因是“涉嫌破坏其AI训练系统”。
田柯宇拥有着亮眼的学术履历,本科毕业于北京航空航天大学软件学院,随后进入北京大学攻读研究生,师从知名学者王立威教授。他在深度学习优化与算法领域颇有建树,在攻读学位期间就已在多个顶级会议发表论文,其中包括ICLR 2023的Spotlight论文《Spark:Designing BERT for Convolutional Networks》。
2021年,田柯宇开始了在字节跳动商业化技术部门的实习。在这里,他参与了一个雄心勃勃的项目:开发新一代的视觉生成模型。这个后来被命名为VAR(Visual Autoregressive Modeling)的项目,试图彻底改变AI生成图像的方式。
然而,就在今年10月18日,网上开始流传字节实习生“投毒”大模型的聊天截图,给公司造成了极大损失。经过调查,矛头很快就指向了田柯宇。
据知情人士描绘,田柯宇在两个月的时间里,系统性地破坏了集群代码,导致近30位同事的工作成果付诸东流。所有的日志记录和系统审查都指向一个不容辩驳的事实。
10月21日,字节跳动内部调查后明确此事为田柯宇所为。事件曝光后,田柯宇试图自证清白,声称真正的破坏者另有其人。然而,这种“甩锅”行为很快被字节内部人士予以驳斥。
字节跳动最初出于对田柯宇在读博士身份的考虑,将其辞退并交由校方处理。然而,田柯宇后续多次否认指控,甚至报警称自己是造谣受害者。这种拒不认错、反咬一口的态度,最终耗尽了字节的耐心。
最终,字节跳动决定通过法律途径追责,以儆效尤,防止类似事件重演。11月27日,字节跳动起诉前实习生田某某篡改代码攻击公司内部模型训练一案,获北京市海淀区人民法院正式受理。字节跳动请求法院判令田某某赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。
但矛盾之处在于,田柯宇获奖的这篇论文正是诞生于字节跳动实验室。论文的五位作者中,有四位都是来自于字节,而田柯宇是第一作者。
这篇名为《视觉自回归建模:基于下一尺度预测的可扩展图像生成》的论文,将图像生成方式进行了重大突破。它采用了一种更接近人类直觉的方法,先勾勒出大致轮廓,再逐步添加细节。
在ImageNet 256×256基准测试中,VAR将图像质量评估指标FID从18.65提升至1.73,生成速度提高了20倍。更重要的是,VAR展现出此前只在大型语言模型中观察到的特征:清晰的幂律缩放和零样本泛化能力。
田柯宇的论文为字节跳动带来了巨大的荣誉,但与此同时,田柯宇破坏训练系统事件也给公司造成了严重的打击。
对于字节跳动而言,田柯宇事件暴露出公司在核心技术安全管控上的致命漏洞。对于田柯宇而言,荣誉与背叛的纠葛将在他的人生轨迹上留下难以磨灭的印记。
而整个事件的背后,也折射出科技企业在追求技术突破和保护自身利益之间的困境。在AI技术高速发展的时代,如何实现技术创新与企业安全共赢,成为摆在所有科技企业面前的一道难题。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/07/22694.shtml