12月18日,以“新纪天工 开物焕彩——致敬开源的力量”为主题的重大科技成就发布会开源专场在国家科技传播中心举办。会上发布了中国算力网开源开放试验场、星辰语义大模型平台、书生大模型、“香山”开源高性能RISC-V处理器核等四项重要开源项目,并同步揭晓了2024年开源创新榜单。
书生大模型:领航大模型创新风潮
由上海人工智能实验室发布的书生大模型,实现了多模态大模型的重大突破。其中,书生·浦语2.5具备一百万词元的超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合。多模态大模型书生万象InternVL2.5支持图像、视频、文本、语音、三维、医疗多种模态。
书生大模型不仅服务于学术研究,也应用于产业界,如智能体开发、数字化平台建设等。上海人工智能实验室青年科学家陈恺表示,未来书生系列大模型将持续迭代模型并开源,实验室将保持开放,携手产学研,成为技术发展的连接器、放大器和加速器。
中国算力网开源开放试验场:赋能大模型创新
鹏城实验室、新一代人工智能产业技术创新战略联盟联合发布了中国算力网开源开放试验场。试验场可调度总算力超过5E Flops,面向全社会提供大规模普惠算力资源,惠及国内外AI开源开发者17万人。2025年,试验场计划提供超过100万卡时的普惠算力,加载超过500T的公共数据集用于预训练和微调。
算力作为新质生产力的代表,正逐渐成为衡量国力和生产力的重要标准。中国算力网开源开放试验场的发布,为大模型训练和创新提供了强有力的算力支撑。
星辰语义大模型:突破万亿参数大模型
中国电信集团CTO、首席科学家李学龙介绍,星辰语义大模型实现了国内首个万亿参数大模型的完整训练。该模型已完成从1B模型到万亿参数模型全尺寸开源,目前下载量达40多万次,有效推动智能政务、智能助理等多领域的智能化升级。
大模型训练本质上是数据工程管理,数据获取正在变得日益困难。闭源大模型公司将会遇到数据来源问题。相反,开源模型由于非营利性质,更容易获得社区和企业的数据支持。
“香山”开源高性能RISC-V处理器核:引领国产芯片创新
北京开源芯片研究院发布的“香山”开源高性能RISC-V处理器核,成为国际开源社区性能最强、最活跃的RISC-V处理器核。该项目源代码通过GitHub、GitLink等国内外开源托管平台,获得约5000个Stars、670个fork。
“香山”开源高性能RISC-V处理器核已完成三次流片,为芯片产业创新发展做出了卓越贡献。
展望与思考:大模型创新之路
专家表示,开源大模型代表了一种必然的趋势。在人工智能时代,开源的意义超越了代码本身。由于开源模型领域尚处于起步阶段,业界尚未形成统一标准,因此厘清AI开源模型的边界及确定哪些内容应当公开,仍需产业界共同探讨。
如何利用好国内平台和服务是开发者抓住大模型发展机遇的关键。随着更多相关平台在国内涌现,开发者将拥有更多机会参与大模型和AI应用的创新中。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/23/36801.shtml