Meta卷出70B神兽反超405B,谷歌马斯克争宠
大模型竞赛愈演愈烈
12月伊始,大模型界迎来了一场激烈的竞争狂欢。Meta、谷歌、马斯克等科技巨头纷纷出招,推出了各自的最新大模型成果。
Meta:Llama 3.3 横空出世
Meta在悄无声息中发布了Llama 3.3,令人意外的是,这个只有70B参数的模型却展现出了惊人的性能。在多项任务表现上,它甚至超越了此前发布的405B版本Llama 3.1。
更令人瞩目的是,Llama 3.3的成本大幅降低。在Meta合作的平台上,其使用成本仅为Llama 3.1 405B的十分之一,这无疑将降低大模型的应用门槛。
Meta解释,Llama 3.3的突破性进展得益于后训练技术的最新应用,包括在线偏好优化。
谷歌:Gemini 登顶榜首
适逢其一岁生日,谷歌也推出了Gemini 1206的新版本。此次更新直接将Gemini送上了lmsys大模型竞技场的榜首,不仅在总成绩上夺冠,在困难提示词、代码、数学、创意写作等各个单项上也均排名第一。
值得注意的是,Gemini此前曾短暂登顶,但后来被OpenAI的GPT-4o超越。如今,最新版本的Gemini再次重回榜首,彰显了谷歌在大模型领域的持续发力。
马斯克:Grok 3 蓄势待发
除了Meta和谷歌,马斯克的xAI也备受关注。有消息称,备受期待的Grok 3即将在本月发布。此前用于测试的Grok 2 mini已消失,这被认为是Grok 3即将登场的信号。
此外,Grok现已免费开放使用,但免费用户的使用量受到限制。当向Grok询问自己时,它表示Grok 3计划在本月上线。
年末大模型争霸
在这个大模型发布密集的12月,各大科技巨头争相推出各自的最新成果,共同推动着大模型领域的发展。
有业内人士表示,Meta的Llama 3.3以70B参数实现405B的效果,谷歌的Gemini 1206夺得竞技场榜首,马斯克的Grok 3也蓄势待发,这将是一场精彩纷呈的年末大模型争霸。
而在这场竞赛中,成本、性能、易用性等因素将成为影响大模型应用的关键要素。究竟谁能在这场博弈中拔得头筹,我们拭目以待。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/11/26553.shtml