OpenAI推出o1模型:错误率下降34%,速度提升50%
12月6日凌晨2点,OpenAI在12天的工作日中首次进行了直播。此次直播中,OpenAI推出了新的o1模型以及订阅服务ChatGPT Pro。从今天起,o1模型将取代o1-preview模型,ChatGPT Plus和Pro订阅用户都可以使用。
今年9月,OpenAI正式发布了o1大模型,该模型可以解决科学、代码和数学等领域复杂的问题。然而,当时只推出了o1-preview和o1 mini两个版本,o1模型的全部功能尚未解锁。这次发布的o1模型在智能化、多模态输入和思考速度方面都有了显著提升。
OpenAI联合创始人兼首席执行官Sam Altman表示,与o1-preview版本相比,o1模型的重大错误率降低了约34%,思考速度提高了约50%。
Altman表示,o1与其他模型的不同之处在于,它在每次回答问题之前都会思考,这使其能够提供比其他模型更详细、更准确的答案。
o1的智能性体现在它在数学等复杂问题上具有更高的准确性。据悉,o1模型解答AIME 2024数学竞赛和博士级科学问题的准确率分别达到78.3%和75.6%,比o1-Preview版本分别提高了28.3%和1.5%。
在回答速度方面,o1也有所提升。在离线测试中,o1的平均响应速度比o1预览版本快了约60%。在直播中,OpenAI员工提出一个问题,让o1和o1-Preview列举公元2世纪的罗马皇帝并简述他们的生平。结果显示,o1只花了约14秒就回答了这个问题,而o1-Preview则用了33秒。
OpenAI还注意到,之前的模型对所有问题都有较长的响应时间,他们已经解决了这个问题。现在,如果你提出一个简单的问题,o1会快速回答;如果你提出一个复杂的问题,它会花更多的时间思考。
此外,o1还增加了多模态输入功能,能够同时处理图像和文本内容并进行推理。
OpenAI展示了一张手绘的A4纸草图,上面画着太阳、冷却系统等物体以及不同的数值,并用手机拍照上传给了o1。o1在没有任何提示的情况下,生成了用户可能想要询问的问题并进行了自动回答。然后,在不到10秒的时间内,o1不仅成功理解了草图中的问题要求,还意识到缺少参数,并通过自我推理给出了正确的答案。
为了满足用户不受调用限制使用模型的需求,OpenAI此次推出了新的订阅机制ChatGPT Pro。用户每月只需支付200美元,即可无限制地使用更强大的o1模型——o1 Pro。
OpenAI展示了o1-Preview、o1和o1 Pro在数学竞赛、代码竞赛和博士级科学问题上回答差异。在每个问题被询问四次后,o1 Pro的可靠准确率最高,分别为80.0%、74.9%和74.2%。
在直播中,OpenAI提出了一个o1-Preview回答错误的化学问题,要求o1 Pro找到符合特定标准的蛋白质。结果显示,o1 Pro只用了53秒就完成了这个问题,并允许用户查看思考过程。
OpenAI表示,他们的计划是让o1 Pro支持更多的高计算密集型任务,以便处理更长和更复杂的任务。此外,o1 Pro还将增加网络浏览、文件上传以及增强的API支持(例如结构化输出、函数调用和图像理解)等功能。
原创文章,作者:睿鸿在线,如若转载,请注明出处:https://mip.orihonor.com/2024/12/09/24022.shtml