北京时间2月1日凌晨◈★◈,OpenAI发布全新推理模型o3-mini◈★◈。据介绍◈★◈,o3-mini是其推理模型系列中最新◈★◈、最具成本效益的模型◈★◈,包含low◈★◈、medium和high三个版本公交车多人运动◈★◈,已经上线了ChatGPT和API◈★◈。值得注意的是◈★◈,ChatGPT免费用户可以通过在消息编辑器中选择“推理(Reason)”或重新生成响应来试用o3-mini模型pp电子(中国)·官方网站◈★◈,这也是OpenAI首次向免费用户提供推理模型◈★◈。
此前◈★◈,DeepSeek因推出了性能良好◈★◈、开源且免费的V3和R1模型而受到广泛关注公交车多人运动pp电子(中国)·官方网站◈★◈,也由于低廉的模型训练成本而走出了一条独特的道路◈★◈,通过开源重构了全球的AI竞争格局◈★◈,使低成本创新成为颠覆行业的创新路径◈★◈。过去一周多的时间里pp电子(中国)·官方网站◈★◈,国内外大模型厂商从“紧急上线”新模型◈★◈,到降价公交车多人运动◈★◈、免费◈★◈,种种措施表明◈★◈,在DeepSeek的刺激下◈★◈,AI大模型行业的竞争正变得越来越激烈◈★◈。
据介绍◈★◈,o3-mini是其最新◈★◈、最具成本效益的模型◈★◈,复杂推理和对话能力显著提升◈★◈,在科学◈★◈、数学◈★◈、编程等领域的性能超越了o1模型◈★◈,并保持了低成本及低延迟的特点◈★◈。
具体来看◈★◈,o3-mini在GPQA Diamond(理化生)◈★◈、AIME2022-2024(数学)◈★◈、Codeforces ELO(编程)基准测试中◈★◈,得分分别为0.77◈★◈、0.80◈★◈、2036◈★◈,比肩或是超过了o1推理模型◈★◈。在中等(medium)推理能力下◈★◈,o3-mini在额外的数学和事实性评估中表现更为出色公交车多人运动◈★◈。同时◈★◈,o3-mini的平均响应速度为7.7秒◈★◈,比o1-mini的10.16秒平均响应速度快24%◈★◈。
值得注意的是◈★◈,DeepSeek的网页及移动应用端均实现了模型与网络的连接◈★◈,支持联网搜索功能◈★◈,而o1模型则尚未实现联网搜索功能◈★◈。另外◈★◈,与其他模型直接提供问题答案不同◈★◈,DeepSeek的R1推理模型可以向用户展示出具体的思考过程◈★◈。不少用户表示◈★◈,在与DeepSeek互动的过程中◈★◈,欣赏其思考的过程甚至比最终得到的答案更具有启发性◈★◈。
或是受DeepSeek的影响◈★◈,o3-mini可与联网搜索功能搭配使用◈★◈,并展示完整的思考过程◈★◈。奥特曼在其社交平台上介绍o3-mini时候不仅表示这是一款“聪明◈★◈、反应快速的模型”◈★◈,还专门强调◈★◈,“它能够搜索网页◈★◈,还可以展示搜索过程”◈★◈。
使用权限方面◈★◈,ChatGPT首次向所有用户免费提供推理模型◈★◈,用户可以通过在消息编辑器中选择“推理(Reason)”或重新生成响应来试用o3-mini模型◈★◈。ChatGPT Pro用户可以无限访问◈★◈,Plus和Team用户的速率限制从原来o1-mini的每天50条消息增加3倍到o3-mini的每天150条消息◈★◈。
在定价方面◈★◈,o3-mini每百万token的输入(缓存未命中)/输出价格为1.10美元/4.40美元◈★◈,比完整版o1便宜93%◈★◈。不过◈★◈,o3-mini的性价比或依然比不上DeepSeek◈★◈。作为对比◈★◈,DeepSeek的API提供的R1模型◈★◈,每百万token的输入(缓存未命中)/输出价格仅为0.55美元/2.19美元◈★◈。
美国知名播客主持人Lex Fridman在其个人社交平台上表示pp电子(中国)·官方网站◈★◈,虽然OpenAI的o3-mini表现不错◈★◈,但是DeepSeek的R1以更低成本实现了同等的性能◈★◈,并开创了开放模型透明度的先河◈★◈。
记者注意到◈★◈,早在几天以前◈★◈,奥特曼在回应DeepSeek的爆火时就指出◈★◈,DeepSeek R1让人印象深刻◈★◈,尤其考虑到成本方面◈★◈,“但我们无疑将带来更好的模型◈★◈,我们很快会发布新的模型”◈★◈。业内人士分析称公交车多人运动pp电子(中国)·官方网站◈★◈,o3-mini模型的紧急上线◈★◈,或表明OpenAI已感受到了来自竞争对手的压力◈★◈,需要加快发布性能更强的模型证明自身的领先优势◈★◈。
值得注意的是◈★◈,在o3-mini推出后◈★◈,OpenAI首席执行官山姆奥特曼与一众高管在reddit上回答网友的问题◈★◈。奥特曼承认◈★◈,中国竞争对手DeepSeek的崛起削弱了OpenAI的技术领先优势◈★◈。“DeepSeek是个非常优秀的模型◈★◈。我们将继续推出更优质的模型pp电子(中国)·官方网站◈★◈,但将无法维持往年的领先优势”◈★◈。
对于“更优质的模型”◈★◈,奥特曼透露◈★◈,下一代推理模型o3将在“数周至月内”发布◈★◈。但被业界期待了许久的旗舰模型GPT-5◈★◈,则尚无发布的时间表◈★◈。
除此以外公交车多人运动◈★◈,奥特曼罕见地对开源与闭源的问题进行了回应◈★◈。他指出◈★◈,OpenAI过去在开源方面站在“历史错误的一边”◈★◈,公司曾经开源部分模型◈★◈,但主要采用闭源的开发模式◈★◈,未来将重新制定开源战略◈★◈。
OpenAI首席产品官Kevin Well还表示◈★◈,公司正考虑将非前沿的旧模型如GPT-2◈★◈、GPT-3等开源◈★◈。
而就在1月29日凌晨◈★◈,阿里云才正式发布升级了通义千问旗舰版模型Qwen2.5-Max◈★◈,据介绍◈★◈,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果◈★◈,预训练数据超过20万亿tokens◈★◈,展现出极强劲的综合性能◈★◈,在多项公开主流模型评测基准上录得高分◈★◈,全面超越了包括DeepSeek-V3在内在目前全球领先的开源MoE模型以及最大的开源稠密模型◈★◈。
天风国际分析师郭明錤认为◈★◈,目前从生成式AI趋势中获利的方式◈★◈,主要还是“卖铲子”和降低成本◈★◈,而不是创造新业务或提升既有业务的附加值◈★◈。而DeepSeek-R1的定价策略公交车多人运动◈★◈,会带动生成式AI的整体使用成本下降◈★◈,这有助于增加AI算力需求公交车多人运动◈★◈,并且可以降低投资人对AI投资能否获利的疑虑◈★◈。不过◈★◈,使用量的提升程度能否抵消价格降低带来的影响仍然有待观察◈★◈。同时◈★◈,郭明錤表示◈★◈,只有大量部署者才会遇到Scaling law边际效益的放缓◈★◈,因此当边际效益再度加速时◈★◈,英伟达将依然是赢家◈★◈。电子元器件pp电子APPAI应用◈★◈。pp电子◈★◈。pp电子游戏◈★◈,pp电子游戏试玩◈★◈,
Copyright © 2012-2025 PP电子·(中国)官方网站 版权所有 非商用版本