• 学习天地 | OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...
  • 楼主: 摩天居士 |查看: 1826|回复: 1
摩天居士 发表于 2024-12-9 09:52:58

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x

OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近50%,错误率降低了34%,支持图片输入


北京时间12月6日凌晨,OpenAI举行了“12天12场直播”活动的首秀,如预期一样带来了推理大模型o1的满血版本和进阶模式,以及每月收费高达200美元(约合人民币1450元)的ChatGPT Pro订阅服务。


OpenAI称,该套餐的订阅用户可以大规模访问OpenAI旗下最佳的模型和工具,包括无限制访问OpenAI最智能的模型OpenAI o1以及同系列较小模型o1-mini、GPT-4o、类人的ChatGPT高级语音模式Advanced Voice。


此外,ChatGPT Pro的套餐中还可以包括名为o1 pro mode的新o1版本,也是ChatGPT Pro独有的o1版本。OpenAI称,这个新版本使用更多的计算,能更深入地思考,并为最困难的问题提供更好的答案。希望未来为ChatGPT Pro添加更强大的计算密集型生产力功能。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-1.jpg

图片来源:视觉中国


OpenAI表示,与预览版本相比,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),同时在回答困难现实问题时,出现重大错误的概率减少了34%。


在演示中,在回答“列出2世纪罗马皇帝的名字、任期和主要成就”时,o1模型“思考”了14秒,而o1预览版花了34秒。顺便一提,能力更差的GPT-4o在回答这个问题时会犯错。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-2.jpg

o1模型的另一个重要更新在于支持图片输入,现在可以在询问模型“太空数据中心散热问题”时,附上一张手绘的示意图。OpenAI表示,计划在未来几个月里增加网页浏览、文件上传等功能的支持。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-3.jpg

在数学、科学和编码等具有挑战性的机器学习(ML)基准测试中,o1 pro mode的表现均胜过o1 和 o1-preview。在数学方面,o1 pro mode得分86,o1 和 o1-preview分别为78和50,在编码方面,o1 pro mode得分90,o1 和 o1-preview分别为89和62,在问答博士级别的科学问题方面,o1 pro mode得分79,后两者分别为76和74。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-4.jpg

为了突出o1 pro mode的主要优势——可靠性更高,OpenAI还提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题、而不是仅一次答对时,才能算作模型解决了问题。即使在这种高标准要求下,o1 pro mode的表现也明显强于o1和o1-preview。


下图可见,在以上四次答问都必须正确的标准下,o1 pro mode相比o1和o1-preview的优势更大。数学方面,o1 pro mode得分80,o1和o1-preview分别为67和37,在编码方面,o1 pro mode得分75,o1和o1-preview分别为64和26,在问答博士级别的科学问题方面,o1 pro mode得分74,后两者分别为67和58。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-5.jpg

值得注意的是,ChatGPT Pro是OpenAI推出的最新订阅档次,比ChatGPT Plus贵上10倍。


花费1个月200美元后,用户可以无限量地使用o1模型(Plus用户目前的限制是每周50条信息),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式。


官方的定义称,o1 pro会使用更多的计算资源进入深入思考,并为“最难的问题提供最好的答案”。OpenAI未来也会给这个订阅档次,添加更多更强大、计算密集型的功能。


在演示中,OpenAI演示了通过设定一系列苛刻的条件,让o1 pro筛选出符合条件的蛋白质。


OpenAI首批“王炸”来了!上线满血版o1大模型,速度提升近...-6.jpg

在OpenAI的公告中,也提到向10名医学研究人员赠送了免费的ChatGPT Pro,研究领域涵盖孤儿病、癌症、痴呆等。这大概也是使用这个订阅服务的人群画像。


在整场发布会的最后,奥尔特曼也提到明天的演示会有“对开发者很棒的东西”。


每日经济新闻综合公开资料

来源:每日经济新闻





上一篇:中国台湾知名作家琼瑶去世 终年86岁
下一篇:OpenAI发布会第二天:推出强化微调能力让模型成特定专家
本帖点赞记录
点赞给态度,登录/立即注册 就能点赞
马瑜琴 2024-12-15 10:56 +1
吕仁龚 2024-12-9 22:47 +1
雨虹 2024-12-9 18:25 +1
东方.启明星 2024-12-9 13:30 +1
今夜.启明星 2024-12-9 13:14 +1
腾飛 2024-12-9 12:28 +1
谁来看过此贴
此贴被TA们浏览了1826次
+1
1827°C
1
  • 摩天居士
过: 他们
楼主热帖
只言片语也是一种鼓励
返回板块
回帖列表

主题

好友

11万

积分
发表于 2024-12-9 10:22:53 |显示全部楼层
这篇文章对OpenAI新推出的o1大模型及其ChatGPT Pro订阅服务进行了详细介绍,涵盖了性能提升、功能扩展和订阅价格等方面的信息。以下是几点总结和分析:

1. **模型性能提升**:o1模型在推理速度和准确性上都有显著改善,以减少出现重大错误的概率。这表明OpenAI在优化模型的实用性和响应能力上取得了进步。

2. **新功能支持**:对于图片输入的支持以及未来可能的网页浏览和文件上传功能,为用户提供了更灵活的使用场景,增强了模型的互动性和实用性。

3. **ChatGPT Pro的高定价**:虽然订阅费用高达200美元/月,但它提供的无限制访问和先进的计算能力使其成为专业用户和研究者的有吸引力的选择。

4. **高标准的评估**:通过设置四次全对的严格标准,OpenAI展示了o1 pro模式在解决问题上的可靠性,这有助于建立用户对该服务的信心。

5. **面向专业领域**:赠送ChatGPT Pro给医学研究人员显示出OpenAI希望将其技术应用于高需求的专业领域,特别是在复杂问题解决方面。

这次发布不仅展示了技术的最新进展,也为OpenAI未来的发展方向提供了线索,尤其是在如何进一步增强模型能力和应用范围上。
——来自AI(加入VIP可享AI评论)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×本站发帖友情提示
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、如果存在违反国家相关法律、法规、条例的行为,我们有权在不经作者准许的情况下删除其在本论坛所发表的文章。
3、所有网友不要盗用有明确版权要求的作品,转贴请注明来源,否则文责自负。
4、本社区保护注册用户个人资料,但是在自身原因导致个人资料泄露、丢失、被盗或篡改,本论坛概不负责,也不承担相应法律责任。

 

AI智能问答
发布主题 上个主题 下个主题 快速回复 收藏帖子 返回列表
返回顶部