发表时间:2024-09-14 14:34:21
文章作者:小编
浏览次数:
AI领域再一次迎来了重大突破!
北京时间今日凌晨,OpenAI正式发布名为OpenAI o1的新模型,即之前所传的“草莓”(Strawberry)模型,该模型可以执行一些类似人类的推理任务,在回复用户询问前会“花更多时间思考”。
OpenAI的CEO萨姆·奥尔特曼(Sam Altman)称其为“新范式的开始”。“o1”新一代大模型能够解决多步骤问题,在复杂推理、数学和编程问题方面,能够像人类一样思考解决问题的过程。
相较于过往的大模型,OpenAI o1大模型的核心逻辑是通过学习大量数据集中的模式,进而预测单词生成的序列,严格意义上来讲并未真正理解客户提问。
Open AI此次发布的新一代大模型“o1”,可谓打破了我们对LLM固有水平的认知。“对于复杂的推理任务而言,这是一个重大进步,代表了人工智能能力的新水平,”Open AI表示。
会像人类一样“花时间思考”
Open AI发布的新一代大模型“o1”,在接收到用户询问后,在作出回答钱,会像人类一样“花时间思考”,用时约10—20秒,进而产生一个内部思路链,从而尝试不同的策略并识别自身的错误。
因具备更为强大到推理能力,因而“o1”在多个行业具有更多应用潜力,尤其是复杂的科学、数学和编程任务。
譬如,在处理物理、化学等问题时,“o1”的表现甚至和该领域的博士生水平不相上下;
再譬如,在国际数学奥林匹克的资格考试中,“o1”的正确率为83%,能够成功进入美国前500名学生的行列,而GPT-4o模型的正确率仅为13%;在编程能力比赛Codeforces中,“o1”模型拿到89%百分位的成绩,而GPT-4o只有11%。
*对复杂数学问题的思路链
未来,该模型还有更多潜在的应用场景,如医疗研究人员可利用该模型来标注细胞测序数据;物理学家可借助o1模型生成量子光学所需的复杂数学公式;软件开发者则可借助它来构建和执行复杂的工作流程等。
可以看出,AI的能力越来越强,可应用的场景也越来越多。但是现阶段,AI仍然有一定局限性,也无法应用到一些非常具体的经营管理场景或商业经营场景里。我们可以期待AI的未来,但现阶段,可能暂时还用不到AI工具,用的最多的仍是数字化系统工具,比如B2C商城系统、私域电商系统、小程序商城系统、分销商城系统等等。
多享有数是一家专注于数字化服务、系统开发、新媒体营销、农村电商的专业互联网公司,成立16年,助力5000+中小企业实现数字化转型升级。成都B2C商城系统开发,成都小程序商城系统开发,就找多享有数!
缺点与局限
作为“o1”大模型的最初始版本,其也有着明显的缺点与局限。
首先,其使用价格非常昂贵。
据悉,“o1”系列共包含三款模型:OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。这两款模型从今天开始对用户开放使用:
- OpenAI o1:高级推理模型,暂不对外开放;
- OpenAI o1-preview:这个版本更注重深度推理处理,每周可使用30次;
- OpenAI o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。
然而,OpenAI o1-preview版定价是每百万个输入tokens 15美元,每百万个输出tokens价格为60美元,分别是GPT-4o的3倍和4倍(一百万tokens大致相当于75万个英文单词)。
其次,该模型无法浏览实时网页、无法上传文件和图片、缺乏广泛的世界知识等。
目前,“o1”大模型只是一款“纯文字版”,暂时无法浏览网页信息以及上传文件和图片,这意味着它不具备ChatGPT的许多使用功能,在许多常见用例中不如GPT-4o那么强大,而且还有用量限制,o1-preview版每周上限为30条消息,o1-mini版每周上限为50条。
此外,“o1”大模型在很多领域的能力不如GPT-4o,譬如在关于世界的事实知识方面表现不佳;有的用例下推理能力较慢,需要更长的时间来回答问题;目前o1只是一个纯文本模型,缺乏针对特定文档进行推理,或者从网络收集实时信息的能力。
此外,让AI模型玩井字棋(Tic-Tac-Toe)一直被认为是个业界难题,拥有推理能力的“o1”大模型也还是会在这个游戏中出错,无法完全攻克技术难关。
- 09-18便利店、商超、购百、奥莱、电商等零售业态如何玩转会员经济?
- 09-18京东出手了,砸100亿元,天猫、抖音、美团、快手也有动作
- 09-14Open AI发布新一代大模型“o1”:会像人类一样“花时间思考”
- 09-14谁玩谁火,玩梗成了品牌营销的硬通货?
- 09-13微信抖音搜索框新增电商入口, 再造新引擎?
- 09-13私域是提供稳定增量的来源
- 09-12做私域,就像谈恋爱
- 09-12从 74 条数据,看 2024 年软件开发新趋势
- 09-11即时零售,电商平台们的“新战场”?
- 09-11保障数字化系统应用的四大策略
- 09-10淘宝、微信支付拆墙,互联网巨头从“流量为王”转向“用户至上”
- 09-10企业做数字化到底是好是坏?
- 09-09蚂蚁上线独立App“支小宝”,步入大模型应用竞争
- 09-09直播电商的下半场:头部主播“披荆斩棘”,新锐势力炒作不断
- 09-06重新思考数字化:从数字化生存,到数字化之后
- 09-06阿里与腾讯“世纪大和解”,互联网再无“世界大战”
- 09-05公众号【内容助推】内测,流量来了
- 09-058000字总结,一文看完今天的全渠道营销
- 09-04营销大变天,总裁都走进了直播间
- 09-04数字化,如何提升人效?