ChatGPT王炸升级,OpenAI会成为下一个苹果吗?

发布时间:2023-11-07 16:27:55 · 责任编辑:字母汇 · 浏览量:69 次

原标题《ChatGPT又变强了,OpenAI会变成下一个苹果吗?》

“今天,有大约200万开发者在使用我们的API进行各种用例的开发。超过92%的财富500强公司正在使用我们的产品进行构建,而现在ChatGPT每周活跃用户大约有1亿。”

北京时间11月7日凌晨,在OpenAI的首次开发者大会上,Sam Altman公布了过去一年中OpenAI的骄人成绩。

如会前流传的消息,本次大会上推出了ChatGPT的最新版本GPT-4 Turbo,以及众多全新功能。更重要的是,OpenAI宣布要围绕GPT打造AI平台,推出GPT Store,并提出了GPTs的概念,用户可以利用GPT Builder工具,创建自己的GPT。

从ChatGPT被比喻为AI的iPhone时刻,恐怕Sam Altman就已经把目标瞄准了苹果。不过,他的野心更大,不仅要把ChatGPT做成下一个iOS,还要进一步加强与用户的绑定,让每个用户都有机会成为开发者。

王炸:GPT-4 Turbo

本次发布的LLM(大语言模型)更新主要包括:

  • 最新的GPT-4 Turbo,支持128k上下文窗口,且价格更低,输出更快。
  • 全新的Assistants API,使开发人员更容易构建自己的人工智能应用程序。
  • 新的多模态功能,包括视觉、图像创建(DALL·E 3)和文本转语音(TTS)。
OpenAI开发者大会的发布的重要更新
OpenAI开发者大会的发布的重要更新

长上下文

长上下文正在成为百模大战的“主战场”。对比众多新模型,GPT-4的32k token上下文窗口已不那么出色。此次GPT-4 Turbo更新的上下文窗口达到128k,是GPT-4的四倍,且超过了竞对Anthropic此前推出的100k token的Claude 2。

Sam Altman在演示中称128k token大约相当于300页纸的文字量,英国版的《哈利·波特与魔法石》差不多就是300页,指环王三部曲平均每本是400页。

不过,GPT-4 Turbo的上下文长度也并非最长。一周前,百川智能发布的Baichuan2-192K,上下文窗口长度为192K,能够处理约35万个汉字。

开发助手

OpenAI此次更新中,着重面向开发者推出了Assistant API,使开发者能在应用中集成类似代理的AI体验。

这个API允许AI助手执行具体任务,调用模型和工具,并处理一些复杂的编程和数据处理工作。它支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。

助手API具有持久化线程功能,简化了状态管理,并允许调用开发者定义的函数。此外,它还提供了代码解释器和检索工具,可在外部数据上运行和检索信息。数据保护方面,开发者可自主管理其传递给API的数据。现在,开发者可以通过助手API游乐场,无需编码进行测试。

此外,OpenAI对函数调用进行了更新,现在模型可以在单个消息中调用多个函数,并更准确地返回正确的函数参数。GPT-4 Turbo在遵循指令生成特定格式时表现更佳,并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外,通过新的seed参数,模型可以产生可重现的输出,有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能,以便在构建“自动完成”等功能时使用。

知识更新

GPT-4的知识库更新到2023年4月。目前ChatGPT中使用的GPT-4模型,已经将知识库更新到了2023年4月,不过GPT-3.5的知识库仍然停留在2022年1月。

新的多模态模型

在多模态能力方面,GPT-4 Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。

开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E 3上线之后,ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。

此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。

价格更低,输出更快

“在模型持续的迭代中,我们的价格也在不断下降。”Sam Altman介绍说,相比于GPT-4,GPT-4 Turbo的输入价格只有1/3,0.01美元每1000 token;输出价格为0.03美元每 1000 token,只有原来的1/2。而内容生成的速度,提高了2倍。

又一个iPhone时刻:GPT Store

在ChatGPT插件上线的时候,就有很多人将其比喻为安卓市场或是iOS的App Store。如今,OpenAI真的推出了AI版本的App Store——GPT Store。

用户可以直接创建ChatGPT的自定义版本,在开发者大会现场,两位OpenAI工作人员现场演示了GPT的构建方法。

OpenAI工作人员Jessica shay现场演示了利用GPT Builder构建一个能与行程表互动的 GPTs。并以对话的形式命令 GPT 给 Sam Altman 发信息, Altman也在现场接收到了这条信息。

另一个更加专业的演示则是OpenAI 的工作人员现场演示Assistants API的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记出来。

Sam Altman表示OpenAI 将会在本月底上线 GPT Store,开发者可以通过GPT Store分享、发布自己的 GPTs。此外,GPT Store产生的收入OpenAI也将按一定比例与开发者分成,不过具体的分配方案还尚未公开。

关于钱和微软

在现场的Assistants API演示过程中,OpenAI工作人员开放了一个现场抽奖,第一波抽奖是随机选了5个到场工程师每人发了500美元的开发者额度。第二波则直接给到场的900多名软件开发人员及参会嘉宾每人发了500美元额度。

看似“撒币”的行为,其实对于OpenAI来说,也没有特别大方,因为API额度消耗的速度对于正常开发者来说,实在是太快了。多位开发者曾在OpenAI社区中表达了OpenAI发放的120美元的开发者试用优惠额度很快就会用光。

开发者zolika84在测试语音识别whisper-api时,90分钟就用掉了120美元额度
开发者zolika84在测试语音识别whisper-api时,90分钟就用掉了120美元额度

过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。

一方面,OpenAI需要支付大量的算力和研发成本;另一方面,还要为未来不确定的法律问题做准备。

本次大会,OpenAI推出了copyright shield功能,用于保护用户不受到版权问题困扰,不光从技术上规避版权风险,当用户遇到版权问题时OpenAI也会协助解决。

过去几个月中,OpenAI一直被美国的众多版权所有者联合维权,多家出版集团都在向OpenAI伸手要钱。在版权问题方面,未来的商业化推广道路需要有庞大的资金支持。在美国的法律环境下,要推出这样一项服务,OpenAI大概率也已经盘算好了败诉后的退路。

说到钱,就不得不提到OpenAI一直以来的大金主:微软。坊间一直流传着两家不合的传闻。Sam Altman的演讲中,只邀请了微软CEO Satya Nadella一个嘉宾,似乎是在向外界证明OpenAI和微软的无间合作。

在演讲中,Sam Altman直白地问Satya Nadella:微软和OpenAI的合作关系怎么样?

Satya Nadella幽默地回答说:“事实上,我记得你第一次向我伸出手时说,‘嘿,你有一些 Azure 积分吗’,比起那时,我们已经取得了很大的进步。”

微软始终是基础设施提供者,赚的是基础设施的钱。Satya Nadella反复强调:“我们的首要任务是构建最好的系统,以便你可以构建最好的模型,然后将其全部提供给开发人员。”

不过,Satya Nadella并没有否认微软开发团队在AI方面的研究工作,他表示:“我们自己也是开发者,我们也在构建产品。”

出品|虎嗅科技组 作者|齐健 编辑|王一鹏 头图|OpenAI