GPT-4o基于GPT-4升级的最新版本,加入对文字、图片及影音方面的能力。GPT-4o可让使用者输入文字、图片、音讯等资讯后即时产生文字、图片、音讯的输出组合,像是分析数据建议图表、跟使用者聊聊所拍摄的照片。根据示范影片显示,GPT-4o能够与使用者进行即时互动,透过镜头画面来描述现场环境,甚至进一步的聊天,即便是交谈中被中断也能够像是跟真人一般继续回答。

Open AI表示GPT-4o可以在短至232毫秒的时间内回应使用者的提问(与人类对话时,人类的回应速度平均为320毫秒)。 它在英文和程式码上的表现与GPT-4 Turbo的效能相当,但在非英文上的效能显著提高,同时API的速度也更快,成本更降低50%。 与现有模型相比,GPT-4o在视觉和音讯理解方面会特别出色。

GPT-4o文字和图像功能今日起在ChatGPT中推出。 一般用户可免费使用,ChatGPT Plus会于未来几周内加入可以即时语音对话的新版语音模式GPT-4o alpha版。

除了手机版的ChatGPT,即日起也率先为Plus用户推出适用于macOS的桌面版App,Windows电脑版本预计今年稍晚推出。用户能够直接从电脑与ChatGPT进行语音对话,GPT-4o的新音讯和视讯功能将在未来推出。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
Moxa 高频宽乙太网路交换器登场 助力推动转型资料导向式工业应用