Openai Sora是GPT-5 吗?GPT-5 功能分析

GPT452024-02-21 23:00:2673

OpenAI,AI 界的“歌者文明”,正在进行一场前所未有的 AI 战略布局

笔者大胆预测,今年 3 月份,OpenAI 会正式发布 GPT-4.5 或者 GPT-5,并上线 GPTs 商店作者分润功能

在发布前,每周都会有重大更新!包括:GPT 长期记忆功能、GPT 更多的多模态功能、本机操作 AI 助手、在线任务 AI 助手、视频配音等

届时,GPT Plus 全家桶包括:GPT 为躯干+大脑 ;两个 AI 助手左膀右臂;绘图 DALL-E、视频制作 Sora 为双腿。

下面,为您详细分析。先预测 Sora的发展趋势,再分析新版 GPT 的功能,最后结合奥特曼的公开演讲,给出学习建议!

一、Sora 未来 1-2 月发展预测

这两天,OpenAI 的文本到视频 AI 模型 Sora 火得一塌糊涂

微信单日搜索破两亿次!

Sora 源自日语,有“天空”的意思,也可引申为“自由”

Sora 可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色

以下两个视频均为 Sora 生成

  • Sora 早在 2023 年 3 月就开始研发!
  • 2023 年 12 月,文生视频 曾经闪现

以下抓图来自当时学习群一个同学的 GPT 对话界面

Sora 100%会集成到 GPT Plus 全家桶中!

目前,Sora 正在邀请外部专家,进行“红蓝对抗”压力测试,你可以到 OpenAI 官网申请加入红队,看能否参与内测!

从蛛丝马迹来看,在不久的将来会发布一个单行版“Sora generator”,并集成到 GPT4.5 或 GPT-5 中,应该还给最大的投资人微软一个“Copilot sora generator”

正式发布日期应该在 2024 年 3 月,GPT4 上市一周年之时!

Sora 的出现,引发了人们对 GPT-5 的遐想,人们对 GPT-5 的期望显著上升。

强如 Sora ,GPT-5 还有哪些功能?

二、GPT-5 功能分析

2024 年 3 月也许发布 GPT-5,或者发布 GPT4.5 先过渡一下,我们后文简称新版 GPT

OpenAI 武器库里堆满了神器:“智子”、“水滴”、“光粒”、“二向箔”、“黑域”

Sora 最多算个“光粒”,GPT-5 才是降维的“二向箔”,未来的 AGC 是更高阶的“黑域”!

新版 GPT 功能分析如下:

1、长期记忆

GPT 作为核心,通过支持更大的上下文窗口,具备长期记忆能力;

ChatGPT 官网 2023 年 12 月闪现过这个功能,以下是笔者当时的抓图

现在版本的 GPT4,只有一次记忆。只记得住当前的对话。

就好像你有一个很好的朋友,每天睡着后就忘了当天的一切。第二天,你和他沟通,要从猴子变人开始说。

新版 ChatGPT 从字面理解,有了长期记忆。能够在聊天中,学习并保留信息,提供更相关的回应。

新增“个性化”设置部分,允许 ChatGPT 根据用户的聊天内容改善响应。

ChatGPT 通过捕捉聊天中的细节和偏好来定制回应。

用户可以通过特定指令修改 ChatGPT 对他们的了解,例如询问“你对我了解多少?”或“我们上次项目进行到哪里了?”。

用户可以在设置中重置 ChatGPT 的记忆或关闭此功能。

2、GPTs 分润计划

去年 12 月,GPTs 商店上线,OpenAI 就官宣:

“我们计划在第一季度启动 GPT 开发者收入计划。作为首步,美国的开发者将根据用户对他们 GPTs 的参与度获得报酬。我们将在接近启动时间时提供详细的支付标准。”

关于 GPTs,入门可参看《OpenAI 正式发布 GPTs 商店和分润规划》

3、AI 助手(本机操作+在线任务)

OpenAI 不断推出更新迭代的 AI 工具,以提升效率和智能化。

OpenAI 正在研发两款 AI 新功能,一款针对计算机操作,另一款针对在线任务,旨在实现计算机操作和在线任务的自动化处理。

💻 OpenAI 正在研发针对计算机操作的 AI 助手,可自动执行各类任务,提升工作效率。

🌐 另一款 AI 专注于网络任务,如信息检索、旅行规划等,能为用户节省时间和劳力。

这些 AI 工具可能给类似服务的创业公司带来竞争压力,但也创造新商机。

详见《OpenAI 正在秘密研发两款 AI 助手》

4、视频配音

目前 Sora 很牛,但是目前做出的视频没有声音!

只有第三方 AI 音频公司 ElevenLabs 宣布,即将推出半自动 AI 配音测试

现在测试名单需要申请 https://form.typeform.com/to/gg0xzZW4

下面是 ElevenLabs 发布的为 Sora 的视频配音展示

我预计 OpenAI 很快会推出类似功能,不然,"没有声音,再好的戏也出不来!”。

功能包括有“文生音乐”,“视频生音乐”等。

5、其他功能

  • 减少幻觉:用过 AI 的用户都知道,幻觉,是所有 AI 的通病。即生成虚假信息的情况将会减少;

  • 提高计算效率:在保证输出质量的前提下,大幅提升计算效率;

  • 多感知能力:可以同时处理文本、音频、视频等不同类型的输入和输出

  • 价格合理:可能会提供更经济实惠的价格

或者不涨价,增加功能=降价!OpenAI API 将继续变得更快、更可靠、更便宜

三、 奥特曼的建议

以下是 Sam 奥特曼在 YC W24 启动会上的演讲要点:

奥特曼暗示我们可能已经非常接近实现通用人工智能(AGI)

AGI 的接近:Sam Altman 暗示我们可能已经非常接近实现通用人工智能(AGI),这将是一个重大的技术突破。

以 AGI 为前提:他建议创业者和技术开发者应该基于 AGI 的实现来规划他们的工作,而不是继续在现有技术框架内进行小幅度的改进。

GPT-5 的潜在进步:Altman 提到,尽管 GPT-4 已经领先了两年,但 GPT-5 可能会带来指数级的提升,这将对现有技术构成巨大挑战。

对初创企业和现有公司的挑战:技术的快速进步将给初创企业和现有公司带来许多问题和挑战,AGI 可能会覆盖一大批创业者的工作领域。

使用最先进的模型:他建议使用最先进的模型(State of the Art, SOTA),而不是花费太多时间进行微调和优化,因为这些努力可能会变得徒劳无功。

远见和产品构建:建议创业者设想一个“上帝般的”模型正在运作,并基于这种设想来构建最好的产品,这需要极强的远见。

OpenAI API 的改进:Altman 提到 OpenAI 的 API 将继续变得更快、更可靠、更便宜,但性能和成本之间始终存在平衡。

避免针对 GPT-4 限制的产品业务:他不推荐建立产品业务主要致力于解决当前 GPT-4 的限制,因为这些限制在 GPT-5 中可能会得到部分或全部修复。

情境优化而非行为优化:对于初创公司来说,情境优化可能比行为优化更重要。通过提供更多信息(如 RAG 等)可能比微调模型更有益。

四、如何学习 Sora,迎接 GPT-5?

1、官网注册 GPT

OpenAi 注册分两步:邮箱验证,目前只开通官方网站使用,不需要验证手机号码了

详见《一文掌握 GPT 注册》

2、开通 GPT4

《ChatGPT4 最新开通方法!不需要验证手机,不需要等待》

开通前,你需要开通支付宝开通 wildcard 支付

《保姆级教程!手把手教你用支付宝开通 ChatGPT plus!》

3、系统的学习 ChatGPT

重点学习 gpts,GPT 文章集锦如下:

《ChatGPT 文章集锦,拿走不谢》

觉得复杂,可以加入我们的学习群获取更多学习资料,提问并参与各种讨论

加入方式见文末

4、系统的学习“文生视频”软件

入门不难,包括 Pixverse,Pika,runway 等。关注sora新动向,熟悉各种提示词

点击看《文生视频》系列文章

结语:

回顾人类发展科技发展史,你会发现这种情况:

某类新技术的浪潮,会在几年之内迅速爆发,就像大自然的力量,无法阻挡,不可逆转。

人才、新发明、新产品一波一波的来,群雄争霸,高潮迭起。寂寂无名的公司凭借新科技,迅速崛起,曾经的老大却容易落入创新者的窘境。

如果你了解蒸汽、电力、内燃机、半导体、电脑等技术发展史,你就知道我在说什么。

最近两波是 2000 年左右的互联网,16 年的区块链,

而今,我们正站在另一个巨浪的起点。人工智能,这个曾经只存在于科幻小说中的概念,未来将渗透到我们生活的每一个角落。

我们也需要对 AI 的发展保持关注和学习,以确保自己在这个内卷的时代掌握这项强大的技术。

AI 的时代才刚刚开始,让我们一起期待 GPT-5 的到来,并共同推进人工智能向着有益于人类的方向发展!

 GPT4 十分钟内完成泰坦尼克号生存分析

本文链接:https://www.lipu365.com/gpt4_gpt5_65.html

怎么使用chatgpt4.0复旦大学教授评chatgpt4chatgpt4.0使用chatgpt4本地部署chatgpt4能干啥chatgpt4.0官方下载GPT Plus充值文本到音乐生成GPTs官网ChatGPT插件

相关文章