AutoGPT:无需人类插手,自主完成任务
有了 Auto-GPT,ChatGPT 已沦为“传统 GPT”根据官方介绍,Auto-GPT 本质上是一个基于 GPT-4 语言模型所构建的实验性开源应用程序,由 GPT-4 驱动,将大型语言模型 (LLM) 思想串在一起来自主实现任务。如果说 ChatGPT 的出现让人相信未来 AI 的重要性,Auto-GPT 则将这个想法进一步升华:未来,由自主 AI 驱动的任务将成为常态。因 Auto-GPT 提出的这个可能,导致 ChatGPT 问世不到半年就已沦为许多人口中的“传统 GPT”。为了验证这种未来的可能性,最近已有不少人下场体验过 Auto-GPT,其中包括微博博主@木遥:“如果你刚开始玩 Auto-GPT 但又没玩明白,你就会焦虑 af,像我一样。”https://img.36krcdn.com/hsossms/20230414/v2_3ca58a7ff8ae49ebba47cd8024177e07@5888275_oswg133921oswg1080oswg390_img_000
本来,木遥只是想让 Auto-GPT 解释一下 LangChain(一个围绕大型语言模型的应用开发框架)的用法,结果 Auto-GPT 直接来了一整套操作(这一系列步骤都是它自己串起来的,无需人类介入),连 LangChain 都安装了:▶ 首先试着直接去 LangChain 官网爬信息。▶ 被官网拒绝了,可能因为有屏蔽。▶ 发现失败了之后想了想,说要不 Google 一下?▶ Google 出了很多结果。▶ 读了半天这些结果,说「现在我们已经搜集了不少有用的信息了,接下来让我们安装它玩一下」▶ 然后就开始动手在我的电脑上安装 LangChain……
https://img.36krcdn.com/hsossms/20230414/v2_e083a2ef4ad2481bb8e1b30e0eeb04c6@5888275_oswg327554oswg690oswg328_img_000
面对行动力如此“爆表” Auto-GPT,木遥忍不住感慨:“我坐在屏幕前看着这一切自动在我眼前发生,心想,我要是有它这个行动力,三个 PhD 都念完了。”除此之外,Globus 创始人安替(Michael Anti)也分享了一个不错的 Auto-GPT 使用案例:“假设你是华为的公关,分析最近国际报道,看看下一步要改善的动作。”
https://img.36krcdn.com/hsossms/20230414/v2_64ea73334f324a8590d0d23a544517a1@5888275_oswg902732oswg1080oswg1009_img_000
对于 Auto-GPT 的表现,安替(Michael Anti)评价道:“奇点算是到了吧,又有很多行业要死了吧?”整体来看,Auto-GPT 就像是一个机器人助理,你只需下达任务,它便会自己看着完成。但 Auto-GPT 真就完美无缺、无懈可击吗?事实证明,至少现阶段还远远不是——Jina AI 的创始人兼 CEO 肖涵表示:“在我们庆祝 Auto-GPT 的快速崛起时,退后一步并仔细检查其潜在的缺点至关重要。”
现阶段,Auto-GPT 仍有缺陷
为说明目前 Auto-GPT 的不足之处,肖涵先大致分析了一波原理,即 Auto-GPT 主要由四部分组成:(1)架构:Auto-GPT 是使用强大的 GPT-4 和 GPT-3.5 语言模型构建的,它们作为机器人的大脑,帮助它思考和推理。(2)自主迭代:类似于机器人从错误中学习的能力。Auto-GPT 可以回顾其工作,在之前的工作基础上再接再厉,并利用其历史记录生成更准确的结果。(3)内存管理:与矢量数据库(一种内存存储解决方案)集成,使 Auto-GPT 能够保留上下文并做出更好的决策,类似于为机器人配备长期记忆以记住过去的经历。(4)多功能性:Auto-GPT 的功能(例如文件操作、Web 浏览和数据检索)使其用途广泛,并使其与有别于以往的 AI 迭代,就像赋予机器人多种技能来处理更广泛的任务。
基于其组成原理,肖涵指出现阶段 Auto-GPT 面临的五个重要局限:▶ 成本高昂虽然 Auto-GPT 具有卓越的功能,但由于任务是通过思维链完成的,为提供更好的推理和提示,每一步都需要调用昂贵的 GPT-4 模型,这通常会最大化 token,也就带来了过高的成本。对此,肖涵估算了一个小任务的花费:Auto-GPT 平均需要 50 个步骤来完成一个小任务,即成本为 50* 0.288=14.4 美元(约人民币 98.5 元)。▶ 不知变通可能会有人觉得只要 Auto-GPT 能完成任务,这 14.4 美元倒也不亏。但问题是,这 14.4 美元是一次性的:哪怕你只想修改一个很小的任务条件,也需要再次支付 14.4 美元。肖涵指出:“一旦生成过解决方案,再次花费相同的金额来调整参数似乎不合逻辑。这揭示了 Auto-GPT 的一个基本问题:它无法将开发和生产区分开来。”▶ 容易陷入死循环更要命的是,这 14.4 美元还可能“打水漂”。许多用户报告说:Auto-GPT 经常陷入循环,导致其无法解决实际问题。“我昨天多次使用它,我发现…它从未完成过一项任务。它总是去深入挖掘、做更多的研究,但从来没有真正完成一个目标。我就放着让它持续循环了几个小时。”
https://img.36krcdn.com/hsossms/20230414/v2_4382c7ee02da4b9db17a9137704cf3b2@5888275_oswg106155oswg1070oswg439_img_000
▶ 矫枉过正Auto-GPT 依靠矢量数据库来进行更快的 K 最近邻(KNN)搜索,但肖涵表示这是一种矫枉过正的做法:“很多情况下,穷举搜索就足够有效了,只需不到一秒钟即可完成。相比之下,每个 GPT-4 调用大约需要 10 秒来处理,这使得系统受 GPT 约束而不是数据库约束。”同时,这也会带来成本的增加。▶ 代理机制不完善Auto-GPT 引入了一个很有趣的概念,即允许生成代理来委派任务。然而,肖涵认为这还不够完善:“这一机制仍处于早期阶段,其潜力在很大程度上仍未得到开发。”
“又贵又慢,AI 摸鱼?”对于以上总结的几点 Auto-GPT 缺陷,实际上早有不少用户在抱怨,还搞出了一些“闹剧”:
https://img.36krcdn.com/hsossms/20230414/v2_ed64339f7e9e4682a01b2057f213bbf0@5888275_oswg130154oswg1080oswg244_img_000
https://img.36krcdn.com/hsossms/20230414/v2_2cebbc8da4b644478e7a76dfeecc5d7c@5888275_oswg161732oswg1080oswg523_img_000
同时,Auto-GPT 的处理速度也引来吐槽,有点“AI 摸鱼”的意思:
https://img.36krcdn.com/hsossms/20230414/v2_c14559f79e8044ce9d6cf7ffb53fdc9a@5888275_oswg157620oswg1080oswg419_img_000
不过即便如此,Auto-GPT 还是令许多人对未来 AI 的发展趋势充满期待:▶ “想象一下,你手里有一个 AI 代理,可以随时随地执行命令。我相信未来才刚刚开始!”▶ “这种自我改进的 AI 代表了真正 AGI 的第一个火花。”▶ “Auto-GPT 的确揭露了使用 GPT 的正确姿势。”
那么,你对于 Auto-GPT 又有什么看法呢?
参考链接https://weibo.com/1644684112/MBK3WCt8o
https://jina.ai/news/auto-gpt-unmasked-hype-hard-truths-production-pitfalls/
https://twitter.com/mranti/status/1646430121904013312?cxt=HHwWgIC8uaDepdktAAAA
本文来自微信公众号https://mp.weixin.qq.com/s/Pig7DGqXUep8Ex-5CItnuQ,作者:郑丽媛 ,
教程
https://bytexd.com/getting-start ... inners-setup-usage/
或是
https://github.com/Torantulino/Auto-GPT
4月13日消息,近日,代码托管平台GitHub上线了一个新的基于GPT-4的开源应用项目AutoGPT,凭借超42k的Star数在开发者圈爆火。
GitHub地址:https://github.com/Torantulino/Auto-GPT
https://img.36krcdn.com/hsossms/20230413/v2_26b35c57da3d487fb27813b2a5396050@000000_oswg51813oswg600oswg257_img_000
AutoGPT能够根据用户需求,在用户完全不插手的情况下自主执行任务,包括日常的事件分析、营销方案撰写、代码编程、数学运算等事务都能代劳。比如某国外测试者要求AutoGPT帮他创建一个网站,AutoGPT就直接调用React框架生成了一个前端页面。
特斯拉前AI总监、现OpenAI技术大牛安德烈·卡尔帕西(Andrej Karpathy)称,AutoGPT是“提示工程的下一个前沿”。因为同基于GPT-4的ChatGPT非常依赖人们输入提示词来完成任务,AutoGPT则将中间的多轮提问环节交给机器,因此有人称AutoGPT将会替代ChatGPT。
01. 解决复杂任务无需人为干预, GitHub上已有42万星标AutoGPT是一个开源的AI代理Python应用程序,由开发人员Significant Ggravitas近日发布在GitHub上,它使用GPT-4作为驱动基础,允许AI自主行动,完全无需用户提示每个操作,30分钟内就可以完成设置,以设置和入门的简便性在用户中大受欢迎,目前GitHub Star量已超过42k。AutoGPT最大的特点就在于能全自动地根据任务指令进行分析和执行,自己给自己提问并进行回答,中间环节不需要用户参与。如果说ChatGPT是服从用户指令,用户让它干什么它就干什么,那AutoGPT就是“自己觉得应该干什么就干什么”,它就像是一个遇到不懂的问题能自行去百度的人类。用户可以为AutoGPT设定总体目标,然后让它逐步采取措施来一一实现目标,这就是“AI代理”概念的由来,它完全自动执行操作。目前AutoGPT已经配备的功能包括:联网搜集信息;存储信息;生成用于文本生成的GPT-4实例;使用GPT-3.5总结信息。人们目前正在探索AutoGPT的各种玩法,在Twitter上有位用户演示了一个简单的例子,让AutoGPT开发电子商务业务,它能代替人自动去浏览互联网来寻找商业创意,并将其发现保存到文件中以供日后参考。
https://img.36krcdn.com/hsossms/20230413/v2_33b951972db347f5bf2a5ce06dec6202@000000_oswg85185oswg350oswg300_img_000
除了自动搜集信息完成指令,编码对它而言也不在话下,另一位用户要求它分析、重写并保存代码,它也顺利完成。卡尔帕西称:“AutoGPT是提示工程的下一个前沿领域。”他认为,一个GPT调用就像是计算机上的一个指令,可以被串联成程序,使用提示来定义I/O设备和工具规格,定义认知循环,在上下文中分页数据输入和输出再运行。
https://img.36krcdn.com/hsossms/20230413/v2_c96866a60b31449b981ad4b03a949f5e@000000_oswg69035oswg290oswg300_img_000
02. 30分钟完成设置打造一款属于自己的AI助手
用户在开始之前,需要确保对终端命令有基本的了解,并需要完成以下步骤:1、设置Git;2、安装Python;3、下载Docker桌面;4、获取OpenAI API密钥,还使用提供的链接来访问,链接如下:Docker:https://www.docker.com/products/docker-desktop/OpenAI API:https://platform.openai.com/account/api-keysPython:https://www.python.org/downloads/
安装具体步骤如下:1、用户首先需要从GitHub克隆AutoGPT存储库;
https://img.36krcdn.com/hsossms/20230413/v2_432947aec9d9438cb81dbfe6bb5c4e30@000000_oswg15542oswg465oswg300_img_000
https://img.36krcdn.com/hsossms/20230413/v2_fa95714f32fb45e6afcc9ed51b79d007@000000_oswg21156oswg600oswg124_img_000
git clone https://github.com/Torantulino/Auto-GPT
导航到新创建的文件夹,其中包含:https://img.36krcdn.com/hsossms/20230413/v2_9538a3352bf748418c5680a2e354fe36@000000_oswg7924oswg600oswg143_img_000
2、在自动GPT文件夹中,找到该文件并插入OpenAI API密钥。接下来,复制该文件并将其重命名为.env.template.env
https://img.36krcdn.com/hsossms/20230413/v2_944bef8f169e4cc49ad3e3f3e7718f24@000000_oswg25988oswg413oswg300_img_0003、运行以下命令以安装所需的Python包;https://img.36krcdn.com/hsossms/20230413/v2_4be9d90f0df64e9fad2e10cd9c6f6e1d@000000_oswg4031oswg600oswg119_img_0004、确保Docker正在运行,无需下载任何容器,只需确保程序处于活动状态即可;https://img.36krcdn.com/hsossms/20230413/v2_4abce19233914b42a387aff8b63efb17@000000_oswg9717oswg318oswg300_img_0005、在运行AutoGPT前,先执行命令:Python scripts/main.py
https://img.36krcdn.com/hsossms/20230413/v2_9974331765c14d119b7fca8370b6992f@000000_oswg19428oswg600oswg124_img_000对于连续模式,使用:Python scripts/main.py—Continuous
https://img.36krcdn.com/hsossms/20230413/v2_1ecb4ff526b0469987dea1e53fc73dbb@000000_oswg13396oswg600oswg115_img_000
6、在设定目标时,先从简单的目标开始测试,太复杂的目标可能会导致AI无法输入任何内容;
https://img.36krcdn.com/hsossms/20230413/v2_9f9e80f9c2b847d286256c8a6c97e271@000000_oswg14126oswg600oswg203_img_000https://img.36krcdn.com/hsossms/20230413/v2_fbdea27138ae4ddca0852463e4a9fd7f@000000_oswg32050oswg600oswg283_img_000
7、AutoGPT可以保存文件,用户只需要引导它朝着正确的方向来保存分析即可。
03. 结语:自问自答的AutoGPT全自动更新迭代已实现
AutoGPT虽然目前还只是一款实验性的开源工具,但是已再次向外界展示了GPT-4大语言模型无边际的强大潜力。当一款AI工具能自动完成优化代码、搜集信息、自动查找并修改Bug时,或许也意味着它未来也将通过编程来不断加强自己的能力,人工智能所能达到的边界再一次被拓展。
来源:GitHub官网、medium本文来自微信公众号“智东西”(ID:zhidxcom),作者:菲凝,
页:
[1]