AutoGPT：无需人类插手，自主完成任务

寂夜清风 发表于 2023-4-14 19:39

有了 Auto-GPT，ChatGPT 已沦为“传统 GPT”根据官方介绍，Auto-GPT 本质上是一个基于 GPT-4 语言模型所构建的实验性开源应用程序，由 GPT-4 驱动，将大型语言模型（LLM）思想串在一起来自主实现任务。如果说 ChatGPT 的出现让人相信未来 AI 的重要性，Auto-GPT 则将这个想法进一步升华：未来，由自主 AI 驱动的任务将成为常态。因 Auto-GPT 提出的这个可能，导致 ChatGPT 问世不到半年就已沦为许多人口中的“传统 GPT”。为了验证这种未来的可能性，最近已有不少人下场体验过 Auto-GPT，其中包括微博博主@木遥：“如果你刚开始玩 Auto-GPT 但又没玩明白，你就会焦虑 af，像我一样。”
https://img.36krcdn.com/hsossms/20230414/v2_3ca58a7ff8ae49ebba47cd8024177e07@5888275_oswg133921oswg1080oswg390_img_000
本来，木遥只是想让 Auto-GPT 解释一下 LangChain（一个围绕大型语言模型的应用开发框架）的用法，结果 Auto-GPT 直接来了一整套操作（这一系列步骤都是它自己串起来的，无需人类介入），连 LangChain 都安装了：▶ 首先试着直接去 LangChain 官网爬信息。▶ 被官网拒绝了，可能因为有屏蔽。▶ 发现失败了之后想了想，说要不 Google 一下？▶ Google 出了很多结果。▶ 读了半天这些结果，说「现在我们已经搜集了不少有用的信息了，接下来让我们安装它玩一下」▶ 然后就开始动手在我的电脑上安装 LangChain……
https://img.36krcdn.com/hsossms/20230414/v2_e083a2ef4ad2481bb8e1b30e0eeb04c6@5888275_oswg327554oswg690oswg328_img_000
面对行动力如此“爆表” Auto-GPT，木遥忍不住感慨：“我坐在屏幕前看着这一切自动在我眼前发生，心想，我要是有它这个行动力，三个 PhD 都念完了。”除此之外，Globus 创始人安替（Michael Anti）也分享了一个不错的 Auto-GPT 使用案例：“假设你是华为的公关，分析最近国际报道，看看下一步要改善的动作。”
https://img.36krcdn.com/hsossms/20230414/v2_64ea73334f324a8590d0d23a544517a1@5888275_oswg902732oswg1080oswg1009_img_000
对于 Auto-GPT 的表现，安替（Michael Anti）评价道：“奇点算是到了吧，又有很多行业要死了吧？”整体来看，Auto-GPT 就像是一个机器人助理，你只需下达任务，它便会自己看着完成。但 Auto-GPT 真就完美无缺、无懈可击吗？事实证明，至少现阶段还远远不是——Jina AI 的创始人兼 CEO 肖涵表示：“在我们庆祝 Auto-GPT 的快速崛起时，退后一步并仔细检查其潜在的缺点至关重要。”
现阶段，Auto-GPT 仍有缺陷
为说明目前 Auto-GPT 的不足之处，肖涵先大致分析了一波原理，即 Auto-GPT 主要由四部分组成：（1）架构：Auto-GPT 是使用强大的 GPT-4 和 GPT-3.5 语言模型构建的，它们作为机器人的大脑，帮助它思考和推理。（2）自主迭代：类似于机器人从错误中学习的能力。Auto-GPT 可以回顾其工作，在之前的工作基础上再接再厉，并利用其历史记录生成更准确的结果。（3）内存管理：与矢量数据库（一种内存存储解决方案）集成，使 Auto-GPT 能够保留上下文并做出更好的决策，类似于为机器人配备长期记忆以记住过去的经历。（4）多功能性：Auto-GPT 的功能（例如文件操作、Web 浏览和数据检索）使其用途广泛，并使其与有别于以往的 AI 迭代，就像赋予机器人多种技能来处理更广泛的任务。
基于其组成原理，肖涵指出现阶段 Auto-GPT 面临的五个重要局限：▶ 成本高昂虽然 Auto-GPT 具有卓越的功能，但由于任务是通过思维链完成的，为提供更好的推理和提示，每一步都需要调用昂贵的 GPT-4 模型，这通常会最大化 token，也就带来了过高的成本。对此，肖涵估算了一个小任务的花费：Auto-GPT 平均需要 50 个步骤来完成一个小任务，即成本为 50* 0.288=14.4 美元（约人民币 98.5 元）。▶ 不知变通可能会有人觉得只要 Auto-GPT 能完成任务，这 14.4 美元倒也不亏。但问题是，这 14.4 美元是一次性的：哪怕你只想修改一个很小的任务条件，也需要再次支付 14.4 美元。肖涵指出：“一旦生成过解决方案，再次花费相同的金额来调整参数似乎不合逻辑。这揭示了 Auto-GPT 的一个基本问题：它无法将开发和生产区分开来。”▶ 容易陷入死循环更要命的是，这 14.4 美元还可能“打水漂”。许多用户报告说：Auto-GPT 经常陷入循环，导致其无法解决实际问题。“我昨天多次使用它，我发现…它从未完成过一项任务。它总是去深入挖掘、做更多的研究，但从来没有真正完成一个目标。我就放着让它持续循环了几个小时。”
https://img.36krcdn.com/hsossms/20230414/v2_4382c7ee02da4b9db17a9137704cf3b2@5888275_oswg106155oswg1070oswg439_img_000
▶ 矫枉过正Auto-GPT 依靠矢量数据库来进行更快的 K 最近邻（KNN）搜索，但肖涵表示这是一种矫枉过正的做法：“很多情况下，穷举搜索就足够有效了，只需不到一秒钟即可完成。相比之下，每个 GPT-4 调用大约需要 10 秒来处理，这使得系统受 GPT 约束而不是数据库约束。”同时，这也会带来成本的增加。▶ 代理机制不完善Auto-GPT 引入了一个很有趣的概念，即允许生成代理来委派任务。然而，肖涵认为这还不够完善：“这一机制仍处于早期阶段，其潜力在很大程度上仍未得到开发。”
“又贵又慢，AI 摸鱼？”对于以上总结的几点 Auto-GPT 缺陷，实际上早有不少用户在抱怨，还搞出了一些“闹剧”：
https://img.36krcdn.com/hsossms/20230414/v2_ed64339f7e9e4682a01b2057f213bbf0@5888275_oswg130154oswg1080oswg244_img_000
https://img.36krcdn.com/hsossms/20230414/v2_2cebbc8da4b644478e7a76dfeecc5d7c@5888275_oswg161732oswg1080oswg523_img_000
同时，Auto-GPT 的处理速度也引来吐槽，有点“AI 摸鱼”的意思：
https://img.36krcdn.com/hsossms/20230414/v2_c14559f79e8044ce9d6cf7ffb53fdc9a@5888275_oswg157620oswg1080oswg419_img_000

不过即便如此，Auto-GPT 还是令许多人对未来 AI 的发展趋势充满期待：▶ “想象一下，你手里有一个 AI 代理，可以随时随地执行命令。我相信未来才刚刚开始！”▶ “这种自我改进的 AI 代表了真正 AGI 的第一个火花。”▶ “Auto-GPT 的确揭露了使用 GPT 的正确姿势。”
那么，你对于 Auto-GPT 又有什么看法呢？
参考链接https://weibo.com/1644684112/MBK3WCt8o
https://jina.ai/news/auto-gpt-unmasked-hype-hard-truths-production-pitfalls/
https://twitter.com/mranti/status/1646430121904013312?cxt=HHwWgIC8uaDepdktAAAA

本文来自微信公众号https://mp.weixin.qq.com/s/Pig7DGqXUep8Ex-5CItnuQ，作者：郑丽媛，

寂夜清风 发表于 2023-4-14 19:41

教程

https://bytexd.com/getting-start ... inners-setup-usage/

或是
https://github.com/Torantulino/Auto-GPT

寂夜清风 发表于 2023-4-14 19:43

4月13日消息，近日，代码托管平台GitHub上线了一个新的基于GPT-4的开源应用项目AutoGPT，凭借超42k的Star数在开发者圈爆火。
GitHub地址：https://github.com/Torantulino/Auto-GPT

https://img.36krcdn.com/hsossms/20230413/v2_26b35c57da3d487fb27813b2a5396050@000000_oswg51813oswg600oswg257_img_000
AutoGPT能够根据用户需求，在用户完全不插手的情况下自主执行任务，包括日常的事件分析、营销方案撰写、代码编程、数学运算等事务都能代劳。比如某国外测试者要求AutoGPT帮他创建一个网站，AutoGPT就直接调用React框架生成了一个前端页面。
特斯拉前AI总监、现OpenAI技术大牛安德烈·卡尔帕西（Andrej Karpathy）称，AutoGPT是“提示工程的下一个前沿”。因为同基于GPT-4的ChatGPT非常依赖人们输入提示词来完成任务，AutoGPT则将中间的多轮提问环节交给机器，因此有人称AutoGPT将会替代ChatGPT。

01. 解决复杂任务无需人为干预, GitHub上已有42万星标AutoGPT是一个开源的AI代理Python应用程序，由开发人员Significant Ggravitas近日发布在GitHub上，它使用GPT-4作为驱动基础，允许AI自主行动，完全无需用户提示每个操作，30分钟内就可以完成设置，以设置和入门的简便性在用户中大受欢迎，目前GitHub Star量已超过42k。AutoGPT最大的特点就在于能全自动地根据任务指令进行分析和执行，自己给自己提问并进行回答，中间环节不需要用户参与。如果说ChatGPT是服从用户指令，用户让它干什么它就干什么，那AutoGPT就是“自己觉得应该干什么就干什么”，它就像是一个遇到不懂的问题能自行去百度的人类。用户可以为AutoGPT设定总体目标，然后让它逐步采取措施来一一实现目标，这就是“AI代理”概念的由来，它完全自动执行操作。目前AutoGPT已经配备的功能包括：联网搜集信息；存储信息；生成用于文本生成的GPT-4实例；使用GPT-3.5总结信息。人们目前正在探索AutoGPT的各种玩法，在Twitter上有位用户演示了一个简单的例子，让AutoGPT开发电子商务业务，它能代替人自动去浏览互联网来寻找商业创意，并将其发现保存到文件中以供日后参考。
https://img.36krcdn.com/hsossms/20230413/v2_33b951972db347f5bf2a5ce06dec6202@000000_oswg85185oswg350oswg300_img_000
除了自动搜集信息完成指令，编码对它而言也不在话下，另一位用户要求它分析、重写并保存代码，它也顺利完成。卡尔帕西称：“AutoGPT是提示工程的下一个前沿领域。”他认为，一个GPT调用就像是计算机上的一个指令，可以被串联成程序，使用提示来定义I/O设备和工具规格，定义认知循环，在上下文中分页数据输入和输出再运行。
https://img.36krcdn.com/hsossms/20230413/v2_c96866a60b31449b981ad4b03a949f5e@000000_oswg69035oswg290oswg300_img_000
02. 30分钟完成设置打造一款属于自己的AI助手

用户在开始之前，需要确保对终端命令有基本的了解，并需要完成以下步骤：1、设置Git；2、安装Python；3、下载Docker桌面；4、获取OpenAI API密钥，还使用提供的链接来访问，链接如下：Docker：https://www.docker.com/products/docker-desktop/OpenAI API：https://platform.openai.com/account/api-keysPython：https://www.python.org/downloads/
安装具体步骤如下：1、用户首先需要从GitHub克隆AutoGPT存储库；
https://img.36krcdn.com/hsossms/20230413/v2_432947aec9d9438cb81dbfe6bb5c4e30@000000_oswg15542oswg465oswg300_img_000
https://img.36krcdn.com/hsossms/20230413/v2_fa95714f32fb45e6afcc9ed51b79d007@000000_oswg21156oswg600oswg124_img_000
git clone https://github.com/Torantulino/Auto-GPT

导航到新创建的文件夹，其中包含：https://img.36krcdn.com/hsossms/20230413/v2_9538a3352bf748418c5680a2e354fe36@000000_oswg7924oswg600oswg143_img_000
2、在自动GPT文件夹中，找到该文件并插入OpenAI API密钥。接下来，复制该文件并将其重命名为.env.template.env
https://img.36krcdn.com/hsossms/20230413/v2_944bef8f169e4cc49ad3e3f3e7718f24@000000_oswg25988oswg413oswg300_img_0003、运行以下命令以安装所需的Python包；https://img.36krcdn.com/hsossms/20230413/v2_4be9d90f0df64e9fad2e10cd9c6f6e1d@000000_oswg4031oswg600oswg119_img_0004、确保Docker正在运行，无需下载任何容器，只需确保程序处于活动状态即可；https://img.36krcdn.com/hsossms/20230413/v2_4abce19233914b42a387aff8b63efb17@000000_oswg9717oswg318oswg300_img_0005、在运行AutoGPT前，先执行命令：Python scripts/main.py
https://img.36krcdn.com/hsossms/20230413/v2_9974331765c14d119b7fca8370b6992f@000000_oswg19428oswg600oswg124_img_000对于连续模式，使用：Python scripts/main.py—Continuous
https://img.36krcdn.com/hsossms/20230413/v2_1ecb4ff526b0469987dea1e53fc73dbb@000000_oswg13396oswg600oswg115_img_000
6、在设定目标时，先从简单的目标开始测试，太复杂的目标可能会导致AI无法输入任何内容；
https://img.36krcdn.com/hsossms/20230413/v2_9f9e80f9c2b847d286256c8a6c97e271@000000_oswg14126oswg600oswg203_img_000https://img.36krcdn.com/hsossms/20230413/v2_fbdea27138ae4ddca0852463e4a9fd7f@000000_oswg32050oswg600oswg283_img_000
7、AutoGPT可以保存文件，用户只需要引导它朝着正确的方向来保存分析即可。
03. 结语：自问自答的AutoGPT全自动更新迭代已实现

AutoGPT虽然目前还只是一款实验性的开源工具，但是已再次向外界展示了GPT-4大语言模型无边际的强大潜力。当一款AI工具能自动完成优化代码、搜集信息、自动查找并修改Bug时，或许也意味着它未来也将通过编程来不断加强自己的能力，人工智能所能达到的边界再一次被拓展。
来源：GitHub官网、medium本文来自微信公众号“智东西”（ID：zhidxcom），作者：菲凝，

页: [1]

吹友吧-智能社区's Archiver

AutoGPT：无需人类插手，自主完成任务