最近 Manus 爆火,很多人都苦于没有邀请码,只能看着有码的人体验 “ 别人给自己干活 ” 的快感。
为啥这东西这么吸引人呢?还是因为现在的大语言模型,只能和你进行 “ 言语交流 ” 。你跟它说 “ 这个东西我不会 ” ,它会给你罗列出详细的步骤,但绝对不会帮你完成。完成工作,是只有碳基生物能干的事,硅基生物它做不来。
而 Manus 一出,就展现了超越传统大模型的自主执行能力,不仅能理解复杂指令,还能拆解任务、调用工具等。网友一看,好家伙,这不就是个帮我打工的私人助理吗?
但这玩意也没那么全能,只能算个 “ 套壳产品 ” ,虽然是集成了很多工具包,但如果是它工具库里没有的,那就完蛋了。
比如,你能让 Manus 帮你 PS 个图,用 PR 剪个视频,再把工程文件发给你吗?对不起,做不到。也就是说,它离我们真正的 “ 生产力工具 ” 还很远。
但最近世超在 GitHub 上发现了个比较火的项目,可以让大语言模型帮你建模。这可不得了,可以说是让AI 成为真正生产力工具的重要一步,现在这个项目已经收获了 6.8k 的 Stars ,还在快速增长。
世超看完演示视频,发现作者仅仅通过与 Claude 对话,就使用 3D 建模软件 Blender 建立出了一幅精美的模型。整个建模过程无需敲代码,更无需学习软件操作,只需要通过语言描述需求即可完成。
视频里,作者直接在对话框里输入: “ 请用 Blender 帮我建立一个场景,有一条龙站在一罐金子旁边 ” 。
随即, Claude 就开始调用 Blender 开始建模了,很快啊。
最终成品图如下:
看着效果确实不错啊,那必须体验一下了,毕竟作为懒狗,看着别人把活全干了确实有种不能拒绝的快感呢。
于是,我找到项目文档,照着上面的步骤,用不了一小时就把项目部署完成了,确实简单。整个过程也不需要写代码,完全的鼠标操作。
体验了一个上午,先说结论:趣味性十足,实用性一般。
首先我试验了一下,能不能达到视频中的效果。我直接把视频中的提示词复制过去,他还真列出步骤一步一步开始做了:
就是这效果。。不能说是一模一样,只能说是有点关系:
金币和地板是有了,就是这龙也太龙了。
不过视频显示啊,作者在该提示词的基础上进行了多次微调,世超由于对建模一窍不通,不懂怎么调整建模细节,所以造成了实物与原图不符。感兴趣的差友们可以尝试复刻一下视频中的效果。
哎,不然来个简单点的,就给我画条龙吧?我们来看看对这种简单直接的要求,它的完成度怎么样。
于是,我直接跟它说:给我画条真龙。
看它输出的步骤,真是有模有样的,先画龙身,再画龙头,然后是龙爪和细节修饰。。
结果呢?
你还别说,跟楼上那条龙真有异曲同工之妙。看来大模型对龙的理解就是这样了,又龙又猪的。没关系,反正都是十二生肖嘛。
额,真龙画不出来,奶龙总行吧?我把奶龙的细节特征全给你描述清楚,你给我画,就不会出错了呗。
必须动手。我给的提示词是: “ 画一条黄色怪兽,圆圆的头,肥胖的身躯,短胳膊短腿,还有恐龙尾巴和绿色眼睛。 ”
它立马就开始动手了,很快啊。
最终结果令我拍手叫好:
说实话,这是给它的几个任务里,完成度最高的一个了,起码能看出来是条奶龙了。
不过呢,这些其实都是些神秘的东方元素,对西方大模型来说,画不出也可以理解。
有没有什么世界各地都常见的东西?我想了想,让它给我画栋房子吧。提示词很简单:画栋房子。
在经过一番全自动操作后,它给出了最终成品:
嗯,确实还不错,有门、窗、树甚至烟囱之类的东西。就是旁边飞了两根横梁不知道是做什么的。。
这几轮体验下来,感觉只能说勉强可以,毕竟是零基础建模师,建出能看出形状的模型已经算是胜利了。
世超也把它的作品给专业 3D 建模的同事看了,同事表示:其实它现在只会简单的几何体堆砌,就像小孩搭积木一样,没有建立复杂模型的能力。
有很多网友尝试过它之后,也给出了类似评价:
总结一下就是:能用,但也仅限能用。想给专业人士帮上忙,其实还远着呢。。
但对现在 AI 的发展来说,还是个不小的进步, AI 从 “ 摸不到工具 ” 到 “ 能摸到工具了 ” ,那给人类打工这件事还会远吗?
那么话又说回来,不是说让 AI 实现工具使用挺有难度吗?这个是咋实现的呢?
其实,怎么能让 AI 使用我们的生产工具干活,一直是 AI 从业者研究的难题。因为现在的 AI 和生产力工具们,还没办法直接 “ 交流 ” 。
举个例子,《 圣经 》中说,最初所有人类都使用的是同一种语言,为了防止人类合伙建造通天塔,上帝一声令下,把大伙的语言都分隔开了。
而现在的各大 AI 和人类的工具、数据库之间呢,也有这种 “ 语言不通 ” 的矛盾。
为了解决这个问题,在去年 11 月,一位叫 MCP ( Model Context Protocol ,模型上下文协议 )的重量级嘉宾就闪亮登场了。
它是由 Anthropic 提出的一种开放标准协议,你可以把它理解成一个 AI 世界的 “ 翻译官 ” 。不管你是什么东西,只要支持 MCP 协议,它都能使大模型的 “ 语言 ” 让其他使用 MCP 协议的工具 “ 听懂 ” ,这样一来,壁垒就被打破了,通天塔不是就指日可待了嘛?
如果未来越来越多的应用使用 MCP 协议,我们的 AI 就能轻松调用它们进行工作,人类就能正式进入 “ 解放双手 ” 的时代了。
上面介绍的建模项目呢,就是使用了 MCP 协议,把大模型和建模软件连接了起来,所以咱们每提一个要求,大模型就能根据要求调用建模软件进行执行。
随着时间推移,已经有越来越多的工具加入 MCP 的队伍中了。
比如, VSCode 上的一个叫 Cline 的插件,本身是使用 AI 辅助编程的,最近也宣布支持 MCP 了,这意味着这款插件可以使用 MCP 生态下的全部功能。
比如一款爬虫工具 Firecrawl ,能把各大网站的信息爬下来,然后转化成对大模型友好的 Markdown 格式。
程序员用这款插件时,想在网站上爬点有用的信息并喂给 AI 总结, so easy 好吧。
不过据传 Manus 没有使用 MCP 协议,世超觉得如果未来 MCP 成为主流, Manus 也就随即失去意义了。。毕竟大家伙都能 “ 万物互联 ” 了,还需要你个集成工具包干什么呢?当然这也都是展望阶段,未来到底怎么样,还不好说。
不过最近的几波新闻,都代表着 AI 离 “ 替人类干活 ” 越来越近了。你说大家不担心抢工作,那是不可能的,毕竟你永远不知道下一个被替代的职业是什么。。
所以,你的职业离被 AI 拿下,还有多远呢?
撰文:不咕
编辑:江江 & 面线