AI 能做一百件事,就做不了一个好看的 PPT

埃森哲的 AI 策略负责人最近在一次内部会议上,吐槽了公司里消耗 AI 算力的情况:驱动 token 消耗的,不是工程师在做开发,是非技术人员在用 AI 把 PDF 转成 PPT。

这怎么是滥用呢?堂堂埃森哲一个咨询公司, 做 PPT 才是正经事啊!

把一份文档变成一场能拿得出手的演示,是打工人最古老也最稳定的工作内容之一。做 PPT 的痛点一直都存在:费心、耗时,要一点点磨细节。原本以为 AI 能带来改变,没想到,这个痛点恰好长在了 AI 的能力边界上——它需要对内容有理解,对结构有控制,以及对视觉有判断力。

越是有需求,越是有市场,这几年来几十款 AI PPT 工具挤进这个赛道,从硅谷到北京,从独立应用到 Office 插件,几乎每个大厂和创业公司都插了一脚。

AI 做 PPT,看上去很美

如果要挑一个最能代表 AI PPT 赛道尴尬处境的产品,那就是 Gamma。

Gamma 是主打「一键生成」的 PPT 工具,只需要输入一个主题,几十秒出一套完整的幻灯片,涵盖排版、配色、动画效果,在网页上看起来,确实是不错。

文章配图-1

但问题通常出在「导出 」,这一下就会带来字体错位、图层塌陷、图文重叠,原版的高级感瞬间变成格式残骸。

有机构测试过,每 25 次 PPTX 导出里,Gamma 的图层保留率只有大约 30%。也就是说,你在网页上看到的,和你在 Office 里打开的,大概率是两套东西。

Gamma 的设计理念是把演示文稿当「活文档」,而不是静态文件。它希望你就在它的平台上展示,通过网页链接分享,进行在线演示,流畅而现代。

文章配图-1

但现实是,绝大多数打工人的演示终点,是会议室里那台插着 HDMI 线的笔记本上的 PowerPoint 软件,更别说 PPT 可能还得来回来去发送和修改。 不在那个终点交付,产品做得再好看也是半成品。

文章配图-2

同样的问题在国内工具上也存在,只是方向相反。国内工具导出稳定性普遍比 Gamma 好,但设计感普遍不如。百度文库智能 PPT 依托 18 亿专业文档库,但排版审美停留在「能看」的水平线,「快」和「好」之间始终有一条鸿沟。

文章配图-1

只负责排版,不负责内容

如果说导出问题是工程债,那内容空洞就是基因问题。

AI PPT 工具的底层逻辑,绝大多数是「模板 + GPT 填字」。你给一个主题,它用大模型拉出大纲、分到每一页、套进预设的模板里。

文章配图-1

听起来很合理,但实际上,大模型擅长的是「生成一段看起来像 PPT 的文字」,不是「写一页值得做成 PPT 的论点」。

结果就是,每张幻灯片看起来都对:标题有了、要点有了、配图有了,然而读过去之后你什么都记不住,每一页都在用不同的句式说同一件事,信息密度极低,逻辑关系极弱。Reddit 上一个用户的总结最精准:「对流程有帮助的大约 30%,主动妨碍你的大约 40%。」

在这个痛点上,做得相对好的是两类。一类秘塔为代表的内容驱动型,因为有文档库兜底,生成出来的不是「大模型编的」而是「从已有资料里提的」,虽然设计感平庸,但至少信息是实的。

文章配图-1

另一类是以 GenPPT 为代表的「先研究再生成」型,生成前先搜一圈资料、提炼论点再做成幻灯片。不过这个品类太新、模板库太薄,还不能作为主力工具。

大部分工具走的是中间那条路:排版好看一点,但内容比 GenPPT 更空。这是最糟的位置,既没有好用到能当生产力工具,又没有好看到能当设计工具。

模板越智能,越不好用

也有一些产品另辟蹊径,比如 Beautiful.ai 的卖点是「智能模板」,往幻灯片里输内容,AI 自动帮你调整布局、对齐间距、选择配色。不需要手动拖拽,不需要纠结字体大小,AI 替你做了一切设计决策。

文章配图-2

但中文社区给它起了个外号:「PPT 牢笼」。

模板规则越强,自定义就越难。你想把某张图片往左挪一点?不行,AI 判定它应该在中间。你想换一种标题样式?这套模板里没有。你想在某页插个非标准布局?抱歉, Beautiful.ai 的世界里不存在「非标准」。

这种设计哲学在理论上是有道理的——大多数人的排版确实不如 AI,把参数固定下来,能有效提高大部分产出。但在实际操作中,它把「帮我」变成了「替我」, 我这不是在和一个工具协作,是在和 AI 较劲。但恕我直言,AI 的审美也很固定啊,全世界的 PPT 都是莫兰迪 or 赛博朋克配色。

WPS AI 走的是另一条路:它不独立,它嵌在 WPS 里,触达最深、路径最短,但 AI 能力偏保守,生成效果在「省时间」层面有效,在「出彩」层面几乎指望不上。总之,Copilot 式的嵌入式路线和 Gamma/Beautiful.ai 的独立式路线,目前都没跑通最后一公里。

通用?不够通用

办公的场景一直都是兵家必争之地,所以通用型 AI 也不会放过,ChatGPT 在五月的时候推出了专门的插件。

文章配图-1

图片来源:X用户Gorden_Sun

如果你没有听说,大概率是因为它的使用体验一般,更适用于对已有的文件做修改,而不是生成。或者,需要极其精细的 prompt。

文章配图-2

Claude 推出过类似的插件,也支持在对话中输出 PPT。不过,也需要一点「曲线救国」:先让它做 HTML 网站,然后再以 PDF 格式导出;或者走 Canva、Figma 等平台,再导出。

文章配图-1

Claude design 作为主打设计排版的工具,同样也可以实现做 PPT。不过问题还是那个问题,它的中文字体有限、主打的是版式而非动画效果。最重要的是, Claude 并不是一个擅长多模态的模型,它的图片生成效果是比较差的,哪怕在 Claude design 里,都需要你自己找好素材——又鬼打墙了,找图片素材,本身就是做 PPT 的一个卡点。

相比之下,擅长多模态的 Gemini,似乎又不太擅长做 PPT。反而是基于 Gemini 的应用产品 Notebooklm,在做 PPT 上表现不错,于是也需要曲线救国一下,把两者结果在一起使用。或者也是先让它做 HTML 再调整。

文章配图-2

Kimi 也猛推过一波,考虑到它的训练数据,版式僵化依然是一个问题,甚至有些过于明显。它偏爱「dashboard」版式,页面上大大小小都是框,一张幻灯片里自动生成了太多框,几乎每个元素、不够五六个字就用一个文本框,每个框里又套框,框框套娃

文章配图-1

这个风格非常适用于咨询、数据分析等商业场景,但如果是教学等偏向图文的场景,就并不适用了,一则没有那么多数字要填,二则需要留给图片更多篇幅,最后就还是得手调。

通用型 AI 在做 PPT 上一直有这个问题:不够通用,跟大众记忆里,对通用型 AI 已经通过 mcp、工具调用,打通完整工具流的印象,有所出入。基本都需要好好写 prompt,这在大多数任务上无可厚非,也是一个当代用户需要学习和掌握的技能了。

但是用在 PPT 上, 这本身就是一个因为精修和微调而心累的工作,如果连 prompt 也需要精雕细琢,不如直接去生图的工具,再 copy & taste到 PPT 完事。

看起来热闹,还没人能赢

现在回去想「把 PDF 转成 PPT」,你还觉得它简单吗

这个需求听起来简单到不行了,但把它拆开就知道为什么难:需要 AI 读懂 PDF 的结构(标题层级、正文、图表、注释),理解哪些信息适合做成什么样式的排版,给每一页配合理的视觉布局,还要保持整体风格统一,最后输出一个能在任何设备上正常打开的 PPTX……

这恰好是所有 AI 弱点的集合—— 自然语言理解要对,视觉审美要对,格式兼容要对,受众意识要对,局部修改控制要对。其中任何一步掉了,最终结果就是「看着还行,但不敢拿去给老板看」。

文章配图-2

这就是为什么工具已经多到溢出了,仍然没有人及格。不是哪一家的产品经理不够努力,是这个品类本身,要求 AI 同时做到模型能力、工程功底、设计品位三件事,形成了不可能三角。

但凡需要认真做 PPT,且不说文本和创意层面,只是视觉层面,用户的要求和想法都会变得很具体。每一页,每一个元素,都有需要做到的东西。同时,还会希望 AI 做的东西能承袭自己的个人风格和审美,不要一眼就能看出来是 AI 跑的。

PPT 是一亿白领的日课,是信息从「内部消化」到「对外表达」的必经通道。谁能把这道门打开,谁就卡住了办公场景最重要的一道闸口。只是目前所有参赛者,都还在门外面转悠。

本文来自转载APPSO ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
资讯组小编的头像资讯组小编
Fable 5 内心「小作文」曝光,这次真不做人了
上一篇 1小时前
下一篇 1小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论