量子位 8小时前
Markdown要凉…卡帕西也站HTML了
index.html
../../../zaker_core/zaker_tpl_static/wap/tpl_font3.html

 

Markdown,当死。

这个暴论,出自今天 Anthropic 工程师 Thariq 发的一篇引爆全网的长文。

整篇文章,就一个目的——

给 MD 宣判「死刑」。

是的,这个前不久风靡 vibe coding 的人机交流格式,正在被 Claude 的工程师们呼吁抛弃。

我现在几乎不怎么亲手编辑这些文件了,更多是拿它们当规范、参考文档或者头脑风暴的产出。就算真要改,通常也是直接丢给 Claude 去修。

不是,你等等。

我刚学会用 MD ……

又死了???

那,替代品是啥啊?下一个该学什么?

Thariq 的答案,出乎意料:

HTML。

我现在不管是做规划、需求设计、方案探索,还是代码审查和整理报告,全都在用 HTML ……

其实吧,如果光 Thariq 这么说,不能代表什么。

关键评论区共鸣的人太多了,这本身就代表一种趋势。

连卡帕西都表示说的太对,反手给出一个认可:

这方法是真的好用。

以下是经过整理,更方便大家阅读的版本。

Enjoy。

Anthropic 工程师力推 HTML,为什么?

这种格式之争的内容,用对比方式呈现是最方便理解的。

在 Thariq 看来,HTML 大于 MD,有 5 点原因。

我把这 5 点都一条条列出来了,也做了图,大家可以对照着看。

1、信息密度碾压

Markdown 能做什么?标题、加粗、列表、代码块。差不多了。

但 HTML 可以做的事情,多到离谱——表格、CSS 样式、SVG 矢量图、JavaScript 交互、Canvas 画布、绝对定位的空间布局……

几乎没有任何一类信息,是 AI 读得懂但 HTML 表达不了的。

你可能见过 Claude Code 在 Markdown 里用 ASCII 码画流程图的样子,或者用 Unicode 色块去「估算颜色」的名场面。

就是这张图。

太心酸了,就像逼着一个画家用筷子画油画,还要求人家必须画出个蒙娜丽莎。

2、可读性

MD,性缩力拉满了。

Thariq 一直这么觉得,超过 100 行的 Markdown 文件,他基本就不读了。

更别提让团队里其他人去读。

这一点可太有共鸣了。

不知道大家是不是这样,反正每次 Claude Code 和 Codex 吭哧吭哧给我干出的两百多行的 plan.md ……我从来没认真看过。

瞟一眼,就一句「开工」发出去了。

但 HTML 应该会好一点。

AI 可以把同样的信息组织成带标签页、带导航、带折叠区块的页面,甚至可以做成响应式的,手机上看也舒服。

对比如下,瞅瞅——

说实话,左边的甚至会选择性忽略,大脑算力瞟一眼就感觉要不够用了。

没办法,sorry 了小 MD,咱们人类还是爱看图啊。

3、分享成本几乎为零

Markdown 文件你怎么分享?发附件。对方还得找个能渲染的工具打开。

HTML 呢?

往 S3 上一传,甩个链接,浏览器直接打开。

发给同事或老板,发给朋友炫耀,都很方便。

功利点说,HTML 就是颜值即正义,方便即正义。

你的 spec、你的报告、你的 PR 说明,被别人真正读到的概率,HTML 比 Markdown 高出太多了。

这也是为什么,AI 时代,个人网站成了新的简历形式。

4、双向交互

HTML 是可以交互的。

你可以让 Claude 给设计稿加上滑块和旋钮,拖一拖就能调整参数。

你可以让它做一个可拖拽的看板来重新排列任务优先级。

你甚至可以让它做一个实时预览的 Prompt 编辑器。

左边改 Prompt,右边立刻看到填充效果。

改完了点一个 Copy 按钮,把参数直接粘回 Claude Code。

5、快乐

这是 Thariq 给出的最后一点理由:

用 HTML 做东西,更好玩。

说真的,这可能是最重要的一条。

当你跟一个工具协作时感到快乐,你就会更愿意投入,更愿意打磨,最终产出的东西质量就是更高。

大家之所以会沉迷于 vibe coding,不就是因为找回了那份原始的快乐吗。

Thariq 的用法清单

不止是纸上谈兵,Thariq 自己早已成为忠实的 HTML 信徒。

他在文章里列了很多具体的使用场景。大家可以照猫画虎,用这个当入门教材。

1、规划和探索

开始一个项目的时候,不再写一个 plan.md,而是让 Claude Code 生成一组 HTML 文件。

先做头脑风暴,把几个方向做成可视化的对比页面。

然后,选一个方向深入,做 mockup、写代码片段。最后整理成一份实施计划。

有 Prompt,大家可以存一存:

我不确定入门引导页该怎么做。生成 6 种完全不同的方案——布局、语气、信息密度都要有差异——放在一个 HTML 文件里用网格排列,让我能并排比较。每种方案标注它做了什么取舍。

最后长这样。

2、代码审查

这个是真的刚需。

在 Markdown 里看 diff,太痛苦了。

但 HTML 可以渲染真正的 diff 视图,加上行内批注、按严重程度标颜色、画流程图来解释代码逻辑。

就像这样。

Thariq 说,他现在每个 PR 都会附一个 HTML 格式的代码说明。

我们自己内部也有一个类似的错误审查 skill,生成的就是 HTML,一眼就能看到错字。

3、设计和原型

这个就不用多说了,HTML 在交互方面就是天生优势,很适合用来做前端。

4、报告和研究

让 Claude Code 去翻你的 Slack、你的代码库、你的 git 历史、互联网上的资料,然后把所有信息整合成一份可读性极高的 HTML 报告。

可以是一份长文档,可以是一个交互式的解释器,甚至,可以是一个幻灯片。

5、一次性编辑器

这个玩法很有意思。

当你用纯文字很难描述你想要什么的时候,让 Claude 给你做一个「一次性编辑器」。

对,一次性,不是可复用的工具,就是一个专门为你当前这件事做的 HTML 页面。

比如你有 30 个 Linear ticket 需要重新排优先级。让 Claude 做一个拖拽看板,预排一遍,你调整完,点一下按钮导出成 Markdown。

或者说你在调一个 system prompt。让 Claude 做一个左右分栏的编辑器,左边改 Prompt,右边实时预览,带 token 计数器和 copy 按钮。

奢侈这一块,用完就扔。

但它帮你省下的时间和脑力,远超你花在描述需求上的 30 秒。

Q&A 环节~

写到这里,我知道有些朋友肯定要问了。

HTML 不是更费 token 吗?

其实吧,这篇文章下面不少网友也是在质疑这点。

有网友现身说法:

自己一个人同时维护 7 个项目,包括代码、设计稿、培训材料和学习模块。

他算了一笔账:

同样内容下,425 个 Markdown 文件一年大约烧 6600 美元上下文成本;换成 HTML 后,直接涨到 1.1 万美元。

等于每年多花 5000 美元,只是为了那些模型根本用不上的 HTML 标签。

甚至有网友调侃,这就是 Anthropic 的小阴招:

Anthropic 真是天才,竟然还能想到更快榨干大家 usage 的新办法。

好吧,Thariq 也承认,HTML 生成时间大概是 Markdown 的 2 到 4 倍。

但他觉得值。

因为你真的会去读它,而且读完之后获得的信息量远超一份你看两眼就关掉的 MD 文件。

而且,随着 Opus 4.7 的 100 万 token 上下文窗口,这点额外开销其实感知不强。

另一个问题,版本控制怎么办?

这确实是 HTML 最大的短板。

HTML 的 diff 很吵,很难 review。

Thariq 没有给出完美的解决方案。

坦率的讲,我觉得这个问题现阶段确实无解。

所以咱还是以衡量 trade off 为主吧,如果你用 HTML 的场景主要是一次性的规划文档、报告、代码审查说明这类东西,版本控制的需求本来就没那么强。

最后一个问题。

假如说,我真的被说服了,假如说,我从今天就开始用 HTML。

那——

怎么让 AI 生成好看的 HTML?

最方便的方式就是 skill,现在有不少前端设计 skill,用上后 AI 味确实会小很多。

但如果你想匹配自己公司的独特视觉风格,Thariq 的建议是:

先让 Claude 读你的代码库,生成一个设计系统 HTML 文件,然后用这个文件作为后续所有 HTML 的参考。

但提醒一句,前提是要有足够的数据资产,并且风格已经高度固定且成熟了。

不然后面可能会被污染,迭代成 AI Slop。

卡帕西也附议了

这篇文章发出来之后,全网都炸了。

连卡帕西都跑出来附议 :

当下最值得尝试的热门建议:试试要求输出 HTML。

但角度不太一样,卡帕西更宏观一点,他画了一条从文字到视觉的进化路线 :

纯文本(难读,费劲)

Markdown(加粗、斜体、标题,稍微好看点)

HTML(还是代码驱动的,但在图形、布局、交互上灵活太多了)

……

至于这条路的终点,卡帕西表示,可能是某种由扩散模型直接生成的交互式视频。

听起来很科幻?

其实吧,你看看最近病毒式传播的那个神经渲染 demo,也许没那么远。

就这玩意儿。

很多东西的实现成本,都被 AI 打爆了。

上面说的是输出形式的问题。

卡帕西还提了一个很有意思的点:输入端也需要进化。

光靠语音也不够,他觉得自己需要能「指」东西——

指着屏幕上的某个位置说「这里改一下」,就像你身边坐着一个人的时候会自然做的那样。

现在的解决方案是截图,或者像 Stitch 里那样可以圈出来,但大家肯定都能感受到,还是不够极致。

归根结底,人类和 AI 之间的输入 / 输出心智融合还在进行中,在脑机接口真的之前,还有大量进展空间。

哥白尼式智能观

太魔幻了,2026 年,HTML 真成了一种「编程语言」。

还是被 Anthropic 工程师认证的那种……

但我觉得,这件事的意义,远不止格式标准之争这么简单。

Markdown 也好,HTML 也罢,本质上都是为人机交互而生的一种范式。

Markdown 是为人类设计的。它简单、直觉、容易手写手编。它存在的全部理由,就是「方便人类使用」。

但现在,谁在写这些文件?

不是你。是 AI。

谁在读这些文件?

也越来越多地,不只是你。是你和 AI 一起读。

甚至有时候,只有 AI 在读。

确实,HTML 是有些信息冗余。

但它是半结构化的。能精确定位、精准修改,扔进浏览器就能直接出预览。

而这些特质,恰恰完美适配了现在的 vibe coding 工作流。

读完 Thraiq 的文章,最大的感叹是:

原来 AI 原生,一直是一件相当具象化的事情。

一切真的都在被改写。那些过去一切以人类为中心的规则,正在被冲击、被重塑。

CLI 正在回归,自然语言正在取代 GUI,代码本身正在变成一种中间产物,而不是最终产品。

所有曾经为了「方便人类操作」而精心设计的东西,都在被重新审视。

不是因为它们不好,而是因为它们曾经优化的那个唯一目标——人类体验——现在只能退居其次,变成众多目标中的一个了。

这让我想起陶哲轩说过的一段话。

他说,我们正在经历一场认知上的哥白尼革命:

曾经我们以为人类智能是宇宙的中心,而现在终于发现,宇宙中存在着各种截然不同的智能形态,各有其独特的优势与局限。

过去,一切以人类为中心。文件格式、交互界面、编程语言,乃至整个软件工程的范式,都围绕着「让人类更高效地表达意图」而运转。

而如今,这个中心,正在松动。

当创作者和消费者都不再是纯粹的人类时,那个为「纯粹人类」设计的世界,或许……注定会逐渐坍塌。

但有时我会尝试说服自己,真的,真的不要焦虑。

或许,这个旧「智能世界观」坍塌的过程,反而会帮助人类?

它会帮助我们,逼着我们在废墟中去重新找到那个——

「生而为人」,更精准的意义。

就比如当年,天文学家承认了宇宙的浩大之后,反而激起了人类更强烈的好奇心。所以我们更加渴望走出去了,所以我们更拼命地想跑得快一点,再快一点……

今天,AI 正把我们带进一个更远、更陌生的名叫「智能」的宇宙。

一切都回归了起点。大家都在同一片森林里,没人一开始就能看清全貌。

即便是 Anthropic 的工程师,也是摸爬滚打到现在,才突然意识到「HTML 当立」这件事。

所以,或许从现在开始,我们可以试着抛掉人类对于传统智能的那份固执。

试着从第一性原理出发——

去质疑一切吧。

Thariq 原文:

https://x.com/trq212/status/2052809885763747935

参考链接:

[ 1 ] https://x.com/karpathy/status/2053872850101285137

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

中国 AIGC 产业峰会最新嘉宾阵容来了

从 AI 最新架构到应用生态,从 AI 音乐、AI 漫剧、AI 浏览器再到世界模型、AI 硬件 ... 这一次,我们希望聚齐AI 赛道的实战派,百度、智谱、昆仑万维、模思智能、蚂蚁灵波都会来。了解详情

5 月 20 日,北京 · 金茂万丽酒店@所有人,马上 AI 起来! 

一键关注 点亮星标

科技前沿进展每日见

评论
大家都在看