AI想法
从信息“高速公路”到“垃圾场”:AI发展带来的数字污染
作者:0fate
从信息“高速公路”到“垃圾场”:AI发展带来的数字污染
1.导言
随着AI的越来越强力,项目开发的入门水平也越来越低,而其成果水平参差不齐,甚者无法使用。那随着这种AI项目越来越多,会不会降低网络水平,使获取有价值信息的成本增加。
2.背景
1.恐怖增长的GitHub代码提交量
以下GitHub首席运营官发的推文:
翻译中文是:
原文指如果按目前的增长率,到达今年年底,年提交量会从25年的10亿次到26年的140亿次,当然这是保持目前增长率的情况下。
但这样看可以说GitHub今年2026年前三个月的代码提交量是去年同期的14倍也没啥问题。
但这样看可以说GitHub今年2026年前三个月的代码提交量是去年同期的14倍也没啥问题。
而由此造成的是GitHub服务运行不稳定了起来。

而许多知名的开源项目维护者(Maintainer)反映,他们每天收到的 Pull Request(合并请求) 数量激增,但其中 70% 以上是由 AI 自动生成的。
2.搜索引擎搜索结果质量下降
你有没有发现现在的搜索引擎(百度、谷歌)搜索内容的最顶部往是“AI 写的 AI 教程”或“AI 总结的商品推荐”。这些内容看起来结构清晰,但往往缺乏真实的测试数据或独特的观点,只是在不断地自我复制和重新洗牌已有的互联网信息。
而且现在有这样一个名词 Slop Merchants(废料商人) :一批利用 AI 每天生成数万个网页的职业操作者。他们不关心内容的正确性,只关心通过这些网页获取广告费。
2026 年 3 月发布在 arXiv 上的论文 《“无穷无尽的 AI 废料流”:AI 辅助软件开发的日益负担》 指出,AI 生成的内容正在导致“知识共有地的悲剧” ,即:
个体获利: 初学者用 AI 快速写完作业或交付了平庸的项目。
集体受损: 全球代码库的技术债(Technical Debt) 激增,互联网知识库充满了高度重复的、没有新意的“洗稿”内容。
3.未来隐患
1.模型崩溃 (Model Collapse)
当网络上充斥着 AI 生成的项目时,未来的 AI 模型在训练时,不得不使用这些 AI 生成的数据作为素材。而这就像生物近亲繁殖一样,AI 会开始自我退化。它会遗忘人类语言中那些微妙的、罕见的、具有创造力的部分,最终输出的内容将变得极其平庸、充满偏见且错误百出。
2.认知能力的“外包”与技能断层
当新一代开发者不再经历“手动解决 Bug、查阅厚重文档、理解底层内存管理”的过程,而是直接跳到“生成结果”时,当出现AI解决不了的Bug时,靠谁来处理。
开发者(维护者)因为要处理无穷无尽的“AI 废料”而陷入倦怠。如果这群“守护者”离开,互联网的质量中轴线将彻底崩塌。
4.应对方式
1.GitHub针对开源维护者的“减负”工具
由于 AI 生成的 Pull Request (PR) 成本几乎为零,而人类审查成本极高,GitHub 在 2026 年 2 月推出了多项功能:
PR 创建门槛限制: 允许维护者设置权限,仅限仓库协作者或具有一定活跃度的真实人类账户提交代码,甚至可以一键关闭来自非信誉账户的 PR。
AI 辅助审阅 (gh-aw): 开发了一种“用 AI 检查 AI”的工具,根据项目的 CONTRIBUTING.md 规范自动筛选掉那些明显的“废料”代码。
一键彻底删除: 针对大规模生成的垃圾 PR,维护者现在可以批量删除并拉黑相关账户,而不再只是简单的关闭。
2.Google 的反击
Google 并非坐以待毙。在 2024 和 2025 年的多次核心更新中,Google 明确表示要打击 “大规模内容滥用”, 针对那些纯粹为了排名而大量生成、无原创价值的 AI 内容进行降权。并强调EEAT: 经验 (Experience)、专业性 (Expertise)、权威性 (Authoritativeness) 和 可信度 (Trustworthiness)。例如,Reddit 和 Quora 等论坛的排名大幅提升,因为 Google 认为那里至少还有真实的人类经验(尽管这也导致了另一种质量问题)。
3.治理模式的转变:从“开放”转向“受限信任”
正如前面论文中提到的“知识共有地的悲剧”,现在的趋势是重新建立信任边界:
禁止/限制 AI 贡献: 一些顶级项目(如 Linux Kernel、curl)已经实施了更严格的政策,有些甚至明确禁止未经标注的 AI 生成补丁。
AGENTS.md 规范: 开始流行在代码库中加入 AGENTS.md 文件,明确规定该项目接受 AI 辅助到什么程度,以及哪些部分必须由人类亲自编写。
数字指纹与水印: 开发者开始使用特殊的数字签名来证明某段代码或某篇文章经过了人类的逻辑验证和实测。
5.总结
互联网正从“信息高速公路”变为“数字垃圾场”吗?
互联网并不会“死”,它正在分层:
表层网正在迅速沦为“数字垃圾场”。这里充斥着 AI 生成的代码、毫无营养的营销推文和看起来专业但充满幻觉的教程。
而那些深层网,需要门槛、需要身份验证、需要真实人类汗水去维护的社群。
入门门槛的降低带来了生产力的繁荣,也带来来了一种“平庸的洪水”。 在这场洪水之后,衡量一个人水平的标志,可能不再是他能“做出什么成果”,而是他是否具备“不被 AI 废料同化”的独立逻辑能力,以及“在垃圾场中辨别金子”的鉴别力。