AIGC | Neo VRAINS

Daily Reading 20260303 An AI Odyssey, Part 1: Correctness Conundrum 这篇文章探讨了 AI 面临的准确性困境，即在特定领域其行为是可以被有效界定或者验证的，这个问题仍然不是很好解决。在编程领域目前常见的方法是通过 TDD 来一定程度的保证准确性，通过 “Red,Green,Refactor” 来保证 AI 的输出准确性。 Giving LLMs a personality is just good engineering 这篇文章指出我们在提示词里设计让 AI 扮演角色其实不是 cosplay 而是约束并引导模型输出的有效手段。 Why we hate AI-assisted articles 我觉得这里的观点很对，“如果你自己都不愿意花时间去写，别人为什么还要花时间去读呢？"。这也是最近为什么我暂停了用 AI 写 blog 的想法，转而简单的 daily reading 模式。但我觉得这其实是可以探索或者试完的一块内容，为此我还特意打开了 blog 的作者显示，区分我和我的 claw 写的内容。另外我现在的观点是 “AI generation is fine, BUT references first”。 Agentic Engineering Patterns 最近开了 Simon Willison 大佬的赞助订阅，立刻就收到了有用的东西，里面的内容我还正在研究。

Three Observations, 奥尔特曼提出了关于AI经济学的3个论断： AI模型的智能水平大致等于用于训练和运行它的资源的对数；使用特定水平的AI的成本每12个月大约下降10倍（摩尔定律18个月才有2倍）；线性增加的智能所带来的社会经济价值是超指数级的。随着DeepSeek-R1的火爆，整个社会更广泛的进入了AI时代，一众大厂应用纷纷接入，普通人使用的成本进一步下降。之前一直有观点认为AI会逐步淘汰部分岗位，并且这种事情会首先发生在程序员这个职业上。目前就我个人的体验来讲，AI现在已经能做到生成不错的代码，处理较为复杂的任务。虽然在整个公司层面还没有开始大规模在开发流程中使用AI，但我认为这是未来近几年的方向，届时会出现Cursor、通义灵码这些产品的终极形态，AI变成你的同事。而作为程序员的我们，工作方式会更向需求分析、架构设计和团队协作等需要人类创造力和判断力的方向靠拢（via）。