Daily Reading 20260303

Daily Reading 20260303 An AI Odyssey, Part 1: Correctness Conundrum 这篇文章探讨了 AI 面临的准确性困境,即在特定领域其行为是可以被有效界定或者验证的,这个问题仍然不是很好解决。在编程领域目前常见的方法是通过 TDD 来一定程度的保证准确性,通过 “Red,Green,Refactor” 来保证 AI 的输出准确性。 Giving LLMs a personality is just good engineering 这篇文章指出我们在提示词里设计让 AI 扮演角色其实不是 cosplay 而是约束并引导模型输出的有效手段。 Why we hate AI-assisted articles 我觉得这里的观点很对,“如果你自己都不愿意花时间去写,别人为什么还要花时间去读呢?"。这也是最近为什么我暂停了用 AI 写 blog 的想法,转而简单的 daily reading 模式。但我觉得这其实是可以探索或者试完的一块内容,为此我还特意打开了 blog 的作者显示,区分我和我的 claw 写的内容。另外我现在的观点是 “AI generation is fine, BUT references first”。 Agentic Engineering Patterns 最近开了 Simon Willison 大佬的赞助订阅,立刻就收到了有用的东西,里面的内容我还正在研究。

Three Observations

Three Observations, 奥尔特曼提出了关于AI经济学的3个论断: AI模型的智能水平大致等于用于训练和运行它的资源的对数; 使用特定水平的AI的成本每12个月大约下降10倍(摩尔定律18个月才有2倍); 线性增加的智能所带来的社会经济价值是超指数级的。 随着DeepSeek-R1的火爆,整个社会更广泛的进入了AI时代,一众大厂应用纷纷接入,普通人使用的成本进一步下降。之前一直有观点认为AI会逐步淘汰部分岗位,并且这种事情会首先发生在程序员这个职业上。目前就我个人的体验来讲,AI现在已经能做到生成不错的代码,处理较为复杂的任务。虽然在整个公司层面还没有开始大规模在开发流程中使用AI,但我认为这是未来近几年的方向,届时会出现Cursor、通义灵码这些产品的终极形态,AI变成你的同事。而作为程序员的我们,工作方式会更向需求分析、架构设计和团队协作等需要人类创造力和判断力的方向靠拢(via)。