PinnedPinnedPrivate
appblit.com

Anthropic CEO 谈Claude、AGI 以及人工智能和人类的未来

达里奥·阿莫代把 Anthropic 面对的核心问题放在规模化与安全治理之间:更大的模型、更多数据和更长训练曾持续推高能力,反对规模化的理由也多次被新方法绕过,因此未来几年仍可能出现接近博士水平、可大规模部署的系统。真正的风险不只在模型更聪明,而在权力被少数组织集中后可能放大滥用和社会伤害。围绕 Claude 的对齐工作,则落在性格设计、微调、可解释性和欺骗检测上;Chris Olah 的机械可解释性尝试从神经激活反推模型内部机制,Amanda Askell 关注怎样让 Claude 更可靠、更有边界。这组对话把 AGI 讨论从概念拉回工程现实:能力曲线、部署规模、组织责任和安全研究必须同时推进。