信任机器

尊敬的用户您好，这是来自FT中文网的温馨提示：如您对更多FT中文网的内容感兴趣，请在苹果应用商店或谷歌应用市场搜索“FT中文网”，下载FT中文网的官方应用。

我们目前所拥有的，大多是原则性的宣言、自愿性的承诺，以及事后补救式的监管。这些工具，对于一项正在以指数级速度渗透社会肌理的技术来说，远远不够。

真正有效的AI治理，需要几个层面的同步推进：

第一，组织内部需要重建“异见文化”和心理安全感。在AI开发和部署的团队中，必须有人被明确授权提出困难的问题，而不必担心被边缘化。这不是软性的文化倡导，而是需要制度设计——独立的伦理审查委员会、匿名反馈渠道、真正有效的内部举报机制。

第二，治理结构需要跟上权力的实际分布。OpenAI的案例清楚地表明，当非正式权力（投资人网络、员工生态、公众影响力）远超正式权威（董事会）时，传统的公司治理框架就会失效。我们需要重新思考，在AI时代，谁有资格、也有能力，对这些组织提出真正的问责。

第三，道德判断不能外包给算法。AI可以辅助决策，但不能替代判断。尤其是在涉及不同文化、不同价值体系的场景中，将道德判断交由一个本身就携带文化偏见的系统来处理，不是效率的提升，而是责任的转移——而且是一种我们很难追溯的转移。

第四，我们需要新的叙事框架。目前关于AI的主流叙事，要么是乌托邦式的技术解放，要么是反乌托邦式的末日预警。这两种叙事都无助于我们做出具体的、日常的、可操作的道德选择。我们需要的，是一种更诚实、更细腻的语言——承认技术的真实价值，也承认它真实的风险，而不是在两者之间反复横跳。

OpenAI的故事所提出的问题，远远超出了一家公司的边界。它们是关于信任、权力，以及在一个塑造我们世界的组织正以制度设计者从未预料的速度运转的时代，问责的边界究竟在哪里。

这让我们回到了Chris Olah在《Magnifica Humanitas》通谕发布后的那句感叹。当最顶尖的工程师开始从古老的人文典籍中寻找“对齐”的答案时，这本身就是一个巨大的隐喻：无论算法如何进化，无论算力如何指数级增长，最终定义“我们是谁”、“我们要去向何方”的，依然是人。

不是代码，不是模型，而是具体的人。是那些在会议室里敢于提出异见的人，是那些在董事会里坚持问责的人，是那些在效率至上的洪流中，依然愿意停下来思考“这是否正确”的人。

技术可以模拟智能，但无法模拟良知。在AI时代，人性不再是软性的装饰，而是我们最后的、也是唯一的防线。如果我们不能在人性的层面重建信任与责任，那么无论我们建造出多么强大的机器，最终都可能只是加速了失控的到来。

这不是一个关于某个CEO的故事。这是一个关于我们所有人的故事——关于我们愿意将多少判断力，交付给我们并不完全理解的系统；关于当那些系统出错时，我们是否还有能力响亮地说一声“不”；更关于在机器日益聪明的未来，我们是否还能守住那份生而为人、最质朴的清醒与担当。

注：本文仅代表作者个人观点

本文编辑徐瑾 jin.xu@ftchinese.com

参考文献：

Company Announcement (2025.5.5) Anthropic co-founder Chris Olah's remarks on Pope Leo XIV's encyclical "Magnifica humanitas."

Mai, K. M., Ellis, A. P., & Welsh, D. T. (2015). The gray side of creativity: Exploring the role of activation in the link between creative personality and unethical behavior. Journal of Experimental Social Psychology, 60, 76-85.

Mai, K. M., Welsh, D. T., Wang, F., Bush, J., & Jiang, K. (2022). Supporting Creativity or Creative Unethicality? Empowering Leadership and the Role of Performance Pressure: KM Mai et al. Journal of Business Ethics, 179(1), 111-131.

Vincent, L. C., & Kouchaki, M. (2016). Creative, rare, entitled, and dishonest: How commonality of creativity in one’s group decreases an individual’s entitlement and dishonesty. Academy of Management Journal, 59(4), 1451-1473.

Zewail, A., Figueroa, A., Graham, J., & Atari, M. (2026). Moral stereotyping in large language models. Proceedings of the National Academy of Sciences, 123(10), e2519941123.

读者评论

热门文章

相关话题

贝恩押中铠侠：AI热潮造就私募史上最赚钱交易之一

北欧生育扶持政策未见成效

美伊协议达成始末

AI巨头在定价权问题上吸取教训

用AI加速工业领域能效提升

年轻金融人才在AI时代脱颖而出所需的关键技能