AI最新资讯

Guide Labs 开源 Steerling-8B，推出全新可解释大语言模型，破解 AI “黑箱” 难题

2026年2月24日

加州旧金山，2026 年 2 月 23 日 —— 专注于可解释人工智能的初创企业 Guide Labs 今日宣布，正式开源其 80 亿参数大语言模型 Steerling-8B。该模型采用全新架构设计，实现了生成内容的全链路可追溯，为解决长期困扰行业的 AI “黑箱” 问题提供了突破性方案。

Steerling-8B 的核心创新在于其原生可解释性：模型生成的每一个 token 都能精准追溯至训练数据中的源头。这一能力既支持事实引用的参考资料核查，也能解析模型对幽默、性别等复杂概念的理解逻辑，从根本上提升了 AI 决策的透明度与可信度。

长期以来，可解释性与模型性能的平衡是行业难题。Guide Labs 首席执行官 Julius Adebayo 表示，Steerling-8B 在保持高透明度的同时，依然保留了宝贵的涌现能力—— 模型能够自主形成如量子计算原理等未经过显式训练的 “发现概念”，证明可解释性无需以牺牲性能为代价。

这一技术突破将为多领域带来变革，尤其适用于高监管与高风险场景：

金融领域：可确保贷款评估仅基于财务指标，排除种族、性别等受保护特征的干扰；
内容治理：助力平台精准识别并阻断版权侵权、暴力等违规内容，同时明确标注判定依据；
科学研究：为蛋白质折叠等领域的 AI 辅助研究提供可追溯的推理路径，加速科研成果验证。

作为 Y Combinator 孵化企业，Guide Labs 于 2024 年 11 月完成由 Initialized Capital 领投的 900 万美元种子轮融资。公司团队由来自 MIT、马里兰大学等机构的专家组成，在可解释机器学习领域拥有 20 余年研究经验，已发表 24 篇以上顶会论文。

据介绍，Steerling-8B 的开源是公司布局的第一步。未来，Guide Labs 将推出更大规模的模型，并开放 API 与智能体服务，让企业能够轻松集成可解释 AI 能力，推动可信人工智能在更多行业的落地应用。

Guide Labs 开源 Steerling-8B，推出全新可解释大语言模型，破解 AI “黑箱” 难题

更多文章

CodeGraph 为AI编程助手配备“全景地图”

今日AI新闻

威斯康星大学麦迪逊分校突破AI能力天花板：重新定义大模型训练的记忆系统

今日AI要闻摘要（2026-03-20）