加州旧金山,2026 年 2 月 23 日 —— 专注于可解释人工智能的初创企业 Guide Labs 今日宣布,正式开源其 80 亿参数大语言模型 Steerling-8B。该模型采用全新架构设计,实现了生成内容的全链路可追溯,为解决长期困扰行业的 AI “黑箱” 问题提供了突破性方案。

Steerling-8B 的核心创新在于其原生可解释性:模型生成的每一个 token 都能精准追溯至训练数据中的源头。这一能力既支持事实引用的参考资料核查,也能解析模型对幽默、性别等复杂概念的理解逻辑,从根本上提升了 AI 决策的透明度与可信度。
长期以来,可解释性与模型性能的平衡是行业难题。Guide Labs 首席执行官 Julius Adebayo 表示,Steerling-8B 在保持高透明度的同时,依然保留了宝贵的涌现能力—— 模型能够自主形成如量子计算原理等未经过显式训练的 “发现概念”,证明可解释性无需以牺牲性能为代价。
这一技术突破将为多领域带来变革,尤其适用于高监管与高风险场景:
- 金融领域:可确保贷款评估仅基于财务指标,排除种族、性别等受保护特征的干扰;
- 内容治理:助力平台精准识别并阻断版权侵权、暴力等违规内容,同时明确标注判定依据;
- 科学研究:为蛋白质折叠等领域的 AI 辅助研究提供可追溯的推理路径,加速科研成果验证。
作为 Y Combinator 孵化企业,Guide Labs 于 2024 年 11 月完成由 Initialized Capital 领投的 900 万美元种子轮融资。公司团队由来自 MIT、马里兰大学等机构的专家组成,在可解释机器学习领域拥有 20 余年研究经验,已发表 24 篇以上顶会论文。
据介绍,Steerling-8B 的开源是公司布局的第一步。未来,Guide Labs 将推出更大规模的模型,并开放 API 与智能体服务,让企业能够轻松集成可解释 AI 能力,推动可信人工智能在更多行业的落地应用。