AI最新资讯

腾讯混元提出HY-WU新范式，让大模型“现场定制”任务大脑

2026年3月8日

2026年3月6日，腾讯混元团队发布技术报告，提出一种名为“HY-WU”的创新技术方案，旨在突破当前大模型“一套固定参数应对所有任务”的根本性限制。报告指出，无论模型多大，固定的参数在面临多样化甚至相互矛盾的任务时，表现必然打折扣。

核心突破在于“动态生成参数”。与传统的“静态参数记忆”（如微调或LoRA）不同，HY-WU训练一个参数生成器。在处理每个具体任务时，该生成器会根据输入（如图片和文字指令）实时合成一套专属的LoRA参数，并将其临时插入到固定不变的基座模型中执行任务，任务完成后该套参数即被丢弃。这相当于为每个任务“现场定制”一个“大脑”，用完即弃。

效果验证与技术拆解。在图片编辑任务上，HY-WU在人工评估中对多个主流开源和闭源模型显示出优势。通过设计精巧的对照实验，研究团队证实，性能提升的关键并非源于参数量的增加，而是“为每个输入精准生成匹配参数”的机制本身。如果采用平均化的固定参数或让参数与输入错配，其优势将不复存在。

潜在影响。该技术被类比为继Transformer、LoRA、MoE之后可能出现的又一范式转换。它从“模型如何使用”的角度切入，尝试解决模型如何为不同任务提供差异化最优响应的难题。虽然目前仅在图片编辑领域得到验证，但如果未来能在语言、视频、智能体等更广泛场景复现效果，或将深刻影响大模型的发展路径。

腾讯HY- WU要捅模型天花板：让模型每次任务都生成个新大脑

腾讯混元提出HY-WU新范式，让大模型“现场定制”任务大脑

更多文章

美团发布LongCat-2.0：首个国产算力训练万亿参数大模型正式开源

CodeGraph 为AI编程助手配备“全景地图”

今日AI新闻

威斯康星大学麦迪逊分校突破AI能力天花板：重新定义大模型训练的记忆系统