2026年3月6日,腾讯混元团队发布技术报告,提出一种名为“HY-WU”的创新技术方案,旨在突破当前大模型“一套固定参数应对所有任务”的根本性限制。报告指出,无论模型多大,固定的参数在面临多样化甚至相互矛盾的任务时,表现必然打折扣。
核心突破在于“动态生成参数”。与传统的“静态参数记忆”(如微调或LoRA)不同,HY-WU训练一个参数生成器。在处理每个具体任务时,该生成器会根据输入(如图片和文字指令)实时合成一套专属的LoRA参数,并将其临时插入到固定不变的基座模型中执行任务,任务完成后该套参数即被丢弃。这相当于为每个任务“现场定制”一个“大脑”,用完即弃。
效果验证与技术拆解。在图片编辑任务上,HY-WU在人工评估中对多个主流开源和闭源模型显示出优势。通过设计精巧的对照实验,研究团队证实,性能提升的关键并非源于参数量的增加,而是“为每个输入精准生成匹配参数”的机制本身。如果采用平均化的固定参数或让参数与输入错配,其优势将不复存在。
潜在影响。该技术被类比为继Transformer、LoRA、MoE之后可能出现的又一范式转换。它从“模型如何使用”的角度切入,尝试解决模型如何为不同任务提供差异化最优响应的难题。虽然目前仅在图片编辑领域得到验证,但如果未来能在语言、视频、智能体等更广泛场景复现效果,或将深刻影响大模型的发展路径。