**每日精选10篇AI论文20...
发布者:麦子
**每日精选10篇AI论文2026.5.25**
数字AI(6篇) 一、SkillOpt:第一个系统化的Agent技能文本空间优化器 核心结论:提出首个像深度学习优化器一样对Agent技能进行系统化迭代优化的框架,在52个评估单元上全部最佳,GPT-5.5上将无技能准确率提升23.5个百分点。 Meta 二、ETCHR:通过图像编辑增强多模态推理,KimiK2.5提升4.6分 核心结论:提出解耦式图像编辑器辅助视觉推理,以无需训练方式接入不同MLLM。Qwen3-VL-8B提升4.82分,KimiK2.5(1T参数MoE)从76.55提升至81.16。 阿里Qwen团队 三、元认知即奖励MaR:Qwen3.5-9B超越GPT-OSS-120B 核心结论:受元认知启发的RL框架,通过知识和调节信号指导LLM推理。Qwen3.5-9B+MaR在22个基准上总体平均超越GPT-OSS-120B,最高提升11%。 Meta+阿里Qwen 四、免训练循环Transformer:推理时让冻结模型变强 核心结论:无需微调或架构修改,在推理时对预训练模型中间层进行循环精炼。Qwen3-4B在MMLU-Pro上提升2.64分,适用于7个模型家族。 阿里Qwen 五、LLM地缘政治偏见源于后训练而非数据 核心结论:测试7个开源LLM发现,地缘政治偏见在后训练阶段被主动塑造。Qwen2.5最显著:聊天版本中国偏好赔率变化18倍。 Qwen/Alibaba 六、法规问答时间性失效:评估OpenAI、Anthropic、DeepSeek 核心结论:5个LLM在时间敏感法规问答中原生模式性能严重下降,RAG显著提升,网络搜索存在近因偏见。 OpenAI/Anthropic/DeepSeek 物理AI(4篇) 七、Any2Any:宇树人形机器人高效跨具身全身追踪迁移 核心结论:全身追踪模型快速部署到新人形平台,无需从头大规模训练,大幅降低部署成本。 Unitree宇树 八、Fast-dDrive:高效块扩散VLM实现端到端自动驾驶 核心结论:解决高保真规划与高效推理矛盾,块扩散方案在边缘硬件上实现高效部署。 MIT ChainFlow-VLA:因果流规划解决自动驾驶时序推理难题 核心结论:解决时间因果推理与全局轨迹一致性不匹配,避免自回归解码误差累积。 MIT π₀-EqM:均衡匹配让VLA机器人控制更稳定 核心结论:提出均衡匹配方法实现更稳定的闭环机器人操控。 MIT