**每日精选10篇AI论文20...

发布者：麦子

**每日精选10篇AI论文2026.5.25**

数字AI（6篇）一、SkillOpt：第一个系统化的Agent技能文本空间优化器核心结论：提出首个像深度学习优化器一样对Agent技能进行系统化迭代优化的框架，在52个评估单元上全部最佳，GPT-5.5上将无技能准确率提升23.5个百分点。 Meta 二、ETCHR：通过图像编辑增强多模态推理，KimiK2.5提升4.6分核心结论：提出解耦式图像编辑器辅助视觉推理，以无需训练方式接入不同MLLM。Qwen3-VL-8B提升4.82分，KimiK2.5（1T参数MoE）从76.55提升至81.16。阿里Qwen团队三、元认知即奖励MaR：Qwen3.5-9B超越GPT-OSS-120B 核心结论：受元认知启发的RL框架，通过知识和调节信号指导LLM推理。Qwen3.5-9B+MaR在22个基准上总体平均超越GPT-OSS-120B，最高提升11%。 Meta+阿里Qwen 四、免训练循环Transformer：推理时让冻结模型变强核心结论：无需微调或架构修改，在推理时对预训练模型中间层进行循环精炼。Qwen3-4B在MMLU-Pro上提升2.64分，适用于7个模型家族。阿里Qwen 五、LLM地缘政治偏见源于后训练而非数据核心结论：测试7个开源LLM发现，地缘政治偏见在后训练阶段被主动塑造。Qwen2.5最显著：聊天版本中国偏好赔率变化18倍。 Qwen/Alibaba 六、法规问答时间性失效：评估OpenAI、Anthropic、DeepSeek 核心结论：5个LLM在时间敏感法规问答中原生模式性能严重下降，RAG显著提升，网络搜索存在近因偏见。 OpenAI/Anthropic/DeepSeek 物理AI（4篇）七、Any2Any：宇树人形机器人高效跨具身全身追踪迁移核心结论：全身追踪模型快速部署到新人形平台，无需从头大规模训练，大幅降低部署成本。 Unitree宇树八、Fast-dDrive：高效块扩散VLM实现端到端自动驾驶核心结论：解决高保真规划与高效推理矛盾，块扩散方案在边缘硬件上实现高效部署。 MIT ChainFlow-VLA：因果流规划解决自动驾驶时序推理难题核心结论：解决时间因果推理与全局轨迹一致性不匹配，避免自回归解码误差累积。 MIT π₀-EqM：均衡匹配让VLA机器人控制更稳定核心结论：提出均衡匹配方法实现更稳定的闭环机器人操控。 MIT