方思童
我是北京大学元培学院人工智能专业本科生,导师为杨耀东助理教授。我是北大对齐小组成员,同时担任逆矩阵科技(Physis AI)研究员。
我的研究聚焦于可信多模态人工智能与世界模型。我提出了 TruthfulVQA(ACL 2026),首个多模态真实性评测基准;以及 Debate with Images(preprint, 2025),基于视觉证据的多智能体辩论欺骗检测框架,与 MM-DeceptionBench,首个多模态欺骗评测基准。我也是 AI Deception Survey 的共同第一作者,该报告是首个国际 AI 欺骗系统性综述,图灵奖得主姚期智院士为通讯作者。
动态
- 2026.04 一篇论文被 ACL 2026 录用。
- 2025.11 AI Deception 综述发布,首个国际 AI 欺骗系统性报告,图灵奖得主姚期智院士为通讯作者。
- 2025.09 Debate with Images 发布,提出 MM-DeceptionBench 与多智能体辩论欺骗检测框架。
- 2025.06 Eval-Anything 在 PKU-Alignment 开源。
- 2025.05 获北京市自然科学基金本科生”启研”计划资助。
荣誉与奖项
- 2025 元培青年学者(仅 10 人)
- 2025 宋庆龄未来助学金
- 2025 受北京市自然科学基金本科生”启研”计划资助 (2023级人工智能方向本科生唯一)
- 2024 北京大学博雅奖学金
- 2024 北京大学招商证券奖学金
- 2024 北京大学学习优秀奖
- 2024 北京大学社会工作奖
- 2023 北京大学新生奖学金(一等奖)
- 2023 福建省高考物理类第一名
代表论文
2026
2025
经历
逆矩阵科技(Physis AI) · 研究员 · 2026.02 – 至今
致力于构建物理真实的世界基础模型与强化学习。
致力于构建物理真实的世界基础模型与强化学习。
北大对齐小组,北京大学 · 研究实习生 · 2024.12 – 至今
- 核心贡献者:Align-Anything (4.6k+ ★) — 全模态对齐框架
- 核心贡献者:Eval-Anything — 全模态安全评测框架
HKGAI 研发中心 / 香港科技大学 · 研究实习生 · 2024.12 – 2025.03
参与开发 HKGAI-V1,香港政府首个基于 DeepSeek 的本地化微调生成式 AI 模型,支持粤语、普通话和英语,具备本地化安全对齐能力。
参与开发 HKGAI-V1,香港政府首个基于 DeepSeek 的本地化微调生成式 AI 模型,支持粤语、普通话和英语,具备本地化安全对齐能力。
教育经历
- 2023 - 至今 北京大学元培学院,人工智能专业