

月记·二零二五·十一月
2025-11-01 ~ 2025-11-30.
月记
前言#
十一月应该是 2025 年这一整年最忙的一个月,也是发生了很多事情,科研上学习上生活上,一些其实都在经历很大的改变,而我还在努力适应。直到写作此篇内容的时候,实际上我依然在为当初的欠下的一些账收尾。
聚散#
十一月份是一个分别的月份。
在实验室这边,大概是因为暑假是大家比较空闲的时候,因此大多数都是那个时候来实习,加上实习合同的时间,大多数人的实习合同都在这个时候结束。因为大家大多数都需要回去继续上学了,尤其是大多数人都是大四来,因此研一或者博一正好是回去的时候。
想当初还是和非常多的好朋友一起,大家一起做 InternVLA-M1,当然其中踩了非常非常多的坑,从当时的视角上来说,其实并不是一段非常快乐的时光,尤其是还比较抗压。不过实际上在时间的滤镜下,当时一步一步,然后迭代模型,做出很不错的作品,一起写技术报告,还确实是一个非常美好的回忆。和一批非常有才华的合作者一起共事过,可以说也是很荣幸了。
而至于学校这边,我在学校的主要时间其实都在 RM 中度过,虽然其实本质上我并不是一直都很对于 RM 上心。假如读者看过我的大一大二回忆录以及 RM 回忆录,那么应该大概知道一些。其实我主要在 RM 中做一些事情的时间也就是大一以及大二期间,那时候接任了视觉组组长,加上我在学校里非常要好的朋友(也算是在 RM 认识的朋友),GYT,当时也在队里,所以说投入的时间比较多。不过到了大三的时候,一方面确实很多我熟悉的人都是比我大一届的,大四大家都需要一些放松,因此大多数人都不经常来了;一方面也是我确实没有什么需求,比如说加分之类的,当时可以说我对于保研基本上已经四平八稳,因此继续留在 RM 也只是因为过去大家给了我很多帮助,因此我留下来带一带培训,给一些建议,但是大概也就是这样子,线下比赛其实都没去。到了今年 RM 几乎沦为仅仅提供工位的地方。
我认为是时候说再见了,继续呆在这里只会继续占用空间,虽然说我的存在多少还是有一些帮助,但是本身我自己也可以去到更加广阔的地方,于是就收拾东西离开了。只是在那里确实放了好多东西,把东西从 RM 的场地搬回宿舍,确实让胳膊废了好几天。
科研#
这周的另外一个主线其实就是科研了,也是一直以来的主题。
十一月份毫无疑问是无比忙碌的,主要体现在既要投稿 CVPR,还要去操心 ICLR 的 Rebuttal,最后的几周时间确实是十分折磨。说实话,CVPR 这一次确实给了我相当大的憧憬,一下子我的 Openreview 账号里面多出了四五篇的投稿,然而事实上是,最后就剩下了一篇论文。大多数的项目毕竟本来也就是混一手,倒也没有抱有太多的期望,只是之前忽然发现自己也到了成为 Paper Machine 的时候了吗,后面才开始醒悟,其实数量一直都不重要,不能只在得不到的时候说不重要。
我发现我确实并不是一个很擅长并行很多项目的人,或者通过自己的项目和别人进行很多利益交换来挂名很多项目的人。在我认识的朋友们中确实有着有这类能力的人,而且说实话,这需要非常大的精力投入,作为一个热爱 Technical 但是多半时候还是懒狗,只有进入心流才可以很有效率的人来说,显然并不适合这种多项目并行的推进方式,而是最好依然 Keep Focus(实际上,这也成为了我的飞书的个人签名,Stay Hungry, Keep Focus)。
甚至对于大多数读者可能不知道的是,大概是因为初中期间的一些压力或者什么问题,在大多数时候我会有一种常态的心悸的感觉,这种感觉是生理性的而非心理性(硬要形容的话,有点像是你小时候考试出成绩的时候等待过程中心脏揪成一团的感觉),这个症状从那时候一直持续到现在,似乎也没有什么办法。为数不多我可以做的就是列一个很长的 Todo-List,来记录全部我需要做的大大小小的事情,然后一个个完成,在全部列完并且干活的过程中处于心流,这时候才能稍微好受一点。据说这个症状是因为生理性高交感导致的。因此不难见得,实际上对于我来说,太多事情并行本身带来的难受就已经会相当使我难以集中注意力。
与此同时,我发现我并不能心安理得挂上一篇其实我并没有在时刻追踪进度的论文,因此最后还是把大多数的项目砍掉了,唯一参与的就是洋哥的 InternData-A1。InternData A1 可以说是目前具身智能仿真领域最大的数据集,我们在 Isaac Sim 中合成了大量的仿真数据,从技能数量上以及各种维度上都远超于之前的工作,并且实现了个人认为的两个重大 milestone。其一,InternData A1 在数据质量上达到了 Pi Dataset 水准。其二,InternData A1 也实现了完全的 sim2real 单任务后训练。这是一个为期一年多的项目,也是集合了基本上 SHAILAB 这边最擅长 Isaac Sim 的一批人,质量相当高。关于数据以及一些 Insight,我专门写了一个 Blog 来详细介绍。
这段时间在科研上发生了很多事情。实际上目前科研的速度越来越快,比如说对于真机 RL 这些事情的风向转变,对于数据采集的发展,对于模型迭代范式的收敛。这其中一方面确实是因为我做了一年的项目维护,某种后遗症是,我认为正常的论文是无趣的 incremental 内容,而难以找到可以让我兴奋起来的下一个有价值的事情。在过去的一年中,数据合成显然是一个相当热门的话题,并且也取得了相当不错的成果,不过现在伴随真机数采的发展,似乎业界正在逐渐统治这里。
GEN-0 的发布无疑是一个 Milestone,我的博客,GEN-0 以及后续的 VLA 发展的看法 详细讨论了这带给仿真的冲击以及其中可以告诉我们的内容。在这篇包含了我很多思考的博客写完之后,我也同样发到了小红书以及知乎,有些意外,又似乎是意料之中,还是获得了不错的关注度,很多比较有名的人转发了我的博客,还是很开心自己的想法可以被认可。
与此同时,就像上个月说到的,本身 GenManip 也在进一步的 Refine 过程中,并且发布了 1.0 版本,我们的官网 ↗ 详细介绍了 GenManip 1.0 的更新内容以及一些功能。本身 GenManip 是作为数据引擎以及 Benchmark Platform 存在的,在当下仿真数据在 Skill Level 的 Scaling 速度可能难以比得过真机数采来看,Benchmark 显然是仿真剩余的相当有价值的领域。以往的 Benchmark 其实都是作为一个 Benchmark 存在的,对于正常的 Model Based 的研究者来说,这意味着他们想要设置一个 Benchmark,要不然在已有的 Benchmark 的基础上进行修改,要不然就需要从头学习仿真的技术。GenManip 在其中其实就是 Highlight 可视化界面编辑场景,提供完整套件并且可以自定义新内容,来让用户可以通过 GUI + Config 的形式产出 Benchmark,从而回到 VLM 时代 Benchmark 的心流体验。
这个思想包括说搭建社区,确实也一直是中心的意愿,于是收到了上面的认可,因此在月中的时候,这个项目也就开始陆续正式跑起来了,我作为核心参与,与 Mentor 一级讨论,来推进整体的项目。抛开一些暂时无法透露的细节,确实和不少的朋友聊完之后,大家都是认为我的思想是比较切实且清晰的,算是不错的评价。说实话,Benchmark Platform 其实本质上就是某种产品,只是我确实想让 GenManip 发挥余热,以及为社区带来一些价值。
正是因为这些事情,所以 CVPR,ICLR Rebuttal 以及最新项目的推进,这些事情叠加在一起,导致最后的两周基本上都是三四点回寝室倒头就睡,然后睡到十点钟上班,中间少有休息,基本都是连轴转。好在好在,似乎是之前生过病透支了生病额度,这次身体倒是还算健康。
生活#
生活上依然是和乐小姐的二人世界排在第一位,每天和乐小姐在一起都非常开心,但是可惜不能说太多。
而另外一件大事可能就是我在中心的 Mentor 结婚了,于是我前往婚礼。因为我确实在人际交往中还是比较直率(类似于口头禅是 “to be honest”),同时能力在线,在前一年中基本上组里的很多内容都是我支持了交付,因此和 Mentor 的私交非常不错。我以及同组的劲辉、方靖,还有隔壁的洋哥,我们几个作为伦哥的伴郎团(准确来说劲辉是伴郎,但是我们也走完了从早上接亲开始的流程),去泉州参加了婚礼。作为在记忆清晰的时候还一直还没有参加过婚礼的我来说(似乎曾经参与过表哥的婚礼,但是确实记忆完全消失),一开始是忐忑,不过最后确实发现相当有趣。
值得一提的是婚礼是沙滩婚礼,因此在海边,在空闲的时候,在海边,一个人看着大海,想起来上一次看海可能还是初中,潮起潮落,令人内心宁静。
结语#
这大概就是这个月发生的事情,劳累,充实,但是绝对不想经历第二次。下个月只剩下一件事情需要做,更加聚焦,希望可以更加快乐。