

关于去年一年的事情,具体的经过以及细节,在各种的大学回忆录以及月记中都有所提及,这里就不再赘述。事实上年终总结还是保持去年的色彩,比起来其他为诸位读者写下的内容,这篇更多是为我自己而写,思考以及总结。
事实上前几天才写完大三回忆录,也就是从去年九月份到今年九月份的这一年间发生的事情,以及后面四个月的月记也已经写完了四分之三。总是重复已经发生的事情实在有些无聊,就比如我发现我需要反复提及我参加 SHAILAB 的夏令营的相关经过,在我印象里绝对不下三次。
所以让我们保持聚焦。聚焦以及迷思也绝对是 2025 年的主题。
回顾目标#
在去年的年终总结中,我在结束的时候写下了一些计划,现在让我们回顾一下,看看有没有实现。
- 产出三篇以上的科研工作:勉强算是完成。四月份中稿的 CVPR,GenManip 是我的第一篇具身相关的论文;之后在九月份的时候发表了 InternVLA-M1 的技术报告,作为核心贡献者;ICLR 的一篇 VLA 相关的投稿,因为匿名规范在这里不过多赘述;InternData-A1,作为贡献者,是非常有影响力的具身相关工作。总的来说一共四篇,达成目标。
- 前往 SHAILAB 直博:圆满完成。作为具身中心非常受欢迎的我(确信,大概如此),因为一直在积极实习并且贡献主线,加上机试面试也都很优秀,成功直博 SHAILAB / SJTU CS。
- 在 Github 累计 commit 三百天:勉强完成。没有细数,但是似乎满打满算刚好三百天。这些日子里主要还是更新博客为主,以及有自己的几个小项目,和 CS-BAOYAN 的开源维护。
- 写三百篇论文感想:没有完成。按照具身相关的 Paper Reading 25 篇一个 Batch 来说,我积累了 200 篇需要阅读的,但是只记录了其中的 150 篇。不过现在依然在持续更新中。之前的一段时间中我都是通过常规的搜索而不是刷 Arxiv 来积累论文阅读,直到后面搭建了 Arxiv 每日邮件推送的服务,一切才开始稳定增长。
- 每天写代码六小时、读论文一小时、跑步一千米:代码的六小时似乎稳稳保持住了,毕竟每一天都是高强度的工作,别说六小时,实际上可能十小时都可以把握,全年无休;不过也是因为工作压力,阅读论文以及跑步似乎都难以保持。整体姑且算是失败。
- 写万字的小说设定:本来想要开展一个放松身心的项目,不过事实上完全没有开始。
- 更新西安交大生存指南:完成。西安交大生存指南这个项目在更新一段时间之后迎来了 Archive,主要是因为社区的支持似乎完全不存在,因此本来面向全体学生的指南,似乎里面只能包括我对于泛计算机专业的 Bias。后续我也转换了策略,转为开始写一个专门为泛计算机专业学生而写的指南,也就是 致新生的你,仅仅通过人与人之间的推荐传播,就已经在我的个人网站上面获得了几千次访问。我甚至可以说,这篇指南绝对是我目前见过最为本质且快捷的泛计算机专业学生指南。
- 坚持写周记:勉强算是完成。今年直到十月份的周记都在稳定更新,但是似乎并无法保证质量,因此后面切换为了月记。
总的来说,大部分的目标都算是完成,只有少数几个目标没有完成。
聚焦#
今年的关键词其实相对简短,第一个就是聚焦。
事实上在来到 SHAILAB 之前,我一向幻想大实验室是某种可以轻易达成 Paper Machine 成就的人,不过实际还是事与愿违。一方面可能确实是我的多线程能力有限,再加上线上实习,所以并没有挂上任何的论文。
同时,另一方面,GenManip ↗ 让我发掘具身智能 Manipulation 领域中相对有价值的内容,即当前的数据缺口需要更多的数据合成。GenManip 聚焦于数据合成,并且和同实验室的洋哥那边的 Simbox 进行了更多的合作。同时 GenManip 支持的数据合成以及测试的闭环也是重要的 Feature,除此之外 GenManip 有大量的 Utils 以及工具,可以合成多样且 Scalable 的数据,感兴趣的读者可以看官网。
长期的工程实践以及和别人的交流让我意识到,一直聚焦于专门的领域相较于大量广泛的发 Paper 而言,似乎更具有价值。我一直认为科研的价值在于对于领域以及技术本身的贡献,而并非是对于论文数量的追求。
同时,在领域中足够聚焦之后,可以期待的是,并非很多项目是我自己需要参与的,而是因为自己的项目不错,所以很多项目需要我的加入。因此在今年晚些时候,我也成功参与了 InternVLA-M1 以及 InternData-A1 两个项目,从而狠狠混贡献。
基本上在数据最为匮乏的时代,GenManip 在中心内部迭代并且产出了 InternData-M1 并且支持 VLA-M1 模型的迭代,而在此之后,GenManip 也会继续履行其作为仿真平台的职责,来作为 Benchmark Platform 进行最后的一次升级。也正是因为聚焦,所以后续顺理成章成为了中心这方面项目的 1/4 个 Leader,来带领团队做一个有价值的 Codebase 平台,以及后续可能有的社区以及 Benchmark 本身。
同时前几天也是成功入选了星启实习生,算是一个大概圆满的结局。
迷思#
聚焦本身意味着我开始思考在科研中真正本质的东西,也就是以 The Bitter Lesson 所倡导的,以统计学习以及预训练为发展脉络的迭代路径本身。在这个时代中可以说群雄并起,具身智能领域中尤为如此,诸多明星研究员,大量的资本涌入以及数不清的初创企业,这使得领域内的迭代节奏远超常规。
做出令人印象深刻并且有意义的工作是很困难的,而且往往意味着你需要做一件需要一年的事情,而不是简单的一件只需要三个月的工作,在仿真以及数据的故事即将走到终点的时候,下一件更加重要的事情在哪里,我还在思考。
当然,今年在发表完 InternVLA-M1 之后,我写下了不少的博客,关于自己在当前时代下的思考,感兴趣的读者可以翻阅 The Dark Side of the AI;以及对于领域目前的观察,也就是目前的 具身十日谈 系列的博客。
迷茫是目前,也注定是未来一年的主色调,在经历了高速迭代并且富有激情的一年之后,我似乎注定需要慢下来思考了。
更多,开源#
当然,笔者开源相关的底色还是不变的。InternVLA-M1 的 Codebase 转化为了 StarVLA ↗ 这个广受欢迎的项目,我正在其中进行贡献;我的博客 致新生的你 获得了广泛的传播以及赞誉;今年和 Tianxing Chen 一起做了 Lumina 具身智能社区 ↗,虽然说后续我已经化身混子,不过反正大概还是有一些贡献的。
同时一些社交媒体上的发声也在进行。今年将自己具身十日谈系列的两篇文章转载到了小红书以及知乎,获得了大量的关注,关于 GEN-0 以及之后对于数据相关内容的思考也是被很厉害的大佬转发关注。总的来说还是很有进步。
另外,乐小姐#
和乐小姐的二人生活还在继续,因为实习的工作,所以有了更多的工资,可以让乐小姐过上更加幸福的生活。有的时候其实会想,这是不是一种代偿心理呢?虽然我喜欢科研,但是确实失去了时间,那么对于乐小姐,乖巧可爱的她,还是自由些吧,自由地开心地长大,自由地开心地生活。
我们两个人的关系也在发生着有趣的变化,虽然不能说,但是 Anyway,我爱她。
以及一切#
今年也发生了不少的事情,比如说保研;比如说大三生活的结束,最后一门考试也离我远去;比如说给新生做了几次的分享,很多同学找到我表达感谢,很多同学从中收获了很多。有的时候我在想,是不是我做出的点滴举动确实像是蝴蝶的翅膀,可以改变很多事情呢?
好在一切,一切顺利。从更多的决策上,其实今年有过不少失误决策,但是结果是好的,算是相对成功的失败吧;然而更遥远的未来也确实充满着未知,结果是什么样子我其实不知道,从很久之后来看,似乎这是一个彻底失败的成功。
最后,作为一切的尾声,还是列下下一年的计划,一年之后看看一切如何:
- 产出三篇以上的科研工作
- 积累 300 篇论文阅读记录
- 积累 10 篇科研感悟的博客
- 维护 3 个有影响力的开源项目
- 攒下月薪 * 倍的积蓄(暂时不透露,不过大概我自己清楚)
- 坚持写月记
- 尝试并且保持健身
新年快乐,明年见。