字节Seed揽5%顶尖大脑造7语修复神器,成本直降83%!: 字节 Top Seed 启动 2026 届招聘,瞄准顶尖博士 4 月 27 日,字节跳动 Seed 在其官微上发布了一则招聘启示,……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“字节Seed揽5%顶尖大脑造7语修复神器,成本直降83%!”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
字节Seed揽5%顶尖大脑造7语修复神器,成本直降83%!:
字节 Top Seed 启动 2026 届招聘,瞄准顶尖博士
4 月 27 日,字节跳动 Seed 在其官微上发布了一则招聘启示,宣布正式启动 2026 届 Top Seed 大模型顶尖人才校招计划,研究课题包括大语言模型、机器学习算法和系统、多模态生成、多模态理解、语音等方向,基本覆盖大模型研究各个领域,计划招募约 30 位顶尖应届博士。
值得一提的是,本届 Top Seed 强调不限专业背景,更关注研究潜力,希望寻找具有极强技术信仰与热情、具备出色研究能力、富有好奇心和驱动力的年轻研究者。
除了匹配研究价值的回报外,Top Seed 计划还将给予人才一流的科研环境和充分的自由度进行研究探索,鼓励不拘泥既有技术、探索智能上限,同时依托字节跳动丰富的应用场景,研究成果也将有广阔的落地空间。
InfoQ 了解到,Top Seed 人才计划是字节跳动去年 5 月发起的面向应届博士毕业生的招聘,同年 7 月,字节推出针对在校博士生的 Top Seed 研究实习生专项,共同为旗下豆包大模型团队筛选人才。
在字节跳动去年发布的该项目宣传视频中,该计划公布了希望招聘到的人才“一定是最顶尖的 5% 的人”,并希望他们去做 95% 的人做不到的事情。
在该段视频中,Top Seed 团队成员表示:“Top Seed 希望人才能够具备的最关键的能力是创造力,要敢于打破我们现在的认知,有坚定的目标和信念,对技术有极大热情,有想象力,有扎实的功底,动手能力强,有较强的好奇心,有探索欲,能够承受挫折。”
应届生已在重要项目中崭露头角无留学背景的人才很能打
值得注意的是,字节跳动在此次招聘启事中还透露了几位刚毕业的同学已经做出了一些有影响力的研究。
比如,Z 同学构建并开源了首个多语言代码修复基准 Multi-SWE-bench,在 SWE-bench 基础上,首次覆盖 Python 之外的 Java、TypeScript、C、C++、Go、Rust 和 JavaScript 七种编程语言,1632 个真实修复任务,是真正面向“全栈工程”的评测基准,其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
具体而言,这个 Multi-SWE-bench 到底能干什么用?答案是可用于评估和提升大模型“自动修 Bug”能力。
作为该篇论文的一作,昝道广就是上述提到的 Z 同学。
据领英信息,昝道广是中科院计算机科学与技术博士生,研究方向为大数据分析技术和人工智能技术应用研究、网络安全分析、威胁情报分析、系统安全、知识图谱、云计算技术,参与发表了 34 篇与大模型相关的学术论文,曾在中国科学院软件研究所担任高级工程师。
济南校区电气信息系计算机科学与技术专业 1 班的昝道广是师生眼里典型的“学霸”。在大学学期,昝道广学习成绩稳居专业第一, 8 次获奖学金;获发明专利 1 项、软件著作权 2 项,发表学术论文 5 篇;多次担任队长参加大学生数学建模、软件设计、算法设计、程序设计等各级竞赛,获省级以上奖项 9 项,获得 Java 高级工程师、IBM 软件工程师等证书……
去年,昝道广加入字节跳动并在短时间内构建并开源了首个多语言代码修复基准 Multi-SWE-bench。
另一位 Q 同学主导并开源了可以在虚拟世界中高效执行各类任务的多模态智能体项目深受开发者群体欢迎,Desktop 版本 GitHub Star 数破万。
UI-TARS 能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5 已在 7 个典型的 GUI 图形用户界面评测基准中取得 SOTA 表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
综合上述信息,InfoQ 推测,Q 同学是该论文的一作者 秦禹嘉。
秦禹嘉 专注于 LLM/VLM 类代理。于 2024 年从清华大学获得计算机科学博士学位,师从刘知远,2020 年于清华大学获得电子工程学士学位,导师为吴冀。
研究生期间,他曾在腾讯微信模式识别组担任实习生,导师为李鹏博士和林彦凯博士。他也曾创办了一家 AI 公司 SeqAI Inc. ,后又于去年 7 月份通过 Top Seed 计划入职字节跳动。
最后是 H 同学。他作为一作发表超稀疏模型架构 UltraMem 研究,有效解决 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,推理成本最高可降低 83%。
在 Transformer 架构下,模型的性能与其参数数量和计算复杂度呈对数关系。随着 LLM 规模不断增大,推理成本会急剧增加,速度变慢。
字节跳动提出的这款全新的稀疏模型架构 UltraMem 有效解决了 MoE 推理时高额的访存问题,还揭示了新架构的 Scaling Law,证明其不仅具备优异的 Scaling 特性,更在性能上超越了 MoE。
实验结果表明,训练规模达 2000 万 value 的 UltraMem 模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模 value 或 expert 开辟了新路径。
InfoQ 查阅论文发现,该技术论文的一作为 Zihao Huang。
根据 OpenReview 信息,Zihao Huang 于 2021 年硕士毕业于南开大学人工智能学院,同年加入字节跳动。
一流高校硕士、博士生、顶级学霸,这些都是已经进入 Top Seed 的人才身上的标签,也侧面反映了该项目的选拔人才标准——只要 5% 顶尖人才。
说完了对人才的要求,Top Seed 又能给予候选人提供什么呢?
技术大佬导师成“招聘法宝”
首先是钱。能提供行业 Top 级薪资待遇。据进入计划的一位北大的学生透露,实习工资被提到了 2000 元一天,要是按照一个月出勤 20 天来算,实习工资将达到月薪 4 万元,这在全行业来讲也属高薪范畴。
其次是资源(算力和数据)。据宣传视频中介绍,Top Seed 能够提供为人才充足的算力和数据支持。当同学们加入后,可以直接参与到问题定义和解决的过程中。Top Seed 会给予人才充分的自由度——虽然团队有统一的愿景,但实现这个愿景的具体路径可以由同学们自主选择。
在这里,最大的优势在于,许多产品都涉及视觉数据处理。这意味着一旦学生加入后开发出了新的视觉技术,可以快速实现应用落地。
第三,是顶级技术大牛带队和充分的自由度。Top Seed 另一最重要的资源和支持来自于优秀的团队。因为对于很多人才来讲,他们选择工作机会时看中的可能并非以上两点,而是能够与杰出的人才共同应对挑战性工作,这本身就极具吸引力。
此外,Top Seed 团队也表示,将会给予学生们更多的自由度,基本上不用做 PPT,也不怎么开会,将把更多的时间放在做正确的事情上。
那 Top Seed 背后的团队,到底藏着哪些优秀导师?根据宣传视频,我们来浅扒一下。
王明轩:Top Seed LLM 研究团队研究员,豆包大语言模型研究团队负责人,北航校友,博士毕业于中科院计算所;
项亮:豆包大模型基础设施团队负责人,2006 年毕业于中国科学技术大学自动化系,并荣获该校本科生最高荣誉奖——郭沫若奖学金。随后保送至中国科学院自动化所,并在杨青研究员的指导下攻读工学博士学位。毕业后,项亮任职于 Hulu 和宜信公司,从事视频推荐系统的研究和开发工作。他还曾任瓜子二手车首席科学家。
冯佳时:字节跳动研究科学家、豆包大模型视觉基础研究团队负责人,曾任新加坡国立大学电子与计算机工程系助理教授,机器学习与视觉实验室负责人。
王雨轩:豆包大模型语音部门负责人,本科毕业于北航,后攻读北京大学研究生,博士毕业于俄亥俄州立大学;
其他未出现在视频中的豆包大模型背后的技术专家还包括:
• 田值:豆包大模型视觉生成模型技术专家,在川大本科期间就以一作发布顶会论文,阿德莱德大学获博士学位;
• 严林:豆包大语言模型对齐团队负责人,研究生毕业于中科院计算所;
• 陈卓:豆包大模型音频生成研究团队负责人,西安交大校友,硕博毕业于哥伦比亚大学;
• 李成刚:豆包大语言模型预训练方向负责人,清华机械工程本硕学位;
同时,2 月份加入字节的谷歌 DeepMind 研究副总裁、现 Seed 基础研究负责人吴永辉,也出现在了可供实习生选择的导师行列。
大厂 AI 人才争夺战,为什么瞄准年轻人?
据智联招聘日前发布的《2025 年春招市场行业周报(第一期)》,春招首周,人工智能行业求职人数同比增速达 33.4%,位居行业第一;人工智能工程师的求职增速达 69.6%,位居职业榜首,平均招聘月薪超过 2 万元。
据脉脉高聘人才智库去年 9 月的数据,云计算、搜索算法、大模型算法、DSP 开发、反欺诈 – 风控算法 5 个岗位连续 2 年位列人才紧缺度前十。
AI 方向技术人才如此短缺,大厂难免纷纷下场抢夺 AI 人才。
2 月份,一则有关 DeepSeek 百万年薪招聘人才的消息引发了热议。据消息,DeepSeek 开出最高 98 万元年薪招聘 UI 设计师。网友们进一步挖掘之后发现,这家公司正在以极具竞争力的薪资招聘各种工程师,即便是非算法岗,也提供令人瞩目的待遇,最高月薪 9 万(合年薪 126 万)。特别是核心系统研发工程师,甚至包括了“校招应届生”这一范畴。
4 月初,阿里国际接连放大招。据阿里国际招聘官网消息,2026 届校招中 80% 为 AI 岗位,包括 AI 算法、研发、AI 产品经理等。同时,启动了面向全球的头部 AI 科技人才培养计划 Bravo102。
4 月中旬,腾讯宣布启动史上最大就业计划,三年内将新增 28000 个实习岗位并加大转化录用,其中仅 2025 年,就将迎来 10000 名校招实习生,有六成面向技术人才开放。
腾讯方面表示,今年开放的校招实习岗位涵盖技术、产品、设计、市场、职能等五大类 70 余种岗位,包括大模型、研发、算法、市场、策划、运营、销售、美术等多个岗位职能。同时,在大模型加速落地的背景下,腾讯加大了人工智能、大数据、云计算、游戏引擎、数字内容等技术类岗位的招聘力度,技术类岗位“扩招”力度空前,占比超 60%。
但有个值得深思的信息是,无论是阿里、字节还是腾讯这类大厂还是 DeepSeek,他们砸下重金招聘的往往都是应届生,甚至是一些本科生、硕士生以及实习生,为什么会这样?
在 InfoQ 近期的一次访谈中,中国人民大学信息学院院长、计算机系教授柴云鹏表示,之所以出现这种情况,是因为“在计算机领域,尤其是工科,很多人的创造力最活跃的时期是在 20 多岁到 30 出头。这个年龄段的人学习能力强,也有一定的经验。但到了 40 岁左右,学习能力可能会变慢,整体节奏也会放慢。特别是在 AI 时代,适应新事物的能力会变弱,而 AI 团队需要快速响应,一旦有新的思路,就要争分夺秒地去实施。加班能力也很重要,而年轻人在这方面更有优势”。
他还表示:“从这个角度看,吸引刚毕业或工作没几年的年轻人是比较划算的。比如,人大信息学院的进人策略也是这样,主要精力放在引进年轻人。只需要少量有经验的人来带领团队。比如,一个有经验的人带领十几个年轻人,这样的战斗力可能是最强的,性价比也很高。从头培养年轻人有很多好处,比如增强归属感和协同沟通能力。”
理想的创新团队年龄结构不能太大。从这个角度看,DeepSeek 的策略是合理的。此外,AI 领域与其他领域不同,它本身就很新,资深人士的经验作用并不大,甚至可能因为固定的思维方式而产生阻力。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“字节Seed揽5%顶尖大脑造7语修复神器,成本直降83%!”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~