【视频转载】对罗福莉的3.5小时访谈

幽灵 • 2026年4月26日下午2:42 • AI技术与行业 • 阅读 697

——AI范式已然巨变！OpenClaw、智能体框架、Agent范式很吃Post-train、卡的分配比例、巨变下的组织

索引

人物简介

罗福莉，1995 年四川宜宾人，国内顶尖 NLP 与大模型技术专家。北师大本科、北大计算语言学硕士，读研期间产出多篇国际顶会论文，学术实力突出。毕业后以阿里星身份入职达摩院，主导多语言预训练模型研发；后任职 DeepSeek，参与 DeepSeek-V2 大模型核心研发。2025 年加入小米，担任 MiMo 大模型负责人，主导小米自研大模型迭代落地。

采访者简介

张小珺，顶尖深度财经科技记者，北大、香港浸会大学新闻学背景，历任《财经》杂志、腾讯新闻潜望资深记者，擅长互联网与AI行业深度调查特稿，手握多篇现象级商业深度报道，斩获多项亚洲卓越新闻奖等权威新闻奖项，现阶段独立运营头部商业访谈播客，长期对话罗福莉、谢赛宁等一线AI领军人物，是国内科技创投圈极具影响力的内容创作者。

采访内容

俺自己听完了，3个多小时，倍速播放，这里有文字精炼的版本：

OpenClaw 相关情况：

对其认知转变：最初因追求顶尖编程体验排斥，使用后发现其自主性、有灵魂，能弥补模型短板，激发中层模型上限。
与其他框架对比：相比 Claude 等框架，OpenClaw有更持久的 memory 体系、能自主利用多模型弥补短板，且设计更适合日常场景。
火起来的原因：中国开发者对效率提升需求急迫，且国内有性价比高的模型，使用 OpenClaw能带来高性价比。
与过去 agent 概念差异：过去的 agent 框架简洁不通用，未达工业级可用能力，而 OpenClaw能让模型执行高复杂度任务，改变了模型生态。
安全性思考：认为可通过端云混合、隐私本地化推理缓解安全性焦虑，开源有利于集众人智慧共同解决相关问题。

研究效率与范式变化：

效率提升：agent 辅助下，研究效率大幅提升，可并行验证多个想法，且能自迭代进化。
研究方向转变：从 code 出发外延到其他领域，激发大模型潜力，靠群体智慧覆盖更多领域以提升模型泛化性。

团队管理与模型训练：

群体智能作用：模型训练需要群体智能，不同环节人员协作，让模型具备更好的 context，提升训练效果。
与团队管理相似性：都需要群体参与，且每个环节人员需足够投入和专业。

模型研发情况：

新模型情况：Proomni、TTS 等三个新模型在 agent 场景表现超预期，出于成本、速度等考量分开训练，未来需更好协作编排。
Flash 模型：核心定位是追求 non – context 效率，采用 Hyper 神经网络结构，结合 NTP 提升基座能力，具有速度快、成本低优势。
模型结构选择：MTP 因能提升推理效率、降低成本，但 MA 在特定时期有优势，未来模型结构设计需考虑 post train 周期和场景变化。
训练挑战与卡需求：训练 1T 模型面临全方位挑战，数据方面问题相对较小，更需解决训练中的数值不稳定问题。研究、预训练、后训练卡的合理比例约为 3:1:1。

大模型训练挑战：

数据与问题挑战：更大模型对脏数据容忍度更高，训练中更大挑战是发现和解决问题，需建立严密监控系统洞察模型参数变化。
问题解决方式：发现问题后分析原因，如系数比、结构、Infra bug 等，可采用 clip、norm 等解决方案，跨团队协作效率低，小团队更高效，但训练周期可能拉长。

团队组织与管理：

团队规模与结构：团队约 100 人，包含数据、Infra、开发等链路人员，真正投入一代模型迭代的约二三十人，不设明确组和职级，避免扼杀创造力。
管理方式与驱动：采用超例外驱动管理，激发热情让大家自驱做事，通过让大家体验新事物、筛选有热爱特质的人来驱动热情。

模型技术要点：

1T 模型决策：涉及混合处理机制、EM 上下文窗口、MTP 等，提升稀疏比以提高架构效率，长上下文数据构造难，MTP 训练为提升基座能力和推理加速。
多模态融合：尝试将音频离散化建模，迁移到其他模态，权衡架构优雅性和成本，Omni 模型构建更高效 VLT，支持多模态，有促进智能的迹象。
TTS 模型：用优雅架构训练，泛化力好，能根据自然语言描述赋予情感和音律，但下限需弥补，目前限时免费开放 API。

模型发展与竞争：

发展路径对比：人类进化与大模型演变环境不同，模型进化路径更自由，语言之后，编码开发复杂度提升，机器人交互会涌现，但受硬件制约。
中美差距与竞争：国内部分模型厂商距国外顶尖代差约两三个月，比拼研究水平、技术敏捷性和拥抱新范式能力，推理需求将爆发，需考虑芯片产能和参数量规模。
发展阶段回顾：22 年 ChatGPT 激发模型智能水平，23 年开源团队追赶顶尖预训练模型，24 年团队组织调整适应后训练范式，25 年面临范式选择。
竞争新态势：大模型竞争从 Chat 过渡到 Agents，入场需 ET 基础模型和敏捷性，国内暂无公司同时具备，Code 在各范式有优势，RL 探索结果暂不分享，竞争维度和速度增加。

创业与开源：

创业机会：创业公司团队规模要求变小，借助 Agent 可实现，但需更低价模型和完善 Multi – agent 架构。
开源目的：开源加速进程，有利于框架、芯片、能源等环节，公司开源与否取决于自身战略生态位。

团队搭建与人才：

人才选择：更注重创造环境让能力快速习得，招人大二、大三本科生的比例增加，要求基础好、好奇心强、热爱驱动、有多样性。
适应人群：注重模型体验、与模型交互频次高的人及能适应 RD Infra 体系模糊性的人适合团队搭建方式。

个人感悟与预期：

自我成长：在否定中成长，心法是做符合价值观、对更多人有益的事，思考做公益组织支持基础研究。
工作状态：工作节奏是早上 11 点到晚上 12 – 4 点，睡眠需求 4 – 6 小时，认为做好当下研究即可。

相关内容

官方公众号原文

知乎：如何评价张小珺对罗福莉的3.5个小时访谈？

文章出自，本文观点不代表学姿势立场，转载请联系原作者。

AGI DeepSeek OpenClaw 企业管理小米推理智能体模型自我成长芯片训练

赞 (1)

打赏

微信扫一扫

支付宝扫一扫

关于作者

幽灵

231 文章

1.5K 评论

59 问题

41 回答

23 粉丝

很想离开这个世界，但有放心不下的人；太多遗憾和误会，不过统统接受；一无是处，却在试着改变。

【视频转载】在造价上亿的大楼当楼长！每天都要干什么？

【视频转载】在造价上亿的大楼当楼长！每天都要干什么？

上一篇 2026年4月25日下午10:36

声音克隆的进化与实操：从底层逻辑到商业落地的深度复盘

声音克隆的进化与实操：从底层逻辑到商业落地的深度复盘

下一篇 2026年4月26日下午5:01

发表回复

返回顶部