作者丨朱可轩
编辑丨陈彩娴
受到姥爷影响,如果给人生写两个关键词,严訸首当其冲想到的是「工程」和「生意」。从小未曾想过长大要「进厂打工」,他创业的种子自初中便已在心中萌芽,产品基因也自此开始积淀。
那时每逢闲暇,他都会跟着百度贴吧大神复现各类产品,包括电磁炮、ZVS、特斯拉线圈等等,在多次尝试使用网购的模板、模块和套件做新产品后,他意识到了自身对产品有着浓厚的兴趣——
把板子焊得非常漂亮,抑或是用特斯拉线圈拉出来比较漂亮的电弧,然后拍照上传到网上。
初二那年,他用几种化学试剂大剂量混合,然后接通一次性二级大伙火头正负极,接入遥控模块后制作了一个遥控起爆的炸弹,在学校后山炸出了蘑菇云,严訸笑着提及这段往事。这朵蘑菇云也让学校两个足球场的人全都驻足观看,直至今日,同学还会拿这件事向身边人介绍他。
这种对产品的激情一直延续到了大学。大二开始,严訸四处参加创客比赛和黑客松比赛,并拿到了人生「第一桶金」——他做了一个种植箱并拿到了十万元奖金。自此,在大大小小的比赛上拿到的奖金累计几十万人民币,这也成为了他创业前期的启动资金。
他曾就读于全美第一创业学院巴布森学院,那时他认为至少大家都会是志同道合想要去创业的,但入学以后却祛魅了,「全世界没有人能教你创业」,他说。
后来,他曾蹲守在欧林工程学院的门口,见到一个人就叙述想法并展示自己的产品,试图寻找同路人,也的确和欧林工程、哈佛的人一同创业了一段时光,但最终祛魅,还是继续和熟悉多年的团队成员并肩作战。
「我认为我们经历了一些迷茫艰难的阶段其实有助于让一些并不坚毅以及并不真正相信自己的人主动离开,在融资以后你会发现发放股份变得越来越舍不得,而融资以前就坚定一起All in并且持续做出贡献的合伙人,就有一种你值得拥有的配得感。」严訸说道。
「创业本质是对全世界的祛魅」,这是第三次提到「祛魅」这个词,而严訸最终放弃了学术生涯,他选择了 All in 创业,当中原因有二:
一是当时拿到了融资,二是他觉得很焦虑,那段时间 AI 掀起的革命在不断刷新大家的认知,他认为自己不应该错过机会,并且人生永远可以再去读个学位,未来并不担心想重新上学而没有学上。
于是,在 2023 年,严訸正式加入硅谷创业大军,先是做了一款社交软件 MEEP 卖给了俱乐部,今年开始,他又投身 AI Agent Infra,并发布了 DeckSpeed、CoreSpeed 和 Zypher Agent,DeckSpeed 也被硅谷多家创业公司客户评价为「Cursor for Slide」。
他想要在这波 Agent 浪潮里重新去定义一种演示方式。
以下是 AI 科技评论与严訸的访谈实录,作者进行了不改原意的编辑整理:
创业是祛魅的过程
AI 科技评论:你为什么想创业,又是从什么时候开始决定 All in 创业的?可否分享一下心路历程。
严訸:我从小就没有想过要找工作,希望做一些跟自己有关的事情,我很看重一款产品我是不是创造者、拥有者之一,所以如果去大厂我会非常痛苦,这款产品做得好与不好和我无关。
很多人会说开始创业的信号是拿到了融资,我真正开始尝试创业是在两年前,之前一直没有 All in 创业是因为对自己还不够自信,只是知道在做自己的产品时,我是最有激情的,最终促使我 All in 的点在于我和合伙人真正开始对世界祛魅,其次才是融资。
我觉得创业本质是对全世界的祛魅,我永远不知道自己什么时候准备好,我们也一直在谈论怎么样应对竞争以及产品的壁垒到底有多深、多厚,两年前,我聊了很多世界最顶尖的企业家和教授,然后发现世界的确是个草台班子,没有事情是谁做不了的,自此,我开始觉得我要比别人做得更快、更好,所以开始 All in 创业。
AI 科技评论:你们的创始团队一共有几位关键成员?大家的背景分别有什么相同与不同之处?
严訸:我们创始团队一共有五个核心成员,目前开发者都是全职,其他找的是非全职。去年有十几个人,然后因为今年有很多工具的加持,每个人都能用 Cursor 同时开两三个窗口进行多线程开发,所以只留下了最优秀的人。团队成员几乎和我都是本科校友,我和苏豪、吴子昂、赵云鹏、Max 已经一起做过很多款产品了。
AI 科技评论:各自有什么特点和故事吗?
严訸:我们团队拿过英伟达黑客马拉松的全球总冠军,每个人几乎都累计拿过 6 位数奖金,也都发过很多 paper 但都没继续做学术。苏豪是 CTO,和我是本科校友,他初中开始尝试做一些产品,吴子昂、赵云鹏也是,大家都有一些共性,开始创办上一家公司的时候,我们一起用奖金凑了 80 万人民币。现阶段大家都是开发者,然后产品我来把关。
AI 科技评论:很多硅谷创业者会设一个 Hacker House,大家在一起办公和居住,你们也有吗?团队平时都是如何协作的?
严訸:我们团队也在 LA 租了一个 Hacker House 大家都住在里面。此外,美国有一款产品叫 Discord,我们会在 Discord 设立一个虚拟办公室,效率甚至高于线下协作形式,线下协作大家可能会距离过近,Discord 保留了隐私性。Discord 可以共享多个屏幕,大家可以边投着屏边干活,人均工作满 14 个小时,不包含闲聊、吃饭、睡觉、通勤的时间,这是非常高效的线上办公。
AI 科技评论:你们的产品是具体是什么时候开始做的?
严訸:我们 Zypher Agent 是今年开始做的,DeckSpeed 是基于 Zypher Agent 的应用,所以做得很快,但花了一个多月两个月时间优化,所以做得过程并不轻松。
AI 科技评论:对于创业而言,哪些人对你的影响与启发最大?
严訸:我必须提一下我姥爷,他是 51 年出生的,小学的时候就自己做了收音机,后来因为家庭原因他没办法参加高考,然后水泥工、电工都做过,一直到 30 岁了才有机会高考,考完以后就去浙江上大学了,学的是工业与应用建筑,回到老家以后开始各种画图赚钱,然后和土老板合伙开始做房地产生意,我从小在家见过很多工程图,经常在家里见到长辈们一起谈论工程和生意上的事情,感觉很酷。所以如果问我想成为什么样的男人,有两个人生关键词,一个是工程,一个是生意。
我高中读了中文版的马斯克传记,叫硅谷钢铁侠,看了两三遍,最后大学专业选的是物联网工程,一年后转学了计算机和金融,大学期间我做了很多自己的产品,硬件、软件都做过。
AI 科技评论:你认为自己的产品品味是什么样的?
严訸:我喜欢简约,我们官网做成了黑白的,本质因为我们做的是设计工具,如果不用黑白的话,色调会干扰用户对于审美的追求和判断,我喜欢留白的艺术,尤为讨厌视觉上繁杂并且 All in one 的界面,虽然我习惯了 IDE 比如 Visual studio 这种界面,但我还是觉得这种产品一点美感都没有。
AI 科技评论:为什么会选择办公这个场景?
严訸:我并非是选择了一个赛道,而是出于一种市场共识,文库、文档、办公作为刚需场景,市场很大,但是我发现在我做 PPT 的时候,没有找到一款 AI PPT 能放心、舒服地使用并交付,也没有一款真正能让你完全用自然语言表达,并且交互方式和 Cursor 类似的 PPT 产品,因此我选择做这件事。
AI 科技评论:你能否从创始人的角度介绍下 DeckSpeed,它的特点是什么?跟现有同类产品相比,它的革新体现在哪里?
严訸:一些声称能够生成 PPT 的产品,它们有一股 AI 味并且不能交付,一眼就能看出来是某产品生成的,我们做 DeckSpeed 和 CoreSpeed 的原则在于让大家真正愿意用它去做一个交付物。
我们和一些 AI PPT 工具不是一个层级的产品。一是实现方式和他们不一样,二是他们是要做一些传统的交付物,而我们做的是不套模板,是从 0 到1、从 1 到正无穷、有无限可能性的演示方式。套模板本质上是在迎合一些现有的工作流,而不是去定义一种交互方式。我不太愿意跟 PPT 产品去比,我是在重新定义一种演示方式,底层是 Coding Agent,大家更多会拿我们和 Cursor比,叫我们“Cursor for Slide”。
AI 科技评论:现在很多产品确实是先模版、再思想。
严訸:对。很多时候迁就模板会让大家忘掉原本想表达的东西,我特别害怕被限制,应该先做内容的表达,而不是因为迁就导致最后表达出来的东西和初始想法有出入。我们官网下面有一句标语是“要像老板一样去做 PPT”,我基本不愿意把时间浪费在做 PPT 上,但很多东西必须亲自去做,因为设计师抓不到重点,他们会为了美观把非重点的部分放上去,这是不行的,我还是希望 Agent 能让我专注于表达。
做 PPT 方向的 Cursor
AI 科技评论:ChatGPT 爆火这两年以来,你最欣赏的 AI native 产品是什么?
严訸:说到 AI native 产品,我首先想到的是 Cursor,我们团队都是 Cursor 的重度用户,Cursor 也给了我们一些产品灵感,CoreSpeed 解决了 Cursor 用户的后端集成难题,DeckSpeed 交互方式和 Cursor 一模一样,DeckSpeed 本质上是 Coding Agent-Zypher,就是写代码的 Agent,但是 DeckSpeed 产出是 PPT。
我有一天用 Cursor 去做了一个网页,转成 PDF 格式,然后拿这个东西来当成了我们的商业计划书,但是 Cursor 的界面长的是一个 IDE 的样子,和 Visual studio 一模一样,是面向于程序员的,所以不可能指望每个人都用 Cursor 去做 PPT,所以我们做了一个出来——给代码蒙一块布,布上画的是 PPT。
然后是 Cal.ai 这类移动端套壳应用帮用户做好了两点,一是降低了使用门槛,简化使用模型的步骤,二是管理好使用模型后的数据,这是独有价值,事实也证明这类产品收入非常不错。
AI 科技评论:现在市面上没有多少特别好的产品。举个例子,跨格式、跨语言的中文简历一键转换为英文简历的产品都没有。你怎么看?
严訸:其实 x 上的中文社区里有些开发者认知和效率都远超美国很多团队,他们人可能在国内,但只在推特上面发表自己的产品和言论,我观察来看,他们几乎不睡觉,发的东西前沿且工作量巨大。
把一个文档中译英后格式还不变这件事大语言模型本身是做不了的,一定得是 Agent 产品做,然后需要用一些自己开发的工具组合来完成。大语言模型本质上是在拓展能力边界,这个能力边界是没有问题的,但是需要分工合作,以及会把任务区分开而不是让一个工具去做所有事情,就像有做推理、编码或者翻译等的工具,而在幻觉的影响下,也会导致把不想改的东西改掉,比如让它只翻译,但它翻译完以后把格式也弄跑掉了,这是不对的。
Agent 做决策之前会先判断是改格式还是改内容,如果是改格式的话,那改内容的工具就不需要被调动了,这样才能保证稳定输出。我们 DeckSpeed 这个 PPT 产品完全可以做到这件事,比如一个动态图表上的小球是蓝色的,可以通过一句 prompt 让他把球变成粉色,它会很精准、不改变形状而只改变小球颜色。再比如,我需要在第六页生成简笔画,它就会生成然后放在合适的位置,本质上这个过程是适用于画图的,另一个 Agent 专门把关结构。
AI 科技评论:PPT 的制作过程需要输入比较多的内容,你们目前有支持语音输入吗?
严訸:语音还没有支持,但这部分不难,只需要把文字转语音加上去就可以了,需要语音表达的细碎要求可能已经在 PPT 制作的后期了,前期就是扔一个网站进去做一些图表、可视化。
AI 科技评论:有说法认为,没有基座模型与强化学习做不好 Agent。你同意这个观点吗?
严訸:从技术来讲,有自己基座模型和强化学习对齐能力的话,确实能够显著提升 Agent 的响应一致性和多轮表现的稳定性,尤其是在涉及比较复杂的任务分解和长期记忆、策略选择的产品时,这种观点是成立的,最近也涌现了一波产品说自己是通用的 Agent,但如果基座模型能做到这点的话,其实不需要所谓的通用 Agent。
而从工程上来讲,我觉得 Agent 是一个架构和策略的产物,DeckSpeed 就更加关注怎么样通过工具调用和任务调度来组织一个有长期记忆、阶段目标的系统化智能体。两周前伯克利发了一篇 paper,核心观点在于大语言模型目前的能力边界是非常广、非常大的,能力也很强,但是多数时候在一些场景下无法配合得很好,这本质上是一个组织管理的问题,几乎复现了人类组织管理混乱的情况,比如让做推理的 Agent 做执行是不行的。Agent 产品不只是在交互上有很大的优化空间,应用层和 Agent 调度的优化也能够决定产品能力的上限。
前段时间 GPT-4o 上新了生图模型,我当时做了一个决策就是第一时间把 4o 的API 调好、接好,之后作为主流的生图放在我们的 PPT 上,但是一直没有合并到我们的产品的主分支上,等 OpenAI 把 4o 的生图能力同步到 API 以后,我们就会立马把写好的分支给推上去,第二天就能让所有人在 DeckSpeed 上享受到最强大的生图模型能力,我认为这个方向是对的。单纯靠生图给 PPT 配图还要去来回切换、复制粘贴,之后还不知道布局在 PPT 哪一个位置,这是难点所在。
AI 科技评论:MCP 协议对于你们做 Agent 有什么影响吗?前后有什么比较重要的变化?
严訸:DeckSpeed 在 Slide 产品里是第一个支持 MCP 的 Agent,支持之后演示文稿实则已不再是单纯的演示文稿了,市面上所有的 AI 工具都声称自己可以生成 PPT,但实际上只是一个工作流,把大语言模型套进原来的办公流程,或者是简单拼接模板,解决的是点状的需求,没有真正进入结构化创作,DeckSpeed 选择的是更难、更有价值的事情,我们不是让你上传一个文档然后生成 PPT,而是从一个想法出发,然后把想法逐渐梳理成一套清晰的表达结构,解决的是怎么把一套理论讲清楚的本质问题,从内容的混沌到结构的清晰,从个人写作到 Agent 的协同,我们不只是做一款生成幻灯片的工具,而是打造一个 AI 驱动的表达系统。
我们有一款产品叫知之 zhizhi.corespeed.io,知之是可以把演示文稿或 PDF 文件上传,然后它自动给你转化成播客形式,这是传统做法,基于 MCP 则是在 DeckSpeed 里用自然语言对话做完 PPT 以后,再请它在演示文稿中添加播客内容,继而变成有声演示文稿,然后 DeckSpeed 会自动调用知之的播客生成服务的 MCP Server,将做好的 PPT 转化为有播客讲解和视觉演示的组合体,这就重新定义了演示文稿。
还有一个比较好的用例在于 MCP 不只是能让你调用一些外部的工具,还能让你调用一些原本拿不到的数据。比如有一个比较专业的工程管理、项目管理的产品叫 Linear,可以往 Linear 系统上发布一条一条的 KPI,就是任务1、任务2、任务3、任务4,然后让不同的员工、开发者去认领任务,一周结束之后,能在 Linear 上看到哪几个任务是被谁完成的。
举个例子,在写周报的场景下,Linear 是有自己官方的 MCP Server 的,我们的用户在 DeckSpeed 里接完 Linear 的 MCP Server 以后,就能在 DeckSpeed 里用一句话调用来自 Linear 的数据,生成周报,它给到的周报还会附有一些图表,比如饼图看工作结构,或者线图看工作时长趋势,最终实现可视化。总得来讲,DeckSpeed 基于 MCP 打开了无限的想象力,包括做周报、做演示的方式,生成的也已经不是传统的单纯文字、图片叠加的演示了。
AI 科技评论:前段时间有个帖子说到 Agent 的安全性和稳定性问题,有开发者分享了一段经历说他用 Agent 操作电脑,然后 Agent 把他的很多关键信息都删掉了,办公类场景下对于关键文件的保护相关问题你是如何思考的?
严訸:我觉得安全性和可靠性的锅不能甩在 Agent 本身上,而是在于设计 Agent 的人有没有提供足够的安全保障,这块我们加了一个错误检测 Error Detector,当中有一个标准是不能去动不该动的东西,以及在删除数据这样高风险的事情上,会提供有窗口让用户二次确认。
DeckSpeed 也做了一个版本管理的交互叫做 Accept 和 Reject,用户每说完一个指令、完成改动并看到出来的效果以后,可以点满意刚才的结果抑或是回滚到上一个版本(Accept,Reject),重新去写 prompt,安全问题都是可以被规避掉的。
00 后正在创造「风向标」
AI 科技评论:你们的核心壁垒是什么?
严訸:我们构建的壁垒在数据和用户的积累上,产品的壁垒或者说产品的方向选择的话,在于能够有一些工具复利。单独来看的话一个 Agent 也就那样,但是两个或者更多工具组合起来能实现比较牛的交付物的话,可能是对的方向。最重要的是,同一件事情的实现方式有 100 种排列组合,借助洞察力和快速迭代能力快速跑马圈地。用户增长方面可以抄 Cursor 作业,Cursor 的爆火也来源于很多人展示了自己用 Cursor 做出来的交付物,我们和 Cursor 走一样的路,然后让大家去看到我们的交付物有多牛。
AI 科技评论:你对 DeckSpeed 的后续打算是什么样的?
严訸:后续我会让大家去探索更多的关于 DeckSpeed 的用例,现在也有某知名的咨询大厂采用了我们产品,因为美国这边有很多员工每天都是在做 PPT 的,我们这款产品能够达到真正能交付、和研报一样级别的 PPT,他们采用我们的产品来减少自己员工的工时,即使后面要面向大 B 收费,也是先 To small B 然后 ToC,我打算先摸索一段时间。
AI 科技评论:你们目前拿到多少融资了?和投资人接触过程中有没有什么有意思的故事?
严訸:目前融了120万美金,CoreSpeed Inc. 这家公司今年年初刚开始,融资来自美国和香港。
我找投资会倾向于找懂我们产品的人,不太愿意让他看到一些别的除了产品本身和项目本身之外的别的东西,冲着光环来会悻悻离开,因为我们并不是带着多高光环的团队,最好是先知道产品,然后知道背后的团队。
我们现在的香港投资人是主动找过来的,他的职级已经达到合伙人级别了,在网上看到 CoreSpeed 然后过来聊了聊天就投了,还有一家美元机构的投资人是我校长的朋友,他们一起打了 15 年高尔夫,我们电话聊了 40 分钟,连我的面都没有见过就决定投资了。
我认为出场方式很重要,如果是主动去找一个人的话,他首先对你是一种防备的状态,而如果是一个他的熟人对你也充分了解的话,就是二度人脉,这样去认识的话,其实大家都非常认可对方,本身是敞开心扉的态度,然后以一个信任的态度去接触,他认可你做的事情,这样你就能占据更大的主动权。
真格基金之前推出了 1 亿元“00 后狠人计划”,一共入选了 17 个 Founder,我是其中之一,后来他们内部还在讨论怎么样给这笔钱的时候,我们这 17 个 Founder 都在外面陆续拿到了融资。
AI 科技评论:作为「00 后」创业者,你觉得你能给目前的科技创业圈、投资人与用户等,带来什么新奇的变化?
严訸:这是个很底层的东西,人永远会衰老,当人衰老以后标志着体能的下降,体能下降以后会导致对新鲜事物的接受程度不够高,年轻人的生活方式和对新鲜事物的接受程度决定了他们倡导了和年长者不一样的东西,由此他们的做事路径和想法都会发生很多改变,经验丰富的人懂得看一些风向标,但是当他看到风向标的时候,已经是有正年轻的人创造出来了风向标,这是极大的优势。
AI 科技评论:创业这两年来你最大的感受是什么?
严訸:爽。偶尔会有压力,但我每天都是快乐的,我没有什么喜欢的娱乐活动,因为我正在做自己喜欢的事情。现在最爽的事情就是每一次发布产品的前夜,团队会无限遐想大家看到这个产品的反响多好,我们会说这个绝对大火然后吊打所有人,处于自我陶醉的状态,而且如果能做到这种状态,也说明产品已经做得很好了。
AI 科技评论:你们是怎么保持创业节奏以及对于新技术的学习和知识更新的?
严訸:我们一直在做最新的东西,比如 AI PPT 的产品虽然是个老生常谈的话题,但是 MCP 协议就是在仅仅两个月前发布的。我们在刚发布这个协议时候就基于 MCP 做了 CoreSpeed,紧接着就是 Zypher Agent、DeckSpeed,然后把 DeckSpeed 做成了全网首个支持 MCP 的 Slide Agent,我们一直在最前沿去做事情,也希望在一些基础的模型能力更新后,能够让我们把产品做得更优秀。