作者|思航
出品|产业家
“Adept做的这件事,我感觉你们能做得更好”。
Adept是海外一家成立仅一年时间估值便突破10亿美元的AI Agent(智能体)独角兽公司,甚至在此期间,还获得了英伟达、微软和包括特斯拉自动驾驶负责人Andrej Karpathy在内的行业大佬,以及不少知名风投的站台。这家公司的使命便是,“创建能够像人类一样使用各种电脑软件完成工作的AI智能体”。
接到西湖大学科学家蓝振忠博士这通电话后,早已对Agent有所感知的孙林君发现,这与自己正在做的事不谋而合。
在大数据智能领域有着近20年经验的孙林君,先后任职于摩托罗拉和阿里巴巴的资深算法专家。2018年,就在大模型进入顶峰期的前几年,孙林君离开阿里,创立了实在智能。
彼时他所瞄准的赛道是数字员工,只不过在当时,数字员工还停留在RPA阶段,在孙林君看来,“Agent将会是是数字员工的终极形式”。
RPA做了一年后,孙林君便意识到RPA自身带有局限性,于是在2019年开始尝试RPA+AI融合的方式,即IPA来突破局限性,但这种融合终归还是“做加法”,想要彻底突破局限性,需要重构底层架构。
直到ChatGPT的发布,让这个有着阿里系和谷歌系的创始团队嗅到了属于他们的机会,用孙林君的原话说,“数字员工的终极愿景可能很快就要到来了”。
半年时间,这个有着强AI基因的团队便将行业首款Agent形式的产品发布出来。与此同时,实在智能也进入到关键一年。2023年,是实在智能完成转型的一年,也是国内Agent元年。
从比尔盖茨到李飞飞、吴恩达,无一不表达出对AI Agent的极大兴趣,甚至比尔盖茨还公开发文表示Agent智能体对未来工作的颠覆作用。据统计,过去一年,硅谷至少有100个项目有关Agent商业化,而国内也有700多亿人民币进入到Agent赛道。
而对于踩中风口的实在智能而言,Agent是他们终于等到的机会,也是实现自我突破的关键分水岭。
一、蜕变:看见数字员工的终极愿景
自大模型出现以后,一个最常听到的说法便是,大模型引领新的工业革命,甚至夸张一点,还有的把大模型比做蒸汽机。在科技圈内,一度出现两派观点,一方认为大模型早晚会取代人类工作;另一方认为大模型只能代替人类完成简单、重复性工作。
但如果严谨地说,大模型本身无法代替任何人类工作。由于其本身并不存在于真实世界中,因此大模型无异于“缸中之脑”,即它的逻辑链不能触及物理世界,永远无法与现实产生连接。
真正能代替人类工作的,并非大模型本身;而是让大模型长出“手和脚”的智能体Agent。
一个在财务场景真实发生的例子是,企业下载资金流水,需要登录到银行,选中对应时期,查询再进行下载。其实这样一套简单、重复性的操作完全可以用机器完成。
在过去,它依靠机器人半自动化的方式,但在这背后软件交付工程师需要将这一套流程的代码打出来,或者企业内部用拖拉拽的方式在独立的机器人上才能够完成;而如今在智能体上,一句自然语言口令便可以轻松搞定。
这种演进,也正是实在智能从过去RPA走向如今Agent的发展路线。
RPA做了一年后,孙林君发现RPA本身存在很强的局限性。局限之一在于有些工作纯通过RPA完不成,比如文字识别,这其中就涉及到通过自然语言处理来提取摘要或找关键词;再比如,在控制能力上,RPA的底层操作系统已经很难满足复杂环境要求,对此,实在智能的做法是将AI和计算机视觉(CV)融合进来。
自此,实在智能也正式从RPA阶段跨越至RPA+AI,即IPA阶段。在孙林君看来,“推出IPA的同时,也意味着实在智能从跟随走向引领”。
具体来看,从2022年末,实在智能发布智能屏幕语义理解技术ISSUT;到2023年中旬,发布自研垂直“塔斯(TARS)大语言模型”;紧接着,国内首个基于大模型的Agent智能体产品“实在Agent——你说PC做”在实在智能诞生。2023年末,实在智能获近2亿元C轮融资,与此同时,也标志着Agent的商业化。
从上述一系列产品发布的节点可以看出,从ISSUT到TARS,再到Agent发布,实际上,实在智能在过去一年时间里已然完成了对Agent底层架构的颠覆。“从RPA过渡到Agent,底层架构的确发生了深刻的变化”,孙林君告诉产业家。
对此,实在智能还做了一个形象生动的比喻,在Agent智能体当中,TARS大模型就相当于“脑”,而ISSUT则相当于“眼”,IPA则是“手和脚”。
而在问到“为什么选择自研大模型”的时候,孙林君给出的答案是,“因为市面上的模型无法满足实在智能的需求”。从RPA本身性质出发,它需要与各种软件进行打通,比如实在智能目前已经与市面上1000多款常见软件进行打通。
而对此,实在智能并非选择用API接口的方式,而是通过ISSUT这个“眼睛”的作用,可以自动识别任何软件的UI界面,再利用大模型的自主学习来完成一系列操作。
在这过程中,它所需要的是,底层的大模型要具备多模态能力。然而,在2023年8月,Agent发布之际,国内还并没有任何一家大模型有类似能力。
可以说,从底层架构的重塑,到自研大模型,种种信号仿佛都在表明,实在智能对AI有着极强的“掌控力”。一份成绩单同样也是最好的证明——过去六年时间里,实在智能已获超70项实授发明专利,其中就包括CV、ISSUT等等。
二、跃进:智能体的想象力有多大?
数据飞轮,是被大模型带火的一个词。
要知道大模型的三大要素便是算力、算法和数据。几乎所有大模型企业都非常看重数据资产。
一个最明显的例子便是,OpenAI于2024上半年宣布向用户免费提供GPT-4和4o模型,与此同时,也标注了通过用户对话数据训练模型,用户可以自行选择是否允许。
除了OpenAI,包括火山引擎在内的不少大模型厂商也都在提数据飞轮。而在大模型时代下,数据带给企业的作用就更加明显了。
对于为B端场景提供服务的企业而言,数据飞轮会帮助企业更快地“转起来”。比如在特定的金融、客服等场景下,在数据飞轮的作用下,流程操作会变得更加标准化,从而反哺给Agent企业。
图注:AWS数据飞轮,来源:AWS
“在软件上积累的大量数据都会让任务完成的更丝滑、顺畅。如果把世界想象成一个元宇宙,那么未来连键盘和鼠标都可能消失,就像星际穿越里的塔斯,只需要和他讲话可以完成很多的事情。”
这是孙林君赋予数字员工的终极愿景,而谈到这,它也是实在智能自研大模型TARS(塔斯)的命名由来。
“目前,智能体离这样的畅想还有一段距离。”孙林君坦率地讲到。然而,从星际穿越跳回到现实世界,智能体的想象力还能有多大?
年初,颠覆人机交互模式的AI电脑来了。2024年3月,英特尔的AI PC高调亮相,而AI PC所在的工作正是前文中提到的代替人类工作,对此,比尔盖茨也在公开信中表达了对AI PC小助手的美好畅想。
让AI PC真正照进现实的正是这家从RPA蜕变过来的实在智能。而在英特尔的发布会上,这款AI PC还是面向大量企业客户,尤其是政企客户。
实在智能在政企客户也有长期积累。在其服务的超2000家客户中,有上百家都是国央企及世界500强企业。
在最近刚落幕的世界人工智能大会上,实在智能还参与了“昇腾原生开发合作签约仪式”,基于华为昇腾开发,从而帮助更好地服务政企客户。
而现如今,实在智能的想象力则从B端走到了C端。
按常理讲,在B端深耕多年贸然转向to C,无论是从产品形态、组织架构,还管理理念和商业模式,思维上都有巨大的差异。然而不同的是,实在智能的使命是数字员工,从现阶段讲就是为员工打造一个“数字分身”。那么,实际上,实在智能的面向人群则是KP(Key Person),本质上依旧是C端。
而从产品的逻辑来讲,B端产品与C端产品最大的不同则在于,后者更注重用户体验。以实在智能为例,很多人不会写代码,需要上网查询。而对于实在智能而言,它能感知到的是大量用户的需求,因此这也很容易演变为商业化产品。
不仅如此,“数字员工”的愿景甚至从国内传到了世界各地。2024年是在实在智能完成Agent转型的关键一年,与此同时,数字员工也正在走向日本、新加坡、东南亚、北美以及欧洲等地。
从星际穿越到服务政企客户,从C端的想象力再到海外客户的认可,可以看到实在智能正在将数字员工的终极远景照进现实。也许,“人人都可以有属于自己的Agent”,就在不远的将来。
三、曙光:如何在SaaS淘汰赛和AI卡位赛中,实现双赢?
从2023年Agent元年,到2024年Agent商业化元年,近两年在这条赛道上发力的有互联网大厂,有大模型公司,有初创企业,也有从其他赛道上转行而来的企业。
似乎对于Agent这件事,大家的理解都各不相同。对于既有算力也有数据的云厂商而言,他们做Agent的思路是基于大模型构建智能体,相当于大模型的“子集”,让他扮演你想要的角色。
第二种则是像用友、金蝶等服务商为企业构建的企业级AI应用平台;第三种则是像钉钉、飞书这种将大模型能力集成在本身的协同办公软件上,而上述这些都可以称之为Agent智能体。
然而,对实在智能而言,Agent智能体的定义还有些不一样。正如前文所说,实在智能的使命在于打造数字员工,因此其所打造的Agent也是针对特定场景的智能体,比如在政务、银行、电商、保险、运营商等等场景,打造更为标准化的智能体。
与过去RPA相同的点在于,都是基于特定场景下的服务,只是用自然语言口令更为便捷;而不同点在于,基于底层架构上的重构,Agent智能体需要企业与客户共同构建RAG,从而保证更个性化地满足客户需求。
实际上,近两年,在Agent这条赛道上,有不少企业之前都是和实在智能并肩作战的RPA企业,比如壹沓科技;再比如从弘玑RPA离职创业的澜码科技,他们都带着些许的Agent基因。
那么,一个问题是,如果Agent是RPA的终极方向,那么这条赛道上,未来又将会呈现怎样的竞争格局?
如果站在Agent这条让AI创业者前仆后继想要涌入的赛道上而言,基于大家对于Agent的不同理解,短期来看未必会呈现出“竞争”关系,而是“强强联手”。
比如年初,实在智能就与同样是作为“AI超级助理”的钉钉达成合作,目前实在智能Agent应用已上架钉钉AI助理市场。
但与此同时,实在智能又不仅仅是新生代Agent企业,它更是从RPA进化而来的企业。
从这一角度来看,实在智能可以说既属于SaaS企业,又属于新时代的AI企业。然而,同样摆在实在智能面前的还有双重竞争,一边是SaaS企业的末位淘汰赛,另一边是AI公司的卡位赛。
有人说,大模型加速了国内数字化的转型,所以对于SaaS企业而言,AI是机会,但同时它也是挑战。
机会在于,用AI将SaaS重构一遍,势必会加速国内数字化转型,也会加速企业的数字化进程,而过去“大家对SaaS付费意愿不强”类似的问题也将不复存在;
但挑战也正在于SaaS企业自身的基因,是在SaaS的基础上加AI,还是用AI用重构一遍,将成为新时代背景下,SaaS企业的“末位淘汰赛”。
那么,AI对SaaS企业究竟意味着什么?在孙林君看来,“如果对于AI有一定掌控力或者有积累的企业,那么这个时代则正是构建护城河的最佳时机。”
与此同时,在AI这个新赛道,还会出现更多的竞争者。可以说,对于国内已经发展了十年的SaaS行业而言,目前已经有不少企业走向IPO,行业know-how的积淀也足够深,如果在此基础上加上AI能力,则足以构建起属于SaaS企业自身的护城河。
从目前的市场格局看,大部分已上市的SaaS企业和SaaS独角兽都已经在做SaaS+AI这件事,只是目前都处于试水阶段,还未有一家有显露出行业壁垒,现在能看到的都是“想象力”。
但对于这个在Agent赛道上屡屡先发制人的实在智能而言,从创始团队的AI基因,到其六年来所积累的行业经验,都在散发着一种独有的强者风范。