去年,OpenAI創(chuàng)始人奧特曼在OpenAI首屆開發(fā)者大會(huì)上預(yù)測(cè),未來各行各業(yè),每一個(gè)人都可以擁有一個(gè)AI Agent。比爾·蓋茨也為AI Agent撰寫千字博文,稱AI Agent將徹底改變?nèi)藱C(jī)交互方式,并顛覆整個(gè)軟件行業(yè)。繼大模型密集爆發(fā)之后,AI Agent風(fēng)潮又席卷而來。
國內(nèi)的各科技巨頭也紛紛發(fā)布自家的AI Agent平臺(tái),如:釘釘?shù)腁I PaaS、百度智能云千帆大模型平臺(tái)、字節(jié)的扣子空間、訊飛星辰智能體平臺(tái)等等。未來已來,隨著AI大模型的不斷“演進(jìn)”,AI Agent大爆發(fā)的時(shí)代大幕,已經(jīng)拉開。

01 AI Agent“寒武紀(jì)”,大爆發(fā)
1、什么是AI Agent?
AI Agent作為新生事物,尚處于從理論到應(yīng)用的探索階段。2023年6月,OpenAI應(yīng)用研究主管LilianWeng提出:
Agent = LLM + 記憶 + 規(guī)劃技能 + 工具使用
2024年在紅杉資本的人工智能峰會(huì)上,吳恩達(dá)認(rèn)為Agent 應(yīng)該具備四種主要能力,即:反思(Reflection)、使用工具(Tool use)、規(guī)劃(Planning)以及多智能體協(xié)同(Multi-agent collaboration)。
不難看出,業(yè)內(nèi)大佬專家們對(duì)AI的理解還是大致趨同的,所謂Agent,我們可以簡單理解為一種能夠感知環(huán)境、自主決策、執(zhí)行復(fù)雜任務(wù)的智能實(shí)體。在當(dāng)前階段,Agent主要以大語言模型(LLM)為核心驅(qū)動(dòng)力,以記憶、規(guī)劃和工具能力為關(guān)鍵模塊。
2、AI Agent,大爆發(fā)
在距今5.4億年前的寒武紀(jì),地球上絕大多數(shù)的動(dòng)物“門”,都開始陸續(xù)出現(xiàn)。這一時(shí)期持續(xù)了兩三千萬年,并在此過程中出現(xiàn)了大量較高等生物,形成了物種多樣性的基本樣態(tài),成為地球生命的大爆發(fā)時(shí)期。類似于寒武紀(jì)生命大爆發(fā),BabyGPT、AutoGPT、Generative Agents等實(shí)驗(yàn)性產(chǎn)品的陸續(xù)問世,讓大模型的下半場出現(xiàn)了類似“寒武紀(jì)”般的Agent大爆發(fā)。所不同的是,寒武紀(jì)的生命是碳基生命,而當(dāng)前的AI Agent(智能體),則是硅基生命。
如同生命的演進(jìn),未來的Agent的世界,會(huì)有越來越多的應(yīng)用出現(xiàn)在應(yīng)用層上。并且會(huì)不斷升級(jí)迭代,“進(jìn)化”出更加復(fù)雜的智能形態(tài)。雖然目前來看,Agent能做的還比較有限,但諸如HuggingGPT,在局部模塊上已經(jīng)展示了其使用工具的能力。相信隨著技術(shù)的不斷成熟和進(jìn)步,Agent必然會(huì)像人類的進(jìn)化一樣,最終能夠做到思考、執(zhí)行、并自動(dòng)解決各種問題。
02 中國VS美國,AI Agent發(fā)展現(xiàn)狀
1、中國:巨頭引領(lǐng),初創(chuàng)涌動(dòng)
投資圈流傳這樣一個(gè)說法,“十個(gè)AI應(yīng)用里面,五個(gè)辦公Agent,三個(gè)AIGC”的境況。作為公認(rèn)LLM落地的最佳載體,Agent在國內(nèi)的發(fā)展勢(shì)頭,可以說是百舸爭流,熱鬧異常。
首先是巨頭引領(lǐng),率先發(fā)力。前面提到的釘釘、百度、字節(jié)等,是以平臺(tái)模式為主,為中小公司提供基建,類似open AI的GPTs。
AI PaaS 中包含模型訓(xùn)練平臺(tái)、模型調(diào)度平臺(tái)和插件開發(fā)平臺(tái) 三個(gè)部分。最底層具備AI基礎(chǔ)設(shè)施支撐,第一層開放了各類通用大模型和插件,企業(yè)可以通過大模型調(diào)取進(jìn)行調(diào)參,打造自己的專屬模型;第二層則是模型調(diào)度平臺(tái),包括上下文記憶、智能規(guī)劃、模板管理、通用能力和提示工具;運(yùn)用這兩層提供的工具和能力,生態(tài)中的企業(yè)可以開發(fā)出多種多樣的AI應(yīng)用,同時(shí),釘釘還在第三層提供了不同場景應(yīng)用和行業(yè)解決方案。
百度智能云千帆大模型平臺(tái),也是由AI基礎(chǔ)設(shè)施、基礎(chǔ)管控平臺(tái)、通用大模型訓(xùn)練、提示工程、模型精調(diào)、Prompt工程等功能構(gòu)成。它和AI PaaS各有千秋。相較而言,百度的大模型平臺(tái)的大模型訓(xùn)練,功能更加細(xì)化豐富,釘釘則更加注重流程的簡化,以此降低用戶的使用門檻。
除大廠外,專注應(yīng)用層的創(chuàng)業(yè)公司也都盯緊了Agent。它們往往船小好掉頭,尤其是專注垂直領(lǐng)域的企業(yè),更有機(jī)會(huì)快速創(chuàng)新并推出對(duì)應(yīng)賽道的產(chǎn)品與解決方案。
2、美國:先發(fā)優(yōu)勢(shì)明顯,場景大爆發(fā)
在整個(gè)AI領(lǐng)域,美國都擁有明顯的先發(fā)優(yōu)勢(shì),Agent也是如此,他們不光在技術(shù)上更領(lǐng)先一步,在應(yīng)用場景上也明顯更為豐富。比如微軟的AutoGen、OpenAI的GPTs,編程的Devin、客服的Agent4、零售的Regie.AI等。
AutoGen允許多個(gè) LLM 智能體通過聊天來解決任務(wù)。LLM 智能體可以扮演各種角色,如程序員、設(shè)計(jì)師,或者是各種角色的組合,對(duì)話過程就把任務(wù)解決了。
OpenAI的GPTs允許任何人創(chuàng)建一個(gè)定制版本的ChatGPT,它可以幫助你學(xué)習(xí)任何棋盤游戲的規(guī)則,幫助教你的孩子數(shù)學(xué),或者設(shè)計(jì)貼紙。任何人都可以輕松地構(gòu)建自己的GPT,而無需編碼知識(shí)。
Devin能夠規(guī)劃并執(zhí)行涉及數(shù)千個(gè)決策的復(fù)雜工程任務(wù),在每一步中都能回憶起相關(guān)上下文,并能隨時(shí)間推移學(xué)習(xí)并糾正錯(cuò)誤,它不僅能夠自動(dòng)完成任務(wù),甚至在幾分鐘內(nèi)就能自行編寫整個(gè)應(yīng)用程序。
Agent4可以理解自然語言,與用戶進(jìn)行流暢的對(duì)話,根據(jù)用戶的需求和偏好,提供個(gè)性化的服務(wù)??梢越勇牳髌放萍寄茉拕?wù),能夠按照知識(shí)庫及時(shí)準(zhǔn)確回答客戶,為客戶提供標(biāo)準(zhǔn)服務(wù),還能夠快速掌握公司的新政策、新業(yè)務(wù)。
Regie.AI可以創(chuàng)建自定義銷售序列,編寫高度個(gè)性化的電子郵件,并存儲(chǔ)相關(guān)的銷售內(nèi)容。它還與領(lǐng)先的銷售參與平臺(tái)(如 Outreach.io、SalesLoft和Hubspot)集成,減少了將消息傳遞到市場并初顯成效所需的時(shí)間。Regie.AI可以很好地用于零售和電子商務(wù),為用戶塑造與核心零售目標(biāo)和目標(biāo)相一致的定制且數(shù)據(jù)豐富的購物體驗(yàn)。
03 AI Agent離我們還有多遠(yuǎn)?
1、“大腦”還不完善
在AI領(lǐng)域,大模型被視為Agent的大腦,“多模態(tài)大模型+Agent”也被認(rèn)為是通往AGI的可行路徑。Agent可以通過不斷學(xué)習(xí),來適應(yīng)處于變化狀態(tài)的應(yīng)用環(huán)境,既能勝任已知多模態(tài)任務(wù),還可以快速應(yīng)對(duì)未知的多模態(tài)任務(wù)。但與此同時(shí),人們還對(duì)Agent抱有更高的預(yù)期,希望它能具有真正意義上的的創(chuàng)造性,通過對(duì)環(huán)境的自主探索,發(fā)現(xiàn)新的策略和解決方案。
但現(xiàn)實(shí)是,目前的大模型“大腦”并沒有非常完善,還不足以支撐Agent更大程度的發(fā)揮。這也是大模型尚未實(shí)現(xiàn)AGI(通用人工智能);多模態(tài)(圖片、視頻的識(shí)別和生成)還在發(fā)展之中(如sora等文生視頻大模型,還不夠完善)的最大Bug。
2、“手腳”還不夠強(qiáng)壯
不論是MCP、A2A協(xié)議的支持,還是現(xiàn)有網(wǎng)站、App的接口,它們好比Agent的手腳,一個(gè)健康的工具生態(tài)對(duì)于AI Agent的發(fā)展至關(guān)重要。最近一年以來Agent工具生態(tài)的發(fā)展很快,包括瀏覽器、編程IDE、向量數(shù)據(jù)庫等等,吸引了一大批創(chuàng)業(yè)者入局,Agent能夠調(diào)用的工具越來越多。但是從量變到質(zhì)變還需要一段相當(dāng)長的時(shí)間。
3、缺乏Agent通用外部框架
統(tǒng)一的底層開發(fā)框架,可以為AI Agent提供共享服務(wù)和功能,包括各種工具和庫,如用于處理數(shù)據(jù)的工具,用于訓(xùn)練和測(cè)試模型的庫,以及用于部署和監(jiān)控AI Agent的工具等。它可以幫助開發(fā)者快速開發(fā)和部署AI Agent,而無需從頭開始構(gòu)建所有的基礎(chǔ)設(shè)施和功能。
盡管已經(jīng)有一些開源框架可供使用,但是從可用到易用,還要走很長一段路。
4、百花齊放才是春天
在AI Agent的開發(fā)領(lǐng)域,目前有一些國內(nèi)外的大型的平臺(tái)和公司,已經(jīng)在進(jìn)行有效研發(fā)并不斷推出應(yīng)用,如國內(nèi)的釘釘、百度、字節(jié),國外的微軟、OpenAI等。但相對(duì)于“一(幾)枝獨(dú)秀”來說,形成“百花齊放”的AI Agent健康生態(tài),無疑更為重要。這在客觀上需要更多中小型軟件服務(wù)商參與進(jìn)來,共襄盛舉。
中小型軟件服務(wù)商由于對(duì)特定業(yè)務(wù)場景的深入理解,他們開發(fā)的AI Agent往往能更好地滿足用戶的需求,從而提高AI Agent的質(zhì)量。比如,一家專注于電商領(lǐng)域的軟件服務(wù)商,可能會(huì)開發(fā)出一個(gè)可以根據(jù)用戶的購物歷史和喜好,提供個(gè)性化推薦的AI Agent。此外,中小型軟件服務(wù)商由于規(guī)模相對(duì)較小,他們?cè)陂_發(fā)AI Agent時(shí),往往能更快地嘗試新的技術(shù)和方法,從而推動(dòng)AI Agent技術(shù)的創(chuàng)新。
04 AI Agent,革了toB軟件的命
1、toB軟件生態(tài)革命來了
AI Agent正在慢慢改變面向企業(yè)(toB)的軟件行業(yè)。未來的企業(yè),將更多地依賴于集成化的平臺(tái),如釘釘、飛書、企業(yè)微信等,這些平臺(tái)提供了一站式的解決方案,包括打卡、考勤、業(yè)務(wù)流程審批、OA、ERP、CRM等功能。這些功能都“長在”平臺(tái)上,也就是說,它們都集成在同一個(gè)應(yīng)用或平臺(tái)中,用戶無需離開這個(gè)平臺(tái)就可以完成所有的工作。這樣的設(shè)計(jì)使得用戶體驗(yàn)更加流暢,成本更低,效率更高。而這一優(yōu)勢(shì),必然會(huì)導(dǎo)致未來獨(dú)立入口的toB軟件越來越少。畢竟,沒誰愿意在多個(gè)軟件之間來回切換,低效、費(fèi)時(shí)又費(fèi)錢。
2、AI Agent 加速淘汰toB軟件
這些加速淘汰的toB軟件包括:簡單數(shù)據(jù)分析、標(biāo)準(zhǔn)流程類(OA、業(yè)務(wù)、營銷、財(cái)務(wù)等)、執(zhí)行自動(dòng)類(RPA軟件)、輕咨詢、傳統(tǒng)教育。
1)數(shù)據(jù)分析類
這類軟件可以對(duì)企業(yè)內(nèi)部和外部的海量數(shù)據(jù)進(jìn)行處理、分析和可視化,幫助企業(yè)做出更明智的決策。但隨著大模型技術(shù)的不斷發(fā)展,一些AI平臺(tái)就可以開始提供更加智能化的數(shù)據(jù)分析和預(yù)測(cè)服務(wù),從而讓這類toB軟件相形見絀,面臨被取代的窘境。
2)標(biāo)準(zhǔn)流程類
大模型強(qiáng)悍的數(shù)據(jù)處理和學(xué)習(xí)能力,可以通過對(duì)大量辦公數(shù)據(jù)的學(xué)習(xí)和分析,自動(dòng)化處理那些重復(fù)性高、規(guī)則明確的任務(wù),以此省去簡單重復(fù)但是耗時(shí)耗力的人工處理。因此,跟所有標(biāo)準(zhǔn)化程度高的職業(yè)一樣,OA(辦公自動(dòng)化)、業(yè)務(wù)審批流和營銷自動(dòng)化等標(biāo)準(zhǔn)流程類軟件同樣面臨著被取代的風(fēng)險(xiǎn)。
3)執(zhí)行自動(dòng)化類
這一類工具(RPA)的主要優(yōu)勢(shì)在于能夠模擬人類在電腦上的操作,從而在各種重復(fù)性高、規(guī)則明確的任務(wù)中取代人力。例如,在財(cái)務(wù)領(lǐng)域,RPA可以自動(dòng)執(zhí)行賬務(wù)處理、數(shù)據(jù)錄入、發(fā)票驗(yàn)證等任務(wù);在客服領(lǐng)域,RPA可以通過自然語言處理技術(shù)實(shí)現(xiàn)自動(dòng)回復(fù)客戶郵件、處理投訴等任務(wù)。但其缺點(diǎn)也很明顯,比如無法處理復(fù)雜和高度變化的流程,需要人類進(jìn)行決策和判斷的任務(wù)也不太適合使用RPA。
4)輕咨詢服務(wù)軟件
這類軟件可以幫助企業(yè)了解行業(yè)動(dòng)態(tài)、市場趨勢(shì)和競爭狀況,提供決策支持。但隨著AI技術(shù)的發(fā)展,大模型提供智能化的行業(yè)分析和咨詢服務(wù)其實(shí)更勝一籌,也更加便利。因此在未來,不只軟件甚至整個(gè)輕咨詢行業(yè),都會(huì)受到AI大模型的巨大影響。
5)傳統(tǒng)教育軟件
與傳統(tǒng)的線上教育軟件,如編程教育、英語陪練等相比,AI具有更明顯的優(yōu)勢(shì),比如AI大模型可以自動(dòng)生成教學(xué)方案,提供更加個(gè)性化、精準(zhǔn)的教學(xué)內(nèi)容,從而減少對(duì)人工教學(xué)的依賴。
3、三類軟件,會(huì)越來越好
這三類軟件是:復(fù)雜業(yè)務(wù)管理、擁有稀缺數(shù)據(jù)的、行業(yè)管理軟件。
1)復(fù)雜業(yè)務(wù)管理軟件
ERP、WMS和TMS等復(fù)雜業(yè)務(wù)管理軟件在企業(yè)中發(fā)揮著重要的作用,它們可以幫助企業(yè)實(shí)現(xiàn)資源的優(yōu)化配置、進(jìn)銷存的管理和運(yùn)輸過程的監(jiān)控。但是,復(fù)雜業(yè)務(wù)管理軟件往往需要處理大量的數(shù)據(jù)和復(fù)雜的流程,并且需要結(jié)合企業(yè)的實(shí)際情況進(jìn)行定制化開發(fā)。AI技術(shù)可以在一定程度上提供輔助功能,但想要做到完全取代,還是很難的。
2)擁有稀缺數(shù)據(jù)的軟件
一些行業(yè)類的軟件,如精密制造、離散制造等工業(yè)類軟件,以及新藥研發(fā)管理軟件、設(shè)備生產(chǎn)管理軟件等行業(yè)管理軟件,通常需要處理大量的數(shù)據(jù)和復(fù)雜的算法。這些軟件中的數(shù)據(jù)和算法往往是稀缺資源,只有少數(shù)企業(yè)能夠擁有。加上在處理高度專業(yè)化的數(shù)據(jù)和知識(shí)方面,人類的專業(yè)知識(shí)和經(jīng)驗(yàn)仍然具有重要作用,因此它的門檻相對(duì)較高,也難以被AI大模型完全取代。
3)行業(yè)管理軟件
設(shè)備生產(chǎn)管理軟件、新藥研發(fā)管理軟件、等行業(yè)管理軟件,在某些特定行業(yè)發(fā)揮著重要的作用。這類軟件可以幫助企業(yè)實(shí)現(xiàn)研發(fā)、生產(chǎn)、質(zhì)量、物料等管理的規(guī)范化、流程化和標(biāo)準(zhǔn)化。由于不同行業(yè)的業(yè)務(wù)和管理模式差異很大,而且這些軟件通常需要處理復(fù)雜的行業(yè)規(guī)則和知識(shí)。所以,AI技術(shù)很難針對(duì)每個(gè)行業(yè)開發(fā)出通用的行業(yè)管理軟件。
05 toB軟件,不出眾就出局
1、不出眾,就出局
AI大模型正在一步步鯨吞蠶食to B軟件的市場份額,這是一個(gè)越來越明顯的現(xiàn)實(shí)。但也并不代表toB軟件只能坐以待斃。由于對(duì)行業(yè)的深入理解,toB軟件公司可以根據(jù)行業(yè)的特性和需求,定制開發(fā)AI Agent。這些AI Agent可以更好地滿足行業(yè)的特定需求(醫(yī)療、金融等),提供更加精準(zhǔn)和有效的服務(wù)。比如,一家服務(wù)于醫(yī)療行業(yè)的軟件公司,可能會(huì)開發(fā)一個(gè)能夠幫助醫(yī)生分析病歷,提供診斷建議AI Agent,而這是其他“外行”很難做到的。
相比之下,科技巨頭如Google、Amazon等,雖然在AI技術(shù)上有著強(qiáng)大的實(shí)力,但基于時(shí)間成本和資源投入成本的考量,他們無法或不愿意深入到每一個(gè)特定的行業(yè),去理解該行業(yè)的特性、滿足該行業(yè)的特定需求。而這也正是toB軟件行業(yè)向死而生的關(guān)鍵路徑。
2、打不過就加入
AI發(fā)展到今天,有遠(yuǎn)見的toB軟件從業(yè)者,一定要樹立抱大腿、找大哥的意識(shí)。要有打不過就加入的“眼力勁兒”,要充分發(fā)揮拿來主義,管你是釘釘AI PaaS,還是百度智能云千帆大模型平臺(tái),都要“為我所用”,在這些平臺(tái)上選擇適合自己的模型和算法,快速開發(fā)和部署AI Agent,還無需關(guān)心底層的基礎(chǔ)設(shè)施和運(yùn)維問題。而且這些toB軟件,還可以通過服務(wù)從平臺(tái)上獲得更多的客戶,既增加了營收,還收集了更多的數(shù)據(jù),怎么算都合適。世事維艱,生存不易,這樣的羊毛薅起來,一點(diǎn)都不丟人。
喬布斯曾經(jīng)說過:“人們不知道他們想要什么,直到你向他們展示它?!?AI Agent正在向越來越多的世人、向各行各業(yè)的潛在用戶們,展示它們難以匹敵的能力和效率。toB軟件行業(yè)以及業(yè)內(nèi)人士們,是時(shí)候準(zhǔn)備做點(diǎn)什么了,與時(shí)俱進(jìn),薅AI時(shí)代的羊毛;或者調(diào)整方向,另做選擇,都可能是明智之舉,總之,大家該動(dòng)起來,做點(diǎn)什么了。您覺得呢?