AI 編程領(lǐng)域開(kāi)始進(jìn)入混戰(zhàn)模式,大廠也在開(kāi)啟 " 降維打擊 "。
近期,先是 OpenAI 宣布 Codex Agent 編程模式,微軟正式開(kāi)源 GitHub Copilot Extension for VS Code 項(xiàng)目,而后谷歌就公布其 AI 編程 Agent 工具 Jules 私有預(yù)覽版,緊接著大模型創(chuàng)企 Anthropic 也正式發(fā)布新一代模型:Claude Opus 4 和 Claude Sonnet 4,作為面向 AI 編程能力的最強(qiáng)模型加持。
這些動(dòng)作背后其實(shí)都在共同指向一類對(duì)手:當(dāng)前最熱門(mén)的 AI 編程助手 Cursor、Windsurf 等,這些風(fēng)頭正勁的創(chuàng)業(yè)企業(yè)在別人的規(guī)則下,如何繼續(xù)玩下去?對(duì)于微軟和谷歌等大廠而言,AI 編程有利于補(bǔ)強(qiáng)云服務(wù)生態(tài)黏性。對(duì)于同時(shí)提供 B 端和 C 端服務(wù)的大模型公司,提供擅長(zhǎng)編碼任務(wù)的模型 + 下探到 Agent,可能是在大模型商業(yè)化路徑上的一次重大機(jī)會(huì)點(diǎn)。
異步 + 混合
微軟對(duì)于 AI 編程的布局更為體系化,圍繞生態(tài)布局,而谷歌從近期的打法上看,則更圍繞產(chǎn)品服務(wù)。
對(duì)于微軟而言,GitHub Copilot 是自 2021 年起作為主流集成開(kāi)發(fā)環(huán)境 IDE 如 VS Code 的插件而提供給用戶。因此開(kāi)源 GitHub Copilot Extension for VS Code 的核心第一步其實(shí)就先將插件開(kāi)源。據(jù)微軟團(tuán)隊(duì)所述,接下來(lái)幾個(gè)月內(nèi),還要將 GitHub Copilot 擴(kuò)展的 AI 功能引入到 VS Code 開(kāi)源存儲(chǔ)庫(kù)。也就是說(shuō),后續(xù)開(kāi)發(fā)者基于 VS Code 無(wú)需插件就可以體驗(yàn)到 GitHub Copilot 功能。
對(duì)于這一點(diǎn),微軟的解釋是:通過(guò)開(kāi)源 GitHub Copilot 插件,能夠與更大的社區(qū)合作,并更快推向市場(chǎng),與 AI 編程軟件開(kāi)發(fā)生命周期保持一致。
微軟此舉可能意在與 Cursor 競(jìng)爭(zhēng),畢竟 Cursor 是對(duì) VS Code 進(jìn)行魔改了,雖然耗費(fèi)了大量技術(shù)和工程能力,但從結(jié)果上看,Cursor 獲得了大量用戶的歡迎,這顯然對(duì)微軟 VS Code 的開(kāi)源生態(tài)帶來(lái)了不小觸動(dòng)。
此前 Wing VC 合伙人 Zachary DeWitt 在其專欄中提醒道:" 微軟也可能簡(jiǎn)單地切斷 Cursor 和競(jìng)爭(zhēng)對(duì)手與 VS Code 核心 API 的連接或更改條款,使其更難在更新的基礎(chǔ)上構(gòu)建。Cursor 對(duì) VS Code 的依賴顯示了建立在他人平臺(tái)上的不穩(wěn)定性。"
如今來(lái)看,大企業(yè)支持開(kāi)源的核心目的是構(gòu)建自己的生態(tài)圈,吸引高質(zhì)量開(kāi)發(fā)者和高質(zhì)量代碼貢獻(xiàn),但這并不意味著開(kāi)源不會(huì)存在商業(yè)沖突。從最近修改 VS Code 插件許可協(xié)議就能明顯看出微軟的不滿,著手生態(tài)戰(zhàn)是必然。
再看谷歌。如果不是 I/O 大會(huì),外界對(duì)谷歌的印象還停留在:遭遇美國(guó)司法部的反壟斷訴訟案,以及對(duì) AI 搜索市場(chǎng)的格局影響性上。
最近半年,谷歌對(duì) AI 編程也在暗戳戳布局,先是對(duì)其 AI 編程助手 Gemini Code Assist 進(jìn)行免費(fèi),又或者推出新的人工智能集成開(kāi)發(fā)環(huán)境 Firebase Studio。不過(guò)直到現(xiàn)在,谷歌還沒(méi)有推出一款能夠引領(lǐng)此次 AI 編程潮流的重量級(jí)產(chǎn)品。
據(jù)谷歌官方介紹,Jules 可以將復(fù)雜的任務(wù)分解成更小的步驟,根據(jù)用戶指令進(jìn)行調(diào)整,并運(yùn)行單元測(cè)試來(lái)驗(yàn)證其工作。Jules 并非一款簡(jiǎn)單的代碼自動(dòng)補(bǔ)全工具,其功能覆蓋了從開(kāi)發(fā)到測(cè)試的多個(gè)環(huán)節(jié),能夠在云端啟用虛擬機(jī)、復(fù)制 GitHub 倉(cāng)庫(kù)、規(guī)劃多步驟開(kāi)發(fā)任務(wù),并自動(dòng)執(zhí)行包括 Bug 修復(fù)、版本升級(jí)、測(cè)試編寫(xiě)以及代碼優(yōu)化等操作。最終,Jules 會(huì)生成 Pull Request(PR)供開(kāi)發(fā)者審查,確保代碼質(zhì)量與項(xiàng)目進(jìn)度。
不過(guò),此次 Jules 升級(jí)后最大的不同的是聚焦 " 異步任務(wù) " 編碼,這與此前所熟知的 " 實(shí)時(shí)協(xié)作 " 不同。例如,Cursor 和 Windsurf 這些工具通常與開(kāi)發(fā)人員需要實(shí)時(shí)協(xié)作,在輸入代碼時(shí)提供代碼建議或重構(gòu)代碼,本質(zhì)上充當(dāng)了 IDE 角色。而" 異步任務(wù) " 則意味著開(kāi)發(fā)者無(wú)需逐行交互地工作,而是為 Agent 分配一個(gè)特定的、可能很復(fù)雜的編碼任務(wù),然后 Agent 將接管該任務(wù),在后臺(tái)進(jìn)行獨(dú)立處理,并在完成工作后呈現(xiàn)。
值得注意的是,微軟本周宣布 GitHub Copilot 升級(jí)為全功能編程 Agent,同樣具備 " 異步任務(wù) " 的自主代理模式。Copilot Agent 最初于今年 2 月推出預(yù)覽版。
調(diào)用 Copilot Agent 后,開(kāi)發(fā)者可分析整個(gè)代碼庫(kù)、跨文件編輯、生成和運(yùn)行測(cè)試、修復(fù)錯(cuò)誤,甚至建議終端命令,并在代碼投入生產(chǎn)之前幫助解決這些問(wèn)題,所有這些都只需一個(gè)提示即可完成。
目前 Agent 功能是直接嵌入到 GitHub Copilot 中,一旦用戶分配任務(wù),該 Agent 就會(huì)開(kāi)始工作。
不過(guò)這在谷歌看來(lái),二者產(chǎn)品還是有所不同:Copilot Agent 類似于單個(gè)開(kāi)發(fā)人員獨(dú)自執(zhí)行計(jì)劃,而 Gemini 則采用 " 混合 Agent" 方法,需要多個(gè)專業(yè) Agent(如開(kāi)發(fā)人員、測(cè)試人員和安全分析師)協(xié)同工作。這些 Agent 本質(zhì)上是 " 彼此對(duì)抗的合作者,以便檢查彼此的工作 ",類似于聊天室里的虛擬團(tuán)隊(duì)。
同樣在本周,OpenAI 發(fā)布 Codex Agent 版本,由新模型 codex-1 加持(codex-1 是 OpenAI o3 的一個(gè)版本,針對(duì)軟件工程進(jìn)行了優(yōu)化),不僅能在云端沙盒環(huán)境中安全地并行處理多項(xiàng)任務(wù),而且通過(guò)與 GitHub 無(wú)縫集成。
OpenAI 認(rèn)為,異步多 Agent 將成為生產(chǎn)高質(zhì)量軟件的默認(rèn)方式,實(shí)時(shí)和異步這兩種模式將融合成一個(gè)統(tǒng)一的工作流程,讓開(kāi)發(fā)者能夠在 IDE 和日常工具中與 AI 無(wú)縫協(xié)作。為此針對(duì) Agent 模式,OpenAI 也在計(jì)劃構(gòu)建一套工具,能同時(shí)支持實(shí)時(shí)協(xié)作和異步任務(wù)。
從當(dāng)前幾家的行動(dòng)路徑上看,異步 + 混合這種模式,由于更接近于自主編碼的早期愿景,也正成為接下來(lái) AI 編程產(chǎn)品的探索方向之一。
當(dāng)大模型廠商下場(chǎng)做編程應(yīng)用
當(dāng)然,眼下眼熱的可不只是微軟、谷歌等大廠,大模型廠商也在暗自發(fā)力。
AI 編程作為 OpenAI ChatGPT 的一大優(yōu)勢(shì),也是超過(guò) 1500 萬(wàn)人訂閱的核心原因之一。尤其是 OpenAI 的 Codex,最初它只是一個(gè)編程模型,但現(xiàn)在來(lái)看它能提供的已經(jīng)是一個(gè)能夠在獨(dú)立沙箱中編寫(xiě)代碼、修復(fù)錯(cuò)誤并回答代碼庫(kù)問(wèn)題的編程助手。
Anthropic 的 Claude 模型也在遵循這一節(jié)奏。此前,基于 Claude 進(jìn)行軟件開(kāi)發(fā)已經(jīng)占其所有交互的十分之一以上,Claude 3.5 Sonnet 就因?yàn)樯瞄L(zhǎng)編碼任務(wù),并且對(duì)軟件工程原理的出色掌握和應(yīng)對(duì)復(fù)雜編程挑戰(zhàn)的能力而被開(kāi)發(fā)人員廣泛使用,包括 Cursor 等 AI 編程產(chǎn)品就主要基于 Claude 3.5 Sonne 提供服務(wù)。而微軟為了不依賴 Codex,也在今年宣布為開(kāi)發(fā)者引入多模型選擇,其中就包括 Claude 3.5 Sonnet。
據(jù) Anthropic 首席科學(xué)官賈里德 · 卡普蘭 ( Jared Kaplan ) 表示,Anthropic 去年年底就停止了對(duì)聊天機(jī)器人的投資,轉(zhuǎn)而專注于提高 Claude 執(zhí)行復(fù)雜任務(wù)的能力,甚至編寫(xiě)整個(gè)代碼庫(kù)。
而此次 Anthropic 將 Claude Opus 4 和 Claude Sonnet 4 升級(jí),均針對(duì)編程能力進(jìn)行了優(yōu)化。與此同時(shí),Anthropic 還發(fā)布 AI 編程助手 Claude Code,通過(guò)與 VS Code 和 JetBrains 等主流 IDE 集成,并基于自家的 Claude Opus 4 模型,可直接嵌入到用戶業(yè)務(wù)流中。
一是預(yù)測(cè)文本,用于簡(jiǎn)單的代碼補(bǔ)全。
二是聊天,用于編碼任務(wù)的人工智能輔助對(duì)話。
三是協(xié)作 " 氛圍編碼 ",使用人工智能進(jìn)行廣泛、協(xié)調(diào)的代碼更改。
四是 Agent 代理模式,人工智能在后臺(tái)自主運(yùn)行,可能在沒(méi)有直接監(jiān)督的情況下做出改變。
顯然,具備了編程模型能力的大模型廠商很快也都會(huì)走完這一輪產(chǎn)品迭代。當(dāng)微軟有了 GitHub Copilot Agent,谷歌上線 Jules,Anthropic 這類大模型廠商的動(dòng)作可能不遠(yuǎn)了。
可能現(xiàn)在最慌的還是 Cursor、Devin 等上層應(yīng)用廠商了。Cursor 其實(shí)也在留有后手,值得一提的是,去年 Cursor 的開(kāi)發(fā)商 Anysphere 推出了自研 Cursor-Fast,其代碼生成能力據(jù)稱介于 GPT-3.5 與 GPT-4 之間。
當(dāng) AI 編程競(jìng)賽進(jìn)入混戰(zhàn)模式,模型能力正成為一切不確定性中的確定因素。從第一性原理出發(fā),模型性能的強(qiáng)弱決定了競(jìng)爭(zhēng)力,盡管開(kāi)發(fā)者可根據(jù)場(chǎng)景選擇最適合的基礎(chǔ)模型,但最終只會(huì)選擇一兩個(gè)好的大模型。(本文首發(fā)于鈦媒體 APP,作者 | 楊麗,編輯 | 蓋虹達(dá))
相關(guān)閱讀《海外 AI 編程賽道并購(gòu)潮起,火熱背后的冷思考》