微軟 CTO Kevin Scott 日前接受媒體采訪,就 AI 代理,編程的未來(lái)等一系列問題闡述了自己的觀點(diǎn)。
在 Scott 看來(lái),模型的推理能力已經(jīng)超前于目前實(shí)際應(yīng)用這些模型的方式。整個(gè)行業(yè)現(xiàn)在需要共同努力,去彌合模型實(shí)際能做的事情和交付給用戶的產(chǎn)品之間的差距。
為了讓代理(agents)真正變得有用,目前 AI 需要更好的代理記憶系統(tǒng)(以處理更復(fù)雜問題),同時(shí)需要一個(gè)生態(tài)系統(tǒng),它應(yīng)當(dāng)像互聯(lián)網(wǎng)那樣(以獲取信息)。
"AI 代理編程 " 并不是過(guò)去四十年來(lái)軟件開發(fā)第一次經(jīng)歷巨大變革。重點(diǎn)不是怎么做,而是要達(dá)成的目標(biāo)。當(dāng)工具發(fā)生變化時(shí),要保持開放的心態(tài)。
以下是訪談重點(diǎn):
模型的推理能力已經(jīng)超前于我們實(shí)際應(yīng)用這些模型的方式。整個(gè)行業(yè)現(xiàn)在需要共同努力,去彌合模型實(shí)際能做的事情和我們交付給用戶的產(chǎn)品之間的差距。
除了 " 推理能力 " 之外,還有很多其他方面的問題需要解決,才能讓代理(agents)真正變得有用。這意味著我們需要更好的代理記憶系統(tǒng),同時(shí)需要一個(gè)生態(tài)系統(tǒng),它應(yīng)當(dāng)像互聯(lián)網(wǎng)那樣。
如果你真正去想象代理能夠做什么、普通用戶希望它們變得多有用——你就會(huì)發(fā)現(xiàn),我們需要像當(dāng)年互聯(lián)網(wǎng)興起時(shí)那樣的一系列變革再次發(fā)生。這一幕的雛形,比如 MCP 協(xié)議,它就是一個(gè)非常好的例子。
"AI 代理編程 " 并不是過(guò)去四十年來(lái)軟件開發(fā)第一次經(jīng)歷巨大變革。不管是軟件還是其他東西,重點(diǎn)不是怎么做,而是我要達(dá)成的目標(biāo)。所以我會(huì)選擇最強(qiáng)大、最方便的方式去實(shí)現(xiàn)它。當(dāng)工具發(fā)生變化時(shí),要保持開放的心態(tài)。
我當(dāng)木工的時(shí)間幾乎跟我寫程序一樣久。我十幾歲那會(huì)兒,圈子里最大的話題是:你如果用了電動(dòng)工具,你還算是真正的木工嗎?真正的木工只用手工工具!今天這種爭(zhēng)論仍然存在,不過(guò)換成了:你用了 CNC(計(jì)算機(jī)控制的數(shù)控工具),你還算真正的木工嗎?
現(xiàn)在最關(guān)鍵的區(qū)別,出現(xiàn)在產(chǎn)品設(shè)計(jì)者的思維方式上。目前一些初創(chuàng)公司,他們并不是靠搞出一套全新的基礎(chǔ)設(shè)施來(lái)創(chuàng)新的;他們創(chuàng)新的方式是:他們對(duì)某個(gè)用戶問題的理解,比任何人都更深入。然后他們基于現(xiàn)成的基礎(chǔ)設(shè)施,或做些微調(diào),就能以世界級(jí)水準(zhǔn)來(lái)解決那個(gè)問題。這種方式,才是我們現(xiàn)在真正需要的。
我認(rèn)為接下來(lái)我們會(huì)看到,人們用代理去解決的問題會(huì)越來(lái)越復(fù)雜、越來(lái)越有雄心。同時(shí)," 代理網(wǎng)絡(luò) " 會(huì)越來(lái)越完整,連接越來(lái)越充分;模型的推理與規(guī)劃能力也會(huì)變得更強(qiáng)。這將促使我們從現(xiàn)在的 " 同步交互 " 模式,進(jìn)入到一個(gè)更強(qiáng)的 " 異步交互 " 時(shí)代。
以下為對(duì)談全文:
主持人:
Kevin,歡迎來(lái)到我們的節(jié)目。
Kevin Scott:
不用謝。
主持人:
謝謝你來(lái)。一件很有意思的事是,我去年也訪問過(guò)你。你當(dāng)時(shí)說(shuō)了兩件非常重要的事情。一個(gè)是——代理(agents)將會(huì)無(wú)處不在。
主持人:
你說(shuō)的這件事真的成真了,而且來(lái)得非常快。還有一件事,我注意到去年你特別強(qiáng)調(diào) " 規(guī)模定律 "(scaling laws),對(duì)吧?
主持人:
當(dāng)時(shí)你展示了很多圖表,說(shuō)我們正在建造大規(guī)?;A(chǔ)設(shè)施,訓(xùn)練更大的模型,而且每?jī)赡晷阅芫蜁?huì)有一次飛躍。但今年,你的重點(diǎn)似乎更多放在 " 代理網(wǎng)絡(luò)(Agentic Web)" 上。發(fā)生了什么變化?從去年到今年,我們學(xué)到了什么?
Kevin Scott:
是的,我覺得發(fā)生了很多變化。其中一件事是,去年很多人還處在一種懷疑狀態(tài)中,他們?cè)趹岩?" 規(guī)模定律 " 是否還能繼續(xù)有效。而事實(shí)上,我們年復(fù)一年已經(jīng)證明,它們依然有效并且運(yùn)作良好。所以現(xiàn)在已經(jīng)不再需要向人們重復(fù)這一點(diǎn)了。
Kevin Scott:
另一件事,說(shuō)實(shí)話,是模型的推理能力已經(jīng)超前于我們實(shí)際應(yīng)用這些模型的方式。我最近一直在談一個(gè)概念,叫做 " 能力懸空 "(capability overhang)。
我認(rèn)為,我們整個(gè)行業(yè)現(xiàn)在需要共同努力,去彌合模型實(shí)際能做的事情和我們交付給用戶的產(chǎn)品之間的差距。這也是為什么在今年的 Build 大會(huì)上," 規(guī)模定律 " 不像去年那么吸引人的原因之一。
Kevin Scott:
還有一點(diǎn)我們發(fā)現(xiàn)了:隨著過(guò)去一年代理數(shù)量的爆發(fā)式增長(zhǎng),以及用戶在這些代理中花費(fèi)時(shí)間的增加,我們意識(shí)到,除了 " 推理能力 " 之外,還有很多其他方面的問題需要解決,才能讓代理真正變得有用。這也是我今天在 Build 大會(huì)主題演講中提到的重點(diǎn)之一:我們需要更好的代理記憶系統(tǒng)。
Kevin Scott:
目前的代理記憶受限于許多方面,它們更像是一次性的、事務(wù)性的——你用它完成某個(gè)任務(wù),期間記憶是連貫的,但這個(gè)記憶很可能會(huì)在下次交互時(shí)完全消失,這就使得我們很難將更復(fù)雜的任務(wù)委托給它們。
Kevin Scott:
而且還有一個(gè)核心問題:如果代理要變得有用,它們就必須能夠替你采取行動(dòng),能夠使用工具,在系統(tǒng)中作出改變,訪問豐富多樣的信息源。
要實(shí)現(xiàn)這些,我們需要一個(gè)生態(tài)系統(tǒng),它應(yīng)當(dāng)像互聯(lián)網(wǎng)那樣:如果你是信息源,你已經(jīng)有了網(wǎng)站、有了 API,那么你必須弄清楚怎么把這些資源接通,讓代理能與之通信,并且要讓各方的激勵(lì)機(jī)制協(xié)同一致,使他們?cè)敢鈪⑴c到這個(gè) " 代理網(wǎng)絡(luò) " 中來(lái)。
Kevin Scott:
所以我認(rèn)為這才是今年最大的故事——我們看到了真正進(jìn)展的曙光,比如 MCP 這樣的超級(jí)簡(jiǎn)單、開放協(xié)議,在代理網(wǎng)絡(luò)中扮演的角色就像 HTTP 在互聯(lián)網(wǎng)中一樣。還有像 NL Web 這樣的標(biāo)準(zhǔn),它在 " 代理網(wǎng)絡(luò) " 中扮演的角色,就類似 HTML 在網(wǎng)頁(yè)世界中的作用。
Kevin Scott:
我覺得你將會(huì)看到這些系統(tǒng)越來(lái)越多地采用簡(jiǎn)單、可組合、可層疊的結(jié)構(gòu),開放社區(qū)將會(huì)非?;钴S,最終推動(dòng)代理真正實(shí)現(xiàn)能力的落地。
主持人:
那我總結(jié)一下我聽到的意思:現(xiàn)在我們已經(jīng)有了代理(agents),而且它們開始真正發(fā)揮作用了,對(duì)吧?而要讓這些代理變得強(qiáng)大,它們就需要訪問權(quán)限。
主持人:
它們需要能夠訪問互聯(lián)網(wǎng)上的各種資源、你電腦上的內(nèi)容,等等類似的信息。也就是說(shuō),你基本上需要建立起一套協(xié)議和流程,來(lái)讓代理可以訪問這些東西,對(duì)吧?
主持人:
所以你現(xiàn)在關(guān)注的是整個(gè)技術(shù)堆棧的不同層級(jí)——比如說(shuō)運(yùn)行時(shí)層面,你們?cè)谀莾簶?gòu)建記憶系統(tǒng)、其他組件;然后還有像 MCP(memory coordination protocol)這樣的協(xié)議,它能把代理連接到更廣闊的互聯(lián)網(wǎng)世界,從而獲取信息,讓信息流入代理系統(tǒng)中。
主持人:
那我想問一下,** 這件事對(duì)微軟來(lái)說(shuō)為什么重要?** 你們希望在這個(gè)生態(tài)系統(tǒng)里扮演什么樣的角色?
Kevin Scott:
嗯,我覺得這里面有兩點(diǎn),也可能是三點(diǎn)特別重要。
第一點(diǎn)是,我們自己在做代理。而我們做的這些代理要對(duì)用戶真正有用,就必須解決這些底層問題。就算你把范圍縮小到企業(yè)級(jí)代理,作為微軟的 CTO,我一直在推動(dòng)的一件事就是:我希望我們公司內(nèi)部所有系統(tǒng)都采用統(tǒng)一的標(biāo)準(zhǔn)協(xié)議,能和我們內(nèi)部構(gòu)建的代理對(duì)話。
Kevin Scott:
這樣我們才能避免把整個(gè)世界暴露在所謂 " 康威定律 "(Conway ’ s Law)之下。你知道,康威定律是軟件架構(gòu)里一個(gè)非常有趣的現(xiàn)象。
康威說(shuō),一個(gè)系統(tǒng)的結(jié)構(gòu)往往會(huì)反映出開發(fā)該系統(tǒng)的組織結(jié)構(gòu),比如編譯器的階段數(shù)通常由負(fù)責(zé)這些部分的團(tuán)隊(duì)數(shù)量決定。
主持人:
沒錯(cuò)。
Kevin Scott:
所以你想象一下,如果你在微軟這樣的大公司內(nèi)部開發(fā)東西,你肯定不希望你造出來(lái)的代理,其結(jié)構(gòu)完全是按照你的組織結(jié)構(gòu)拼出來(lái)的。
但現(xiàn)實(shí)中如果你沒有通用的協(xié)議和標(biāo)準(zhǔn)服務(wù),這樣的 " 組織圖產(chǎn)品 " 就會(huì)反復(fù)出現(xiàn)。作為工程師,看到那種低效開發(fā)場(chǎng)景,真的很讓人抓狂。
Kevin Scott:
但我認(rèn)為,更重要的是,如果你真正去想象代理能夠做什么、普通用戶希望它們變得多有用——你就會(huì)發(fā)現(xiàn),我們需要像當(dāng)年互聯(lián)網(wǎng)興起時(shí)那樣的一系列變革再次發(fā)生。我現(xiàn)在就能看到這一幕的雛形,比如 MCP 協(xié)議,它就是一個(gè)非常好的例子。
Kevin Scott:
它是一個(gè)非常簡(jiǎn)單但關(guān)鍵的協(xié)議,解決了一個(gè)非常重要的問題——不僅是為那些構(gòu)建代理和平臺(tái)基礎(chǔ)設(shè)施的人服務(wù),也同樣幫助了系統(tǒng)的最終用戶,讓他們的體驗(yàn)變得更加有用。它還為那些服務(wù)提供方提供了機(jī)會(huì),比如有人可能會(huì)說(shuō):" 我也想?yún)⑴c到這個(gè)新型的大網(wǎng)絡(luò)里來(lái)。"
但現(xiàn)在的問題是,很多人以前知道怎么去連接某個(gè)服務(wù)、怎么構(gòu)建服務(wù),但如今他們面對(duì)的是一群代理,坐在那里思考:" 我該怎么把我的系統(tǒng)接進(jìn)來(lái)?這對(duì)我到底意味著什么?"
Kevin Scott:
甚至從商業(yè)模式的角度來(lái)說(shuō),他們也會(huì)想:我為什么要接入這個(gè)系統(tǒng)?它對(duì)我到底有什么價(jià)值?
所以第二點(diǎn)就是——我們希望讓自己構(gòu)建的代理變得更有用。
Kevin Scott:
第三點(diǎn)是,作為一家平臺(tái)型公司,這一點(diǎn)甚至比我們自己要寫的代理更重要。微軟已經(jīng)在構(gòu)建平臺(tái)技術(shù)這條路上深耕了五十年,我們想要確保,當(dāng)這個(gè)全新的 " 超級(jí)網(wǎng)絡(luò) " 興起時(shí),我們能夠幫助解決其中出現(xiàn)的問題。
主持人:
是啊,看到你們現(xiàn)在在 MCP 上投入這么多,并把它整合進(jìn)整個(gè) Windows 系統(tǒng),真的很酷,很厲害。這讓我想到一個(gè)問題——我最近聽到一些人在討論 MCP,他們開始關(guān)注它的安全模型問題。
主持人:
我很好奇你是怎么看這個(gè)問題的。因?yàn)槟闱懊嫣岬竭^(guò)很多 MCP 技術(shù)棧和互聯(lián)網(wǎng)技術(shù)棧之間的類比。而我們知道,互聯(lián)網(wǎng)是有一套完整的安全機(jī)制的,比如 " 同源策略 "(Same-Origin Policy),它確保了網(wǎng)站在執(zhí)行代碼時(shí)只能操作自己域名下的數(shù)據(jù),對(duì)吧?但 MCP 目前似乎還沒有類似的機(jī)制。所以你覺得,什么樣的安全模型才是適合 MCP 的?
Kevin Scott:
嗯,說(shuō)實(shí)話,我也不敢說(shuō)我完全知道什么才是 " 正確 " 的安全模型。但 MCP 有一點(diǎn)很有趣,就是它的設(shè)計(jì)極其簡(jiǎn)潔明了,這其實(shí)使得整個(gè)社區(qū)可以相對(duì)容易地就這個(gè)問題達(dá)成共識(shí)。
Kevin Scott:
我們?cè)谄髽I(yè)層面上確實(shí)有很多非常重視的需求,我們也和 MCP 團(tuán)隊(duì)合作得很好,正在推進(jìn)相關(guān)工作。
Kevin Scott:
比如說(shuō),我們需要讓代理具有 " 身份 " ——這樣我們才能建立起權(quán)限系統(tǒng)。你可以定義:某個(gè)代理是代表某個(gè)用戶在操作,然后它就有權(quán)訪問系統(tǒng)中某些資源。
Kevin Scott:
甚至代理本身可以主動(dòng)查詢多個(gè)系統(tǒng),然后說(shuō):" 這是我想完成的一件事,要實(shí)現(xiàn)這件事,我需要訪問以下這些系統(tǒng)。那我需要獲得哪些權(quán)限才能做這件事?"
Kevin Scott:
它可以向被委托給它的用戶請(qǐng)求授權(quán),說(shuō):" 你能不能給我訪問這些資源的權(quán)限,這樣我才能替你完成你交代的任務(wù)?" 是或否。
然后系統(tǒng)管理員也需要有權(quán)限來(lái)審查,比如:" 我是否允許這些操作發(fā)生?" 所以,這整個(gè)流程雖然并不 " 簡(jiǎn)單 ",但其實(shí)在 MCP 架構(gòu)上實(shí)現(xiàn)起來(lái)是可行的、邏輯清晰的。
Kevin Scott:
而關(guān)鍵在于:我們應(yīng)該以開放的方式來(lái)做這件事。我們并不希望這些機(jī)制是專屬于微軟代理或微軟系統(tǒng)的——我們真正需要的是讓它像互聯(lián)網(wǎng)一樣運(yùn)作的生態(tài)系統(tǒng)。
主持人:
對(duì)我來(lái)說(shuō),這其實(shí)是個(gè)很有意思的問題。我覺得現(xiàn)在圍繞 AI 的發(fā)展,有兩種可能的模式或者 " 市場(chǎng)路徑 "(Go-to-Market)正在浮現(xiàn),而你們微軟似乎都在關(guān)注這兩個(gè)方向。
一種是所謂的 " 垂直一體化 " 模式,在這種模式下,你控制模型、應(yīng)用、整個(gè)上下游——一切都在你手中。
主持人:
而這種模式的一個(gè)好處是:安全性可以得到很強(qiáng)的保障。就像蘋果的 App Store 或 iPhone 模式,你可以在多個(gè)層面上強(qiáng)制安全策略。
但另一種則是 " 開放模型 " ——你犧牲一部分控制權(quán)和安全性,但能換來(lái)更強(qiáng)的創(chuàng)新活力,因?yàn)闆]有中心化的權(quán)威機(jī)構(gòu)去限制開發(fā)者。
所以我想問的是,你們?cè)谖④浭窃趺此伎家吣臈l路的?你們是怎么做出這個(gè)決策的?
Kevin Scott:
是的,你看,這確實(shí)是很多人現(xiàn)在在討論的一個(gè)核心問題——但我覺得,那可能是一個(gè)偽命題(false dichotomy)。
你知道,在這些開放系統(tǒng)中,它們的特點(diǎn)是 " 無(wú)需許可 "(permissionless)。這種開放式創(chuàng)新的能力,確實(shí)帶來(lái)了巨大的優(yōu)勢(shì)。對(duì)我個(gè)人來(lái)說(shuō),現(xiàn)在最讓我興奮的一件事就是:你可以不經(jīng)任何人批準(zhǔn)就去創(chuàng)新、去構(gòu)建產(chǎn)品,不需要?jiǎng)e人給你發(fā)許可,不需要通過(guò)什么中介流程才能把你的作品推向世界。
你不再需要通過(guò)一堆復(fù)雜的守門人機(jī)制,在你這個(gè)有想法的人與那些可能真正從中受益的人之間設(shè)下重重阻礙。
Kevin Scot:
我覺得我們這幾年建立起來(lái)的那些 " 中間層 ",其實(shí)并沒有為最核心的兩方帶來(lái)多少價(jià)值:一邊是辛辛苦苦做出東西的人,另一邊是愿意為這些成果付出注意力、金錢或其他資源的用戶。
這就是為什么我對(duì)開放系統(tǒng)特別興奮,也正是我們?cè)谧鰬?zhàn)略選擇時(shí)的重要原因之一。
Kevin Scott:
但我也認(rèn)為,在這些系統(tǒng)中,其實(shí)是有辦法實(shí)現(xiàn)強(qiáng)健安全性的。我們可以借助 AI 本身的一些能力,構(gòu)建出更智能的安全模型。
比如說(shuō),你運(yùn)行的代理可以照顧到你個(gè)人的安全需求——哪些信息你愿意分享,哪些你不愿意;它還能做風(fēng)險(xiǎn)評(píng)估。
我舉個(gè)實(shí)際例子:今天早上我正準(zhǔn)備上臺(tái)演講的時(shí)候,突然收到一堆郵件,因?yàn)槲沂俏移拮拥膫溆冒踩~戶。
有人在她賬戶上嘗試篡改兩步驗(yàn)證(2FA)設(shè)置。我第一反應(yīng)是發(fā)短信給她,而不是發(fā)郵件——因?yàn)槲覔?dān)心她的郵箱可能已經(jīng)被未經(jīng)授權(quán)的第三方訪問了。
Kevin Scott:
我發(fā)信息問她:" 你是不是在改配置?" 她回復(fù):" 是的,是我。"
所以你可以想象,如果有一個(gè)代理可以接入你多種通信渠道,監(jiān)測(cè)到這種異常行為,并調(diào)用各種資源進(jìn)行 " 三角校驗(yàn) ",判斷這些行為到底是合法的還是非法的,那將是非常有用的。
所以我認(rèn)為,兩種模式是可以共存的。并不是說(shuō)非得二選一——就像你剛才設(shè)想的那樣。
主持人:
這很有道理。我還有一個(gè)特別好奇的問題是——現(xiàn)在看來(lái),軟件工程正在發(fā)生根本性變化,對(duì)吧?
而你是一個(gè)在軟件工程領(lǐng)域深耕多年的老兵,我覺得你也很重視 " 工藝 " 本身——制作事物的技藝。
我們剛才聊到你平時(shí)做陶藝、做包,喜歡親手參與制作的過(guò)程。我覺得很多人對(duì) " 用代理寫代碼 " 有點(diǎn)抵觸,覺得這樣會(huì)削弱那種 " 手工打造 " 的感覺,雖然我并不完全同意這個(gè)觀點(diǎn)。
但我還是很想知道,作為一個(gè)真正關(guān)心編程工藝的人,你怎么看待未來(lái)的 " 代理編程 "?
Kevin Scott:
我先說(shuō)一句,我真的很欣賞 " 我的人 " ——我這里說(shuō)的 " 我的人 ",指的是廣義的創(chuàng)作者群體。
包括軟件工程師、機(jī)械工程師、木工、陶藝師等等這些人。我們都是從零或者原材料開始創(chuàng)造新東西的人。
Kevin Scott:
如果你真的熱愛你的工作,你一定會(huì)對(duì)怎么做、用什么工具、用什么材料、如何組合這些細(xì)節(jié)有非常強(qiáng)烈的主張。這是你成為真正優(yōu)秀從業(yè)者的必備條件。
但有趣的是——人們的觀點(diǎn)五花八門。
正如你剛才提到的,我做這行已經(jīng)很久了——我寫第一個(gè)程序的時(shí)候只有 12 歲,也就是說(shuō)我編程已經(jīng)有 41 年了。
Kevin Scott:
如果你在一個(gè)領(lǐng)域堅(jiān)持得夠久,你就會(huì)看到:這并不是過(guò)去四十年來(lái)軟件開發(fā)第一次經(jīng)歷巨大變革。每次這種變革發(fā)生時(shí),人們都會(huì)對(duì)其含義有非常強(qiáng)烈的反應(yīng)。
但現(xiàn)實(shí)是,人們是有選擇權(quán)的。
我現(xiàn)在仍然喜歡用文本編輯器。說(shuō)實(shí)話,我可能不該說(shuō)這個(gè),因?yàn)槲覀児咀隽?Visual Studio Code(笑),但我就是一個(gè)老古板——我還在用 vim。
Kevin Scott:
至少我會(huì)用 vim,但我最愛的還是那種古早的編輯器。我就是不愿意換別的工具。
盡管我知道,這在某種程度上已經(jīng)降低了我的效率,但我還是出于 " 自主選擇 " 的理由堅(jiān)持使用它。
但在我做的其他項(xiàng)目中,比如不管是軟件還是其他東西,有時(shí)候我也會(huì)說(shuō):" 這里的重點(diǎn)不是怎么做,而是我要達(dá)成的目標(biāo)。"
所以我會(huì)選擇最強(qiáng)大、最方便的方式去實(shí)現(xiàn)它——不管別人會(huì)不會(huì)因此嘲笑我。
Kevin Scott:
這種情況無(wú)處不在。比如我當(dāng)木工的時(shí)間幾乎跟我寫程序一樣久。
我還記得我十幾歲那會(huì)兒,圈子里最大的話題是:" 你如果用了電動(dòng)工具,你還算是真正的木工嗎?"
" 真正的木工只用手工工具!"
Kevin Scott:
今天這種爭(zhēng)論仍然存在,不過(guò)換成了:" 你用了 CNC(計(jì)算機(jī)控制的數(shù)控工具),你還算真正的木工嗎?"
我覺得這種討論本身就很有意思,但最終大家做出不同選擇,是因?yàn)樗麄兊膬r(jià)值觀不同。
如果你更重視過(guò)程,你可能會(huì)做出完全不同的選擇;而如果你更看重結(jié)果,你就可能用別的方式。
主持人:
我覺得類似 " 你算不算是真正的木工 "" 你是不是個(gè)真正的程序員 " 這種問題,說(shuō)到底其實(shí)是在說(shuō):" 只有按照我成長(zhǎng)時(shí)的方式去做,你才是真正的 XXX。" 這其實(shí)是一種有偏見的說(shuō)法。
Kevin Scott:
對(duì),是這樣。但現(xiàn)實(shí)是——這個(gè)世界的情況太多樣化了,對(duì)吧?
所以我要說(shuō)的是:我絕不會(huì)告訴任何人不要對(duì)自己的技藝有強(qiáng)烈的主張。你盡管有你的堅(jiān)持,那很好!
但如果說(shuō)我有什么建議的話(這不是命令,只是我個(gè)人發(fā)現(xiàn)有用的建議),那就是——當(dāng)工具發(fā)生變化時(shí),要保持開放的心態(tài)。
Kevin Scott:
我都數(shù)不清多少次了,有些新的技術(shù)出現(xiàn)在其他 " 非軟件 " 的創(chuàng)作領(lǐng)域,我一開始都會(huì)下意識(shí)地抗拒——比如說(shuō)我當(dāng)時(shí)對(duì) 3D 打印機(jī)完全提不起興趣,我拖了很久才去學(xué)怎么用它們。
現(xiàn)在我真的后悔了,因?yàn)樗鼈儙缀鯇?duì)我做的所有事都非常有用。出于種種復(fù)雜的原因,我沒有讓自己產(chǎn)生好奇心,這是我自己的問題,也確實(shí)有點(diǎn)奇怪。
所以我的建議就是:保持好奇,去嘗試。如果某樣?xùn)|西適合你,那就用它;如果不適合,也無(wú)妨。
主持人:
沒錯(cuò)。那么你怎么看 " 軟件工程代理(software engineering agents)" 的未來(lái)?
會(huì)不會(huì)出現(xiàn)那種 " 一個(gè)代理統(tǒng)治一切 " 的局面?還是說(shuō)我們會(huì)同時(shí)使用很多具有不同風(fēng)格的代理?你認(rèn)為這個(gè)生態(tài)系統(tǒng)會(huì)如何發(fā)展?
Kevin Scott:
我認(rèn)為將來(lái)一定是有很多不同類型的代理。這是好事。
我們當(dāng)然會(huì)在 GitHub Copilot 以及我們正在開發(fā)的 GitHub Agent 上非常努力,希望成為很多開發(fā)者首選的工具,因?yàn)槲覀兿胱屗娴膶?duì)大家有用。
但要說(shuō)全世界的開發(fā)者都統(tǒng)一使用某一個(gè)工具來(lái)完成工作中的關(guān)鍵部分,我認(rèn)為那不現(xiàn)實(shí)。
Kevin Scott:
成為一個(gè)開發(fā)者的樂趣之一,就是你有權(quán)選擇工具。你可以嘗試各種東西,做一些看起來(lái) " 非理性 " 的事,也可以選擇完全理性的方式。
這是我在過(guò)去四十年程序員生涯中始終觀察到的一件事:人們不斷更換自己的工具??偸窃谧兓?。
主持人:
那你有沒有想過(guò):這些代理會(huì)在哪些維度上有所不同?
Kevin Scott:
我覺得最關(guān)鍵的區(qū)別,可能會(huì)出現(xiàn)在產(chǎn)品設(shè)計(jì)者的思維方式上。
現(xiàn)在我看到最有意思的一些初創(chuàng)公司,他們并不是靠搞出一套全新的基礎(chǔ)設(shè)施來(lái)創(chuàng)新的;他們創(chuàng)新的方式是:他們對(duì)某個(gè)用戶問題的理解,比任何人都更深入。
然后他們基于現(xiàn)成的基礎(chǔ)設(shè)施,或做些微調(diào),就能以世界級(jí)水準(zhǔn)來(lái)解決那個(gè)問題。這種方式,才是我們現(xiàn)在真正需要的。
Kevin Scott:
這也會(huì)推動(dòng)代理多樣性的形成——哪些代理被用來(lái)解決什么問題,最終都會(huì)受到這個(gè)維度的驅(qū)動(dòng)。
而且說(shuō)實(shí)話,現(xiàn)在你更容易對(duì)用戶的問題形成這種 " 細(xì)致入微的理解 ",也更容易拿起各種工具嘗試去解決這些問題。
所以我們會(huì)看到大量公司、團(tuán)隊(duì)去打造各種東西來(lái)嘗試解決不同的需求。
Kevin Scott:
哪怕在 " 軟件開發(fā)工具 " 這個(gè)領(lǐng)域都已經(jīng)開始瘋狂了——過(guò)去一年冒出來(lái)的工具簡(jiǎn)直數(shù)不過(guò)來(lái)。
而且這些工具都挺有趣的,各有各的特點(diǎn)。
對(duì)于像我們這樣的軟件工具開發(fā)公司來(lái)說(shuō),這確實(shí)壓力很大,因?yàn)槟阋獞?yīng)對(duì)那么多創(chuàng)新和變化。
但從技術(shù)角度來(lái)看,這真的太有意思了。
我們發(fā)現(xiàn):只要你對(duì)用戶的需求有某種細(xì)膩的認(rèn)知,就總會(huì)有人愿意嘗試你的解決方案。尤其是那些有高容忍度和高興趣度的用戶。
主持人:
是啊。我們時(shí)間快到了,但我還有個(gè)問題。
假設(shè)一年之后我們又在 Build 大會(huì)上坐下來(lái)聊,你覺得:現(xiàn)在的一些熱門話題或大問題,一年后會(huì)變得不再重要?而一年后什么會(huì)成為真正重要的討論焦點(diǎn)?你有哪些預(yù)測(cè)?
Kevin Scott:
我覺得現(xiàn)在那些還在堅(jiān)持說(shuō) " 這項(xiàng)技術(shù)還沒準(zhǔn)備好 " 的人——比如說(shuō):" 我試過(guò)了,但稍微有點(diǎn)貴 " 或者 " 功能上還差一點(diǎn)點(diǎn) " ——如果他們把這些當(dāng)作不行動(dòng)的借口,那他們很快就會(huì)被遠(yuǎn)遠(yuǎn)甩在后面。
因?yàn)檫@些問題都會(huì)隨著時(shí)間變得微不足道:技術(shù)每年都會(huì)變得更便宜、更強(qiáng)大。
Kevin Scott:
我覺得在 2025 年,這個(gè)觀點(diǎn)其實(shí)已經(jīng)不需要 " 游說(shuō) " 了。過(guò)去確實(shí)有很多人大聲說(shuō):" 技術(shù)進(jìn)展很快就會(huì)停滯,大家都會(huì)失望。"
雖然現(xiàn)在還有人這么說(shuō),但我覺得已經(jīng)沒什么人認(rèn)真聽他們的了。畢竟你聽這些 " 唱衰者 " 的話,又能獲得什么呢?你是在賭失敗,而 " 賭失敗 " 和 " 賭樂觀 " 之間的成本差異,其實(shí)非常大。
Kevin Scott:
我認(rèn)為接下來(lái)我們會(huì)看到,人們用代理去解決的問題會(huì)越來(lái)越復(fù)雜、越來(lái)越有雄心。同時(shí)," 代理網(wǎng)絡(luò) " 會(huì)越來(lái)越完整,連接越來(lái)越充分;模型的推理與規(guī)劃能力也會(huì)變得更強(qiáng)。這將促使我們從現(xiàn)在的 " 同步交互 " 模式,進(jìn)入到一個(gè)更強(qiáng)的 " 異步交互 " 時(shí)代。
Kevin Scott:
現(xiàn)在的交互方式是:你坐下來(lái),想著要完成一件事,然后給代理發(fā)出指令,等它返回一個(gè)結(jié)果,然后你基于那個(gè)結(jié)果再操作。
但到了明年,你可能會(huì)看到這樣的使用方式:" 嘿,去幫我搞定這件事。"
然后代理會(huì)花時(shí)間去處理:它會(huì)調(diào)用很多外部系統(tǒng),它會(huì)去整合信息,它會(huì)反復(fù)迭代,它會(huì)不斷處理、匯總、推進(jìn),最后,在一個(gè)非即時(shí)但有深度的時(shí)間之后,代理會(huì)告訴你:" 我已經(jīng)幫你推進(jìn)到這一步了,接下來(lái)輪到你了。"
主持人:
聽起來(lái)真是我想活在的未來(lái)。
Kevin Scott:
我也這么想,真心的。
主持人:
好吧,Kevin,非常感謝你今天來(lái)參加節(jié)目。真的非常精彩的談話。
Kevin Scott:
很高興能和你聊這場(chǎng)對(duì)話,我也非常享受,謝謝你邀請(qǐng)我來(lái)。