北京時間5月22日凌晨,在距離蘋果WWDC 2024舉行還有不到半個月之際,微軟一年一度的Build開發(fā)者大會如期而至。
在發(fā)布會上,微軟正式推出Team Copilot,將Copilot for Microsoft 365從幕后的個人AI助手,擴展為團隊助手。此外,微軟也宣布自己成為首批提供英偉達(dá)最新Blackwell AI 芯片的云服務(wù)商之一,與英偉達(dá)建立了“深厚的合作伙伴關(guān)系”。
值得注意的是,微軟Build 2024開發(fā)者大會并沒有如之前的預(yù)測一樣推出「All in AI」的Windows 12,也沒有針對性地推出消費者期待的AI產(chǎn)品,而是將重點回歸到與開發(fā)者建立聯(lián)系身上。
由此可見,微軟此次最具想象力的升級圍繞著AI Agent(AI個人助手)展開。“AI Agent本質(zhì)上是通過對話式的UI來展現(xiàn)出部分人的屬性,相當(dāng)于很重要的連接器。并且增加算力后,其智力可以無限擴張。”瀾碼科技創(chuàng)始人兼CEO周健對21世紀(jì)經(jīng)濟報道記者表示,2023年是大語言模型的元年,2024年將是AI Agent的爆發(fā)年,AI Agent是大語言模型優(yōu)先落地的最佳形態(tài)。
AI虛擬員工
微軟再次掀起了一場由AI驅(qū)動的“生產(chǎn)力革命”浪潮。
在發(fā)布會上,微軟方面宣布Microsoft Copilot Studio推出全新的Agent代理功能,讓開發(fā)者能夠根據(jù)特定任務(wù)和功能,構(gòu)建主動響應(yīng)數(shù)據(jù)和事件。基于新功能,開發(fā)者可通過記憶和知識了解上下文、推理操作和輸入,并基于用戶反饋進(jìn)行學(xué)習(xí),從而獨立管理復(fù)雜、長期運行的業(yè)務(wù)流程。
“用戶可在Teams、Loop、Planner等協(xié)作工具中調(diào)用Copilot。Team Copilot能夠在會議中擔(dān)任主持人,管理會議議程、跟蹤會議時間并記錄會議要點,也可以在聊天中作為協(xié)作者,提供重要信息、跟蹤行動項目并解決未決問題。它還可以擔(dān)任項目經(jīng)理,幫助確保每個項目順利推進(jìn),并及時通知團隊進(jìn)行輸入。這些功能將在今年晚些時候推出預(yù)覽版。”微軟CEO薩蒂亞?納德拉(Satya Nadella)說道。
此外,Copilot還能成為項目經(jīng)理,通過創(chuàng)建和分配任務(wù)、跟蹤截止日期等方式推動團隊協(xié)作。在另一項產(chǎn)品更新中,微軟也表示將在今年晚些時候推出一款“AI代理”工具——類似于“AI虛擬員工”,可以執(zhí)行監(jiān)控電子郵件、幫助新員工入職、輸入數(shù)據(jù)等一系列瑣碎的自動化任務(wù)。微軟小心翼翼地強調(diào),Copilot不會接管人們的工作,只會接手其中一些無聊的部分。
而在底層芯片方面,微軟宣布Azure AI Studio現(xiàn)已支持提供GPT-4o API 將率先使用英偉達(dá)Blackwell AI芯片。納德拉介紹,由OpeanAI開發(fā)的最新旗艦?zāi)P虶PT-4o,現(xiàn)已在Azure AI Studio中提供,并作為API提供。該多模態(tài)模型集成了文本、圖像和音頻處理能力,帶來了全新的生成式和對話式AI體驗。
此外,由微軟開發(fā)的Phi-3列AI小型語言模型(SLM)中的一種新型多模態(tài)模型Phi-3-vision現(xiàn)已在Azure中推出。Phi-3模型功能強大、經(jīng)濟高效,并且針對個人設(shè)備進(jìn)行了優(yōu)化。Phi-3-vision提供了輸入圖像和文本并接收文本響應(yīng)的功能。例如,用戶可以詢問有關(guān)圖表的問題,或詢問有關(guān)特定圖像的開放式問題。
開發(fā)人員可以在Azure AI Playground中試驗這些前沿模型,并且可以開始使用Azure AI Studio中的模型進(jìn)行構(gòu)建和自定義。
AI Agent落地何時到來?
此前在OpenAI首屆開發(fā)者大會(OpenAI DevDay)上,OpenAI發(fā)布了AI Agent初期形態(tài)產(chǎn)品GPTs,并推出了相應(yīng)的制作工具GPT Builder。用戶僅僅通過跟GPT Builder聊天,把想要的GPT功能描述一遍,就能生成專屬GPT。
比爾·蓋茨在一篇名為《人工智能將徹底改變你使用計算機的方式》的文章中,對AI Agent將對人類帶來的改變進(jìn)行了詳細(xì)描述。
“你不必為不同的任務(wù)使用不同的應(yīng)用程序。你只需用簡單通俗的語言告訴你的設(shè)備你想做什么。根據(jù)你選擇與軟件分享多少信息,基于對你的生活有豐富的了解,軟件將能夠作出個性化的回應(yīng)。在不久的將來,任何上網(wǎng)的人都可以擁有一個由人工智能驅(qū)動的個人助理,這遠(yuǎn)遠(yuǎn)超出了當(dāng)今的技術(shù)水平。”比爾·蓋茨說道。
由此可見,在大模型這一“巨人的肩膀之上”,AI Agent的應(yīng)用之花才得以綻放。
“大語言模型有特點,它能夠與人交互,從而帶來范式的轉(zhuǎn)變。過去我們所有的系統(tǒng)都是機器,人需要適應(yīng)機器,才會造成人作為一個數(shù)據(jù)的搬運工作去填充空間。但今天因為有了大語言模型,我們就有機會讓機器去適應(yīng)人,而機器適應(yīng)人就會使得大語言模型背后的這個領(lǐng)域模型能發(fā)揮更大的作用。”周建對記者分析稱,因為人可以在機器的引導(dǎo)之下完成任務(wù),人機協(xié)同完成任務(wù)才能成為可能。
在具體的商業(yè)路徑方面,東吳證券發(fā)布研報指出,AI Agent未來有兩大落地場景方向。
首先是智能體模擬。國內(nèi)情緒消費市場仍有較大想象空間,陪伴類智能體或受益于情緒消費趨勢紅利,成為LLM(大語言模型)時代重要的AI原生應(yīng)用。東吳證券預(yù)計,陪伴類智能體大部分商業(yè)價值集中在供給方而非平臺,更加看好具備豐富IP儲備或者能讓用戶定制智能體的玩家。
其次則是交互智能體。“智能體之間、智能體與虛擬世界內(nèi)事物之間可互動,可能涌現(xiàn)出超越設(shè)計者規(guī)劃的場景和能力,特別是對開放世界游戲等行業(yè),可增強玩家沉浸感,解決開放世界內(nèi)容消耗快的問題;多可信agent技術(shù)成熟后可能會孵化出新的游戲品類。”東吳證券指出。