在近日舉行的Build 2025開發者盛會上,微軟公司震撼發布了一系列針對Windows平臺的AI開發新工具和特性,其中最引人注目的當屬Windows AI Foundry這一全新統一平臺的問世。該平臺旨在為本地AI開發提供前所未有的強大支持,通過整合Windows Copilot Runtime及多項創新功能,進一步推動Windows生態內AI應用的蓬勃發展。
Windows AI Foundry的推出,標志著微軟在本地AI開發領域邁出了關鍵步伐。該平臺不僅集成了已在Windows平臺上為本地AI應用提供支持的Windows Copilot Runtime,還通過Windows AI API和Windows機器學習(ML)功能,讓AI模型得以在本地持續高效運行。而Windows AI Foundry的拓展,則為開發者提供了即用型AI API,這些API由內置AI模型驅動,滿足開發者多樣化的本地AI應用開發需求。
該平臺的一大亮點在于其提供的定制Windows內置模型工具,開發者可針對自身應用的特定需求對模型進行優化調整。Windows AI Foundry還支持從Azure AI Foundry引入開源模型,極大地豐富了開發者可使用的模型資源。同時,它還配備了一個推理運行時,讓開發者能夠輕松地將自己開發的模型集成到應用中。
在AI模型的集成方面,Windows AI Foundry展現出了卓越的兼容性。它不僅整合了來自Azure Foundry Local的AI模型,還支持其他模型目錄,如Ollama和NVIDIA NIMs。微軟自家的Foundry Local模型目錄則提供經過優化的AI模型,這些模型能夠在CPU、GPU和NPU等多種硬件平臺上高效運行。開發者只需通過簡單的命令即可瀏覽、下載和測試與設備兼容的模型,并利用Foundry Local SDK輕松將Foundry Local集成到自己的應用中,從而大大降低了開發難度和時間成本。
Windows ML作為Windows內置的AI推理運行時,在Windows AI Foundry中扮演著重要角色。它基于DirectML開發,能夠在AMD、Intel、NVIDIA和Qualcomm等多種芯片平臺上高效運行。Windows ML的出現極大地簡化了模型部署流程,使開發者無需擔憂未來硬件更新帶來的兼容性問題。該運行時能夠自動更新所有必要的依賴項,并在后臺自動適配新的芯片架構,確保應用的穩定性和性能。
微軟還宣布了對LoRA(Low-Rank Adaptation)技術的支持。這一技術能夠在Phi Silica模型上實現對模型參數的小部分微調,通過自定義數據進行微調,LoRA能夠顯著提升模型在特定任務上的性能表現。目前,LoRA已進入公開預覽階段,并已在Snapdragon X系列NPU上實現支持。未來幾個月內,LoRA還將擴展到Intel和AMD的Copilot+ PC上,為更多開發者提供這一高效的微調工具。
微軟還推出了新的語義搜索API,幫助開發者在其應用中創建AI驅動的搜索體驗。這些API支持本地運行,并集成了RAG(Retrieval-Augmented Generation)技術,能夠提供更加智能和高效的搜索結果。目前,語義搜索API已在所有Copilot+ PC上進入私有預覽階段,開發者可利用這些API將AI驅動的搜索功能集成到自己的應用中,為用戶提供更加個性化的搜索體驗。