OpenAI在沉寂六年后,終于重返開源領域,近期震撼發布了兩款全新大語言模型——gpt-oss-120b與gpt-oss-20b。這一舉動標志著OpenAI自2019年GPT-2之后,再次向公眾敞開了其技術的大門,盡管近年來它更多地聚焦于付費專有模型的研發。
gpt-oss-120b,這款龐然大物擁有驚人的1170億總參數,其中每token激活51億參數,專為高推理能力的生產級和通用場景量身打造。它能夠在單塊配備80GB顯存的英偉達H100 GPU上流暢運行,展現了強大的處理能力和效率。而gpt-oss-20b,雖然規模稍小,總參數達到210億,每token激活36億參數,但它卻以低延遲和本地化設計為亮點,僅需16GB內存便能在邊緣設備,如家用筆記本電腦或臺式機上輕松運行,極大地拓寬了應用場景。
這兩款模型均為純文本語言模型,它們在文本處理、代碼生成以及數學問題求解等領域展現出了非凡的實力。更令人興奮的是,gpt-oss系列采用了Apache 2.0許可協議,這意味著無論是個人用戶、開發者還是企業,都可以免費下載這些模型,并根據自身需求進行參數級的微調,以適應特定的應用場景。更重要的是,這些調整后的模型還可以用于商業服務或創收,而無需向OpenAI支付任何費用,這與國內如DeepSeek、Qwen 3等開源模型的做法不謀而合。