智快網 - 新科技與新能源行業網絡媒體

          Ollama發布自研多模態AI引擎,本地推理性能實現大幅提升

             發布時間:2025-05-17 15:17 作者:柳晴雪

          近期,科技領域迎來了一項新的技術突破。據WinBuzzer于5月16日報道,開源大語言模型服務工具Ollama宣布成功研發出一款多模態AI定制引擎,這一創新成果標志著Ollama在技術上實現了對llama.cpp框架的直接依賴的擺脫。

          此前,llama.cpp項目通過整合libmtmd庫,為項目增添了全面的視覺支持功能。這一進展引發了社區對Ollama與llama.cpp之間關系的廣泛討論。針對這一話題,Ollama團隊成員在Hacker News平臺上進行了澄清,強調他們的引擎是基于golang獨立開發的,并未直接借鑒llama.cpp的C++實現,并對社區的反饋表示了感謝。

          在官方聲明中,Ollama指出,隨著各大科技公司如meta的Llama 4、Google的Gemma 3、阿里巴巴的Qwen 2.5 VL以及Mistral Small 3.1等推出的AI模型復雜性日益增加,現有的技術架構已難以滿足高效處理的需求。因此,Ollama決定推出這款全新的多模態AI定制引擎。

          這款新引擎在本地推理精度上實現了顯著突破,特別是在處理大型圖像并生成大量token時,表現尤為突出。Ollama通過引入圖像處理附加元數據,優化了批量處理和位置數據管理,有效避免了圖像分割錯誤導致的輸出質量下降問題。他們還采用了KVCache優化技術,進一步加速了transformer模型的推理速度。

          在內存管理方面,新引擎也進行了大幅優化,并新增了圖像緩存功能。這一功能確保了圖像處理后的數據可以重復使用,避免了數據的提前丟棄,從而提高了資源利用效率。為了進一步提升性能,Ollama還與NVIDIA、AMD、Qualcomm、Intel和Microsoft等硬件巨頭展開合作,通過精準檢測硬件元數據,對內存估算進行了優化。

          針對像meta的Llama 4 Scout(一款擁有1090億參數的混合專家模型MoE)這樣的復雜模型,Ollama的新引擎還支持分塊注意力(chunked attention)和2D旋轉嵌入(2D rotary embedding)等先進技術。這些技術的引入,使得Ollama在處理復雜模型時能夠展現出更高的效率和準確性。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          亚洲国产精品无码一线岛国| 国产区精品高清在线观看| 国产精品久久久久影视青草| 精品日产卡一卡二卡国色天香| 亚洲国产精品嫩草影院在线观看| 久久国产美女免费观看精品| 网曝门精品国产事件在线观看| 精品不卡一区二区| 国产精品综合久久第一页| 免费a级毛片18以上观看精品| 99久久免费精品视频| 国产成人精品2021| 久久精品9988| 日韩精品一区二区三区视频| 伊人无码精品久久一区二区| 亚洲精品人成电影网| 人与狗精品AA毛片| 日韩精品无码一区二区三区AV | 中文字幕在线不卡精品视频99| av无码精品一区二区三区四区| 久久久精品久久久久久96| 国产在线观看麻豆91精品免费 | 中日韩无砖码一线二线| 国产午夜精品1区2区3福利| 亚洲美女精品视频| 日韩人妻无码精品久久免费一| 久久精品视频久久| 国产精品自在自线免费观看| 3d精品重口littleballerina| 久久久久久一品道精品免费看| 久久精品中文字幕不卡一二区| 久久精品这里热有精品2015| 久久精品免视看国产成人| 久久精品加勒比中文字幕| 亚洲国产精品自在在线观看| 久久se精品一区二区影院| 国产91精品新入口| 国产国产人精品视频69| 日韩一级特黄av毛片| 日韩精品人成在线播放| 中文字幕日韩专区|