智快網 - 新科技與新能源行業網絡媒體

          微軟開源OmniParser,GPT-4V秒解析屏幕截圖,智能新突破!

             發布時間:2024-10-29 10:39 作者:楊凌霄

          微軟近日宣布了一項重大開源項目——OmniParser,這是一款專為解析和識別屏幕上可交互圖標設計的AI工具。傳統自動化方法受限于HTML或視圖層次結構,而現有的視覺語言模型在處理復雜GUI元素時又顯得力不從心。為此,微軟推出了這款純視覺基礎的工具,旨在解決當前屏幕解析技術的局限性。

          OmniParser結合了可交互區域檢測模型、圖標描述模型和OCR模塊,無需依賴HTML標簽或視圖層次結構等顯式基礎數據。這一特性使得它能夠在桌面、移動設備和網頁等多種平臺上跨平臺工作,顯著提高了用戶界面的解析準確性。OmniParser還能將識別出的屏幕元素轉換成結構化的數據。

          在實際測試中,OmniParser展現出了卓越的性能。在ScreenSpot數據集中,它的準確率提高了73%,遠超依賴HTML解析的模型。同時,當GPT-4V使用OmniParser的輸出后,圖標的正確標記率從70.5%提升至93.8%。這些改進充分證明了OmniParser在解決當前GUI交互模型根本缺陷方面的有效性。

          微軟已在Hugging Face上發布了OmniParser,這一舉措將有助于普及這一前沿技術,進一步推動多模態AI的發展,特別是在無障礙、自動化和智能用戶輔助等領域。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          思思久久精品在热线热| 日韩在线一区二区三区视频| 久久99精品国产自在现线小黄鸭 | 国产老女人精品免费视频| 国产精品三级视频| 99re6热视频精品免费观看| 国产精品无码无卡在线播放| 成人区人妻精品一区二区不卡网站| 青春草无码精品视频在线观| 日韩视频无码日韩视频又2021| 精品中文字幕久久久久久| 日韩视频在线精品视频免费观看| 91精品免费不卡在线观看| 99久久99久久精品免费观看| 久久精品一区二区三区四区| 日韩精品成人一区二区三区| 91麻豆国产福利精品| 久久久99精品成人片中文字幕| 国产精品人成在线观看| jizz国产精品网站| 四虎精品成人免费视频| 日韩精品成人a在线观看| 亚洲一日韩欧美中文字幕在线| 亚洲美日韩Av中文字幕无码久久久妻妇 | 久久精品国产亚洲7777| 国产成人精品综合在线观看| 亚洲精品99久久久久中文字幕| 一本一本久久a久久精品综合麻豆 一本色道久久88综合日韩精品 | 日本精品一区二区三本中文| 精品国产不卡在线电影| 精品免费国产一区二区三区| 无码人妻精品一区二区三区不卡| 国产在线拍揄自揄视精品| 国产在线拍揄自揄视精品| 香蕉久久精品国产| 国产精品美女网站在线看| 国产精品四虎在线观看免费| 日韩精品无码久久一区二区三| 亚洲AV日韩AV永久无码免下载| 日韩放荡少妇无码视频| 日韩成人国产精品视频|