智快網 - 新科技與新能源行業網絡媒體

          AI讀不懂時鐘,也算不出星期幾?基礎時間認知成挑戰

             發布時間:2025-05-17 23:10 作者:任飛揚

          近期,一項關于人工智能(AI)能力邊界的研究引起了廣泛關注。據LiveScience報道,盡管AI在編程、圖像生成、文本創作乃至部分標準化測試中表現出色,但在執行日常生活中看似簡單的“讀時鐘”和“算日子”等任務時,卻頻頻失誤。

          這項研究在2025年的“國際學習表征會議”(ICLR)上被詳細介紹,相關論文已在arXiv平臺上發布,盡管尚未完成同行評審。愛丁堡大學的研究員Rohit Saxena是論文的主要作者,他指出,人類對時間和日歷概念的掌握幾乎是本能的,而AI在這方面的欠缺應被視為一個需要重視的問題。

          為了驗證這一點,研究團隊設計了一系列專門測試時鐘識別和日歷計算的圖像,并將它們輸入到多個具備圖文處理能力的大型語言模型中,包括meta的Llama 3.2-Vision、Anthropic的Claude-3.5 Sonnet、谷歌的Gemini 2.0和OpenAI的GPT-4。然而,測試結果顯示,這些模型在判斷時鐘時間和推算日期星期上的準確率均未超過50%。

          Saxena進一步解釋,AI在處理時鐘問題時,不僅需要識別指針的位置,還要理解角度和分辨不同風格的表盤,如羅馬數字或藝術化設計,這遠比簡單的物體識別復雜得多。而日歷問題同樣困擾著AI,特別是在處理如“每年第153天是星期幾”這類問題時,錯誤率依然很高。

          研究數據顯示,AI在讀時鐘上的正確率僅為38.7%,而在判斷日歷上的準確率更是低至26.3%。Saxena強調,AI的推理過程并不基于固定的算法規則,而是依賴于從訓練數據中學習到的模式,這導致它們的推理過程缺乏一致性和準確性。

          研究還發現,當AI的訓練樣本中缺乏某些特定現象,如閏年或復雜的日歷規則時,它們的表現會進一步下降。即使模型已經理解了“閏年”這一概念,它們也很難將這個知識正確地應用到具體的視覺判斷中。

          針對這些問題,研究提出了兩個改進方向:一是增加訓練數據中的代表性示例,以確保AI能夠接觸到更多樣化的情境;二是重新審視AI如何整合邏輯推理與空間感知能力,特別是在處理不常遇到的任務時。這些發現不僅揭示了AI的當前局限,也為未來的研究和開發提供了重要的指導。

           
           
          更多>同類內容
          全站最新
          熱門內容
          本欄最新
           
          智快科技微信賬號
          微信群

          微信掃一掃
          加微信拉群
          電動汽車群
          科技數碼群

          青青热久久久久综合精品| 综合91在线精品| 国产精品电影在线观看| 国产精品成人A区在线观看| 久久国产热这里只有精品| 日韩中文字幕在线免费观看| 午夜国产精品久久影院| 日韩精品一区二区三区在线观看l| 99精品无人区乱码在线观看| 91精品国产91久久久久久| 夜色www国产精品资源站| 久久亚洲国产欧洲精品一| 亚洲精品无码专区在线在线播放 | 无码日韩人妻精品久久蜜桃| 亚洲中文字幕无码久久精品1 | 久久精品国产亚洲av麻豆蜜芽| 久久精品中文騷妇女内射| 久久精品国产亚洲av麻豆| 无码精品日韩中文字幕| 国产在vr视频精品观看| 久久久WWW免费人成精品| 亚洲欧洲久久久精品| 一本之道av不卡精品| 老湿机一区午夜精品免费福利| 亚洲精品日韩中文字幕久久久| 国产日韩一区二区三区在线观看| 国产69久久精品成人看| 国产精品久久久久9999赢消| 国产精品情侣呻吟对白视频| 国产精品久久久精品三级| 国产成人精品三级麻豆| 免费观看四虎精品国产永久| 国产成人精品无码专区| 国产精品久久久久久久福利院| 国产伦精品一区三区视频| 国产日韩AV免费无码一区二区三区 | 午夜国产精品免费观看| 亚洲Av永久无码精品一区二区| 久久久久无码精品国产h动漫 | 日韩福利视频一区| 日韩一区二区三区在线|