top of page

三星超小模型挑戰大模型,以遞迴推理在ARC-AGI基準測試取得亮眼成績

  • 作家相片: Hao Chen Lu
    Hao Chen Lu
  • 2025年10月10日
  • 讀畢需時 1 分鐘

Source: IThome新聞三星(Samsung)先進技術研究院蒙特婁研究員Alexia Jolicoeur-Martineau發表Tiny Recursion Model(TRM)研究,以僅約700萬參數的小模型,在ARC-AGI-1基準測試達44.6%正確率,在ARC-AGI-2則達7.8%。 雖然其表現仍低於Grok-4系列模型,但已超越多個大型語言模型。 相關論文已公開發表,並於GitHub平臺開放原始碼。三星(Samsung)先進技術研究院蒙特婁研究員Alexia Jolicoeur-Martineau發表Tiny Recursion Model(TRM)研究,以僅約700萬參數的小模型,在ARC-AGI-1基準測試達44.6%正確率,在ARC-AGI-2則達7.8%。 雖然其表現仍低於Grok-4系列模型,但已超越多個大型語言模型。 相關論文已公開發表,並於GitHub平臺開放原始碼。 See more: https://www.ithome.com.tw/news/171620

最新文章

查看全部
四個AWS維護的公開儲存庫因建置觸發設定疏漏,一度可能遭接管

Source: IThome新聞 資安業者Wiz研究團隊揭露名為CodeBreach的供應鏈風險,指出AWS管理的4個開源GitHub儲存庫,因專案層級的自動化建置觸發條件設定疏漏,存在外部人士可觸發建置並進一步取得儲存庫管理權限的可能性。 AWS表示接獲通報後已完成修補並輪替相關憑證,檢視建置紀錄與CloudTrail稽核紀錄後未發現遭濫用,且不影響客戶環境與AWS服務,AWS也強調這是各專案設

 
 
 
雲端主權不只資料落地,IBM推Sovereign Core強調運作期間治理與邊界內稽核

Source: IThome新聞 IBM發表新軟體基礎IBM Sovereign Core,主打雲端主權與AI工作負載支援的平臺軟體,目的是讓企業、政府與服務供應商能在既有基礎架構與平臺投資上,加速建置並營運符合主權要求的AI環境。 IBM規畫在2026年2月開始提供技術預覽版,並在2026年年中正式上線。 See more: https://www.ithome.com.tw/news/173

 
 
 

留言


雷盾資安股份有限公司版權所有 © 2022 by TS Security Co., Ltd.

  • Instagram
  • Facebook
  • LinkedIn
bottom of page