OpenAI發表用來評估AI模型經濟價值的GDPval標準
- Hao Chen Lu
- 9月26日
- 讀畢需時 1 分鐘
Source: IThome新聞OpenAI本周四(9/25)發表了GDPval評估標準,用以衡量AI模型在具經濟價值之真實世界任務上的表現,它納入了對美國國內生產毛額(Gross Domestic Product,GDP)最有貢獻的9個產業、44種職業與1,320項具體任務。 首次的評測發現,整體表現最佳的是Claude Opus 4.1。OpenAI本周四(9/25)發表了GDPval評估標準,用以衡量AI模型在具經濟價值之真實世界任務上的表現,它納入了對美國國內生產毛額(Gross Domestic Product,GDP)最有貢獻的9個產業、44種職業與1,320項具體任務。 首次的評測發現,整體表現最佳的是Claude Opus 4.1。 See more: https://www.ithome.com.tw/news/171400


留言