人類AI評估系統Yupp上線,可測試逾500個大型語言模型
- Hao Chen Lu
- 6月23日
- 讀畢需時 1 分鐘
Source: iThome 新聞
去年成立的AI新創Yupp日前正式推出人類評估系統,邀請使用者協助評估全球逾500個大型語言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama 等,也涵蓋了必須付費訂閱的各種Pro與Max模型,並根據使用者的回饋制定Yupp AI VIBE(Vibe Intelligence BEnchmark)排行榜。去年成立的AI新創Yupp日前正式推出人類評估系統,邀請使用者協助評估全球逾500個大型語言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama 等,也涵蓋了必須付費訂閱的各種Pro與Max模型,並根據使用者的回饋制定Yupp AI VIBE(Vibe Intelligence BEnchmark)排行榜。 See more: https://www.ithome.com.tw/news/169673
Comments