馬斯克的Grok 4又炸場了!
泄露的跑分顯示,那個號稱“人類最后考試”的HLE測試,它居然拿了45%的高分。
這比谷歌Gemini高了整整24個百分點,是Claude的4倍多。
HLE可是AI界最難的關卡,覆蓋100多學科2500道題,專治各種吹牛模型。
Grok 4這次全面碾壓對手。
在數學和編程測試里也領先。
馬斯克說它基于“第一性原理”推理,像物理學家一樣思考。

馬斯克的Grok 4又炸場了!
泄露的跑分顯示,那個號稱“人類最后考試”的HLE測試,它居然拿了45%的高分。
這比谷歌Gemini高了整整24個百分點,是Claude的4倍多。
HLE可是AI界最難的關卡,覆蓋100多學科2500道題,專治各種吹牛模型。
Grok 4這次全面碾壓對手。
在數學和編程測試里也領先。
馬斯克說它基于“第一性原理”推理,像物理學家一樣思考。

下一篇:比盧普斯一對一指導楊瀚森