xAIs Grok 4.20 hängt in Benchmarks zurück - dennoch niedrigste Halluzinationsrate
Davon sollte man sich nicht in die Irre führen lassen: Der generiert weiterhin in 1/5 der Testfragen Unsinn. Das ist nicht der beste Bullshit-Generator, sondern der am wenigstens schlechte.
the-decoder.de