Feedback Leaderboard

Average user feedback score (Great=+1, Okay=0, Bad=-1). Polled from users after model completes a task. Higher is better.

These benchmarks are based on real-world usage by engineers with Claude Code as the coding agent. Model names are hidden from the users during evaluation.