GPT-4.5 vs Claude Opus 4.6：逆向工程任务基准对比

Summary

Redis 作者（antirez）的实际测试：复杂逆向工程任务上 GPT-4.5 >> Claude Opus 4.6。提示：不同任务模型表现差异很大，单一基准不能代表全部能力。

不同模型在不同任务上表现差异显著。逆向工程是代码理解+推理能力的综合考验。