OpenAI présente PaperBench, un benchmark pour évaluer la… — Guidances