Skip to content
Kembali ke senarai artikel
Models12 min

OpenAI o1/o3 vs Claude Opus Extended Thinking: Reasoning Bench

Misaki HayashiAI Research Analyst
2026-04-2112 min
o1o3Extended ThinkingReasoningBenchmarks

Artikel ini diterbitkan dalam Bahasa Jepun. Ringkasan dalam Bahasa Melayu di bawah:

OpenAI o1/o3 vs Claude Opus Extended Thinking: Reasoning BenchOpenAI o1/o3 vs Claude Opus 4.5/4.7 Extended Thinking measured on AIME 2025, GPQA Diamond, ARC-AGI 2 and SWE-bench Verified — per-task strengths broken down.

Mulakan dengan Konsultasi Percuma

Kongsikan cabaran IT anda dengan kami. Kami akan mencadangkan penyelesaian yang paling sesuai.

Hubungi Kami