Skip to content
Quay lại danh sách bài viết
Models10 min

Measuring DeepSeek's Japanese: JMMLU, JCommonSenseQA, AI-Oh Benchmarks

Misaki HayashiAI Research Analyst
2026-04-2010 min
DeepSeekJapanese NLPBenchmarksJMMLUEvaluation

Bài viết này được đăng bằng tiếng Nhật. Tóm tắt tiếng Việt ở dưới:

Measuring DeepSeek's Japanese: JMMLU, JCommonSenseQA, AI-Oh BenchmarksInternal benchmark of DeepSeek V3.2/R1 vs Qwen2.5-72B, Claude 3.5 Sonnet and GPT-4o-mini on JMMLU, JCommonSenseQA and AI-Oh, with reproducible prompt formats and conditions.

Bắt đầu với tư vấn miễn phí

Hãy chia sẻ thách thức IT của bạn với chúng tôi. Chúng tôi sẽ đề xuất giải pháp phù hợp nhất.

Liên hệ ngay