Quay lại danh sách bài viết
Models10 min
Measuring DeepSeek's Japanese: JMMLU, JCommonSenseQA, AI-Oh Benchmarks
Misaki HayashiAI Research Analyst2026-04-2010 min
DeepSeekJapanese NLPBenchmarksJMMLUEvaluation
Bài viết này được đăng bằng tiếng Nhật. Tóm tắt tiếng Việt ở dưới:
Measuring DeepSeek's Japanese: JMMLU, JCommonSenseQA, AI-Oh Benchmarks—Internal benchmark of DeepSeek V3.2/R1 vs Qwen2.5-72B, Claude 3.5 Sonnet and GPT-4o-mini on JMMLU, JCommonSenseQA and AI-Oh, with reproducible prompt formats and conditions.
Bắt đầu với tư vấn miễn phí
Hãy chia sẻ thách thức IT của bạn với chúng tôi. Chúng tôi sẽ đề xuất giải pháp phù hợp nhất.
Liên hệ ngay