수학추론 – AI 매터스 l AI Matters

수학추론

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대…

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습…

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과 수학적 추론에 최적화”

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과…

3월 26, 2025

알리바바의 Qwen 팀은 24일(현지 시간) 자사 블로그를 통해 새로운 시각-언어 모델인 Qwen2.5-VL-32B-Instruct를 오픈소스로 공개했다. 이 모델은 기존 Qwen2.5-VL…

1
2
3

Trending

[WWDC25] 애플, 인텔리전스 대폭 강화… 개발자에게 온디바이스 AI 모델 개방

[AI 매터스 뉴스레터 #78] [WWDC25] 애플에도 AI가…

이종철 수석 에디터6월 10, 2025

“음, 어…” 감정 표현 극대화한 일레븐랩스, '일레븐 v3 알파' 음성 AI 모델 출시

태그로 영화 대사도 생성 가능… 감정 표현…

김은영 에디터6월 10, 2025

Evaluating evidence-based health information from generative AI using a cross-sectional study with laypeople seeking screening information

AI한테 건강 정보 묻지 마세요… 챗GPT 제공…

김은영 에디터6월 10, 2025

수학추론 – AI 매터스 l AI Matters