NDTV가 10일(현지 시간) 보도한 내용에 따르면, 중국의 주요 AI 기업들이 대학 입학시험 기간 동안 학생들의 부정행위를 방지하기 위해…
Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5%…
Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습…
Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations 워싱턴대학교와 노스캐롤라이나대학교 연구진의 논문에 따르면, 현재의 의료…
인공지능 대형언어모델의 한국어 능력을 평가하는 ‘수능 국어 LLM 리더보드’가 공개됐다. 평가 결과 ‘o1-프리뷰’ 모델이 97점으로 1등급을 기록하며 주목받고…