Qwen

中, 수능 기간 동안 딥시크, 큐웬 등 AI 챗봇 기능 일시 중단한다… “부정행위 방지 목적”

中, 수능 기간 동안 딥시크, 큐웬 등 AI…

6월 11, 2025

NDTV가 10일(현지 시간) 보도한 내용에 따르면, 중국의 주요 AI 기업들이 대학 입학시험 기간 동안 학생들의 부정행위를 방지하기 위해…

Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning

메타, 기존 통념 뒤집는 연구 결과 공개… “추론…

6월 2, 2025

Don’t Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning 기존 통념을 뒤집는 발견: 짧은 추론이 34.5%…

Spurious Rewards: Rethinking Training Signals in RLVR

“정답 몰라도 괜찮다”… AI 강화학습의 상식을 뒤엎은 워싱턴대…

6월 2, 2025

Spurious Rewards: Rethinking Training Signals in RLVR 무작위 보상만으로 21.4% 성능 향상, 틀린 답 보상해도 24.6% 상승 강화학습…

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations

“대화가 정답이다”…의료 AI의 진단 정확도 9.64% 향상시킨 새로운…

2월 3, 2025

Dialogue is Better Than Monologue: Instructing Medical LLMs via Strategical Conversations 워싱턴대학교와 노스캐롤라이나대학교 연구진의 논문에 따르면, 현재의 의료…

o1-프리뷰, 97점으로 수능 국어 1등급 달성... 한국어 언어모델 성능 평가 리더보드 공개

o1-프리뷰, 97점으로 수능 국어 1등급 달성… 한국어 언어모델…

11월 22, 2024

인공지능 대형언어모델의 한국어 능력을 평가하는 ‘수능 국어 LLM 리더보드’가 공개됐다. 평가 결과 ‘o1-프리뷰’ 모델이 97점으로 1등급을 기록하며 주목받고…

Qwen – AI 매터스 l AI Matters