최신논문

전체 240
번호 제목 작성자 작성일 추천 조회
120
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd | 2024.07.04 | 추천 1 | 조회 372
dd 2024.07.04 1 372
119
Monte Carlo Tree를 통한 GPT-4 레벨 수학 올림피아드 솔루션 액세스 LLaMa-3 8B를 사용한 자체 정제
dd | 2024.07.04 | 추천 0 | 조회 277
dd 2024.07.04 0 277
118
이미지는 재구성 및 생성을 위해 32개의 토큰만큼 가치가 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 310
dd 2024.07.04 0 310
117
자동화된 프로세스 감독을 통해 언어모델의 수학적 추론 개선
dd | 2024.07.04 | 추천 0 | 조회 349
dd 2024.07.04 0 349
116
MS, VALL-E2 발표
dd | 2024.07.04 | 추천 0 | 조회 335
dd 2024.07.04 0 335
115
ReLU-KAN: 행렬 추가, 점 곱셈 및 ReLU만 필요한 새로운 Kolmogorov-Arnold 네트워크
dd | 2024.07.04 | 추천 0 | 조회 596
dd 2024.07.04 0 596
114
인공 초인적 지능에 있어 개방성은 필수적이다
dd | 2024.07.04 | 추천 1 | 조회 317
dd 2024.07.04 1 317
113
ReST-MCTS*: 프로세스 보상 안내 트리검색을 통한 LLM 자체교육
dd | 2024.07.04 | 추천 0 | 조회 267
dd 2024.07.04 0 267
112
Mobile-Agent-v2: 다중 에이전트 협업을 통한 효과적인 탐색 기능을 갖춘 모바일 장치 작동 도우미
dd | 2024.07.04 | 추천 0 | 조회 283
dd 2024.07.04 0 283
111
체스를 두는 신경망에서 학습된 예측의 증거발견
dd | 2024.07.04 | 추천 0 | 조회 322
dd 2024.07.04 0 322
110
지능형 Go-Explore: 거대한 기초모델의 어깨 위에 서기
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 307
ㅇㅇ 2024.07.04 0 307
109
Grokked Transformers는 암묵적 추론자입니다: 일반화의 한계에 대한 기계적 여정
dd | 2024.07.04 | 추천 0 | 조회 438
dd 2024.07.04 0 438
108
OMNI-EPIC: 코드로 프로그래밍된 환경을 통한 인간의 흥미 개념 모델을 통한 개방성
dd | 2024.07.04 | 추천 0 | 조회 273
dd 2024.07.04 0 273
107
월드 모델링을 위한 확산: Atari에서는 시각적 세부 사항이 중요합니다
dd | 2024.07.04 | 추천 0 | 조회 243
dd 2024.07.04 0 243
106
플라톤적 표현 가설
ㅇㅇ | 2024.07.04 | 추천 1 | 조회 316
ㅇㅇ 2024.07.04 1 316
105
xLSTM: 확장된 장단기 메모리
dd | 2024.07.04 | 추천 0 | 조회 354
dd 2024.07.04 0 354
104
대표성 없음, 신뢰 없음: PPO에서 대표성, 붕괴, 신뢰 문제 연결
dd | 2024.07.04 | 추천 0 | 조회 289
dd 2024.07.04 0 289
103
세계 모델을 통한 다양한 도메인 마스터링 (DreamerV3)
dd | 2024.07.04 | 추천 0 | 조회 267
dd 2024.07.04 0 267
102
NExT: 대규모 언어 모델에 코드 실행에 대한 추론을 가르치기
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 281
ㅇㅇ 2024.07.04 0 281
101
KAN: 콜모고로프-아놀드 네트웍스
dd | 2024.07.04 | 추천 0 | 조회 227
dd 2024.07.04 0 227