최신논문

전체 240
번호 제목 작성자 작성일 추천 조회
100
다중 토큰 예측을 통한 더 나은, 더 빠른 대규모 언어 모델
dd | 2024.07.04 | 추천 0 | 조회 195
dd 2024.07.04 0 195
99
점 하나하나씩 생각하자: Transformer 언어모델의 숨겨진 계산
dd | 2024.07.04 | 추천 0 | 조회 167
dd 2024.07.04 0 167
98
언어모델은 비밀리에 Q-함수입니다
dd | 2024.07.04 | 추천 0 | 조회 179
dd 2024.07.04 0 179
97
자가 플레이 적대 언어 게임은 LLM 추론을 향상시킵니다.
dd | 2024.07.04 | 추천 0 | 조회 315
dd 2024.07.04 0 315
96
여러 시뮬레이션된 세계에서 Instructable 에이전트 확장
dd | 2024.07.04 | 추천 0 | 조회 246
dd 2024.07.04 0 246
95
압축은 지능을 선형적으로 나타냅니다.
dd | 2024.07.04 | 추천 0 | 조회 245
dd 2024.07.04 0 245
94
Generalist Vision Transformer를 향하여
dd | 2024.07.04 | 추천 0 | 조회 179
dd 2024.07.04 0 179
93
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 329
dd 2024.07.04 0 329
92
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd | 2024.07.04 | 추천 0 | 조회 199
dd 2024.07.04 0 199
91
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd | 2024.07.04 | 추천 0 | 조회 157
dd 2024.07.04 0 157
90
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 150
ㅇㅇ 2024.07.04 0 150
89
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd | 2024.07.04 | 추천 0 | 조회 155
dd 2024.07.04 0 155
88
Genie: 생성적 상호 작용 환경
dd | 2024.07.04 | 추천 0 | 조회 155
dd 2024.07.04 0 155
87
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd | 2024.07.04 | 추천 0 | 조회 150
dd 2024.07.04 0 150
86
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd | 2024.07.04 | 추천 0 | 조회 154
dd 2024.07.04 0 154
85
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd | 2024.07.04 | 추천 0 | 조회 213
dd 2024.07.04 0 213
84
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd | 2024.07.04 | 추천 0 | 조회 146
dd 2024.07.04 0 146
83
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd | 2024.07.04 | 추천 0 | 조회 146
dd 2024.07.04 0 146
82
대규모 언어 모델을 위한 시간의 화살표
dd | 2024.07.04 | 추천 0 | 조회 150
dd 2024.07.04 0 150
81
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 165
ㅇㅇ 2024.07.04 0 165