최신논문

전체 234
번호 제목 작성자 작성일 추천 조회
94
Generalist Vision Transformer를 향하여
dd | 2024.07.04 | 추천 0 | 조회 130
dd 2024.07.04 0 130
93
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 256
dd 2024.07.04 0 256
92
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd | 2024.07.04 | 추천 0 | 조회 147
dd 2024.07.04 0 147
91
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd | 2024.07.04 | 추천 0 | 조회 116
dd 2024.07.04 0 116
90
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 108
ㅇㅇ 2024.07.04 0 108
89
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd | 2024.07.04 | 추천 0 | 조회 116
dd 2024.07.04 0 116
88
Genie: 생성적 상호 작용 환경
dd | 2024.07.04 | 추천 0 | 조회 121
dd 2024.07.04 0 121
87
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd | 2024.07.04 | 추천 0 | 조회 116
dd 2024.07.04 0 116
86
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd | 2024.07.04 | 추천 0 | 조회 118
dd 2024.07.04 0 118
85
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd | 2024.07.04 | 추천 0 | 조회 179
dd 2024.07.04 0 179
84
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd | 2024.07.04 | 추천 0 | 조회 110
dd 2024.07.04 0 110
83
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd | 2024.07.04 | 추천 0 | 조회 114
dd 2024.07.04 0 114
82
대규모 언어 모델을 위한 시간의 화살표
dd | 2024.07.04 | 추천 0 | 조회 115
dd 2024.07.04 0 115
81
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 130
ㅇㅇ 2024.07.04 0 130
80
자기 보상 언어모델
dd | 2024.07.04 | 추천 0 | 조회 140
dd 2024.07.04 0 140
79
GATS: 모으다-참석하다-흩어지다
dd | 2024.07.04 | 추천 0 | 조회 225
dd 2024.07.04 0 225
78
자가 재생 미세 조정을 통해 약한 언어 모델을 강력한 언어 모델로 변환
dd | 2024.07.04 | 추천 0 | 조회 213
dd 2024.07.04 0 213
77
ReST는 ReAct를 만납니다: 다단계 추론을 위한 자기개선 LLM 에이전트
dd | 2024.07.03 | 추천 0 | 조회 134
dd 2024.07.03 0 134
76
비지도 LLM 지식 발견의 과제
dd | 2024.07.03 | 추천 0 | 조회 117
dd 2024.07.03 0 117
75
인간 데이터를 넘어서: 언어 모델을 통한 문제 해결을 위한 자체 훈련 확장
ㅇㅇ | 2024.07.03 | 추천 0 | 조회 105
ㅇㅇ 2024.07.03 0 105