최신논문

전체 194
번호 제목 작성자 작성일 추천 조회
94
Generalist Vision Transformer를 향하여
dd | 2024.07.04 | 추천 0 | 조회 65
dd 2024.07.04 0 65
93
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd | 2024.07.04 | 추천 0 | 조회 101
dd 2024.07.04 0 101
92
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd | 2024.07.04 | 추천 0 | 조회 62
dd 2024.07.04 0 62
91
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd | 2024.07.04 | 추천 0 | 조회 51
dd 2024.07.04 0 51
90
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 45
ㅇㅇ 2024.07.04 0 45
89
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd | 2024.07.04 | 추천 0 | 조회 51
dd 2024.07.04 0 51
88
Genie: 생성적 상호 작용 환경
dd | 2024.07.04 | 추천 0 | 조회 55
dd 2024.07.04 0 55
87
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd | 2024.07.04 | 추천 0 | 조회 51
dd 2024.07.04 0 51
86
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd | 2024.07.04 | 추천 0 | 조회 54
dd 2024.07.04 0 54
85
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd | 2024.07.04 | 추천 0 | 조회 113
dd 2024.07.04 0 113
84
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd | 2024.07.04 | 추천 0 | 조회 46
dd 2024.07.04 0 46
83
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd | 2024.07.04 | 추천 0 | 조회 49
dd 2024.07.04 0 49
82
대규모 언어 모델을 위한 시간의 화살표
dd | 2024.07.04 | 추천 0 | 조회 44
dd 2024.07.04 0 44
81
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ | 2024.07.04 | 추천 0 | 조회 53
ㅇㅇ 2024.07.04 0 53
80
자기 보상 언어모델
dd | 2024.07.04 | 추천 0 | 조회 66
dd 2024.07.04 0 66
79
GATS: 모으다-참석하다-흩어지다
dd | 2024.07.04 | 추천 0 | 조회 98
dd 2024.07.04 0 98
78
자가 재생 미세 조정을 통해 약한 언어 모델을 강력한 언어 모델로 변환
dd | 2024.07.04 | 추천 0 | 조회 72
dd 2024.07.04 0 72
77
ReST는 ReAct를 만납니다: 다단계 추론을 위한 자기개선 LLM 에이전트
dd | 2024.07.03 | 추천 0 | 조회 63
dd 2024.07.03 0 63
76
비지도 LLM 지식 발견의 과제
dd | 2024.07.03 | 추천 0 | 조회 53
dd 2024.07.03 0 53
75
인간 데이터를 넘어서: 언어 모델을 통한 문제 해결을 위한 자체 훈련 확장
ㅇㅇ | 2024.07.03 | 추천 0 | 조회 39
ㅇㅇ 2024.07.03 0 39