최신논문
전체 194
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 161
|
하이룽룽 | 2024.08.21 | 1 | 161 |
인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 185
|
하이룽룽 | 2024.08.21 | 1 | 185 |
인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 198
|
admin | 2024.06.25 | 1 | 198 |
인기글 |
자율 컴퓨팅의 비전: LLM이 그것을 현실로 만들 수 있을까?
하이룽룽
|
2024.07.22
|
추천 1
|
조회 157
|
하이룽룽 | 2024.07.22 | 1 | 157 |
인기글 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 133
|
ㅇㅇ | 2024.07.18 | 1 | 133 |
인기글 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 138
|
dd | 2024.07.08 | 1 | 138 |
인기글 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 131
|
dd | 2024.07.04 | 1 | 131 |
인기글 |
인공 초인적 지능에 있어 개방성은 필수적이다
dd
|
2024.07.04
|
추천 1
|
조회 85
|
dd | 2024.07.04 | 1 | 85 |
인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 1
|
조회 85
|
ㅇㅇ | 2024.07.04 | 1 | 85 |
인기글 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 131
|
admin | 2024.06.26 | 1 | 131 |
134 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 133
|
ㅇㅇ | 2024.07.18 | 1 | 133 |
133 |
기초 자동 평가자: 더 나은 자동 평가를 위한 대규모 언어 모델 길들이기
dd
|
2024.07.17
|
추천 0
|
조회 92
|
dd | 2024.07.17 | 0 | 92 |
132 |
백만 명의 전문가의 혼합
dd
|
2024.07.16
|
추천 0
|
조회 92
|
dd | 2024.07.16 | 0 | 92 |
131 |
Q-Sparse: 모든 대규모 언어모델은 완전 희소 활성화 가능
ㅇㅇ
|
2024.07.16
|
추천 0
|
조회 102
|
ㅇㅇ | 2024.07.16 | 0 | 102 |
130 |
Mobility VLA: Long-Context VLM 및 Topological Graph를 사용한 다중 모드 지침 탐색
admin
|
2024.07.11
|
추천 0
|
조회 96
|
admin | 2024.07.11 | 0 | 96 |
129 |
공리적 훈련을 통한 트랜스포머 인과 추론 교육
dd
|
2024.07.11
|
추천 0
|
조회 60
|
dd | 2024.07.11 | 0 | 60 |
128 |
PaliGemma: transfer를 위한 다재다능한 3B VLM
dd
|
2024.07.11
|
추천 0
|
조회 96
|
dd | 2024.07.11 | 0 | 96 |
127 |
Many-Shot In-Context 학습
dd
|
2024.07.09
|
추천 0
|
조회 102
|
dd | 2024.07.09 | 0 | 102 |
126 |
오프라인 Actor-Critic 강화 학습은 대형 모델로 확장됩니다.
dd
|
2024.07.08
|
추천 0
|
조회 101
|
dd | 2024.07.08 | 0 | 101 |
125 |
검색 없이 그랜드마스터 레벨 체스
ㅇㅇ
|
2024.07.08
|
추천 0
|
조회 105
|
ㅇㅇ | 2024.07.08 | 0 | 105 |
124 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 138
|
dd | 2024.07.08 | 1 | 138 |
123 |
반복적 자기 개선에서의 자발적 보상 해킹
dd
|
2024.07.08
|
추천 0
|
조회 85
|
dd | 2024.07.08 | 0 | 85 |
122 |
점들을 연결하기: LLM은 다양한 교육 데이터에서 잠재 구조를 추론하고 언어화할 수 있습니다.
admin
|
2024.07.04
|
추천 0
|
조회 82
|
admin | 2024.07.04 | 0 | 82 |
121 |
언어모델은 확률론적 추론이 가능합니다
dd
|
2024.07.04
|
추천 0
|
조회 86
|
dd | 2024.07.04 | 0 | 86 |
120 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 131
|
dd | 2024.07.04 | 1 | 131 |
119 |
Monte Carlo Tree를 통한 GPT-4 레벨 수학 올림피아드 솔루션 액세스 LLaMa-3 8B를 사용한 자체 정제
dd
|
2024.07.04
|
추천 0
|
조회 91
|
dd | 2024.07.04 | 0 | 91 |
118 |
이미지는 재구성 및 생성을 위해 32개의 토큰만큼 가치가 있습니다.
dd
|
2024.07.04
|
추천 0
|
조회 90
|
dd | 2024.07.04 | 0 | 90 |
117 |
자동화된 프로세스 감독을 통해 언어모델의 수학적 추론 개선
dd
|
2024.07.04
|
추천 0
|
조회 92
|
dd | 2024.07.04 | 0 | 92 |
116 |
MS, VALL-E2 발표
dd
|
2024.07.04
|
추천 0
|
조회 102
|
dd | 2024.07.04 | 0 | 102 |
115 |
ReLU-KAN: 행렬 추가, 점 곱셈 및 ReLU만 필요한 새로운 Kolmogorov-Arnold 네트워크
dd
|
2024.07.04
|
추천 0
|
조회 155
|
dd | 2024.07.04 | 0 | 155 |