최신논문
전체 240
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 413
|
하이룽룽 | 2024.08.21 | 1 | 413 |
인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 525
|
하이룽룽 | 2024.08.21 | 1 | 525 |
인기글 |
New 일반 에이전트에는 세계 모델이 필요합니다. (4)
하이룽룽
|
2025.06.04
|
추천 0
|
조회 42
|
하이룽룽 | 2025.06.04 | 0 | 42 |
인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 564
|
admin | 2024.06.25 | 1 | 564 |
인기글 |
자율 컴퓨팅의 비전: LLM이 그것을 현실로 만들 수 있을까?
하이룽룽
|
2024.07.22
|
추천 1
|
조회 425
|
하이룽룽 | 2024.07.22 | 1 | 425 |
인기글 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 368
|
ㅇㅇ | 2024.07.18 | 1 | 368 |
인기글 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 372
|
dd | 2024.07.08 | 1 | 372 |
인기글 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 372
|
dd | 2024.07.04 | 1 | 372 |
인기글 |
인공 초인적 지능에 있어 개방성은 필수적이다
dd
|
2024.07.04
|
추천 1
|
조회 317
|
dd | 2024.07.04 | 1 | 317 |
인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 1
|
조회 316
|
ㅇㅇ | 2024.07.04 | 1 | 316 |
40 |
혼합 RL 설정의 전문가 혼합
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 351
|
ㅇㅇ | 2024.06.27 | 0 | 351 |
39 |
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
admin
|
2024.06.27
|
추천 0
|
조회 272
|
admin | 2024.06.27 | 0 | 272 |
38 |
더 크고, 정규화되고, 낙관적입니다. 컴퓨팅 및 샘플 효율적 연속 제어를 위한 확장
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 265
|
ㅇㅇ | 2024.06.27 | 0 | 265 |
37 |
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
admin
|
2024.06.26
|
추천 0
|
조회 314
|
admin | 2024.06.26 | 0 | 314 |
36 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 370
|
admin | 2024.06.26 | 1 | 370 |
35 |
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
admin
|
2024.06.26
|
추천 0
|
조회 248
|
admin | 2024.06.26 | 0 | 248 |
34 |
(2023년 9월) Vision Transformers에서 Softmax를 ReLU로 교체
admin
|
2024.06.26
|
추천 0
|
조회 237
|
admin | 2024.06.26 | 0 | 237 |
33 |
(2023년 8월) 대규모 언어모델은 인간과 유사한 개념 구성으로 수렴됩니다
admin
|
2024.06.26
|
추천 0
|
조회 325
|
admin | 2024.06.26 | 0 | 325 |
32 |
(2023년 9월) 자기 지도 시퀀스 모델의 월드모델에서의 새로운 선형 표현
admin
|
2024.06.25
|
추천 0
|
조회 213
|
admin | 2024.06.25 | 0 | 213 |
31 |
(2023년 9월) 컴파일러 최적화를 위한 대규모 언어모델
admin
|
2024.06.25
|
추천 0
|
조회 216
|
admin | 2024.06.25 | 0 | 216 |
30 |
(2023년 9월) RAIN: 언어모델은 미세조정 없이 스스로 정렬될 수 있습니다.
admin
|
2024.06.25
|
추천 0
|
조회 189
|
admin | 2024.06.25 | 0 | 189 |
29 |
(2023년 9월) Transformers에서 메사 최적화 알고리즘 발견
admin
|
2024.06.25
|
추천 0
|
조회 199
|
admin | 2024.06.25 | 0 | 199 |
28 |
(2023년 9월) 표면 통계 너머: 잠재 확산 모델의 장면 표현
admin
|
2024.06.25
|
추천 0
|
조회 170
|
admin | 2024.06.25 | 0 | 170 |
27 |
(2023년 9월) 최적화 도구로서의 대규모 언어모델
admin
|
2024.06.25
|
추천 0
|
조회 218
|
admin | 2024.06.25 | 0 | 218 |
26 |
(2023년 9월) Q-Transformer: 자동회귀 Q-함수를 통한 확장 가능한 오프라인 강화 학습
admin
|
2024.06.25
|
추천 0
|
조회 212
|
admin | 2024.06.25 | 0 | 212 |
25 |
(2023년 9월) Gated RNN에서 어텐션 기능 발견
admin
|
2024.06.25
|
추천 0
|
조회 215
|
admin | 2024.06.25 | 0 | 215 |
24 |
(2023년 9월) 대규모 언어모델에서 마음이론 공개: 인간 두뇌의 단일뉴런과 평행
admin
|
2024.06.25
|
추천 0
|
조회 202
|
admin | 2024.06.25 | 0 | 202 |
23 |
(2023년 9월) 언어모델이 자신이 언어모델이라는 것을 (자발적으로) 인식할 수 있습니까
admin
|
2024.06.25
|
추천 0
|
조회 173
|
admin | 2024.06.25 | 0 | 173 |
22 |
(2023년 8월) RoboTAP: Few-Shot 시각적 모방을 위한 임의 지점 추적
admin
|
2024.06.25
|
추천 0
|
조회 153
|
admin | 2024.06.25 | 0 | 153 |
21 |
(2023년 8월) 심층 강화학습을 활용한 챔피언 수준의 드론 경주
admin
|
2024.06.25
|
추천 0
|
조회 157
|
admin | 2024.06.25 | 0 | 157 |