최신논문
전체 240
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 413
|
하이룽룽 | 2024.08.21 | 1 | 413 |
인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 524
|
하이룽룽 | 2024.08.21 | 1 | 524 |
인기글 |
New 일반 에이전트에는 세계 모델이 필요합니다. (4)
하이룽룽
|
2025.06.04
|
추천 0
|
조회 41
|
하이룽룽 | 2025.06.04 | 0 | 41 |
인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 564
|
admin | 2024.06.25 | 1 | 564 |
인기글 |
자율 컴퓨팅의 비전: LLM이 그것을 현실로 만들 수 있을까?
하이룽룽
|
2024.07.22
|
추천 1
|
조회 425
|
하이룽룽 | 2024.07.22 | 1 | 425 |
인기글 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 368
|
ㅇㅇ | 2024.07.18 | 1 | 368 |
인기글 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 372
|
dd | 2024.07.08 | 1 | 372 |
인기글 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 372
|
dd | 2024.07.04 | 1 | 372 |
인기글 |
인공 초인적 지능에 있어 개방성은 필수적이다
dd
|
2024.07.04
|
추천 1
|
조회 317
|
dd | 2024.07.04 | 1 | 317 |
인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 1
|
조회 316
|
ㅇㅇ | 2024.07.04 | 1 | 316 |
220 |
YOLOv12: 주의 집중 실시간 물체 감지기
하이룽룽
|
2025.02.19
|
추천 0
|
조회 88
|
하이룽룽 | 2025.02.19 | 0 | 88 |
219 |
인간과 동물의 행동에서 상징적 인지 모델 발견
하이룽룽
|
2025.02.19
|
추천 1
|
조회 97
|
하이룽룽 | 2025.02.19 | 1 | 97 |
218 |
네이티브 스파스 어텐션: 하드웨어 정렬 및 네이티브 학습 가능한 스파스 어텐션
하이룽룽
|
2025.02.18
|
추천 0
|
조회 96
|
하이룽룽 | 2025.02.18 | 0 | 96 |
217 |
스펙트럼 여행: 트랜스포머가 최단 경로를 예측하는 방법
하이룽룽
|
2025.02.16
|
추천 0
|
조회 92
|
하이룽룽 | 2025.02.16 | 0 | 92 |
216 |
인공 일반 지능과 인간 고용의 종말 : 사회 계약 재협상의 필요성
하이룽룽
|
2025.02.16
|
추천 0
|
조회 91
|
하이룽룽 | 2025.02.16 | 0 | 91 |
215 |
TransMLA: 다중 헤드 잠재 주의만 있으면 됩니다.
하이룽룽
|
2025.02.13
|
추천 0
|
조회 117
|
하이룽룽 | 2025.02.13 | 0 | 117 |
214 |
모델 자체 탐색을 통한 자동화된 기능 발견
하이룽룽
|
2025.02.12
|
추천 1
|
조회 101
|
하이룽룽 | 2025.02.12 | 1 | 101 |
213 |
openai 대규모 추론 모델을 사용한 경쟁 프로그래밍
하이룽룽
|
2025.02.12
|
추천 0
|
조회 106
|
하이룽룽 | 2025.02.12 | 0 | 106 |
212 |
잠재 추론을 통한 테스트 시간 컴퓨팅 확장: 재귀적 깊이 접근 방식
하이룽룽
|
2025.02.10
|
추천 0
|
조회 105
|
하이룽룽 | 2025.02.10 | 0 | 105 |
211 |
AlphaGeometry2로 올림피아드 기하학을 푸는 금메달리스트 성능
하이룽룽
|
2025.02.07
|
추천 0
|
조회 107
|
하이룽룽 | 2025.02.07 | 0 | 107 |
210 |
s1: 간단한 테스트 시간 스케일링
하이룽룽
|
2025.02.03
|
추천 0
|
조회 131
|
하이룽룽 | 2025.02.03 | 0 | 131 |
209 |
RL + 트랜스포머 = 범용 문제 해결사
하이룽룽
|
2025.02.02
|
추천 0
|
조회 116
|
하이룽룽 | 2025.02.02 | 0 | 116 |
208 |
자기-개선(Self-Improving) 트랜스포머가 쉬운-어려운 문제 및 길이 일반화 문제를 극복하는 방법
하이룽룽
|
2025.02.02
|
추천 0
|
조회 122
|
하이룽룽 | 2025.02.02 | 0 | 122 |
207 |
Iclr 2025 워크숍 인간의 감독 없이 자체 개선되는 파운데이션 모델
하이룽룽
|
2025.01.30
|
추천 1
|
조회 115
|
하이룽룽 | 2025.01.30 | 1 | 115 |
206 |
FP4 양자화를 사용한 대규모 언어 모델 교육 최적화
하이룽룽
|
2025.01.29
|
추천 0
|
조회 128
|
하이룽룽 | 2025.01.29 | 0 | 128 |
205 |
범용 모델 프리 강화학습을 향하여
하이룽룽
|
2025.01.28
|
추천 1
|
조회 115
|
하이룽룽 | 2025.01.28 | 1 | 115 |
204 |
Eagle 2: 프론티어 비전-언어 모델을 위한 처음부터 포스트 트레이닝 데이터 전략 구축
하이룽룽
|
2025.01.28
|
추천 0
|
조회 122
|
하이룽룽 | 2025.01.28 | 0 | 122 |
203 |
LLM이 직관적 자기 인식 형태를 가지고 있음
하이룽룽
|
2025.01.22
|
추천 0
|
조회 114
|
하이룽룽 | 2025.01.22 | 0 | 114 |
202 |
더 깊이 있는 LLM 사고의 진화
하이룽룽
|
2025.01.20
|
추천 0
|
조회 285
|
하이룽룽 | 2025.01.20 | 0 | 285 |
201 |
트랜스포머 후속 Titans: Learning to Memorize at Test Time
하이룽룽
|
2025.01.14
|
추천 1
|
조회 271
|
하이룽룽 | 2025.01.14 | 1 | 271 |