최신논문
전체 194
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 161
|
하이룽룽 | 2024.08.21 | 1 | 161 |
인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 185
|
하이룽룽 | 2024.08.21 | 1 | 185 |
인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 198
|
admin | 2024.06.25 | 1 | 198 |
인기글 |
자율 컴퓨팅의 비전: LLM이 그것을 현실로 만들 수 있을까?
하이룽룽
|
2024.07.22
|
추천 1
|
조회 157
|
하이룽룽 | 2024.07.22 | 1 | 157 |
인기글 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 133
|
ㅇㅇ | 2024.07.18 | 1 | 133 |
인기글 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 138
|
dd | 2024.07.08 | 1 | 138 |
인기글 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 131
|
dd | 2024.07.04 | 1 | 131 |
인기글 |
인공 초인적 지능에 있어 개방성은 필수적이다
dd
|
2024.07.04
|
추천 1
|
조회 85
|
dd | 2024.07.04 | 1 | 85 |
인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 1
|
조회 85
|
ㅇㅇ | 2024.07.04 | 1 | 85 |
인기글 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 131
|
admin | 2024.06.26 | 1 | 131 |
54 |
(2023년 10월) 유레카: 대규모 언어모델 코딩을 통한 인간수준 보상 설계
dd
|
2024.07.02
|
추천 0
|
조회 61
|
dd | 2024.07.02 | 0 | 61 |
53 |
(2023년 10월) Polymatrix 분해 가능성을 통한 멀티플레이어 게임에서 셀프 플레이에 대한 보장
ㅇㅇ
|
2024.07.02
|
추천 0
|
조회 52
|
ㅇㅇ | 2024.07.02 | 0 | 52 |
52 |
고밀도 비전 작업을 위한 확산 기반 일반주의자를 향하여
ㅇㅇ
|
2024.07.02
|
추천 0
|
조회 49
|
ㅇㅇ | 2024.07.02 | 0 | 49 |
51 |
대규모 멀티모달 언어모델에서는 인간과 유사한 객체 개념 표현이 자연스럽게 나타납니다.
ㅇㅇ
|
2024.07.02
|
추천 0
|
조회 68
|
ㅇㅇ | 2024.07.02 | 0 | 68 |
50 |
(2023년 10월) 파운데이션 강화 학습: 파운데이션 사전 지원을 통해 구체화된 일반 요원을 향함
admin
|
2024.07.01
|
추천 0
|
조회 63
|
admin | 2024.07.01 | 0 | 63 |
49 |
1,000,000,000개의 페르소나로 합성 데이터 생성 확장
ㅇㅇ
|
2024.07.01
|
추천 0
|
조회 59
|
ㅇㅇ | 2024.07.01 | 0 | 59 |
48 |
(2023년 10월) 언어모델은 공간과 시간을 표현합니다
admin
|
2024.07.01
|
추천 0
|
조회 70
|
admin | 2024.07.01 | 0 | 70 |
47 |
(2023년 10월) 거의 무한한 컨텍스트를 위한 Blockwise Transformers를 사용한 링 어텐션
admin
|
2024.07.01
|
추천 0
|
조회 84
|
admin | 2024.07.01 | 0 | 84 |
46 |
(2023년 10월) 신경망의 관계적 제약은 추상적 기하학적 규칙성에 대한 인간의 편견을 재현합니다.
admin
|
2024.07.01
|
추천 0
|
조회 75
|
admin | 2024.07.01 | 0 | 75 |
45 |
(2023년 10월) 말하기 전에 생각하세요: 일시정지 토큰을 사용한 언어 모델 훈련
admin
|
2024.07.01
|
추천 0
|
조회 64
|
admin | 2024.07.01 | 0 | 64 |
44 |
(2023년 10월) Self-Taught Optimizer(STOP): 반복적으로 자체 개선
admin
|
2024.07.01
|
추천 0
|
조회 66
|
admin | 2024.07.01 | 0 | 66 |
43 |
(2023년 10월) 의심 에이전트: 마음 이론 인식 GPT-4를 사용하여 불완전한 정보 게임하기
admin
|
2024.07.01
|
추천 0
|
조회 79
|
admin | 2024.07.01 | 0 | 79 |
42 |
(2023년 10월) RLAdapter: 오픈월드에서 대규모 언어모델과 강화학습 연결
admin
|
2024.07.01
|
추천 0
|
조회 71
|
admin | 2024.07.01 | 0 | 71 |
41 |
(2023년 10월) 알파제로와 유사한 트리 검색으로 대규모 언어모델 디코딩 및 학습 가이드
admin
|
2024.07.01
|
추천 0
|
조회 68
|
admin | 2024.07.01 | 0 | 68 |
40 |
혼합 RL 설정의 전문가 혼합
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 109
|
ㅇㅇ | 2024.06.27 | 0 | 109 |
39 |
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
admin
|
2024.06.27
|
추천 0
|
조회 85
|
admin | 2024.06.27 | 0 | 85 |
38 |
더 크고, 정규화되고, 낙관적입니다. 컴퓨팅 및 샘플 효율적 연속 제어를 위한 확장
ㅇㅇ
|
2024.06.27
|
추천 0
|
조회 82
|
ㅇㅇ | 2024.06.27 | 0 | 82 |
37 |
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
admin
|
2024.06.26
|
추천 0
|
조회 146
|
admin | 2024.06.26 | 0 | 146 |
36 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 131
|
admin | 2024.06.26 | 1 | 131 |
35 |
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
admin
|
2024.06.26
|
추천 0
|
조회 95
|
admin | 2024.06.26 | 0 | 95 |