최신논문

전체 194
번호 제목 작성자 작성일 추천 조회
54
(2023년 10월) 유레카: 대규모 언어모델 코딩을 통한 인간수준 보상 설계
dd | 2024.07.02 | 추천 0 | 조회 61
dd 2024.07.02 0 61
53
(2023년 10월) Polymatrix 분해 가능성을 통한 멀티플레이어 게임에서 셀프 플레이에 대한 보장
ㅇㅇ | 2024.07.02 | 추천 0 | 조회 52
ㅇㅇ 2024.07.02 0 52
52
고밀도 비전 작업을 위한 확산 기반 일반주의자를 향하여
ㅇㅇ | 2024.07.02 | 추천 0 | 조회 49
ㅇㅇ 2024.07.02 0 49
51
대규모 멀티모달 언어모델에서는 인간과 유사한 객체 개념 표현이 자연스럽게 나타납니다.
ㅇㅇ | 2024.07.02 | 추천 0 | 조회 68
ㅇㅇ 2024.07.02 0 68
50
(2023년 10월) 파운데이션 강화 학습: 파운데이션 사전 지원을 통해 구체화된 일반 요원을 향함
admin | 2024.07.01 | 추천 0 | 조회 63
admin 2024.07.01 0 63
49
1,000,000,000개의 페르소나로 합성 데이터 생성 확장
ㅇㅇ | 2024.07.01 | 추천 0 | 조회 59
ㅇㅇ 2024.07.01 0 59
48
(2023년 10월) 언어모델은 공간과 시간을 표현합니다
admin | 2024.07.01 | 추천 0 | 조회 70
admin 2024.07.01 0 70
47
(2023년 10월) 거의 무한한 컨텍스트를 위한 Blockwise Transformers를 사용한 링 어텐션
admin | 2024.07.01 | 추천 0 | 조회 84
admin 2024.07.01 0 84
46
(2023년 10월) 신경망의 관계적 제약은 추상적 기하학적 규칙성에 대한 인간의 편견을 재현합니다.
admin | 2024.07.01 | 추천 0 | 조회 75
admin 2024.07.01 0 75
45
(2023년 10월) 말하기 전에 생각하세요: 일시정지 토큰을 사용한 언어 모델 훈련
admin | 2024.07.01 | 추천 0 | 조회 64
admin 2024.07.01 0 64
44
(2023년 10월) Self-Taught Optimizer(STOP): 반복적으로 자체 개선
admin | 2024.07.01 | 추천 0 | 조회 66
admin 2024.07.01 0 66
43
(2023년 10월) 의심 에이전트: 마음 이론 인식 GPT-4를 사용하여 불완전한 정보 게임하기
admin | 2024.07.01 | 추천 0 | 조회 79
admin 2024.07.01 0 79
42
(2023년 10월) RLAdapter: 오픈월드에서 대규모 언어모델과 강화학습 연결
admin | 2024.07.01 | 추천 0 | 조회 71
admin 2024.07.01 0 71
41
(2023년 10월) 알파제로와 유사한 트리 검색으로 대규모 언어모델 디코딩 및 학습 가이드
admin | 2024.07.01 | 추천 0 | 조회 68
admin 2024.07.01 0 68
40
혼합 RL 설정의 전문가 혼합
ㅇㅇ | 2024.06.27 | 추천 0 | 조회 109
ㅇㅇ 2024.06.27 0 109
39
공동 사례 선택을 통한 데이터 큐레이션으로 다중 모드 학습이 더욱 가속화됩니다.
admin | 2024.06.27 | 추천 0 | 조회 85
admin 2024.06.27 0 85
38
더 크고, 정규화되고, 낙관적입니다. 컴퓨팅 및 샘플 효율적 연속 제어를 위한 확장
ㅇㅇ | 2024.06.27 | 추천 0 | 조회 82
ㅇㅇ 2024.06.27 0 82
37
(2023년 9월) 멀티모달 기반 모델: 전문가에서 범용 보조자까지
admin | 2024.06.26 | 추천 0 | 조회 146
admin 2024.06.26 0 146
36
(2023년 9월) 언어 모델링은 압축이다
admin | 2024.06.26 | 추천 1 | 조회 131
admin 2024.06.26 1 131
35
(2023년 9월) 자동회귀 다음 토큰 예측자는 범용 학습기입니다.
admin | 2024.06.26 | 추천 0 | 조회 95
admin 2024.06.26 0 95