최신논문
전체 194
번호 | 제목 | 작성자 | 작성일 | 추천 | 조회 |
인기글 |
Transfusion: 다음 토큰을 예측하고 하나의 Multi-Modal 모델로 이미지를 확산시킵니다.
하이룽룽
|
2024.08.21
|
추천 1
|
조회 161
|
하이룽룽 | 2024.08.21 | 1 | 161 |
인기글 |
코딩할 것인가, 코딩하지 않을 것인가? 사전 교육에서 코드의 영향 탐색
하이룽룽
|
2024.08.21
|
추천 1
|
조회 185
|
하이룽룽 | 2024.08.21 | 1 | 185 |
인기글 |
(2023년 7월) LongNet: 트랜스포머를 1,000,000,000 토큰으로 확장
admin
|
2024.06.25
|
추천 1
|
조회 198
|
admin | 2024.06.25 | 1 | 198 |
인기글 |
자율 컴퓨팅의 비전: LLM이 그것을 현실로 만들 수 있을까?
하이룽룽
|
2024.07.22
|
추천 1
|
조회 157
|
하이룽룽 | 2024.07.22 | 1 | 157 |
인기글 |
OpenAI 최초의 슈퍼얼라이먼트 논문 발표
ㅇㅇ
|
2024.07.18
|
추천 1
|
조회 133
|
ㅇㅇ | 2024.07.18 | 1 | 133 |
인기글 |
학습(테스트 시간에 학습): 표현적 숨겨진 상태를 가진 RNN
dd
|
2024.07.08
|
추천 1
|
조회 138
|
dd | 2024.07.08 | 1 | 138 |
인기글 |
초월: 생성모델은 이를 교육하는 전문가보다 성능이 뛰어날 수 있습니다.
dd
|
2024.07.04
|
추천 1
|
조회 131
|
dd | 2024.07.04 | 1 | 131 |
인기글 |
인공 초인적 지능에 있어 개방성은 필수적이다
dd
|
2024.07.04
|
추천 1
|
조회 85
|
dd | 2024.07.04 | 1 | 85 |
인기글 |
플라톤적 표현 가설
ㅇㅇ
|
2024.07.04
|
추천 1
|
조회 85
|
ㅇㅇ | 2024.07.04 | 1 | 85 |
인기글 |
(2023년 9월) 언어 모델링은 압축이다
admin
|
2024.06.26
|
추천 1
|
조회 131
|
admin | 2024.06.26 | 1 | 131 |
94 |
Generalist Vision Transformer를 향하여
dd
|
2024.07.04
|
추천 0
|
조회 65
|
dd | 2024.07.04 | 0 | 65 |
93 |
Quiet-STaR: 언어 모델은 말하기 전에 스스로 생각하는 법을 배울 수 있습니다.
dd
|
2024.07.04
|
추천 0
|
조회 101
|
dd | 2024.07.04 | 0 | 101 |
92 |
1비트 LLM 시대: 모든 대규모 언어 모델은 1.58비트입니다.
dd
|
2024.07.04
|
추천 0
|
조회 62
|
dd | 2024.07.04 | 0 | 62 |
91 |
언어모델을 넘어: 바이트 모델은 디지털 세계 시뮬레이터입니다.
dd
|
2024.07.04
|
추천 0
|
조회 51
|
dd | 2024.07.04 | 0 | 51 |
90 |
그리핀: 효율적인 언어 모델을 위한 지역적 주의와 게이트 선형 재귀를 혼합
ㅇㅇ
|
2024.07.04
|
추천 0
|
조회 45
|
ㅇㅇ | 2024.07.04 | 0 | 45 |
89 |
트랜스포머가 경사 하강을 통해 인과 구조를 학습하는 방법
dd
|
2024.07.04
|
추천 0
|
조회 51
|
dd | 2024.07.04 | 0 | 51 |
88 |
Genie: 생성적 상호 작용 환경
dd
|
2024.07.04
|
추천 0
|
조회 55
|
dd | 2024.07.04 | 0 | 55 |
87 |
강력한 에이전트는 인과 세계 모델을 학습합니다.
dd
|
2024.07.04
|
추천 0
|
조회 51
|
dd | 2024.07.04 | 0 | 51 |
86 |
전문가의 혼합으로 심층 RL을 위한 매개변수 스케일링 잠금 해제
dd
|
2024.07.04
|
추천 0
|
조회 54
|
dd | 2024.07.04 | 0 | 54 |
85 |
전문가의 세분화된 혼합을 위한 스케일링 법칙
dd
|
2024.07.04
|
추천 0
|
조회 113
|
dd | 2024.07.04 | 0 | 113 |
84 |
OS-Copilot: 자기 개선을 통한 일반 컴퓨터 에이전트를 향하여
dd
|
2024.07.04
|
추천 0
|
조회 46
|
dd | 2024.07.04 | 0 | 46 |
83 |
LLM 에이전트는 웹사이트를 자율적으로 해킹할 수 있습니다
dd
|
2024.07.04
|
추천 0
|
조회 49
|
dd | 2024.07.04 | 0 | 49 |
82 |
대규모 언어 모델을 위한 시간의 화살표
dd
|
2024.07.04
|
추천 0
|
조회 44
|
dd | 2024.07.04 | 0 | 44 |
81 |
신경망의 학습가능성의 경계는 프랙탈이다
ㅇㅇ
|
2024.07.04
|
추천 0
|
조회 53
|
ㅇㅇ | 2024.07.04 | 0 | 53 |
80 |
자기 보상 언어모델
dd
|
2024.07.04
|
추천 0
|
조회 66
|
dd | 2024.07.04 | 0 | 66 |
79 |
GATS: 모으다-참석하다-흩어지다
dd
|
2024.07.04
|
추천 0
|
조회 98
|
dd | 2024.07.04 | 0 | 98 |
78 |
자가 재생 미세 조정을 통해 약한 언어 모델을 강력한 언어 모델로 변환
dd
|
2024.07.04
|
추천 0
|
조회 72
|
dd | 2024.07.04 | 0 | 72 |
77 |
ReST는 ReAct를 만납니다: 다단계 추론을 위한 자기개선 LLM 에이전트
dd
|
2024.07.03
|
추천 0
|
조회 63
|
dd | 2024.07.03 | 0 | 63 |
76 |
비지도 LLM 지식 발견의 과제
dd
|
2024.07.03
|
추천 0
|
조회 53
|
dd | 2024.07.03 | 0 | 53 |
75 |
인간 데이터를 넘어서: 언어 모델을 통한 문제 해결을 위한 자체 훈련 확장
ㅇㅇ
|
2024.07.03
|
추천 0
|
조회 39
|
ㅇㅇ | 2024.07.03 | 0 | 39 |