Multiagent Finetuning: 다양한 추론 체인을 통한 자기 개선

작성자

하이룽룽

작성일

2025-01-14 18:32

조회

263

https://arxiv.org/abs/2501.05707

https://x.com/du_yilun/status/1878851914307371440?t=Ykw_JxHU-NXh32Z3oZbsJA&s=19

대규모 언어 모델(LLM)은 최근 몇 년 동안 놀라운 성능을 달성했지만 근본적인 훈련 데이터에 의해 제한됩니다. 훈련 데이터를 넘어 모델을 개선하기 위해 최근 연구에서는 LLM을 사용하여 자율적 자기 개선을 위한 합성 데이터를 생성하는 방법을 탐구했습니다. 그러나 자기 계발을 위한 연속적인 단계는 수익이 감소하는 지점에 도달할 수 있습니다. 이 연구에서 우리는 자기 개선에 대한 보완적 접근 방식을 제안하며, 이는 언어 모델의 다중 에이전트 사회에 미세 조정이 적용되는 것입니다. 모두 동일한 기본 모델에서 시작하는 언어 모델 그룹은 모델 간의 다중 에이전트 상호 작용을 통해 생성된 데이터를 사용하여 각 모델을 업데이트하여 독립적으로 전문화됩니다. 독립적인 데이터 집합에서 각 모델을 학습시킴으로써 이 접근 방식을 통해 모델 간 전문화와 모델 집합에 대한 다양화를 가능하게 하는 방법을 설명합니다. 그 결과, 우리의 전체 시스템은 다양한 추론 체인을 보존하고 단일 에이전트 자체 개선 방법보다 훨씬 더 많은 미세 조정을 통해 자율적으로 개선할 수 있습니다. 우리는 광범위한 추론 작업 세트에서 접근 방식의 효율성을 정량적으로 설명합니다.

전체 0

« Transformer^2 자기 적응 LLM

트랜스포머 후속 Titans: Learning to Memorize at Test Time »

목록보기 답글쓰기

글수정 글삭제

N 일론 머스크 "그록4 8일 스트리밍 발표예정"	07:13
N 나타났으면 (3)	2025.07.07
N 딥마인드 아이소모픽랩스 첫 인체 임상 시험 준비 중	2025.07.07
N OpenAI 연구원 "세계 최초 바이오 에이전트 어떻게 유출되었는지 궁금"	2025.07.05
N 가속하셈 (7)	2025.07.05
N 그록4 HLE 45 달성	2025.07.05
N 클로드 4.5? (claude-neptune-v3) 등장	2025.07.04
N OpenAI 연구원 "재정적자는 가짜"	2025.07.04
에마드 모스타크 "내년까지 화면으로 할 수 있는 모든 작업을 AI가 더 빠르고 저렴하게 처리할 수 있을 것" (2)	2025.07.02
Grok4 0629	2025.07.02

N 일단 재들 기술력 몸 클로킹 우주마음대로 왔다갔다하는 우주선 이것만해도 인간하고 차원이다른	09:57
N 외계붕이	07:30
N 외계붕이 vs AGI 누가 더 셀 것 같으셈?	2025.07.07
N 딥러닝 혁명과 스케일링 법칙은 아직 초기 수준이셈 폭발적으로 발전할 여지가 많이 남아있음	2025.07.07
N 룽룽이는 지미애플의 이번말 우주끝에 가는 비유 발전 말이거믿는다고했나??	2025.07.07
N 본격 휴머노이드는 2027이라던데 가격 안정화 고려하면 2020년대 말 잡아야 할 듯 그 전에 빠른이륙 일어나서 특이점 오면 좋겠으셈 ㅜㅜ	2025.07.07
N 로봇발전 폭팔적이 몇년안으로도될수있단글봣는데 되면가능하겟지 안될수도있고 모름	2025.07.06
N 이거 언제오셈? ㅜ.,ㅠ	2025.07.06
N 폭주하는 초지능이 가속주의 룬붕이를 최고지도자로 삼고 지구를 정복한다는 농담이셈	2025.07.05
N 이게 무슨소리셈?	2025.07.05

지미애플의 오리온	2024.08.28
전 OpenAI GTM 잭 캐스 "트랜스포머로 AGI 달성 가능" (7)	2024.07.04
전 구글 차이나 사장 리 카이푸 "AI는 2025년에 박사 학위 수준을 넘어설 것"	2024.07.29
로건 킬패트릭 "2025"	2024.08.06
앞으로 큰일이네 (8)	2024.08.08
선형들이 짖어대지만 (4)	2024.08.21
OpenAI 오리온 출시 예정 (7)	2024.08.27
gpt-4o 설명 바뀜	2024.08.31
다리오 아모데이 "2026 AGI, 5~10년 동안 1000년치 발전 일어날 것" (8)	2024.10.12
...... (2)	2025.04.21