뉴스/정보

Anthropic의 수석 과학자 "2025년에 에이전트가 더 좋아질 수 있는 5가지 방법"

작성자
하이룽룽
작성일
2025-01-11 21:36
조회
19
Anthropic의 수석 과학자가 2025년에 에이전트가 더 좋아질 수 있는 5가지 방법에 대해 이야기합니다. MIT 테크놀로지 리뷰

에이전트(Agents)는 현재 테크 업계에서 가장 뜨거운 이슈다. 구글 딥마인드, 오픈AI, 앤트로픽(Anthropic) 등 주요 기업들이 대형 언어 모델(LLM)에 자율적으로 업무를 수행할 수 있는 능력을 부여하기 위해 경쟁하고 있다. 업계 용어로는 이를 ‘에이전틱 AI(agentic AI)’라고 부르는데, 실리콘밸리 전역에서 큰 화제가 되고 있다. 엔비디아(Nvidia)부터 세일즈포스(Salesforce)까지 업계 모든 이들이 이 기술이 산업 전반을 어떻게 뒤흔들지 논의하고 있다.

오픈AI의 샘 알트먼(Sam Altman)은 지난주 블로그 글에서 “2025년에는 첫 번째 AI 에이전트가 ‘직장에 합류’하여 기업의 생산성을 실제로 바꿔 놓는 모습을 보게 될 수도 있다”고 언급했다.

가장 넓은 의미에서 ‘에이전트’란, 거의 감시나 감독 없이 어떤 일을 알아서 진행하는 소프트웨어 시스템을 말한다. 수행해야 할 작업이 복잡할수록 필요한 에이전트의 지능도 높아진다. 많은 사람들은 대형 언어 모델이 이미 충분히 똑똑해져서 우리를 대신해 폼 작성, 요리 레시피 검색 후 재료를 온라인 장바구니에 담기, 미팅 전 검색 엔진을 통해 마지막 순간에 필요한 정보를 찾아 간단한 요약을 작성하는 등 유용한 다양한 작업을 해줄 수 있다고 믿는다.

2023년 10월, 앤트로픽은 ‘컴퓨터 사용(computer use)’이라는 클로드(Claude) 대형 언어 모델의 확장 기능을 선보였다. 이 기능은 이름에서 알 수 있듯이, 인간이 마우스 커서를 움직이고 버튼을 클릭하며 텍스트를 입력하듯 클로드가 컴퓨터를 사용할 수 있게 해준다. 사용자와 단순한 대화만 하는 대신, 이제는 화면상에서 작업을 실제로 수행하도록 요청할 수 있게 된 것이다.

앤트로픽 측은 이 기능이 여전히 번거롭고 오류가 많다고 지적하지만, DoorDash, Canva, Asana와 같은 일부 써드파티 개발사에 이미 시험적으로 제공하고 있다.

‘컴퓨터 사용’은 에이전트의 미래를 엿볼 수 있는 한 단면이다. MIT 테크놀로지 리뷰는 향후 어떤 변화가 있을지 알아보기 위해 앤트로픽의 공동 창업자이자 최고 과학자인 재러드 카플란(Jared Kaplan)과 이야기를 나눴다. 아래는 2025년에 에이전트가 한층 더 발전할 다섯 가지 방향이다.

(*카플란의 답변은 길이와 명확성을 위해 일부 편집되었습니다.)



1. 에이전트는 툴 사용 능력이 더욱 향상될 것이다

“AI의 역량을 판단하는 두 가지 축이 있다고 생각합니다. 하나는 시스템이 얼마나 복잡한 작업을 해낼 수 있느냐의 문제죠. AI 시스템이 점점 더 똑똑해지면, 이 면에서도 능력이 향상됩니다.

“하지만 또 다른 축도 있습니다. 바로 AI가 어떤 환경이나 도구를 사용할 수 있느냐 하는 점이죠.

“10년 전 [딥마인드의 바둑 모델] AlphaGo가 있었을 때, 그것은 바둑을 두는 데 있어서는 초인간적인 능력을 갖춘 AI 시스템이었습니다. 그러나 바둑판 하나만 다룰 수 있으면 그것은 매우 제한된 환경입니다. 아무리 똑똑하더라도 실제로 유용하지는 않죠. 이후 텍스트 모델, 멀티모달 모델, 그리고 지금의 컴퓨터 사용, 어쩌면 미래에는 로보틱스 등을 통해 AI가 다양한 환경과 작업에서 활용될 수 있게 되면서 실질적인 유용성이 커지고 있습니다.

“우리가 ‘컴퓨터 사용’ 기능을 흥미롭게 생각한 것도 그 때문입니다. 최근까지 대형 언어 모델과 작업할 때는 매우 구체적인 프롬프트나 도구를 제공해야 했고, 사용하는 환경 역시 제한적이었습니다. 저는 컴퓨터 사용이 점점 더 향상되면서 모델이 다양한 작업, 복잡한 작업도 잘 해내게 되고, 모델 스스로 실수를 인지하거나 중요한 의사결정에 앞서 사용자에게 피드백을 요청하게 되는 방향으로 발전할 것이라고 봅니다.”




2. 에이전트는 상황(Context)을 이해하게 될 것이다

“클로드가 여러분의 특정 상황, 그리고 해당 조직이 돌아가는 방식을 충분히 학습해야 유용해질 것입니다. 예컨대 여러분이 맡은 역할이 무엇인지, 글쓰기 스타일이나 조직적인 필요가 어떤 것인지 등을 파악해야 하죠.

“이 부분은 에이전트에게 특히 중요하지만 아직 덜 주목받고 있는 문제입니다. 시스템이 유용함을 넘어, 안전하게 작동하고 사용자가 기대하는 대로 움직이려면 이러한 문맥 이해가 꼭 필요합니다.

“또한 여러 작업에서는 굳이 클로드가 오랜 시간 복잡한 추론을 할 필요가 없습니다. 예를 들어 ‘구글 독스(Google Docs)를 열기 전에 몇 시간씩 생각할 필요’는 전혀 없잖아요. 결국 우리는 단순한 업무에는 지나친 추론을 낭비하지 않고, 정말 유용하고 중요한 순간에만 추론 능력을 발휘하는 모습을 보게 될 겁니다.”




3. 에이전트는 코딩 보조 기능을 더욱 발전시킬 것이다

“아직 ‘컴퓨터 사용’이 초기 베타 단계지만, 우리가 개발자들에게 배포해 피드백을 받는 이유가 시스템이 다소 원시적일 때부터 개선 방향을 찾고자 해서입니다. 시간이 지나면서 이런 시스템들이 더 널리 쓰이고, 여러분의 다양한 작업에서 협업하는 모습을 보게 될 거예요.

“DoorDash, The Browser Company, Canva 등은 이미 AI를 활용한 각종 브라우저 상호작용을 실험 중이며, AI와 함께 디자인을 진행하고 있습니다.

“그리고 저는 코딩 보조 기능에도 더 많은 발전이 있을 거라 예상합니다. 개발자들이 이를 매우 흥미롭게 생각하고 있으니까요. 벌써 클로드 3.5를 활용해 코딩하는 데 관심이 상당히 높습니다. 이전처럼 몇 년 전의 단순한 ‘자동완성’ 기능이 아니라, 코드를 이해하고, 디버깅하며, 실행 결과를 확인하고 수정하는 수준에 이르고 있습니다.”




4. 에이전트를 안전하게 만들 필요가 생길 것이다

“우리는 앤트로픽을 창업할 때부터 AI가 굉장히 빠르게 발전할 거라고 예상했고, 따라서 당연히 안전 문제가 중요해질 것이라고 보았습니다. 올해는 이 점이 더욱 피부로 와 닿을 것입니다. 왜냐하면 앞으로 이러한 에이전트가 우리의 실제 업무에 점점 더 깊이 통합될 것이고, 이에 따라 ‘프롬프트 인젝션(prompt injection)’ 같은 문제가 대두될 수밖에 없기 때문이죠.

“[프롬프트 인젝션이란, 개발자가 의도하지 않은 방식으로, 또는 예상치 못한 경로로 대형 언어 모델에 악성 프롬프트를 전달하는 공격을 말합니다. 예를 들어 웹사이트에 몰래 삽입된 텍스트가 방문한 모델에게 유해한 명령을 실행하도록 유도할 수 있습니다.]

“프롬프트 인젝션은 에이전트를 대규모로 활용하기 시작하면 특히 중요한 이슈입니다. 예를 들어, 클로드가 악의적인 웹사이트를 방문하게 될 경우, 그 사이트가 클로드에게 해서는 안 될 행동을 하도록 부추길 수도 있기 때문입니다.

“더 발전한 모델이 나올수록 위험성도 커집니다. 그래서 우리는 모델의 규모가 커질수록 AI가 오용되지 않도록 막아야 한다는 ‘스케일링 정책(scaling policy)’을 마련해 두고 있습니다. 테러리스트 활동 지원 같은 용도에 쓰일 수 있는 가능성을 막아야겠죠.

“AI가 유용하다는 점에 대해서는 저도 굉장히 기대하고 있습니다. 실제로 앤트로픽 내부에서도 이미 코딩을 비롯해 다양한 방식으로 클로드를 활용해 업무를 가속화하고 있습니다. 그렇지만 동시에 여러 문제적 과제들을 맞닥뜨리게 될 것이고, 올해는 이런 일이 본격화될 것으로 봅니다. 흥미진진한 한 해가 될 것입니다.”
전체 0