인터뷰/예측

Anthropic Michael Gerstenhaber "최종 목표만 던져주면, 모델이 스스로 최적의 방법을 계획하고 실행하는 시대가 올 것"

작성자
하이룽룽
작성일
2025-06-30 18:44
조회
6





Anthropic 제품 전문가 Michael Gerstenhaber 인터뷰 (Q&A 상세 요약)

이 인터뷰는 Superhuman.AI의 진행자들과 Anthropic의 제품 전문가 Michael Gerstenhaber가 AI, 특히 Claude 모델의 발전과 미래에 대해 나눈 대화를 담고 있습니다.


Q1. 최근 AI 기술, 특히 Claude 3 출시 이후 어떤 변화를 체감하고 계신가요? 기술 발전 속도가 어느 정도라고 보시나요?

A. (Michael Gerstenhaber): "지난 1년 반 동안, 특히 Claude 3가 출시된 이후 AI 모델이 겪은 변화의 양은 정말 극적(dramatic)이었습니다. 1년 전 모델들과 지금 모델들은 전혀 비슷하지 않아요. 그리고 이건 정말이지... 우리는 이제 막 시작하는 단계에 불과합니다."

그는 기술 발전 속도가 엄청나게 빠르다고 강조하며, "미래는 더 빠르고, 더 빠르고, 더 빨라질 것이며, 연구 자체도 더 잘하고, 더 잘하고, 더 잘하게 될 것"이라고 예측합니다. 9~12개월 후를 예측하는 것조차 "너무나 긴 시간"이라고 표현할 정도로 변화의 속도가 빠르다고 말합니다.





Q2. 모든 AI 연구소들이 '코딩' 능력 향상에 집중하는 것 같습니다. 코딩이 AI 능력의 중요한 벤치마크가 된 특별한 이유가 있을까요?

A. (Michael Gerstenhaber): "두 가지 큰 이유가 있습니다. 첫째, 엔지니어들은 다른 엔지니어들을 위한 제품을 만드는 것을 좋아합니다. 자신들이 직접 사용하는 도구를 만드는 거죠. 둘째, 그리고 이게 더 중요한데, 그들은 AI가 생성한 코드의 품질을 즉시, 그리고 정확하게 평가할 수 있습니다."


  • 빠른 피드백 루프: 법률이나 의료 분야와 달리, 엔지니어는 코드가 제대로 작동하는지, 효율적인지 바로 테스트하고 평가할 수 있습니다. 이는 모델 개선을 위한 매우 빠른 피드백 루프를 만듭니다.

  • 내부 실험의 산물 (Claude Code): Anthropic의 내부 코딩 도구인 'Claude Code'도 이런 배경에서 탄생했습니다. 우리는 고객들처럼 직접 코딩 에이전트를 실험해보고 싶었고, 모델이 얼마나 오랫동안 생산적으로 코드를 짤 수 있는지 그 한계를 테스트했습니다.




Q3. 최근 Claude 3.5 Sonnet과 Opus가 출시되었습니다. 개발자나 빌더 입장에서 이 두 모델을 어떻게 선택하고 활용해야 할까요?

A. (Michael Gerstenhaber): "Opus와 Sonnet은 각기 다른 목적에 최적화되어 있습니다."


  • Opus (최상위 모델): "Opus는 마치 똑똑한 인턴에게 복잡한 업무를 맡기는 것과 같습니다. 단순히 코드를 짜는 것을 넘어, 여러 단계의 계획을 세우고(sequence planning), 스스로 문제를 분석하고, 여러 갈래의 길을 테스트한 후 최적의 답을 찾아내는 데 탁월합니다. 장시간이 걸리는 복잡한 작업이나 에이전트적인 행동이 필요할 때 Opus가 이상적입니다."

  • Sonnet (빠르고 효율적인 모델): "반면 Sonnet은 빠른 응답 속도와 효율성이 중요할 때 사용합니다. 즉각적인 질문에 대한 답변이나 비교적 단순한 코드 생성, 텍스트 요약 같은 작업에서 뛰어난 성능을 보입니다."

결론적으로, 복잡한 추론과 계획이 필요하면 Opus, 빠른 속도와 효율성이 중요하면 Sonnet을 사용하는 것이 좋습니다.





Q4. 많은 사람들이 Claude를 코딩 외에 '글쓰기'에 탁월하다고 평가합니다. Anthropic도 이 부분을 의도하고 있나요?

A. (Michael Gerstenhaber, 웃으며): "네, 그렇습니다. 사실 글쓰기는 Claude의 숨겨진 초능력(underrated superpower)이라고 생각합니다. 우리는 Claude의 캐릭터와 목소리에 대해 많은 시간을 투자하며, 이는 의도적인 선택입니다."

진행자 (Zain Kahn): "저도 동의합니다. 저희 팀원 중 한 명이 Claude를 이용해 소셜 미디어 게시물을 단번에 작성했는데, 이게 바이럴이 되면서 100만 회 이상의 노출과 1만 개 이상의 '좋아요'를 받았습니다. 정말 놀라웠습니다."

A. (Michael Gerstenhaber): "정말 멋진 이야기네요. 더 잘 쓴다는 것은 여러분을 더 잘 이해한다는 의미이기도 하니까요. 더 나은 커뮤니케이션 파트너가 되는 것이죠. 이는 모델의 지능이 전반적으로 향상되고 있다는 증거이기도 합니다."





Q5. AI 앱 개발자들이 흔히 "우리는 그냥 API 래퍼(wrapper)일 뿐"이라는 비판을 받습니다. 또한, 모델 성능을 어떻게 평가해야 할지 어려움을 겪습니다. 이에 대해 어떻게 생각하시나요?

A. (Michael Gerstenhaber):


  • "래퍼"라는 비유에 대하여: "저는 그 비유가 완전히 틀렸다고 생각합니다. 진정한 가치는 모델의 일반 지능기업이 가진 고유한 도메인 데이터 및 전문성을 결합하는 데서 나옵니다. 예를 들어, 법률 리서치 회사는 자신들의 방대한 법률 데이터를 모델과 결합하여 누구도 따라 할 수 없는 독특한 가치를 창출합니다. 애플리케이션 계층은 단순한 래퍼가 아니라, 바로 이 중요한 맥락과 전문성을 제공하는 곳입니다."

  • 모델 평가(Evals)에 대하여: "공개된 벤치마크는 유용하지만, 참고 자료일 뿐입니다. 가장 중요한 것은 자신만의 평가(Eval) 기준을 갖는 것입니다. '우리 고객에게 좋은 결과물이란 무엇인가?'를 명확히 정의하고, 그 기준에 따라 오프라인 및 라이브 환경에서 지속적으로 테스트해야 합니다. 모델을 업그레이드할 때, 벤치마크 점수보다 중요한 것은 실제 고객 경험이 향상되었는지를 확인하는 것입니다. 이는 매우 중요한 제품 결정 사항입니다."




Q6. 마지막으로, 앞으로 6~12개월 안에 AI 분야에서 어떤 기술이나 능력이 가장 흥미진진하게 발전할 것으로 보시나요?

A. (Michael Gerstenhaber): "저는 목표 지향성(goal-orientation)에 주목하고 있습니다. 지금은 개발자들이 모델에게 '이것을 하고, 그다음 저것을 해'라고 단계별로 지시하는 방식(imperative programming)에 익숙합니다. 하지만 모델이 점점 더 똑똑해지면서, 우리는 더 이상 구체적인 방법을 지시할 필요가 없어질 겁니다."

"대신, '이것을 달성해 줘'라고 최종 목표만 던져주면, 모델이 스스로 최적의 방법을 계획하고 실행하는 시대가 올 것입니다. 이는 지금의 방식과는 완전히 다른 차원의 상호작용이며, 모든 분야에서 엄청난 생산성 향상을 가져올 것입니다. 이 변화가 가장 흥미롭습니다."





Q7. 개발의 미래는 어떻게 변할 것이라고 보시나요? 개발자들이 지금부터 준비해야 할 핵심 역량은 무엇일까요?

A. (Michael Gerstenhaber): "개발 패러다임이 명령형(imperative)에서 목표 지향적(goal-oriented)으로 바뀌고 있습니다. 과거에는 모델에게 '이것을 하고, 그 다음 저것을 해'라고 단계별로 지시해야 했다면, 이제는 '이것을 달성해 줘'라고 최종 목표만 던져주면 됩니다. AI가 스스로 최적의 방법을 계획하고 실행하는 거죠. 따라서 '어떻게' 할 것인가보다 '무엇을' 만들 것인가를 아는 능력, 즉 올바른 목표를 설정하는 능력이 훨씬 중요해질 것입니다. AI 덕분에 A지점에서 B지점으로 가는 것은 훨씬 쉬워졌지만, B지점이 어디인지 아는 것은 여전히, 아니 오히려 더 중요해졌습니다."





Q8. 마지막으로, 많은 사람들이 궁금해하는 질문입니다. 인공 일반 지능(AGI)에 대해 어떻게 생각하시나요? 우리가 얼마나 가까이 와 있다고 보십니까?

A. (Michael Gerstenhaber): "(웃으며) 저는 이 질문에 너무 가까이 있기 때문에 추측성 답변을 하기가 매우 조심스럽습니다. 제 답변이 Anthropic의 공식 입장으로 비칠 수 있으니까요. 다만, 기술이 임의로 강력해지고(arbitrarily powerful) 있으며, 그 발전 속도가 엄청나다는 것은 분명합니다. 이미 우리는 AI가 일상적인 작업들을 수행하는 것을 보고 있고, 이 능력은 계속해서 발전할 것입니다. 매우 흥미로운 시기입니다."

전체 0