인터뷰/예측
OpenAI 직원 "chatGPT는 극단의 증폭기"

OpenAI 직원 윌 듀퓨(Will Depue) 인터뷰 요약
-
소개 및 역할: 호스트들은 윌 듀퓨를 환영하며 농담으로 그가 AI나 트랜스포머 아키텍처를 직접 만들었다고 소개합니다. 윌은 웃으며 자신은 약 2년 전 OpenAI에 합류했고, 스타트업 경험이 있으며, 약 1년간 비디오 생성 모델(Sora) 팀에서 일했고 현재는 ChatGPT의 강화학습(RL) 후처리 훈련 관련 업무를 한다고 설명합니다.
-
'지브리 스타일' 이미지 생성 열풍:
-
호스트들은 ChatGPT 내 DALL-E 3를 이용한 '스튜디오 지브리' 스타일 이미지 생성이 바이럴된 것에 대해 질문합니다. OpenAI가 이를 예상했는지, 왜 하필 지브리 스타일이었는지 묻습니다.
-
윌은 개인적으로 이미지 생성 기능에 대해 긍정적이었지만, 지브리 스타일의 폭발적인 인기는 예상하지 못했다고 답합니다.
-
수요 예측 실패로 GPU를 부족하게 준비했던 점을 솔직히 인정하며, 예상보다 트래픽이 훨씬 많았다고 말합니다.
-
실제 네일샵 등 소상공인들이 DALL-E 3로 만든 이미지를 로고나 간판 등에 활용하는 것을 보며, AI 이미지 생성 도구가 단순한 장난감을 넘어 실용적인 도구로 자리 잡고 있다고 평가합니다. (그는 이를 '파이버 평가' - 프리랜서 마켓 '파이버'의 업무 중 AI로 자동화 가능한 비율 측정 - 로 부르며 중요하게 생각합니다.)
-
지브리 스타일의 매력으로는 사용하기 쉽고 (심지어 'Ghibli' 철자를 틀려도 잘 작동), 결과물이 마법처럼 느껴지며 다른 스타일에 비해 일관되게 높은 품질을 보여준 점을 꼽습니다.
-
-
OpenAI의 집중과 방향:
-
외부의 소음(정치, 기술 경쟁, 벤치마크 등)에도 불구하고 OpenAI는 '실질적인 진보'에 집중하고 있다고 강조합니다.
-
이미지 내 텍스트 생성 기능 개선처럼, 시간이 걸리더라도 기술의 다음 단계를 위한 연구 개발에 집중하고 있음을 언급합니다.
-
OpenAI가 연구 중심 조직에서 실제 제품을 배포하는 조직으로 변화하는 과정에 있으며, 사용자에게 정말 유용한 도구를 제공하는 데 동기 부여를 받는다고 말합니다.
-
ChatGPT라는 기존 플랫폼 덕분에 이미지 생성 같은 완전히 새로운 기능을 출시했을 때 사용자들이 기꺼이 시도해보는, 제품-시장 적합성(PMF)을 찾기 좋은 환경이라고 덧붙입니다.
-
-
미래 비전 및 우려:
-
장기적으로는 개인화 극대화, 매우 긴 컨텍스트 처리 능력, 모델이 사용자를 기억하고 먼저 제안하는 능동적인 AI를 흥미로운 방향으로 보고 있다고 말합니다.
-
소위 '슬롭'(Slop, 저품질 AI 콘텐츠) 문제에 대해서는, 기술 발전으로 품질이 계속 향상될 것이며 어쩌면 인간이 만드는 콘텐츠가 문제일 수도 있다는 농담 섞인 의견을 내비칩니다.
-
교육에 미칠 영향에 대해서는 깊이 우려합니다. AI 도구가 학생들 간의 격차를 심화시킬 수 있으며, 상위권 학생들은 더 강력해지겠지만 하위권 학생들은 뒤처질 수 있다고 지적합니다. 개인적으로는 AI를 강력한 학습 도구로 활용하고 있지만, 이러한 양극화 현상에 대한 해결책은 아직 모르겠다고 말합니다.
-
전반적으로 윌 듀퓨는 OpenAI의 기술 발전 속도와 실용적인 적용 가능성에 대해 낙관하면서도, 사회적 영향력과 교육 격차 등 잠재적인 문제점에 대해서도 인지하고 고민하는 모습을 보여줍니다.
추가언급
-
GPU 부족 사태: 지브리 스타일 이미지 생성 기능 출시 당시, OpenAI 팀은 예상보다 훨씬 적은 트래픽을 예측했고, 그 결과 GPU를 부족하게 준비(underprovisioned)했다고 솔직하게 인정했습니다. 이는 내부 예측과 실제 사용자 수요 간의 큰 차이를 보여줍니다.
-
'파이버(Fiverr) 평가': 윌 듀퓨는 내부적으로 모델의 유용성을 평가하는 방법 중 하나로 "파이버 평가"를 언급했습니다. 프리랜서 마켓플레이스 '파이버'에 올라오는 작업들 중 "상당수(a lot of them)"를 자동화할 수 있다는 점을 확인했다고 합니다. 이는 AI가 특정 업무 영역에서 상당한 대체 가능성을 가지고 있음을 시사합니다.
-
광범위한 비즈니스 적용 예측: 그는 "매우 가까운 미래에 세상의 거의 모든 비즈니스(pretty much every business in the world very soon)"가 로고 제작 등에 AI 이미지 생성 도구를 사용할 것이라고 예측했습니다.
-
개발 주기: 이전 버전의 이미지 생성 모델(확산 모델)이 **글자를 제대로 쓰지 못하는 문제를 해결하는 데 약 2년(takes us like two years)**이 걸렸다고 언급하며, 핵심 기능 개선에는 상당한 시간이 소요될 수 있음을 보여주었습니다.
-
이전 바이럴: DALL-E 3 출시 때는 내부적으로 "페페(Pepe) 밈 이미지를 많이 만들었고, 그게 크게 유행했다"는 구체적인 내부 테스트 사례를 언급했습니다. (이번 지브리 스타일 유행은 예측하지 못했다고 합니다.)
-
연구에서 배포로의 전환: OpenAI가 "연구 회사에서 배포 회사로(from being a research company to a deployment company)" 전환하는 과정에 있으며, 현재 **"과거 어느 때보다 훨씬 더 많은 배포(a lot more deployment)"**를 하고 있다고 회사의 전략적 변화를 설명했습니다.
-
'슬롭(Slop)'에 대한 반문: 저품질 AI 콘텐츠를 뜻하는 '슬롭'에 대해 이야기하며, **샌프란시스코 현대미술관(SF MoMA) 전시 작품의 절반(half of it)**도 슬롭처럼 느껴졌다고 농담하며, 어쩌면 인간이 만드는 콘텐츠 자체에 슬롭이 많은 것 아니냐는 흥미로운 관점을 제시했습니다.
-
교육 격차 심화 우려: AI 도구가 교육에 미칠 영향에 대해 "극도로 우려(extremely worried)"하며, 세상이 "더 극단적으로(a lot more extreme)" 변할 것이라고 예측했습니다. 특히 하위권 학생들은 뒤쳐지고 상위권 학생들은 극도로 강력해지는(extremely overpowered) 양극화(bimodal) 현상을 예상했습니다.
-
개인적 학습 효과: 만약 자신이 어렸을 때 이런 도구가 있었다면 "지금보다 훨씬 더 똑똑했을 것(vastly smarter than I am now)"이라고 강하게 이야기하며 AI의 학습 도구로서의 잠재력을 강조했습니다. (어제 희귀 영양 보충제에 대해 깊이 파고들었다는 개인적인 경험을 예로 들었습니다.)
-
미래 AI 비전: 장기적으로 개인화 극대화, 초장기 컨텍스트(super long context), 모델이 사용자를 인지하고 능동적으로 제안하는 것, 사용자에게서 모델로 주도권(agency)을 넘기는 것 등을 중요한 발전 방향으로 꼽았습니다.
이러한 구체적인 언급들은 OpenAI 내부의 고민, 평가 방식, 미래 비전, 그리고 기술 발전에 따른 사회적 영향에 대한 그의 생각을 엿볼 수 있게 해줍니다.