본문 바로가기

IT 트렌드

[Post] 생성형 AI: 창의적인 새로운 세상 (2/2)

 

 

Generative AI: A Creative New World

A powerful new class of large language models is making it possible for machines to write, code, draw and create with credible and sometimes superhuman results.

www.sequoiacap.com

 

핵심 요약:

  • 텍스트, 코드, 이미지, 음성, 비디오, 3D 모델 등 다양한 도메인에서 혁신적 모델 등장
  • 카피라이팅, 코드 생성, 아트 생성 등 다양한 분야에서 실용적인 애플리케이션 출현
  • 성공적인 생성형 AI 기업은 사용자 참여/데이터와 모델 성능 간의 선순환을 통해 지속가능한 경쟁우위 확보 가능

 

생성형 AI의 시장 지형도와 미래 애플리케이션의 구조

 

시장 지형도

아래는 각 카테고리를 지원할 플랫폼 레이어와 그 위에 구축될 수 있는 잠재적인 애플리케이션 유형입니다.

 

모델:

  • 텍스트는 가장 발전된 영역입니다. 하지만 자연어는 제대로 구현하기 어렵고, 품질이 중요합니다. 오늘날 모델들은 일반적인 단문/중문 작성에 꽤 좋습니다(그러나 그조차도 주로 반복이나 초안용으로 사용됨). 시간이 지남에 따라 모델이 개선되면, 우리는 더 높은 품질의 출력물, 장문 콘텐츠, 더 나은 수직적 특화 조정을 볼 수 있을 것입니다.
  • 코드 생성은 GitHub CoPilot이 보여주듯이 단기적으로 개발자 생산성에 큰 영향을 미칠 것입니다. 또한 비개발자들도 코드를 창의적으로 사용할 수 있게 만들 것입니다.
  • 이미지는 더 최근의 현상이지만 바이럴하게 퍼졌습니다: 트위터에서 텍스트보다 생성된 이미지를 공유하는 것이 훨씬 더 재미있거든요! 우리는 다양한 미적 스타일을 가진 이미지 모델과, 생성된 이미지를 편집하고 수정하는 다양한 기술들이 등장하는 것을 보고 있습니다.
  • 음성 합성은 한동안 있어왔지만(안녕, Siri!), 소비자와 기업용 애플리케이션들이 이제 막 좋아지고 있습니다. 영화나 팟캐스트와 같은 고급 애플리케이션의 경우 기계적으로 들리지 않는 원샷 인간 품질의 음성에 대한 기준이 꽤 높습니다. 하지만 이미지와 마찬가지로, 오늘날의 모델들은 추가 개선을 위한 시작점이나 실용적인 애플리케이션을 위한 최종 출력을 제공합니다.
  • 비디오와 3D 모델은 빠르게 발전하고 있습니다. 사람들은 이러한 모델들이 영화, 게임, VR, 건축, 물리적 제품 디자인과 같은 거대한 창작 시장을 unlock할 잠재력에 대해 흥분하고 있습니다. 연구 조직들이 지금도 기초적인 3D와 비디오 모델들을 출시하고 있습니다.
  • 기타 영역: 오디오와 음악부터 생물학과 화학(생성형 단백질과 분자는 어떠신가요?)까지 많은 분야에서 근본적인 모델 R&D가 진행되고 있습니다.

 

애플리케이션: 다음은 우리가 기대하는 애플리케이션들입니다. 이 페이지에 담긴 것보다 훨씬 더 많은 것들이 있으며, 우리는 창업자들과 개발자들이 꿈꾸는 창의적인 애플리케이션들에 매료되어 있습니다.

  • 카피라이팅: 판매와 마케팅 전략, 고객 지원을 위한 개인화된 웹과 이메일 콘텐츠의 증가하는 수요는 언어 모델의 완벽한 적용 사례입니다. 짧은 형식과 문구의 양식화된 특성, 그리고 이러한 팀들에 대한 시간과 비용 압박은 자동화되고 증강된 솔루션에 대한 수요를 촉진할 것입니다.
  • 수직 특화 글쓰기 도우미: 오늘날 대부분의 글쓰기 도우미는 수평적입니다; 우리는 법률 계약서 작성부터 시나리오 작성까지 특정 최종 시장을 위한 훨씬 더 나은 생성형 애플리케이션을 구축할 기회가 있다고 믿습니다. 여기서의 제품 차별화는 특정 워크플로우를 위한 모델의 미세 조정과 UX 패턴에 있습니다.
  • 코드 생성: 현재 애플리케이션들은 개발자들을 터보차지하여 훨씬 더 생산적으로 만듭니다: GitHub Copilot은 현재 설치된 프로젝트에서 거의 40%의 코드를 생성하고 있습니다. 하지만 더 큰 기회는 소비자들에게 코딩에 대한 접근성을 열어주는 것일 수 있습니다. 프롬프트 학습이 궁극적인 고수준 프로그래밍 언어가 될 수 있습니다.
  • 아트 생성: 전 세계 예술사와 대중문화가 이제 이러한 대규모 모델들에 인코딩되어 있어, 누구나 이전에는 마스터하는 데 평생이 걸렸을 테마와 스타일을 자유롭게 탐험할 수 있게 되었습니다.
  • 게임: 꿈은 자연어를 사용하여 리깅이 가능한 복잡한 장면이나 모델을 만드는 것입니다; 그 최종 상태는 아마도 아직 멀었지만, 텍스처와 스카이박스 아트 생성과 같이 단기적으로 더 실행 가능한 즉각적인 옵션들이 있습니다.
  • 미디어/광고: 에이전시 작업을 자동화하고 소비자를 위한 광고 카피와 크리에이티브를 실시간으로 최적화할 수 있는 잠재력을 상상해보세요. 판매 메시지와 보완적인 시각 자료를 페어링하는 멀티모달 생성에 대한 훌륭한 기회가 있습니다.
  • 디자인: 디지털과 물리적 제품의 프로토타이핑은 노동 집약적이고 반복적인 프로세스입니다. 러프한 스케치와 프롬프트로부터 고화질 렌더링을 만드는 것은 이미 현실이 되었습니다. 3D 모델이 사용 가능해지면서 생성형 디자인 프로세스는 제조와 생산까지 확장될 것입니다—텍스트에서 객체로. 여러분의 다음 iPhone 앱이나 운동화는 기계가 디자인할 수 있습니다.
  • 소셜 미디어와 디지털 커뮤니티: 생성형 도구를 사용하여 우리 자신을 표현하는 새로운 방법이 있을까요? Midjourney와 같은 새로운 애플리케이션들은 소비자들이 공개적으로 창작하는 것을 배우면서 새로운 소셜 경험을 만들어내고 있습니다.

 

생성형 AI 애플리케이션의 구조

생성형 AI 애플리케이션은 어떤 모습일까요? 다음은 몇 가지 예측입니다.

지능과 모델 미세조정 생성형 AI 앱은 GPT-3나 Stable Diffusion과 같은 대규모 모델 위에 구축됩니다. 이러한 애플리케이션들은 더 많은 사용자 데이터를 얻으면서 다음을 위해 모델을 미세조정할 수 있습니다: 1) 특정 문제 영역에 대한 모델 품질/성능 향상 2) 모델 크기/비용 감소.

우리는 생성형 AI 앱을 대규모 범용 모델이라는 "큰 뇌" 위에 앉아 있는 UI 레이어와 "작은 뇌"로 생각할 수 있습니다.

형태 오늘날 생성형 AI 앱은 주로 기존 소프트웨어 생태계의 플러그인으로 존재합니다. 코드 완성은 IDE에서 발생하고, 이미지 생성은 Figma나 Photoshop에서 일어나며, Discord 봇조차도 디지털/소셜 커뮤니티에 생성형 AI를 주입하는 매개체입니다.

또한 카피라이팅을 위한 Jasper와 Copy.ai, 비디오 편집을 위한 Runway, 노트 테이킹을 위한 Mem과 같은 소수의 독립형 생성형 AI 웹 앱도 있습니다.

플러그인은 자체 애플리케이션을 부트스트랩하는 데 효과적인 쐐기가 될 수 있으며, 사용자 데이터와 모델 품질의 닭과 달걀 문제를 해결하는 현명한 방법이 될 수 있습니다(모델을 개선하기 위해서는 충분한 사용량을 얻기 위한 배포가 필요합니다; 사용자를 끌어들이기 위해서는 좋은 모델이 필요합니다). 우리는 이 배포 전략이 소비자/소셜과 같은 다른 시장 카테고리에서도 성과를 거두는 것을 보았습니다.

상호작용 패러다임 오늘날 대부분의 생성형 AI 데모는 "일회성"입니다: 입력을 제공하면 기계가 출력을 내놓고, 여러분은 그것을 유지하거나 버리고 다시 시도할 수 있습니다. 점점 더 모델들은 출력물을 수정, 개선, 업그레이드하고 변형을 생성할 수 있도록 반복적이 되어가고 있습니다.

오늘날 생성형 AI 출력물은 프로토타입이나 초안으로 사용되고 있습니다. 애플리케이션들은 창작 프로세스를 시작하기 위해 여러 가지 다른 아이디어를 내놓는 데 탁월하고(예: 로고나 건축 디자인에 대한 다양한 옵션), 최종 상태에 도달하기 위해 사용자가 다듬어야 하는 초안을 제안하는 데도 탁월합니다(예: 블로그 포스트나 코드 자동완성). 모델들이 사용자 데이터를 기반으로 더 스마트해짐에 따라, 우리는 이러한 초안들이 점점 더 나아져서 최종 제품으로 사용하기에 충분할 정도가 될 것으로 예상합니다.

 

지속적인 카테고리 리더십

최고의 생성형 AI 기업들은 사용자 참여/데이터와 모델 성능 사이의 플라이휠을 끊임없이 실행함으로써 지속 가능한 경쟁 우위를 창출할 수 있습니다. 승리하기 위해서는 팀들이 다음과 같은 플라이휠을 가동해야 합니다:

  1. 탁월한 사용자 참여 확보
  2. 더 많은 사용자 참여를 더 나은 모델 성능으로 전환(프롬프트 개선, 모델 미세조정, 레이블된 훈련 데이터로서의 사용자 선택)
  3. 뛰어난 모델 성능을 활용하여 더 많은 사용자 성장과 참여 유도

이들은 모든 사람을 위한 모든 것이 되려고 하기보다는 특정 문제 영역(예: 코드, 디자인, 게임)으로 진출할 가능성이 높습니다. 또한 레버리지와 배포를 위해 먼저 애플리케이션에 깊이 통합한 다음, 나중에 AI 네이티브 워크플로우로 기존 애플리케이션을 대체하려고 시도할 가능성이 높습니다. 사용자와 데이터를 축적하기 위해 올바른 방식으로 이러한 애플리케이션을 구축하는 데는 시간이 걸리겠지만, 우리는 최고의 애플리케이션들이 지속 가능하고 대규모로 성장할 기회가 있다고 믿습니다.