핵심 요약:
- 생성형 AI의 급격한 발전으로 AGI 시대가 빠르게 접근
- 트랜스포머 기술의 혁신이 AI 발전의 핵심 동력으로 작용
- 인프라, 예측, 응용 프로그램 등 다양한 분야에서 혁신 가속화
- 모델 구매와 자체 개발 사이의 전략적 선택이 기업 경쟁력 좌우
올해의 AI 50 리스트는 우리가 알고 있는 업무 방식을 재편할 수 있는 이 혁신적인 인공지능의 지배력을 잘 보여줍니다.
약 5년 전 AI 50을 처음 시작했을 때, "영화에서 많은 관심을 받는 인공일반지능(AGI)은 아직 멀었다"고 썼습니다. 오늘날, 그 공상과학적 미래가 훨씬 가까워졌습니다.
가장 큰 변화는 생성형 AI의 부상이었습니다. 특히 트랜스포머(신경망의 한 유형)가 텍스트와 이미지 생성에서부터 단백질 접힘과 전산 화학에 이르기까지 모든 분야에 활용되고 있습니다. 생성형 AI는 작년 리스트에서는 배경이었지만 이제는 전면에 나섰습니다.
생성형 AI의 역사
생성형 AI는 새로운 것이 아닙니다. 1960년대의 ELIZA 챗봇은 사용자가 모의 치료사에게 질문을 입력할 수 있게 했지만, 챗봇의 새로워 보이는 답변은 실제로는 규칙 기반 검색 테이블에 기반했습니다.
주요 도약은 2014년 구글 연구원 Ian Goodfellow의 생성적 적대 신경망(GANs)으로, 두 네트워크를 제로섬 게임에서 대립시켜 그럴듯한 저해상도 이미지를 생성했습니다. 이후 몇 년 동안 흐릿한 얼굴은 더 사실적이 되었지만 GANs는 여전히 훈련과 확장이 어려웠습니다.
2017년, 구글의 또 다른 그룹이 텍스트 번역 성능을 향상시키기 위해 유명한 트랜스포머 논문인 "Attention Is All You Need"를 발표했습니다. 여기서 어텐션은 언어마다 다른 단어의 위치를 기반으로 문맥을 제공하는 메커니즘을 의미합니다. 연구자들은 최고 성능을 보이는 모델들이 모두 이러한 어텐션 메커니즘을 가지고 있다는 것을 관찰하고, 텍스트에서 패턴을 추출하는 다른 수단을 어텐션 중심으로 대체할 것을 제안했습니다.
성능과 훈련 효율성에 대한 영향은 엄청났습니다. 이전의 자연어 처리 방식과 달리, 트랜스포머는 텍스트 전체를 한 번에 분석할 수 있습니다. 이는 모델의 병렬 훈련을 가능하게 했고, ChatGPT, GitHub Copilot, Microsoft의 새로운 Bing을 구동하는 GPT와 같은 더 큰 모델을 실현 가능하게 만들었습니다. 이러한 모델들은 방대한 양의 인간 언어로 훈련되었으며, 대규모 언어 모델(LLM)로 알려져 있습니다.
트랜스포머는 컴퓨터 비전 응용에도 효과적이지만, Stability와 Midjourney의 제품을 통해 가장 놀라운 고해상도 이미지를 생산하는 것은 잠재(또는 안정) 확산이라는 다른 방법입니다. 이러한 확산 모델들은 GANs와 트랜스포머의 장점을 결합했습니다. 일부 모델의 더 작은 크기와 오픈소스 가용성은 실험을 원하는 사람들에게 혁신의 원천이 되었습니다.
올해의 네 가지 트렌드
생성형 AI 인프라: OpenAI는 ChatGPT와 GPT-4 출시로 큰 주목을 받았지만, 규모와 인간 피드백 강화학습(RLHF) 기술에 대한 그들의 큰 도전은 LLM이 취하는 많은 방향 중 하나일 뿐입니다. Anthropic과 그들의 챗봇 Claude는 강화학습 입헌적 AI(RL-CAI)라는 다른 접근법을 사용합니다. CAI 부분은 출력의 오용과 환각을 제한하도록 설계된 인간 친화적 원칙 세트를 인코딩합니다. 한편 DeepMind의 Mustafa Suleyman와 Greylock의 Reid Hoffman가 설립한 비밀스러운 스타트업 Inflection은 소비자 애플리케이션에 집중하고 있습니다.
이들은 클로즈드 소스 측면의 유명한 진출자들일 뿐입니다. 오픈소스 세계에서 Hugging Face는 자체 모델을 훈련하거나 기존 모델을 미세 조정하고자 하는 개발자들을 위한 필수 플랫폼이 되었습니다. Stability의 오픈소스 제품과 함께, Hugging Face는 Facebook의 LLaMA와 Stanford의 Alpaca와 같은 최신 최첨단 모델들도 호스팅합니다.
예측 인프라: 골드러시 시대에 많은 개별 탐광자들이 망했지만, 곡괭이와 삽을 파는 사람들은 잘 해냈습니다. 이것이 투자자들이 기술 변화 시기에 종종 혁신적인 인프라 기업들에 집중하는 이유입니다. 여러 형태의 AI는 예측에 관한 것이므로, 이 새로운 카테고리를 예측 인프라라고 부르겠습니다.
이러한 인프라 기업들 중 가장 큰 규모의 기업들은 모든 종류의 데이터 파이프라인을 용이하게 하는 형식으로 기업 AI 애플리케이션에 필요한 방대한 양의 데이터를 호스팅합니다. Databricks는 AI/ML 데이터 팀의 요구사항에 맞게 특별히 설계되어 이 분야의 주요 기존 업체인 Snowflake와 차별화되었습니다.
데이터 레이블링, 정제 및 기타 프로세스가 모델 훈련에 매우 중요하기 때문에, 이번 해 리스트에는 이 분야의 기업이 네 곳(Coactive, Scale, Snorkel, Surge)이 있으며, 작년의 한 곳(Scale)에서 증가했습니다. AI 50에 새로 진입한 두 기업인 MosaicML과 Weights & Biases는 특별히 AI 실무자들의 모델 훈련과 미세 조정을 돕습니다. Arize와 Hugging Face도 대규모로 모델을 배포하기 쉽게 만듭니다.
생성형 AI 애플리케이션: Midjourney와 Stable Diffusion은 소셜 미디어에서의 바이럴리티 덕분에 혜택을 받아 생성형 AI를 대중문화의 중심에 위치시켰습니다. 그 후 ChatGPT가 세계의 주목을 받으며 1억 사용자를 확보한 최단기 제품이 되었습니다. Google이 Bard 챗봇으로 따라잡기를 시도하는 동안, Neeva는 최초의 생성형 AI 네이티브 검색 엔진이 되었습니다.
LLM이 주로 텍스트 생성을 위해 설계되었기 때문에, 생성형 글쓰기 앱은 빠르게 성장하는 카테고리입니다. 올해 리스트에는 이러한 애플리케이션이 두 개 있습니다: GPT-4를 사용하여 마케팅 카피라이터를 돕는 Jasper와 자체 독점 모델을 훈련시키고 기업 사용 사례에 집중하는 Writer입니다. 언어 모델이 더 능숙해짐에 따라 법률 텍스트와 같은 더 복잡한 애플리케이션을 처리할 수 있게 되었습니다. Harvey는 GPT-4를 사용하여 법률 및 기타 전문 서비스 기업에서 변호사 보조 수준의 법률 업무를 수행하고 있으며, Ironclad는 사내 법률 팀을 위한 많은 계약 프로세스를 자동화했습니다.
생성형 AI는 본질적으로 창의적이므로, 다른 창의적 분야에서도 많은 혁신이 일어나는 것은 자연스럽습니다. Runway는 '에브리씽 에브리웨어 올 앳 원스'의 오스카상 수상팀이 품질 기준을 충족하는 비디오를 생성, 편집하고 효과를 적용합니다. Descript는 생성형 AI를 사용하여 편집 과정을 덜 힘들게 만들면서 팟캐스트와 비디오 워크플로우 모두에 집중합니다. ChatGPT, Bing, Bard는 범용 챗봇이지만, 원래 트랜스포머 논문의 저자 중 한 명인 Noam Shazeer가 설립한 Character.AI가 구동하는 맞춤형 챗봇 제작은 새로운 창의적 공간입니다.
파워포인트 발표자료 만들기는 많은 사람들이 직장에서 창의성을 발휘하는 가장 가까운 방법이지만, Tome과 같은 새로운 생성형 AI 앱은 텍스트 프롬프트만으로 아이디어를 생생하게 표현하는 아름다운 프레젠테이션을 쉽게 디자인할 수 있게 합니다. 업무 생산성에 대한 또 다른 관점은 컴퓨터와 사람들의 상호작용 방식에 대해 훈련된 액션 모델인 ACT-1을 구축한 Adept에서 찾을 수 있습니다. 그들의 목표는 결국 현재 작업을 완료하기 위해 해야 하는 검색, 클릭, 스크롤의 일부를 자동화하는 것입니다.
예측 AI 애플리케이션: AI의 예측 능력을 사용하는 또 다른 유용한 방법은 이상을 탐지하고 이를 완화할 방법을 찾는 것입니다. 예를 들어, Abnormal Security는 기업의 클라우드 이메일 환경을 분석하여 피싱 시도와 기타 위협을 식별하고 악의적인 이메일을 제거합니다. 의료 분야에서 Viz.ai는 전문의가 검토해야 할 환자 영상을 신속하게 표면화하고, 뇌졸중 및 기타 시간에 민감한 상태의 환자를 위한 결과를 개선하기 위해 치료 팀을 조정합니다.
AI의 미래 전망
내년 리스트가 나올 때쯤에도 생성형 AI와 LLM이 여전히 지배적일 것으로 믿습니다. 하지만 상황은 빠르게 변화하고 있으며, 이에 따라 움직일 수 있는 기업들에게는 큰 기회가 있습니다. 앞으로 1년 동안 주목해야 할 세 가지 사항은 다음과 같습니다:
- 인프라 계층이 매우 "두껍습니다" - 현재 이 분야의 가장 큰 기업들이 모델과 클라우드 서비스를 제공하고 있습니다. 이는 애플리케이션을 구축하는 기업들이 가치를 확보하는 방법을 배우면서 변화할 것입니다.
- LLM 사용이 성숙해질 것입니다 - 일부 기업들은 클라우드 API에서 AI 모델을 구매하는 것을 강력히 선호하고, 다른 기업들은 자체 모델 구축을 열망할 것입니다. 많은 전문가들은 스타트업들이 성장하면서 API에서 자체적인 더 작고 효율적인 모델로 전환할 것이라고 예측합니다. 대규모의 고유한 데이터를 보유한 기업들은 자체 모델 훈련에서 명확한 장점을 보게 될 것입니다. Bloomberg가 최근 발표한 금융 언어 처리에 중점을 둔 자체 LLM은 좋은 사례입니다.
- 빠르면서도 통찰력 있는 기업이 생존할 것입니다 - AI의 이번 물결이 거대한 사회적 변화를 일으키면서, 적응하고, 전환하고, 예상치 못한 기회를 활용하는 능력이 핵심이 될 것입니다. 이 기술이 업무를 변화시킬 엄청난 잠재력을 가지고 있기 때문에, 변화만이 유일한 상수가 될 것입니다.
생성형 AI는 많은 가정을 뒤집어 놓았습니다. 초기에는 AI가 육체노동을 대체할 것으로 생각했지만, 로봇공학은 인지적 지식 노동의 일부보다 더 어려운 것으로 판명되었습니다. 또한 놀랍게도, 생성형 모델의 근사적 특성은 창의적 작업에서 예상보다 더 뛰어난 성능을 보이는 반면, 단순 기계적 작업에서는 완전한 신뢰성을 보장하지 못합니다. 인류를 위협할 수 있다고 일부가 우려하는 미래의 자기학습 시스템인 인공일반지능 달성은 여전히 움직이는 목표입니다. 하지만 지난 1년간 대규모 언어 모델의 발전이 혁신적이었고 그 응용이 점점 더 일반화되고 있다는 점은 의심의 여지가 없습니다. 우리는 매일 AI가 우리의 일하고, 창조하고, 놀이하는 방식을 어떻게 변화시킬지 보여주는 새로운 사례들을 목격하고 있습니다.
'IT 트렌드' 카테고리의 다른 글
[Post] 새로운 언어 모델 스택 (0) | 2025.01.30 |
---|---|
[Post] 자율 AI 에이전트 심층 분석: 기술적 접근 (0) | 2025.01.29 |
[Post] AI 에이전트의 시대: 가능성과 현실 사이 (0) | 2025.01.28 |
[Post] AI가 여는 하이브리드 업무의 시대: 미래 업무 환경의 청사진 (3/3) (0) | 2025.01.26 |
[Post] AI가 여는 하이브리드 업무의 시대: 문서와 데이터의 혁명 (2/3) (0) | 2025.01.26 |
[Post] AI가 여는 하이브리드 업무의 시대: 새로운 일하기 방식의 시작 (1/3) (0) | 2025.01.26 |