구글 쿠버네티스 엔진을 활용한 Ordaōs Bio의 AI 성장

Find AI Tools
No difficulty
No complicated process
Find ai tools

구글 쿠버네티스 엔진을 활용한 Ordaōs Bio의 AI 성장

목차

  1. 인공지능 기반의 비즈니스 전환

    • 기업의 인공지능 활용 현황
    • 구글의 AI 혁신
  2. 구글 쿠버네티스 엔진을 활용한 AI 성장의 사례: 오디어스

    • 오디어스 소개
    • 고객의 문제점과 요구사항
      • 복잡한 요구사항
      • 플랫폼 배포의 다양성
      • 자원 활용의 어려움
      • 성능 및 확장성
      • 비용 효율
      • 자동화와 효율성의 중요성
    • 구글 쿠버네티스 엔진의 도움
      • 포터빌리티 지원
      • 유연한 툴과 프레임워크
      • 자원 활용의 유연함
      • 대규모 모델 훈련의 가능성
      • 비용 절감과 효율성
      • 자동화된 AI 플랫폼 구축

🔥 구글 쿠버네티스 엔진을 활용한 AI 성장의 사례: 오디어스

이제는 기업들이 인공지능을 활용하여 비즈니스를 혁신하는 시대입니다. 특히 구글은 항상 인공지능 혁신의 선두에 있었습니다. 오늘의 이 발표에서는 오디어스와 같은 기업들이 구글 쿠버네티스 엔진을 활용하여 인공지능(AI) 여정을 가속화하는 방법에 대해 알려드리겠습니다.

안녕하세요, 제 이름은 Malin Patel이고, 저는 구글의 쿠버네티스 엔진 제품 관리 총괄자입니다. 오늘은 공동 발표자로 구글 쿠버네티스 엔진의 기술 총괄자인 Tony Seward와 오디어스의 CEO인 David Longo와 함께하겠습니다.

여러분들은 제품 및 서비스 개발을 위해서는 고객의 의견을 반영해야 합니다. 많은 고객들이 인공지능 플랫폼의 개발이 어렵다고 불평하고 있습니다. 이는 매우 복잡한 요구사항을 해결해야 한다는 것을 의미합니다. 이러한 요구사항은 이식성, 맞춤성, 확장성, 신뢰성, 성능, 보안, 비용 효율성과 같은 다양한 측면을 고려해야 합니다.

구글 쿠버네티스 엔진 팀은 다양한 고객들이 이러한 어려움을 극복하는 데 도움을 주었습니다. 그래서 오늘은 고객들이 다양한 클라우드와 온프레미스 환경에서 모델을 훈련하고 서빙하려는 경우 이식성을 지원하는 오픈소스 솔루션을 제공하고 있습니다. 쿠버네티스 엔진을 사용하면 한 번의 코드 작성으로 모델을 어디에서나 실행할 수 있습니다.

하지만 플랫폼 개발자들은 다양한 기계 학습 도구와 프레임워크를 지원해야 하는데, 이는 다양한 팀의 다양한 요구를 충족시키기 위함입니다. 이를 위해 구글 쿠버네티스 엔진은 도구 체인과 원하는 프레임워크를 완전히 사용자 정의할 수 있는 유연성을 제공합니다. 또한 기반 인프라와 소프트웨어 스택에 대한 완전한 제어권을 부여하여 요구에 맞게 조정할 수 있습니다.

많은 기업들은 GPU와 TPU의 확보에 어려움을 겪고 있습니다. 이러한 자원은 가용성을 위해 시간과 장소의 유연성을 희생해야 할 수도 있습니다. 그러나 구글 쿠버네티스 엔진은 가용한 리소스 균등 분배, 할당 및 비용 할당을 위한 Q와 같은 오픈소스 도구의 네이티브 지원을 제공하여 이러한 어려움을 해결합니다.

이외에도 많은 기업들은 수조 개의 파라미터로 이루어진 거대한 모델을 훈련해야 합니다. 이런 경우 고성능과 확장성을 요구할 수 밖에 없습니다. 구글 쿠버네티스 엔진은 최대 15,000개 노드로 단일 GKE 클러스터를 확장할 수 있어 거대한 모델을 훈련할 수 있습니다.

또한 거대한 모델의 훈련 및 서빙은 매우 비싸기 때문에 기업들은 낮은 비용과 더 높은 효율성을 원합니다. 구글 쿠버네티스 엔진은 자동 스케일링과 같은 다양한 고급 기능을 제공하여 클러스터를 동적으로 조정하고 GPU 공유와 같은 기능을 통해 리소스를 높은 수준으로 활용할 수 있습니다. 이를 통해 인프라 비용을 절감할 수 있는데, 이외에도 GKE는 훈련 및 서빙 클러스터의 운영 비용을 낮출 수 있어 총 소유 비용(TCO)을 향상시킬 수 있습니다.

AI 플랫폼 구축을 위해서는 데이터 수집, 데이터 정제, 피처 구축, 모델 빌드, 훈련을 위한 클러스터 프로비저닝, 파인 튜닝 및 모델 배포 등 많은 작업을 수행해야 합니다. 이러한 프로세스를 자동화하고 간단하게 만들기 위해서는 매우 강력한 플랫폼과 도구 세트가 필요합니다. 구글 쿠버네티스 엔진 팀은 프로토타입 제작부터 프로덕션까지의 여정을 가속화하기 위해 많은 혁신을 추구하고 있습니다.

오늘은 구글의 새로운 혁신 중 하나인 텐서 프로세싱 유닛(Tensor Processing Unit, TPU)이 GKE에서 일반적으로 사용 가능하게 되었다는 소식에 대해 자랑스럽게 생각합니다. 이제 구글 쿠버네티스 엔진에서 제공하는 TPU의 최첨단 성능과 산업 최고의 확장성을 활용할 수 있습니다. Character AI, Lightricks, Words and Biases, Grammarly와 같은 기업들은 이미 TPU를 사용하여 GKE에서 최고의 가격 대 성능을 얻고 있습니다.

또한 새로운 TPU 세대인 DPU v5가 GK에서 사용 가능하다는 소식을 전해드리게 되어 기쁩니다. DPU v5는 이전 세대인 TPU에 비해 동일한 가격으로 2배의 성능 개선을 제공하여 모델 훈련 속도를 크게 향상시킬 수 있습니다. 또한 다양한 VM 모양을 지원하여 다양한 요구에 맞게 사용할 수 있습니다.

구글 쿠버네티스 엔진의 일환인 A3 VM은 Nvidia H100 GPU를 사용하여 추론 워크로드에 이상적인 성능을 제공합니다. A3 VM은 이전 세대 VM 대비 최대 10배 높은 네트워크 대역폭을 제공하여 더 많은 데이터를 GPU에 공급할 수 있습니다. 한 노드에는 8개의 H100 GPU가 탑재되어 있으며, 단일 노드에서 26 EXA FLOPS의 놀라운 컴퓨팅 용량을 제공합니다. 이제 모델을 더 빠르게 훈련할 수 있게 되었고, 구글 쿠버네티스 엔진의 산업 최고의 확장성으로 수천 개의 H100 GPU가 탑재된 GKE 클러스터를 생성하여 자체 슈퍼컴퓨터를 구축할 수 있게 되었습니다.

마지막으로, GKE에서 Google Cloud Storage FUSE가 일반적으로 사용 가능해진 것을 자랑스럽게 생각합니다. GCS(구글 클라우드 스토리지) FUSE는 GCS 파일 시스템을 사용하여 표준 파일 시맨틱을 사용해 Google Cloud Storage에서 데이터를 가져올 수 있도록 지원합니다. 이를 통해 다른 플랫폼에서 모델을 구글 클라우드에 쉽게 이식할 수 있으며, 구글의 고유한 SDK와의 코드 변경 없이도 실행 속도를 높일 수 있습니다. GCS FUSE는 workload identity를 통한 인증과 같은 내장 보안 기능도 제공하며, 특권이 필요하지 않은 컨테이너 요구사항을 충족시켜 보다 뛰어난 보안 프로세서를 제공합니다.

요약하자면, 구글 쿠버네티스 엔진은 인프라와 호환성 문제에 대해 걱정할 필요 없이 모델을 구축하고 훈련하며 서빙할 수 있도록 도와줍니다. 이제 저희는 오디어스의 CEO인 David Longo를 소개하고, GKE가 오디어스의 AI 여정을 어떻게 가속화시키고 있는지 들어보겠습니다.

✨ 오디어스: AI 여정을 가속화하는 구글 쿠버네티스 엔진의 도움

안녕하세요. 기쁘게도 오늘 구글 넥스트에서 여러분들께 인사드리게 되어 매우 기쁩니다. 제 이름은 David Longo이고, 저는 오디어스(Ordeos)의 CEO이자 창업자입니다. 오디어스는 디지털 비트의 혼돈을 물리적 원자의 순서로 바꾸기 위해 단백질 설계를 컴퓨터로 수행하는 회사입니다.

구체적으로는 우리는 컴퓨터를 사용하여 미니 단백질 생성 속도를 이전의 30배로 높일 수 있습니다. 이렇게 가능한 이유는 바로 구글과 구글 쿠버네티스 엔진을 통해 클라우드에서 디자인 엔진을 조정한 결과입니다.

이전에는 단백질을 발견하는 과정에서 라이브러리 스크린을 사용했습니다. 수백만 개의 물리적 모델을 검사하기 위해 실해 안에서 실험을 진행하며, 그 중 하나가 테스트를 시작하게 됩니다. 이런 프로세스는 주로 몇 주에서 몇 달이 걸리며, 종종 우리가 원하는 결과를 얻지 못하는 "타협"된 분자를 얻게 됩니다. 이러한 분자들은 예상대로 작동하지 않으며, 원하는 대상 이외에도 부작용을 일으키는 경우가 많습니다.

하지만 오디어스는 이와 반대로 작동합니다. 우리는 컴퓨터로부터 단백질을 처음부터 디자인해 낼 수 있습니다. 이를 위해 우리는 훈련자가 관심 있는 대상인 단백질과 단백질의 행동 방식에 대한 사양을 입력합니다. 이 사양은 시스템이 이해할 수 있는 형태로 표현됩니다. 그럼 시스템은 처음부터 새로운 단백질을 생성합니다. 이러한 단백질들은 다양한 기준에 따라 휴리스틱 체계를 통해 인식되고 평가됩니다. 이를 통해 생성된 단백질들은 계속해서 개선됩니다.

마침내 모델들은 실제 실험실에서 검증되게 되지만, 이미 최적화된 단백질이 생성되어 있습니다. 따라서 실험실에서 실제로 진행되는 것은 오직 최종 검증과정입니다.

제가 이야기한 것은 생성자, 훈련자, 평가자 등 많은 부분으로 나뉘어진 소프트웨어 시스템입니다. 이것들을 하나로 조화롭게 동작시키기 위해서는 어려운 문제가 많습니다. 이제 그 문제를 어떻게 해결했는지 들어보겠습니다.

우선, 우리는 강력하면서도 확장 가능한 도구를 구축하기 위해 구글 쿠버네티스 엔진을 활용했습니다. 우리는 사용하기 쉬운 사용자 인터페이스(UI)를 개발하였고, 이를 통해 생명 과학자들이 쉽게 이용할 수 있도록 했습니다. UI를 통해 백엔드와 연결되는 API들을 구축했고, 우리의 AI 모델들은 생산 환경에서 사용되고 테스트되고 개선될 수 있도록 구축되었습니다.

또한, 사건 주도형 아키텍처의 중요성을 깨닫게 되었습니다. 생명 과학자가 시스템을 사용하지 않는 동안은 GPU를 지속적으로 돌려두고 싶지 않기 때문이죠. 따라서 우리는 필요할 때에만 스케일 업하고 필요하지 않을 때에는 스케일 다운할 수 있는 시스템을 구축하기 위해 쿠버네티스를 사용했습니다.

또한, 우리는 시스템을 제어하는 단일 프로그램이 있어야 했습니다. 각각의 실험은 여러 모델과 계산을 사용할 수 있는 단일 실행으로 간주할 수 있습니다. 그러나 총 수백 개의 모델과 계산이 함께 동작하게 되는 경우, 쿠버네티스를 사용하여 오디어스의야 다양한 컨테이너와 모델을 협조하고 원활하게 통신할 수 있도록 해결했습니다.

이러한 시스템들은 네이티브로 로드 밸런싱에 대응할 수 있도록 설계되어 있어 수요에 따라 스케일 업할 수 있습니다. 따라서 사용자에게 필요한 때에 필요한 컴퓨팅 자원을 제공할 수 있고, 비용을 최소화하기 위해 사용하지 않는 경우에는 자원을 축소할 수 있습니다. 또한, 시스템은 스스로 치유되는 기능을 제공하여 실패한 경우에도 다시 빌드업하고 다시 시도할 수 있습니다.

하지만 쿠버네티스 자체는 이벤트 주도형이 아니거나, 적어도 이벤트가 스케일 업에 반영되기 어려웠습니다. 그래서 이 문제를 어떻게 해결했는지 들어보겠습니다.

우리는 쿠버네티스가 아니라 오픈소스 도구인 Keda를 사용해 이 문제를 해결했습니다. Keda는 대표적인 이벤트 큐인 Redis 또는 다른 Pub/Sub 시스템과 연계하여 이벤트를 모니터링하고, 쿠버네티스 API로 스케일링을 제어하는 방식으로 동작합니다. 이를 통해 컨테이너가 필요한 만큼만 스케일 업되고 비용을 효율적으로 관리할 수 있습니다.

Keda는 스케일 객체(Scale object)를 정의하여 사용될 컨테이너의 스케일링을 제어합니다. 스케일 객체는 큐의 길이가 10이 되면 컨테이너를 2개로 스케일 업하는 등의 파라미터를 설정합니다. 이렇게 하면 기존의 파드(Pod)만 있던 헬름차트(Helm Chart)나 Kubernetes 차트에서 처럼 스케일 작업을 위한 추가적인 지정만 하면 됩니다.

또한, 여러 환경을 관리하기 위해 쿠버네티스를 사용했습니다. 오디어스와 같은 기업에서는 생명 과학, 컴퓨터 과학, 분자 생물학 등 다양한 분야의 전문가들이 필요합니다. 이러한 전문가들 간에는 자연스럽게 이해관계 갈등이 있을 수 있습니다. 생명 과학자들은 단백질을 디자인하는 것에 초점을 맞추고, 개발자들은 새로운 기능을 개발하고 시키기 위해 환경을 조성하려고 합니다. 우리는 다양한 환경을 관리하기 위해 여러 개의 환경을 구성했습니다. 이를 통해 리소스를 분리하여 올바른 계산 자원이 올바른 곳에 배치되도록 했습니다. 또한, GitHub와 Cloud Build를 사용하여 이러한 환경 간에 시스템을 신속하게 배포하고 이동할 수 있게 했습니다.

구글 쿠버네티스 엔진은 코드 작성을 한 번만 해도 여러 환경에 반복적으로 적용할 수 있는 강력한 도구입니다. 우리는 인프라 코드 작업을 딱 한 번만 하면 다양한 환경에서 반복 적용할 수 있습니다. 또한, 구글 쿠버네티스 엔진은 다양한 클라우드에서도 사용할 수 있으므로 필요에 따라 고객의 클라우드에 쉽게 배포할 수 있습니다.

마지막으로, 오디어스는 구글 Cloud의 협력과 협조 정신에 매우 감사하게 생각합니다. 구글은 끊임없는 혁신뿐만 아니라 고객의 이익을 최우선으로 생각해왔기 때문에 오디어스와의 협력관계가 아주 원활하게 이루어지고 있습니다. 왈트 디즈니의 유명한 명언 중 하나로 "불가능한 것을 하기는 참으로 재미가 있다"가 있습니다. 구글 Cloud와 함께하며 오디어스는 불가능한 일들을 해내고 있습니다.

감사합니다.

Special Thanks to

  • 구글 쿠버네티스 엔진 팀
  • 오디어스 팀

FAQ

Q: 오디어스는 어떻게 구글 쿠버네티스 엔진을 활용하고 있나요?
A: 오디어스는 구글 쿠버네티스 엔진을 사용하여 디지털 단백질 설계 엔진을 클라우드에서 운영하고 있습니다. 이를 통해 오디어스는 단백질 공학 및 새로운 단백질 디자인을 빠르고 확장 가능한 방식으로 수행할 수 있습니다.

Q: 구글 쿠버네티스 엔진을 사용한 오디어스의 주요 혜택은 무엇인가요?
A: 구글 쿠버네티스 엔진을 사용함으로써 오디어스는 자원의 효율적인 활용, 복잡성 감소 및 확장성 확보와 같은 다양한 혜택을 누릴 수 있습니다. 또한, 인프라 비용을 절감하고 효율적인 AI 플랫폼 구축을 할 수 있으며, 손쉬운 자동화와 관리를 통해 생산성을 향상시킬 수 있습니다.

Q: 오디어스의 플랫폼은 어떻게 구성되어 있나요?
A: 오디어스의 플랫폼은 구글 쿠버네티스 엔진을 중심으로 여러 컨테이너와 모델, 평가자, 훈련자 등 다양한 구성 요소들로 구성되어 있습니다. 이러한 요소들은 쿠버네티스를 통해 효율적으로 배포되며, 이벤트 기반의 자동 스케일링 및 리소스 관리 기능을 활용하여 최적의 성능과 비용 효율성을 달성합니다.

Q: 오디어스의 AI 모델을 사용할 수 있는 방법은 무엇인가요?
A: 오디어스의 AI 모델은 API를 통해 제공되며, 구글 쿠버네티스 엔진을 통해 이식성을 확보하여 다양한 환경에서 사용할 수 있습니다. 또한, 구글 클라우드의 다른 서비스와의 통합을 지원하여 사용자에게 편리하고 신뢰성 있는 AI 솔루션을 제공합니다.

Q: 오디어스와 구글 클라우드의 협력 관계는 어떻게 되나요?
A: 오디어스는 구글 클라우드를 협력 파트너로 선택하고 있으며, 구글의 혁신, 협력 및 고객 중심적인 접근 방식에 매우 감사하게 생각합니다. 구글 클라우드의 기술 지원과 업계 최고의 클라우드 인프라를 활용하여 오디어스는 자사의 기술적 발전과 성장을 이루어나가고 있습니다.

Q: 오디어스가 구글 쿠버네티스 엔진을 선택한 이유는 무엇인가요?
A: 오디어스는 구글 쿠버네티스 엔진의 강력한 플랫폼 기능, 자동화 및 스케일링 지원, 다양한 클라우드 환경과의 호환성을 인정하고 선택했습니다. 구글 쿠버네티스 엔진은 효율적인 자원 할당, 유연성, 안정성을 제공하여 오디어스가 단백질 설계 분야에서 높은 수준의 성능과 생산성을 달성할 수 있도록 지원합니다.

Most people like

Are you spending too much time looking for ai tools?
App rating
4.9
AI Tools
100k+
Trusted Users
5000+
WHY YOU SHOULD CHOOSE TOOLIFY

TOOLIFY is the best ai tool source.