AI事業本部におけるGPU活用の取り組みとKubernetes

サイバーエージェント AI事業本部では、広告領域を始めとして、様々な領域での機械学習のワークロードが増えています。研究者・データサイエンティスト・プロダクト開発者など様々なメンバーが機械学習を利用するなか、利便性の高いGPU/ML環境の提供は欠かせません。 現在に至るまでAI事業本部におけるオンプレGPU環境は様々な変遷があり、現在は2020年にリリースされた NVIDIA A100を利用しNetApp TridentとKubernetesをあわせてGPU/ML環境の提供を開始しています。 本セッションではこれまでの背景をお話しつつ、オープンソースなエコシステムと拡張性を活かしながら、GPU/ML基盤をどのように開発しているかについて紹介します。

青山 真也・李 榮宰・高橋 大輔

登壇者プロフィール

青山 真也・李 榮宰・高橋 大輔

株式会社サイバーエージェント

ML/GPU基盤開発チーム

amsy810

MasayaAoyama


--- 青山 真也 2016年CyberAgent入社。プライベートクラウド上のKubernetes as a Serviceのプロダクトオーナー、Kubernetes/CloudNative 領域の Developer Expertsとしても従事。国内カンファレンスでのKeynoteや海外カンファレンス等での登壇経験。著書に『Kubernetes完全ガイド』『みんなのDocker/Kubernetes』。現在はOSSへのContribute 活動をはじめ、CloudNative Days Tokyo 2019/2020のCo-chair、CNCF公式のCloud Native Meetup TokyoやKubernetes Meetup TokyoのOrganizerなどコミュニティ活動にも従事。 --- 李 榮宰 2016年にサイバーエージェントに入社。入社後は広告プロダクトでソリューションアーキテクト、さらにプライベートクラウドやGKE互換なコンテナプラットフォームの開発を担当。AI系基盤プロジェクトのマネージャとしてAIプラットフォームを開発。 --- 高橋 大輔 主にプライベートなOpenStackプラットフォームとKubernetes-as-a-Serviceの開発、およびさまざまなアクセラレータデバイス提供における全ての工程を担当。 GPUaaS / AIプラットフォームの基盤となる物理インフラを構築。