機械学習のハードウェアインフラってどうしてる？Facebookの成長を支えたパイプライン

ENGINEER

2018.06.12 2023.11.20

Facebookのサービスは、機械学習により大きく進歩しました。自動翻訳システム、画像分類システム、音声認識、物体認識、顔認識システムなどの新しいサービスが次々にリリースされています。

これらの開発には機械学習を用いますが、複雑な計算を行うには膨大なマシンパワーが必要になります。膨大な仕事量をこなすために、Facebookは2013年から、データセンターの機械学習ハードウェアを大幅にアップグレードしてきました。

まず、『HP SL270s G8システム』をAIリサーチ用に導入しました。そして研究を行う過程で、GPUのパワーが重要であると気づきます。GPUに加え、熱効率、パフォーマンス、信頼性、クラスター管理にも焦点を置いて、次世代のシステム開発に取り組みました。

『Big Sur』と『Big Basin』という2つのサーバーがデザインされ、OCP（オープンコンピュートプロジェクト）のデータセンターに追加されました。ここから、AIリサーチと機械学習はさらに進歩することになります。

Servers
出典 : code.facebook.com

Big Basin v2の導入
Facebookの機械学習パイプライン
将来のハードウェアデザイン

Big Basin v2の導入

組み立て方式で作られた『Big Basinシステム』は、それを基盤にして、OCPから様々な要素を取り込むことができました。そして完成したのが『Big Basin v2システム』です。

最新世代の『NVIDIA Tesla V100 GPU』アクセラレータの採用により、CPUパフォーマンスの向上、PCle帯域幅も倍になりました。さらにネットワークカードのアップグレードも行い、前回のシステムと比べてシングルGPUコアのパフォーマスが66%も向上しました。

システム全体でも大幅な改善となり、研究者とエンジニアが、より複雑で大きな機械学習モデルを設計できるようになりました。

Front
出典 : code.facebook.com

Front2
出典 : code.facebook.com

Inside01
出典 : code.facebook.com

Inside2
出典 : code.facebook.com

Backside Server
出典 : code.facebook.com

Facebookの機械学習パイプライン

『Big Basin v2』は、Facebookの機械学習を支える最先端のマシンです。

そして大部分の機械学習は、『FBLearner』というパイプラインを通されます。『Feature Store』『Flow』『Predictor』という三段階のAIプラットフォームを用いて機械学習を行います。

まず、『Feature Store』でフィーチャーを抽出し『Flow』に受け渡します。そこで渡されたデータを元に学習モデルを作り出します。最終段階までテストされたモデルは、『Predictor』に渡され、インターフェイスが実装されたり、実際のトラフィック上で稼働を始めます。

たとえば、実際のトラフィックを観察することで、ストーリーや投稿の中から最も人気のあるものを見つけ出すことができます。

データと『Feature Store』は『Bryce Canyon』によって、『Flow』は『Tioga Pass CPU』もしくは『Big Basin v2 GPU』によって、そして『Predictor』は『Tioga Pass』もしくは『Twin Lakes』によって処理されています。

Servers and work flows
出典 : code.facebook.com

将来のハードウェアデザイン

めざましく発展する機械学習をサポートしようと、Facebookは最先端の人工知能インフラストラクチャーを目指しています。

より良いエネルギー効率、高いパフォーマンス性、ノード間通信、ストレージ効率やデータローカリティの改良を重ね、より大きく複雑なデータを扱えるように取り組んでいます。

また、ソースを一般にも公開して、さらに共同作業をすることで、プロセスを加速できると言われています。より多くのデータを処理、解析し、そしてさらに素晴らしいFacebookエクスペリエンスを届けるのが目標です。

『Big Basin v2』のデザインスペックは一般公開されているので、ぜひチェックしてみてください。

“OCP Marketplace“

（執筆：f code　翻訳：July Ando）

【リモート可】音楽、エンタメ × ITでイノベーションを！API開発をするサーバーサイドエンジニア募集！

#土日週末OK
#急募

【週4勤務/リモートワークOK】クリエイター中心の組織で開発を担う、バックエンドエンジニアを募集！

#急募
#長期案件
#フルリモートOK

Workship MAGAZINEの外部スペシャリスト／プロフェッショナルからの寄稿です。あなたの専門的な知見を、Workship MAGAZINEに載せませんか？お問い合わせはこちら。

この記事はプロフェッショナル寄稿からの転載です。配信元または著者とコンテンツ契約を結び配信しています。
The next step in Facebook's AI hardware infrastructure

Follow @goworkship

■当サイト掲載中の情報について
Workship MAGAZINEでは日々情報の更新に努めておりますが、掲載内容は最新のものと異なる可能性があります。当該情報について、その有用性、適合性、完全性、正確性、安全性、合法性、最新性等について、いかなる保証もするものではありません。修正の必要に気づかれた場合は、サイト下の問い合わせ窓口よりお知らせください。
■アクセス解析ツールについて
当サイトでは、Googleによるアクセス解析ツール『Googleアナリティクス』を利用しています。このGoogleアナリティクスはトラフィックデータの収集を行なっています。このトラフィックデータは匿名で収集されており、個人を特定するものではありません。この規約に関して、詳しくはGoogle アナリティクス利用規約をご覧ください。

■広告の配信について
当サイトは第三者配信の広告サービス『Google Adsense』を利用しています。広告配信事業者は、取得した閲覧履歴や購買履歴等の情報を分析して、ユーザーの趣味・嗜好に応じた新商品・サービスに関する広告を表示することがあります。また当サイトは、商品やサービスを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、『A8.net』『もしもアフィリエイト』『afb』『アクセストレード』『バリューコマース』『レントラックス』『felmat』『TGアフィリエイト』『リンクシェア』『楽天アフィリエイト』『Amazon アソシエイト』の参加者です。IPアドレス、ユーザーエージェント、クッキー情報、成果結果情報（広告成果毎の識別子）などを取得し、広告配信に係る成果計測、広告配信に係る不正防止などに利用する場合があります。

機械学習のハードウェアインフラってどうしてる？Facebookの成長を支えたパイプライン

Big Basin v2の導入

Facebookの機械学習パイプライン

将来のハードウェアデザイン

NEW

業務時間外の連絡、どこまでOK？「即レス要求」は法的リスク【社労士解説】

地方採用なぜ難しい？人材不足の原因と成功企業が実践する採用戦略

Wantedly運用代行おすすめ20社比較｜費用・選び方・失敗しないポイントを解説

フリーランスのリモート案件探し方完全ガイド｜職種別・単価相場・おすすめサービスを解説

PICKUP

業務時間外の連絡、どこまでOK？「即レス要求」は法的リスク【社労士解説】

「どうせ無名の会社だから」は言い訳。大手病より深刻な「中小企業病」の正体

青色申告、あえてやめませんか？Taxnote×白色申告で確定申告のダルさを軽減しよう

求人票に「月給28万円」じゃスルーされる！給与を盛らずに応募数を増やす求人票の書き方

KEYWORDS

機械学習のハードウェアインフラってどうしてる？Facebookの成長を支えたパイプライン

Big Basin v2の導入

Facebookの機械学習パイプライン

将来のハードウェアデザイン

NEW

業務時間外の連絡、どこまでOK？「即レス要求」は法的リスク【社労士解説】

地方採用なぜ難しい？人材不足の原因と成功企業が実践する採用戦略

Wantedly運用代行おすすめ20社比較｜費用・選び方・失敗しないポイントを解説

フリーランスのリモート案件探し方完全ガイド｜職種別・単価相場・おすすめサービスを解説

SHARE

PICKUP

業務時間外の連絡、どこまでOK？「即レス要求」は法的リスク【社労士解説】

「どうせ無名の会社だから」は言い訳。大手病より深刻な「中小企業病」の正体

青色申告、あえてやめませんか？Taxnote×白色申告で確定申告のダルさを軽減しよう

求人票に「月給28万円」じゃスルーされる！給与を盛らずに応募数を増やす求人票の書き方

KEYWORDS