4Gamers さんの記事。まぁ、一般人には関係の無い雲の上の話だが、なかなかにとんでもないものが開発されつつあるんだなぁ、というニュース。超お高い GPU GV100 を 16 基つなげて、一つの GPU のように使うものらしい。だいたい、GV100 1個でも、現在現実的なコストで製造できるほぼ最大のチップだそうで、なんか物量の投入具合にフラフラする気分である。ニューラルネットワークの機械学習の計算にフィットする TensorCore を搭載しているので、かなり精度は落ちるが、1 チップで最大 118TFlops を叩き出すそうで、もう良くわからない世界。
このチップを 16 基。総計で 2 PFlops とか、もう何が何やら。ただ、それだけの計算能力をフルに活用できるソフトウェア技術があるのか、というのも気にかかる所ではある。一応メモリには HBM2 接続 32GB を各チップごとに搭載しているとのことで、できるだけメモリも足枷になりにくいようにはしている。ただ、別の GPU のメモリへアクセスする際のペナルティは気になるところ、NVSwitch がどれくらいのデータ転送能力があるかがポイントだろうか。
個人的には、機械学習に使うのも凄そうではあるが、やはり最近話題のリアルタイムレイトレーシングに使いたい所。4K 解像度で、どれくらいの映像をリアルタイムで出せるのだろうか。相当なレベルの映像を出せるなら、39万9千ドルは高くない、という人たちはたくさんいそうではある。
後、あくまで GPU として見える、ということは、本体たる CPU も重要になってきそう。これだけの計算パワーをぶん回せる CPU となると、こちらも多コアのものを複数並べて使うのだろうか。仕事の分散とかもかなり工夫が必要そう。
一度、この DGX-2 がフルパワーで計算している結果を見てみたいものだ。