7 ポイント 投稿者 xguru 2021-07-29 | 1件のコメント | WhatsAppで共有
  • Pythonに似たプログラミング言語とコンパイラ

  • CUDAの経験がない研究者でも、高効率なディープラーニング向けGPUコードを簡単に記述可能

→ すでにTorch実装より約2倍効率のよいカーネルを実装

  • Linux、NVIDIA GPUをサポート(AMD GPUと他のCPUは開発中)

  • 基本コードはNumbaに似ているが、SIMTを使わず、ブロック単位の演算によってインスタンス内で並列実行

  • PythonコードをTriton-IRに変換し、Triton Compilerを通じてLLVM-IRへ変換するアーキテクチャ

1件のコメント

 
xguru 2021-07-29

原著者の論文 : http://eecs.harvard.edu/~htk/publication/…

(Philippe Tillet を OpenAI が採用し、継続して開発を支援しているとのこと)