- MK-1は、OpenAI、Anthropic、GoogleのようなエリートAIプレイヤーと同等、あるいはそれ以上の能力を持つAIモデルの提供を目指す新しい企業です。
- 同社の最初の製品であるMKMLは、数行のPythonコードだけでGPU上の大規模言語モデル(LLM)推論コストを2分の1に削減できる推論ランタイムです。
- MKMLは、Hugging FaceやPyTorchといった人気のエコシステムと互換性があります。
- MKMLは現在クローズドベータリリース段階にあり、初期パートナーを募集しています。
- MKMLは、AIモデルのメモリ使用量を減らし、速度を高めることで最適化するのに役立ちます。たとえば、Llama-2 13Bモデルを26GBから10.5GBに削減し、フォワードパスの推論時間を最大2.3倍短縮できます。
- MKMLは、コストまたは速度に応じてAIモデルを最適化するために使用できます。コスト最適化のシナリオでは、モデルをより安価なGPUインスタンスに適合させることができ、より高価なインスタンス上ではベースモデルよりも高速に実行できます。速度最適化のシナリオでは、MKMLによってモデルを最大2.0倍高速化し、より多くのユーザーにサービスを提供できます。
- MKMLは既存のワークフローに容易に統合できます。これには、MKMLのモデルコーデックの1つを使ってモデルを一度圧縮し、圧縮済みモデルをディスクに保存してから推論用に読み込むプロセスが含まれます。
- MKMLはさまざまなモデルサイズとシステム構成をサポートしており、速度テストでは一貫してベースラインを上回ります。
- MKMLはまた、元のモデルに対する高い忠実度を維持しており、標準的なパープレキシティ測定でも差は無視できるレベルです。
- MK-1の長期的なビジョンは、推論スタック全体にわたってAIの性能を限界まで引き上げることです。彼らは今後の開発に向けた野心的なロードマップを持っています.
1件のコメント
Hacker Newsの意見