環境を手動でセットアップする
本記事では、さまざまなハードウェアターゲットに対して、モデル変換およびモデル推論のためのPython環境を手動でセットアップする方法を説明します。
モデル変換用環境のセットアップ
Foundry Toolkitは内部で利用しているため、uvを使用したPython仮想環境に環境をインストールすることを推奨します。
特に設定しない限り、デフォルトのPythonバージョンは3.12です。
要件のインストール
Foundry Toolkitが仮想環境をセットアップする際、以下の3種類の要件を順番にインストールします。
- 基本要件(Base requirements):すべてのパッケージを含む基本的な要件。
- 機能要件(Feature requirements):レシピ用の追加要件。基本要件の後にインストールされます。
- プロジェクト要件(Project requirements):プロジェクト内の
requirements.txtファイル。依存関係をカスタマイズできます。
これらのファイルは olive-recipes リポジトリでホストされています。
要件ファイルは、その内容を拡張する特別なコマンドをサポートしています。要件ファイルをインストールする前に特別なコマンドがないか確認して適切に対処し、その後 uv pip install -r xxx.txt で通常通りインストールしてください。
例:Qualcomm NPU
Deepseek Qualcomm NPU の場合、runtimeOverwrite.executeEp は CUDAExecutionProvider であるため、基本要件ファイルは NvidiaGPU となります。executeRuntimeFeatures は AutoGptq なので、機能要件ファイルは AutoGptq となります。
例:AMD NPU
Deepseek AMD NPU の場合、runtimeOverwrite.executeEp は AMD/Quark_py3.10.17 であるため、基本要件ファイルは AMD/Quark_py3.10.17 となります。機能要件はありません。この仮想環境にはPython 3.10を使用してください。
モデル推論用環境のセットアップ
プロセスは「モデル変換用環境のセットアップ」と同様です。
変換にも同じ要件ファイルを使用できる場合があります。その場合、ファイルから onnxruntime-windowsml と onnxruntime-genai-winml のみをインストールすればよいかもしれません。
WCR は、Foundry Toolkitのすべての実行プロバイダーでモデルを実行するための最新の要件ファイルです。
QNN上のLLMモデルの場合、arm64 Python環境の方が優れたパフォーマンスを発揮します。この構成用に専用の要件ファイルが用意されています。