AIでテキストから画像生成「Stable Diffusion」

参考ブログ
TeDokology [Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img]

nvidia-smiコマンド
NVIDIA GPUデバイスの管理・モニタリングを行うコマンド

Google Colabで!nvidia-smiと実行した結果。


Diffusers
画像や音声に対応した事前学習済みの拡散モデル。拡散モデルの推論と学習のためのモジュール式ツールボックスとして機能する。要約すると「Diffusersは機械学習を行う上での便利ツール」
HuggingFaceがDiffusersを開発しているらしい。

PyTorch(パイトーチ)
Pythonのオープンソース機械学習ライブラリ(Deep Learningライブラリ)
Diffusersでは、PyTorchが必須。

CUDA Toolkit
NVIDIA社製GPUカードを汎用的な数値計算目的で利用したい場合に必要となるソフトウェア

cuDNN
NVIDIA CUDA Deep Neural Network
ディープ ニューラル ネットワークでの使用を目的としたGPUアクセラレーション型のプリミティブのライブラリ。

プリミティブ
原始的な(もの)、根源的な(もの)、初期の、などの意味を持つ英単語。
複雑な構造を形作る際の構成要素として使われる、単純あるいは基本的な構造や要素のこと。

アクセラレーション
加速、促進、高速化などの意味。IT分野ではソフトウェアなどの特定の機能の性能を高め、処理や通信の速度を高めること指す。

ビックリマークを先頭に打つ意味
例:!dir
Windowsではあまり利用しないコマンド。
Mac/Linux系はターミナルにわざわざ移行する必要がなく実行できる。

Hugging face
「自然言語理解」と「自然言語生成」の最先端の汎用アーキテクチャ(BERT、GPT-2など)と何千もの事前学習済みモデルを提供するライブラリ

アクセストークン取得
右上アイコン->Settings->Access Tokens->New Token

python
スポンサーリンク
のんびりブログ

コメント

タイトルとURLをコピーしました