> ## Documentation Index
> Fetch the complete documentation index at: https://wb-21fd5541-dependabot-github-actions-actions-cache-6.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> PyTorch Ignite と W&B を統合して、トレーニング メトリクス、モデル パラメーター、実験設定を自動的にログします。

# PyTorch Ignite

* この[W\&B レポートの例 →](https://app.wandb.ai/example-team/pytorch-ignite-example/reports/PyTorch-Ignite-with-W%26B--Vmlldzo0NzkwMg)で、生成される可視化を確認できます
* この[ホストされたノートブックの例 →](https://colab.research.google.com/drive/15e-yGOvboTzXU4pe91Jg-Yr7sae3zBOJ#scrollTo=ztVifsYAmnRr)で、コードを自分で実行してみてください

Ignite は、トレーニングおよび検証中にメトリクス、モデル/オプティマイザーのパラメーター、勾配をログするための W\&B ハンドラーをサポートしています。また、モデル チェックポイントを W\&B クラウドにログするためにも使用できます。このクラスは wandb モジュールのラッパーでもあります。つまり、このラッパーを使って任意の wandb 関数を呼び出せます。モデル パラメーターと勾配の保存方法については、例を参照してください。

<div id="basic-setup">
  ## 基本セットアップ
</div>

```python theme={null}
from argparse import ArgumentParser
import wandb
import torch
from torch import nn
from torch.optim import SGD
from torch.utils.data import DataLoader
import torch.nn.functional as F
from torchvision.transforms import Compose, ToTensor, Normalize
from torchvision.datasets import MNIST

from ignite.engine import Events, create_supervised_trainer, create_supervised_evaluator
from ignite.metrics import Accuracy, Loss

from tqdm import tqdm


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.conv2_drop = nn.Dropout2d()
        self.fc1 = nn.Linear(320, 50)
        self.fc2 = nn.Linear(50, 10)

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, 320)
        x = F.relu(self.fc1(x))
        x = F.dropout(x, training=self.training)
        x = self.fc2(x)
        return F.log_softmax(x, dim=-1)


def get_data_loaders(train_batch_size, val_batch_size):
    data_transform = Compose([ToTensor(), Normalize((0.1307,), (0.3081,))])

    train_loader = DataLoader(MNIST(download=True, root=".", transform=data_transform, train=True),
                              batch_size=train_batch_size, shuffle=True)

    val_loader = DataLoader(MNIST(download=False, root=".", transform=data_transform, train=False),
                            batch_size=val_batch_size, shuffle=False)
    return train_loader, val_loader
```

ignite で `WandBLogger` を使用する手順はモジュール式になっています。まず、`WandBLogger` オブジェクトを作成します。次に、それを trainer または evaluator にアタッチして、メトリクスを自動的にログします。この例では、次のことを示します。

* trainer オブジェクトにアタッチして、トレーニング損失をログします。
* evaluator にアタッチして、検証損失をログします。
* 学習率などの任意のパラメーターをログします。
* モデルを監視します。

```python theme={null}
from ignite.contrib.handlers.wandb_logger import *
def run(train_batch_size, val_batch_size, epochs, lr, momentum, log_interval):
    train_loader, val_loader = get_data_loaders(train_batch_size, val_batch_size)
    model = Net()
    device = 'cpu'

    if torch.cuda.is_available():
        device = 'cuda'

    optimizer = SGD(model.parameters(), lr=lr, momentum=momentum)
    trainer = create_supervised_trainer(model, optimizer, F.nll_loss, device=device)
    evaluator = create_supervised_evaluator(model,
                                            metrics={'accuracy': Accuracy(),
                                                     'nll': Loss(F.nll_loss)},
                                            device=device)

    desc = "ITERATION - loss: {:.2f}"
    pbar = tqdm(
        initial=0, leave=False, total=len(train_loader),
        desc=desc.format(0)
    )
    #WandBlogger オブジェクトの作成
    wandb_logger = WandBLogger(
    project="pytorch-ignite-integration",
    name="cnn-mnist",
    config={"max_epochs": epochs,"batch_size":train_batch_size},
    tags=["pytorch-ignite", "mninst"]
    )

    wandb_logger.attach_output_handler(
    trainer,
    event_name=Events.ITERATION_COMPLETED,
    tag="training",
    output_transform=lambda loss: {"loss": loss}
    )

    wandb_logger.attach_output_handler(
    evaluator,
    event_name=Events.EPOCH_COMPLETED,
    tag="training",
    metric_names=["nll", "accuracy"],
    global_step_transform=lambda *_: trainer.state.iteration,
    )

    wandb_logger.attach_opt_params_handler(
    trainer,
    event_name=Events.ITERATION_STARTED,
    optimizer=optimizer,
    param_name='lr'  # オプション
    )

    wandb_logger.watch(model)
```

必要に応じて、ignite `EVENTS` を使ってメトリクスをターミナルに直接ログできます

```python theme={null}
    @trainer.on(Events.ITERATION_COMPLETED(every=log_interval))
    def log_training_loss(engine):
        pbar.desc = desc.format(engine.state.output)
        pbar.update(log_interval)

    @trainer.on(Events.EPOCH_COMPLETED)
    def log_training_results(engine):
        pbar.refresh()
        evaluator.run(train_loader)
        metrics = evaluator.state.metrics
        avg_accuracy = metrics['accuracy']
        avg_nll = metrics['nll']
        tqdm.write(
            "トレーニング結果 - エポック: {}  平均精度: {:.2f} 平均損失: {:.2f}"
            .format(engine.state.epoch, avg_accuracy, avg_nll)
        )

    @trainer.on(Events.EPOCH_COMPLETED)
    def log_validation_results(engine):
        evaluator.run(val_loader)
        metrics = evaluator.state.metrics
        avg_accuracy = metrics['accuracy']
        avg_nll = metrics['nll']
        tqdm.write(
            "検証結果 - エポック: {}  平均精度: {:.2f} 平均損失: {:.2f}"
            .format(engine.state.epoch, avg_accuracy, avg_nll))

        pbar.n = pbar.last_print_n = 0

    trainer.run(train_loader, max_epochs=epochs)
    pbar.close()


if __name__ == "__main__":
    parser = ArgumentParser()
    parser.add_argument('--batch_size', type=int, default=64,
                        help='トレーニング用の入力バッチサイズ (デフォルト: 64)')
    parser.add_argument('--val_batch_size', type=int, default=1000,
                        help='検証用の入力バッチサイズ (デフォルト: 1000)')
    parser.add_argument('--epochs', type=int, default=10,
                        help='トレーニングのエポック数 (デフォルト: 10)')
    parser.add_argument('--lr', type=float, default=0.01,
                        help='学習率 (デフォルト: 0.01)')
    parser.add_argument('--momentum', type=float, default=0.5,
                        help='SGDモメンタム (デフォルト: 0.5)')
    parser.add_argument('--log_interval', type=int, default=10,
                        help='トレーニングステータスをログするまでに待機するバッチ数')

    args = parser.parse_args()
    run(args.batch_size, args.val_batch_size, args.epochs, args.lr, args.momentum, args.log_interval)
```

このコードにより、次の可視化が生成されます::

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541-dependabot-github-actions-actions-cache-6/YBe_izfYs-9FeLxI/images/integrations/pytorch-ignite-1.png?fit=max&auto=format&n=YBe_izfYs-9FeLxI&q=85&s=dde2a24a30605b465ae336ebcb54cc8b" alt="PyTorch Ignite トレーニングダッシュボード" width="900" height="450" data-path="images/integrations/pytorch-ignite-1.png" />
</Frame>

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541-dependabot-github-actions-actions-cache-6/YBe_izfYs-9FeLxI/images/integrations/pytorch-ignite-2.png?fit=max&auto=format&n=YBe_izfYs-9FeLxI&q=85&s=ad60b68d639f87726b5e7296c3e86bec" alt="PyTorch Ignite パフォーマンス" width="900" height="450" data-path="images/integrations/pytorch-ignite-2.png" />
</Frame>

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541-dependabot-github-actions-actions-cache-6/YBe_izfYs-9FeLxI/images/integrations/pytorch-ignite-3.png?fit=max&auto=format&n=YBe_izfYs-9FeLxI&q=85&s=e1031702a397d0263276ef5540fc623e" alt="PyTorch Ignite ハイパーパラメーターの調整結果" width="900" height="450" data-path="images/integrations/pytorch-ignite-3.png" />
</Frame>

<Frame>
  <img src="https://mintcdn.com/wb-21fd5541-dependabot-github-actions-actions-cache-6/YBe_izfYs-9FeLxI/images/integrations/pytorch-ignite-4.png?fit=max&auto=format&n=YBe_izfYs-9FeLxI&q=85&s=101e7c9f763409ad83e7da8055b564c6" alt="PyTorch Ignite モデル比較ダッシュボード" width="1664" height="855" data-path="images/integrations/pytorch-ignite-4.png" />
</Frame>

詳細については、[Ignite Docs](https://pytorch.org/ignite/contrib/handlers.html#module-ignite.contrib.handlers.wandb_logger)を参照してください。
