p225 のbatch_size宣言について #13

roadto93ds · 2021-10-10T07:27:07Z

p225 のdataloaderを導入した訓練についてですが、

for文の外で batch_sizeを決めて動かしたのですが、

for文の中で
imgs.shape[0] という形で改めて定義しないと動かないのはなぜでしょうか？

# epoch回数
n_epochs = 100
# batch_size
batch_size = 64

# data_loader
train_data_loader = DataLoader(cifar2, batch_size=batch_size, shuffle=True)

# 損失関数
loss_fn = nn.NLLLoss()
# 最適化戦略
optimizer = optim.SGD(model.parameters(), lr=1e-2)


for epoch in range(n_epochs):
  for imgs, labels in train_data_loader:
    # model出力
    outputs = model(imgs.view(batch_size,-1)) # batch_size行,3*32*32列にする
    # 損失関数での評価
    train_loss = loss_fn(outputs, labels)

    optimizer.zero_grad()

    train_loss.backward() 

    optimizer.step()

  print("Epoch:{}, Loss:{}".format(epoch, float(train_loss)))

The text was updated successfully, but these errors were encountered:

Gin5050 · 2021-10-22T08:05:50Z

roadto93ds 様

ご質問ありがとうございます。
また、ご連絡が遅くなり申し訳ありません。

ご質問の件ですが、データ数がバッチサイズで割り切れないのが理由だと思われます。
（※ 詳しいエラー内容を見てないので推測です）
該当部分ではデータ数10000をサイズ64のバッチにするので、バッチサイズ64のtensorが156個できます。
この時64*156=9984となり、内側のfor文のラストのimgsはimgs.shape[0]=16でバッチサイズ64にできません。

そのため、ここではfor文の外ではなく内側で batch_sizeを再計算してバッチサイズを64にできない場合でも計算できるようにしています。

余談ですが、DataLoaderのオプションでdrop_last=Trueにすると割り切れない部分は落としてくれるので、内側でbatch_sizeを計算しなくても動きます。

参考：https://pytorch.org/docs/stable/data.html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

p225 のbatch_size宣言について #13

p225 のbatch_size宣言について #13

roadto93ds commented Oct 10, 2021

Gin5050 commented Oct 22, 2021 •

edited

Loading

p225 のbatch_size宣言について #13

p225 のbatch_size宣言について #13

Comments

roadto93ds commented Oct 10, 2021

Gin5050 commented Oct 22, 2021 • edited Loading

Gin5050 commented Oct 22, 2021 •

edited

Loading