PyTorch-실습 : 딥러닝 모델 프로그램 만들기(2)

import torch.nn as nn

class MnistModel(nn.Module):

    def __init__(self, input_size, output_size):
        self.input_size = input_size
        self.output_size = output_size
        super().__init__()
        self.layers = nn.Sequential(
            nn.Linear(input_size, 500), nn.LeakyReLU(), nn.BatchNorm1d(500),
            nn.Linear(500, 300), nn.LeakyReLU(), nn.BatchNorm1d(300),
            nn.Linear(300, 100), nn.LeakyReLU(), nn.BatchNorm1d(100),
            nn.Linear(100, 50), nn.LeakyReLU(), nn.BatchNorm1d(50),
            nn.Linear(50, output_size),
            nn.LogSoftmax(dim=-1))

    def forward(self, x):
        y = self.layers(x)
        return y

data.py

from torchvision import datasets, transforms

def load_mnist():
    dataset = datasets.MNIST('../data', train=True, download=True, transform=transforms.Compose(transforms.ToTensor()))
    x_data = dataset.data.float() / 255.
    y_data = dataset.targets
    return x_data, y_data

trainer.py

from copy import deepcopy
import numpy as np
import torch


class Train_model():
    def __init__(self, model, optimizer, loss):
        self.model = model
        self.optimizer = optimizer
        self.loss = loss
        super().__init__()

    def run_train_data(self, x, y, config):
        self.model.train()
        indices = torch.randperm(x.size(0))
        x = torch.index_select(x, dim=0, index=indices).split(config.batch_size, dim=0)
        y = torch.index_select(y, dim=0, index=indices).split(config.batch_size, dim=0)
        train_loader = zip(x, y)
        total_loss = 0
        for i, (data, target) in enumerate(train_loader):
            train_model = self.model(data)
            train_loss = self.loss(train_model, target.squeeze())
            self.optimizer.zero_grad()
            train_loss.backward()
            self.optimizer.step()
            print(f"Train_{i} / loss : {float(train_loss)}")
            total_loss += float(train_loss)
        return total_loss / len(x)

    def run_test_data(self, x, y, config):
        self.model.eval()
        # no_grad mode
        with torch.no_grad():
            indices = torch.randperm(x.size(0))
            x = torch.index_select(x, dim=0, index=indices).split(config.batch_size, dim=0)
            y = torch.index_select(y, dim=0, index=indices).split(config.batch_size, dim=0)
            total_loss = 0
            test_loader = zip(x, y)
            for i, (data, target) in enumerate(test_loader):
                test_model = self.model(data)
                test_loss = self.loss(test_model, target.squeeze())
                print(f"test_{i} / loss : {float(test_loss)}")
                total_loss += float(test_loss)
            return total_loss / len(x)

    def main_train(self, train_data, test_data, config):
        result_loss = np.inf
        best_model = None
        for i in range(config.epochs):
            train_loss = self.run_train_data(train_data[0], train_data[1], config)
            test_loss = self.run_test_data(test_data[0], test_data[1], config)
            if test_loss <= result_loss:
                result_loss = test_loss
                best_model = deepcopy(self.model.state_dict())
            print(f"Epoch : {i+1}, train_loss : {train_loss}, test_loss : {test_loss}  result_loss : {result_loss}")
        self.model.load_state_dict(best_model)

train.py

import torch
import argparse
import torch.nn as nn
import torch.optim as optim
from model import MnistModel
from trainer import Train_model
from data import load_mnist


def user_option():
    page = argparse.ArgumentParser()
    page.add_argument('--save_model', required=True)
    page.add_argument('--train_ratio', type=float, default=.8)
    page.add_argument('--batch_size', type=int, default=64)
    page.add_argument('--epochs', type=int, default=5)
    config = page.parse_args()
    return config


def mnist_run(config):
    device = torch.device('cpu')
    x_data, y_data = load_mnist()
    x_data = x_data.view(x_data.size(0), -1)
    train_cnt = int(x_data.size(0) * config.train_ratio)
    test_cnt = x_data.size(0) - train_cnt
    indices = torch.randperm(x_data.size(0))
    x_data = torch.index_select(x_data,dim=0,index=indices).to(device).split([train_cnt, test_cnt], dim=0)
    y_data = torch.index_select(y_data,dim=0,index=indices).to(device).split([train_cnt, test_cnt], dim=0)
    model = MnistModel(784, 10).to(device)
    optimizer = optim.Adam(model.parameters())
    loss = nn.NLLLoss()
    trainer = Train_model(model, optimizer, loss)
    trainer.main_train((x_data[0], y_data[0]), (x_data[1], y_data[1]), config)
    torch.save({'model': trainer.model.state_dict(), 'config': config}, config.save_model)


if __name__ == '__main__':
    config = user_option()
    mnist_run(config)

'AI > PyTorch-실습' 카테고리의 다른 글

PyTorch-실습 : 딥러닝 모델 프로그램 만들기(1) (0)	2020.09.17
PyTorch-실습 : 파이토치 코드 활용하기(2) (0)	2020.09.17
PyTorch-실습 : 파이토치 코드 활용하기(1) (1)	2020.09.17

DK - AI

PyTorch-실습 : 딥러닝 모델 프로그램 만들기(2)

'AI > PyTorch-실습' 카테고리의 다른 글

+ Recent posts

티스토리툴바