133 분 소요

RNN을 사용한 문장 생성

1. 언어 모델을 사용한 문장 생성

1.1 RNN을 사용한 문장 생성의 순서

from IPython.display import Image
Image('./deep_learning_2_images/fig 7-1.png', width=600)

png

Image('./deep_learning_2_images/fig 7-2.png', width=400)

png

Image('./deep_learning_2_images/fig 7-3.png', width=300)

png

Image('./deep_learning_2_images/fig 7-4.png', width=450)

png

1.2 문장 생성 구현

from common.base_model import BaseModel
from common.time_layers import *
class Rnnlm(BaseModel):
    def __init__(self, vocab_size=10000, wordvec_size=100, hidden_size=100):            
        V, D, H = vocab_size, wordvec_size, hidden_size
        rn = np.random.randn

        # 가중치 초기화
        embed_W = (rn(V, D) / 100).astype('f')
        lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
        lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b = np.zeros(4 * H).astype('f')
        affine_W = (rn(H, V) / np.sqrt(H)).astype('f')
        affine_b = np.zeros(V).astype('f')

        # 계층 생성
        self.layers = [
            TimeEmbedding(embed_W),
            TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True),
            TimeAffine(affine_W, affine_b)
        ]
        self.loss_layer = TimeSoftmaxWithLoss()
        self.lstm_layer = self.layers[1]

        # 모든 가중치와 기울기를 리스트에 모은다.
        self.params, self.grads = [], []
        for layer in self.layers:
            self.params += layer.params
            self.grads += layer.grads

    def predict(self, xs):
        for layer in self.layers:
            xs = layer.forward(xs)
        return xs

    def forward(self, xs, ts):
        score = self.predict(xs)
        loss = self.loss_layer.forward(score, ts)
        return loss

    def backward(self, dout=1):
        dout = self.loss_layer.backward(dout)
        for layer in reversed(self.layers):
            dout = layer.backward(dout)
        return dout

    def reset_state(self):
        self.lstm_layer.reset_state()

RnnlmGen 클래스

class RnnlmGen(Rnnlm):
    def generate(self, start_id, skip_ids=None, sample_size=100):
        word_ids = [start_id]

        x = start_id        
        while len(word_ids) < sample_size:
            x = np.array(x).reshape(1, 1)
            score = self.predict(x)            
            p = softmax(score.flatten())
            sampled = np.random.choice(len(p), size=1, p=p)
            if (skip_ids is None) or (sampled not in skip_ids):
                x = sampled
                word_ids.append(int(x))

        return word_ids

    def get_state(self):
        return self.lstm_layer.h, self.lstm_layer.c

    def set_state(self, state):
        self.lstm_layer.set_state(*state)

Rnnlm으로 문장 생성

from dataset import ptb

corpus, word_to_id, id_to_word = ptb.load_data('train')
vocab_size = len(word_to_id)
corpus_size = len(corpus)

model = RnnlmGen()
model.load_params('Rnnlm.pkl')

# start 문자와 skip 문자 설정
start_word = 'you'
start_id = word_to_id[start_word]
skip_words = ['N', '<unk>', '$']
skip_ids = [word_to_id[w] for w in skip_words]
# 문장 생성
word_ids = model.generate(start_id, skip_ids)
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print(txt)
you will take how finding it had been where about the traditional does n't aim by what 's most merely crossed the game is n't being used.
 it was a very successful list if expired.
 the company was sport mr. roman 's findings.
 mr. roman also will pay cost kevin to bring up from ford based in capital markets and nl.
 he estimated his own inside run the world 's bronx and show his name sets warned him to literature his television friend pinkerton 's i. kohl.
 panamanian rules feel the beauty that and name-dropping

1.3 더 좋은 문장으로

class BetterRnnlm(BaseModel):
    def __init__(self, vocab_size=10000, wordvec_size=650,
                 hidden_size=650, dropout_ratio=0.5):
        V, D, H = vocab_size, wordvec_size, hidden_size
        rn = np.random.randn

        embed_W = (rn(V, D) / 100).astype('f')
        lstm_Wx1 = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
        lstm_Wh1 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b1 = np.zeros(4 * H).astype('f')
        lstm_Wx2 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_Wh2 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b2 = np.zeros(4 * H).astype('f')
        affine_b = np.zeros(V).astype('f')

        self.layers = [
            TimeEmbedding(embed_W),
            TimeDropout(dropout_ratio),
            TimeLSTM(lstm_Wx1, lstm_Wh1, lstm_b1, stateful=True),
            TimeDropout(dropout_ratio),
            TimeLSTM(lstm_Wx2, lstm_Wh2, lstm_b2, stateful=True),
            TimeDropout(dropout_ratio),
            TimeAffine(embed_W.T, affine_b)  # weight tying!!
        ]
        self.loss_layer = TimeSoftmaxWithLoss()
        self.lstm_layers = [self.layers[2], self.layers[4]]
        self.drop_layers = [self.layers[1], self.layers[3], self.layers[5]]

        self.params, self.grads = [], []
        for layer in self.layers:
            self.params += layer.params
            self.grads += layer.grads

    def predict(self, xs, train_flg=False):
        for layer in self.drop_layers:
            layer.train_flg = train_flg

        for layer in self.layers:
            xs = layer.forward(xs)
        return xs

    def forward(self, xs, ts, train_flg=True):
        score = self.predict(xs, train_flg)
        loss = self.loss_layer.forward(score, ts)
        return loss

    def backward(self, dout=1):
        dout = self.loss_layer.backward(dout)
        for layer in reversed(self.layers):
            dout = layer.backward(dout)
        return dout

    def reset_state(self):
        for layer in self.lstm_layers:
            layer.reset_state()
class BetterRnnlmGen(BetterRnnlm):
    def generate(self, start_id, skip_ids=None, sample_size=100):
        word_ids = [start_id]

        x = start_id
        while len(word_ids) < sample_size:
            x = np.array(x).reshape(1, 1)
            score = self.predict(x).flatten()
            p = softmax(score).flatten()

            sampled = np.random.choice(len(p), size=1, p=p)
            if (skip_ids is None) or (sampled not in skip_ids):
                x = sampled
                word_ids.append(int(x))

        return word_ids

    def get_state(self):
        states = []
        for layer in self.lstm_layers:
            states.append((layer.h, layer.c))
        return states

    def set_state(self, states):
        for layer, state in zip(self.lstm_layers, states):
            layer.set_state(*state)
corpus, word_to_id, id_to_word = ptb.load_data('train')
vocab_size = len(word_to_id)
corpus_size = len(corpus)

model = BetterRnnlmGen()
model.load_params('./BetterRnnlm.pkl')

# start 문자와 skip 문자 설정
start_word = 'you'
start_id = word_to_id[start_word]
skip_words = ['N', '<unk>', '$']
skip_ids = [word_to_id[w] for w in skip_words]
# 문장 생성
word_ids = model.generate(start_id, skip_ids)
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print(txt)
you have invested in.
 but to help meet the weekend 's interest-rate arrangements.
 it 's like his right to build the world for a single market value.
 cattle sales of its government units a for last year 's two category will allow the company to take a bigger role in the home increase.
 though all the elderly have in the exact line of u.s. shows unfortunately of the past year is expected to be shipping at its toledo ohio headquarters.
 the oldest brand for one of four exposures in tobacco factories has role along with

the meaning of life is 으로 문장 생성 실험

model.reset_state()

start_words = 'the meaning of life is'
start_ids = [word_to_id[w] for w in start_words.split(' ')]

for x in start_ids[:-1]:
    x = np.array(x).reshape(1, 1)
    model.predict(x)

word_ids = model.generate(start_ids[-1], skip_ids)
word_ids = start_ids[:-1] + word_ids
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print('-' * 50)
print(txt)
--------------------------------------------------
the meaning of life is into a different region.
 it 's the answer.
 trying to capture strong spirits prices were initially responsible.
 but many of the side of the domestic industry two firms expect a delay by the number of foreign companies with a minimum total of about half the estimated value of problems over april.
 in chicago digital are pursuing a joint venture with acquisitions.
 in such a sign of growing economic stability he gave the company a crash of collection choice.
 the japan market 's gyrations ending oct..
 the health care development association said it

2. seq2seq

2.1 seq2seq의 원리

Image('./deep_learning_2_images/fig 7-5.png', width=300)

png

Image('./deep_learning_2_images/fig 7-6.png', width=600)

png

Image('./deep_learning_2_images/fig 7-7.png', width=450)

png

Image('./deep_learning_2_images/fig 7-8.png', width=600)

png

Image('./deep_learning_2_images/fig 7-9.png', width=700)

png

2.2 시계열 데이터 변환용 장난감 문제

Image('./deep_learning_2_images/fig 7-10.png', width=300)

png

2.3 가변 길이 시계열 데이터

Image('./deep_learning_2_images/fig 7-11.png', width=500)

png

2.4 덧셈 데이터셋

Image('./deep_learning_2_images/fig 7-12.png', width=350)

png

  • 참고 : https://github.com/keras-team/keras/blob/2.0.0/examples/addition_rnn.py
import sys
sys.path.append('..')
from dataset import sequence


(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt', seed=1984)
char_to_id, id_to_char = sequence.get_vocab()

print(x_train.shape, t_train.shape)
print(x_test.shape, t_test.shape)

print(x_train[0])
print(t_train[0])

print(''.join([id_to_char[c] for c in x_train[0]]))
print(''.join([id_to_char[c] for c in t_train[0]]))
(45000, 7) (45000, 5)
(5000, 7) (5000, 5)
[ 3  0  2  0  0 11  5]
[ 6  0 11  7  5]
71+118 
_189 

3. seq2seq 구현

3.1 Encoder 클래스

Image('./deep_learning_2_images/fig 7-13.png', width=220)

png

Image('./deep_learning_2_images/fig 7-14.png', width=650)

png

Image('./deep_learning_2_images/fig 7-15.png', width=280)

png

Encoder 클래스

class Encoder:
    def __init__(self, vocab_size, wordvec_size, hidden_size):
        V, D, H = vocab_size, wordvec_size, hidden_size
        rn = np.random.randn

        embed_W = (rn(V, D) / 100).astype('f')
        lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
        lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b = np.zeros(4 * H).astype('f')

        self.embed = TimeEmbedding(embed_W)
        self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=False)

        self.params = self.embed.params + self.lstm.params
        self.grads = self.embed.grads + self.lstm.grads
        self.hs = None
  
    def forward(self, xs):
        xs = self.embed.forward(xs)
        hs = self.lstm.forward(xs)
        self.hs = hs
        return hs[:, -1, :]

    def backward(self, dh):
        dhs = np.zeros_like(self.hs)
        dhs[:, -1, :] = dh

        dout = self.lstm.backward(dhs)
        dout = self.embed.backward(dout)
        return dout

3.2 Decoder 클래스

Image('./deep_learning_2_images/fig 7-16.png', width=400)

png

Image('./deep_learning_2_images/fig 7-17.png', width=600)

png

Image('./deep_learning_2_images/fig 7-18.png', width=600)

png

Image('./deep_learning_2_images/fig 7-19.png', width=400)

png

Decoder 클래스

class Decoder:
    def __init__(self, vocab_size, wordvec_size, hidden_size):
        V, D, H = vocab_size, wordvec_size, hidden_size
        rn = np.random.randn

        embed_W = (rn(V, D) / 100).astype('f')
        lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
        lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b = np.zeros(4 * H).astype('f')
        affine_W = (rn(H, V) / np.sqrt(H)).astype('f')
        affine_b = np.zeros(V).astype('f')

        self.embed = TimeEmbedding(embed_W)
        self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True)
        self.affine = TimeAffine(affine_W, affine_b)

        self.params, self.grads = [], []
        for layer in (self.embed, self.lstm, self.affine):
            self.params += layer.params
            self.grads += layer.grads

    def forward(self, xs, h):
        self.lstm.set_state(h)

        out = self.embed.forward(xs) 
        out = self.lstm.forward(out)
        score = self.affine.forward(out)
        return score

    def backward(self, dscore):
        dout = self.affine.backward(dscore)
        dout = self.lstm.backward(dout)
        dout = self.embed.backward(dout)
        dh = self.lstm.dh
        return dh

    def generate(self, h, start_id, sample_size):
        sampled = []
        sample_id = start_id
        self.lstm.set_state(h)

        for _ in range(sample_size):
            x = np.array(sample_id).reshape((1, 1))
            out = self.embed.forward(x)
            out = self.lstm.forward(out)
            score = self.affine.forward(out)

            sample_id = np.argmax(score.flatten())
            sampled.append(int(sample_id))

        return sampled

3.3 Seq2seq 클래스

Seq2seq 클래스

class Seq2seq(BaseModel):
    def __init__(self, vocab_size, wordvec_size, hidden_size):
        V, D, H = vocab_size, wordvec_size, hidden_size
        self.encoder = Encoder(V, D, H)
        self.decoder = Decoder(V, D, H)
        self.softmax = TimeSoftmaxWithLoss()

        self.params = self.encoder.params + self.decoder.params
        self.grads = self.encoder.grads + self.decoder.grads

    def forward(self, xs, ts):
        decoder_xs, decoder_ts = ts[:, :-1], ts[:, 1:]

        h = self.encoder.forward(xs)
        score = self.decoder.forward(decoder_xs, h)
        loss = self.softmax.forward(score, decoder_ts)
        return loss

    def backward(self, dout=1):
        dout = self.softmax.backward(dout)
        dh = self.decoder.backward(dout)
        dout = self.encoder.backward(dh)
        return dout

    def generate(self, xs, start_id, sample_size):
        h = self.encoder.forward(xs)
        sampled = self.decoder.generate(h, start_id, sample_size)
        return sampled

3.4 seq2seq 평가

seq2seq의 학습 코드

# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq

# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()

# 입력 반전 여부 설정 =============================================
is_reverse = False  # True
if is_reverse:
    x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================

# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0

# 일반 혹은 엿보기(Peeky) 설정 =====================================
model = Seq2seq(vocab_size, wordvec_size, hidden_size)
# model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)

acc_list = []
for epoch in range(max_epoch):
    trainer.fit(x_train, t_train, max_epoch=1,
                batch_size=batch_size, max_grad=max_grad)

    correct_num = 0
    for i in range(len(x_test)):
        question, correct = x_test[[i]], t_test[[i]]
        verbose = i < 10
        correct_num += eval_seq2seq(model, question, correct,
                                    id_to_char, verbose, is_reverse)

    acc = float(correct_num) / len(x_test)
    acc_list.append(acc)
    print('검증 정확도 %.3f%%' % (acc * 100))

| 에폭 1 |  반복 1 / 351 | 시간 0[s] | 손실 2.56
| 에폭 1 |  반복 21 / 351 | 시간 0[s] | 손실 2.53
| 에폭 1 |  반복 41 / 351 | 시간 1[s] | 손실 2.17
| 에폭 1 |  반복 61 / 351 | 시간 1[s] | 손실 1.96
| 에폭 1 |  반복 81 / 351 | 시간 2[s] | 손실 1.92
| 에폭 1 |  반복 101 / 351 | 시간 3[s] | 손실 1.87
| 에폭 1 |  반복 121 / 351 | 시간 3[s] | 손실 1.85
| 에폭 1 |  반복 141 / 351 | 시간 4[s] | 손실 1.83
| 에폭 1 |  반복 161 / 351 | 시간 5[s] | 손실 1.79
| 에폭 1 |  반복 181 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 |  반복 201 / 351 | 시간 6[s] | 손실 1.77
| 에폭 1 |  반복 221 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 |  반복 241 / 351 | 시간 7[s] | 손실 1.76
| 에폭 1 |  반복 261 / 351 | 시간 8[s] | 손실 1.76
| 에폭 1 |  반복 281 / 351 | 시간 8[s] | 손실 1.75
| 에폭 1 |  반복 301 / 351 | 시간 9[s] | 손실 1.74
| 에폭 1 |  반복 321 / 351 | 시간 9[s] | 손실 1.75
| 에폭 1 |  반복 341 / 351 | 시간 10[s] | 손실 1.74
Q 77+85  
T 162 
X 100 
---
Q 975+164
T 1139
X 1000
---
Q 582+84 
T 666 
X 1000
---
Q 8+155  
T 163 
X 100 
---
Q 367+55 
T 422 
X 1000
---
Q 600+257
T 857 
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1000
---
Q 26+838 
T 864 
X 1000
---
Q 143+93 
T 236 
X 100 
---
검증 정확도 0.180%
| 에폭 2 |  반복 1 / 351 | 시간 0[s] | 손실 1.74
| 에폭 2 |  반복 21 / 351 | 시간 0[s] | 손실 1.73
| 에폭 2 |  반복 41 / 351 | 시간 1[s] | 손실 1.74
| 에폭 2 |  반복 61 / 351 | 시간 2[s] | 손실 1.74
| 에폭 2 |  반복 81 / 351 | 시간 2[s] | 손실 1.73
| 에폭 2 |  반복 101 / 351 | 시간 3[s] | 손실 1.73
| 에폭 2 |  반복 121 / 351 | 시간 3[s] | 손실 1.72
| 에폭 2 |  반복 141 / 351 | 시간 4[s] | 손실 1.71
| 에폭 2 |  반복 161 / 351 | 시간 5[s] | 손실 1.71
| 에폭 2 |  반복 181 / 351 | 시간 5[s] | 손실 1.71
| 에폭 2 |  반복 201 / 351 | 시간 6[s] | 손실 1.70
| 에폭 2 |  반복 221 / 351 | 시간 7[s] | 손실 1.71
| 에폭 2 |  반복 241 / 351 | 시간 7[s] | 손실 1.70
| 에폭 2 |  반복 261 / 351 | 시간 8[s] | 손실 1.69
| 에폭 2 |  반복 281 / 351 | 시간 9[s] | 손실 1.69
| 에폭 2 |  반복 301 / 351 | 시간 9[s] | 손실 1.69
| 에폭 2 |  반복 321 / 351 | 시간 10[s] | 손실 1.68
| 에폭 2 |  반복 341 / 351 | 시간 10[s] | 손실 1.67
Q 77+85  
T 162 
X 994 
---
Q 975+164
T 1139
X 1000
---
Q 582+84 
T 666 
X 700 
---
Q 8+155  
T 163 
X 100 
---
Q 367+55 
T 422 
X 400 
---
Q 600+257
T 857 
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1544
---
Q 26+838 
T 864 
X 400 
---
Q 143+93 
T 236 
X 400 
---
검증 정확도 0.220%
| 에폭 3 |  반복 1 / 351 | 시간 0[s] | 손실 1.66
| 에폭 3 |  반복 21 / 351 | 시간 0[s] | 손실 1.66
| 에폭 3 |  반복 41 / 351 | 시간 1[s] | 손실 1.65
| 에폭 3 |  반복 61 / 351 | 시간 1[s] | 손실 1.63
| 에폭 3 |  반복 81 / 351 | 시간 2[s] | 손실 1.62
| 에폭 3 |  반복 101 / 351 | 시간 2[s] | 손실 1.62
| 에폭 3 |  반복 121 / 351 | 시간 3[s] | 손실 1.60
| 에폭 3 |  반복 141 / 351 | 시간 4[s] | 손실 1.59
| 에폭 3 |  반복 161 / 351 | 시간 4[s] | 손실 1.57
| 에폭 3 |  반복 181 / 351 | 시간 5[s] | 손실 1.57
| 에폭 3 |  반복 201 / 351 | 시간 6[s] | 손실 1.56
| 에폭 3 |  반복 221 / 351 | 시간 6[s] | 손실 1.54
| 에폭 3 |  반복 241 / 351 | 시간 7[s] | 손실 1.52
| 에폭 3 |  반복 261 / 351 | 시간 7[s] | 손실 1.52
| 에폭 3 |  반복 281 / 351 | 시간 8[s] | 손실 1.52
| 에폭 3 |  반복 301 / 351 | 시간 9[s] | 손실 1.50
| 에폭 3 |  반복 321 / 351 | 시간 9[s] | 손실 1.49
| 에폭 3 |  반복 341 / 351 | 시간 10[s] | 손실 1.48
Q 77+85  
T 162 
X 108 
---
Q 975+164
T 1139
X 1001
---
Q 582+84 
T 666 
X 648 
---
Q 8+155  
T 163 
X 138 
---
Q 367+55 
T 422 
X 448 
---
Q 600+257
T 857 
X 848 
---
Q 761+292
T 1053
X 1011
---
Q 830+597
T 1427
X 1373
---
Q 26+838 
T 864 
X 868 
---
Q 143+93 
T 236 
X 348 
---
검증 정확도 0.560%
| 에폭 4 |  반복 1 / 351 | 시간 0[s] | 손실 1.47
| 에폭 4 |  반복 21 / 351 | 시간 0[s] | 손실 1.46
| 에폭 4 |  반복 41 / 351 | 시간 1[s] | 손실 1.44
| 에폭 4 |  반복 61 / 351 | 시간 1[s] | 손실 1.43
| 에폭 4 |  반복 81 / 351 | 시간 2[s] | 손실 1.42
| 에폭 4 |  반복 101 / 351 | 시간 3[s] | 손실 1.41
| 에폭 4 |  반복 121 / 351 | 시간 3[s] | 손실 1.40
| 에폭 4 |  반복 141 / 351 | 시간 4[s] | 손실 1.40
| 에폭 4 |  반복 161 / 351 | 시간 5[s] | 손실 1.38
| 에폭 4 |  반복 181 / 351 | 시간 5[s] | 손실 1.38
| 에폭 4 |  반복 201 / 351 | 시간 6[s] | 손실 1.37
| 에폭 4 |  반복 221 / 351 | 시간 7[s] | 손실 1.35
| 에폭 4 |  반복 241 / 351 | 시간 7[s] | 손실 1.33
| 에폭 4 |  반복 261 / 351 | 시간 8[s] | 손실 1.33
| 에폭 4 |  반복 281 / 351 | 시간 9[s] | 손실 1.33
| 에폭 4 |  반복 301 / 351 | 시간 9[s] | 손실 1.32
| 에폭 4 |  반복 321 / 351 | 시간 10[s] | 손실 1.31
| 에폭 4 |  반복 341 / 351 | 시간 11[s] | 손실 1.30
Q 77+85  
T 162 
X 146 
---
Q 975+164
T 1139
X 1189
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 432 
---
Q 600+257
T 857 
X 866 
---
Q 761+292
T 1053
X 1002
---
Q 830+597
T 1427
X 1406
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
X 202 
---
검증 정확도 1.060%
| 에폭 5 |  반복 1 / 351 | 시간 0[s] | 손실 1.28
| 에폭 5 |  반복 21 / 351 | 시간 0[s] | 손실 1.29
| 에폭 5 |  반복 41 / 351 | 시간 1[s] | 손실 1.28
| 에폭 5 |  반복 61 / 351 | 시간 1[s] | 손실 1.27
| 에폭 5 |  반복 81 / 351 | 시간 2[s] | 손실 1.27
| 에폭 5 |  반복 101 / 351 | 시간 3[s] | 손실 1.26
| 에폭 5 |  반복 121 / 351 | 시간 4[s] | 손실 1.26
| 에폭 5 |  반복 141 / 351 | 시간 4[s] | 손실 1.27
| 에폭 5 |  반복 161 / 351 | 시간 5[s] | 손실 1.26
| 에폭 5 |  반복 181 / 351 | 시간 5[s] | 손실 1.25
| 에폭 5 |  반복 201 / 351 | 시간 6[s] | 손실 1.23
| 에폭 5 |  반복 221 / 351 | 시간 7[s] | 손실 1.22
| 에폭 5 |  반복 241 / 351 | 시간 7[s] | 손실 1.21
| 에폭 5 |  반복 261 / 351 | 시간 8[s] | 손실 1.21
| 에폭 5 |  반복 281 / 351 | 시간 9[s] | 손실 1.21
| 에폭 5 |  반복 301 / 351 | 시간 9[s] | 손실 1.20
| 에폭 5 |  반복 321 / 351 | 시간 10[s] | 손실 1.19
| 에폭 5 |  반복 341 / 351 | 시간 11[s] | 손실 1.18
Q 77+85  
T 162 
X 145 
---
Q 975+164
T 1139
X 1168
---
Q 582+84 
T 666 
X 665 
---
Q 8+155  
T 163 
X 192 
---
Q 367+55 
T 422 
X 431 
---
Q 600+257
T 857 
X 895 
---
Q 761+292
T 1053
X 1015
---
Q 830+597
T 1427
X 1493
---
Q 26+838 
T 864 
X 891 
---
Q 143+93 
T 236 
X 221 
---
검증 정확도 2.260%
| 에폭 6 |  반복 1 / 351 | 시간 0[s] | 손실 1.17
| 에폭 6 |  반복 21 / 351 | 시간 0[s] | 손실 1.17
| 에폭 6 |  반복 41 / 351 | 시간 1[s] | 손실 1.18
| 에폭 6 |  반복 61 / 351 | 시간 1[s] | 손실 1.17
| 에폭 6 |  반복 81 / 351 | 시간 2[s] | 손실 1.16
| 에폭 6 |  반복 101 / 351 | 시간 3[s] | 손실 1.16
| 에폭 6 |  반복 121 / 351 | 시간 3[s] | 손실 1.16
| 에폭 6 |  반복 141 / 351 | 시간 4[s] | 손실 1.14
| 에폭 6 |  반복 161 / 351 | 시간 5[s] | 손실 1.14
| 에폭 6 |  반복 181 / 351 | 시간 5[s] | 손실 1.13
| 에폭 6 |  반복 201 / 351 | 시간 6[s] | 손실 1.15
| 에폭 6 |  반복 221 / 351 | 시간 7[s] | 손실 1.13
| 에폭 6 |  반복 241 / 351 | 시간 7[s] | 손실 1.13
| 에폭 6 |  반복 261 / 351 | 시간 8[s] | 손실 1.13
| 에폭 6 |  반복 281 / 351 | 시간 9[s] | 손실 1.17
| 에폭 6 |  반복 301 / 351 | 시간 9[s] | 손실 1.12
| 에폭 6 |  반복 321 / 351 | 시간 10[s] | 손실 1.10
| 에폭 6 |  반복 341 / 351 | 시간 11[s] | 손실 1.10
Q 77+85  
T 162 
X 166 
---
Q 975+164
T 1139
X 1160
---
Q 582+84 
T 666 
X 660 
---
Q 8+155  
T 163 
X 164 
---
Q 367+55 
T 422 
X 412 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1011
---
Q 830+597
T 1427
X 1412
---
Q 26+838 
T 864 
X 821 
---
Q 143+93 
T 236 
X 207 
---
검증 정확도 1.800%
| 에폭 7 |  반복 1 / 351 | 시간 0[s] | 손실 1.13
| 에폭 7 |  반복 21 / 351 | 시간 0[s] | 손실 1.09
| 에폭 7 |  반복 41 / 351 | 시간 1[s] | 손실 1.09
| 에폭 7 |  반복 61 / 351 | 시간 1[s] | 손실 1.11
| 에폭 7 |  반복 81 / 351 | 시간 2[s] | 손실 1.12
| 에폭 7 |  반복 101 / 351 | 시간 3[s] | 손실 1.10
| 에폭 7 |  반복 121 / 351 | 시간 3[s] | 손실 1.09
| 에폭 7 |  반복 141 / 351 | 시간 4[s] | 손실 1.09
| 에폭 7 |  반복 161 / 351 | 시간 5[s] | 손실 1.07
| 에폭 7 |  반복 181 / 351 | 시간 5[s] | 손실 1.07
| 에폭 7 |  반복 201 / 351 | 시간 6[s] | 손실 1.06
| 에폭 7 |  반복 221 / 351 | 시간 7[s] | 손실 1.08
| 에폭 7 |  반복 241 / 351 | 시간 7[s] | 손실 1.06
| 에폭 7 |  반복 261 / 351 | 시간 8[s] | 손실 1.07
| 에폭 7 |  반복 281 / 351 | 시간 9[s] | 손실 1.06
| 에폭 7 |  반복 301 / 351 | 시간 9[s] | 손실 1.09
| 에폭 7 |  반복 321 / 351 | 시간 10[s] | 손실 1.09
| 에폭 7 |  반복 341 / 351 | 시간 11[s] | 손실 1.08
Q 77+85  
T 162 
X 156 
---
Q 975+164
T 1139
X 1166
---
Q 582+84 
T 666 
X 665 
---
Q 8+155  
T 163 
X 148 
---
Q 367+55 
T 422 
X 412 
---
Q 600+257
T 857 
X 893 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1441
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 227 
---
검증 정확도 3.700%
| 에폭 8 |  반복 1 / 351 | 시간 0[s] | 손실 1.05
| 에폭 8 |  반복 21 / 351 | 시간 0[s] | 손실 1.04
| 에폭 8 |  반복 41 / 351 | 시간 1[s] | 손실 1.05
| 에폭 8 |  반복 61 / 351 | 시간 1[s] | 손실 1.04
| 에폭 8 |  반복 81 / 351 | 시간 2[s] | 손실 1.03
| 에폭 8 |  반복 101 / 351 | 시간 3[s] | 손실 1.05
| 에폭 8 |  반복 121 / 351 | 시간 3[s] | 손실 1.05
| 에폭 8 |  반복 141 / 351 | 시간 4[s] | 손실 1.03
| 에폭 8 |  반복 161 / 351 | 시간 5[s] | 손실 1.04
| 에폭 8 |  반복 181 / 351 | 시간 5[s] | 손실 1.02
| 에폭 8 |  반복 201 / 351 | 시간 6[s] | 손실 1.03
| 에폭 8 |  반복 221 / 351 | 시간 6[s] | 손실 1.04
| 에폭 8 |  반복 241 / 351 | 시간 7[s] | 손실 1.02
| 에폭 8 |  반복 261 / 351 | 시간 8[s] | 손실 1.02
| 에폭 8 |  반복 281 / 351 | 시간 8[s] | 손실 1.02
| 에폭 8 |  반복 301 / 351 | 시간 9[s] | 손실 1.02
| 에폭 8 |  반복 321 / 351 | 시간 9[s] | 손실 1.01
| 에폭 8 |  반복 341 / 351 | 시간 10[s] | 손실 1.00
Q 77+85  
T 162 
X 164 
---
Q 975+164
T 1139
X 1160
---
Q 582+84 
T 666 
X 671 
---
Q 8+155  
T 163 
X 164 
---
Q 367+55 
T 422 
X 433 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1449
---
Q 26+838 
T 864 
X 871 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 3.700%
| 에폭 9 |  반복 1 / 351 | 시간 0[s] | 손실 1.02
| 에폭 9 |  반복 21 / 351 | 시간 0[s] | 손실 1.01
| 에폭 9 |  반복 41 / 351 | 시간 1[s] | 손실 1.01
| 에폭 9 |  반복 61 / 351 | 시간 1[s] | 손실 0.99
| 에폭 9 |  반복 81 / 351 | 시간 2[s] | 손실 0.99
| 에폭 9 |  반복 101 / 351 | 시간 2[s] | 손실 1.00
| 에폭 9 |  반복 121 / 351 | 시간 3[s] | 손실 1.00
| 에폭 9 |  반복 141 / 351 | 시간 4[s] | 손실 0.99
| 에폭 9 |  반복 161 / 351 | 시간 5[s] | 손실 0.99
| 에폭 9 |  반복 181 / 351 | 시간 5[s] | 손실 0.99
| 에폭 9 |  반복 201 / 351 | 시간 6[s] | 손실 0.98
| 에폭 9 |  반복 221 / 351 | 시간 6[s] | 손실 0.98
| 에폭 9 |  반복 241 / 351 | 시간 7[s] | 손실 0.99
| 에폭 9 |  반복 261 / 351 | 시간 8[s] | 손실 0.99
| 에폭 9 |  반복 281 / 351 | 시간 8[s] | 손실 0.98
| 에폭 9 |  반복 301 / 351 | 시간 9[s] | 손실 0.98
| 에폭 9 |  반복 321 / 351 | 시간 10[s] | 손실 0.97
| 에폭 9 |  반복 341 / 351 | 시간 10[s] | 손실 0.97
Q 77+85  
T 162 
X 167 
---
Q 975+164
T 1139
X 1123
---
Q 582+84 
T 666 
X 677 
---
Q 8+155  
T 163 
X 172 
---
Q 367+55 
T 422 
X 418 
---
Q 600+257
T 857 
X 872 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1429
---
Q 26+838 
T 864 
X 870 
---
Q 143+93 
T 236 
X 228 
---
검증 정확도 4.320%
| 에폭 10 |  반복 1 / 351 | 시간 0[s] | 손실 0.95
| 에폭 10 |  반복 21 / 351 | 시간 0[s] | 손실 0.96
| 에폭 10 |  반복 41 / 351 | 시간 1[s] | 손실 0.96
| 에폭 10 |  반복 61 / 351 | 시간 1[s] | 손실 0.97
| 에폭 10 |  반복 81 / 351 | 시간 2[s] | 손실 1.00
| 에폭 10 |  반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 10 |  반복 121 / 351 | 시간 3[s] | 손실 0.97
| 에폭 10 |  반복 141 / 351 | 시간 4[s] | 손실 0.97
| 에폭 10 |  반복 161 / 351 | 시간 4[s] | 손실 1.00
| 에폭 10 |  반복 181 / 351 | 시간 5[s] | 손실 0.98
| 에폭 10 |  반복 201 / 351 | 시간 6[s] | 손실 1.00
| 에폭 10 |  반복 221 / 351 | 시간 6[s] | 손실 0.98
| 에폭 10 |  반복 241 / 351 | 시간 7[s] | 손실 0.98
| 에폭 10 |  반복 261 / 351 | 시간 7[s] | 손실 0.98
| 에폭 10 |  반복 281 / 351 | 시간 8[s] | 손실 0.97
| 에폭 10 |  반복 301 / 351 | 시간 9[s] | 손실 0.95
| 에폭 10 |  반복 321 / 351 | 시간 9[s] | 손실 0.94
| 에폭 10 |  반복 341 / 351 | 시간 10[s] | 손실 0.94
Q 77+85  
T 162 
X 157 
---
Q 975+164
T 1139
X 1109
---
Q 582+84 
T 666 
X 660 
---
Q 8+155  
T 163 
X 160 
---
Q 367+55 
T 422 
X 409 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1009
---
Q 830+597
T 1427
X 1404
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 3.380%
| 에폭 11 |  반복 1 / 351 | 시간 0[s] | 손실 0.99
| 에폭 11 |  반복 21 / 351 | 시간 0[s] | 손실 0.96
| 에폭 11 |  반복 41 / 351 | 시간 1[s] | 손실 0.95
| 에폭 11 |  반복 61 / 351 | 시간 1[s] | 손실 0.95
| 에폭 11 |  반복 81 / 351 | 시간 2[s] | 손실 0.95
| 에폭 11 |  반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 11 |  반복 121 / 351 | 시간 3[s] | 손실 0.97
| 에폭 11 |  반복 141 / 351 | 시간 4[s] | 손실 0.94
| 에폭 11 |  반복 161 / 351 | 시간 5[s] | 손실 0.94
| 에폭 11 |  반복 181 / 351 | 시간 5[s] | 손실 0.97
| 에폭 11 |  반복 201 / 351 | 시간 6[s] | 손실 0.94
| 에폭 11 |  반복 221 / 351 | 시간 6[s] | 손실 0.94
| 에폭 11 |  반복 241 / 351 | 시간 7[s] | 손실 0.93
| 에폭 11 |  반복 261 / 351 | 시간 8[s] | 손실 0.95
| 에폭 11 |  반복 281 / 351 | 시간 9[s] | 손실 0.93
| 에폭 11 |  반복 301 / 351 | 시간 9[s] | 손실 0.93
| 에폭 11 |  반복 321 / 351 | 시간 10[s] | 손실 0.93
| 에폭 11 |  반복 341 / 351 | 시간 11[s] | 손실 0.94
Q 77+85  
T 162 
X 160 
---
Q 975+164
T 1139
X 1121
---
Q 582+84 
T 666 
X 668 
---
Q 8+155  
T 163 
X 172 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1461
---
Q 26+838 
T 864 
X 871 
---
Q 143+93 
T 236 
X 242 
---
검증 정확도 5.560%
| 에폭 12 |  반복 1 / 351 | 시간 0[s] | 손실 0.96
| 에폭 12 |  반복 21 / 351 | 시간 0[s] | 손실 0.93
| 에폭 12 |  반복 41 / 351 | 시간 1[s] | 손실 0.93
| 에폭 12 |  반복 61 / 351 | 시간 1[s] | 손실 0.93
| 에폭 12 |  반복 81 / 351 | 시간 2[s] | 손실 0.93
| 에폭 12 |  반복 101 / 351 | 시간 3[s] | 손실 0.94
| 에폭 12 |  반복 121 / 351 | 시간 3[s] | 손실 0.96
| 에폭 12 |  반복 141 / 351 | 시간 4[s] | 손실 0.95
| 에폭 12 |  반복 161 / 351 | 시간 4[s] | 손실 0.95
| 에폭 12 |  반복 181 / 351 | 시간 5[s] | 손실 0.93
| 에폭 12 |  반복 201 / 351 | 시간 5[s] | 손실 0.94
| 에폭 12 |  반복 221 / 351 | 시간 6[s] | 손실 0.94
| 에폭 12 |  반복 241 / 351 | 시간 7[s] | 손실 0.94
| 에폭 12 |  반복 261 / 351 | 시간 7[s] | 손실 0.91
| 에폭 12 |  반복 281 / 351 | 시간 8[s] | 손실 0.92
| 에폭 12 |  반복 301 / 351 | 시간 8[s] | 손실 0.91
| 에폭 12 |  반복 321 / 351 | 시간 9[s] | 손실 0.95
| 에폭 12 |  반복 341 / 351 | 시간 10[s] | 손실 0.95
Q 77+85  
T 162 
X 158 
---
Q 975+164
T 1139
X 1129
---
Q 582+84 
T 666 
X 661 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 849 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1404
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 228 
---
검증 정확도 6.760%
| 에폭 13 |  반복 1 / 351 | 시간 0[s] | 손실 0.89
| 에폭 13 |  반복 21 / 351 | 시간 0[s] | 손실 0.90
| 에폭 13 |  반복 41 / 351 | 시간 1[s] | 손실 0.90
| 에폭 13 |  반복 61 / 351 | 시간 1[s] | 손실 0.92
| 에폭 13 |  반복 81 / 351 | 시간 2[s] | 손실 1.01
| 에폭 13 |  반복 101 / 351 | 시간 3[s] | 손실 0.90
| 에폭 13 |  반복 121 / 351 | 시간 3[s] | 손실 0.90
| 에폭 13 |  반복 141 / 351 | 시간 4[s] | 손실 0.90
| 에폭 13 |  반복 161 / 351 | 시간 4[s] | 손실 0.90
| 에폭 13 |  반복 181 / 351 | 시간 5[s] | 손실 0.90
| 에폭 13 |  반복 201 / 351 | 시간 6[s] | 손실 0.92
| 에폭 13 |  반복 221 / 351 | 시간 6[s] | 손실 0.93
| 에폭 13 |  반복 241 / 351 | 시간 7[s] | 손실 0.94
| 에폭 13 |  반복 261 / 351 | 시간 7[s] | 손실 0.90
| 에폭 13 |  반복 281 / 351 | 시간 8[s] | 손실 0.93
| 에폭 13 |  반복 301 / 351 | 시간 8[s] | 손실 0.90
| 에폭 13 |  반복 321 / 351 | 시간 9[s] | 손실 0.92
| 에폭 13 |  반복 341 / 351 | 시간 9[s] | 손실 0.88
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
X 1121
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
X 164 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1400
---
Q 26+838 
T 864 
X 867 
---
Q 143+93 
T 236 
X 242 
---
검증 정확도 7.820%
| 에폭 14 |  반복 1 / 351 | 시간 0[s] | 손실 0.91
| 에폭 14 |  반복 21 / 351 | 시간 0[s] | 손실 0.88
| 에폭 14 |  반복 41 / 351 | 시간 1[s] | 손실 0.89
| 에폭 14 |  반복 61 / 351 | 시간 1[s] | 손실 0.88
| 에폭 14 |  반복 81 / 351 | 시간 2[s] | 손실 0.89
| 에폭 14 |  반복 101 / 351 | 시간 3[s] | 손실 0.89
| 에폭 14 |  반복 121 / 351 | 시간 3[s] | 손실 0.88
| 에폭 14 |  반복 141 / 351 | 시간 4[s] | 손실 0.88
| 에폭 14 |  반복 161 / 351 | 시간 4[s] | 손실 0.88
| 에폭 14 |  반복 181 / 351 | 시간 5[s] | 손실 0.91
| 에폭 14 |  반복 201 / 351 | 시간 6[s] | 손실 0.93
| 에폭 14 |  반복 221 / 351 | 시간 6[s] | 손실 0.90
| 에폭 14 |  반복 241 / 351 | 시간 7[s] | 손실 0.92
| 에폭 14 |  반복 261 / 351 | 시간 7[s] | 손실 0.93
| 에폭 14 |  반복 281 / 351 | 시간 8[s] | 손실 0.88
| 에폭 14 |  반복 301 / 351 | 시간 9[s] | 손실 0.87
| 에폭 14 |  반복 321 / 351 | 시간 9[s] | 손실 0.88
| 에폭 14 |  반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85  
T 162 
X 160 
---
Q 975+164
T 1139
X 1160
---
Q 582+84 
T 666 
X 655 
---
Q 8+155  
T 163 
X 171 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1418
---
Q 26+838 
T 864 
X 858 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 6.580%
| 에폭 15 |  반복 1 / 351 | 시간 0[s] | 손실 0.84
| 에폭 15 |  반복 21 / 351 | 시간 0[s] | 손실 0.86
| 에폭 15 |  반복 41 / 351 | 시간 1[s] | 손실 0.89
| 에폭 15 |  반복 61 / 351 | 시간 1[s] | 손실 0.92
| 에폭 15 |  반복 81 / 351 | 시간 2[s] | 손실 0.87
| 에폭 15 |  반복 101 / 351 | 시간 2[s] | 손실 0.87
| 에폭 15 |  반복 121 / 351 | 시간 3[s] | 손실 0.86
| 에폭 15 |  반복 141 / 351 | 시간 4[s] | 손실 0.87
| 에폭 15 |  반복 161 / 351 | 시간 4[s] | 손실 0.86
| 에폭 15 |  반복 181 / 351 | 시간 5[s] | 손실 0.87
| 에폭 15 |  반복 201 / 351 | 시간 5[s] | 손실 0.87
| 에폭 15 |  반복 221 / 351 | 시간 6[s] | 손실 0.88
| 에폭 15 |  반복 241 / 351 | 시간 7[s] | 손실 0.87
| 에폭 15 |  반복 261 / 351 | 시간 7[s] | 손실 0.87
| 에폭 15 |  반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 15 |  반복 301 / 351 | 시간 8[s] | 손실 0.91
| 에폭 15 |  반복 321 / 351 | 시간 9[s] | 손실 0.88
| 에폭 15 |  반복 341 / 351 | 시간 10[s] | 손실 0.86
Q 77+85  
T 162 
X 164 
---
Q 975+164
T 1139
X 1138
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 172 
---
Q 367+55 
T 422 
X 424 
---
Q 600+257
T 857 
X 862 
---
Q 761+292
T 1053
X 1063
---
Q 830+597
T 1427
X 1446
---
Q 26+838 
T 864 
X 868 
---
Q 143+93 
T 236 
X 242 
---
검증 정확도 7.340%
| 에폭 16 |  반복 1 / 351 | 시간 0[s] | 손실 0.85
| 에폭 16 |  반복 21 / 351 | 시간 0[s] | 손실 0.87
| 에폭 16 |  반복 41 / 351 | 시간 1[s] | 손실 0.86
| 에폭 16 |  반복 61 / 351 | 시간 1[s] | 손실 0.86
| 에폭 16 |  반복 81 / 351 | 시간 2[s] | 손실 0.88
| 에폭 16 |  반복 101 / 351 | 시간 2[s] | 손실 0.87
| 에폭 16 |  반복 121 / 351 | 시간 3[s] | 손실 0.89
| 에폭 16 |  반복 141 / 351 | 시간 4[s] | 손실 0.88
| 에폭 16 |  반복 161 / 351 | 시간 5[s] | 손실 0.88
| 에폭 16 |  반복 181 / 351 | 시간 5[s] | 손실 0.86
| 에폭 16 |  반복 201 / 351 | 시간 6[s] | 손실 0.84
| 에폭 16 |  반복 221 / 351 | 시간 7[s] | 손실 0.86
| 에폭 16 |  반복 241 / 351 | 시간 7[s] | 손실 0.88
| 에폭 16 |  반복 261 / 351 | 시간 8[s] | 손실 0.88
| 에폭 16 |  반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 16 |  반복 301 / 351 | 시간 9[s] | 손실 0.87
| 에폭 16 |  반복 321 / 351 | 시간 10[s] | 손실 0.87
| 에폭 16 |  반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85  
T 162 
X 160 
---
Q 975+164
T 1139
X 1136
---
Q 582+84 
T 666 
X 662 
---
Q 8+155  
T 163 
X 172 
---
Q 367+55 
T 422 
X 412 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1420
---
Q 26+838 
T 864 
X 859 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 6.700%
| 에폭 17 |  반복 1 / 351 | 시간 0[s] | 손실 0.84
| 에폭 17 |  반복 21 / 351 | 시간 0[s] | 손실 0.85
| 에폭 17 |  반복 41 / 351 | 시간 1[s] | 손실 0.87
| 에폭 17 |  반복 61 / 351 | 시간 1[s] | 손실 0.85
| 에폭 17 |  반복 81 / 351 | 시간 2[s] | 손실 0.86
| 에폭 17 |  반복 101 / 351 | 시간 3[s] | 손실 0.86
| 에폭 17 |  반복 121 / 351 | 시간 3[s] | 손실 0.87
| 에폭 17 |  반복 141 / 351 | 시간 4[s] | 손실 0.85
| 에폭 17 |  반복 161 / 351 | 시간 4[s] | 손실 0.87
| 에폭 17 |  반복 181 / 351 | 시간 5[s] | 손실 0.87
| 에폭 17 |  반복 201 / 351 | 시간 6[s] | 손실 0.85
| 에폭 17 |  반복 221 / 351 | 시간 6[s] | 손실 0.84
| 에폭 17 |  반복 241 / 351 | 시간 7[s] | 손실 0.84
| 에폭 17 |  반복 261 / 351 | 시간 8[s] | 손실 0.85
| 에폭 17 |  반복 281 / 351 | 시간 8[s] | 손실 0.86
| 에폭 17 |  반복 301 / 351 | 시간 9[s] | 손실 0.83
| 에폭 17 |  반복 321 / 351 | 시간 9[s] | 손실 0.86
| 에폭 17 |  반복 341 / 351 | 시간 10[s] | 손실 0.83
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1128
---
Q 582+84 
T 666 
X 659 
---
Q 8+155  
T 163 
X 157 
---
Q 367+55 
T 422 
X 417 
---
Q 600+257
T 857 
X 849 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1414
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 229 
---
검증 정확도 7.340%
| 에폭 18 |  반복 1 / 351 | 시간 0[s] | 손실 0.85
| 에폭 18 |  반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 18 |  반복 41 / 351 | 시간 1[s] | 손실 0.85
| 에폭 18 |  반복 61 / 351 | 시간 1[s] | 손실 0.82
| 에폭 18 |  반복 81 / 351 | 시간 2[s] | 손실 0.83
| 에폭 18 |  반복 101 / 351 | 시간 3[s] | 손실 0.84
| 에폭 18 |  반복 121 / 351 | 시간 3[s] | 손실 0.86
| 에폭 18 |  반복 141 / 351 | 시간 4[s] | 손실 0.91
| 에폭 18 |  반복 161 / 351 | 시간 5[s] | 손실 0.87
| 에폭 18 |  반복 181 / 351 | 시간 5[s] | 손실 0.85
| 에폭 18 |  반복 201 / 351 | 시간 6[s] | 손실 0.86
| 에폭 18 |  반복 221 / 351 | 시간 7[s] | 손실 0.82
| 에폭 18 |  반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 18 |  반복 261 / 351 | 시간 8[s] | 손실 0.84
| 에폭 18 |  반복 281 / 351 | 시간 8[s] | 손실 0.83
| 에폭 18 |  반복 301 / 351 | 시간 9[s] | 손실 0.86
| 에폭 18 |  반복 321 / 351 | 시간 10[s] | 손실 0.84
| 에폭 18 |  반복 341 / 351 | 시간 10[s] | 손실 0.86
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1131
---
Q 582+84 
T 666 
X 659 
---
Q 8+155  
T 163 
X 172 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1414
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 8.560%
| 에폭 19 |  반복 1 / 351 | 시간 0[s] | 손실 0.82
| 에폭 19 |  반복 21 / 351 | 시간 0[s] | 손실 0.85
| 에폭 19 |  반복 41 / 351 | 시간 1[s] | 손실 0.84
| 에폭 19 |  반복 61 / 351 | 시간 1[s] | 손실 0.85
| 에폭 19 |  반복 81 / 351 | 시간 2[s] | 손실 0.84
| 에폭 19 |  반복 101 / 351 | 시간 3[s] | 손실 0.82
| 에폭 19 |  반복 121 / 351 | 시간 3[s] | 손실 0.82
| 에폭 19 |  반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 19 |  반복 161 / 351 | 시간 4[s] | 손실 0.84
| 에폭 19 |  반복 181 / 351 | 시간 5[s] | 손실 0.83
| 에폭 19 |  반복 201 / 351 | 시간 6[s] | 손실 0.85
| 에폭 19 |  반복 221 / 351 | 시간 6[s] | 손실 0.83
| 에폭 19 |  반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 19 |  반복 261 / 351 | 시간 7[s] | 손실 0.82
| 에폭 19 |  반복 281 / 351 | 시간 8[s] | 손실 0.86
| 에폭 19 |  반복 301 / 351 | 시간 8[s] | 손실 0.83
| 에폭 19 |  반복 321 / 351 | 시간 9[s] | 손실 0.85
| 에폭 19 |  반복 341 / 351 | 시간 9[s] | 손실 0.83
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1127
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
X 167 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 9.800%
| 에폭 20 |  반복 1 / 351 | 시간 0[s] | 손실 0.79
| 에폭 20 |  반복 21 / 351 | 시간 0[s] | 손실 0.83
| 에폭 20 |  반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 20 |  반복 61 / 351 | 시간 1[s] | 손실 0.81
| 에폭 20 |  반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 20 |  반복 101 / 351 | 시간 3[s] | 손실 0.86
| 에폭 20 |  반복 121 / 351 | 시간 3[s] | 손실 0.85
| 에폭 20 |  반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 20 |  반복 161 / 351 | 시간 4[s] | 손실 0.83
| 에폭 20 |  반복 181 / 351 | 시간 5[s] | 손실 0.86
| 에폭 20 |  반복 201 / 351 | 시간 6[s] | 손실 0.84
| 에폭 20 |  반복 221 / 351 | 시간 6[s] | 손실 0.81
| 에폭 20 |  반복 241 / 351 | 시간 7[s] | 손실 0.81
| 에폭 20 |  반복 261 / 351 | 시간 7[s] | 손실 0.82
| 에폭 20 |  반복 281 / 351 | 시간 8[s] | 손실 0.79
| 에폭 20 |  반복 301 / 351 | 시간 9[s] | 손실 0.80
| 에폭 20 |  반복 321 / 351 | 시간 9[s] | 손실 0.81
| 에폭 20 |  반복 341 / 351 | 시간 10[s] | 손실 0.85
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1127
---
Q 582+84 
T 666 
X 655 
---
Q 8+155  
T 163 
X 159 
---
Q 367+55 
T 422 
X 412 
---
Q 600+257
T 857 
X 849 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1394
---
Q 26+838 
T 864 
X 858 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 5.120%
| 에폭 21 |  반복 1 / 351 | 시간 0[s] | 손실 0.87
| 에폭 21 |  반복 21 / 351 | 시간 0[s] | 손실 0.83
| 에폭 21 |  반복 41 / 351 | 시간 1[s] | 손실 0.83
| 에폭 21 |  반복 61 / 351 | 시간 1[s] | 손실 0.80
| 에폭 21 |  반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 21 |  반복 101 / 351 | 시간 3[s] | 손실 0.81
| 에폭 21 |  반복 121 / 351 | 시간 3[s] | 손실 0.83
| 에폭 21 |  반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 21 |  반복 161 / 351 | 시간 4[s] | 손실 0.81
| 에폭 21 |  반복 181 / 351 | 시간 5[s] | 손실 0.79
| 에폭 21 |  반복 201 / 351 | 시간 5[s] | 손실 0.83
| 에폭 21 |  반복 221 / 351 | 시간 6[s] | 손실 0.84
| 에폭 21 |  반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 21 |  반복 261 / 351 | 시간 7[s] | 손실 0.81
| 에폭 21 |  반복 281 / 351 | 시간 8[s] | 손실 0.80
| 에폭 21 |  반복 301 / 351 | 시간 8[s] | 손실 0.83
| 에폭 21 |  반복 321 / 351 | 시간 9[s] | 손실 0.82
| 에폭 21 |  반복 341 / 351 | 시간 10[s] | 손실 0.82
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1136
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
X 160 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 849 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1424
---
Q 26+838 
T 864 
X 867 
---
Q 143+93 
T 236 
X 235 
---
검증 정확도 10.500%
| 에폭 22 |  반복 1 / 351 | 시간 0[s] | 손실 0.81
| 에폭 22 |  반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 22 |  반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 22 |  반복 61 / 351 | 시간 1[s] | 손실 0.83
| 에폭 22 |  반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 22 |  반복 101 / 351 | 시간 3[s] | 손실 0.80
| 에폭 22 |  반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 22 |  반복 141 / 351 | 시간 4[s] | 손실 0.80
| 에폭 22 |  반복 161 / 351 | 시간 4[s] | 손실 0.82
| 에폭 22 |  반복 181 / 351 | 시간 5[s] | 손실 0.83
| 에폭 22 |  반복 201 / 351 | 시간 6[s] | 손실 0.87
| 에폭 22 |  반복 221 / 351 | 시간 6[s] | 손실 0.81
| 에폭 22 |  반복 241 / 351 | 시간 7[s] | 손실 0.81
| 에폭 22 |  반복 261 / 351 | 시간 8[s] | 손실 0.81
| 에폭 22 |  반복 281 / 351 | 시간 8[s] | 손실 0.82
| 에폭 22 |  반복 301 / 351 | 시간 9[s] | 손실 0.81
| 에폭 22 |  반복 321 / 351 | 시간 9[s] | 손실 0.81
| 에폭 22 |  반복 341 / 351 | 시간 10[s] | 손실 0.82
Q 77+85  
T 162 
X 159 
---
Q 975+164
T 1139
X 1127
---
Q 582+84 
T 666 
X 655 
---
Q 8+155  
T 163 
X 157 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1400
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
X 232 
---
검증 정확도 2.440%
| 에폭 23 |  반복 1 / 351 | 시간 0[s] | 손실 0.83
| 에폭 23 |  반복 21 / 351 | 시간 0[s] | 손실 0.80
| 에폭 23 |  반복 41 / 351 | 시간 1[s] | 손실 0.78
| 에폭 23 |  반복 61 / 351 | 시간 1[s] | 손실 0.77
| 에폭 23 |  반복 81 / 351 | 시간 2[s] | 손실 0.79
| 에폭 23 |  반복 101 / 351 | 시간 3[s] | 손실 0.79
| 에폭 23 |  반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 23 |  반복 141 / 351 | 시간 4[s] | 손실 0.81
| 에폭 23 |  반복 161 / 351 | 시간 5[s] | 손실 0.80
| 에폭 23 |  반복 181 / 351 | 시간 5[s] | 손실 0.84
| 에폭 23 |  반복 201 / 351 | 시간 6[s] | 손실 0.79
| 에폭 23 |  반복 221 / 351 | 시간 7[s] | 손실 0.78
| 에폭 23 |  반복 241 / 351 | 시간 7[s] | 손실 0.80
| 에폭 23 |  반복 261 / 351 | 시간 8[s] | 손실 0.82
| 에폭 23 |  반복 281 / 351 | 시간 9[s] | 손실 0.83
| 에폭 23 |  반복 301 / 351 | 시간 9[s] | 손실 0.79
| 에폭 23 |  반복 321 / 351 | 시간 10[s] | 손실 0.81
| 에폭 23 |  반복 341 / 351 | 시간 10[s] | 손실 0.81
Q 77+85  
T 162 
X 165 
---
Q 975+164
T 1139
X 1138
---
Q 582+84 
T 666 
X 675 
---
Q 8+155  
T 163 
X 171 
---
Q 367+55 
T 422 
X 428 
---
Q 600+257
T 857 
X 861 
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1445
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 4.880%
| 에폭 24 |  반복 1 / 351 | 시간 0[s] | 손실 0.82
| 에폭 24 |  반복 21 / 351 | 시간 0[s] | 손실 0.80
| 에폭 24 |  반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 24 |  반복 61 / 351 | 시간 2[s] | 손실 0.79
| 에폭 24 |  반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 24 |  반복 101 / 351 | 시간 3[s] | 손실 0.77
| 에폭 24 |  반복 121 / 351 | 시간 4[s] | 손실 0.76
| 에폭 24 |  반복 141 / 351 | 시간 4[s] | 손실 0.78
| 에폭 24 |  반복 161 / 351 | 시간 5[s] | 손실 0.79
| 에폭 24 |  반복 181 / 351 | 시간 5[s] | 손실 0.80
| 에폭 24 |  반복 201 / 351 | 시간 6[s] | 손실 0.83
| 에폭 24 |  반복 221 / 351 | 시간 7[s] | 손실 0.81
| 에폭 24 |  반복 241 / 351 | 시간 7[s] | 손실 0.79
| 에폭 24 |  반복 261 / 351 | 시간 8[s] | 손실 0.77
| 에폭 24 |  반복 281 / 351 | 시간 8[s] | 손실 0.76
| 에폭 24 |  반복 301 / 351 | 시간 9[s] | 손실 0.75
| 에폭 24 |  반복 321 / 351 | 시간 9[s] | 손실 0.77
| 에폭 24 |  반복 341 / 351 | 시간 10[s] | 손실 0.79
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
X 1151
---
Q 582+84 
T 666 
X 661 
---
Q 8+155  
T 163 
X 157 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 846 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 229 
---
검증 정확도 8.600%
| 에폭 25 |  반복 1 / 351 | 시간 0[s] | 손실 0.75
| 에폭 25 |  반복 21 / 351 | 시간 0[s] | 손실 0.78
| 에폭 25 |  반복 41 / 351 | 시간 1[s] | 손실 0.78
| 에폭 25 |  반복 61 / 351 | 시간 1[s] | 손실 0.80
| 에폭 25 |  반복 81 / 351 | 시간 2[s] | 손실 0.78
| 에폭 25 |  반복 101 / 351 | 시간 2[s] | 손실 0.79
| 에폭 25 |  반복 121 / 351 | 시간 3[s] | 손실 0.76
| 에폭 25 |  반복 141 / 351 | 시간 4[s] | 손실 0.76
| 에폭 25 |  반복 161 / 351 | 시간 4[s] | 손실 0.76
| 에폭 25 |  반복 181 / 351 | 시간 5[s] | 손실 0.76
| 에폭 25 |  반복 201 / 351 | 시간 5[s] | 손실 0.78
| 에폭 25 |  반복 221 / 351 | 시간 6[s] | 손실 0.78
| 에폭 25 |  반복 241 / 351 | 시간 7[s] | 손실 0.78
| 에폭 25 |  반복 261 / 351 | 시간 7[s] | 손실 0.78
| 에폭 25 |  반복 281 / 351 | 시간 8[s] | 손실 0.79
| 에폭 25 |  반복 301 / 351 | 시간 9[s] | 손실 0.77
| 에폭 25 |  반복 321 / 351 | 시간 9[s] | 손실 0.76
| 에폭 25 |  반복 341 / 351 | 시간 10[s] | 손실 0.76
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1146
---
Q 582+84 
T 666 
X 668 
---
Q 8+155  
T 163 
X 166 
---
Q 367+55 
T 422 
X 426 
---
Q 600+257
T 857 
X 849 
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 242 
---
검증 정확도 11.220%
plt.rc("font", family="Malgun Gothic")
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()

png

4. seq2seq 개선

4.1 입력 데이터 반전

Image('./deep_learning_2_images/fig 7-23.png', width=400)

png

입력 데이터 반전 코드

# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq

# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()

# 입력 반전 여부 설정 =============================================
is_reverse = True
if is_reverse:
    x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================

# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0

# 일반 혹은 엿보기(Peeky) 설정 =====================================
model = Seq2seq(vocab_size, wordvec_size, hidden_size)
# model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)

acc_list = []
for epoch in range(max_epoch):
    trainer.fit(x_train, t_train, max_epoch=1,
                batch_size=batch_size, max_grad=max_grad)

    correct_num = 0
    for i in range(len(x_test)):
        question, correct = x_test[[i]], t_test[[i]]
        verbose = i < 10
        correct_num += eval_seq2seq(model, question, correct,
                                    id_to_char, verbose, is_reverse)

    acc = float(correct_num) / len(x_test)
    acc_list.append(acc)
    print('검증 정확도 %.3f%%' % (acc * 100))
| 에폭 1 |  반복 1 / 351 | 시간 0[s] | 손실 2.56
| 에폭 1 |  반복 21 / 351 | 시간 0[s] | 손실 2.52
| 에폭 1 |  반복 41 / 351 | 시간 0[s] | 손실 2.17
| 에폭 1 |  반복 61 / 351 | 시간 1[s] | 손실 1.96
| 에폭 1 |  반복 81 / 351 | 시간 2[s] | 손실 1.91
| 에폭 1 |  반복 101 / 351 | 시간 2[s] | 손실 1.87
| 에폭 1 |  반복 121 / 351 | 시간 2[s] | 손실 1.86
| 에폭 1 |  반복 141 / 351 | 시간 3[s] | 손실 1.84
| 에폭 1 |  반복 161 / 351 | 시간 4[s] | 손실 1.80
| 에폭 1 |  반복 181 / 351 | 시간 4[s] | 손실 1.78
| 에폭 1 |  반복 201 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 |  반복 221 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 |  반복 241 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 |  반복 261 / 351 | 시간 6[s] | 손실 1.75
| 에폭 1 |  반복 281 / 351 | 시간 7[s] | 손실 1.74
| 에폭 1 |  반복 301 / 351 | 시간 7[s] | 손실 1.74
| 에폭 1 |  반복 321 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 |  반복 341 / 351 | 시간 9[s] | 손실 1.73
Q 77+85  
T 162 
X 100 
---
Q 975+164
T 1139
X 1000
---
Q 582+84 
T 666 
X 1001
---
Q 8+155  
T 163 
X 100 
---
Q 367+55 
T 422 
X 1001
---
Q 600+257
T 857 
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1000
---
Q 26+838 
T 864 
X 1001
---
Q 143+93 
T 236 
X 703 
---
검증 정확도 0.120%
| 에폭 2 |  반복 1 / 351 | 시간 0[s] | 손실 1.73
| 에폭 2 |  반복 21 / 351 | 시간 0[s] | 손실 1.72
| 에폭 2 |  반복 41 / 351 | 시간 1[s] | 손실 1.72
| 에폭 2 |  반복 61 / 351 | 시간 1[s] | 손실 1.72
| 에폭 2 |  반복 81 / 351 | 시간 2[s] | 손실 1.70
| 에폭 2 |  반복 101 / 351 | 시간 3[s] | 손실 1.70
| 에폭 2 |  반복 121 / 351 | 시간 3[s] | 손실 1.69
| 에폭 2 |  반복 141 / 351 | 시간 4[s] | 손실 1.68
| 에폭 2 |  반복 161 / 351 | 시간 4[s] | 손실 1.67
| 에폭 2 |  반복 181 / 351 | 시간 5[s] | 손실 1.66
| 에폭 2 |  반복 201 / 351 | 시간 5[s] | 손실 1.66
| 에폭 2 |  반복 221 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 |  반복 241 / 351 | 시간 7[s] | 손실 1.63
| 에폭 2 |  반복 261 / 351 | 시간 7[s] | 손실 1.62
| 에폭 2 |  반복 281 / 351 | 시간 8[s] | 손실 1.61
| 에폭 2 |  반복 301 / 351 | 시간 8[s] | 손실 1.60
| 에폭 2 |  반복 321 / 351 | 시간 9[s] | 손실 1.58
| 에폭 2 |  반복 341 / 351 | 시간 9[s] | 손실 1.56
Q 77+85  
T 162 
X 100 
---
Q 975+164
T 1139
X 1000
---
Q 582+84 
T 666 
X 690 
---
Q 8+155  
T 163 
X 1000
---
Q 367+55 
T 422 
X 470 
---
Q 600+257
T 857 
X 700 
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1444
---
Q 26+838 
T 864 
X 700 
---
Q 143+93 
T 236 
X 370 
---
검증 정확도 0.400%
| 에폭 3 |  반복 1 / 351 | 시간 0[s] | 손실 1.52
| 에폭 3 |  반복 21 / 351 | 시간 0[s] | 손실 1.53
| 에폭 3 |  반복 41 / 351 | 시간 1[s] | 손실 1.51
| 에폭 3 |  반복 61 / 351 | 시간 1[s] | 손실 1.49
| 에폭 3 |  반복 81 / 351 | 시간 2[s] | 손실 1.47
| 에폭 3 |  반복 101 / 351 | 시간 2[s] | 손실 1.45
| 에폭 3 |  반복 121 / 351 | 시간 3[s] | 손실 1.44
| 에폭 3 |  반복 141 / 351 | 시간 4[s] | 손실 1.42
| 에폭 3 |  반복 161 / 351 | 시간 4[s] | 손실 1.40
| 에폭 3 |  반복 181 / 351 | 시간 5[s] | 손실 1.38
| 에폭 3 |  반복 201 / 351 | 시간 5[s] | 손실 1.37
| 에폭 3 |  반복 221 / 351 | 시간 6[s] | 손실 1.35
| 에폭 3 |  반복 241 / 351 | 시간 6[s] | 손실 1.33
| 에폭 3 |  반복 261 / 351 | 시간 7[s] | 손실 1.32
| 에폭 3 |  반복 281 / 351 | 시간 7[s] | 손실 1.30
| 에폭 3 |  반복 301 / 351 | 시간 8[s] | 손실 1.29
| 에폭 3 |  반복 321 / 351 | 시간 9[s] | 손실 1.28
| 에폭 3 |  반복 341 / 351 | 시간 9[s] | 손실 1.27
Q 77+85  
T 162 
X 158 
---
Q 975+164
T 1139
X 1148
---
Q 582+84 
T 666 
X 662 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 382 
---
Q 600+257
T 857 
X 818 
---
Q 761+292
T 1053
X 1008
---
Q 830+597
T 1427
X 1434
---
Q 26+838 
T 864 
X 838 
---
Q 143+93 
T 236 
X 202 
---
검증 정확도 1.940%
| 에폭 4 |  반복 1 / 351 | 시간 0[s] | 손실 1.26
| 에폭 4 |  반복 21 / 351 | 시간 0[s] | 손실 1.25
| 에폭 4 |  반복 41 / 351 | 시간 1[s] | 손실 1.23
| 에폭 4 |  반복 61 / 351 | 시간 1[s] | 손실 1.22
| 에폭 4 |  반복 81 / 351 | 시간 2[s] | 손실 1.20
| 에폭 4 |  반복 101 / 351 | 시간 3[s] | 손실 1.19
| 에폭 4 |  반복 121 / 351 | 시간 3[s] | 손실 1.18
| 에폭 4 |  반복 141 / 351 | 시간 4[s] | 손실 1.17
| 에폭 4 |  반복 161 / 351 | 시간 4[s] | 손실 1.15
| 에폭 4 |  반복 181 / 351 | 시간 5[s] | 손실 1.13
| 에폭 4 |  반복 201 / 351 | 시간 5[s] | 손실 1.12
| 에폭 4 |  반복 221 / 351 | 시간 6[s] | 손실 1.11
| 에폭 4 |  반복 241 / 351 | 시간 7[s] | 손실 1.09
| 에폭 4 |  반복 261 / 351 | 시간 7[s] | 손실 1.08
| 에폭 4 |  반복 281 / 351 | 시간 8[s] | 손실 1.07
| 에폭 4 |  반복 301 / 351 | 시간 8[s] | 손실 1.07
| 에폭 4 |  반복 321 / 351 | 시간 9[s] | 손실 1.05
| 에폭 4 |  반복 341 / 351 | 시간 10[s] | 손실 1.03
Q 77+85  
T 162 
X 166 
---
Q 975+164
T 1139
X 1196
---
Q 582+84 
T 666 
X 668 
---
Q 8+155  
T 163 
X 166 
---
Q 367+55 
T 422 
X 419 
---
Q 600+257
T 857 
X 896 
---
Q 761+292
T 1053
X 1010
---
Q 830+597
T 1427
X 1496
---
Q 26+838 
T 864 
X 868 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 5.780%
| 에폭 5 |  반복 1 / 351 | 시간 0[s] | 손실 1.01
| 에폭 5 |  반복 21 / 351 | 시간 0[s] | 손실 1.01
| 에폭 5 |  반복 41 / 351 | 시간 1[s] | 손실 1.00
| 에폭 5 |  반복 61 / 351 | 시간 1[s] | 손실 0.99
| 에폭 5 |  반복 81 / 351 | 시간 2[s] | 손실 0.97
| 에폭 5 |  반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 5 |  반복 121 / 351 | 시간 3[s] | 손실 0.95
| 에폭 5 |  반복 141 / 351 | 시간 4[s] | 손실 0.94
| 에폭 5 |  반복 161 / 351 | 시간 4[s] | 손실 0.93
| 에폭 5 |  반복 181 / 351 | 시간 5[s] | 손실 0.93
| 에폭 5 |  반복 201 / 351 | 시간 6[s] | 손실 0.91
| 에폭 5 |  반복 221 / 351 | 시간 6[s] | 손실 0.89
| 에폭 5 |  반복 241 / 351 | 시간 7[s] | 손실 0.89
| 에폭 5 |  반복 261 / 351 | 시간 7[s] | 손실 0.88
| 에폭 5 |  반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 5 |  반복 301 / 351 | 시간 8[s] | 손실 0.86
| 에폭 5 |  반복 321 / 351 | 시간 9[s] | 손실 0.85
| 에폭 5 |  반복 341 / 351 | 시간 10[s] | 손실 0.84
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
X 1192
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 166 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 860 
---
Q 761+292
T 1053
X 1066
---
Q 830+597
T 1427
X 1414
---
Q 26+838 
T 864 
X 865 
---
Q 143+93 
T 236 
X 232 
---
검증 정확도 12.460%
| 에폭 6 |  반복 1 / 351 | 시간 0[s] | 손실 0.86
| 에폭 6 |  반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 6 |  반복 41 / 351 | 시간 1[s] | 손실 0.82
| 에폭 6 |  반복 61 / 351 | 시간 1[s] | 손실 0.81
| 에폭 6 |  반복 81 / 351 | 시간 2[s] | 손실 0.80
| 에폭 6 |  반복 101 / 351 | 시간 3[s] | 손실 0.80
| 에폭 6 |  반복 121 / 351 | 시간 3[s] | 손실 0.79
| 에폭 6 |  반복 141 / 351 | 시간 4[s] | 손실 0.78
| 에폭 6 |  반복 161 / 351 | 시간 4[s] | 손실 0.77
| 에폭 6 |  반복 181 / 351 | 시간 5[s] | 손실 0.77
| 에폭 6 |  반복 201 / 351 | 시간 6[s] | 손실 0.78
| 에폭 6 |  반복 221 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 |  반복 241 / 351 | 시간 7[s] | 손실 0.75
| 에폭 6 |  반복 261 / 351 | 시간 7[s] | 손실 0.74
| 에폭 6 |  반복 281 / 351 | 시간 8[s] | 손실 0.73
| 에폭 6 |  반복 301 / 351 | 시간 9[s] | 손실 0.73
| 에폭 6 |  반복 321 / 351 | 시간 9[s] | 손실 0.72
| 에폭 6 |  반복 341 / 351 | 시간 10[s] | 손실 0.72
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
X 1141
---
Q 582+84 
T 666 
X 661 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 851 
---
Q 761+292
T 1053
X 1061
---
Q 830+597
T 1427
X 1391
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 234 
---
검증 정확도 14.260%
| 에폭 7 |  반복 1 / 351 | 시간 0[s] | 손실 0.71
| 에폭 7 |  반복 21 / 351 | 시간 0[s] | 손실 0.71
| 에폭 7 |  반복 41 / 351 | 시간 1[s] | 손실 0.70
| 에폭 7 |  반복 61 / 351 | 시간 1[s] | 손실 0.70
| 에폭 7 |  반복 81 / 351 | 시간 2[s] | 손실 0.68
| 에폭 7 |  반복 101 / 351 | 시간 2[s] | 손실 0.68
| 에폭 7 |  반복 121 / 351 | 시간 3[s] | 손실 0.67
| 에폭 7 |  반복 141 / 351 | 시간 3[s] | 손실 0.67
| 에폭 7 |  반복 161 / 351 | 시간 4[s] | 손실 0.67
| 에폭 7 |  반복 181 / 351 | 시간 4[s] | 손실 0.66
| 에폭 7 |  반복 201 / 351 | 시간 5[s] | 손실 0.66
| 에폭 7 |  반복 221 / 351 | 시간 5[s] | 손실 0.66
| 에폭 7 |  반복 241 / 351 | 시간 6[s] | 손실 0.64
| 에폭 7 |  반복 261 / 351 | 시간 6[s] | 손실 0.65
| 에폭 7 |  반복 281 / 351 | 시간 7[s] | 손실 0.64
| 에폭 7 |  반복 301 / 351 | 시간 8[s] | 손실 0.63
| 에폭 7 |  반복 321 / 351 | 시간 8[s] | 손실 0.63
| 에폭 7 |  반복 341 / 351 | 시간 9[s] | 손실 0.62
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1142
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1144
---
Q 830+597
T 1427
X 1431
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 17.500%
| 에폭 8 |  반복 1 / 351 | 시간 0[s] | 손실 0.66
| 에폭 8 |  반복 21 / 351 | 시간 0[s] | 손실 0.61
| 에폭 8 |  반복 41 / 351 | 시간 1[s] | 손실 0.62
| 에폭 8 |  반복 61 / 351 | 시간 1[s] | 손실 0.61
| 에폭 8 |  반복 81 / 351 | 시간 2[s] | 손실 0.61
| 에폭 8 |  반복 101 / 351 | 시간 2[s] | 손실 0.61
| 에폭 8 |  반복 121 / 351 | 시간 3[s] | 손실 0.60
| 에폭 8 |  반복 141 / 351 | 시간 3[s] | 손실 0.60
| 에폭 8 |  반복 161 / 351 | 시간 4[s] | 손실 0.59
| 에폭 8 |  반복 181 / 351 | 시간 5[s] | 손실 0.58
| 에폭 8 |  반복 201 / 351 | 시간 5[s] | 손실 0.59
| 에폭 8 |  반복 221 / 351 | 시간 6[s] | 손실 0.60
| 에폭 8 |  반복 241 / 351 | 시간 6[s] | 손실 0.59
| 에폭 8 |  반복 261 / 351 | 시간 7[s] | 손실 0.58
| 에폭 8 |  반복 281 / 351 | 시간 7[s] | 손실 0.59
| 에폭 8 |  반복 301 / 351 | 시간 8[s] | 손실 0.58
| 에폭 8 |  반복 321 / 351 | 시간 9[s] | 손실 0.57
| 에폭 8 |  반복 341 / 351 | 시간 9[s] | 손실 0.57
Q 77+85  
T 162 
X 163 
---
Q 975+164
T 1139
X 1134
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 423 
---
Q 600+257
T 857 
X 759 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1431
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 23.080%
| 에폭 9 |  반복 1 / 351 | 시간 0[s] | 손실 0.55
| 에폭 9 |  반복 21 / 351 | 시간 0[s] | 손실 0.56
| 에폭 9 |  반복 41 / 351 | 시간 0[s] | 손실 0.56
| 에폭 9 |  반복 61 / 351 | 시간 1[s] | 손실 0.55
| 에폭 9 |  반복 81 / 351 | 시간 2[s] | 손실 0.54
| 에폭 9 |  반복 101 / 351 | 시간 2[s] | 손실 0.55
| 에폭 9 |  반복 121 / 351 | 시간 3[s] | 손실 0.55
| 에폭 9 |  반복 141 / 351 | 시간 3[s] | 손실 0.54
| 에폭 9 |  반복 161 / 351 | 시간 4[s] | 손실 0.55
| 에폭 9 |  반복 181 / 351 | 시간 4[s] | 손실 0.53
| 에폭 9 |  반복 201 / 351 | 시간 5[s] | 손실 0.54
| 에폭 9 |  반복 221 / 351 | 시간 5[s] | 손실 0.54
| 에폭 9 |  반복 241 / 351 | 시간 6[s] | 손실 0.53
| 에폭 9 |  반복 261 / 351 | 시간 6[s] | 손실 0.53
| 에폭 9 |  반복 281 / 351 | 시간 7[s] | 손실 0.54
| 에폭 9 |  반복 301 / 351 | 시간 8[s] | 손실 0.54
| 에폭 9 |  반복 321 / 351 | 시간 8[s] | 손실 0.53
| 에폭 9 |  반복 341 / 351 | 시간 9[s] | 손실 0.53
Q 77+85  
T 162 
X 158 
---
Q 975+164
T 1139
X 1142
---
Q 582+84 
T 666 
X 664 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 854 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 26.520%
| 에폭 10 |  반복 1 / 351 | 시간 0[s] | 손실 0.50
| 에폭 10 |  반복 21 / 351 | 시간 0[s] | 손실 0.51
| 에폭 10 |  반복 41 / 351 | 시간 1[s] | 손실 0.52
| 에폭 10 |  반복 61 / 351 | 시간 1[s] | 손실 0.55
| 에폭 10 |  반복 81 / 351 | 시간 1[s] | 손실 0.52
| 에폭 10 |  반복 101 / 351 | 시간 2[s] | 손실 0.51
| 에폭 10 |  반복 121 / 351 | 시간 2[s] | 손실 0.50
| 에폭 10 |  반복 141 / 351 | 시간 3[s] | 손실 0.51
| 에폭 10 |  반복 161 / 351 | 시간 4[s] | 손실 0.52
| 에폭 10 |  반복 181 / 351 | 시간 4[s] | 손실 0.53
| 에폭 10 |  반복 201 / 351 | 시간 5[s] | 손실 0.50
| 에폭 10 |  반복 221 / 351 | 시간 5[s] | 손실 0.50
| 에폭 10 |  반복 241 / 351 | 시간 6[s] | 손실 0.50
| 에폭 10 |  반복 261 / 351 | 시간 6[s] | 손실 0.50
| 에폭 10 |  반복 281 / 351 | 시간 7[s] | 손실 0.49
| 에폭 10 |  반복 301 / 351 | 시간 8[s] | 손실 0.48
| 에폭 10 |  반복 321 / 351 | 시간 8[s] | 손실 0.48
| 에폭 10 |  반복 341 / 351 | 시간 9[s] | 손실 0.48
Q 77+85  
T 162 
X 163 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 664 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1431
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 235 
---
검증 정확도 29.820%
| 에폭 11 |  반복 1 / 351 | 시간 0[s] | 손실 0.47
| 에폭 11 |  반복 21 / 351 | 시간 0[s] | 손실 0.48
| 에폭 11 |  반복 41 / 351 | 시간 1[s] | 손실 0.48
| 에폭 11 |  반복 61 / 351 | 시간 1[s] | 손실 0.48
| 에폭 11 |  반복 81 / 351 | 시간 2[s] | 손실 0.47
| 에폭 11 |  반복 101 / 351 | 시간 2[s] | 손실 0.47
| 에폭 11 |  반복 121 / 351 | 시간 3[s] | 손실 0.47
| 에폭 11 |  반복 141 / 351 | 시간 3[s] | 손실 0.47
| 에폭 11 |  반복 161 / 351 | 시간 4[s] | 손실 0.48
| 에폭 11 |  반복 181 / 351 | 시간 4[s] | 손실 0.48
| 에폭 11 |  반복 201 / 351 | 시간 5[s] | 손실 0.47
| 에폭 11 |  반복 221 / 351 | 시간 5[s] | 손실 0.47
| 에폭 11 |  반복 241 / 351 | 시간 6[s] | 손실 0.46
| 에폭 11 |  반복 261 / 351 | 시간 6[s] | 손실 0.46
| 에폭 11 |  반복 281 / 351 | 시간 7[s] | 손실 0.46
| 에폭 11 |  반복 301 / 351 | 시간 8[s] | 손실 0.48
| 에폭 11 |  반복 321 / 351 | 시간 8[s] | 손실 0.45
| 에폭 11 |  반복 341 / 351 | 시간 9[s] | 손실 0.45
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1426
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 28.480%
| 에폭 12 |  반복 1 / 351 | 시간 0[s] | 손실 0.46
| 에폭 12 |  반복 21 / 351 | 시간 0[s] | 손실 0.45
| 에폭 12 |  반복 41 / 351 | 시간 1[s] | 손실 0.45
| 에폭 12 |  반복 61 / 351 | 시간 1[s] | 손실 0.46
| 에폭 12 |  반복 81 / 351 | 시간 2[s] | 손실 0.45
| 에폭 12 |  반복 101 / 351 | 시간 2[s] | 손실 0.46
| 에폭 12 |  반복 121 / 351 | 시간 3[s] | 손실 0.46
| 에폭 12 |  반복 141 / 351 | 시간 3[s] | 손실 0.46
| 에폭 12 |  반복 161 / 351 | 시간 4[s] | 손실 0.45
| 에폭 12 |  반복 181 / 351 | 시간 4[s] | 손실 0.44
| 에폭 12 |  반복 201 / 351 | 시간 5[s] | 손실 0.45
| 에폭 12 |  반복 221 / 351 | 시간 5[s] | 손실 0.44
| 에폭 12 |  반복 241 / 351 | 시간 6[s] | 손실 0.43
| 에폭 12 |  반복 261 / 351 | 시간 6[s] | 손실 0.43
| 에폭 12 |  반복 281 / 351 | 시간 7[s] | 손실 0.44
| 에폭 12 |  반복 301 / 351 | 시간 8[s] | 손실 0.45
| 에폭 12 |  반복 321 / 351 | 시간 8[s] | 손실 0.44
| 에폭 12 |  반복 341 / 351 | 시간 9[s] | 손실 0.43
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 36.640%
| 에폭 13 |  반복 1 / 351 | 시간 0[s] | 손실 0.41
| 에폭 13 |  반복 21 / 351 | 시간 0[s] | 손실 0.43
| 에폭 13 |  반복 41 / 351 | 시간 1[s] | 손실 0.42
| 에폭 13 |  반복 61 / 351 | 시간 1[s] | 손실 0.42
| 에폭 13 |  반복 81 / 351 | 시간 2[s] | 손실 0.42
| 에폭 13 |  반복 101 / 351 | 시간 2[s] | 손실 0.44
| 에폭 13 |  반복 121 / 351 | 시간 3[s] | 손실 0.43
| 에폭 13 |  반복 141 / 351 | 시간 4[s] | 손실 0.41
| 에폭 13 |  반복 161 / 351 | 시간 4[s] | 손실 0.42
| 에폭 13 |  반복 181 / 351 | 시간 5[s] | 손실 0.42
| 에폭 13 |  반복 201 / 351 | 시간 5[s] | 손실 0.42
| 에폭 13 |  반복 221 / 351 | 시간 6[s] | 손실 0.43
| 에폭 13 |  반복 241 / 351 | 시간 6[s] | 손실 0.43
| 에폭 13 |  반복 261 / 351 | 시간 7[s] | 손실 0.41
| 에폭 13 |  반복 281 / 351 | 시간 7[s] | 손실 0.42
| 에폭 13 |  반복 301 / 351 | 시간 8[s] | 손실 0.41
| 에폭 13 |  반복 321 / 351 | 시간 8[s] | 손실 0.43
| 에폭 13 |  반복 341 / 351 | 시간 9[s] | 손실 0.40
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 424 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1429
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 39.420%
| 에폭 14 |  반복 1 / 351 | 시간 0[s] | 손실 0.41
| 에폭 14 |  반복 21 / 351 | 시간 0[s] | 손실 0.41
| 에폭 14 |  반복 41 / 351 | 시간 1[s] | 손실 0.41
| 에폭 14 |  반복 61 / 351 | 시간 1[s] | 손실 0.40
| 에폭 14 |  반복 81 / 351 | 시간 2[s] | 손실 0.40
| 에폭 14 |  반복 101 / 351 | 시간 2[s] | 손실 0.41
| 에폭 14 |  반복 121 / 351 | 시간 3[s] | 손실 0.39
| 에폭 14 |  반복 141 / 351 | 시간 3[s] | 손실 0.39
| 에폭 14 |  반복 161 / 351 | 시간 4[s] | 손실 0.38
| 에폭 14 |  반복 181 / 351 | 시간 4[s] | 손실 0.38
| 에폭 14 |  반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 14 |  반복 221 / 351 | 시간 5[s] | 손실 0.38
| 에폭 14 |  반복 241 / 351 | 시간 6[s] | 손실 0.39
| 에폭 14 |  반복 261 / 351 | 시간 6[s] | 손실 0.40
| 에폭 14 |  반복 281 / 351 | 시간 7[s] | 손실 0.41
| 에폭 14 |  반복 301 / 351 | 시간 8[s] | 손실 0.39
| 에폭 14 |  반복 321 / 351 | 시간 8[s] | 손실 0.39
| 에폭 14 |  반복 341 / 351 | 시간 9[s] | 손실 0.39
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1137
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1426
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 235 
---
검증 정확도 36.680%
| 에폭 15 |  반복 1 / 351 | 시간 0[s] | 손실 0.38
| 에폭 15 |  반복 21 / 351 | 시간 0[s] | 손실 0.39
| 에폭 15 |  반복 41 / 351 | 시간 1[s] | 손실 0.39
| 에폭 15 |  반복 61 / 351 | 시간 1[s] | 손실 0.38
| 에폭 15 |  반복 81 / 351 | 시간 2[s] | 손실 0.38
| 에폭 15 |  반복 101 / 351 | 시간 2[s] | 손실 0.38
| 에폭 15 |  반복 121 / 351 | 시간 3[s] | 손실 0.38
| 에폭 15 |  반복 141 / 351 | 시간 3[s] | 손실 0.38
| 에폭 15 |  반복 161 / 351 | 시간 4[s] | 손실 0.38
| 에폭 15 |  반복 181 / 351 | 시간 4[s] | 손실 0.38
| 에폭 15 |  반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 15 |  반복 221 / 351 | 시간 5[s] | 손실 0.39
| 에폭 15 |  반복 241 / 351 | 시간 6[s] | 손실 0.38
| 에폭 15 |  반복 261 / 351 | 시간 6[s] | 손실 0.37
| 에폭 15 |  반복 281 / 351 | 시간 7[s] | 손실 0.37
| 에폭 15 |  반복 301 / 351 | 시간 8[s] | 손실 0.39
| 에폭 15 |  반복 321 / 351 | 시간 8[s] | 손실 0.39
| 에폭 15 |  반복 341 / 351 | 시간 9[s] | 손실 0.37
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1137
---
Q 582+84 
T 666 
X 667 
---
Q 8+155  
T 163 
X 164 
---
Q 367+55 
T 422 
X 420 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1431
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 41.100%
| 에폭 16 |  반복 1 / 351 | 시간 0[s] | 손실 0.36
| 에폭 16 |  반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 16 |  반복 41 / 351 | 시간 1[s] | 손실 0.36
| 에폭 16 |  반복 61 / 351 | 시간 1[s] | 손실 0.36
| 에폭 16 |  반복 81 / 351 | 시간 2[s] | 손실 0.37
| 에폭 16 |  반복 101 / 351 | 시간 2[s] | 손실 0.36
| 에폭 16 |  반복 121 / 351 | 시간 3[s] | 손실 0.37
| 에폭 16 |  반복 141 / 351 | 시간 3[s] | 손실 0.36
| 에폭 16 |  반복 161 / 351 | 시간 4[s] | 손실 0.37
| 에폭 16 |  반복 181 / 351 | 시간 4[s] | 손실 0.36
| 에폭 16 |  반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 16 |  반복 221 / 351 | 시간 5[s] | 손실 0.38
| 에폭 16 |  반복 241 / 351 | 시간 6[s] | 손실 0.36
| 에폭 16 |  반복 261 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 |  반복 281 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 |  반복 301 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 |  반복 321 / 351 | 시간 8[s] | 손실 0.35
| 에폭 16 |  반복 341 / 351 | 시간 9[s] | 손실 0.37
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1142
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1430
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 42.700%
| 에폭 17 |  반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 17 |  반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 17 |  반복 41 / 351 | 시간 1[s] | 손실 0.36
| 에폭 17 |  반복 61 / 351 | 시간 1[s] | 손실 0.35
| 에폭 17 |  반복 81 / 351 | 시간 2[s] | 손실 0.36
| 에폭 17 |  반복 101 / 351 | 시간 2[s] | 손실 0.34
| 에폭 17 |  반복 121 / 351 | 시간 3[s] | 손실 0.34
| 에폭 17 |  반복 141 / 351 | 시간 4[s] | 손실 0.34
| 에폭 17 |  반복 161 / 351 | 시간 4[s] | 손실 0.34
| 에폭 17 |  반복 181 / 351 | 시간 5[s] | 손실 0.35
| 에폭 17 |  반복 201 / 351 | 시간 5[s] | 손실 0.35
| 에폭 17 |  반복 221 / 351 | 시간 6[s] | 손실 0.34
| 에폭 17 |  반복 241 / 351 | 시간 6[s] | 손실 0.35
| 에폭 17 |  반복 261 / 351 | 시간 7[s] | 손실 0.36
| 에폭 17 |  반복 281 / 351 | 시간 8[s] | 손실 0.37
| 에폭 17 |  반복 301 / 351 | 시간 8[s] | 손실 0.37
| 에폭 17 |  반복 321 / 351 | 시간 9[s] | 손실 0.37
| 에폭 17 |  반복 341 / 351 | 시간 9[s] | 손실 0.36
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1138
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
X 1429
---
Q 26+838 
T 864 
X 865 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 42.860%
| 에폭 18 |  반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 18 |  반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 18 |  반복 41 / 351 | 시간 1[s] | 손실 0.35
| 에폭 18 |  반복 61 / 351 | 시간 1[s] | 손실 0.35
| 에폭 18 |  반복 81 / 351 | 시간 2[s] | 손실 0.34
| 에폭 18 |  반복 101 / 351 | 시간 3[s] | 손실 0.34
| 에폭 18 |  반복 121 / 351 | 시간 3[s] | 손실 0.33
| 에폭 18 |  반복 141 / 351 | 시간 4[s] | 손실 0.33
| 에폭 18 |  반복 161 / 351 | 시간 4[s] | 손실 0.34
| 에폭 18 |  반복 181 / 351 | 시간 5[s] | 손실 0.33
| 에폭 18 |  반복 201 / 351 | 시간 6[s] | 손실 0.33
| 에폭 18 |  반복 221 / 351 | 시간 6[s] | 손실 0.33
| 에폭 18 |  반복 241 / 351 | 시간 7[s] | 손실 0.33
| 에폭 18 |  반복 261 / 351 | 시간 7[s] | 손실 0.33
| 에폭 18 |  반복 281 / 351 | 시간 8[s] | 손실 0.33
| 에폭 18 |  반복 301 / 351 | 시간 9[s] | 손실 0.33
| 에폭 18 |  반복 321 / 351 | 시간 9[s] | 손실 0.35
| 에폭 18 |  반복 341 / 351 | 시간 10[s] | 손실 0.35
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1138
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 423 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1425
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 40.640%
| 에폭 19 |  반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 19 |  반복 21 / 351 | 시간 0[s] | 손실 0.34
| 에폭 19 |  반복 41 / 351 | 시간 1[s] | 손실 0.34
| 에폭 19 |  반복 61 / 351 | 시간 1[s] | 손실 0.34
| 에폭 19 |  반복 81 / 351 | 시간 2[s] | 손실 0.34
| 에폭 19 |  반복 101 / 351 | 시간 2[s] | 손실 0.32
| 에폭 19 |  반복 121 / 351 | 시간 3[s] | 손실 0.31
| 에폭 19 |  반복 141 / 351 | 시간 3[s] | 손실 0.33
| 에폭 19 |  반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 19 |  반복 181 / 351 | 시간 5[s] | 손실 0.30
| 에폭 19 |  반복 201 / 351 | 시간 5[s] | 손실 0.31
| 에폭 19 |  반복 221 / 351 | 시간 6[s] | 손실 0.31
| 에폭 19 |  반복 241 / 351 | 시간 6[s] | 손실 0.32
| 에폭 19 |  반복 261 / 351 | 시간 7[s] | 손실 0.33
| 에폭 19 |  반복 281 / 351 | 시간 7[s] | 손실 0.32
| 에폭 19 |  반복 301 / 351 | 시간 8[s] | 손실 0.32
| 에폭 19 |  반복 321 / 351 | 시간 8[s] | 손실 0.33
| 에폭 19 |  반복 341 / 351 | 시간 9[s] | 손실 0.33
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1430
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 47.540%
| 에폭 20 |  반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 20 |  반복 21 / 351 | 시간 0[s] | 손실 0.35
| 에폭 20 |  반복 41 / 351 | 시간 1[s] | 손실 0.33
| 에폭 20 |  반복 61 / 351 | 시간 1[s] | 손실 0.33
| 에폭 20 |  반복 81 / 351 | 시간 2[s] | 손실 0.31
| 에폭 20 |  반복 101 / 351 | 시간 2[s] | 손실 0.31
| 에폭 20 |  반복 121 / 351 | 시간 3[s] | 손실 0.33
| 에폭 20 |  반복 141 / 351 | 시간 3[s] | 손실 0.32
| 에폭 20 |  반복 161 / 351 | 시간 4[s] | 손실 0.33
| 에폭 20 |  반복 181 / 351 | 시간 4[s] | 손실 0.31
| 에폭 20 |  반복 201 / 351 | 시간 5[s] | 손실 0.30
| 에폭 20 |  반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 20 |  반복 241 / 351 | 시간 6[s] | 손실 0.33
| 에폭 20 |  반복 261 / 351 | 시간 6[s] | 손실 0.35
| 에폭 20 |  반복 281 / 351 | 시간 7[s] | 손실 0.36
| 에폭 20 |  반복 301 / 351 | 시간 7[s] | 손실 0.34
| 에폭 20 |  반복 321 / 351 | 시간 8[s] | 손실 0.32
| 에폭 20 |  반복 341 / 351 | 시간 8[s] | 손실 0.32
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 665 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
X 862 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 49.980%
| 에폭 21 |  반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 21 |  반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 21 |  반복 41 / 351 | 시간 1[s] | 손실 0.30
| 에폭 21 |  반복 61 / 351 | 시간 1[s] | 손실 0.30
| 에폭 21 |  반복 81 / 351 | 시간 2[s] | 손실 0.32
| 에폭 21 |  반복 101 / 351 | 시간 2[s] | 손실 0.32
| 에폭 21 |  반복 121 / 351 | 시간 3[s] | 손실 0.31
| 에폭 21 |  반복 141 / 351 | 시간 3[s] | 손실 0.30
| 에폭 21 |  반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 21 |  반복 181 / 351 | 시간 4[s] | 손실 0.31
| 에폭 21 |  반복 201 / 351 | 시간 5[s] | 손실 0.31
| 에폭 21 |  반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 21 |  반복 241 / 351 | 시간 6[s] | 손실 0.31
| 에폭 21 |  반복 261 / 351 | 시간 7[s] | 손실 0.29
| 에폭 21 |  반복 281 / 351 | 시간 7[s] | 손실 0.30
| 에폭 21 |  반복 301 / 351 | 시간 8[s] | 손실 0.29
| 에폭 21 |  반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 21 |  반복 341 / 351 | 시간 9[s] | 손실 0.29
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
X 162 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
X 859 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 51.040%
| 에폭 22 |  반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 22 |  반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 22 |  반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 22 |  반복 61 / 351 | 시간 1[s] | 손실 0.29
| 에폭 22 |  반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 22 |  반복 101 / 351 | 시간 2[s] | 손실 0.28
| 에폭 22 |  반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 22 |  반복 141 / 351 | 시간 3[s] | 손실 0.31
| 에폭 22 |  반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 22 |  반복 181 / 351 | 시간 4[s] | 손실 0.30
| 에폭 22 |  반복 201 / 351 | 시간 5[s] | 손실 0.28
| 에폭 22 |  반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 22 |  반복 241 / 351 | 시간 6[s] | 손실 0.33
| 에폭 22 |  반복 261 / 351 | 시간 6[s] | 손실 0.32
| 에폭 22 |  반복 281 / 351 | 시간 7[s] | 손실 0.31
| 에폭 22 |  반복 301 / 351 | 시간 8[s] | 손실 0.30
| 에폭 22 |  반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 22 |  반복 341 / 351 | 시간 9[s] | 손실 0.31
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
X 423 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1430
---
Q 26+838 
T 864 
X 865 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 47.740%
| 에폭 23 |  반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 23 |  반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 23 |  반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 23 |  반복 61 / 351 | 시간 1[s] | 손실 0.28
| 에폭 23 |  반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 23 |  반복 101 / 351 | 시간 2[s] | 손실 0.27
| 에폭 23 |  반복 121 / 351 | 시간 3[s] | 손실 0.28
| 에폭 23 |  반복 141 / 351 | 시간 3[s] | 손실 0.28
| 에폭 23 |  반복 161 / 351 | 시간 4[s] | 손실 0.30
| 에폭 23 |  반복 181 / 351 | 시간 5[s] | 손실 0.30
| 에폭 23 |  반복 201 / 351 | 시간 5[s] | 손실 0.29
| 에폭 23 |  반복 221 / 351 | 시간 6[s] | 손실 0.29
| 에폭 23 |  반복 241 / 351 | 시간 6[s] | 손실 0.28
| 에폭 23 |  반복 261 / 351 | 시간 7[s] | 손실 0.28
| 에폭 23 |  반복 281 / 351 | 시간 7[s] | 손실 0.30
| 에폭 23 |  반복 301 / 351 | 시간 8[s] | 손실 0.29
| 에폭 23 |  반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 23 |  반복 341 / 351 | 시간 9[s] | 손실 0.28
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1142
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1429
---
Q 26+838 
T 864 
X 866 
---
Q 143+93 
T 236 
X 238 
---
검증 정확도 45.140%
| 에폭 24 |  반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 24 |  반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 24 |  반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 24 |  반복 61 / 351 | 시간 1[s] | 손실 0.29
| 에폭 24 |  반복 81 / 351 | 시간 2[s] | 손실 0.30
| 에폭 24 |  반복 101 / 351 | 시간 2[s] | 손실 0.29
| 에폭 24 |  반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 24 |  반복 141 / 351 | 시간 3[s] | 손실 0.29
| 에폭 24 |  반복 161 / 351 | 시간 4[s] | 손실 0.28
| 에폭 24 |  반복 181 / 351 | 시간 4[s] | 손실 0.29
| 에폭 24 |  반복 201 / 351 | 시간 5[s] | 손실 0.28
| 에폭 24 |  반복 221 / 351 | 시간 6[s] | 손실 0.28
| 에폭 24 |  반복 241 / 351 | 시간 6[s] | 손실 0.29
| 에폭 24 |  반복 261 / 351 | 시간 7[s] | 손실 0.29
| 에폭 24 |  반복 281 / 351 | 시간 7[s] | 손실 0.29
| 에폭 24 |  반복 301 / 351 | 시간 8[s] | 손실 0.28
| 에폭 24 |  반복 321 / 351 | 시간 8[s] | 손실 0.27
| 에폭 24 |  반복 341 / 351 | 시간 9[s] | 손실 0.29
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
X 421 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 237 
---
검증 정확도 51.800%
| 에폭 25 |  반복 1 / 351 | 시간 0[s] | 손실 0.29
| 에폭 25 |  반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 25 |  반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 25 |  반복 61 / 351 | 시간 1[s] | 손실 0.26
| 에폭 25 |  반복 81 / 351 | 시간 2[s] | 손실 0.26
| 에폭 25 |  반복 101 / 351 | 시간 2[s] | 손실 0.27
| 에폭 25 |  반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 25 |  반복 141 / 351 | 시간 3[s] | 손실 0.28
| 에폭 25 |  반복 161 / 351 | 시간 4[s] | 손실 0.28
| 에폭 25 |  반복 181 / 351 | 시간 4[s] | 손실 0.28
| 에폭 25 |  반복 201 / 351 | 시간 5[s] | 손실 0.27
| 에폭 25 |  반복 221 / 351 | 시간 5[s] | 손실 0.29
| 에폭 25 |  반복 241 / 351 | 시간 6[s] | 손실 0.27
| 에폭 25 |  반복 261 / 351 | 시간 7[s] | 손실 0.28
| 에폭 25 |  반복 281 / 351 | 시간 7[s] | 손실 0.28
| 에폭 25 |  반복 301 / 351 | 시간 8[s] | 손실 0.27
| 에폭 25 |  반복 321 / 351 | 시간 8[s] | 손실 0.28
| 에폭 25 |  반복 341 / 351 | 시간 9[s] | 손실 0.28
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 856 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1426
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 54.060%
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()

png

4.2 엿보기(peeky)

Image('./deep_learning_2_images/fig 7-25.png', width=600)

png

Image('./deep_learning_2_images/fig 7-26.png', width=600)

png

Image('./deep_learning_2_images/fig 7-27.png', width=600)

png

PeekyDecoder 클래스

class PeekyDecoder:
    def __init__(self, vocab_size, wordvec_size, hidden_size):
        V, D, H = vocab_size, wordvec_size, hidden_size
        rn = np.random.randn

        embed_W = (rn(V, D) / 100).astype('f')
        lstm_Wx = (rn(H + D, 4 * H) / np.sqrt(H + D)).astype('f')
        lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
        lstm_b = np.zeros(4 * H).astype('f')
        affine_W = (rn(H + H, V) / np.sqrt(H + H)).astype('f')
        affine_b = np.zeros(V).astype('f')

        self.embed = TimeEmbedding(embed_W)
        self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True)
        self.affine = TimeAffine(affine_W, affine_b)

        self.params, self.grads = [], []
        for layer in (self.embed, self.lstm, self.affine):
            self.params += layer.params
            self.grads += layer.grads
        self.cache = None

    def forward(self, xs, h):
        N, T = xs.shape
        N, H = h.shape

        self.lstm.set_state(h)
        out = self.embed.forward(xs)                
        hs = np.repeat(h, T, axis=0).reshape(N, T, H)
        out = np.concatenate((hs, out), axis=2)        
        out = self.lstm.forward(out)        
        out = np.concatenate((hs, out), axis=2)        

        score = self.affine.forward(out)
        self.cache = H
        return score

    def backward(self, dscore):
        H = self.cache

        dout = self.affine.backward(dscore)
        dout, dhs0 = dout[:, :, H:], dout[:, :, :H]
        dout = self.lstm.backward(dout)
        dembed, dhs1 = dout[:, :, H:], dout[:, :, :H]
        self.embed.backward(dembed)

        dhs = dhs0 + dhs1
        dh = self.lstm.dh + np.sum(dhs, axis=1)
        return dh

    def generate(self, h, start_id, sample_size):
        sampled = []
        char_id = start_id
        self.lstm.set_state(h)

        H = h.shape[1]
        peeky_h = h.reshape(1, 1, H)
        for _ in range(sample_size):
            x = np.array([char_id]).reshape((1, 1))
            out = self.embed.forward(x)

            out = np.concatenate((peeky_h, out), axis=2)
            out = self.lstm.forward(out)
            out = np.concatenate((peeky_h, out), axis=2)
            score = self.affine.forward(out)

            char_id = np.argmax(score.flatten())
            sampled.append(char_id)

        return sampled
class PeekySeq2seq(Seq2seq):
    def __init__(self, vocab_size, wordvec_size, hidden_size):
        V, D, H = vocab_size, wordvec_size, hidden_size
        self.encoder = Encoder(V, D, H)
        self.decoder = PeekyDecoder(V, D, H)
        self.softmax = TimeSoftmaxWithLoss()

        self.params = self.encoder.params + self.decoder.params
        self.grads = self.encoder.grads + self.decoder.grads
# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq

# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()

# 입력 반전 여부 설정 =============================================
is_reverse = True
if is_reverse:
    x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================

# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0

# 일반 혹은 엿보기(Peeky) 설정 =====================================
# model = Seq2seq(vocab_size, wordvec_size, hidden_size)
model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)

acc_list = []
for epoch in range(max_epoch):
    trainer.fit(x_train, t_train, max_epoch=1,
                batch_size=batch_size, max_grad=max_grad)

    correct_num = 0
    for i in range(len(x_test)):
        question, correct = x_test[[i]], t_test[[i]]
        verbose = i < 10
        correct_num += eval_seq2seq(model, question, correct,
                                    id_to_char, verbose, is_reverse)

    acc = float(correct_num) / len(x_test)
    acc_list.append(acc)
    print('검증 정확도 %.3f%%' % (acc * 100))
| 에폭 1 |  반복 1 / 351 | 시간 0[s] | 손실 2.57
| 에폭 1 |  반복 21 / 351 | 시간 0[s] | 손실 2.48
| 에폭 1 |  반복 41 / 351 | 시간 1[s] | 손실 2.20
| 에폭 1 |  반복 61 / 351 | 시간 1[s] | 손실 1.99
| 에폭 1 |  반복 81 / 351 | 시간 2[s] | 손실 1.89
| 에폭 1 |  반복 101 / 351 | 시간 2[s] | 손실 1.82
| 에폭 1 |  반복 121 / 351 | 시간 3[s] | 손실 1.82
| 에폭 1 |  반복 141 / 351 | 시간 4[s] | 손실 1.80
| 에폭 1 |  반복 161 / 351 | 시간 4[s] | 손실 1.79
| 에폭 1 |  반복 181 / 351 | 시간 5[s] | 손실 1.78
| 에폭 1 |  반복 201 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 |  반복 221 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 |  반복 241 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 |  반복 261 / 351 | 시간 7[s] | 손실 1.75
| 에폭 1 |  반복 281 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 |  반복 301 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 |  반복 321 / 351 | 시간 9[s] | 손실 1.73
| 에폭 1 |  반복 341 / 351 | 시간 10[s] | 손실 1.73
Q 77+85  
T 162 
X 100 
---
Q 975+164
T 1139
X 1013
---
Q 582+84 
T 666 
X 102 
---
Q 8+155  
T 163 
X 100 
---
Q 367+55 
T 422 
X 1023
---
Q 600+257
T 857 
X 1023
---
Q 761+292
T 1053
X 1023
---
Q 830+597
T 1427
X 1111
---
Q 26+838 
T 864 
X 102 
---
Q 143+93 
T 236 
X 102 
---
검증 정확도 0.280%
| 에폭 2 |  반복 1 / 351 | 시간 0[s] | 손실 1.71
| 에폭 2 |  반복 21 / 351 | 시간 0[s] | 손실 1.71
| 에폭 2 |  반복 41 / 351 | 시간 1[s] | 손실 1.71
| 에폭 2 |  반복 61 / 351 | 시간 2[s] | 손실 1.71
| 에폭 2 |  반복 81 / 351 | 시간 2[s] | 손실 1.70
| 에폭 2 |  반복 101 / 351 | 시간 3[s] | 손실 1.68
| 에폭 2 |  반복 121 / 351 | 시간 3[s] | 손실 1.69
| 에폭 2 |  반복 141 / 351 | 시간 4[s] | 손실 1.68
| 에폭 2 |  반복 161 / 351 | 시간 4[s] | 손실 1.67
| 에폭 2 |  반복 181 / 351 | 시간 5[s] | 손실 1.67
| 에폭 2 |  반복 201 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 |  반복 221 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 |  반복 241 / 351 | 시간 7[s] | 손실 1.65
| 에폭 2 |  반복 261 / 351 | 시간 7[s] | 손실 1.63
| 에폭 2 |  반복 281 / 351 | 시간 8[s] | 손실 1.62
| 에폭 2 |  반복 301 / 351 | 시간 9[s] | 손실 1.61
| 에폭 2 |  반복 321 / 351 | 시간 9[s] | 손실 1.61
| 에폭 2 |  반복 341 / 351 | 시간 10[s] | 손실 1.60
Q 77+85  
T 162 
X 100 
---
Q 975+164
T 1139
X 1200
---
Q 582+84 
T 666 
X 690 
---
Q 8+155  
T 163 
X 100 
---
Q 367+55 
T 422 
X 690 
---
Q 600+257
T 857 
X 999 
---
Q 761+292
T 1053
X 1029
---
Q 830+597
T 1427
X 1240
---
Q 26+838 
T 864 
X 792 
---
Q 143+93 
T 236 
X 290 
---
검증 정확도 0.400%
| 에폭 3 |  반복 1 / 351 | 시간 0[s] | 손실 1.58
| 에폭 3 |  반복 21 / 351 | 시간 0[s] | 손실 1.59
| 에폭 3 |  반복 41 / 351 | 시간 1[s] | 손실 1.58
| 에폭 3 |  반복 61 / 351 | 시간 2[s] | 손실 1.56
| 에폭 3 |  반복 81 / 351 | 시간 2[s] | 손실 1.55
| 에폭 3 |  반복 101 / 351 | 시간 3[s] | 손실 1.53
| 에폭 3 |  반복 121 / 351 | 시간 4[s] | 손실 1.51
| 에폭 3 |  반복 141 / 351 | 시간 4[s] | 손실 1.50
| 에폭 3 |  반복 161 / 351 | 시간 5[s] | 손실 1.49
| 에폭 3 |  반복 181 / 351 | 시간 5[s] | 손실 1.47
| 에폭 3 |  반복 201 / 351 | 시간 6[s] | 손실 1.46
| 에폭 3 |  반복 221 / 351 | 시간 7[s] | 손실 1.43
| 에폭 3 |  반복 241 / 351 | 시간 7[s] | 손실 1.42
| 에폭 3 |  반복 261 / 351 | 시간 8[s] | 손실 1.41
| 에폭 3 |  반복 281 / 351 | 시간 9[s] | 손실 1.39
| 에폭 3 |  반복 301 / 351 | 시간 9[s] | 손실 1.37
| 에폭 3 |  반복 321 / 351 | 시간 10[s] | 손실 1.36
| 에폭 3 |  반복 341 / 351 | 시간 11[s] | 손실 1.35
Q 77+85  
T 162 
X 154 
---
Q 975+164
T 1139
X 1033
---
Q 582+84 
T 666 
X 644 
---
Q 8+155  
T 163 
X 161 
---
Q 367+55 
T 422 
X 433 
---
Q 600+257
T 857 
X 818 
---
Q 761+292
T 1053
X 1018
---
Q 830+597
T 1427
X 1344
---
Q 26+838 
T 864 
X 834 
---
Q 143+93 
T 236 
X 211 
---
검증 정확도 1.600%
| 에폭 4 |  반복 1 / 351 | 시간 0[s] | 손실 1.32
| 에폭 4 |  반복 21 / 351 | 시간 0[s] | 손실 1.32
| 에폭 4 |  반복 41 / 351 | 시간 1[s] | 손실 1.30
| 에폭 4 |  반복 61 / 351 | 시간 1[s] | 손실 1.30
| 에폭 4 |  반복 81 / 351 | 시간 2[s] | 손실 1.28
| 에폭 4 |  반복 101 / 351 | 시간 3[s] | 손실 1.27
| 에폭 4 |  반복 121 / 351 | 시간 3[s] | 손실 1.25
| 에폭 4 |  반복 141 / 351 | 시간 4[s] | 손실 1.24
| 에폭 4 |  반복 161 / 351 | 시간 4[s] | 손실 1.22
| 에폭 4 |  반복 181 / 351 | 시간 5[s] | 손실 1.21
| 에폭 4 |  반복 201 / 351 | 시간 6[s] | 손실 1.20
| 에폭 4 |  반복 221 / 351 | 시간 6[s] | 손실 1.20
| 에폭 4 |  반복 241 / 351 | 시간 7[s] | 손실 1.17
| 에폭 4 |  반복 261 / 351 | 시간 7[s] | 손실 1.16
| 에폭 4 |  반복 281 / 351 | 시간 8[s] | 손실 1.14
| 에폭 4 |  반복 301 / 351 | 시간 9[s] | 손실 1.12
| 에폭 4 |  반복 321 / 351 | 시간 9[s] | 손실 1.11
| 에폭 4 |  반복 341 / 351 | 시간 10[s] | 손실 1.10
Q 77+85  
T 162 
X 158 
---
Q 975+164
T 1139
X 1123
---
Q 582+84 
T 666 
X 657 
---
Q 8+155  
T 163 
X 165 
---
Q 367+55 
T 422 
X 423 
---
Q 600+257
T 857 
X 777 
---
Q 761+292
T 1053
X 1023
---
Q 830+597
T 1427
X 1388
---
Q 26+838 
T 864 
X 887 
---
Q 143+93 
T 236 
X 223 
---
검증 정확도 5.140%
| 에폭 5 |  반복 1 / 351 | 시간 0[s] | 손실 1.08
| 에폭 5 |  반복 21 / 351 | 시간 0[s] | 손실 1.07
| 에폭 5 |  반복 41 / 351 | 시간 1[s] | 손실 1.05
| 에폭 5 |  반복 61 / 351 | 시간 1[s] | 손실 1.04
| 에폭 5 |  반복 81 / 351 | 시간 2[s] | 손실 1.02
| 에폭 5 |  반복 101 / 351 | 시간 3[s] | 손실 1.01
| 에폭 5 |  반복 121 / 351 | 시간 3[s] | 손실 1.00
| 에폭 5 |  반복 141 / 351 | 시간 4[s] | 손실 0.99
| 에폭 5 |  반복 161 / 351 | 시간 4[s] | 손실 0.99
| 에폭 5 |  반복 181 / 351 | 시간 5[s] | 손실 0.96
| 에폭 5 |  반복 201 / 351 | 시간 6[s] | 손실 0.95
| 에폭 5 |  반복 221 / 351 | 시간 7[s] | 손실 0.94
| 에폭 5 |  반복 241 / 351 | 시간 7[s] | 손실 0.92
| 에폭 5 |  반복 261 / 351 | 시간 8[s] | 손실 0.91
| 에폭 5 |  반복 281 / 351 | 시간 8[s] | 손실 0.90
| 에폭 5 |  반복 301 / 351 | 시간 9[s] | 손실 0.89
| 에폭 5 |  반복 321 / 351 | 시간 10[s] | 손실 0.88
| 에폭 5 |  반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85  
T 162 
X 160 
---
Q 975+164
T 1139
X 1135
---
Q 582+84 
T 666 
X 668 
---
Q 8+155  
T 163 
X 169 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 861 
---
Q 761+292
T 1053
X 1045
---
Q 830+597
T 1427
X 1324
---
Q 26+838 
T 864 
X 861 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 9.380%
| 에폭 6 |  반복 1 / 351 | 시간 0[s] | 손실 0.90
| 에폭 6 |  반복 21 / 351 | 시간 0[s] | 손실 0.86
| 에폭 6 |  반복 41 / 351 | 시간 1[s] | 손실 0.83
| 에폭 6 |  반복 61 / 351 | 시간 1[s] | 손실 0.84
| 에폭 6 |  반복 81 / 351 | 시간 2[s] | 손실 0.82
| 에폭 6 |  반복 101 / 351 | 시간 3[s] | 손실 0.81
| 에폭 6 |  반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 6 |  반복 141 / 351 | 시간 4[s] | 손실 0.79
| 에폭 6 |  반복 161 / 351 | 시간 5[s] | 손실 0.78
| 에폭 6 |  반복 181 / 351 | 시간 5[s] | 손실 0.77
| 에폭 6 |  반복 201 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 |  반복 221 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 |  반복 241 / 351 | 시간 7[s] | 손실 0.74
| 에폭 6 |  반복 261 / 351 | 시간 8[s] | 손실 0.74
| 에폭 6 |  반복 281 / 351 | 시간 8[s] | 손실 0.73
| 에폭 6 |  반복 301 / 351 | 시간 9[s] | 손실 0.72
| 에폭 6 |  반복 321 / 351 | 시간 10[s] | 손실 0.72
| 에폭 6 |  반복 341 / 351 | 시간 10[s] | 손실 0.71
Q 77+85  
T 162 
X 163 
---
Q 975+164
T 1139
X 1138
---
Q 582+84 
T 666 
X 668 
---
Q 8+155  
T 163 
X 166 
---
Q 367+55 
T 422 
X 423 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
X 1048
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
X 873 
---
Q 143+93 
T 236 
X 239 
---
검증 정확도 15.040%
| 에폭 7 |  반복 1 / 351 | 시간 0[s] | 손실 0.68
| 에폭 7 |  반복 21 / 351 | 시간 0[s] | 손실 0.69
| 에폭 7 |  반복 41 / 351 | 시간 1[s] | 손실 0.67
| 에폭 7 |  반복 61 / 351 | 시간 1[s] | 손실 0.66
| 에폭 7 |  반복 81 / 351 | 시간 2[s] | 손실 0.66
| 에폭 7 |  반복 101 / 351 | 시간 2[s] | 손실 0.65
| 에폭 7 |  반복 121 / 351 | 시간 3[s] | 손실 0.65
| 에폭 7 |  반복 141 / 351 | 시간 4[s] | 손실 0.64
| 에폭 7 |  반복 161 / 351 | 시간 4[s] | 손실 0.63
| 에폭 7 |  반복 181 / 351 | 시간 5[s] | 손실 0.61
| 에폭 7 |  반복 201 / 351 | 시간 5[s] | 손실 0.61
| 에폭 7 |  반복 221 / 351 | 시간 6[s] | 손실 0.60
| 에폭 7 |  반복 241 / 351 | 시간 7[s] | 손실 0.57
| 에폭 7 |  반복 261 / 351 | 시간 7[s] | 손실 0.57
| 에폭 7 |  반복 281 / 351 | 시간 8[s] | 손실 0.57
| 에폭 7 |  반복 301 / 351 | 시간 9[s] | 손실 0.55
| 에폭 7 |  반복 321 / 351 | 시간 9[s] | 손실 0.54
| 에폭 7 |  반복 341 / 351 | 시간 10[s] | 손실 0.53
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 665 
---
Q 8+155  
T 163 
X 156 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
X 858 
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1428
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
X 235 
---
검증 정확도 39.100%
| 에폭 8 |  반복 1 / 351 | 시간 0[s] | 손실 0.51
| 에폭 8 |  반복 21 / 351 | 시간 0[s] | 손실 0.50
| 에폭 8 |  반복 41 / 351 | 시간 1[s] | 손실 0.49
| 에폭 8 |  반복 61 / 351 | 시간 1[s] | 손실 0.48
| 에폭 8 |  반복 81 / 351 | 시간 2[s] | 손실 0.47
| 에폭 8 |  반복 101 / 351 | 시간 3[s] | 손실 0.46
| 에폭 8 |  반복 121 / 351 | 시간 3[s] | 손실 0.46
| 에폭 8 |  반복 141 / 351 | 시간 4[s] | 손실 0.44
| 에폭 8 |  반복 161 / 351 | 시간 5[s] | 손실 0.41
| 에폭 8 |  반복 181 / 351 | 시간 5[s] | 손실 0.42
| 에폭 8 |  반복 201 / 351 | 시간 6[s] | 손실 0.41
| 에폭 8 |  반복 221 / 351 | 시간 7[s] | 손실 0.40
| 에폭 8 |  반복 241 / 351 | 시간 7[s] | 손실 0.39
| 에폭 8 |  반복 261 / 351 | 시간 8[s] | 손실 0.37
| 에폭 8 |  반복 281 / 351 | 시간 9[s] | 손실 0.36
| 에폭 8 |  반복 301 / 351 | 시간 9[s] | 손실 0.36
| 에폭 8 |  반복 321 / 351 | 시간 10[s] | 손실 0.35
| 에폭 8 |  반복 341 / 351 | 시간 11[s] | 손실 0.34
Q 77+85  
T 162 
X 161 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 657 
---
Q 8+155  
T 163 
X 155 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1438
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 65.060%
| 에폭 9 |  반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 9 |  반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 9 |  반복 41 / 351 | 시간 1[s] | 손실 0.31
| 에폭 9 |  반복 61 / 351 | 시간 1[s] | 손실 0.31
| 에폭 9 |  반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 9 |  반복 101 / 351 | 시간 2[s] | 손실 0.29
| 에폭 9 |  반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 9 |  반복 141 / 351 | 시간 4[s] | 손실 0.27
| 에폭 9 |  반복 161 / 351 | 시간 4[s] | 손실 0.27
| 에폭 9 |  반복 181 / 351 | 시간 5[s] | 손실 0.26
| 에폭 9 |  반복 201 / 351 | 시간 5[s] | 손실 0.25
| 에폭 9 |  반복 221 / 351 | 시간 6[s] | 손실 0.25
| 에폭 9 |  반복 241 / 351 | 시간 7[s] | 손실 0.24
| 에폭 9 |  반복 261 / 351 | 시간 7[s] | 손실 0.24
| 에폭 9 |  반복 281 / 351 | 시간 8[s] | 손실 0.23
| 에폭 9 |  반복 301 / 351 | 시간 8[s] | 손실 0.22
| 에폭 9 |  반복 321 / 351 | 시간 9[s] | 손실 0.22
| 에폭 9 |  반복 341 / 351 | 시간 10[s] | 손실 0.21
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
X 1140
---
Q 582+84 
T 666 
X 657 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 83.280%
| 에폭 10 |  반복 1 / 351 | 시간 0[s] | 손실 0.22
| 에폭 10 |  반복 21 / 351 | 시간 0[s] | 손실 0.20
| 에폭 10 |  반복 41 / 351 | 시간 1[s] | 손실 0.20
| 에폭 10 |  반복 61 / 351 | 시간 1[s] | 손실 0.20
| 에폭 10 |  반복 81 / 351 | 시간 2[s] | 손실 0.18
| 에폭 10 |  반복 101 / 351 | 시간 2[s] | 손실 0.17
| 에폭 10 |  반복 121 / 351 | 시간 3[s] | 손실 0.18
| 에폭 10 |  반복 141 / 351 | 시간 4[s] | 손실 0.17
| 에폭 10 |  반복 161 / 351 | 시간 4[s] | 손실 0.17
| 에폭 10 |  반복 181 / 351 | 시간 5[s] | 손실 0.17
| 에폭 10 |  반복 201 / 351 | 시간 5[s] | 손실 0.17
| 에폭 10 |  반복 221 / 351 | 시간 6[s] | 손실 0.16
| 에폭 10 |  반복 241 / 351 | 시간 7[s] | 손실 0.15
| 에폭 10 |  반복 261 / 351 | 시간 7[s] | 손실 0.15
| 에폭 10 |  반복 281 / 351 | 시간 8[s] | 손실 0.15
| 에폭 10 |  반복 301 / 351 | 시간 9[s] | 손실 0.15
| 에폭 10 |  반복 321 / 351 | 시간 9[s] | 손실 0.14
| 에폭 10 |  반복 341 / 351 | 시간 10[s] | 손실 0.14
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
X 656 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 88.400%
| 에폭 11 |  반복 1 / 351 | 시간 0[s] | 손실 0.13
| 에폭 11 |  반복 21 / 351 | 시간 0[s] | 손실 0.13
| 에폭 11 |  반복 41 / 351 | 시간 1[s] | 손실 0.13
| 에폭 11 |  반복 61 / 351 | 시간 1[s] | 손실 0.12
| 에폭 11 |  반복 81 / 351 | 시간 2[s] | 손실 0.12
| 에폭 11 |  반복 101 / 351 | 시간 3[s] | 손실 0.12
| 에폭 11 |  반복 121 / 351 | 시간 3[s] | 손실 0.11
| 에폭 11 |  반복 141 / 351 | 시간 4[s] | 손실 0.12
| 에폭 11 |  반복 161 / 351 | 시간 5[s] | 손실 0.11
| 에폭 11 |  반복 181 / 351 | 시간 5[s] | 손실 0.11
| 에폭 11 |  반복 201 / 351 | 시간 6[s] | 손실 0.12
| 에폭 11 |  반복 221 / 351 | 시간 7[s] | 손실 0.11
| 에폭 11 |  반복 241 / 351 | 시간 7[s] | 손실 0.11
| 에폭 11 |  반복 261 / 351 | 시간 8[s] | 손실 0.10
| 에폭 11 |  반복 281 / 351 | 시간 8[s] | 손실 0.10
| 에폭 11 |  반복 301 / 351 | 시간 9[s] | 손실 0.10
| 에폭 11 |  반복 321 / 351 | 시간 9[s] | 손실 0.09
| 에폭 11 |  반복 341 / 351 | 시간 10[s] | 손실 0.09
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 90.940%
| 에폭 12 |  반복 1 / 351 | 시간 0[s] | 손실 0.09
| 에폭 12 |  반복 21 / 351 | 시간 0[s] | 손실 0.09
| 에폭 12 |  반복 41 / 351 | 시간 1[s] | 손실 0.09
| 에폭 12 |  반복 61 / 351 | 시간 1[s] | 손실 0.09
| 에폭 12 |  반복 81 / 351 | 시간 2[s] | 손실 0.09
| 에폭 12 |  반복 101 / 351 | 시간 2[s] | 손실 0.08
| 에폭 12 |  반복 121 / 351 | 시간 3[s] | 손실 0.08
| 에폭 12 |  반복 141 / 351 | 시간 4[s] | 손실 0.08
| 에폭 12 |  반복 161 / 351 | 시간 4[s] | 손실 0.08
| 에폭 12 |  반복 181 / 351 | 시간 5[s] | 손실 0.08
| 에폭 12 |  반복 201 / 351 | 시간 5[s] | 손실 0.08
| 에폭 12 |  반복 221 / 351 | 시간 6[s] | 손실 0.09
| 에폭 12 |  반복 241 / 351 | 시간 7[s] | 손실 0.09
| 에폭 12 |  반복 261 / 351 | 시간 7[s] | 손실 0.09
| 에폭 12 |  반복 281 / 351 | 시간 8[s] | 손실 0.08
| 에폭 12 |  반복 301 / 351 | 시간 8[s] | 손실 0.08
| 에폭 12 |  반복 321 / 351 | 시간 9[s] | 손실 0.07
| 에폭 12 |  반복 341 / 351 | 시간 10[s] | 손실 0.08
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 92.220%
| 에폭 13 |  반복 1 / 351 | 시간 0[s] | 손실 0.07
| 에폭 13 |  반복 21 / 351 | 시간 0[s] | 손실 0.07
| 에폭 13 |  반복 41 / 351 | 시간 1[s] | 손실 0.07
| 에폭 13 |  반복 61 / 351 | 시간 2[s] | 손실 0.07
| 에폭 13 |  반복 81 / 351 | 시간 2[s] | 손실 0.06
| 에폭 13 |  반복 101 / 351 | 시간 3[s] | 손실 0.06
| 에폭 13 |  반복 121 / 351 | 시간 4[s] | 손실 0.07
| 에폭 13 |  반복 141 / 351 | 시간 4[s] | 손실 0.06
| 에폭 13 |  반복 161 / 351 | 시간 5[s] | 손실 0.06
| 에폭 13 |  반복 181 / 351 | 시간 6[s] | 손실 0.06
| 에폭 13 |  반복 201 / 351 | 시간 6[s] | 손실 0.06
| 에폭 13 |  반복 221 / 351 | 시간 7[s] | 손실 0.06
| 에폭 13 |  반복 241 / 351 | 시간 8[s] | 손실 0.06
| 에폭 13 |  반복 261 / 351 | 시간 8[s] | 손실 0.06
| 에폭 13 |  반복 281 / 351 | 시간 9[s] | 손실 0.06
| 에폭 13 |  반복 301 / 351 | 시간 10[s] | 손실 0.05
| 에폭 13 |  반복 321 / 351 | 시간 10[s] | 손실 0.05
| 에폭 13 |  반복 341 / 351 | 시간 11[s] | 손실 0.06
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 94.380%
| 에폭 14 |  반복 1 / 351 | 시간 0[s] | 손실 0.05
| 에폭 14 |  반복 21 / 351 | 시간 0[s] | 손실 0.05
| 에폭 14 |  반복 41 / 351 | 시간 1[s] | 손실 0.05
| 에폭 14 |  반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 14 |  반복 81 / 351 | 시간 2[s] | 손실 0.05
| 에폭 14 |  반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 14 |  반복 121 / 351 | 시간 4[s] | 손실 0.05
| 에폭 14 |  반복 141 / 351 | 시간 4[s] | 손실 0.05
| 에폭 14 |  반복 161 / 351 | 시간 5[s] | 손실 0.05
| 에폭 14 |  반복 181 / 351 | 시간 6[s] | 손실 0.05
| 에폭 14 |  반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 14 |  반복 221 / 351 | 시간 7[s] | 손실 0.06
| 에폭 14 |  반복 241 / 351 | 시간 8[s] | 손실 0.06
| 에폭 14 |  반복 261 / 351 | 시간 8[s] | 손실 0.07
| 에폭 14 |  반복 281 / 351 | 시간 9[s] | 손실 0.06
| 에폭 14 |  반복 301 / 351 | 시간 9[s] | 손실 0.06
| 에폭 14 |  반복 321 / 351 | 시간 10[s] | 손실 0.05
| 에폭 14 |  반복 341 / 351 | 시간 11[s] | 손실 0.05
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 94.660%
| 에폭 15 |  반복 1 / 351 | 시간 0[s] | 손실 0.04
| 에폭 15 |  반복 21 / 351 | 시간 0[s] | 손실 0.04
| 에폭 15 |  반복 41 / 351 | 시간 1[s] | 손실 0.04
| 에폭 15 |  반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 15 |  반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 15 |  반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 15 |  반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 15 |  반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 15 |  반복 161 / 351 | 시간 5[s] | 손실 0.05
| 에폭 15 |  반복 181 / 351 | 시간 6[s] | 손실 0.07
| 에폭 15 |  반복 201 / 351 | 시간 6[s] | 손실 0.06
| 에폭 15 |  반복 221 / 351 | 시간 7[s] | 손실 0.05
| 에폭 15 |  반복 241 / 351 | 시간 8[s] | 손실 0.05
| 에폭 15 |  반복 261 / 351 | 시간 9[s] | 손실 0.05
| 에폭 15 |  반복 281 / 351 | 시간 9[s] | 손실 0.04
| 에폭 15 |  반복 301 / 351 | 시간 10[s] | 손실 0.04
| 에폭 15 |  반복 321 / 351 | 시간 11[s] | 손실 0.04
| 에폭 15 |  반복 341 / 351 | 시간 11[s] | 손실 0.04
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 97.080%
| 에폭 16 |  반복 1 / 351 | 시간 0[s] | 손실 0.03
| 에폭 16 |  반복 21 / 351 | 시간 0[s] | 손실 0.03
| 에폭 16 |  반복 41 / 351 | 시간 1[s] | 손실 0.03
| 에폭 16 |  반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 16 |  반복 81 / 351 | 시간 2[s] | 손실 0.03
| 에폭 16 |  반복 101 / 351 | 시간 3[s] | 손실 0.04
| 에폭 16 |  반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 16 |  반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 16 |  반복 161 / 351 | 시간 5[s] | 손실 0.04
| 에폭 16 |  반복 181 / 351 | 시간 6[s] | 손실 0.05
| 에폭 16 |  반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 16 |  반복 221 / 351 | 시간 7[s] | 손실 0.04
| 에폭 16 |  반복 241 / 351 | 시간 8[s] | 손실 0.04
| 에폭 16 |  반복 261 / 351 | 시간 8[s] | 손실 0.04
| 에폭 16 |  반복 281 / 351 | 시간 9[s] | 손실 0.04
| 에폭 16 |  반복 301 / 351 | 시간 10[s] | 손실 0.04
| 에폭 16 |  반복 321 / 351 | 시간 10[s] | 손실 0.04
| 에폭 16 |  반복 341 / 351 | 시간 11[s] | 손실 0.04
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 95.700%
| 에폭 17 |  반복 1 / 351 | 시간 0[s] | 손실 0.04
| 에폭 17 |  반복 21 / 351 | 시간 0[s] | 손실 0.04
| 에폭 17 |  반복 41 / 351 | 시간 1[s] | 손실 0.04
| 에폭 17 |  반복 61 / 351 | 시간 2[s] | 손실 0.06
| 에폭 17 |  반복 81 / 351 | 시간 2[s] | 손실 0.07
| 에폭 17 |  반복 101 / 351 | 시간 3[s] | 손실 0.06
| 에폭 17 |  반복 121 / 351 | 시간 4[s] | 손실 0.05
| 에폭 17 |  반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 17 |  반복 161 / 351 | 시간 5[s] | 손실 0.04
| 에폭 17 |  반복 181 / 351 | 시간 6[s] | 손실 0.03
| 에폭 17 |  반복 201 / 351 | 시간 6[s] | 손실 0.03
| 에폭 17 |  반복 221 / 351 | 시간 7[s] | 손실 0.03
| 에폭 17 |  반복 241 / 351 | 시간 8[s] | 손실 0.03
| 에폭 17 |  반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 17 |  반복 281 / 351 | 시간 9[s] | 손실 0.03
| 에폭 17 |  반복 301 / 351 | 시간 10[s] | 손실 0.03
| 에폭 17 |  반복 321 / 351 | 시간 10[s] | 손실 0.03
| 에폭 17 |  반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 98.160%
| 에폭 18 |  반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 18 |  반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 18 |  반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 18 |  반복 61 / 351 | 시간 1[s] | 손실 0.02
| 에폭 18 |  반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 18 |  반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 18 |  반복 121 / 351 | 시간 3[s] | 손실 0.02
| 에폭 18 |  반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 18 |  반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 18 |  반복 181 / 351 | 시간 5[s] | 손실 0.02
| 에폭 18 |  반복 201 / 351 | 시간 6[s] | 손실 0.02
| 에폭 18 |  반복 221 / 351 | 시간 6[s] | 손실 0.02
| 에폭 18 |  반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 18 |  반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 18 |  반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 18 |  반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 18 |  반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 18 |  반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 97.780%
| 에폭 19 |  반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 19 |  반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 19 |  반복 41 / 351 | 시간 1[s] | 손실 0.03
| 에폭 19 |  반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 19 |  반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 19 |  반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 19 |  반복 121 / 351 | 시간 3[s] | 손실 0.06
| 에폭 19 |  반복 141 / 351 | 시간 4[s] | 손실 0.05
| 에폭 19 |  반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 19 |  반복 181 / 351 | 시간 5[s] | 손실 0.04
| 에폭 19 |  반복 201 / 351 | 시간 6[s] | 손실 0.03
| 에폭 19 |  반복 221 / 351 | 시간 7[s] | 손실 0.03
| 에폭 19 |  반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 19 |  반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 19 |  반복 281 / 351 | 시간 9[s] | 손실 0.03
| 에폭 19 |  반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 19 |  반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 19 |  반복 341 / 351 | 시간 11[s] | 손실 0.03
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 98.080%
| 에폭 20 |  반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 20 |  반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 20 |  반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 20 |  반복 61 / 351 | 시간 1[s] | 손실 0.02
| 에폭 20 |  반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 20 |  반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 20 |  반복 121 / 351 | 시간 3[s] | 손실 0.02
| 에폭 20 |  반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 20 |  반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 20 |  반복 181 / 351 | 시간 5[s] | 손실 0.04
| 에폭 20 |  반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 20 |  반복 221 / 351 | 시간 6[s] | 손실 0.03
| 에폭 20 |  반복 241 / 351 | 시간 7[s] | 손실 0.06
| 에폭 20 |  반복 261 / 351 | 시간 8[s] | 손실 0.06
| 에폭 20 |  반복 281 / 351 | 시간 8[s] | 손실 0.03
| 에폭 20 |  반복 301 / 351 | 시간 9[s] | 손실 0.03
| 에폭 20 |  반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 20 |  반복 341 / 351 | 시간 10[s] | 손실 0.02
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 97.600%
| 에폭 21 |  반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 21 |  반복 21 / 351 | 시간 0[s] | 손실 0.01
| 에폭 21 |  반복 41 / 351 | 시간 1[s] | 손실 0.01
| 에폭 21 |  반복 61 / 351 | 시간 2[s] | 손실 0.01
| 에폭 21 |  반복 81 / 351 | 시간 2[s] | 손실 0.01
| 에폭 21 |  반복 101 / 351 | 시간 3[s] | 손실 0.01
| 에폭 21 |  반복 121 / 351 | 시간 3[s] | 손실 0.01
| 에폭 21 |  반복 141 / 351 | 시간 4[s] | 손실 0.01
| 에폭 21 |  반복 161 / 351 | 시간 5[s] | 손실 0.01
| 에폭 21 |  반복 181 / 351 | 시간 5[s] | 손실 0.01
| 에폭 21 |  반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 21 |  반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 21 |  반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 21 |  반복 261 / 351 | 시간 8[s] | 손실 0.02
| 에폭 21 |  반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 21 |  반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 21 |  반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 21 |  반복 341 / 351 | 시간 10[s] | 손실 0.03
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 95.020%
| 에폭 22 |  반복 1 / 351 | 시간 0[s] | 손실 0.05
| 에폭 22 |  반복 21 / 351 | 시간 0[s] | 손실 0.07
| 에폭 22 |  반복 41 / 351 | 시간 1[s] | 손실 0.08
| 에폭 22 |  반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 22 |  반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 22 |  반복 101 / 351 | 시간 3[s] | 손실 0.03
| 에폭 22 |  반복 121 / 351 | 시간 4[s] | 손실 0.02
| 에폭 22 |  반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 22 |  반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 22 |  반복 181 / 351 | 시간 6[s] | 손실 0.02
| 에폭 22 |  반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 22 |  반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 22 |  반복 241 / 351 | 시간 7[s] | 손실 0.01
| 에폭 22 |  반복 261 / 351 | 시간 8[s] | 손실 0.01
| 에폭 22 |  반복 281 / 351 | 시간 9[s] | 손실 0.01
| 에폭 22 |  반복 301 / 351 | 시간 10[s] | 손실 0.01
| 에폭 22 |  반복 321 / 351 | 시간 10[s] | 손실 0.01
| 에폭 22 |  반복 341 / 351 | 시간 11[s] | 손실 0.01
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 97.860%
| 에폭 23 |  반복 1 / 351 | 시간 0[s] | 손실 0.01
| 에폭 23 |  반복 21 / 351 | 시간 0[s] | 손실 0.01
| 에폭 23 |  반복 41 / 351 | 시간 1[s] | 손실 0.01
| 에폭 23 |  반복 61 / 351 | 시간 2[s] | 손실 0.01
| 에폭 23 |  반복 81 / 351 | 시간 2[s] | 손실 0.01
| 에폭 23 |  반복 101 / 351 | 시간 3[s] | 손실 0.01
| 에폭 23 |  반복 121 / 351 | 시간 3[s] | 손실 0.01
| 에폭 23 |  반복 141 / 351 | 시간 4[s] | 손실 0.01
| 에폭 23 |  반복 161 / 351 | 시간 5[s] | 손실 0.01
| 에폭 23 |  반복 181 / 351 | 시간 5[s] | 손실 0.01
| 에폭 23 |  반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 23 |  반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 23 |  반복 241 / 351 | 시간 7[s] | 손실 0.01
| 에폭 23 |  반복 261 / 351 | 시간 8[s] | 손실 0.01
| 에폭 23 |  반복 281 / 351 | 시간 8[s] | 손실 0.01
| 에폭 23 |  반복 301 / 351 | 시간 9[s] | 손실 0.01
| 에폭 23 |  반복 321 / 351 | 시간 10[s] | 손실 0.03
| 에폭 23 |  반복 341 / 351 | 시간 10[s] | 손실 0.04
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
X 874 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 95.800%
| 에폭 24 |  반복 1 / 351 | 시간 0[s] | 손실 0.03
| 에폭 24 |  반복 21 / 351 | 시간 0[s] | 손실 0.03
| 에폭 24 |  반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 24 |  반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 24 |  반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 24 |  반복 101 / 351 | 시간 3[s] | 손실 0.04
| 에폭 24 |  반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 24 |  반복 141 / 351 | 시간 4[s] | 손실 0.03
| 에폭 24 |  반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 24 |  반복 181 / 351 | 시간 5[s] | 손실 0.02
| 에폭 24 |  반복 201 / 351 | 시간 6[s] | 손실 0.02
| 에폭 24 |  반복 221 / 351 | 시간 7[s] | 손실 0.02
| 에폭 24 |  반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 24 |  반복 261 / 351 | 시간 8[s] | 손실 0.02
| 에폭 24 |  반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 24 |  반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 24 |  반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 24 |  반복 341 / 351 | 시간 10[s] | 손실 0.02
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 97.480%
| 에폭 25 |  반복 1 / 351 | 시간 0[s] | 손실 0.01
| 에폭 25 |  반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 25 |  반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 25 |  반복 61 / 351 | 시간 2[s] | 손실 0.02
| 에폭 25 |  반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 25 |  반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 25 |  반복 121 / 351 | 시간 4[s] | 손실 0.02
| 에폭 25 |  반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 25 |  반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 25 |  반복 181 / 351 | 시간 6[s] | 손실 0.01
| 에폭 25 |  반복 201 / 351 | 시간 7[s] | 손실 0.01
| 에폭 25 |  반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 25 |  반복 241 / 351 | 시간 8[s] | 손실 0.01
| 에폭 25 |  반복 261 / 351 | 시간 9[s] | 손실 0.02
| 에폭 25 |  반복 281 / 351 | 시간 9[s] | 손실 0.02
| 에폭 25 |  반복 301 / 351 | 시간 10[s] | 손실 0.02
| 에폭 25 |  반복 321 / 351 | 시간 11[s] | 손실 0.02
| 에폭 25 |  반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85  
T 162 
O 162 
---
Q 975+164
T 1139
O 1139
---
Q 582+84 
T 666 
O 666 
---
Q 8+155  
T 163 
O 163 
---
Q 367+55 
T 422 
O 422 
---
Q 600+257
T 857 
O 857 
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1437
---
Q 26+838 
T 864 
O 864 
---
Q 143+93 
T 236 
O 236 
---
검증 정확도 96.120%
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()

png

Reference

댓글남기기