Rnn 14 (rnn을 사용한 문장 생성)
RNN을 사용한 문장 생성
1. 언어 모델을 사용한 문장 생성
1.1 RNN을 사용한 문장 생성의 순서
from IPython.display import Image
Image('./deep_learning_2_images/fig 7-1.png', width=600)
Image('./deep_learning_2_images/fig 7-2.png', width=400)
Image('./deep_learning_2_images/fig 7-3.png', width=300)
Image('./deep_learning_2_images/fig 7-4.png', width=450)
1.2 문장 생성 구현
from common.base_model import BaseModel
from common.time_layers import *
class Rnnlm(BaseModel):
def __init__(self, vocab_size=10000, wordvec_size=100, hidden_size=100):
V, D, H = vocab_size, wordvec_size, hidden_size
rn = np.random.randn
# 가중치 초기화
embed_W = (rn(V, D) / 100).astype('f')
lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b = np.zeros(4 * H).astype('f')
affine_W = (rn(H, V) / np.sqrt(H)).astype('f')
affine_b = np.zeros(V).astype('f')
# 계층 생성
self.layers = [
TimeEmbedding(embed_W),
TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True),
TimeAffine(affine_W, affine_b)
]
self.loss_layer = TimeSoftmaxWithLoss()
self.lstm_layer = self.layers[1]
# 모든 가중치와 기울기를 리스트에 모은다.
self.params, self.grads = [], []
for layer in self.layers:
self.params += layer.params
self.grads += layer.grads
def predict(self, xs):
for layer in self.layers:
xs = layer.forward(xs)
return xs
def forward(self, xs, ts):
score = self.predict(xs)
loss = self.loss_layer.forward(score, ts)
return loss
def backward(self, dout=1):
dout = self.loss_layer.backward(dout)
for layer in reversed(self.layers):
dout = layer.backward(dout)
return dout
def reset_state(self):
self.lstm_layer.reset_state()
RnnlmGen 클래스
class RnnlmGen(Rnnlm):
def generate(self, start_id, skip_ids=None, sample_size=100):
word_ids = [start_id]
x = start_id
while len(word_ids) < sample_size:
x = np.array(x).reshape(1, 1)
score = self.predict(x)
p = softmax(score.flatten())
sampled = np.random.choice(len(p), size=1, p=p)
if (skip_ids is None) or (sampled not in skip_ids):
x = sampled
word_ids.append(int(x))
return word_ids
def get_state(self):
return self.lstm_layer.h, self.lstm_layer.c
def set_state(self, state):
self.lstm_layer.set_state(*state)
Rnnlm으로 문장 생성
from dataset import ptb
corpus, word_to_id, id_to_word = ptb.load_data('train')
vocab_size = len(word_to_id)
corpus_size = len(corpus)
model = RnnlmGen()
model.load_params('Rnnlm.pkl')
# start 문자와 skip 문자 설정
start_word = 'you'
start_id = word_to_id[start_word]
skip_words = ['N', '<unk>', '$']
skip_ids = [word_to_id[w] for w in skip_words]
# 문장 생성
word_ids = model.generate(start_id, skip_ids)
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print(txt)
you will take how finding it had been where about the traditional does n't aim by what 's most merely crossed the game is n't being used.
it was a very successful list if expired.
the company was sport mr. roman 's findings.
mr. roman also will pay cost kevin to bring up from ford based in capital markets and nl.
he estimated his own inside run the world 's bronx and show his name sets warned him to literature his television friend pinkerton 's i. kohl.
panamanian rules feel the beauty that and name-dropping
1.3 더 좋은 문장으로
class BetterRnnlm(BaseModel):
def __init__(self, vocab_size=10000, wordvec_size=650,
hidden_size=650, dropout_ratio=0.5):
V, D, H = vocab_size, wordvec_size, hidden_size
rn = np.random.randn
embed_W = (rn(V, D) / 100).astype('f')
lstm_Wx1 = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
lstm_Wh1 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b1 = np.zeros(4 * H).astype('f')
lstm_Wx2 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_Wh2 = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b2 = np.zeros(4 * H).astype('f')
affine_b = np.zeros(V).astype('f')
self.layers = [
TimeEmbedding(embed_W),
TimeDropout(dropout_ratio),
TimeLSTM(lstm_Wx1, lstm_Wh1, lstm_b1, stateful=True),
TimeDropout(dropout_ratio),
TimeLSTM(lstm_Wx2, lstm_Wh2, lstm_b2, stateful=True),
TimeDropout(dropout_ratio),
TimeAffine(embed_W.T, affine_b) # weight tying!!
]
self.loss_layer = TimeSoftmaxWithLoss()
self.lstm_layers = [self.layers[2], self.layers[4]]
self.drop_layers = [self.layers[1], self.layers[3], self.layers[5]]
self.params, self.grads = [], []
for layer in self.layers:
self.params += layer.params
self.grads += layer.grads
def predict(self, xs, train_flg=False):
for layer in self.drop_layers:
layer.train_flg = train_flg
for layer in self.layers:
xs = layer.forward(xs)
return xs
def forward(self, xs, ts, train_flg=True):
score = self.predict(xs, train_flg)
loss = self.loss_layer.forward(score, ts)
return loss
def backward(self, dout=1):
dout = self.loss_layer.backward(dout)
for layer in reversed(self.layers):
dout = layer.backward(dout)
return dout
def reset_state(self):
for layer in self.lstm_layers:
layer.reset_state()
class BetterRnnlmGen(BetterRnnlm):
def generate(self, start_id, skip_ids=None, sample_size=100):
word_ids = [start_id]
x = start_id
while len(word_ids) < sample_size:
x = np.array(x).reshape(1, 1)
score = self.predict(x).flatten()
p = softmax(score).flatten()
sampled = np.random.choice(len(p), size=1, p=p)
if (skip_ids is None) or (sampled not in skip_ids):
x = sampled
word_ids.append(int(x))
return word_ids
def get_state(self):
states = []
for layer in self.lstm_layers:
states.append((layer.h, layer.c))
return states
def set_state(self, states):
for layer, state in zip(self.lstm_layers, states):
layer.set_state(*state)
corpus, word_to_id, id_to_word = ptb.load_data('train')
vocab_size = len(word_to_id)
corpus_size = len(corpus)
model = BetterRnnlmGen()
model.load_params('./BetterRnnlm.pkl')
# start 문자와 skip 문자 설정
start_word = 'you'
start_id = word_to_id[start_word]
skip_words = ['N', '<unk>', '$']
skip_ids = [word_to_id[w] for w in skip_words]
# 문장 생성
word_ids = model.generate(start_id, skip_ids)
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print(txt)
you have invested in.
but to help meet the weekend 's interest-rate arrangements.
it 's like his right to build the world for a single market value.
cattle sales of its government units a for last year 's two category will allow the company to take a bigger role in the home increase.
though all the elderly have in the exact line of u.s. shows unfortunately of the past year is expected to be shipping at its toledo ohio headquarters.
the oldest brand for one of four exposures in tobacco factories has role along with
the meaning of life is
으로 문장 생성 실험
model.reset_state()
start_words = 'the meaning of life is'
start_ids = [word_to_id[w] for w in start_words.split(' ')]
for x in start_ids[:-1]:
x = np.array(x).reshape(1, 1)
model.predict(x)
word_ids = model.generate(start_ids[-1], skip_ids)
word_ids = start_ids[:-1] + word_ids
txt = ' '.join([id_to_word[i] for i in word_ids])
txt = txt.replace(' <eos>', '.\n')
print('-' * 50)
print(txt)
--------------------------------------------------
the meaning of life is into a different region.
it 's the answer.
trying to capture strong spirits prices were initially responsible.
but many of the side of the domestic industry two firms expect a delay by the number of foreign companies with a minimum total of about half the estimated value of problems over april.
in chicago digital are pursuing a joint venture with acquisitions.
in such a sign of growing economic stability he gave the company a crash of collection choice.
the japan market 's gyrations ending oct..
the health care development association said it
2. seq2seq
2.1 seq2seq의 원리
Image('./deep_learning_2_images/fig 7-5.png', width=300)
Image('./deep_learning_2_images/fig 7-6.png', width=600)
Image('./deep_learning_2_images/fig 7-7.png', width=450)
Image('./deep_learning_2_images/fig 7-8.png', width=600)
Image('./deep_learning_2_images/fig 7-9.png', width=700)
2.2 시계열 데이터 변환용 장난감 문제
Image('./deep_learning_2_images/fig 7-10.png', width=300)
2.3 가변 길이 시계열 데이터
Image('./deep_learning_2_images/fig 7-11.png', width=500)
2.4 덧셈 데이터셋
Image('./deep_learning_2_images/fig 7-12.png', width=350)
- 참고 : https://github.com/keras-team/keras/blob/2.0.0/examples/addition_rnn.py
import sys
sys.path.append('..')
from dataset import sequence
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt', seed=1984)
char_to_id, id_to_char = sequence.get_vocab()
print(x_train.shape, t_train.shape)
print(x_test.shape, t_test.shape)
print(x_train[0])
print(t_train[0])
print(''.join([id_to_char[c] for c in x_train[0]]))
print(''.join([id_to_char[c] for c in t_train[0]]))
(45000, 7) (45000, 5)
(5000, 7) (5000, 5)
[ 3 0 2 0 0 11 5]
[ 6 0 11 7 5]
71+118
_189
3. seq2seq 구현
3.1 Encoder 클래스
Image('./deep_learning_2_images/fig 7-13.png', width=220)
Image('./deep_learning_2_images/fig 7-14.png', width=650)
Image('./deep_learning_2_images/fig 7-15.png', width=280)
Encoder 클래스
class Encoder:
def __init__(self, vocab_size, wordvec_size, hidden_size):
V, D, H = vocab_size, wordvec_size, hidden_size
rn = np.random.randn
embed_W = (rn(V, D) / 100).astype('f')
lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b = np.zeros(4 * H).astype('f')
self.embed = TimeEmbedding(embed_W)
self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=False)
self.params = self.embed.params + self.lstm.params
self.grads = self.embed.grads + self.lstm.grads
self.hs = None
def forward(self, xs):
xs = self.embed.forward(xs)
hs = self.lstm.forward(xs)
self.hs = hs
return hs[:, -1, :]
def backward(self, dh):
dhs = np.zeros_like(self.hs)
dhs[:, -1, :] = dh
dout = self.lstm.backward(dhs)
dout = self.embed.backward(dout)
return dout
3.2 Decoder 클래스
Image('./deep_learning_2_images/fig 7-16.png', width=400)
Image('./deep_learning_2_images/fig 7-17.png', width=600)
Image('./deep_learning_2_images/fig 7-18.png', width=600)
Image('./deep_learning_2_images/fig 7-19.png', width=400)
Decoder 클래스
class Decoder:
def __init__(self, vocab_size, wordvec_size, hidden_size):
V, D, H = vocab_size, wordvec_size, hidden_size
rn = np.random.randn
embed_W = (rn(V, D) / 100).astype('f')
lstm_Wx = (rn(D, 4 * H) / np.sqrt(D)).astype('f')
lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b = np.zeros(4 * H).astype('f')
affine_W = (rn(H, V) / np.sqrt(H)).astype('f')
affine_b = np.zeros(V).astype('f')
self.embed = TimeEmbedding(embed_W)
self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True)
self.affine = TimeAffine(affine_W, affine_b)
self.params, self.grads = [], []
for layer in (self.embed, self.lstm, self.affine):
self.params += layer.params
self.grads += layer.grads
def forward(self, xs, h):
self.lstm.set_state(h)
out = self.embed.forward(xs)
out = self.lstm.forward(out)
score = self.affine.forward(out)
return score
def backward(self, dscore):
dout = self.affine.backward(dscore)
dout = self.lstm.backward(dout)
dout = self.embed.backward(dout)
dh = self.lstm.dh
return dh
def generate(self, h, start_id, sample_size):
sampled = []
sample_id = start_id
self.lstm.set_state(h)
for _ in range(sample_size):
x = np.array(sample_id).reshape((1, 1))
out = self.embed.forward(x)
out = self.lstm.forward(out)
score = self.affine.forward(out)
sample_id = np.argmax(score.flatten())
sampled.append(int(sample_id))
return sampled
3.3 Seq2seq 클래스
Seq2seq 클래스
class Seq2seq(BaseModel):
def __init__(self, vocab_size, wordvec_size, hidden_size):
V, D, H = vocab_size, wordvec_size, hidden_size
self.encoder = Encoder(V, D, H)
self.decoder = Decoder(V, D, H)
self.softmax = TimeSoftmaxWithLoss()
self.params = self.encoder.params + self.decoder.params
self.grads = self.encoder.grads + self.decoder.grads
def forward(self, xs, ts):
decoder_xs, decoder_ts = ts[:, :-1], ts[:, 1:]
h = self.encoder.forward(xs)
score = self.decoder.forward(decoder_xs, h)
loss = self.softmax.forward(score, decoder_ts)
return loss
def backward(self, dout=1):
dout = self.softmax.backward(dout)
dh = self.decoder.backward(dout)
dout = self.encoder.backward(dh)
return dout
def generate(self, xs, start_id, sample_size):
h = self.encoder.forward(xs)
sampled = self.decoder.generate(h, start_id, sample_size)
return sampled
3.4 seq2seq 평가
seq2seq의 학습 코드
# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq
# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()
# 입력 반전 여부 설정 =============================================
is_reverse = False # True
if is_reverse:
x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================
# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0
# 일반 혹은 엿보기(Peeky) 설정 =====================================
model = Seq2seq(vocab_size, wordvec_size, hidden_size)
# model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)
acc_list = []
for epoch in range(max_epoch):
trainer.fit(x_train, t_train, max_epoch=1,
batch_size=batch_size, max_grad=max_grad)
correct_num = 0
for i in range(len(x_test)):
question, correct = x_test[[i]], t_test[[i]]
verbose = i < 10
correct_num += eval_seq2seq(model, question, correct,
id_to_char, verbose, is_reverse)
acc = float(correct_num) / len(x_test)
acc_list.append(acc)
print('검증 정확도 %.3f%%' % (acc * 100))
| 에폭 1 | 반복 1 / 351 | 시간 0[s] | 손실 2.56
| 에폭 1 | 반복 21 / 351 | 시간 0[s] | 손실 2.53
| 에폭 1 | 반복 41 / 351 | 시간 1[s] | 손실 2.17
| 에폭 1 | 반복 61 / 351 | 시간 1[s] | 손실 1.96
| 에폭 1 | 반복 81 / 351 | 시간 2[s] | 손실 1.92
| 에폭 1 | 반복 101 / 351 | 시간 3[s] | 손실 1.87
| 에폭 1 | 반복 121 / 351 | 시간 3[s] | 손실 1.85
| 에폭 1 | 반복 141 / 351 | 시간 4[s] | 손실 1.83
| 에폭 1 | 반복 161 / 351 | 시간 5[s] | 손실 1.79
| 에폭 1 | 반복 181 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 | 반복 201 / 351 | 시간 6[s] | 손실 1.77
| 에폭 1 | 반복 221 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 | 반복 241 / 351 | 시간 7[s] | 손실 1.76
| 에폭 1 | 반복 261 / 351 | 시간 8[s] | 손실 1.76
| 에폭 1 | 반복 281 / 351 | 시간 8[s] | 손실 1.75
| 에폭 1 | 반복 301 / 351 | 시간 9[s] | 손실 1.74
| 에폭 1 | 반복 321 / 351 | 시간 9[s] | 손실 1.75
| 에폭 1 | 반복 341 / 351 | 시간 10[s] | 손실 1.74
Q 77+85
T 162
X 100
---
Q 975+164
T 1139
X 1000
---
Q 582+84
T 666
X 1000
---
Q 8+155
T 163
X 100
---
Q 367+55
T 422
X 1000
---
Q 600+257
T 857
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1000
---
Q 26+838
T 864
X 1000
---
Q 143+93
T 236
X 100
---
검증 정확도 0.180%
| 에폭 2 | 반복 1 / 351 | 시간 0[s] | 손실 1.74
| 에폭 2 | 반복 21 / 351 | 시간 0[s] | 손실 1.73
| 에폭 2 | 반복 41 / 351 | 시간 1[s] | 손실 1.74
| 에폭 2 | 반복 61 / 351 | 시간 2[s] | 손실 1.74
| 에폭 2 | 반복 81 / 351 | 시간 2[s] | 손실 1.73
| 에폭 2 | 반복 101 / 351 | 시간 3[s] | 손실 1.73
| 에폭 2 | 반복 121 / 351 | 시간 3[s] | 손실 1.72
| 에폭 2 | 반복 141 / 351 | 시간 4[s] | 손실 1.71
| 에폭 2 | 반복 161 / 351 | 시간 5[s] | 손실 1.71
| 에폭 2 | 반복 181 / 351 | 시간 5[s] | 손실 1.71
| 에폭 2 | 반복 201 / 351 | 시간 6[s] | 손실 1.70
| 에폭 2 | 반복 221 / 351 | 시간 7[s] | 손실 1.71
| 에폭 2 | 반복 241 / 351 | 시간 7[s] | 손실 1.70
| 에폭 2 | 반복 261 / 351 | 시간 8[s] | 손실 1.69
| 에폭 2 | 반복 281 / 351 | 시간 9[s] | 손실 1.69
| 에폭 2 | 반복 301 / 351 | 시간 9[s] | 손실 1.69
| 에폭 2 | 반복 321 / 351 | 시간 10[s] | 손실 1.68
| 에폭 2 | 반복 341 / 351 | 시간 10[s] | 손실 1.67
Q 77+85
T 162
X 994
---
Q 975+164
T 1139
X 1000
---
Q 582+84
T 666
X 700
---
Q 8+155
T 163
X 100
---
Q 367+55
T 422
X 400
---
Q 600+257
T 857
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1544
---
Q 26+838
T 864
X 400
---
Q 143+93
T 236
X 400
---
검증 정확도 0.220%
| 에폭 3 | 반복 1 / 351 | 시간 0[s] | 손실 1.66
| 에폭 3 | 반복 21 / 351 | 시간 0[s] | 손실 1.66
| 에폭 3 | 반복 41 / 351 | 시간 1[s] | 손실 1.65
| 에폭 3 | 반복 61 / 351 | 시간 1[s] | 손실 1.63
| 에폭 3 | 반복 81 / 351 | 시간 2[s] | 손실 1.62
| 에폭 3 | 반복 101 / 351 | 시간 2[s] | 손실 1.62
| 에폭 3 | 반복 121 / 351 | 시간 3[s] | 손실 1.60
| 에폭 3 | 반복 141 / 351 | 시간 4[s] | 손실 1.59
| 에폭 3 | 반복 161 / 351 | 시간 4[s] | 손실 1.57
| 에폭 3 | 반복 181 / 351 | 시간 5[s] | 손실 1.57
| 에폭 3 | 반복 201 / 351 | 시간 6[s] | 손실 1.56
| 에폭 3 | 반복 221 / 351 | 시간 6[s] | 손실 1.54
| 에폭 3 | 반복 241 / 351 | 시간 7[s] | 손실 1.52
| 에폭 3 | 반복 261 / 351 | 시간 7[s] | 손실 1.52
| 에폭 3 | 반복 281 / 351 | 시간 8[s] | 손실 1.52
| 에폭 3 | 반복 301 / 351 | 시간 9[s] | 손실 1.50
| 에폭 3 | 반복 321 / 351 | 시간 9[s] | 손실 1.49
| 에폭 3 | 반복 341 / 351 | 시간 10[s] | 손실 1.48
Q 77+85
T 162
X 108
---
Q 975+164
T 1139
X 1001
---
Q 582+84
T 666
X 648
---
Q 8+155
T 163
X 138
---
Q 367+55
T 422
X 448
---
Q 600+257
T 857
X 848
---
Q 761+292
T 1053
X 1011
---
Q 830+597
T 1427
X 1373
---
Q 26+838
T 864
X 868
---
Q 143+93
T 236
X 348
---
검증 정확도 0.560%
| 에폭 4 | 반복 1 / 351 | 시간 0[s] | 손실 1.47
| 에폭 4 | 반복 21 / 351 | 시간 0[s] | 손실 1.46
| 에폭 4 | 반복 41 / 351 | 시간 1[s] | 손실 1.44
| 에폭 4 | 반복 61 / 351 | 시간 1[s] | 손실 1.43
| 에폭 4 | 반복 81 / 351 | 시간 2[s] | 손실 1.42
| 에폭 4 | 반복 101 / 351 | 시간 3[s] | 손실 1.41
| 에폭 4 | 반복 121 / 351 | 시간 3[s] | 손실 1.40
| 에폭 4 | 반복 141 / 351 | 시간 4[s] | 손실 1.40
| 에폭 4 | 반복 161 / 351 | 시간 5[s] | 손실 1.38
| 에폭 4 | 반복 181 / 351 | 시간 5[s] | 손실 1.38
| 에폭 4 | 반복 201 / 351 | 시간 6[s] | 손실 1.37
| 에폭 4 | 반복 221 / 351 | 시간 7[s] | 손실 1.35
| 에폭 4 | 반복 241 / 351 | 시간 7[s] | 손실 1.33
| 에폭 4 | 반복 261 / 351 | 시간 8[s] | 손실 1.33
| 에폭 4 | 반복 281 / 351 | 시간 9[s] | 손실 1.33
| 에폭 4 | 반복 301 / 351 | 시간 9[s] | 손실 1.32
| 에폭 4 | 반복 321 / 351 | 시간 10[s] | 손실 1.31
| 에폭 4 | 반복 341 / 351 | 시간 11[s] | 손실 1.30
Q 77+85
T 162
X 146
---
Q 975+164
T 1139
X 1189
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 432
---
Q 600+257
T 857
X 866
---
Q 761+292
T 1053
X 1002
---
Q 830+597
T 1427
X 1406
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
X 202
---
검증 정확도 1.060%
| 에폭 5 | 반복 1 / 351 | 시간 0[s] | 손실 1.28
| 에폭 5 | 반복 21 / 351 | 시간 0[s] | 손실 1.29
| 에폭 5 | 반복 41 / 351 | 시간 1[s] | 손실 1.28
| 에폭 5 | 반복 61 / 351 | 시간 1[s] | 손실 1.27
| 에폭 5 | 반복 81 / 351 | 시간 2[s] | 손실 1.27
| 에폭 5 | 반복 101 / 351 | 시간 3[s] | 손실 1.26
| 에폭 5 | 반복 121 / 351 | 시간 4[s] | 손실 1.26
| 에폭 5 | 반복 141 / 351 | 시간 4[s] | 손실 1.27
| 에폭 5 | 반복 161 / 351 | 시간 5[s] | 손실 1.26
| 에폭 5 | 반복 181 / 351 | 시간 5[s] | 손실 1.25
| 에폭 5 | 반복 201 / 351 | 시간 6[s] | 손실 1.23
| 에폭 5 | 반복 221 / 351 | 시간 7[s] | 손실 1.22
| 에폭 5 | 반복 241 / 351 | 시간 7[s] | 손실 1.21
| 에폭 5 | 반복 261 / 351 | 시간 8[s] | 손실 1.21
| 에폭 5 | 반복 281 / 351 | 시간 9[s] | 손실 1.21
| 에폭 5 | 반복 301 / 351 | 시간 9[s] | 손실 1.20
| 에폭 5 | 반복 321 / 351 | 시간 10[s] | 손실 1.19
| 에폭 5 | 반복 341 / 351 | 시간 11[s] | 손실 1.18
Q 77+85
T 162
X 145
---
Q 975+164
T 1139
X 1168
---
Q 582+84
T 666
X 665
---
Q 8+155
T 163
X 192
---
Q 367+55
T 422
X 431
---
Q 600+257
T 857
X 895
---
Q 761+292
T 1053
X 1015
---
Q 830+597
T 1427
X 1493
---
Q 26+838
T 864
X 891
---
Q 143+93
T 236
X 221
---
검증 정확도 2.260%
| 에폭 6 | 반복 1 / 351 | 시간 0[s] | 손실 1.17
| 에폭 6 | 반복 21 / 351 | 시간 0[s] | 손실 1.17
| 에폭 6 | 반복 41 / 351 | 시간 1[s] | 손실 1.18
| 에폭 6 | 반복 61 / 351 | 시간 1[s] | 손실 1.17
| 에폭 6 | 반복 81 / 351 | 시간 2[s] | 손실 1.16
| 에폭 6 | 반복 101 / 351 | 시간 3[s] | 손실 1.16
| 에폭 6 | 반복 121 / 351 | 시간 3[s] | 손실 1.16
| 에폭 6 | 반복 141 / 351 | 시간 4[s] | 손실 1.14
| 에폭 6 | 반복 161 / 351 | 시간 5[s] | 손실 1.14
| 에폭 6 | 반복 181 / 351 | 시간 5[s] | 손실 1.13
| 에폭 6 | 반복 201 / 351 | 시간 6[s] | 손실 1.15
| 에폭 6 | 반복 221 / 351 | 시간 7[s] | 손실 1.13
| 에폭 6 | 반복 241 / 351 | 시간 7[s] | 손실 1.13
| 에폭 6 | 반복 261 / 351 | 시간 8[s] | 손실 1.13
| 에폭 6 | 반복 281 / 351 | 시간 9[s] | 손실 1.17
| 에폭 6 | 반복 301 / 351 | 시간 9[s] | 손실 1.12
| 에폭 6 | 반복 321 / 351 | 시간 10[s] | 손실 1.10
| 에폭 6 | 반복 341 / 351 | 시간 11[s] | 손실 1.10
Q 77+85
T 162
X 166
---
Q 975+164
T 1139
X 1160
---
Q 582+84
T 666
X 660
---
Q 8+155
T 163
X 164
---
Q 367+55
T 422
X 412
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1011
---
Q 830+597
T 1427
X 1412
---
Q 26+838
T 864
X 821
---
Q 143+93
T 236
X 207
---
검증 정확도 1.800%
| 에폭 7 | 반복 1 / 351 | 시간 0[s] | 손실 1.13
| 에폭 7 | 반복 21 / 351 | 시간 0[s] | 손실 1.09
| 에폭 7 | 반복 41 / 351 | 시간 1[s] | 손실 1.09
| 에폭 7 | 반복 61 / 351 | 시간 1[s] | 손실 1.11
| 에폭 7 | 반복 81 / 351 | 시간 2[s] | 손실 1.12
| 에폭 7 | 반복 101 / 351 | 시간 3[s] | 손실 1.10
| 에폭 7 | 반복 121 / 351 | 시간 3[s] | 손실 1.09
| 에폭 7 | 반복 141 / 351 | 시간 4[s] | 손실 1.09
| 에폭 7 | 반복 161 / 351 | 시간 5[s] | 손실 1.07
| 에폭 7 | 반복 181 / 351 | 시간 5[s] | 손실 1.07
| 에폭 7 | 반복 201 / 351 | 시간 6[s] | 손실 1.06
| 에폭 7 | 반복 221 / 351 | 시간 7[s] | 손실 1.08
| 에폭 7 | 반복 241 / 351 | 시간 7[s] | 손실 1.06
| 에폭 7 | 반복 261 / 351 | 시간 8[s] | 손실 1.07
| 에폭 7 | 반복 281 / 351 | 시간 9[s] | 손실 1.06
| 에폭 7 | 반복 301 / 351 | 시간 9[s] | 손실 1.09
| 에폭 7 | 반복 321 / 351 | 시간 10[s] | 손실 1.09
| 에폭 7 | 반복 341 / 351 | 시간 11[s] | 손실 1.08
Q 77+85
T 162
X 156
---
Q 975+164
T 1139
X 1166
---
Q 582+84
T 666
X 665
---
Q 8+155
T 163
X 148
---
Q 367+55
T 422
X 412
---
Q 600+257
T 857
X 893
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1441
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 227
---
검증 정확도 3.700%
| 에폭 8 | 반복 1 / 351 | 시간 0[s] | 손실 1.05
| 에폭 8 | 반복 21 / 351 | 시간 0[s] | 손실 1.04
| 에폭 8 | 반복 41 / 351 | 시간 1[s] | 손실 1.05
| 에폭 8 | 반복 61 / 351 | 시간 1[s] | 손실 1.04
| 에폭 8 | 반복 81 / 351 | 시간 2[s] | 손실 1.03
| 에폭 8 | 반복 101 / 351 | 시간 3[s] | 손실 1.05
| 에폭 8 | 반복 121 / 351 | 시간 3[s] | 손실 1.05
| 에폭 8 | 반복 141 / 351 | 시간 4[s] | 손실 1.03
| 에폭 8 | 반복 161 / 351 | 시간 5[s] | 손실 1.04
| 에폭 8 | 반복 181 / 351 | 시간 5[s] | 손실 1.02
| 에폭 8 | 반복 201 / 351 | 시간 6[s] | 손실 1.03
| 에폭 8 | 반복 221 / 351 | 시간 6[s] | 손실 1.04
| 에폭 8 | 반복 241 / 351 | 시간 7[s] | 손실 1.02
| 에폭 8 | 반복 261 / 351 | 시간 8[s] | 손실 1.02
| 에폭 8 | 반복 281 / 351 | 시간 8[s] | 손실 1.02
| 에폭 8 | 반복 301 / 351 | 시간 9[s] | 손실 1.02
| 에폭 8 | 반복 321 / 351 | 시간 9[s] | 손실 1.01
| 에폭 8 | 반복 341 / 351 | 시간 10[s] | 손실 1.00
Q 77+85
T 162
X 164
---
Q 975+164
T 1139
X 1160
---
Q 582+84
T 666
X 671
---
Q 8+155
T 163
X 164
---
Q 367+55
T 422
X 433
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1449
---
Q 26+838
T 864
X 871
---
Q 143+93
T 236
X 239
---
검증 정확도 3.700%
| 에폭 9 | 반복 1 / 351 | 시간 0[s] | 손실 1.02
| 에폭 9 | 반복 21 / 351 | 시간 0[s] | 손실 1.01
| 에폭 9 | 반복 41 / 351 | 시간 1[s] | 손실 1.01
| 에폭 9 | 반복 61 / 351 | 시간 1[s] | 손실 0.99
| 에폭 9 | 반복 81 / 351 | 시간 2[s] | 손실 0.99
| 에폭 9 | 반복 101 / 351 | 시간 2[s] | 손실 1.00
| 에폭 9 | 반복 121 / 351 | 시간 3[s] | 손실 1.00
| 에폭 9 | 반복 141 / 351 | 시간 4[s] | 손실 0.99
| 에폭 9 | 반복 161 / 351 | 시간 5[s] | 손실 0.99
| 에폭 9 | 반복 181 / 351 | 시간 5[s] | 손실 0.99
| 에폭 9 | 반복 201 / 351 | 시간 6[s] | 손실 0.98
| 에폭 9 | 반복 221 / 351 | 시간 6[s] | 손실 0.98
| 에폭 9 | 반복 241 / 351 | 시간 7[s] | 손실 0.99
| 에폭 9 | 반복 261 / 351 | 시간 8[s] | 손실 0.99
| 에폭 9 | 반복 281 / 351 | 시간 8[s] | 손실 0.98
| 에폭 9 | 반복 301 / 351 | 시간 9[s] | 손실 0.98
| 에폭 9 | 반복 321 / 351 | 시간 10[s] | 손실 0.97
| 에폭 9 | 반복 341 / 351 | 시간 10[s] | 손실 0.97
Q 77+85
T 162
X 167
---
Q 975+164
T 1139
X 1123
---
Q 582+84
T 666
X 677
---
Q 8+155
T 163
X 172
---
Q 367+55
T 422
X 418
---
Q 600+257
T 857
X 872
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1429
---
Q 26+838
T 864
X 870
---
Q 143+93
T 236
X 228
---
검증 정확도 4.320%
| 에폭 10 | 반복 1 / 351 | 시간 0[s] | 손실 0.95
| 에폭 10 | 반복 21 / 351 | 시간 0[s] | 손실 0.96
| 에폭 10 | 반복 41 / 351 | 시간 1[s] | 손실 0.96
| 에폭 10 | 반복 61 / 351 | 시간 1[s] | 손실 0.97
| 에폭 10 | 반복 81 / 351 | 시간 2[s] | 손실 1.00
| 에폭 10 | 반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 10 | 반복 121 / 351 | 시간 3[s] | 손실 0.97
| 에폭 10 | 반복 141 / 351 | 시간 4[s] | 손실 0.97
| 에폭 10 | 반복 161 / 351 | 시간 4[s] | 손실 1.00
| 에폭 10 | 반복 181 / 351 | 시간 5[s] | 손실 0.98
| 에폭 10 | 반복 201 / 351 | 시간 6[s] | 손실 1.00
| 에폭 10 | 반복 221 / 351 | 시간 6[s] | 손실 0.98
| 에폭 10 | 반복 241 / 351 | 시간 7[s] | 손실 0.98
| 에폭 10 | 반복 261 / 351 | 시간 7[s] | 손실 0.98
| 에폭 10 | 반복 281 / 351 | 시간 8[s] | 손실 0.97
| 에폭 10 | 반복 301 / 351 | 시간 9[s] | 손실 0.95
| 에폭 10 | 반복 321 / 351 | 시간 9[s] | 손실 0.94
| 에폭 10 | 반복 341 / 351 | 시간 10[s] | 손실 0.94
Q 77+85
T 162
X 157
---
Q 975+164
T 1139
X 1109
---
Q 582+84
T 666
X 660
---
Q 8+155
T 163
X 160
---
Q 367+55
T 422
X 409
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1009
---
Q 830+597
T 1427
X 1404
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 237
---
검증 정확도 3.380%
| 에폭 11 | 반복 1 / 351 | 시간 0[s] | 손실 0.99
| 에폭 11 | 반복 21 / 351 | 시간 0[s] | 손실 0.96
| 에폭 11 | 반복 41 / 351 | 시간 1[s] | 손실 0.95
| 에폭 11 | 반복 61 / 351 | 시간 1[s] | 손실 0.95
| 에폭 11 | 반복 81 / 351 | 시간 2[s] | 손실 0.95
| 에폭 11 | 반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 11 | 반복 121 / 351 | 시간 3[s] | 손실 0.97
| 에폭 11 | 반복 141 / 351 | 시간 4[s] | 손실 0.94
| 에폭 11 | 반복 161 / 351 | 시간 5[s] | 손실 0.94
| 에폭 11 | 반복 181 / 351 | 시간 5[s] | 손실 0.97
| 에폭 11 | 반복 201 / 351 | 시간 6[s] | 손실 0.94
| 에폭 11 | 반복 221 / 351 | 시간 6[s] | 손실 0.94
| 에폭 11 | 반복 241 / 351 | 시간 7[s] | 손실 0.93
| 에폭 11 | 반복 261 / 351 | 시간 8[s] | 손실 0.95
| 에폭 11 | 반복 281 / 351 | 시간 9[s] | 손실 0.93
| 에폭 11 | 반복 301 / 351 | 시간 9[s] | 손실 0.93
| 에폭 11 | 반복 321 / 351 | 시간 10[s] | 손실 0.93
| 에폭 11 | 반복 341 / 351 | 시간 11[s] | 손실 0.94
Q 77+85
T 162
X 160
---
Q 975+164
T 1139
X 1121
---
Q 582+84
T 666
X 668
---
Q 8+155
T 163
X 172
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1461
---
Q 26+838
T 864
X 871
---
Q 143+93
T 236
X 242
---
검증 정확도 5.560%
| 에폭 12 | 반복 1 / 351 | 시간 0[s] | 손실 0.96
| 에폭 12 | 반복 21 / 351 | 시간 0[s] | 손실 0.93
| 에폭 12 | 반복 41 / 351 | 시간 1[s] | 손실 0.93
| 에폭 12 | 반복 61 / 351 | 시간 1[s] | 손실 0.93
| 에폭 12 | 반복 81 / 351 | 시간 2[s] | 손실 0.93
| 에폭 12 | 반복 101 / 351 | 시간 3[s] | 손실 0.94
| 에폭 12 | 반복 121 / 351 | 시간 3[s] | 손실 0.96
| 에폭 12 | 반복 141 / 351 | 시간 4[s] | 손실 0.95
| 에폭 12 | 반복 161 / 351 | 시간 4[s] | 손실 0.95
| 에폭 12 | 반복 181 / 351 | 시간 5[s] | 손실 0.93
| 에폭 12 | 반복 201 / 351 | 시간 5[s] | 손실 0.94
| 에폭 12 | 반복 221 / 351 | 시간 6[s] | 손실 0.94
| 에폭 12 | 반복 241 / 351 | 시간 7[s] | 손실 0.94
| 에폭 12 | 반복 261 / 351 | 시간 7[s] | 손실 0.91
| 에폭 12 | 반복 281 / 351 | 시간 8[s] | 손실 0.92
| 에폭 12 | 반복 301 / 351 | 시간 8[s] | 손실 0.91
| 에폭 12 | 반복 321 / 351 | 시간 9[s] | 손실 0.95
| 에폭 12 | 반복 341 / 351 | 시간 10[s] | 손실 0.95
Q 77+85
T 162
X 158
---
Q 975+164
T 1139
X 1129
---
Q 582+84
T 666
X 661
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 849
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1404
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 228
---
검증 정확도 6.760%
| 에폭 13 | 반복 1 / 351 | 시간 0[s] | 손실 0.89
| 에폭 13 | 반복 21 / 351 | 시간 0[s] | 손실 0.90
| 에폭 13 | 반복 41 / 351 | 시간 1[s] | 손실 0.90
| 에폭 13 | 반복 61 / 351 | 시간 1[s] | 손실 0.92
| 에폭 13 | 반복 81 / 351 | 시간 2[s] | 손실 1.01
| 에폭 13 | 반복 101 / 351 | 시간 3[s] | 손실 0.90
| 에폭 13 | 반복 121 / 351 | 시간 3[s] | 손실 0.90
| 에폭 13 | 반복 141 / 351 | 시간 4[s] | 손실 0.90
| 에폭 13 | 반복 161 / 351 | 시간 4[s] | 손실 0.90
| 에폭 13 | 반복 181 / 351 | 시간 5[s] | 손실 0.90
| 에폭 13 | 반복 201 / 351 | 시간 6[s] | 손실 0.92
| 에폭 13 | 반복 221 / 351 | 시간 6[s] | 손실 0.93
| 에폭 13 | 반복 241 / 351 | 시간 7[s] | 손실 0.94
| 에폭 13 | 반복 261 / 351 | 시간 7[s] | 손실 0.90
| 에폭 13 | 반복 281 / 351 | 시간 8[s] | 손실 0.93
| 에폭 13 | 반복 301 / 351 | 시간 8[s] | 손실 0.90
| 에폭 13 | 반복 321 / 351 | 시간 9[s] | 손실 0.92
| 에폭 13 | 반복 341 / 351 | 시간 9[s] | 손실 0.88
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
X 1121
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
X 164
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1400
---
Q 26+838
T 864
X 867
---
Q 143+93
T 236
X 242
---
검증 정확도 7.820%
| 에폭 14 | 반복 1 / 351 | 시간 0[s] | 손실 0.91
| 에폭 14 | 반복 21 / 351 | 시간 0[s] | 손실 0.88
| 에폭 14 | 반복 41 / 351 | 시간 1[s] | 손실 0.89
| 에폭 14 | 반복 61 / 351 | 시간 1[s] | 손실 0.88
| 에폭 14 | 반복 81 / 351 | 시간 2[s] | 손실 0.89
| 에폭 14 | 반복 101 / 351 | 시간 3[s] | 손실 0.89
| 에폭 14 | 반복 121 / 351 | 시간 3[s] | 손실 0.88
| 에폭 14 | 반복 141 / 351 | 시간 4[s] | 손실 0.88
| 에폭 14 | 반복 161 / 351 | 시간 4[s] | 손실 0.88
| 에폭 14 | 반복 181 / 351 | 시간 5[s] | 손실 0.91
| 에폭 14 | 반복 201 / 351 | 시간 6[s] | 손실 0.93
| 에폭 14 | 반복 221 / 351 | 시간 6[s] | 손실 0.90
| 에폭 14 | 반복 241 / 351 | 시간 7[s] | 손실 0.92
| 에폭 14 | 반복 261 / 351 | 시간 7[s] | 손실 0.93
| 에폭 14 | 반복 281 / 351 | 시간 8[s] | 손실 0.88
| 에폭 14 | 반복 301 / 351 | 시간 9[s] | 손실 0.87
| 에폭 14 | 반복 321 / 351 | 시간 9[s] | 손실 0.88
| 에폭 14 | 반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85
T 162
X 160
---
Q 975+164
T 1139
X 1160
---
Q 582+84
T 666
X 655
---
Q 8+155
T 163
X 171
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1418
---
Q 26+838
T 864
X 858
---
Q 143+93
T 236
X 239
---
검증 정확도 6.580%
| 에폭 15 | 반복 1 / 351 | 시간 0[s] | 손실 0.84
| 에폭 15 | 반복 21 / 351 | 시간 0[s] | 손실 0.86
| 에폭 15 | 반복 41 / 351 | 시간 1[s] | 손실 0.89
| 에폭 15 | 반복 61 / 351 | 시간 1[s] | 손실 0.92
| 에폭 15 | 반복 81 / 351 | 시간 2[s] | 손실 0.87
| 에폭 15 | 반복 101 / 351 | 시간 2[s] | 손실 0.87
| 에폭 15 | 반복 121 / 351 | 시간 3[s] | 손실 0.86
| 에폭 15 | 반복 141 / 351 | 시간 4[s] | 손실 0.87
| 에폭 15 | 반복 161 / 351 | 시간 4[s] | 손실 0.86
| 에폭 15 | 반복 181 / 351 | 시간 5[s] | 손실 0.87
| 에폭 15 | 반복 201 / 351 | 시간 5[s] | 손실 0.87
| 에폭 15 | 반복 221 / 351 | 시간 6[s] | 손실 0.88
| 에폭 15 | 반복 241 / 351 | 시간 7[s] | 손실 0.87
| 에폭 15 | 반복 261 / 351 | 시간 7[s] | 손실 0.87
| 에폭 15 | 반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 15 | 반복 301 / 351 | 시간 8[s] | 손실 0.91
| 에폭 15 | 반복 321 / 351 | 시간 9[s] | 손실 0.88
| 에폭 15 | 반복 341 / 351 | 시간 10[s] | 손실 0.86
Q 77+85
T 162
X 164
---
Q 975+164
T 1139
X 1138
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 172
---
Q 367+55
T 422
X 424
---
Q 600+257
T 857
X 862
---
Q 761+292
T 1053
X 1063
---
Q 830+597
T 1427
X 1446
---
Q 26+838
T 864
X 868
---
Q 143+93
T 236
X 242
---
검증 정확도 7.340%
| 에폭 16 | 반복 1 / 351 | 시간 0[s] | 손실 0.85
| 에폭 16 | 반복 21 / 351 | 시간 0[s] | 손실 0.87
| 에폭 16 | 반복 41 / 351 | 시간 1[s] | 손실 0.86
| 에폭 16 | 반복 61 / 351 | 시간 1[s] | 손실 0.86
| 에폭 16 | 반복 81 / 351 | 시간 2[s] | 손실 0.88
| 에폭 16 | 반복 101 / 351 | 시간 2[s] | 손실 0.87
| 에폭 16 | 반복 121 / 351 | 시간 3[s] | 손실 0.89
| 에폭 16 | 반복 141 / 351 | 시간 4[s] | 손실 0.88
| 에폭 16 | 반복 161 / 351 | 시간 5[s] | 손실 0.88
| 에폭 16 | 반복 181 / 351 | 시간 5[s] | 손실 0.86
| 에폭 16 | 반복 201 / 351 | 시간 6[s] | 손실 0.84
| 에폭 16 | 반복 221 / 351 | 시간 7[s] | 손실 0.86
| 에폭 16 | 반복 241 / 351 | 시간 7[s] | 손실 0.88
| 에폭 16 | 반복 261 / 351 | 시간 8[s] | 손실 0.88
| 에폭 16 | 반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 16 | 반복 301 / 351 | 시간 9[s] | 손실 0.87
| 에폭 16 | 반복 321 / 351 | 시간 10[s] | 손실 0.87
| 에폭 16 | 반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85
T 162
X 160
---
Q 975+164
T 1139
X 1136
---
Q 582+84
T 666
X 662
---
Q 8+155
T 163
X 172
---
Q 367+55
T 422
X 412
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1420
---
Q 26+838
T 864
X 859
---
Q 143+93
T 236
X 239
---
검증 정확도 6.700%
| 에폭 17 | 반복 1 / 351 | 시간 0[s] | 손실 0.84
| 에폭 17 | 반복 21 / 351 | 시간 0[s] | 손실 0.85
| 에폭 17 | 반복 41 / 351 | 시간 1[s] | 손실 0.87
| 에폭 17 | 반복 61 / 351 | 시간 1[s] | 손실 0.85
| 에폭 17 | 반복 81 / 351 | 시간 2[s] | 손실 0.86
| 에폭 17 | 반복 101 / 351 | 시간 3[s] | 손실 0.86
| 에폭 17 | 반복 121 / 351 | 시간 3[s] | 손실 0.87
| 에폭 17 | 반복 141 / 351 | 시간 4[s] | 손실 0.85
| 에폭 17 | 반복 161 / 351 | 시간 4[s] | 손실 0.87
| 에폭 17 | 반복 181 / 351 | 시간 5[s] | 손실 0.87
| 에폭 17 | 반복 201 / 351 | 시간 6[s] | 손실 0.85
| 에폭 17 | 반복 221 / 351 | 시간 6[s] | 손실 0.84
| 에폭 17 | 반복 241 / 351 | 시간 7[s] | 손실 0.84
| 에폭 17 | 반복 261 / 351 | 시간 8[s] | 손실 0.85
| 에폭 17 | 반복 281 / 351 | 시간 8[s] | 손실 0.86
| 에폭 17 | 반복 301 / 351 | 시간 9[s] | 손실 0.83
| 에폭 17 | 반복 321 / 351 | 시간 9[s] | 손실 0.86
| 에폭 17 | 반복 341 / 351 | 시간 10[s] | 손실 0.83
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1128
---
Q 582+84
T 666
X 659
---
Q 8+155
T 163
X 157
---
Q 367+55
T 422
X 417
---
Q 600+257
T 857
X 849
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1414
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 229
---
검증 정확도 7.340%
| 에폭 18 | 반복 1 / 351 | 시간 0[s] | 손실 0.85
| 에폭 18 | 반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 18 | 반복 41 / 351 | 시간 1[s] | 손실 0.85
| 에폭 18 | 반복 61 / 351 | 시간 1[s] | 손실 0.82
| 에폭 18 | 반복 81 / 351 | 시간 2[s] | 손실 0.83
| 에폭 18 | 반복 101 / 351 | 시간 3[s] | 손실 0.84
| 에폭 18 | 반복 121 / 351 | 시간 3[s] | 손실 0.86
| 에폭 18 | 반복 141 / 351 | 시간 4[s] | 손실 0.91
| 에폭 18 | 반복 161 / 351 | 시간 5[s] | 손실 0.87
| 에폭 18 | 반복 181 / 351 | 시간 5[s] | 손실 0.85
| 에폭 18 | 반복 201 / 351 | 시간 6[s] | 손실 0.86
| 에폭 18 | 반복 221 / 351 | 시간 7[s] | 손실 0.82
| 에폭 18 | 반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 18 | 반복 261 / 351 | 시간 8[s] | 손실 0.84
| 에폭 18 | 반복 281 / 351 | 시간 8[s] | 손실 0.83
| 에폭 18 | 반복 301 / 351 | 시간 9[s] | 손실 0.86
| 에폭 18 | 반복 321 / 351 | 시간 10[s] | 손실 0.84
| 에폭 18 | 반복 341 / 351 | 시간 10[s] | 손실 0.86
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1131
---
Q 582+84
T 666
X 659
---
Q 8+155
T 163
X 172
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1414
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
X 239
---
검증 정확도 8.560%
| 에폭 19 | 반복 1 / 351 | 시간 0[s] | 손실 0.82
| 에폭 19 | 반복 21 / 351 | 시간 0[s] | 손실 0.85
| 에폭 19 | 반복 41 / 351 | 시간 1[s] | 손실 0.84
| 에폭 19 | 반복 61 / 351 | 시간 1[s] | 손실 0.85
| 에폭 19 | 반복 81 / 351 | 시간 2[s] | 손실 0.84
| 에폭 19 | 반복 101 / 351 | 시간 3[s] | 손실 0.82
| 에폭 19 | 반복 121 / 351 | 시간 3[s] | 손실 0.82
| 에폭 19 | 반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 19 | 반복 161 / 351 | 시간 4[s] | 손실 0.84
| 에폭 19 | 반복 181 / 351 | 시간 5[s] | 손실 0.83
| 에폭 19 | 반복 201 / 351 | 시간 6[s] | 손실 0.85
| 에폭 19 | 반복 221 / 351 | 시간 6[s] | 손실 0.83
| 에폭 19 | 반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 19 | 반복 261 / 351 | 시간 7[s] | 손실 0.82
| 에폭 19 | 반복 281 / 351 | 시간 8[s] | 손실 0.86
| 에폭 19 | 반복 301 / 351 | 시간 8[s] | 손실 0.83
| 에폭 19 | 반복 321 / 351 | 시간 9[s] | 손실 0.85
| 에폭 19 | 반복 341 / 351 | 시간 9[s] | 손실 0.83
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1127
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
X 167
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 239
---
검증 정확도 9.800%
| 에폭 20 | 반복 1 / 351 | 시간 0[s] | 손실 0.79
| 에폭 20 | 반복 21 / 351 | 시간 0[s] | 손실 0.83
| 에폭 20 | 반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 20 | 반복 61 / 351 | 시간 1[s] | 손실 0.81
| 에폭 20 | 반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 20 | 반복 101 / 351 | 시간 3[s] | 손실 0.86
| 에폭 20 | 반복 121 / 351 | 시간 3[s] | 손실 0.85
| 에폭 20 | 반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 20 | 반복 161 / 351 | 시간 4[s] | 손실 0.83
| 에폭 20 | 반복 181 / 351 | 시간 5[s] | 손실 0.86
| 에폭 20 | 반복 201 / 351 | 시간 6[s] | 손실 0.84
| 에폭 20 | 반복 221 / 351 | 시간 6[s] | 손실 0.81
| 에폭 20 | 반복 241 / 351 | 시간 7[s] | 손실 0.81
| 에폭 20 | 반복 261 / 351 | 시간 7[s] | 손실 0.82
| 에폭 20 | 반복 281 / 351 | 시간 8[s] | 손실 0.79
| 에폭 20 | 반복 301 / 351 | 시간 9[s] | 손실 0.80
| 에폭 20 | 반복 321 / 351 | 시간 9[s] | 손실 0.81
| 에폭 20 | 반복 341 / 351 | 시간 10[s] | 손실 0.85
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1127
---
Q 582+84
T 666
X 655
---
Q 8+155
T 163
X 159
---
Q 367+55
T 422
X 412
---
Q 600+257
T 857
X 849
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1394
---
Q 26+838
T 864
X 858
---
Q 143+93
T 236
X 237
---
검증 정확도 5.120%
| 에폭 21 | 반복 1 / 351 | 시간 0[s] | 손실 0.87
| 에폭 21 | 반복 21 / 351 | 시간 0[s] | 손실 0.83
| 에폭 21 | 반복 41 / 351 | 시간 1[s] | 손실 0.83
| 에폭 21 | 반복 61 / 351 | 시간 1[s] | 손실 0.80
| 에폭 21 | 반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 21 | 반복 101 / 351 | 시간 3[s] | 손실 0.81
| 에폭 21 | 반복 121 / 351 | 시간 3[s] | 손실 0.83
| 에폭 21 | 반복 141 / 351 | 시간 4[s] | 손실 0.83
| 에폭 21 | 반복 161 / 351 | 시간 4[s] | 손실 0.81
| 에폭 21 | 반복 181 / 351 | 시간 5[s] | 손실 0.79
| 에폭 21 | 반복 201 / 351 | 시간 5[s] | 손실 0.83
| 에폭 21 | 반복 221 / 351 | 시간 6[s] | 손실 0.84
| 에폭 21 | 반복 241 / 351 | 시간 7[s] | 손실 0.82
| 에폭 21 | 반복 261 / 351 | 시간 7[s] | 손실 0.81
| 에폭 21 | 반복 281 / 351 | 시간 8[s] | 손실 0.80
| 에폭 21 | 반복 301 / 351 | 시간 8[s] | 손실 0.83
| 에폭 21 | 반복 321 / 351 | 시간 9[s] | 손실 0.82
| 에폭 21 | 반복 341 / 351 | 시간 10[s] | 손실 0.82
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1136
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
X 160
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 849
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1424
---
Q 26+838
T 864
X 867
---
Q 143+93
T 236
X 235
---
검증 정확도 10.500%
| 에폭 22 | 반복 1 / 351 | 시간 0[s] | 손실 0.81
| 에폭 22 | 반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 22 | 반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 22 | 반복 61 / 351 | 시간 1[s] | 손실 0.83
| 에폭 22 | 반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 22 | 반복 101 / 351 | 시간 3[s] | 손실 0.80
| 에폭 22 | 반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 22 | 반복 141 / 351 | 시간 4[s] | 손실 0.80
| 에폭 22 | 반복 161 / 351 | 시간 4[s] | 손실 0.82
| 에폭 22 | 반복 181 / 351 | 시간 5[s] | 손실 0.83
| 에폭 22 | 반복 201 / 351 | 시간 6[s] | 손실 0.87
| 에폭 22 | 반복 221 / 351 | 시간 6[s] | 손실 0.81
| 에폭 22 | 반복 241 / 351 | 시간 7[s] | 손실 0.81
| 에폭 22 | 반복 261 / 351 | 시간 8[s] | 손실 0.81
| 에폭 22 | 반복 281 / 351 | 시간 8[s] | 손실 0.82
| 에폭 22 | 반복 301 / 351 | 시간 9[s] | 손실 0.81
| 에폭 22 | 반복 321 / 351 | 시간 9[s] | 손실 0.81
| 에폭 22 | 반복 341 / 351 | 시간 10[s] | 손실 0.82
Q 77+85
T 162
X 159
---
Q 975+164
T 1139
X 1127
---
Q 582+84
T 666
X 655
---
Q 8+155
T 163
X 157
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1039
---
Q 830+597
T 1427
X 1400
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
X 232
---
검증 정확도 2.440%
| 에폭 23 | 반복 1 / 351 | 시간 0[s] | 손실 0.83
| 에폭 23 | 반복 21 / 351 | 시간 0[s] | 손실 0.80
| 에폭 23 | 반복 41 / 351 | 시간 1[s] | 손실 0.78
| 에폭 23 | 반복 61 / 351 | 시간 1[s] | 손실 0.77
| 에폭 23 | 반복 81 / 351 | 시간 2[s] | 손실 0.79
| 에폭 23 | 반복 101 / 351 | 시간 3[s] | 손실 0.79
| 에폭 23 | 반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 23 | 반복 141 / 351 | 시간 4[s] | 손실 0.81
| 에폭 23 | 반복 161 / 351 | 시간 5[s] | 손실 0.80
| 에폭 23 | 반복 181 / 351 | 시간 5[s] | 손실 0.84
| 에폭 23 | 반복 201 / 351 | 시간 6[s] | 손실 0.79
| 에폭 23 | 반복 221 / 351 | 시간 7[s] | 손실 0.78
| 에폭 23 | 반복 241 / 351 | 시간 7[s] | 손실 0.80
| 에폭 23 | 반복 261 / 351 | 시간 8[s] | 손실 0.82
| 에폭 23 | 반복 281 / 351 | 시간 9[s] | 손실 0.83
| 에폭 23 | 반복 301 / 351 | 시간 9[s] | 손실 0.79
| 에폭 23 | 반복 321 / 351 | 시간 10[s] | 손실 0.81
| 에폭 23 | 반복 341 / 351 | 시간 10[s] | 손실 0.81
Q 77+85
T 162
X 165
---
Q 975+164
T 1139
X 1138
---
Q 582+84
T 666
X 675
---
Q 8+155
T 163
X 171
---
Q 367+55
T 422
X 428
---
Q 600+257
T 857
X 861
---
Q 761+292
T 1053
X 1070
---
Q 830+597
T 1427
X 1445
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 239
---
검증 정확도 4.880%
| 에폭 24 | 반복 1 / 351 | 시간 0[s] | 손실 0.82
| 에폭 24 | 반복 21 / 351 | 시간 0[s] | 손실 0.80
| 에폭 24 | 반복 41 / 351 | 시간 1[s] | 손실 0.80
| 에폭 24 | 반복 61 / 351 | 시간 2[s] | 손실 0.79
| 에폭 24 | 반복 81 / 351 | 시간 2[s] | 손실 0.81
| 에폭 24 | 반복 101 / 351 | 시간 3[s] | 손실 0.77
| 에폭 24 | 반복 121 / 351 | 시간 4[s] | 손실 0.76
| 에폭 24 | 반복 141 / 351 | 시간 4[s] | 손실 0.78
| 에폭 24 | 반복 161 / 351 | 시간 5[s] | 손실 0.79
| 에폭 24 | 반복 181 / 351 | 시간 5[s] | 손실 0.80
| 에폭 24 | 반복 201 / 351 | 시간 6[s] | 손실 0.83
| 에폭 24 | 반복 221 / 351 | 시간 7[s] | 손실 0.81
| 에폭 24 | 반복 241 / 351 | 시간 7[s] | 손실 0.79
| 에폭 24 | 반복 261 / 351 | 시간 8[s] | 손실 0.77
| 에폭 24 | 반복 281 / 351 | 시간 8[s] | 손실 0.76
| 에폭 24 | 반복 301 / 351 | 시간 9[s] | 손실 0.75
| 에폭 24 | 반복 321 / 351 | 시간 9[s] | 손실 0.77
| 에폭 24 | 반복 341 / 351 | 시간 10[s] | 손실 0.79
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
X 1151
---
Q 582+84
T 666
X 661
---
Q 8+155
T 163
X 157
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 846
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 229
---
검증 정확도 8.600%
| 에폭 25 | 반복 1 / 351 | 시간 0[s] | 손실 0.75
| 에폭 25 | 반복 21 / 351 | 시간 0[s] | 손실 0.78
| 에폭 25 | 반복 41 / 351 | 시간 1[s] | 손실 0.78
| 에폭 25 | 반복 61 / 351 | 시간 1[s] | 손실 0.80
| 에폭 25 | 반복 81 / 351 | 시간 2[s] | 손실 0.78
| 에폭 25 | 반복 101 / 351 | 시간 2[s] | 손실 0.79
| 에폭 25 | 반복 121 / 351 | 시간 3[s] | 손실 0.76
| 에폭 25 | 반복 141 / 351 | 시간 4[s] | 손실 0.76
| 에폭 25 | 반복 161 / 351 | 시간 4[s] | 손실 0.76
| 에폭 25 | 반복 181 / 351 | 시간 5[s] | 손실 0.76
| 에폭 25 | 반복 201 / 351 | 시간 5[s] | 손실 0.78
| 에폭 25 | 반복 221 / 351 | 시간 6[s] | 손실 0.78
| 에폭 25 | 반복 241 / 351 | 시간 7[s] | 손실 0.78
| 에폭 25 | 반복 261 / 351 | 시간 7[s] | 손실 0.78
| 에폭 25 | 반복 281 / 351 | 시간 8[s] | 손실 0.79
| 에폭 25 | 반복 301 / 351 | 시간 9[s] | 손실 0.77
| 에폭 25 | 반복 321 / 351 | 시간 9[s] | 손실 0.76
| 에폭 25 | 반복 341 / 351 | 시간 10[s] | 손실 0.76
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1146
---
Q 582+84
T 666
X 668
---
Q 8+155
T 163
X 166
---
Q 367+55
T 422
X 426
---
Q 600+257
T 857
X 849
---
Q 761+292
T 1053
X 1049
---
Q 830+597
T 1427
X 1424
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 242
---
검증 정확도 11.220%
plt.rc("font", family="Malgun Gothic")
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()
4. seq2seq 개선
4.1 입력 데이터 반전
Image('./deep_learning_2_images/fig 7-23.png', width=400)
입력 데이터 반전 코드
# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq
# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()
# 입력 반전 여부 설정 =============================================
is_reverse = True
if is_reverse:
x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================
# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0
# 일반 혹은 엿보기(Peeky) 설정 =====================================
model = Seq2seq(vocab_size, wordvec_size, hidden_size)
# model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)
acc_list = []
for epoch in range(max_epoch):
trainer.fit(x_train, t_train, max_epoch=1,
batch_size=batch_size, max_grad=max_grad)
correct_num = 0
for i in range(len(x_test)):
question, correct = x_test[[i]], t_test[[i]]
verbose = i < 10
correct_num += eval_seq2seq(model, question, correct,
id_to_char, verbose, is_reverse)
acc = float(correct_num) / len(x_test)
acc_list.append(acc)
print('검증 정확도 %.3f%%' % (acc * 100))
| 에폭 1 | 반복 1 / 351 | 시간 0[s] | 손실 2.56
| 에폭 1 | 반복 21 / 351 | 시간 0[s] | 손실 2.52
| 에폭 1 | 반복 41 / 351 | 시간 0[s] | 손실 2.17
| 에폭 1 | 반복 61 / 351 | 시간 1[s] | 손실 1.96
| 에폭 1 | 반복 81 / 351 | 시간 2[s] | 손실 1.91
| 에폭 1 | 반복 101 / 351 | 시간 2[s] | 손실 1.87
| 에폭 1 | 반복 121 / 351 | 시간 2[s] | 손실 1.86
| 에폭 1 | 반복 141 / 351 | 시간 3[s] | 손실 1.84
| 에폭 1 | 반복 161 / 351 | 시간 4[s] | 손실 1.80
| 에폭 1 | 반복 181 / 351 | 시간 4[s] | 손실 1.78
| 에폭 1 | 반복 201 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 | 반복 221 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 | 반복 241 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 | 반복 261 / 351 | 시간 6[s] | 손실 1.75
| 에폭 1 | 반복 281 / 351 | 시간 7[s] | 손실 1.74
| 에폭 1 | 반복 301 / 351 | 시간 7[s] | 손실 1.74
| 에폭 1 | 반복 321 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 | 반복 341 / 351 | 시간 9[s] | 손실 1.73
Q 77+85
T 162
X 100
---
Q 975+164
T 1139
X 1000
---
Q 582+84
T 666
X 1001
---
Q 8+155
T 163
X 100
---
Q 367+55
T 422
X 1001
---
Q 600+257
T 857
X 1000
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1000
---
Q 26+838
T 864
X 1001
---
Q 143+93
T 236
X 703
---
검증 정확도 0.120%
| 에폭 2 | 반복 1 / 351 | 시간 0[s] | 손실 1.73
| 에폭 2 | 반복 21 / 351 | 시간 0[s] | 손실 1.72
| 에폭 2 | 반복 41 / 351 | 시간 1[s] | 손실 1.72
| 에폭 2 | 반복 61 / 351 | 시간 1[s] | 손실 1.72
| 에폭 2 | 반복 81 / 351 | 시간 2[s] | 손실 1.70
| 에폭 2 | 반복 101 / 351 | 시간 3[s] | 손실 1.70
| 에폭 2 | 반복 121 / 351 | 시간 3[s] | 손실 1.69
| 에폭 2 | 반복 141 / 351 | 시간 4[s] | 손실 1.68
| 에폭 2 | 반복 161 / 351 | 시간 4[s] | 손실 1.67
| 에폭 2 | 반복 181 / 351 | 시간 5[s] | 손실 1.66
| 에폭 2 | 반복 201 / 351 | 시간 5[s] | 손실 1.66
| 에폭 2 | 반복 221 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 | 반복 241 / 351 | 시간 7[s] | 손실 1.63
| 에폭 2 | 반복 261 / 351 | 시간 7[s] | 손실 1.62
| 에폭 2 | 반복 281 / 351 | 시간 8[s] | 손실 1.61
| 에폭 2 | 반복 301 / 351 | 시간 8[s] | 손실 1.60
| 에폭 2 | 반복 321 / 351 | 시간 9[s] | 손실 1.58
| 에폭 2 | 반복 341 / 351 | 시간 9[s] | 손실 1.56
Q 77+85
T 162
X 100
---
Q 975+164
T 1139
X 1000
---
Q 582+84
T 666
X 690
---
Q 8+155
T 163
X 1000
---
Q 367+55
T 422
X 470
---
Q 600+257
T 857
X 700
---
Q 761+292
T 1053
X 1000
---
Q 830+597
T 1427
X 1444
---
Q 26+838
T 864
X 700
---
Q 143+93
T 236
X 370
---
검증 정확도 0.400%
| 에폭 3 | 반복 1 / 351 | 시간 0[s] | 손실 1.52
| 에폭 3 | 반복 21 / 351 | 시간 0[s] | 손실 1.53
| 에폭 3 | 반복 41 / 351 | 시간 1[s] | 손실 1.51
| 에폭 3 | 반복 61 / 351 | 시간 1[s] | 손실 1.49
| 에폭 3 | 반복 81 / 351 | 시간 2[s] | 손실 1.47
| 에폭 3 | 반복 101 / 351 | 시간 2[s] | 손실 1.45
| 에폭 3 | 반복 121 / 351 | 시간 3[s] | 손실 1.44
| 에폭 3 | 반복 141 / 351 | 시간 4[s] | 손실 1.42
| 에폭 3 | 반복 161 / 351 | 시간 4[s] | 손실 1.40
| 에폭 3 | 반복 181 / 351 | 시간 5[s] | 손실 1.38
| 에폭 3 | 반복 201 / 351 | 시간 5[s] | 손실 1.37
| 에폭 3 | 반복 221 / 351 | 시간 6[s] | 손실 1.35
| 에폭 3 | 반복 241 / 351 | 시간 6[s] | 손실 1.33
| 에폭 3 | 반복 261 / 351 | 시간 7[s] | 손실 1.32
| 에폭 3 | 반복 281 / 351 | 시간 7[s] | 손실 1.30
| 에폭 3 | 반복 301 / 351 | 시간 8[s] | 손실 1.29
| 에폭 3 | 반복 321 / 351 | 시간 9[s] | 손실 1.28
| 에폭 3 | 반복 341 / 351 | 시간 9[s] | 손실 1.27
Q 77+85
T 162
X 158
---
Q 975+164
T 1139
X 1148
---
Q 582+84
T 666
X 662
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 382
---
Q 600+257
T 857
X 818
---
Q 761+292
T 1053
X 1008
---
Q 830+597
T 1427
X 1434
---
Q 26+838
T 864
X 838
---
Q 143+93
T 236
X 202
---
검증 정확도 1.940%
| 에폭 4 | 반복 1 / 351 | 시간 0[s] | 손실 1.26
| 에폭 4 | 반복 21 / 351 | 시간 0[s] | 손실 1.25
| 에폭 4 | 반복 41 / 351 | 시간 1[s] | 손실 1.23
| 에폭 4 | 반복 61 / 351 | 시간 1[s] | 손실 1.22
| 에폭 4 | 반복 81 / 351 | 시간 2[s] | 손실 1.20
| 에폭 4 | 반복 101 / 351 | 시간 3[s] | 손실 1.19
| 에폭 4 | 반복 121 / 351 | 시간 3[s] | 손실 1.18
| 에폭 4 | 반복 141 / 351 | 시간 4[s] | 손실 1.17
| 에폭 4 | 반복 161 / 351 | 시간 4[s] | 손실 1.15
| 에폭 4 | 반복 181 / 351 | 시간 5[s] | 손실 1.13
| 에폭 4 | 반복 201 / 351 | 시간 5[s] | 손실 1.12
| 에폭 4 | 반복 221 / 351 | 시간 6[s] | 손실 1.11
| 에폭 4 | 반복 241 / 351 | 시간 7[s] | 손실 1.09
| 에폭 4 | 반복 261 / 351 | 시간 7[s] | 손실 1.08
| 에폭 4 | 반복 281 / 351 | 시간 8[s] | 손실 1.07
| 에폭 4 | 반복 301 / 351 | 시간 8[s] | 손실 1.07
| 에폭 4 | 반복 321 / 351 | 시간 9[s] | 손실 1.05
| 에폭 4 | 반복 341 / 351 | 시간 10[s] | 손실 1.03
Q 77+85
T 162
X 166
---
Q 975+164
T 1139
X 1196
---
Q 582+84
T 666
X 668
---
Q 8+155
T 163
X 166
---
Q 367+55
T 422
X 419
---
Q 600+257
T 857
X 896
---
Q 761+292
T 1053
X 1010
---
Q 830+597
T 1427
X 1496
---
Q 26+838
T 864
X 868
---
Q 143+93
T 236
X 239
---
검증 정확도 5.780%
| 에폭 5 | 반복 1 / 351 | 시간 0[s] | 손실 1.01
| 에폭 5 | 반복 21 / 351 | 시간 0[s] | 손실 1.01
| 에폭 5 | 반복 41 / 351 | 시간 1[s] | 손실 1.00
| 에폭 5 | 반복 61 / 351 | 시간 1[s] | 손실 0.99
| 에폭 5 | 반복 81 / 351 | 시간 2[s] | 손실 0.97
| 에폭 5 | 반복 101 / 351 | 시간 3[s] | 손실 0.95
| 에폭 5 | 반복 121 / 351 | 시간 3[s] | 손실 0.95
| 에폭 5 | 반복 141 / 351 | 시간 4[s] | 손실 0.94
| 에폭 5 | 반복 161 / 351 | 시간 4[s] | 손실 0.93
| 에폭 5 | 반복 181 / 351 | 시간 5[s] | 손실 0.93
| 에폭 5 | 반복 201 / 351 | 시간 6[s] | 손실 0.91
| 에폭 5 | 반복 221 / 351 | 시간 6[s] | 손실 0.89
| 에폭 5 | 반복 241 / 351 | 시간 7[s] | 손실 0.89
| 에폭 5 | 반복 261 / 351 | 시간 7[s] | 손실 0.88
| 에폭 5 | 반복 281 / 351 | 시간 8[s] | 손실 0.87
| 에폭 5 | 반복 301 / 351 | 시간 8[s] | 손실 0.86
| 에폭 5 | 반복 321 / 351 | 시간 9[s] | 손실 0.85
| 에폭 5 | 반복 341 / 351 | 시간 10[s] | 손실 0.84
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
X 1192
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 166
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 860
---
Q 761+292
T 1053
X 1066
---
Q 830+597
T 1427
X 1414
---
Q 26+838
T 864
X 865
---
Q 143+93
T 236
X 232
---
검증 정확도 12.460%
| 에폭 6 | 반복 1 / 351 | 시간 0[s] | 손실 0.86
| 에폭 6 | 반복 21 / 351 | 시간 0[s] | 손실 0.82
| 에폭 6 | 반복 41 / 351 | 시간 1[s] | 손실 0.82
| 에폭 6 | 반복 61 / 351 | 시간 1[s] | 손실 0.81
| 에폭 6 | 반복 81 / 351 | 시간 2[s] | 손실 0.80
| 에폭 6 | 반복 101 / 351 | 시간 3[s] | 손실 0.80
| 에폭 6 | 반복 121 / 351 | 시간 3[s] | 손실 0.79
| 에폭 6 | 반복 141 / 351 | 시간 4[s] | 손실 0.78
| 에폭 6 | 반복 161 / 351 | 시간 4[s] | 손실 0.77
| 에폭 6 | 반복 181 / 351 | 시간 5[s] | 손실 0.77
| 에폭 6 | 반복 201 / 351 | 시간 6[s] | 손실 0.78
| 에폭 6 | 반복 221 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 | 반복 241 / 351 | 시간 7[s] | 손실 0.75
| 에폭 6 | 반복 261 / 351 | 시간 7[s] | 손실 0.74
| 에폭 6 | 반복 281 / 351 | 시간 8[s] | 손실 0.73
| 에폭 6 | 반복 301 / 351 | 시간 9[s] | 손실 0.73
| 에폭 6 | 반복 321 / 351 | 시간 9[s] | 손실 0.72
| 에폭 6 | 반복 341 / 351 | 시간 10[s] | 손실 0.72
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
X 1141
---
Q 582+84
T 666
X 661
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 851
---
Q 761+292
T 1053
X 1061
---
Q 830+597
T 1427
X 1391
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 234
---
검증 정확도 14.260%
| 에폭 7 | 반복 1 / 351 | 시간 0[s] | 손실 0.71
| 에폭 7 | 반복 21 / 351 | 시간 0[s] | 손실 0.71
| 에폭 7 | 반복 41 / 351 | 시간 1[s] | 손실 0.70
| 에폭 7 | 반복 61 / 351 | 시간 1[s] | 손실 0.70
| 에폭 7 | 반복 81 / 351 | 시간 2[s] | 손실 0.68
| 에폭 7 | 반복 101 / 351 | 시간 2[s] | 손실 0.68
| 에폭 7 | 반복 121 / 351 | 시간 3[s] | 손실 0.67
| 에폭 7 | 반복 141 / 351 | 시간 3[s] | 손실 0.67
| 에폭 7 | 반복 161 / 351 | 시간 4[s] | 손실 0.67
| 에폭 7 | 반복 181 / 351 | 시간 4[s] | 손실 0.66
| 에폭 7 | 반복 201 / 351 | 시간 5[s] | 손실 0.66
| 에폭 7 | 반복 221 / 351 | 시간 5[s] | 손실 0.66
| 에폭 7 | 반복 241 / 351 | 시간 6[s] | 손실 0.64
| 에폭 7 | 반복 261 / 351 | 시간 6[s] | 손실 0.65
| 에폭 7 | 반복 281 / 351 | 시간 7[s] | 손실 0.64
| 에폭 7 | 반복 301 / 351 | 시간 8[s] | 손실 0.63
| 에폭 7 | 반복 321 / 351 | 시간 8[s] | 손실 0.63
| 에폭 7 | 반복 341 / 351 | 시간 9[s] | 손실 0.62
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1142
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1144
---
Q 830+597
T 1427
X 1431
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 239
---
검증 정확도 17.500%
| 에폭 8 | 반복 1 / 351 | 시간 0[s] | 손실 0.66
| 에폭 8 | 반복 21 / 351 | 시간 0[s] | 손실 0.61
| 에폭 8 | 반복 41 / 351 | 시간 1[s] | 손실 0.62
| 에폭 8 | 반복 61 / 351 | 시간 1[s] | 손실 0.61
| 에폭 8 | 반복 81 / 351 | 시간 2[s] | 손실 0.61
| 에폭 8 | 반복 101 / 351 | 시간 2[s] | 손실 0.61
| 에폭 8 | 반복 121 / 351 | 시간 3[s] | 손실 0.60
| 에폭 8 | 반복 141 / 351 | 시간 3[s] | 손실 0.60
| 에폭 8 | 반복 161 / 351 | 시간 4[s] | 손실 0.59
| 에폭 8 | 반복 181 / 351 | 시간 5[s] | 손실 0.58
| 에폭 8 | 반복 201 / 351 | 시간 5[s] | 손실 0.59
| 에폭 8 | 반복 221 / 351 | 시간 6[s] | 손실 0.60
| 에폭 8 | 반복 241 / 351 | 시간 6[s] | 손실 0.59
| 에폭 8 | 반복 261 / 351 | 시간 7[s] | 손실 0.58
| 에폭 8 | 반복 281 / 351 | 시간 7[s] | 손실 0.59
| 에폭 8 | 반복 301 / 351 | 시간 8[s] | 손실 0.58
| 에폭 8 | 반복 321 / 351 | 시간 9[s] | 손실 0.57
| 에폭 8 | 반복 341 / 351 | 시간 9[s] | 손실 0.57
Q 77+85
T 162
X 163
---
Q 975+164
T 1139
X 1134
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 423
---
Q 600+257
T 857
X 759
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1431
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 238
---
검증 정확도 23.080%
| 에폭 9 | 반복 1 / 351 | 시간 0[s] | 손실 0.55
| 에폭 9 | 반복 21 / 351 | 시간 0[s] | 손실 0.56
| 에폭 9 | 반복 41 / 351 | 시간 0[s] | 손실 0.56
| 에폭 9 | 반복 61 / 351 | 시간 1[s] | 손실 0.55
| 에폭 9 | 반복 81 / 351 | 시간 2[s] | 손실 0.54
| 에폭 9 | 반복 101 / 351 | 시간 2[s] | 손실 0.55
| 에폭 9 | 반복 121 / 351 | 시간 3[s] | 손실 0.55
| 에폭 9 | 반복 141 / 351 | 시간 3[s] | 손실 0.54
| 에폭 9 | 반복 161 / 351 | 시간 4[s] | 손실 0.55
| 에폭 9 | 반복 181 / 351 | 시간 4[s] | 손실 0.53
| 에폭 9 | 반복 201 / 351 | 시간 5[s] | 손실 0.54
| 에폭 9 | 반복 221 / 351 | 시간 5[s] | 손실 0.54
| 에폭 9 | 반복 241 / 351 | 시간 6[s] | 손실 0.53
| 에폭 9 | 반복 261 / 351 | 시간 6[s] | 손실 0.53
| 에폭 9 | 반복 281 / 351 | 시간 7[s] | 손실 0.54
| 에폭 9 | 반복 301 / 351 | 시간 8[s] | 손실 0.54
| 에폭 9 | 반복 321 / 351 | 시간 8[s] | 손실 0.53
| 에폭 9 | 반복 341 / 351 | 시간 9[s] | 손실 0.53
Q 77+85
T 162
X 158
---
Q 975+164
T 1139
X 1142
---
Q 582+84
T 666
X 664
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 854
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
X 238
---
검증 정확도 26.520%
| 에폭 10 | 반복 1 / 351 | 시간 0[s] | 손실 0.50
| 에폭 10 | 반복 21 / 351 | 시간 0[s] | 손실 0.51
| 에폭 10 | 반복 41 / 351 | 시간 1[s] | 손실 0.52
| 에폭 10 | 반복 61 / 351 | 시간 1[s] | 손실 0.55
| 에폭 10 | 반복 81 / 351 | 시간 1[s] | 손실 0.52
| 에폭 10 | 반복 101 / 351 | 시간 2[s] | 손실 0.51
| 에폭 10 | 반복 121 / 351 | 시간 2[s] | 손실 0.50
| 에폭 10 | 반복 141 / 351 | 시간 3[s] | 손실 0.51
| 에폭 10 | 반복 161 / 351 | 시간 4[s] | 손실 0.52
| 에폭 10 | 반복 181 / 351 | 시간 4[s] | 손실 0.53
| 에폭 10 | 반복 201 / 351 | 시간 5[s] | 손실 0.50
| 에폭 10 | 반복 221 / 351 | 시간 5[s] | 손실 0.50
| 에폭 10 | 반복 241 / 351 | 시간 6[s] | 손실 0.50
| 에폭 10 | 반복 261 / 351 | 시간 6[s] | 손실 0.50
| 에폭 10 | 반복 281 / 351 | 시간 7[s] | 손실 0.49
| 에폭 10 | 반복 301 / 351 | 시간 8[s] | 손실 0.48
| 에폭 10 | 반복 321 / 351 | 시간 8[s] | 손실 0.48
| 에폭 10 | 반복 341 / 351 | 시간 9[s] | 손실 0.48
Q 77+85
T 162
X 163
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 664
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1431
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 235
---
검증 정확도 29.820%
| 에폭 11 | 반복 1 / 351 | 시간 0[s] | 손실 0.47
| 에폭 11 | 반복 21 / 351 | 시간 0[s] | 손실 0.48
| 에폭 11 | 반복 41 / 351 | 시간 1[s] | 손실 0.48
| 에폭 11 | 반복 61 / 351 | 시간 1[s] | 손실 0.48
| 에폭 11 | 반복 81 / 351 | 시간 2[s] | 손실 0.47
| 에폭 11 | 반복 101 / 351 | 시간 2[s] | 손실 0.47
| 에폭 11 | 반복 121 / 351 | 시간 3[s] | 손실 0.47
| 에폭 11 | 반복 141 / 351 | 시간 3[s] | 손실 0.47
| 에폭 11 | 반복 161 / 351 | 시간 4[s] | 손실 0.48
| 에폭 11 | 반복 181 / 351 | 시간 4[s] | 손실 0.48
| 에폭 11 | 반복 201 / 351 | 시간 5[s] | 손실 0.47
| 에폭 11 | 반복 221 / 351 | 시간 5[s] | 손실 0.47
| 에폭 11 | 반복 241 / 351 | 시간 6[s] | 손실 0.46
| 에폭 11 | 반복 261 / 351 | 시간 6[s] | 손실 0.46
| 에폭 11 | 반복 281 / 351 | 시간 7[s] | 손실 0.46
| 에폭 11 | 반복 301 / 351 | 시간 8[s] | 손실 0.48
| 에폭 11 | 반복 321 / 351 | 시간 8[s] | 손실 0.45
| 에폭 11 | 반복 341 / 351 | 시간 9[s] | 손실 0.45
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1426
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 238
---
검증 정확도 28.480%
| 에폭 12 | 반복 1 / 351 | 시간 0[s] | 손실 0.46
| 에폭 12 | 반복 21 / 351 | 시간 0[s] | 손실 0.45
| 에폭 12 | 반복 41 / 351 | 시간 1[s] | 손실 0.45
| 에폭 12 | 반복 61 / 351 | 시간 1[s] | 손실 0.46
| 에폭 12 | 반복 81 / 351 | 시간 2[s] | 손실 0.45
| 에폭 12 | 반복 101 / 351 | 시간 2[s] | 손실 0.46
| 에폭 12 | 반복 121 / 351 | 시간 3[s] | 손실 0.46
| 에폭 12 | 반복 141 / 351 | 시간 3[s] | 손실 0.46
| 에폭 12 | 반복 161 / 351 | 시간 4[s] | 손실 0.45
| 에폭 12 | 반복 181 / 351 | 시간 4[s] | 손실 0.44
| 에폭 12 | 반복 201 / 351 | 시간 5[s] | 손실 0.45
| 에폭 12 | 반복 221 / 351 | 시간 5[s] | 손실 0.44
| 에폭 12 | 반복 241 / 351 | 시간 6[s] | 손실 0.43
| 에폭 12 | 반복 261 / 351 | 시간 6[s] | 손실 0.43
| 에폭 12 | 반복 281 / 351 | 시간 7[s] | 손실 0.44
| 에폭 12 | 반복 301 / 351 | 시간 8[s] | 손실 0.45
| 에폭 12 | 반복 321 / 351 | 시간 8[s] | 손실 0.44
| 에폭 12 | 반복 341 / 351 | 시간 9[s] | 손실 0.43
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
X 237
---
검증 정확도 36.640%
| 에폭 13 | 반복 1 / 351 | 시간 0[s] | 손실 0.41
| 에폭 13 | 반복 21 / 351 | 시간 0[s] | 손실 0.43
| 에폭 13 | 반복 41 / 351 | 시간 1[s] | 손실 0.42
| 에폭 13 | 반복 61 / 351 | 시간 1[s] | 손실 0.42
| 에폭 13 | 반복 81 / 351 | 시간 2[s] | 손실 0.42
| 에폭 13 | 반복 101 / 351 | 시간 2[s] | 손실 0.44
| 에폭 13 | 반복 121 / 351 | 시간 3[s] | 손실 0.43
| 에폭 13 | 반복 141 / 351 | 시간 4[s] | 손실 0.41
| 에폭 13 | 반복 161 / 351 | 시간 4[s] | 손실 0.42
| 에폭 13 | 반복 181 / 351 | 시간 5[s] | 손실 0.42
| 에폭 13 | 반복 201 / 351 | 시간 5[s] | 손실 0.42
| 에폭 13 | 반복 221 / 351 | 시간 6[s] | 손실 0.43
| 에폭 13 | 반복 241 / 351 | 시간 6[s] | 손실 0.43
| 에폭 13 | 반복 261 / 351 | 시간 7[s] | 손실 0.41
| 에폭 13 | 반복 281 / 351 | 시간 7[s] | 손실 0.42
| 에폭 13 | 반복 301 / 351 | 시간 8[s] | 손실 0.41
| 에폭 13 | 반복 321 / 351 | 시간 8[s] | 손실 0.43
| 에폭 13 | 반복 341 / 351 | 시간 9[s] | 손실 0.40
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 424
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1429
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 239
---
검증 정확도 39.420%
| 에폭 14 | 반복 1 / 351 | 시간 0[s] | 손실 0.41
| 에폭 14 | 반복 21 / 351 | 시간 0[s] | 손실 0.41
| 에폭 14 | 반복 41 / 351 | 시간 1[s] | 손실 0.41
| 에폭 14 | 반복 61 / 351 | 시간 1[s] | 손실 0.40
| 에폭 14 | 반복 81 / 351 | 시간 2[s] | 손실 0.40
| 에폭 14 | 반복 101 / 351 | 시간 2[s] | 손실 0.41
| 에폭 14 | 반복 121 / 351 | 시간 3[s] | 손실 0.39
| 에폭 14 | 반복 141 / 351 | 시간 3[s] | 손실 0.39
| 에폭 14 | 반복 161 / 351 | 시간 4[s] | 손실 0.38
| 에폭 14 | 반복 181 / 351 | 시간 4[s] | 손실 0.38
| 에폭 14 | 반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 14 | 반복 221 / 351 | 시간 5[s] | 손실 0.38
| 에폭 14 | 반복 241 / 351 | 시간 6[s] | 손실 0.39
| 에폭 14 | 반복 261 / 351 | 시간 6[s] | 손실 0.40
| 에폭 14 | 반복 281 / 351 | 시간 7[s] | 손실 0.41
| 에폭 14 | 반복 301 / 351 | 시간 8[s] | 손실 0.39
| 에폭 14 | 반복 321 / 351 | 시간 8[s] | 손실 0.39
| 에폭 14 | 반복 341 / 351 | 시간 9[s] | 손실 0.39
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1137
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1426
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 235
---
검증 정확도 36.680%
| 에폭 15 | 반복 1 / 351 | 시간 0[s] | 손실 0.38
| 에폭 15 | 반복 21 / 351 | 시간 0[s] | 손실 0.39
| 에폭 15 | 반복 41 / 351 | 시간 1[s] | 손실 0.39
| 에폭 15 | 반복 61 / 351 | 시간 1[s] | 손실 0.38
| 에폭 15 | 반복 81 / 351 | 시간 2[s] | 손실 0.38
| 에폭 15 | 반복 101 / 351 | 시간 2[s] | 손실 0.38
| 에폭 15 | 반복 121 / 351 | 시간 3[s] | 손실 0.38
| 에폭 15 | 반복 141 / 351 | 시간 3[s] | 손실 0.38
| 에폭 15 | 반복 161 / 351 | 시간 4[s] | 손실 0.38
| 에폭 15 | 반복 181 / 351 | 시간 4[s] | 손실 0.38
| 에폭 15 | 반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 15 | 반복 221 / 351 | 시간 5[s] | 손실 0.39
| 에폭 15 | 반복 241 / 351 | 시간 6[s] | 손실 0.38
| 에폭 15 | 반복 261 / 351 | 시간 6[s] | 손실 0.37
| 에폭 15 | 반복 281 / 351 | 시간 7[s] | 손실 0.37
| 에폭 15 | 반복 301 / 351 | 시간 8[s] | 손실 0.39
| 에폭 15 | 반복 321 / 351 | 시간 8[s] | 손실 0.39
| 에폭 15 | 반복 341 / 351 | 시간 9[s] | 손실 0.37
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1137
---
Q 582+84
T 666
X 667
---
Q 8+155
T 163
X 164
---
Q 367+55
T 422
X 420
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1431
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 237
---
검증 정확도 41.100%
| 에폭 16 | 반복 1 / 351 | 시간 0[s] | 손실 0.36
| 에폭 16 | 반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 16 | 반복 41 / 351 | 시간 1[s] | 손실 0.36
| 에폭 16 | 반복 61 / 351 | 시간 1[s] | 손실 0.36
| 에폭 16 | 반복 81 / 351 | 시간 2[s] | 손실 0.37
| 에폭 16 | 반복 101 / 351 | 시간 2[s] | 손실 0.36
| 에폭 16 | 반복 121 / 351 | 시간 3[s] | 손실 0.37
| 에폭 16 | 반복 141 / 351 | 시간 3[s] | 손실 0.36
| 에폭 16 | 반복 161 / 351 | 시간 4[s] | 손실 0.37
| 에폭 16 | 반복 181 / 351 | 시간 4[s] | 손실 0.36
| 에폭 16 | 반복 201 / 351 | 시간 5[s] | 손실 0.38
| 에폭 16 | 반복 221 / 351 | 시간 5[s] | 손실 0.38
| 에폭 16 | 반복 241 / 351 | 시간 6[s] | 손실 0.36
| 에폭 16 | 반복 261 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 | 반복 281 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 | 반복 301 / 351 | 시간 7[s] | 손실 0.35
| 에폭 16 | 반복 321 / 351 | 시간 8[s] | 손실 0.35
| 에폭 16 | 반복 341 / 351 | 시간 9[s] | 손실 0.37
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1142
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1430
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 237
---
검증 정확도 42.700%
| 에폭 17 | 반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 17 | 반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 17 | 반복 41 / 351 | 시간 1[s] | 손실 0.36
| 에폭 17 | 반복 61 / 351 | 시간 1[s] | 손실 0.35
| 에폭 17 | 반복 81 / 351 | 시간 2[s] | 손실 0.36
| 에폭 17 | 반복 101 / 351 | 시간 2[s] | 손실 0.34
| 에폭 17 | 반복 121 / 351 | 시간 3[s] | 손실 0.34
| 에폭 17 | 반복 141 / 351 | 시간 4[s] | 손실 0.34
| 에폭 17 | 반복 161 / 351 | 시간 4[s] | 손실 0.34
| 에폭 17 | 반복 181 / 351 | 시간 5[s] | 손실 0.35
| 에폭 17 | 반복 201 / 351 | 시간 5[s] | 손실 0.35
| 에폭 17 | 반복 221 / 351 | 시간 6[s] | 손실 0.34
| 에폭 17 | 반복 241 / 351 | 시간 6[s] | 손실 0.35
| 에폭 17 | 반복 261 / 351 | 시간 7[s] | 손실 0.36
| 에폭 17 | 반복 281 / 351 | 시간 8[s] | 손실 0.37
| 에폭 17 | 반복 301 / 351 | 시간 8[s] | 손실 0.37
| 에폭 17 | 반복 321 / 351 | 시간 9[s] | 손실 0.37
| 에폭 17 | 반복 341 / 351 | 시간 9[s] | 손실 0.36
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1138
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
X 1429
---
Q 26+838
T 864
X 865
---
Q 143+93
T 236
O 236
---
검증 정확도 42.860%
| 에폭 18 | 반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 18 | 반복 21 / 351 | 시간 0[s] | 손실 0.36
| 에폭 18 | 반복 41 / 351 | 시간 1[s] | 손실 0.35
| 에폭 18 | 반복 61 / 351 | 시간 1[s] | 손실 0.35
| 에폭 18 | 반복 81 / 351 | 시간 2[s] | 손실 0.34
| 에폭 18 | 반복 101 / 351 | 시간 3[s] | 손실 0.34
| 에폭 18 | 반복 121 / 351 | 시간 3[s] | 손실 0.33
| 에폭 18 | 반복 141 / 351 | 시간 4[s] | 손실 0.33
| 에폭 18 | 반복 161 / 351 | 시간 4[s] | 손실 0.34
| 에폭 18 | 반복 181 / 351 | 시간 5[s] | 손실 0.33
| 에폭 18 | 반복 201 / 351 | 시간 6[s] | 손실 0.33
| 에폭 18 | 반복 221 / 351 | 시간 6[s] | 손실 0.33
| 에폭 18 | 반복 241 / 351 | 시간 7[s] | 손실 0.33
| 에폭 18 | 반복 261 / 351 | 시간 7[s] | 손실 0.33
| 에폭 18 | 반복 281 / 351 | 시간 8[s] | 손실 0.33
| 에폭 18 | 반복 301 / 351 | 시간 9[s] | 손실 0.33
| 에폭 18 | 반복 321 / 351 | 시간 9[s] | 손실 0.35
| 에폭 18 | 반복 341 / 351 | 시간 10[s] | 손실 0.35
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1138
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 423
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1425
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 237
---
검증 정확도 40.640%
| 에폭 19 | 반복 1 / 351 | 시간 0[s] | 손실 0.34
| 에폭 19 | 반복 21 / 351 | 시간 0[s] | 손실 0.34
| 에폭 19 | 반복 41 / 351 | 시간 1[s] | 손실 0.34
| 에폭 19 | 반복 61 / 351 | 시간 1[s] | 손실 0.34
| 에폭 19 | 반복 81 / 351 | 시간 2[s] | 손실 0.34
| 에폭 19 | 반복 101 / 351 | 시간 2[s] | 손실 0.32
| 에폭 19 | 반복 121 / 351 | 시간 3[s] | 손실 0.31
| 에폭 19 | 반복 141 / 351 | 시간 3[s] | 손실 0.33
| 에폭 19 | 반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 19 | 반복 181 / 351 | 시간 5[s] | 손실 0.30
| 에폭 19 | 반복 201 / 351 | 시간 5[s] | 손실 0.31
| 에폭 19 | 반복 221 / 351 | 시간 6[s] | 손실 0.31
| 에폭 19 | 반복 241 / 351 | 시간 6[s] | 손실 0.32
| 에폭 19 | 반복 261 / 351 | 시간 7[s] | 손실 0.33
| 에폭 19 | 반복 281 / 351 | 시간 7[s] | 손실 0.32
| 에폭 19 | 반복 301 / 351 | 시간 8[s] | 손실 0.32
| 에폭 19 | 반복 321 / 351 | 시간 8[s] | 손실 0.33
| 에폭 19 | 반복 341 / 351 | 시간 9[s] | 손실 0.33
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1430
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 238
---
검증 정확도 47.540%
| 에폭 20 | 반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 20 | 반복 21 / 351 | 시간 0[s] | 손실 0.35
| 에폭 20 | 반복 41 / 351 | 시간 1[s] | 손실 0.33
| 에폭 20 | 반복 61 / 351 | 시간 1[s] | 손실 0.33
| 에폭 20 | 반복 81 / 351 | 시간 2[s] | 손실 0.31
| 에폭 20 | 반복 101 / 351 | 시간 2[s] | 손실 0.31
| 에폭 20 | 반복 121 / 351 | 시간 3[s] | 손실 0.33
| 에폭 20 | 반복 141 / 351 | 시간 3[s] | 손실 0.32
| 에폭 20 | 반복 161 / 351 | 시간 4[s] | 손실 0.33
| 에폭 20 | 반복 181 / 351 | 시간 4[s] | 손실 0.31
| 에폭 20 | 반복 201 / 351 | 시간 5[s] | 손실 0.30
| 에폭 20 | 반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 20 | 반복 241 / 351 | 시간 6[s] | 손실 0.33
| 에폭 20 | 반복 261 / 351 | 시간 6[s] | 손실 0.35
| 에폭 20 | 반복 281 / 351 | 시간 7[s] | 손실 0.36
| 에폭 20 | 반복 301 / 351 | 시간 7[s] | 손실 0.34
| 에폭 20 | 반복 321 / 351 | 시간 8[s] | 손실 0.32
| 에폭 20 | 반복 341 / 351 | 시간 8[s] | 손실 0.32
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 665
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1051
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
X 862
---
Q 143+93
T 236
O 236
---
검증 정확도 49.980%
| 에폭 21 | 반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 21 | 반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 21 | 반복 41 / 351 | 시간 1[s] | 손실 0.30
| 에폭 21 | 반복 61 / 351 | 시간 1[s] | 손실 0.30
| 에폭 21 | 반복 81 / 351 | 시간 2[s] | 손실 0.32
| 에폭 21 | 반복 101 / 351 | 시간 2[s] | 손실 0.32
| 에폭 21 | 반복 121 / 351 | 시간 3[s] | 손실 0.31
| 에폭 21 | 반복 141 / 351 | 시간 3[s] | 손실 0.30
| 에폭 21 | 반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 21 | 반복 181 / 351 | 시간 4[s] | 손실 0.31
| 에폭 21 | 반복 201 / 351 | 시간 5[s] | 손실 0.31
| 에폭 21 | 반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 21 | 반복 241 / 351 | 시간 6[s] | 손실 0.31
| 에폭 21 | 반복 261 / 351 | 시간 7[s] | 손실 0.29
| 에폭 21 | 반복 281 / 351 | 시간 7[s] | 손실 0.30
| 에폭 21 | 반복 301 / 351 | 시간 8[s] | 손실 0.29
| 에폭 21 | 반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 21 | 반복 341 / 351 | 시간 9[s] | 손실 0.29
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
X 162
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
X 859
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 51.040%
| 에폭 22 | 반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 22 | 반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 22 | 반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 22 | 반복 61 / 351 | 시간 1[s] | 손실 0.29
| 에폭 22 | 반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 22 | 반복 101 / 351 | 시간 2[s] | 손실 0.28
| 에폭 22 | 반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 22 | 반복 141 / 351 | 시간 3[s] | 손실 0.31
| 에폭 22 | 반복 161 / 351 | 시간 4[s] | 손실 0.31
| 에폭 22 | 반복 181 / 351 | 시간 4[s] | 손실 0.30
| 에폭 22 | 반복 201 / 351 | 시간 5[s] | 손실 0.28
| 에폭 22 | 반복 221 / 351 | 시간 5[s] | 손실 0.32
| 에폭 22 | 반복 241 / 351 | 시간 6[s] | 손실 0.33
| 에폭 22 | 반복 261 / 351 | 시간 6[s] | 손실 0.32
| 에폭 22 | 반복 281 / 351 | 시간 7[s] | 손실 0.31
| 에폭 22 | 반복 301 / 351 | 시간 8[s] | 손실 0.30
| 에폭 22 | 반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 22 | 반복 341 / 351 | 시간 9[s] | 손실 0.31
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
X 423
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1430
---
Q 26+838
T 864
X 865
---
Q 143+93
T 236
X 238
---
검증 정확도 47.740%
| 에폭 23 | 반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 23 | 반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 23 | 반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 23 | 반복 61 / 351 | 시간 1[s] | 손실 0.28
| 에폭 23 | 반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 23 | 반복 101 / 351 | 시간 2[s] | 손실 0.27
| 에폭 23 | 반복 121 / 351 | 시간 3[s] | 손실 0.28
| 에폭 23 | 반복 141 / 351 | 시간 3[s] | 손실 0.28
| 에폭 23 | 반복 161 / 351 | 시간 4[s] | 손실 0.30
| 에폭 23 | 반복 181 / 351 | 시간 5[s] | 손실 0.30
| 에폭 23 | 반복 201 / 351 | 시간 5[s] | 손실 0.29
| 에폭 23 | 반복 221 / 351 | 시간 6[s] | 손실 0.29
| 에폭 23 | 반복 241 / 351 | 시간 6[s] | 손실 0.28
| 에폭 23 | 반복 261 / 351 | 시간 7[s] | 손실 0.28
| 에폭 23 | 반복 281 / 351 | 시간 7[s] | 손실 0.30
| 에폭 23 | 반복 301 / 351 | 시간 8[s] | 손실 0.29
| 에폭 23 | 반복 321 / 351 | 시간 8[s] | 손실 0.29
| 에폭 23 | 반복 341 / 351 | 시간 9[s] | 손실 0.28
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1142
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1429
---
Q 26+838
T 864
X 866
---
Q 143+93
T 236
X 238
---
검증 정확도 45.140%
| 에폭 24 | 반복 1 / 351 | 시간 0[s] | 손실 0.31
| 에폭 24 | 반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 24 | 반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 24 | 반복 61 / 351 | 시간 1[s] | 손실 0.29
| 에폭 24 | 반복 81 / 351 | 시간 2[s] | 손실 0.30
| 에폭 24 | 반복 101 / 351 | 시간 2[s] | 손실 0.29
| 에폭 24 | 반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 24 | 반복 141 / 351 | 시간 3[s] | 손실 0.29
| 에폭 24 | 반복 161 / 351 | 시간 4[s] | 손실 0.28
| 에폭 24 | 반복 181 / 351 | 시간 4[s] | 손실 0.29
| 에폭 24 | 반복 201 / 351 | 시간 5[s] | 손실 0.28
| 에폭 24 | 반복 221 / 351 | 시간 6[s] | 손실 0.28
| 에폭 24 | 반복 241 / 351 | 시간 6[s] | 손실 0.29
| 에폭 24 | 반복 261 / 351 | 시간 7[s] | 손실 0.29
| 에폭 24 | 반복 281 / 351 | 시간 7[s] | 손실 0.29
| 에폭 24 | 반복 301 / 351 | 시간 8[s] | 손실 0.28
| 에폭 24 | 반복 321 / 351 | 시간 8[s] | 손실 0.27
| 에폭 24 | 반복 341 / 351 | 시간 9[s] | 손실 0.29
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
X 421
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
X 1054
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 237
---
검증 정확도 51.800%
| 에폭 25 | 반복 1 / 351 | 시간 0[s] | 손실 0.29
| 에폭 25 | 반복 21 / 351 | 시간 0[s] | 손실 0.29
| 에폭 25 | 반복 41 / 351 | 시간 1[s] | 손실 0.28
| 에폭 25 | 반복 61 / 351 | 시간 1[s] | 손실 0.26
| 에폭 25 | 반복 81 / 351 | 시간 2[s] | 손실 0.26
| 에폭 25 | 반복 101 / 351 | 시간 2[s] | 손실 0.27
| 에폭 25 | 반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 25 | 반복 141 / 351 | 시간 3[s] | 손실 0.28
| 에폭 25 | 반복 161 / 351 | 시간 4[s] | 손실 0.28
| 에폭 25 | 반복 181 / 351 | 시간 4[s] | 손실 0.28
| 에폭 25 | 반복 201 / 351 | 시간 5[s] | 손실 0.27
| 에폭 25 | 반복 221 / 351 | 시간 5[s] | 손실 0.29
| 에폭 25 | 반복 241 / 351 | 시간 6[s] | 손실 0.27
| 에폭 25 | 반복 261 / 351 | 시간 7[s] | 손실 0.28
| 에폭 25 | 반복 281 / 351 | 시간 7[s] | 손실 0.28
| 에폭 25 | 반복 301 / 351 | 시간 8[s] | 손실 0.27
| 에폭 25 | 반복 321 / 351 | 시간 8[s] | 손실 0.28
| 에폭 25 | 반복 341 / 351 | 시간 9[s] | 손실 0.28
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 856
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1426
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 54.060%
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()
4.2 엿보기(peeky)
Image('./deep_learning_2_images/fig 7-25.png', width=600)
Image('./deep_learning_2_images/fig 7-26.png', width=600)
Image('./deep_learning_2_images/fig 7-27.png', width=600)
PeekyDecoder 클래스
class PeekyDecoder:
def __init__(self, vocab_size, wordvec_size, hidden_size):
V, D, H = vocab_size, wordvec_size, hidden_size
rn = np.random.randn
embed_W = (rn(V, D) / 100).astype('f')
lstm_Wx = (rn(H + D, 4 * H) / np.sqrt(H + D)).astype('f')
lstm_Wh = (rn(H, 4 * H) / np.sqrt(H)).astype('f')
lstm_b = np.zeros(4 * H).astype('f')
affine_W = (rn(H + H, V) / np.sqrt(H + H)).astype('f')
affine_b = np.zeros(V).astype('f')
self.embed = TimeEmbedding(embed_W)
self.lstm = TimeLSTM(lstm_Wx, lstm_Wh, lstm_b, stateful=True)
self.affine = TimeAffine(affine_W, affine_b)
self.params, self.grads = [], []
for layer in (self.embed, self.lstm, self.affine):
self.params += layer.params
self.grads += layer.grads
self.cache = None
def forward(self, xs, h):
N, T = xs.shape
N, H = h.shape
self.lstm.set_state(h)
out = self.embed.forward(xs)
hs = np.repeat(h, T, axis=0).reshape(N, T, H)
out = np.concatenate((hs, out), axis=2)
out = self.lstm.forward(out)
out = np.concatenate((hs, out), axis=2)
score = self.affine.forward(out)
self.cache = H
return score
def backward(self, dscore):
H = self.cache
dout = self.affine.backward(dscore)
dout, dhs0 = dout[:, :, H:], dout[:, :, :H]
dout = self.lstm.backward(dout)
dembed, dhs1 = dout[:, :, H:], dout[:, :, :H]
self.embed.backward(dembed)
dhs = dhs0 + dhs1
dh = self.lstm.dh + np.sum(dhs, axis=1)
return dh
def generate(self, h, start_id, sample_size):
sampled = []
char_id = start_id
self.lstm.set_state(h)
H = h.shape[1]
peeky_h = h.reshape(1, 1, H)
for _ in range(sample_size):
x = np.array([char_id]).reshape((1, 1))
out = self.embed.forward(x)
out = np.concatenate((peeky_h, out), axis=2)
out = self.lstm.forward(out)
out = np.concatenate((peeky_h, out), axis=2)
score = self.affine.forward(out)
char_id = np.argmax(score.flatten())
sampled.append(char_id)
return sampled
class PeekySeq2seq(Seq2seq):
def __init__(self, vocab_size, wordvec_size, hidden_size):
V, D, H = vocab_size, wordvec_size, hidden_size
self.encoder = Encoder(V, D, H)
self.decoder = PeekyDecoder(V, D, H)
self.softmax = TimeSoftmaxWithLoss()
self.params = self.encoder.params + self.decoder.params
self.grads = self.encoder.grads + self.decoder.grads
# coding: utf-8
import sys
sys.path.append('..')
import numpy as np
import matplotlib.pyplot as plt
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq
# 데이터셋 읽기
(x_train, t_train), (x_test, t_test) = sequence.load_data('addition.txt')
char_to_id, id_to_char = sequence.get_vocab()
# 입력 반전 여부 설정 =============================================
is_reverse = True
if is_reverse:
x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]
# ================================================================
# 하이퍼파라미터 설정
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 128
batch_size = 128
max_epoch = 25
max_grad = 5.0
# 일반 혹은 엿보기(Peeky) 설정 =====================================
# model = Seq2seq(vocab_size, wordvec_size, hidden_size)
model = PeekySeq2seq(vocab_size, wordvec_size, hidden_size)
# ================================================================
optimizer = Adam()
trainer = Trainer(model, optimizer)
acc_list = []
for epoch in range(max_epoch):
trainer.fit(x_train, t_train, max_epoch=1,
batch_size=batch_size, max_grad=max_grad)
correct_num = 0
for i in range(len(x_test)):
question, correct = x_test[[i]], t_test[[i]]
verbose = i < 10
correct_num += eval_seq2seq(model, question, correct,
id_to_char, verbose, is_reverse)
acc = float(correct_num) / len(x_test)
acc_list.append(acc)
print('검증 정확도 %.3f%%' % (acc * 100))
| 에폭 1 | 반복 1 / 351 | 시간 0[s] | 손실 2.57
| 에폭 1 | 반복 21 / 351 | 시간 0[s] | 손실 2.48
| 에폭 1 | 반복 41 / 351 | 시간 1[s] | 손실 2.20
| 에폭 1 | 반복 61 / 351 | 시간 1[s] | 손실 1.99
| 에폭 1 | 반복 81 / 351 | 시간 2[s] | 손실 1.89
| 에폭 1 | 반복 101 / 351 | 시간 2[s] | 손실 1.82
| 에폭 1 | 반복 121 / 351 | 시간 3[s] | 손실 1.82
| 에폭 1 | 반복 141 / 351 | 시간 4[s] | 손실 1.80
| 에폭 1 | 반복 161 / 351 | 시간 4[s] | 손실 1.79
| 에폭 1 | 반복 181 / 351 | 시간 5[s] | 손실 1.78
| 에폭 1 | 반복 201 / 351 | 시간 5[s] | 손실 1.77
| 에폭 1 | 반복 221 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 | 반복 241 / 351 | 시간 6[s] | 손실 1.76
| 에폭 1 | 반복 261 / 351 | 시간 7[s] | 손실 1.75
| 에폭 1 | 반복 281 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 | 반복 301 / 351 | 시간 8[s] | 손실 1.74
| 에폭 1 | 반복 321 / 351 | 시간 9[s] | 손실 1.73
| 에폭 1 | 반복 341 / 351 | 시간 10[s] | 손실 1.73
Q 77+85
T 162
X 100
---
Q 975+164
T 1139
X 1013
---
Q 582+84
T 666
X 102
---
Q 8+155
T 163
X 100
---
Q 367+55
T 422
X 1023
---
Q 600+257
T 857
X 1023
---
Q 761+292
T 1053
X 1023
---
Q 830+597
T 1427
X 1111
---
Q 26+838
T 864
X 102
---
Q 143+93
T 236
X 102
---
검증 정확도 0.280%
| 에폭 2 | 반복 1 / 351 | 시간 0[s] | 손실 1.71
| 에폭 2 | 반복 21 / 351 | 시간 0[s] | 손실 1.71
| 에폭 2 | 반복 41 / 351 | 시간 1[s] | 손실 1.71
| 에폭 2 | 반복 61 / 351 | 시간 2[s] | 손실 1.71
| 에폭 2 | 반복 81 / 351 | 시간 2[s] | 손실 1.70
| 에폭 2 | 반복 101 / 351 | 시간 3[s] | 손실 1.68
| 에폭 2 | 반복 121 / 351 | 시간 3[s] | 손실 1.69
| 에폭 2 | 반복 141 / 351 | 시간 4[s] | 손실 1.68
| 에폭 2 | 반복 161 / 351 | 시간 4[s] | 손실 1.67
| 에폭 2 | 반복 181 / 351 | 시간 5[s] | 손실 1.67
| 에폭 2 | 반복 201 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 | 반복 221 / 351 | 시간 6[s] | 손실 1.65
| 에폭 2 | 반복 241 / 351 | 시간 7[s] | 손실 1.65
| 에폭 2 | 반복 261 / 351 | 시간 7[s] | 손실 1.63
| 에폭 2 | 반복 281 / 351 | 시간 8[s] | 손실 1.62
| 에폭 2 | 반복 301 / 351 | 시간 9[s] | 손실 1.61
| 에폭 2 | 반복 321 / 351 | 시간 9[s] | 손실 1.61
| 에폭 2 | 반복 341 / 351 | 시간 10[s] | 손실 1.60
Q 77+85
T 162
X 100
---
Q 975+164
T 1139
X 1200
---
Q 582+84
T 666
X 690
---
Q 8+155
T 163
X 100
---
Q 367+55
T 422
X 690
---
Q 600+257
T 857
X 999
---
Q 761+292
T 1053
X 1029
---
Q 830+597
T 1427
X 1240
---
Q 26+838
T 864
X 792
---
Q 143+93
T 236
X 290
---
검증 정확도 0.400%
| 에폭 3 | 반복 1 / 351 | 시간 0[s] | 손실 1.58
| 에폭 3 | 반복 21 / 351 | 시간 0[s] | 손실 1.59
| 에폭 3 | 반복 41 / 351 | 시간 1[s] | 손실 1.58
| 에폭 3 | 반복 61 / 351 | 시간 2[s] | 손실 1.56
| 에폭 3 | 반복 81 / 351 | 시간 2[s] | 손실 1.55
| 에폭 3 | 반복 101 / 351 | 시간 3[s] | 손실 1.53
| 에폭 3 | 반복 121 / 351 | 시간 4[s] | 손실 1.51
| 에폭 3 | 반복 141 / 351 | 시간 4[s] | 손실 1.50
| 에폭 3 | 반복 161 / 351 | 시간 5[s] | 손실 1.49
| 에폭 3 | 반복 181 / 351 | 시간 5[s] | 손실 1.47
| 에폭 3 | 반복 201 / 351 | 시간 6[s] | 손실 1.46
| 에폭 3 | 반복 221 / 351 | 시간 7[s] | 손실 1.43
| 에폭 3 | 반복 241 / 351 | 시간 7[s] | 손실 1.42
| 에폭 3 | 반복 261 / 351 | 시간 8[s] | 손실 1.41
| 에폭 3 | 반복 281 / 351 | 시간 9[s] | 손실 1.39
| 에폭 3 | 반복 301 / 351 | 시간 9[s] | 손실 1.37
| 에폭 3 | 반복 321 / 351 | 시간 10[s] | 손실 1.36
| 에폭 3 | 반복 341 / 351 | 시간 11[s] | 손실 1.35
Q 77+85
T 162
X 154
---
Q 975+164
T 1139
X 1033
---
Q 582+84
T 666
X 644
---
Q 8+155
T 163
X 161
---
Q 367+55
T 422
X 433
---
Q 600+257
T 857
X 818
---
Q 761+292
T 1053
X 1018
---
Q 830+597
T 1427
X 1344
---
Q 26+838
T 864
X 834
---
Q 143+93
T 236
X 211
---
검증 정확도 1.600%
| 에폭 4 | 반복 1 / 351 | 시간 0[s] | 손실 1.32
| 에폭 4 | 반복 21 / 351 | 시간 0[s] | 손실 1.32
| 에폭 4 | 반복 41 / 351 | 시간 1[s] | 손실 1.30
| 에폭 4 | 반복 61 / 351 | 시간 1[s] | 손실 1.30
| 에폭 4 | 반복 81 / 351 | 시간 2[s] | 손실 1.28
| 에폭 4 | 반복 101 / 351 | 시간 3[s] | 손실 1.27
| 에폭 4 | 반복 121 / 351 | 시간 3[s] | 손실 1.25
| 에폭 4 | 반복 141 / 351 | 시간 4[s] | 손실 1.24
| 에폭 4 | 반복 161 / 351 | 시간 4[s] | 손실 1.22
| 에폭 4 | 반복 181 / 351 | 시간 5[s] | 손실 1.21
| 에폭 4 | 반복 201 / 351 | 시간 6[s] | 손실 1.20
| 에폭 4 | 반복 221 / 351 | 시간 6[s] | 손실 1.20
| 에폭 4 | 반복 241 / 351 | 시간 7[s] | 손실 1.17
| 에폭 4 | 반복 261 / 351 | 시간 7[s] | 손실 1.16
| 에폭 4 | 반복 281 / 351 | 시간 8[s] | 손실 1.14
| 에폭 4 | 반복 301 / 351 | 시간 9[s] | 손실 1.12
| 에폭 4 | 반복 321 / 351 | 시간 9[s] | 손실 1.11
| 에폭 4 | 반복 341 / 351 | 시간 10[s] | 손실 1.10
Q 77+85
T 162
X 158
---
Q 975+164
T 1139
X 1123
---
Q 582+84
T 666
X 657
---
Q 8+155
T 163
X 165
---
Q 367+55
T 422
X 423
---
Q 600+257
T 857
X 777
---
Q 761+292
T 1053
X 1023
---
Q 830+597
T 1427
X 1388
---
Q 26+838
T 864
X 887
---
Q 143+93
T 236
X 223
---
검증 정확도 5.140%
| 에폭 5 | 반복 1 / 351 | 시간 0[s] | 손실 1.08
| 에폭 5 | 반복 21 / 351 | 시간 0[s] | 손실 1.07
| 에폭 5 | 반복 41 / 351 | 시간 1[s] | 손실 1.05
| 에폭 5 | 반복 61 / 351 | 시간 1[s] | 손실 1.04
| 에폭 5 | 반복 81 / 351 | 시간 2[s] | 손실 1.02
| 에폭 5 | 반복 101 / 351 | 시간 3[s] | 손실 1.01
| 에폭 5 | 반복 121 / 351 | 시간 3[s] | 손실 1.00
| 에폭 5 | 반복 141 / 351 | 시간 4[s] | 손실 0.99
| 에폭 5 | 반복 161 / 351 | 시간 4[s] | 손실 0.99
| 에폭 5 | 반복 181 / 351 | 시간 5[s] | 손실 0.96
| 에폭 5 | 반복 201 / 351 | 시간 6[s] | 손실 0.95
| 에폭 5 | 반복 221 / 351 | 시간 7[s] | 손실 0.94
| 에폭 5 | 반복 241 / 351 | 시간 7[s] | 손실 0.92
| 에폭 5 | 반복 261 / 351 | 시간 8[s] | 손실 0.91
| 에폭 5 | 반복 281 / 351 | 시간 8[s] | 손실 0.90
| 에폭 5 | 반복 301 / 351 | 시간 9[s] | 손실 0.89
| 에폭 5 | 반복 321 / 351 | 시간 10[s] | 손실 0.88
| 에폭 5 | 반복 341 / 351 | 시간 10[s] | 손실 0.87
Q 77+85
T 162
X 160
---
Q 975+164
T 1139
X 1135
---
Q 582+84
T 666
X 668
---
Q 8+155
T 163
X 169
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 861
---
Q 761+292
T 1053
X 1045
---
Q 830+597
T 1427
X 1324
---
Q 26+838
T 864
X 861
---
Q 143+93
T 236
X 239
---
검증 정확도 9.380%
| 에폭 6 | 반복 1 / 351 | 시간 0[s] | 손실 0.90
| 에폭 6 | 반복 21 / 351 | 시간 0[s] | 손실 0.86
| 에폭 6 | 반복 41 / 351 | 시간 1[s] | 손실 0.83
| 에폭 6 | 반복 61 / 351 | 시간 1[s] | 손실 0.84
| 에폭 6 | 반복 81 / 351 | 시간 2[s] | 손실 0.82
| 에폭 6 | 반복 101 / 351 | 시간 3[s] | 손실 0.81
| 에폭 6 | 반복 121 / 351 | 시간 3[s] | 손실 0.80
| 에폭 6 | 반복 141 / 351 | 시간 4[s] | 손실 0.79
| 에폭 6 | 반복 161 / 351 | 시간 5[s] | 손실 0.78
| 에폭 6 | 반복 181 / 351 | 시간 5[s] | 손실 0.77
| 에폭 6 | 반복 201 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 | 반복 221 / 351 | 시간 6[s] | 손실 0.76
| 에폭 6 | 반복 241 / 351 | 시간 7[s] | 손실 0.74
| 에폭 6 | 반복 261 / 351 | 시간 8[s] | 손실 0.74
| 에폭 6 | 반복 281 / 351 | 시간 8[s] | 손실 0.73
| 에폭 6 | 반복 301 / 351 | 시간 9[s] | 손실 0.72
| 에폭 6 | 반복 321 / 351 | 시간 10[s] | 손실 0.72
| 에폭 6 | 반복 341 / 351 | 시간 10[s] | 손실 0.71
Q 77+85
T 162
X 163
---
Q 975+164
T 1139
X 1138
---
Q 582+84
T 666
X 668
---
Q 8+155
T 163
X 166
---
Q 367+55
T 422
X 423
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
X 1048
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
X 873
---
Q 143+93
T 236
X 239
---
검증 정확도 15.040%
| 에폭 7 | 반복 1 / 351 | 시간 0[s] | 손실 0.68
| 에폭 7 | 반복 21 / 351 | 시간 0[s] | 손실 0.69
| 에폭 7 | 반복 41 / 351 | 시간 1[s] | 손실 0.67
| 에폭 7 | 반복 61 / 351 | 시간 1[s] | 손실 0.66
| 에폭 7 | 반복 81 / 351 | 시간 2[s] | 손실 0.66
| 에폭 7 | 반복 101 / 351 | 시간 2[s] | 손실 0.65
| 에폭 7 | 반복 121 / 351 | 시간 3[s] | 손실 0.65
| 에폭 7 | 반복 141 / 351 | 시간 4[s] | 손실 0.64
| 에폭 7 | 반복 161 / 351 | 시간 4[s] | 손실 0.63
| 에폭 7 | 반복 181 / 351 | 시간 5[s] | 손실 0.61
| 에폭 7 | 반복 201 / 351 | 시간 5[s] | 손실 0.61
| 에폭 7 | 반복 221 / 351 | 시간 6[s] | 손실 0.60
| 에폭 7 | 반복 241 / 351 | 시간 7[s] | 손실 0.57
| 에폭 7 | 반복 261 / 351 | 시간 7[s] | 손실 0.57
| 에폭 7 | 반복 281 / 351 | 시간 8[s] | 손실 0.57
| 에폭 7 | 반복 301 / 351 | 시간 9[s] | 손실 0.55
| 에폭 7 | 반복 321 / 351 | 시간 9[s] | 손실 0.54
| 에폭 7 | 반복 341 / 351 | 시간 10[s] | 손실 0.53
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 665
---
Q 8+155
T 163
X 156
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
X 858
---
Q 761+292
T 1053
X 1052
---
Q 830+597
T 1427
X 1428
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
X 235
---
검증 정확도 39.100%
| 에폭 8 | 반복 1 / 351 | 시간 0[s] | 손실 0.51
| 에폭 8 | 반복 21 / 351 | 시간 0[s] | 손실 0.50
| 에폭 8 | 반복 41 / 351 | 시간 1[s] | 손실 0.49
| 에폭 8 | 반복 61 / 351 | 시간 1[s] | 손실 0.48
| 에폭 8 | 반복 81 / 351 | 시간 2[s] | 손실 0.47
| 에폭 8 | 반복 101 / 351 | 시간 3[s] | 손실 0.46
| 에폭 8 | 반복 121 / 351 | 시간 3[s] | 손실 0.46
| 에폭 8 | 반복 141 / 351 | 시간 4[s] | 손실 0.44
| 에폭 8 | 반복 161 / 351 | 시간 5[s] | 손실 0.41
| 에폭 8 | 반복 181 / 351 | 시간 5[s] | 손실 0.42
| 에폭 8 | 반복 201 / 351 | 시간 6[s] | 손실 0.41
| 에폭 8 | 반복 221 / 351 | 시간 7[s] | 손실 0.40
| 에폭 8 | 반복 241 / 351 | 시간 7[s] | 손실 0.39
| 에폭 8 | 반복 261 / 351 | 시간 8[s] | 손실 0.37
| 에폭 8 | 반복 281 / 351 | 시간 9[s] | 손실 0.36
| 에폭 8 | 반복 301 / 351 | 시간 9[s] | 손실 0.36
| 에폭 8 | 반복 321 / 351 | 시간 10[s] | 손실 0.35
| 에폭 8 | 반복 341 / 351 | 시간 11[s] | 손실 0.34
Q 77+85
T 162
X 161
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 657
---
Q 8+155
T 163
X 155
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1438
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 65.060%
| 에폭 9 | 반복 1 / 351 | 시간 0[s] | 손실 0.32
| 에폭 9 | 반복 21 / 351 | 시간 0[s] | 손실 0.31
| 에폭 9 | 반복 41 / 351 | 시간 1[s] | 손실 0.31
| 에폭 9 | 반복 61 / 351 | 시간 1[s] | 손실 0.31
| 에폭 9 | 반복 81 / 351 | 시간 2[s] | 손실 0.29
| 에폭 9 | 반복 101 / 351 | 시간 2[s] | 손실 0.29
| 에폭 9 | 반복 121 / 351 | 시간 3[s] | 손실 0.29
| 에폭 9 | 반복 141 / 351 | 시간 4[s] | 손실 0.27
| 에폭 9 | 반복 161 / 351 | 시간 4[s] | 손실 0.27
| 에폭 9 | 반복 181 / 351 | 시간 5[s] | 손실 0.26
| 에폭 9 | 반복 201 / 351 | 시간 5[s] | 손실 0.25
| 에폭 9 | 반복 221 / 351 | 시간 6[s] | 손실 0.25
| 에폭 9 | 반복 241 / 351 | 시간 7[s] | 손실 0.24
| 에폭 9 | 반복 261 / 351 | 시간 7[s] | 손실 0.24
| 에폭 9 | 반복 281 / 351 | 시간 8[s] | 손실 0.23
| 에폭 9 | 반복 301 / 351 | 시간 8[s] | 손실 0.22
| 에폭 9 | 반복 321 / 351 | 시간 9[s] | 손실 0.22
| 에폭 9 | 반복 341 / 351 | 시간 10[s] | 손실 0.21
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
X 1140
---
Q 582+84
T 666
X 657
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 83.280%
| 에폭 10 | 반복 1 / 351 | 시간 0[s] | 손실 0.22
| 에폭 10 | 반복 21 / 351 | 시간 0[s] | 손실 0.20
| 에폭 10 | 반복 41 / 351 | 시간 1[s] | 손실 0.20
| 에폭 10 | 반복 61 / 351 | 시간 1[s] | 손실 0.20
| 에폭 10 | 반복 81 / 351 | 시간 2[s] | 손실 0.18
| 에폭 10 | 반복 101 / 351 | 시간 2[s] | 손실 0.17
| 에폭 10 | 반복 121 / 351 | 시간 3[s] | 손실 0.18
| 에폭 10 | 반복 141 / 351 | 시간 4[s] | 손실 0.17
| 에폭 10 | 반복 161 / 351 | 시간 4[s] | 손실 0.17
| 에폭 10 | 반복 181 / 351 | 시간 5[s] | 손실 0.17
| 에폭 10 | 반복 201 / 351 | 시간 5[s] | 손실 0.17
| 에폭 10 | 반복 221 / 351 | 시간 6[s] | 손실 0.16
| 에폭 10 | 반복 241 / 351 | 시간 7[s] | 손실 0.15
| 에폭 10 | 반복 261 / 351 | 시간 7[s] | 손실 0.15
| 에폭 10 | 반복 281 / 351 | 시간 8[s] | 손실 0.15
| 에폭 10 | 반복 301 / 351 | 시간 9[s] | 손실 0.15
| 에폭 10 | 반복 321 / 351 | 시간 9[s] | 손실 0.14
| 에폭 10 | 반복 341 / 351 | 시간 10[s] | 손실 0.14
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
X 656
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 88.400%
| 에폭 11 | 반복 1 / 351 | 시간 0[s] | 손실 0.13
| 에폭 11 | 반복 21 / 351 | 시간 0[s] | 손실 0.13
| 에폭 11 | 반복 41 / 351 | 시간 1[s] | 손실 0.13
| 에폭 11 | 반복 61 / 351 | 시간 1[s] | 손실 0.12
| 에폭 11 | 반복 81 / 351 | 시간 2[s] | 손실 0.12
| 에폭 11 | 반복 101 / 351 | 시간 3[s] | 손실 0.12
| 에폭 11 | 반복 121 / 351 | 시간 3[s] | 손실 0.11
| 에폭 11 | 반복 141 / 351 | 시간 4[s] | 손실 0.12
| 에폭 11 | 반복 161 / 351 | 시간 5[s] | 손실 0.11
| 에폭 11 | 반복 181 / 351 | 시간 5[s] | 손실 0.11
| 에폭 11 | 반복 201 / 351 | 시간 6[s] | 손실 0.12
| 에폭 11 | 반복 221 / 351 | 시간 7[s] | 손실 0.11
| 에폭 11 | 반복 241 / 351 | 시간 7[s] | 손실 0.11
| 에폭 11 | 반복 261 / 351 | 시간 8[s] | 손실 0.10
| 에폭 11 | 반복 281 / 351 | 시간 8[s] | 손실 0.10
| 에폭 11 | 반복 301 / 351 | 시간 9[s] | 손실 0.10
| 에폭 11 | 반복 321 / 351 | 시간 9[s] | 손실 0.09
| 에폭 11 | 반복 341 / 351 | 시간 10[s] | 손실 0.09
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 90.940%
| 에폭 12 | 반복 1 / 351 | 시간 0[s] | 손실 0.09
| 에폭 12 | 반복 21 / 351 | 시간 0[s] | 손실 0.09
| 에폭 12 | 반복 41 / 351 | 시간 1[s] | 손실 0.09
| 에폭 12 | 반복 61 / 351 | 시간 1[s] | 손실 0.09
| 에폭 12 | 반복 81 / 351 | 시간 2[s] | 손실 0.09
| 에폭 12 | 반복 101 / 351 | 시간 2[s] | 손실 0.08
| 에폭 12 | 반복 121 / 351 | 시간 3[s] | 손실 0.08
| 에폭 12 | 반복 141 / 351 | 시간 4[s] | 손실 0.08
| 에폭 12 | 반복 161 / 351 | 시간 4[s] | 손실 0.08
| 에폭 12 | 반복 181 / 351 | 시간 5[s] | 손실 0.08
| 에폭 12 | 반복 201 / 351 | 시간 5[s] | 손실 0.08
| 에폭 12 | 반복 221 / 351 | 시간 6[s] | 손실 0.09
| 에폭 12 | 반복 241 / 351 | 시간 7[s] | 손실 0.09
| 에폭 12 | 반복 261 / 351 | 시간 7[s] | 손실 0.09
| 에폭 12 | 반복 281 / 351 | 시간 8[s] | 손실 0.08
| 에폭 12 | 반복 301 / 351 | 시간 8[s] | 손실 0.08
| 에폭 12 | 반복 321 / 351 | 시간 9[s] | 손실 0.07
| 에폭 12 | 반복 341 / 351 | 시간 10[s] | 손실 0.08
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 92.220%
| 에폭 13 | 반복 1 / 351 | 시간 0[s] | 손실 0.07
| 에폭 13 | 반복 21 / 351 | 시간 0[s] | 손실 0.07
| 에폭 13 | 반복 41 / 351 | 시간 1[s] | 손실 0.07
| 에폭 13 | 반복 61 / 351 | 시간 2[s] | 손실 0.07
| 에폭 13 | 반복 81 / 351 | 시간 2[s] | 손실 0.06
| 에폭 13 | 반복 101 / 351 | 시간 3[s] | 손실 0.06
| 에폭 13 | 반복 121 / 351 | 시간 4[s] | 손실 0.07
| 에폭 13 | 반복 141 / 351 | 시간 4[s] | 손실 0.06
| 에폭 13 | 반복 161 / 351 | 시간 5[s] | 손실 0.06
| 에폭 13 | 반복 181 / 351 | 시간 6[s] | 손실 0.06
| 에폭 13 | 반복 201 / 351 | 시간 6[s] | 손실 0.06
| 에폭 13 | 반복 221 / 351 | 시간 7[s] | 손실 0.06
| 에폭 13 | 반복 241 / 351 | 시간 8[s] | 손실 0.06
| 에폭 13 | 반복 261 / 351 | 시간 8[s] | 손실 0.06
| 에폭 13 | 반복 281 / 351 | 시간 9[s] | 손실 0.06
| 에폭 13 | 반복 301 / 351 | 시간 10[s] | 손실 0.05
| 에폭 13 | 반복 321 / 351 | 시간 10[s] | 손실 0.05
| 에폭 13 | 반복 341 / 351 | 시간 11[s] | 손실 0.06
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 94.380%
| 에폭 14 | 반복 1 / 351 | 시간 0[s] | 손실 0.05
| 에폭 14 | 반복 21 / 351 | 시간 0[s] | 손실 0.05
| 에폭 14 | 반복 41 / 351 | 시간 1[s] | 손실 0.05
| 에폭 14 | 반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 14 | 반복 81 / 351 | 시간 2[s] | 손실 0.05
| 에폭 14 | 반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 14 | 반복 121 / 351 | 시간 4[s] | 손실 0.05
| 에폭 14 | 반복 141 / 351 | 시간 4[s] | 손실 0.05
| 에폭 14 | 반복 161 / 351 | 시간 5[s] | 손실 0.05
| 에폭 14 | 반복 181 / 351 | 시간 6[s] | 손실 0.05
| 에폭 14 | 반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 14 | 반복 221 / 351 | 시간 7[s] | 손실 0.06
| 에폭 14 | 반복 241 / 351 | 시간 8[s] | 손실 0.06
| 에폭 14 | 반복 261 / 351 | 시간 8[s] | 손실 0.07
| 에폭 14 | 반복 281 / 351 | 시간 9[s] | 손실 0.06
| 에폭 14 | 반복 301 / 351 | 시간 9[s] | 손실 0.06
| 에폭 14 | 반복 321 / 351 | 시간 10[s] | 손실 0.05
| 에폭 14 | 반복 341 / 351 | 시간 11[s] | 손실 0.05
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 94.660%
| 에폭 15 | 반복 1 / 351 | 시간 0[s] | 손실 0.04
| 에폭 15 | 반복 21 / 351 | 시간 0[s] | 손실 0.04
| 에폭 15 | 반복 41 / 351 | 시간 1[s] | 손실 0.04
| 에폭 15 | 반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 15 | 반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 15 | 반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 15 | 반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 15 | 반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 15 | 반복 161 / 351 | 시간 5[s] | 손실 0.05
| 에폭 15 | 반복 181 / 351 | 시간 6[s] | 손실 0.07
| 에폭 15 | 반복 201 / 351 | 시간 6[s] | 손실 0.06
| 에폭 15 | 반복 221 / 351 | 시간 7[s] | 손실 0.05
| 에폭 15 | 반복 241 / 351 | 시간 8[s] | 손실 0.05
| 에폭 15 | 반복 261 / 351 | 시간 9[s] | 손실 0.05
| 에폭 15 | 반복 281 / 351 | 시간 9[s] | 손실 0.04
| 에폭 15 | 반복 301 / 351 | 시간 10[s] | 손실 0.04
| 에폭 15 | 반복 321 / 351 | 시간 11[s] | 손실 0.04
| 에폭 15 | 반복 341 / 351 | 시간 11[s] | 손실 0.04
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 97.080%
| 에폭 16 | 반복 1 / 351 | 시간 0[s] | 손실 0.03
| 에폭 16 | 반복 21 / 351 | 시간 0[s] | 손실 0.03
| 에폭 16 | 반복 41 / 351 | 시간 1[s] | 손실 0.03
| 에폭 16 | 반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 16 | 반복 81 / 351 | 시간 2[s] | 손실 0.03
| 에폭 16 | 반복 101 / 351 | 시간 3[s] | 손실 0.04
| 에폭 16 | 반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 16 | 반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 16 | 반복 161 / 351 | 시간 5[s] | 손실 0.04
| 에폭 16 | 반복 181 / 351 | 시간 6[s] | 손실 0.05
| 에폭 16 | 반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 16 | 반복 221 / 351 | 시간 7[s] | 손실 0.04
| 에폭 16 | 반복 241 / 351 | 시간 8[s] | 손실 0.04
| 에폭 16 | 반복 261 / 351 | 시간 8[s] | 손실 0.04
| 에폭 16 | 반복 281 / 351 | 시간 9[s] | 손실 0.04
| 에폭 16 | 반복 301 / 351 | 시간 10[s] | 손실 0.04
| 에폭 16 | 반복 321 / 351 | 시간 10[s] | 손실 0.04
| 에폭 16 | 반복 341 / 351 | 시간 11[s] | 손실 0.04
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 95.700%
| 에폭 17 | 반복 1 / 351 | 시간 0[s] | 손실 0.04
| 에폭 17 | 반복 21 / 351 | 시간 0[s] | 손실 0.04
| 에폭 17 | 반복 41 / 351 | 시간 1[s] | 손실 0.04
| 에폭 17 | 반복 61 / 351 | 시간 2[s] | 손실 0.06
| 에폭 17 | 반복 81 / 351 | 시간 2[s] | 손실 0.07
| 에폭 17 | 반복 101 / 351 | 시간 3[s] | 손실 0.06
| 에폭 17 | 반복 121 / 351 | 시간 4[s] | 손실 0.05
| 에폭 17 | 반복 141 / 351 | 시간 4[s] | 손실 0.04
| 에폭 17 | 반복 161 / 351 | 시간 5[s] | 손실 0.04
| 에폭 17 | 반복 181 / 351 | 시간 6[s] | 손실 0.03
| 에폭 17 | 반복 201 / 351 | 시간 6[s] | 손실 0.03
| 에폭 17 | 반복 221 / 351 | 시간 7[s] | 손실 0.03
| 에폭 17 | 반복 241 / 351 | 시간 8[s] | 손실 0.03
| 에폭 17 | 반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 17 | 반복 281 / 351 | 시간 9[s] | 손실 0.03
| 에폭 17 | 반복 301 / 351 | 시간 10[s] | 손실 0.03
| 에폭 17 | 반복 321 / 351 | 시간 10[s] | 손실 0.03
| 에폭 17 | 반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 98.160%
| 에폭 18 | 반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 18 | 반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 18 | 반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 18 | 반복 61 / 351 | 시간 1[s] | 손실 0.02
| 에폭 18 | 반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 18 | 반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 18 | 반복 121 / 351 | 시간 3[s] | 손실 0.02
| 에폭 18 | 반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 18 | 반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 18 | 반복 181 / 351 | 시간 5[s] | 손실 0.02
| 에폭 18 | 반복 201 / 351 | 시간 6[s] | 손실 0.02
| 에폭 18 | 반복 221 / 351 | 시간 6[s] | 손실 0.02
| 에폭 18 | 반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 18 | 반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 18 | 반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 18 | 반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 18 | 반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 18 | 반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 97.780%
| 에폭 19 | 반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 19 | 반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 19 | 반복 41 / 351 | 시간 1[s] | 손실 0.03
| 에폭 19 | 반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 19 | 반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 19 | 반복 101 / 351 | 시간 3[s] | 손실 0.05
| 에폭 19 | 반복 121 / 351 | 시간 3[s] | 손실 0.06
| 에폭 19 | 반복 141 / 351 | 시간 4[s] | 손실 0.05
| 에폭 19 | 반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 19 | 반복 181 / 351 | 시간 5[s] | 손실 0.04
| 에폭 19 | 반복 201 / 351 | 시간 6[s] | 손실 0.03
| 에폭 19 | 반복 221 / 351 | 시간 7[s] | 손실 0.03
| 에폭 19 | 반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 19 | 반복 261 / 351 | 시간 8[s] | 손실 0.03
| 에폭 19 | 반복 281 / 351 | 시간 9[s] | 손실 0.03
| 에폭 19 | 반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 19 | 반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 19 | 반복 341 / 351 | 시간 11[s] | 손실 0.03
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 98.080%
| 에폭 20 | 반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 20 | 반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 20 | 반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 20 | 반복 61 / 351 | 시간 1[s] | 손실 0.02
| 에폭 20 | 반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 20 | 반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 20 | 반복 121 / 351 | 시간 3[s] | 손실 0.02
| 에폭 20 | 반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 20 | 반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 20 | 반복 181 / 351 | 시간 5[s] | 손실 0.04
| 에폭 20 | 반복 201 / 351 | 시간 6[s] | 손실 0.05
| 에폭 20 | 반복 221 / 351 | 시간 6[s] | 손실 0.03
| 에폭 20 | 반복 241 / 351 | 시간 7[s] | 손실 0.06
| 에폭 20 | 반복 261 / 351 | 시간 8[s] | 손실 0.06
| 에폭 20 | 반복 281 / 351 | 시간 8[s] | 손실 0.03
| 에폭 20 | 반복 301 / 351 | 시간 9[s] | 손실 0.03
| 에폭 20 | 반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 20 | 반복 341 / 351 | 시간 10[s] | 손실 0.02
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 97.600%
| 에폭 21 | 반복 1 / 351 | 시간 0[s] | 손실 0.02
| 에폭 21 | 반복 21 / 351 | 시간 0[s] | 손실 0.01
| 에폭 21 | 반복 41 / 351 | 시간 1[s] | 손실 0.01
| 에폭 21 | 반복 61 / 351 | 시간 2[s] | 손실 0.01
| 에폭 21 | 반복 81 / 351 | 시간 2[s] | 손실 0.01
| 에폭 21 | 반복 101 / 351 | 시간 3[s] | 손실 0.01
| 에폭 21 | 반복 121 / 351 | 시간 3[s] | 손실 0.01
| 에폭 21 | 반복 141 / 351 | 시간 4[s] | 손실 0.01
| 에폭 21 | 반복 161 / 351 | 시간 5[s] | 손실 0.01
| 에폭 21 | 반복 181 / 351 | 시간 5[s] | 손실 0.01
| 에폭 21 | 반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 21 | 반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 21 | 반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 21 | 반복 261 / 351 | 시간 8[s] | 손실 0.02
| 에폭 21 | 반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 21 | 반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 21 | 반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 21 | 반복 341 / 351 | 시간 10[s] | 손실 0.03
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 95.020%
| 에폭 22 | 반복 1 / 351 | 시간 0[s] | 손실 0.05
| 에폭 22 | 반복 21 / 351 | 시간 0[s] | 손실 0.07
| 에폭 22 | 반복 41 / 351 | 시간 1[s] | 손실 0.08
| 에폭 22 | 반복 61 / 351 | 시간 1[s] | 손실 0.05
| 에폭 22 | 반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 22 | 반복 101 / 351 | 시간 3[s] | 손실 0.03
| 에폭 22 | 반복 121 / 351 | 시간 4[s] | 손실 0.02
| 에폭 22 | 반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 22 | 반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 22 | 반복 181 / 351 | 시간 6[s] | 손실 0.02
| 에폭 22 | 반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 22 | 반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 22 | 반복 241 / 351 | 시간 7[s] | 손실 0.01
| 에폭 22 | 반복 261 / 351 | 시간 8[s] | 손실 0.01
| 에폭 22 | 반복 281 / 351 | 시간 9[s] | 손실 0.01
| 에폭 22 | 반복 301 / 351 | 시간 10[s] | 손실 0.01
| 에폭 22 | 반복 321 / 351 | 시간 10[s] | 손실 0.01
| 에폭 22 | 반복 341 / 351 | 시간 11[s] | 손실 0.01
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 97.860%
| 에폭 23 | 반복 1 / 351 | 시간 0[s] | 손실 0.01
| 에폭 23 | 반복 21 / 351 | 시간 0[s] | 손실 0.01
| 에폭 23 | 반복 41 / 351 | 시간 1[s] | 손실 0.01
| 에폭 23 | 반복 61 / 351 | 시간 2[s] | 손실 0.01
| 에폭 23 | 반복 81 / 351 | 시간 2[s] | 손실 0.01
| 에폭 23 | 반복 101 / 351 | 시간 3[s] | 손실 0.01
| 에폭 23 | 반복 121 / 351 | 시간 3[s] | 손실 0.01
| 에폭 23 | 반복 141 / 351 | 시간 4[s] | 손실 0.01
| 에폭 23 | 반복 161 / 351 | 시간 5[s] | 손실 0.01
| 에폭 23 | 반복 181 / 351 | 시간 5[s] | 손실 0.01
| 에폭 23 | 반복 201 / 351 | 시간 6[s] | 손실 0.01
| 에폭 23 | 반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 23 | 반복 241 / 351 | 시간 7[s] | 손실 0.01
| 에폭 23 | 반복 261 / 351 | 시간 8[s] | 손실 0.01
| 에폭 23 | 반복 281 / 351 | 시간 8[s] | 손실 0.01
| 에폭 23 | 반복 301 / 351 | 시간 9[s] | 손실 0.01
| 에폭 23 | 반복 321 / 351 | 시간 10[s] | 손실 0.03
| 에폭 23 | 반복 341 / 351 | 시간 10[s] | 손실 0.04
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
X 874
---
Q 143+93
T 236
O 236
---
검증 정확도 95.800%
| 에폭 24 | 반복 1 / 351 | 시간 0[s] | 손실 0.03
| 에폭 24 | 반복 21 / 351 | 시간 0[s] | 손실 0.03
| 에폭 24 | 반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 24 | 반복 61 / 351 | 시간 2[s] | 손실 0.03
| 에폭 24 | 반복 81 / 351 | 시간 2[s] | 손실 0.04
| 에폭 24 | 반복 101 / 351 | 시간 3[s] | 손실 0.04
| 에폭 24 | 반복 121 / 351 | 시간 4[s] | 손실 0.04
| 에폭 24 | 반복 141 / 351 | 시간 4[s] | 손실 0.03
| 에폭 24 | 반복 161 / 351 | 시간 5[s] | 손실 0.03
| 에폭 24 | 반복 181 / 351 | 시간 5[s] | 손실 0.02
| 에폭 24 | 반복 201 / 351 | 시간 6[s] | 손실 0.02
| 에폭 24 | 반복 221 / 351 | 시간 7[s] | 손실 0.02
| 에폭 24 | 반복 241 / 351 | 시간 7[s] | 손실 0.02
| 에폭 24 | 반복 261 / 351 | 시간 8[s] | 손실 0.02
| 에폭 24 | 반복 281 / 351 | 시간 8[s] | 손실 0.02
| 에폭 24 | 반복 301 / 351 | 시간 9[s] | 손실 0.02
| 에폭 24 | 반복 321 / 351 | 시간 10[s] | 손실 0.02
| 에폭 24 | 반복 341 / 351 | 시간 10[s] | 손실 0.02
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
O 1427
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 97.480%
| 에폭 25 | 반복 1 / 351 | 시간 0[s] | 손실 0.01
| 에폭 25 | 반복 21 / 351 | 시간 0[s] | 손실 0.02
| 에폭 25 | 반복 41 / 351 | 시간 1[s] | 손실 0.02
| 에폭 25 | 반복 61 / 351 | 시간 2[s] | 손실 0.02
| 에폭 25 | 반복 81 / 351 | 시간 2[s] | 손실 0.02
| 에폭 25 | 반복 101 / 351 | 시간 3[s] | 손실 0.02
| 에폭 25 | 반복 121 / 351 | 시간 4[s] | 손실 0.02
| 에폭 25 | 반복 141 / 351 | 시간 4[s] | 손실 0.02
| 에폭 25 | 반복 161 / 351 | 시간 5[s] | 손실 0.02
| 에폭 25 | 반복 181 / 351 | 시간 6[s] | 손실 0.01
| 에폭 25 | 반복 201 / 351 | 시간 7[s] | 손실 0.01
| 에폭 25 | 반복 221 / 351 | 시간 7[s] | 손실 0.01
| 에폭 25 | 반복 241 / 351 | 시간 8[s] | 손실 0.01
| 에폭 25 | 반복 261 / 351 | 시간 9[s] | 손실 0.02
| 에폭 25 | 반복 281 / 351 | 시간 9[s] | 손실 0.02
| 에폭 25 | 반복 301 / 351 | 시간 10[s] | 손실 0.02
| 에폭 25 | 반복 321 / 351 | 시간 11[s] | 손실 0.02
| 에폭 25 | 반복 341 / 351 | 시간 11[s] | 손실 0.02
Q 77+85
T 162
O 162
---
Q 975+164
T 1139
O 1139
---
Q 582+84
T 666
O 666
---
Q 8+155
T 163
O 163
---
Q 367+55
T 422
O 422
---
Q 600+257
T 857
O 857
---
Q 761+292
T 1053
O 1053
---
Q 830+597
T 1427
X 1437
---
Q 26+838
T 864
O 864
---
Q 143+93
T 236
O 236
---
검증 정확도 96.120%
# 그래프 그리기
x = np.arange(len(acc_list))
plt.plot(x, acc_list, marker='o')
plt.xlabel('에폭')
plt.ylabel('정확도')
plt.ylim(0, 1.0)
plt.show()
댓글남기기