Korean man, Korean woman을 통해 Class prompt를 작성했기에 생성 후 비교하는 이미지가 전부 동양인이기 때문에 외국인의 이미지를 잘 그리지 못하는 것 같음 (실험1의 에미넴)
Inference step은 50이 적당할 것 같음. 100steps를 할 경우엔 과적합 때문인지 얼굴이 뭉개지는 현상이 생김.
Instance image는 다다익선. 4장이 최소지만 6장, 10장 등 늘릴 때마다 성능이 좋아지는 것으로 보임
gradient_accumulation_steps 가 2배 늘어날 때 마다 시간이 2배로 늘어남.
train_batch_size의 한계는 4.
memory개선을 통해 batch_size를 늘려보려 했지만 8-bits-adam은 라이브러리가 CUDA를 찾지 못하는 오류가 계속 생겨 사용 불가.
batch_size를 2로 할 경우 충분히 상용 가능한 속도로 학습이 될 것 같음. 불가능한 시간보다는 조금의 성능을 포기하고 시간을 챙기는 게 좋을 것 같음..