LoRAとは:GPTと別の仕組みのAIが絵を学習する方法
LoRAの利点:20~200枚ぐらいの絵があればいい。
LoRAの仕組み : 基盤モデルは6GBの容量で、数万枚の学習データが入っている。それに自分の絵柄を学習したLoRAデータ(数10MB)で方向づけをするとお手軽に自分の絵柄を近づけられる。
例えると、博士課程を終えた人(大量学習済み)に幼稚園の先生やらせたり小中高大学教員やらせたりできるイメージ。学部によって向き不向きあるので、目的にあった学部の人を選ぶ。
画像を用意するだけじゃなくて、
・Googleアカウント
・画像20枚
・画像に紐づいた名前の、画像を説明するテキストデータ20個(girl.jpg なら girl.txt)
テキストデータには、画像がなんなのかを説明するタグを記述。あとから自動化できるけど、最初手作業でやるといいらしい。
01.jpg
01.txt
------------------------------------------
a_girl , smile, looking_at_viewer, watercolor,
------------------------------------------
GPTに判断させたら、Counterfeit v3 か PastelMix