かやのみ日記帳

日々感じたことをつれづれと書いています。

AIによる画像生成、Midjouneyを試してみた感想

これはこれであり?
(Midjourney: cat ear tail, japanese anime like, girl , long straight orange hair)

MidjourneyはDiscordで/imagine なんとか~とつぶやくとAIが60秒以内に画像生成してくれるサービスだ。有料のサブスク$30/monthで無限に使えるようになる。

上のカバー画像は実際にMidjourney生成のもの。イメージとしてはVRChatの自分のアバターを生成してほしかったのだが…まあ全然使いこなせていない。けどこれはこれでいい感じに思える。

顧客のイメージしていたもの

まあこの画像を日本語でもどう表現したらいいのかは非常に難しいだろう。それを英語でAIに理解できるように説明するのは困難だ。なので魔法の画像生成機にはたぶんならない。けど呪文のように、いろいろ指定しやすい単語を組み合わせて新しい画像を生み出せる。

 

で、いろいろやった感想を書きたいと思う。

 

混ぜ物がうまい

Google画像検索をした上位20位を混ぜて出力している感じがする。重み付けとなるメインのものが2つくらいあって、他の要素をうまく混ぜ合わせている感じ。自分で生成しているような雰囲気はあまり感じなかった。混ぜるのがうまい。

なので、ホントは出力された画像から入力元の画像は10~20くらい重み付け付きで出せるんじゃないかと思う。ただ、その入力元がバレると競合にとって有利だし、意外と内部で複雑な計算をやってるかもしれないのでなんとも。非公開なのはしょうがない。

 

人間も結局過去に体験してきた様々なものを混ぜ合わせて創作をしている。そのデータ量のことを”人生経験”なんていうのかもしれない。そういったデータセットはAIは忘れないし、強い。そこに加えて混ぜ方がどんどんうまくなっちゃうと人間太刀打ちできない気がする。

Twitterで話題になっているのはプロの絵描きがAIを元に修正していい絵にしていること。この修正をAIが学習してさらにいい絵にできるとなると…いやーやばい。

 

たぶんだが、将来的には絵に含まれている要素、スタイルを抽出して、別な絵に対して適用できるようになると思う。その混ぜ方、抽出方法は絵には依存しにくいと思う。なのでデータセットによらず、学習データとして利用可能なはずだ。

そうなると今の不明瞭なデータセット著作権のヤバさから開放されて、本当に創造的なAIになっちゃうかもしれないなと思った。

 

写真の構図、絵のタッチ…そういうものを学習されて、絵に適用可能になるとAIによる修正サジェストなんかもできるだろうし…強い。そういえばAI着彩もあったんだった。ホントにAIがどんどん創作に忍び寄っている。

将来的には3D空間というのも学習できて絵からモデルを作成できるかもしれない。
いろいろ可能性を感じた。