画像生成AIの弱点は | ネルログ - 哲学対話、読書、Suno、ゲームの話をつらつらと

現在の画像生成AIで作りにくい画像

PixAI.Artをいろいろと使ってみて感じたのは、なんでも画像生成できるというわけではない無い点です。

例えば、将棋（shogi）の画像を生成しようとすると、

といった感じになります。全然人間がイメージするものとは異なりますね。

これは元データとして将棋の画像が存在しないから発生しているのが原因と考えられます。または将棋という言葉を学習できていないからかもしれません。

次に理想的な日本の朝食（The ideal Japanese breakfast）の例では、

という感じで、明らかに洋食の朝食になります。これも同様に元の画像データが存在しないか、日本の朝食についてAIが学習できていない可能性が高いです。

この傾向はCanvaの画像生成でも同じで、いろいろと入力するテキストを変更しても、難しかったです。

またアジア人というと、中国系の顔になりやすいというのもありますね。このあたりは日本独自性というか、日本向けにかなりローカライズしないと難しい気がしました。

その点ではPixAI.Artの人物画像は、日本人に馴染みやすいので、海外の画像生成AIに比べると一日の長があると言えますね。

とうことで、画像生成AIは万能というわけではなく、作れない画像も多数存在するため、このあたりが人間に残された余地なのかもしれないと思いました。

そのうち画像生成できるようになるのかもしれませんが、次々と新しい事象は生まれていくので、結局それらは人間が写真を撮ったり、絵を描いたりしないといけないということです。