いろいろと気力も上がってきたので、AI系のツールをいろいろと試し始めました。
目次
テキスト系
とりあえず、テキスト系では、
に触ってみました。
スラスラと文章が出てくるのは、本当に素晴らしいなと思いました。使っていて欠点というか、今後のAIの方向性の課題みたいなものが見えたなあと。
元データをどう選ぶのか?
まず、元データをどうするか?という話。著作権うんぬんの話もあるのですが、個人的には元データをどういう基準で選ぶのか?というのが最大の課題になりそうな気がしました。
具体的には、
- 時期(タイムラグ)
- データの量と配分
です。
時期(タイムラグ)
これは非常にわかりやすくて、古い情報ばかりだと出力は古い情報になってしまいます。ですので、適度に新しい情報をインプットというか、AIに学習させる必要があり、それには時間がかかるわけです。
ただ、世界はリアルタイムに進行しているので(時間概念の話は置いておきましょう)、常に最新情報は得られません。
つまり、そこに確実にタイムラグが存在するわけです。
データの量と配分
次にデータの量と配分。量というのはどのぐらいの情報量をAIに学習させるか?ということです。極端な例ですが、ゾウリムシについての情報はどのぐらいが適正なのか?という話。それをどうやって判断し、どうやって選別するのか?というのが課題になります。
たくさん学習させたほうが良い気もしますが、そもそもゾウリムシの情報ってそんなに必要?ってこともあるので。それがすべての情報)まあ言葉と言ったわかりやすいですね)で起きるわけです。それをどうやって制御するのかは難しいなと。
いやいやインターネットにある情報の量で判断すれば良いじゃないかという意見もあると思いますが、それが2つ目の配分という課題です。
例えば、陰謀論についての情報ってたくさんありますよね。ほとんどはそれがあたかも事実かのように書かれています。無作為にやってしまえば、そういう情報も入ってしまう可能性があるわけです。じゃあ、人間がある程度制御すれば良いのでは?という話になりますが、そうなると選別者の意思が反映されてしまうわけです。
まっとうな人間(何を持ってまっとうとするかは置いといて)が選別するなら良いですが、たまたま危険思想の持ち主がその選定者に選ばれてしまったら、偏った情報をAIに学習させる可能性を否定できません。
そのあたりってあまり議論されていないようにも思いました。
玉虫色の日本人みたいな回答
これも使っていて、非常に気になりました。一番受けが良いものを集めてくると、結果として玉虫色になってしまうというわけです。
一番懸念されるというか、個人的にうーんと思ったのが、例えばAのメリット、デメリットを挙げる場合。明らかにAのメリットの方が多かったとしても、玉虫色の回答がメインになると、結果としてメリットとデメリットが同程度あるように感じてしまいます。
現在のテキスト系AIには自分で判断することをシステム上で防いでいて、人間に判断を委ねるとしていますが、前提条件としてAのメリットが多いのに、デメリットも同程度の量をピックアップされてしまったら迷いますよね。これって判断する際の材料として微妙だなと感じました。
まあ他にもいろいろと感じたことはありますが、もっと触ってみて改めて書く予定です。
画像系
とりあえずPixAIを使ってみて、TwitterやWeb上のAI画像をいろいと見たり、調べたりした感想です。
方向性が似ている
一番思ったのは方向性全部一緒だなという点。
テキストの項目で述べた玉虫色の回答に似ているのですが、人が好む画像や写真のテイストって一定の方向性が有るんですよね。
元にしている写真や画像が一緒というのもありますが、生成される画像は違いはあるものの、どこかしら似たような面影があります。逆に微妙だったものについては、言わずもがな、投稿されることは無いですし、そっと削除されていくだけです。
そのため、全体的に美に対する感覚が一緒だと、結果として同じようなものしか生まれないというのが課題としてあるかなと感じました。
AIコスプレイヤーみたいな表現がありましたが、意味は合っているかどうかはわかりませんが、すごく個人的にはしっくりきました。似ている顔で、装飾が違うという感じです。
元データの権利的
前述したように元にしている画像や写真が一緒だと、どうしても似たようなものになってしまうという課題があります。
著作権的な問題もまだどう決着が付くのか、今後変わっていく可能性があるかはわかりませんが、少なくとも個性的な絵柄を描く方は、AIの元データにされるとするバレてしまうので、何かしらトラブルが発生しそうです。
これはリアル画像系でもそうで、なんとなく、このあたりの人の写真を元データとして使っているんだろうなあという想像が結構できてしまいます。
そのあたりがクリアにならないと、今後もいろいろと問題は出てきそうな感じはありますね。版権的なものというか、肖像権的なものです。
例えば、勝手に自分の写真が使われていたら嫌ですよね。。。で、これまでは問題無しだったものが、ひっくり返る可能性は無きにしもあらず。ただ、遡って違法になることは無いですし、新法作るにしても、法律変えるにしても時間がかかるので、今すぐどうこうというわけではないですが。
テキストの場合って、こういう問題が発生しにくいというか、一般的な文章になるので結構問題が出にくいのと判別しにくいってのがありますが、写真や画像は一発で誰でもわかりますからね。そこが個人的には気になりました。
音声系
音声系は、RVC+VC Clientの組み合わせで半リアルタイムの音声変換を試しました。
ノイズはあるが通常のボイスチェンジャーとは圧倒的差
これはちょっと驚きました。調べたサイトが女性声でやっていたので、自分もそのまま女性声で試してみたのですが、ボイスチェンジャーとは全く違い、圧倒的な差があることを感じました。
ボイスチェンジャーはあくまで自分の声のピッチなどを変更するので、自分の喋り方がかなり強く出てしまいます。
しかし、RVC+VC Clientのリアルタイム音声変換(AIボイスチェンジャーと言うみたい)の場合、発した言葉を変換するのではなくて、言葉を読み取ってAIに喋らせる感じなので、元の自分の喋り方がかなり消せる感じです。
というか、普通に喋っていてもAIの喋り方になってしまうという方がわかりやすいかもしれません。どうも海外では犯罪にも使われはじめているようで、たしかにこれはヤバいなとは思いました。
ただ、現状ではノイズが入ったり、声を上手く認識できなくても、その認識できなかった音でAIが勝手に喋ってしまったりと、課題はあります。
それでも普通に遊ぶ分には問題ないですし、Youtubeなどの動画やライブ配信などには使えるレベルだなと思いました。
個性の価値が高まる可能性は高い
AI系ツールをいろいろと触ってきて感じたのは、もう個性の無い人間はAIに取って代わられるんだなということを実感しました。
ただ、逆に個性のある人は生き残れるというか、価値が逆に上がっていくんだろうなとも言えます。
その人にしか描けない絵、小説、マンガなどクリエイティブなものについて、突き抜けた個性のものはAIに作ることはできません。正確に言えば、その人の絵や小説などをメインに学習させれば、再現することはできるでしょう。でも、それってその人の個性は残るってことなんですよね。
また専門分野などのニッチな世界は、これからもAIでは難しいだろうなと感じました。前述したようにAIは玉虫色だったり、人間が好む方向性に沿った出力が残っていくため、逆にニッチな世界はどうやっても苦手です。なので、特化型の人も生き残ることができるかなと感じました。
時代はリアルと仮想の二極化
ということで、最後にタイトルの話。
AIの進化は目覚ましく、テキストや画像、動画(ディープフェイクなど)で仮想世界はこれまで以上に盛り上がりを見せるだろうなと感じました。正直、リアルに興味を持たない人も増えていくでしょう。
そうなると、リアル世界を重視する人と、仮想世界を重視する人の二極化していくのでは無いかなと思いました。というか現状そうなりつつあるかなと。
逆に言えば、リアルの価値がこれまで以上に希少なものになるので、リアルでうまく立ち回れると、それだけリターンも大きくなる可能性は高そうです。
大量生産される偽物
AIで作られたものはどうやっても仮想世界であって、それはリアルではありません。その壁は電脳などの新しいテクノロジーが生まれない限り越えられない壁(いわゆる2次元の壁)。VRでいくら臨場がんが出ようとも、それはリアルではなく偽物でしかないです。
またAI系コンテンツは大量生産しやすく、誰でも簡単に生成できてしまう(参入障壁が低い)ため、今後、価値はどんどん下がっていくと思われます。一部の成功者は生まれるとしても、他は死屍累々の世界とも言えるかなと。
それはユートピアなのか、それともディストピアなのか
さらに言えば、二極化も単純に2つに分かれるというよりは、一部のリアル世界を重視する人と多くの仮想世界を重視する人という感じになる気がします。
そして一番不安というか、個人的にうーんと思ってしまったのは、多くの人が享楽する仮想世界を作るのは、最終的に一部のリアル重視派なんだろうなと。
今は最先端のテクノロジーですが、ある程度時間が経てば、後は資本勝負になるということです。
それがユートピアなのか、それともディストピアなのか、自分にはよくわからいなあと思いました。
※ちなみにアイキャッチの最初の画像は、Canvaで人工知能と二極化という情報から人工知能によって作成された画像です。