こんにちは、草井真良です。
過激な意見が飛び交うAI関連ですが、私はどちらも利用してみています。
こういう記事も過去に書きました。
画像生成AIや対話型AIをしばらく使ってみた感想を書きます。
そもそもAIとは?
調べてみると決まった定義はないそうで、人工知能という、人間の知能を模倣したコンピュータシステムだと言われています。
そもそもAIという言葉の定義自体が曖昧なようで、この状態から議論するのは意見がまとまらないという意味でかなりまずいと思うのですが、とりあえずここでは前述のように、人間の知能を模倣したコンピュータシステムとしましょう。
その開発や利用において、Python(パイソン)というプログラミング言語がよく使われております。
何故ならばAIの開発に使えるライブラリやフレームワーク、つまり外部のスクリプトを利用しやすく、それらを活用する事で初心者でも比較的手軽に開発ができるからです。
私はAIの手を借りて少しPythonを触ってみましたが、PHPやJavaScriptとは異なる独特の文法で、全くの初心者でも大丈夫とは言いにくい感触を受けました。
何を作るのかの目的をはっきりさせてテキストとネットを活用しないとやや厳しいと感じました。
また使う機会があるなら多分画像認識やデータ分析で必要になったら学ぶといった感じになりそうです。
Pythonができる代表としてはWebスクレイピング(Web上のデータ収集)が挙げられたりしますが、ある程度はPHPを自動で動かす事でもできてしまうから上記の使い方やAI関係が強みだと思います。
余談はこれまでにして本題に入りましょう。
画像生成AIを使ってみた感想
使ったのはNovelAIとStable Diffusion A1111で、NSFWも含めて画像を多数生成してみました。
使ってみて構図やキャラの特徴をきちんとプロンプト(呪文)で指定しててもAIは従ってくれないケースが多々ありました。
特に画像を滑らかにするためにスケール(呪文への忠実度)を低くしているとAIが指示に従わない確率が高くなっていきました。
スケールを高くすると指示には従いやすくなってくれますが、画像がガビガビになって線が汚くなりがちなのでそうせざるを得ませんでした。
またLoRAという追加データを使うとそれがより顕著になります。
Stable Diffusionはローカルでも使えますが、NovelAIの方はオンラインオンリーです。
NovelAIはStable Diffusionと違い有料でLoRAも使えず、プロンプトもNSFW関係は自動入力してくれないので困りました。入力できるようにして欲しい・・・
また私の指示が良くなかったのでしょうが、出力される画像がどうにもワンパターンで変化に乏しいのも良くない点です。
Stable Diffusionは拡張機能で予測入力ができ、また簡単にバリエーションのある画像を生成しやすいので、最近はこっちの方で遊んでいたりします。
良いグラボを積んだマシンがあればローカルでも動かせますしね。
対話型AIを使ってみた感想
使ったのはChatGPTやGeminiで、ローカルではまだ使った事はありません。
こちらは最近画像生成もできるようになったという事で便利になりましたね(生成に時間はかかりますが)
ローカルで動かすには画像生成AIと比べてかなりマシンのスペックが要求されるようで、一般人が容易に手を出せるものではありません。
軽く調べてみた所、ある程度使えるものを動かすにはグラフィックボード(GPU)の性能の指針の1つとなる「VRAM」が16GB以上ないと難しいようです。
それより小さくてもCPUやRAMに負担をかけて動かす「CPUモード」 があるのですが、応答速度が下がるらしくやはりGPUが大事なようですね。
この分野はあまり使った事がないから良いものがあればコメント欄等で教えてください。
最後に
どうでしたでしょうか?
AIを使うにあたって強力なグラフィックボード(GPU)が必要なので、私を含めて一般人には中々手が届かないですね。
一応このようなGPU付きのサーバをレンタルできるサービスもありますが、高価で設定するのにもコツが要るのでやはり手を出しにくいですね。
今後はマシンの性能向上とともに、AI自体が少ないリソースで高度な回答や生成が可能になるように祈っています。
未来に期待します。
コメント