chatGPT、省庁内の大量の書類を捌くのに使いたいという心情は分かるし、縦断的に使えるようにするメリットは計り知れないんでそういう方面はいいと思う
でも著作物の学習はどうなんだろうと思ってしまう
あれの要約機能がここぞというときにあまり役に立たない理由は
PDFを読ませても学習量が十分でなければうまく出力できないからでないかと思うんだよな
学習内容がGPTの中にクラスタ化してしっかり定着するまでにはやはり物量か、過学習が必要
よくも悪くもたくさん食べた情報、ネットに多数決で書かれている内容に引きずられる
国会図書館の図書を読み込ませたとしても、同一の記述のパラフレーズがいくつもなければ定着しない
AIは内容の精査もしないのでたくさん書いてあることが真実となる
資料が少ない事柄は過学習させてそのまま吐き出させるしかないんじゃないかと思うので、出力物が著作権侵害をしやすくなる
これはお絵描きAIでも同様だという肌感覚があるんだよね
クラスタ化するほどの学習量が確保できているのは現状だと女の子が一人だけの(エロ)絵
それも顔と身体といくつかの構図くらいで手・髪型・服はぐちゃぐちゃ
学習量の少ない部分、創作性を出して差別化を図りたい部分はどうしても人間の絵師からパクってこないといけない
はっきり言って粗雑な盗作・ディープフェイクには使えても仕事で使えるような代物ではない