>>443
マジ?ソース見てみたい
takagiとかいうのがちょっとくらい児童のデータがLLMにまざっても構わんネットに載せた時点でそいつの責任って法律になってるとか言ってるの見た時に
こりゃ色んな意味でヤッベェことになってんなと思ったんだけど
(そのノリで運営するなら医療アシスタントのchatbotなんかもちょっとくらいは事故になんねーよ勝手に口座の入力画面間違えたリテラシー低いジジババが悪いんだ位のスタンスで重大な流出事故を起こしかねない、すでにマイナカードで実績もある)
その後の和製生成AIのニュースでまずWikipediaから学習と言ってたのにはちょっと驚いたんだよね
あれ?意外と慎重?って
和製生成AI作ってるやつらはまだ正気と思っていいのかなぁ

画像生成AIはクソ性能のdiffusionモデルが気軽に未消化の元画像吐き出して元データ流出させても誰も死なないせいか「コピー機じゃない!コラなんてしてない!」ってテック系が言い張ってるみたいだけど
それを医療でやったら大変なことになるぞ、と思うんだけどね
仕組み的にも一度多次元ベクトル化を挟んでるだけで実質コピー&コラージュ機に近いと思うんだよな
テック系的には数値だから元画像切り貼りしてない、だからコラじゃない!と思うのかもしれんが
イラストっていう膨大なベクトル数の集合体では汎化が起こるまでに膨大な量の学習が必要なわけで
SDから23億枚+1億6千枚+clip6億枚まで使用しても足りずにどうみても素材が残ってるものを吐き出さないといけないのなら
使用自体を中止すべきでは?と思うんだけどね
これが社内文書ならとっくに損害賠償沙汰、小説にうっかり使用しても一文や二文の完全一致で自主回収になることも珍しくないのに
なんでイラストだけこんなにやりたい放題なのか