クリーンといえば勝手に人様のイラストを素材サイトに追加したがるやつらをどうにかできないもんかね
huggingface のデータセット漫画村とかヤベーだろ
ポケモンデータセットなんかを大公開されてるのはほっといていいもんなのか?
日本のAIモデル開発者はゴミみたいなスキルしかなく難易度クソイージーなdanbooruデータセットですらうまく扱えないんで
オープンソースのデータセットが消えるだけでも実質的に開発できなくなると思うんだが
pixivデータセットやXデータセットも怪しいんじゃねえかな
何百万とあるデータにタグをちゃんと設定するというのがあいつらにはもう無理なんだよね
根気がなくて短期的な成果しか見てないから
地獄のように地味なアノテーションなんて絶対やらない
まして自分の奴隷労働の成果を他人と共有なんて絶対したがらないだろうね
そんなところでも人の成果にタダ乗りしたがるフリーライダーなんてちょっと規制かければクソチョロいだろ