感情分析AIが海賊版サイトの小説を大量に取り込んで炎上、サイト閉鎖
chatGPTが訴訟を気にしてrobots.txtのオプトアウトを受け付け開始
だいぶ無断取得データセット問題で炎上するようになってきたね
お役人はデータ無料取得を大前提にして先に計画作っちゃったから絶対崩されたくない感じなのかな

chatGPTの制作費は140億円程度なので日本にも作れる!とウキウキしてたが
英語圏みたいに時給2ドルのケニア人アノテーターを雇うわけにもいかないだろうし
純粋な日本語話者のアノテーターをどうやってそんなに確保するつもりなんだろう
NECがどんな方法で高水準LLM作ったのかは不明だけどラマもchatGPTの蒸留で性能上がったというし外国製の丸パクリでもいけるもんなのかな
まぁ何とかなったとしても著作物のデータセットにまでお金がかかるようになったら破綻するよね