日本語のアノテーション作業もろくにできない日本企業のアホらに既成のデータセットだけ与えても何もできないってこの一年で分かったでしょうに
基幹産業用のマルチモーダルLLMやガイダンス用のchatbotはそこまでの高性能は必要ないんでしょ?
むしろデータ内容を学習段階で選ばないと簡単にヤベー事故を起こす
カスタマイズ能力の高さで勝負するのなら雑多なwebクロールなんて必要ないし
政府主導で作るデータセットなんてどうせマイナカード以上の事故案件になるに決まってるんだから本当にやめときゃいいのに
あ、これもズブズブ案件だから国がどうなろうが知ったこっちゃないのか