LLMは昨日ここでも言われてたようにパラメータ数が命でGPT4は2000億以上、憶測によっては5000億とも100兆とも言われてるんだけど
対して昨日サイゲが発表してた日本語のは68億
これを活かすならGPT4とマージしてそっちの方の力を借りないと会話にすらならない
だから米国で無断の著作物利用が禁じ手になれば日本語LLMも作るだけ無駄ということに
打開策としては国会図書館利用になるんだろうけど出版社がおとなしくやらせるわけはないな
AGIにやたら希望見出してるやつは100年後には普及してるっていうけど
じゃあ100年リリース待てばいいじゃんと思うわ
そうすりゃ今学習済みのモデルは全部著作権切れよ
未来のためにアーカイブ作ってタイムマシンに埋めとけよ
軽く数百億円ドブ金だろうけどなァに文化が発展しただらう