ネトウヨと戦い続けるための機械学習、その他知識
■ このスレッドは過去ログ倉庫に格納されています
ネトウヨもTwitterなどでbotとか駆使している
我々もエクセルやプログラミング、AI、機械学習などでスキル武装する必要があるのでは?
さて、何から手を付けるべきか、いろいろブレストしよう ツイッターのbotはtwitterのapiを調べればやり方わかるよ >>4
プログラミングとか勉強したこと何度かあるけど長続きしなくて、いい歳のおっさんになった今でもワードエクセルすらまともに使えない
Twitterのヘイトツイート探しには検索演算子が、アノニマスポスト運営会社の特定には様々なネット知識が活用されていることを知り、各々がスキル向上を図り、それを利用してみて達成感を得たり課題を見つけることでモチベが維持されプラスのサイクルが生まれると感じた
それでとりあえずネット上のヘイトとの戦いという共通の関心をもった人のためのIT議論・雑談スレを立ててみた
>>4
そんな感じです
初心者歓迎のスキル雑談からオススメ参考書についての情報交換、対ネトウヨ技術の基礎研究まで広くカバー
>>3
>>5
情報どうもです ガイジにはガイジと言うだけでええ
へんにサヨさんみたいに行儀よくしようと思うと負ける ワイは通報自動化のために機械学習を使ったヘイトスピーチの識別器を作ってる
学習に使ってるデータセット置いておくから、 必要ならpandas.read_csvで読み込んで使ってくれや
http://fast-uploader.com/file/7086430383273/ A Survey on Hate Speech Detection using Natural Language Processing
http://www.aclweb.org/anthology/W17-1101 すごいンゴ
AI興味あるけどちょっと今は手が出せないンゴ ガイジを武器にしてくる 自閉&無職なので同じコトずーっと繰り返す
ここらに対応できないとどうしよもない 実際、ネトウヨをスクリプトと三回レスバさせることに成功したハンJ民もおるようやしな こっちは飽きてくる
ウヨは自閉入ってる上に無職だから長期的に活動できる
これはでかいよな、ハン板だって数年後はガイジウヨが盛り返してるかもしれん ネトウヨの日本語見てると特定のワードに反応して少ない語彙を繋ぎ合わせた文を返すAIの学習途中みたいな感じだし、AIチャットボットとネトウヨをバトルさせるのも頑張れば以外とすぐできそう てか半分くらいはAIなんじゃないの?ネトウヨって
大勢いるわりには思想のバリエーションが余りにも少ないとことか 1だけど機械学習にはPythonってプログラミング言語が良いことを知ってやっと入門書買ったところ
他の言語の学習など寄り道もいっぱいしてるから、スレ立てしておきながらこのスレに実のある貢献ができそうにない
スレが落ちてしまったらすまん(いろいろな話題を持ち寄ってスレを活用し続けてくれると嬉しいが)
とりあえず、自分のペースで学んだり模索していることは伝えたかった 実は機械学習だけやったらAzure MLというサービスがあるんや
GUIベースで初心者にも比較的使いやすいで とりあえずisuyoの分類機作るところからはじめるか
みんなで頑張ればスクレイピングもアノテーションも出来るやろ
あとはJumanで形態素切ってRNNか何かでモデル組んどけばパラメーターサーチはプロがやってくれるやろ
あとはクローラとかでネトウヨを掘るとかすればええんやろうけど、Webは分からんから詳しい人か来てくれるとうれしいわな >>25
ネトウヨを発見するんやったらTwitterならグラフ理論活用するのが早いと思うで
ただ機械学習やビッグデータ解析に付き物のリソースがな…
それとAPI制限があかんな
いくつかの大物ネトウヨ見つけてそっからフォロワーのフォロワーくらいまで掘ってネトウヨコミュニティ割り出せばほぼ全掘り出来るんやないか? ちょっと質問なんやがwikiの表の設計データをJSONで扱おうと思ってるんやがこんな感じでええんか?
もっと使いやすいやりかたあったら教えてほしいで
くっそ初心者の質問ですまん
{
表の名前2:{
見出しの内部名1:{
見出し名:
表に使うかどうか:
何行目か:
},
見出しの内部名2:{...},
...
},
表の名前2:{...},
...
} ネトウヨ診断みたいなサイトあれば便利だな
ツイッターアカウントいれたらネトウヨ度を判定してくれる >>30
そのためには辞書ファイルの充実は必須やろうから
ここに乗ってない言葉見つけたら貼ってってや
ネトウヨが使う差別語を貼ってくスレ
http://lavender.5ch.net/test/read.cgi/korea/1531930522/ 文字動画がまだまだありそうなので、流れる文字から自動的にヘイトワードを抽出することはできないだろうか
あとスレの趣旨とは少し違うかもしれないが、「このチャンネルのこの動画を見たけどヘイトはなかった」みたいなネガティブデータの共有ができたら、効率的だと思う
他力本願ですまん、自分でも勉強してみる >>35
個人のPCではきついで
グラボ何枚か差したマイニング用PCくらいは必要じゃないんかな?わからんけど
クソアルゴリズムやったのもあるけど昔やろうとして即PC止まったで
動画のOCRはやる方法はあるにはあるけど基本無理やな
ネガティデータはスレに報告すればええんちゃう? 動画ダウンロード→3秒ごととかでキャプチャして画像数十枚に変換→OCR→差別用語をチェック
というやり方なら一応文字動画のOCRをすることはできると思う
ただ文字の背景画像をうまく消さなきゃならないな
(動画のキャプチャ画像をそのままオンラインのOCRサービスにかけてみたが検出できなかった) >>38
逆に文字の色だけで抜き出すとかできないかな 全くの初心者は何から勉強すればいいんけ?
初心者でも勉強していけば戦力になるかな? >>40
今まで一度もプログラミングしたことのない全くの初心者はpython3の勉強をオススメするで
こいつが使えるとAIとかを始めとしてかなり色んなことが出来るんや
ステマになりかねんからオススメするのは嫌なんやが「みんなのpython 第4版」みたいなオススメされてる書籍を写経することからやな
もしくはネット上で頻繁に使われとるJavaScript 周りを勉強して拡張の1つであるjQueryを使うなりしてYouTube 以外のサイトのRPG風報告履歴確認ツールの作成とかもええな
androidのアプリを作って文字通り通報ソシャゲにするのも悪くはないで >>40
初心者が最速で戦力になるのは小さいツールやな
例えばやがwikiに載っとる編集者用ツールとかのようなちょっとした不便なところを少しずつ変えていくんや 腹腹時計ぐぐってたらでてきた
情報というよりは闘争技術だけどソース
遊撃インターネット
http://www.uranus.dti.ne.jp/~yuugeki/top.htm >>19
自閉は同じことをやり続けるのが得意と聞いたで
皆が皆そういうわけでもないんやろが あと糖質もやな
ワイは昔ならトンデモ陰謀論に走る奴らがまとめてネトウヨに流れ込んだのも今の状況の原因やと思ってる 機械学習エンジニアハンJ民ワイ、スレが終わってて咽び泣く >>63
『機械学習(Machine Learning・MLと略します)』とは、
機械にデータを学習させ、データに潜むパターンや特性を発見し、
予測させることです。
ですって!
http://gagbot.net/machine-learning/ml1 >>16
こういうのもヘイトって傍目から思われないようにっては思う ■ このスレッドは過去ログ倉庫に格納されています