物欲購入目録日誌 写真館
スポンサーサイト
--.--.-- (--:--) スポンサー広告
Twitterでつぶやく
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
[Ruby] DON’T FOLLOW ME ( Twitter スパム推定の結果)
2011.09.29 (11:17) プログラミングtrackback(0)comment(0)
Twitterでつぶやく
mnys1.jpg


作成したtwitter bot(@tachi_pic_bot)が明らかに中の人が人間じゃない人にフォローされていて、自動化としてはフォローされた人は無作為にこっちからフォローしていたのですが、、ちょっと賢くしてbotにスパム推定機能をつけようじゃないかという開発で、とりあえず、botに実装完了。

botをフォローしてくださっている方を全て一度、スパム推定を実施。

結果は以下のような感じで、スパム推定したのは297事例でそのうち、59事例が比スパムという結果になりました。
約20%がスパム判定されたということになります。


follow.png


実際には結構厳しめの設定なので誤判定でスパムに判定されているケースもあるかと思いますが、、整理し終わったあとで比スパムの事例を見るとそれなりにおかしくない結果(中の人がリアルに書いていて、広告でもアダルトでもない)事例が多く残っているので機能としては結構できている感があるとこまでいけました!!

あとは継続的に回せるように幾つかの仕組みを実装したり、新素性を入れてみて精度を測ってみたりしようかと思っておりますな。とりあえず、成功かな。
prevhome next












トラックバックURL
→http://tachiphoto.blog61.fc2.com/tb.php/1476-eb225229
home
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。