物欲購入目録日誌 写真館
スポンサーサイト
--.--.-- (--:--) スポンサー広告
Twitterでつぶやく
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
twitter bot( @tachi_pic_bot)のモデル検証をCross-validationできるようにした。
2010.11.09 (02:54) 気になるモノtrackback(0)comment(0)
Twitterでつぶやく
twitter bot( @tachi_pic_bot)で文書分類にナイーブベイズ分類器を使っているのですが、実際に自分で作っているモデル(教師データ)の精度がどの程度のなのか全くわからんかったのでCross-validationで検証できるようにしてみた。

norisuke.jpg


教師データの組みわせ次第ではかなりの精度に依存してかなり面白い。とりあえず、よさそうなデータセットを教師データとして見た結果。


I, [2010-11-09T02:40:44.127982 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.918962722852512
I, [2010-11-09T02:41:47.084170 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.944894651539708
I, [2010-11-09T02:42:49.716535 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.936790923824959
I, [2010-11-09T02:43:52.310271 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.949756888168558
I, [2010-11-09T02:44:55.222284 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.951377633711507
I, [2010-11-09T02:45:59.320793 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.925445705024311
I, [2010-11-09T02:47:01.447921 #706] INFO -- : 試行事例数: 617 訓練事例数: 5555 正解率: 0.952998379254457
I, [2010-11-09T02:48:03.748073 #706] INFO -- : 試行事例数: 619 訓練事例数: 5553 正解率: 0.956381260096931

交差検定 正解率: 0.941991448538056


ほんまか?とりあえず、機械学習は素人なので↑がどういう意味なのかまったくわからんが、とりあえずモデルの変更を近日中に計画中。分割数で目安ってどれぐらだろ?たしかあの本にちょっと書いてあった気がしないでもないえkど、、とりあえず明日、同僚に聞いてみよう。

あとよりパワフルなSVMを入れたいななぁ~と思っておりますが、、とりあえず、通勤途中にkindleで参考書読んでまず理論武装中。

そして、ノリスケがかわいすぎる!!
t-all5.gif
prevhome next












トラックバックURL
→http://tachiphoto.blog61.fc2.com/tb.php/1194-69208e5f
home
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。