物欲購入目録日誌 写真館
スポンサーサイト
--.--.-- (--:--) スポンサー広告
Twitterでつぶやく
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
[Ruby] Sanitize : HTMLから不用なタグを消去する(サニタイズ)ライブラリ
2011.12.26 (23:43) プログラミングtrackback(0)comment(0)
Twitterでつぶやく
Basics-of-HTML.jpg


HTMLから不用なhtmlのタグを消去することをサニタイズというらしい、、

プログラムを作っていると、、HTMLからタグを取るのが結構めんどくさい場合ってありますよね。そいう場合はruby gemの Sanitizeというライブラリを使うと便利です。

http://wonko.com/post/sanitize

・install

$ gem install sanitize



・example


#! /usr/bin/ruby
$KCODE="u"
require 'rubygems'
require 'sanitize'

html = '<a href="http://foo.com/">foo</a>'
puts Sanitize.clean(html)




$./ex.rb
foo



タグの削除の方法とか、特定のものを残してそれ意外を削除するなど、いろんなパタンで削除できるらしいですな。ちまちま正規表現でなんとかしようとするよりもはるかに便利!

詳しくは上記のページをご参照。
prevhome next












トラックバックURL
→http://tachiphoto.blog61.fc2.com/tb.php/1542-08b155ae
home
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。