2013-06-30から1日間の記事一覧

2013-06-30

Ruby で Web ページの本文を抽出する方法

Ruby

ExtractContent を使えばいい。 Webページの本文抽出 (nakatani @ cybozu labs) ただ、上の記事の ExtractContent は Ruby1.9 以上では動かなかった。正規表現エンジンが変わったからね…。無ければ自分で修正することを前提に、GitHub で探したら、案の定 1…