2010-06-21から1日間の記事一覧

続・BeautifulSoup で HTML 文書からタグを取り除く(Python)

前回(BeautifulSoup で HTML 文書からタグを取り除く(Python) - やた@はてな日記)の内容でも,ある程度は問題なく処理できていました.しかし,大量の HTML 文書を渡してみると,新たに 2 つの問題が見つかりました.それぞれの内容と今回の対処は以下…