HTMLのタグとタグの間にある文字列のみを抽出するsedの書き方

<html>Want to match here!</html>

sed -e 's/<[^>]*>//g'

上記のsedでHTMLタグのみを除去できます。
正確に説明すると、<[^>]*>はHTMLタグにマッチさせる正規表現になります。
そしてマッチしたHTMLタグをsedの置換で削除します。
するとHTMLタグに囲まれた部分だけ抽出することができます。

以上

Leave a Reply

Your email address will not be published. Required fields are marked *