<html>Want to match here!</html>
sed -e 's/<[^>]*>//g'
上記のsedでHTMLタグのみを除去できます。
正確に説明すると、<[^>]*>はHTMLタグにマッチさせる正規表現になります。
そしてマッチしたHTMLタグをsedの置換で削除します。
するとHTMLタグに囲まれた部分だけ抽出することができます。
以上
自分用の備忘録。定期的に記事を見直し、修正が必要な部分は修正すること。
<html>Want to match here!</html>
sed -e 's/<[^>]*>//g'
上記のsedでHTMLタグのみを除去できます。
正確に説明すると、<[^>]*>はHTMLタグにマッチさせる正規表現になります。
そしてマッチしたHTMLタグをsedの置換で削除します。
するとHTMLタグに囲まれた部分だけ抽出することができます。
以上