Reuni algumas expressões regulares úteis para trabalhar com HTML.

Encontra comentários HTML

/<!--(.*?)-->/

Testar

Captura o atributo href de links

/href="([^\'\"]+)/g

Testar

Encontra todos os atributos de uma tag. Ex: src, name, value.

/(?:[\w]*) *= *"(?:(?:(?:(?:(?:\\\W)*\\\W)*[^"]*)\\\W)*[^"]*")/gim

Testar

Encontra tags <h1> até <h6>

<h([1-6])>([^<]*)<\/h([1-6])>

Testar

Encontra tags <a> válidas

<a[^>]*([^"]*)[^>]*>([ 0-9a-zA-Z]+)<\/a>

Testar

Encontra todas as URLs de um texto

(http:\/\/|https:\/\/)([a-zA-Z0-9]+.[a-zA-Z0-9-]+|[a-zA-Z0-9-]+).[a-zA-Z.]{2,6}(\/[a-zA-Z0-9.?=\/#%&+-]+|\/|)

Testar

Encontra todas as imagens

<img([\w\W]+?)\/?>

Testar

Útil para remover tags HTML

<[^>]*>

Testar