【PHP】HTMLのhref属性のみを取得する正規表現

公開日: : HTML解析

hrefのみ取得する正規表現です。

$html = "...何かHTML...";
grep_href($html);

/**
 * @param string $html 解析するHTML
 * @return array preg_match_allの結果
 */
function grep_href($html) {
    $ptn='/<a[^>]href\s?=\s?[\"\']([^\"\']+)[\"\'][^>]*>/i';
    preg_match_all($ptn, $html, $m);
    return $m;
}

サイトをスクレイピングしたりすると、こういう正規表現がぱっと必要になったりしますよね。しますよね?grep_hrefという名前は微妙ですかね。この関数を応用すれば、内部リンクのみ取得とか、外部リンクのみ取得とかもできます。

正規表現に間違いございましたら、是非ご指摘下さいませ。

関連記事

no image

【PHP】Aタグのsrc属性のみを取得する正規表現

src属性を取得する正規表現です。 $html = "...何かHTML...&qu

記事を読む

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

php
【PHP】リファラーを取得する

ユーザーがどのサイトから来たのか取得したい時ありますよね。 そんな時

php
【PHP】ファイルが存在するか確認する

画像ファイルなど、ファイルの存在確認をするには、file_exists

php
【PHP】arrayの要素を消す

配列で特定のキーの要素を削除したい時は、unset関数を使います

php
【PHP】httpのステータスコードで404を返す方法

ページを表示しつつ、httpステータスは404を返したい時などあると思

php
【PHP】var_dumpで改行させてブラウザで表示したい時

プログラム中でvar_dumpする時、dumpしたものの中身が多いと大

→もっと見る

PAGE TOP ↑