ネットサーフィン

こんにちは、かいです。

アドベントカレンダー、初ブログ記事です。

参加した企画はこちら↓

【謎解きクラスタによる謎以外の Advent Calendar 2022】

はじめに

想像してください。

「あー、Python (プログラミング言語) ってどういう用途で使われるんだろ」

Python 何ができる』 で検索

そこには、SEO (検索エンジン最適化) の成れの果てのような光景が広がっています。

「徹底解説」「初心者向け」「【〇〇選】」

これらの用語を見ただけで、記事の内容が容易に推測可能です。 これでもかと挿入されるフリー素材の大きな画像、プログラミングスクールへの誘導、自己啓発

私には、それに費やすような時間もスタミナもありません。

全部まとめてブロックします。

uBlacklist

uBlacklist

フィルターを掛けて、見たくないサイトを検索結果から除外する拡張機能です。

1個1個手動でブロックすることもできますが、私はタイトルすらも見たくないので、マッチパターン&正規表現でブロックしています。

ublacklistの使い方は公式サイトを見れば分かります。しかし、公式サイトには出来ないであろうことがあります。

具体的なブロックルール紹介です。

この記事は、以下、個人の趣味増し増しのブロックルールを挙げて終わります。

ありがとうございました。


趣味増し増しブロックルール

1. 単語ブロック

タイトルに以下の文字が含まれていたらブロック

  • 徹底
  • ○選 (○は2桁以下の数字)
  • 将来性
  • 「メリット」「デメリット」がこの順番
  • 必見
  • 検索結果
  • 通販
title/.*\u5fb9\u5e95.*/
title/.*[1-9]?[0-9]\u9078.*/
title/.*\u5c06\u6765\u6027.*/
title/.*\u30e1\u30ea\u30c3\u30c8.*\u30c7\u30e1\u30ea\u30c3\u30c8.*/
title/.*\u5fc5\u898b.*/
title/.*\u691c\u7d22\u7d50\u679c.*/
title/.*\u901a\u8ca9.*/
title/.*\u901f\u5831.*/

2. 隅付き括弧ブロック

【】内に以下の文字のいずれかが含まれていたらブロック

  • 最新
  • 初心者
title/^\u3010.*(\u6700\u65b0|\u521d\u5fc3\u8005).*\u3011.*/

3. ?!ブロック

「〇〇とは?〇〇してみました!」系

title/^.+\uff1f.+\uff01$/

4. ccTLDブロック

ccTLD (Country Code Top Level Domain) は国ごとに割り当てられるTLDです。

基本、日本語のサイトぐらいしか見ないので、ccTLDがjp以外のものをブロック。

許可する国は適宜追加してください。

/^https?:\/\/.*\.[a-z]{2}\//
@*://*.jp/*
@*://*.io/*

5. ドメイン長ブロック

長いドメイン使っているサイトはまともじゃない

/^https?:\/\/.{25,}\/$/