ネットサーフィン
こんにちは、かいです。
初アドベントカレンダー、初ブログ記事です。
参加した企画はこちら↓
【謎解きクラスタによる謎以外の Advent Calendar 2022】
はじめに
想像してください。
「あー、Python (プログラミング言語) ってどういう用途で使われるんだろ」
『Python 何ができる』 で検索
そこには、SEO (検索エンジン最適化) の成れの果てのような光景が広がっています。
「徹底解説」「初心者向け」「【〇〇選】」
これらの用語を見ただけで、記事の内容が容易に推測可能です。 これでもかと挿入されるフリー素材の大きな画像、プログラミングスクールへの誘導、自己啓発。
私には、それに費やすような時間もスタミナもありません。
全部まとめてブロックします。
uBlacklist
フィルターを掛けて、見たくないサイトを検索結果から除外する拡張機能です。
1個1個手動でブロックすることもできますが、私はタイトルすらも見たくないので、マッチパターン&正規表現でブロックしています。
ublacklistの使い方は公式サイトを見れば分かります。しかし、公式サイトには出来ないであろうことがあります。
具体的なブロックルール紹介です。
この記事は、以下、個人の趣味増し増しのブロックルールを挙げて終わります。
ありがとうございました。
趣味増し増しブロックルール
1. 単語ブロック
タイトルに以下の文字が含まれていたらブロック
- 徹底
- ○選 (○は2桁以下の数字)
- 将来性
- 「メリット」「デメリット」がこの順番
- 必見
- 検索結果
- 通販
title/.*\u5fb9\u5e95.*/ title/.*[1-9]?[0-9]\u9078.*/ title/.*\u5c06\u6765\u6027.*/ title/.*\u30e1\u30ea\u30c3\u30c8.*\u30c7\u30e1\u30ea\u30c3\u30c8.*/ title/.*\u5fc5\u898b.*/ title/.*\u691c\u7d22\u7d50\u679c.*/ title/.*\u901a\u8ca9.*/ title/.*\u901f\u5831.*/
2. 隅付き括弧ブロック
【】内に以下の文字のいずれかが含まれていたらブロック
- 最新
- 初心者
title/^\u3010.*(\u6700\u65b0|\u521d\u5fc3\u8005).*\u3011.*/
3. ?!ブロック
「〇〇とは?〇〇してみました!」系
title/^.+\uff1f.+\uff01$/
4. ccTLDブロック
ccTLD (Country Code Top Level Domain) は国ごとに割り当てられるTLDです。
基本、日本語のサイトぐらいしか見ないので、ccTLDがjp以外のものをブロック。
許可する国は適宜追加してください。
/^https?:\/\/.*\.[a-z]{2}\// @*://*.jp/* @*://*.io/*
5. ドメイン長ブロック
長いドメイン使っているサイトはまともじゃない
/^https?:\/\/.{25,}\/$/