4 ポイント 投稿者 GN⁺ 2025-01-28 | 1件のコメント | WhatsAppで共有
  • Marginalia Search の紹介

    • Marginalia Search は非商用コンテンツを優先するウェブ検索ツール
    • 古いウェブサイトを見つけられる機能を提供
    • オープンソースプロジェクトで、AGPL ライセンスに従う
    • ユーザープライバシーを重視し、追跡および広告技術を遮断
  • 技術とプライバシー

    • カスタムのインデックスおよびクローラーソフトウェアを使用
    • AI やクラウドを使わないシンプルな技術
    • ユーザーデータや検索データを第三者と共有しない
    • クエリや IP アドレスを長期保存しない
  • ポリシーと個人情報保護

    • GDPR を遵守し、個人情報を収集しない
    • EU Cookie 指令を遵守し、サービス機能の提供以外の目的で Cookie を使用しない
    • IP アドレスを含むアクセスログは最大 24 時間保存され、バグ診断のため匿名化されたログがより長く保存される場合がある
  • 連絡先とソースコード

    • 検索エンジンのウェブマスターには contact@marginalia-search.com を通じて連絡可能
    • ソースコードは https://git.marginalia.nu/ で確認可能
    • IP 地理位置データには IP2Location LITE データを使用し、CC-BY-SA 4.0 ライセンスに従う

1件のコメント

 
GN⁺ 2025-01-28
Hacker Newsのコメント
  • Marginalia検索エンジンとそのアルゴリズムについてのエッセイを書いたことがある。初期にはPersonal PageRankを使っていたが、現在はBM25でページを順位付けしている。Personal PageRankは、ページの類似性に基づく新機能に使われている。Marginaliaの成長とブログ記事を読むのは興味深い。

  • Marginaliaの作者はウェブサイトをsearch.marginalia.nuからmarginalia-search.comへ移し、視覚面も改善した。今でも同じ検索エンジンだ。

  • Marginaliaは個人の情熱によるプロジェクトであり、Google、Bing、DDGと競争しようとしているわけではない。「小さなウェブ」の中で面白いものを見つけるための方法だ。その点を念頭に置いて見るべきだ。

  • このプロジェクトがHNに登場するたびにうれしくなる。忍耐と愛情で何ができるかを示す好例だ。

  • 現時点でDDGにMarginaliaのbang検索がないことに驚いた。提案として送っておいた。

  • サイト所有者として、発見された被リンクを公開している点が特に気に入っている。そのおかげで、知らなかった被リンクを見つけられた。

  • 最近Googleの検索語を繰り返し試してみたが、どの場合も妥当な答えが上位に出てきた。試してみるつもりだ。

  • ウェブ上で最も楽しく、有用で、健全なプロジェクトだと思う。技術は非常に堅実で、体験も完璧だ。作者に感謝したい。

  • 関心分野の簡単な用語で検索したが、期待した結果は出なかった。Marginaliaは何かについて学びたいときには悪くないが、何か特定のものを探したいときにはそうでもない。たとえばScott AlexanderのSubstackについて人々がどう思っているかは得られるが、ニュースレターそのものを見つけるのは難しい。

  • 英語コンテンツ専用なのかと尋ねている。フランス語のクエリで試したが、関連性のある英語の結果しか返ってこなかった。