1 ポイント 投稿者 GN⁺ 2025-06-05 | 1件のコメント | WhatsAppで共有
  • Merlin Bird IDは、鳥類の識別と探索に特化したツール
  • ユーザーは鳥の写真や鳴き声を通じて、すばやく種を識別できる
  • 一般利用者と専門家の両方が簡単に活用できる、ユーザーフレンドリーさを提供
  • AIベースの鳥類識別機能により、さまざまな環境で正確な情報を確認できる
  • 鳥類保護とシチズンサイエンス研究に積極的に貢献できる可能性が高い

Merlin Bird ID 概要

  • Merlin Bird IDは、世界中で使われている鳥類識別および種探索プラットフォーム
  • ユーザーは携帯電話やウェブサイトで鳥の写真または鳴き声をアップロードし、すばやくその鳥の種を識別できる
  • All About Birdsが提供しており、初心者と専門家の両方に向けた、直感的で使いやすいユーザー体験を目指して設計されている
  • アルゴリズムと機械学習技術を用いて、さまざまな地域・環境における正確な鳥類情報へのアクセスを提供する
  • Merlin Bird IDは、シチズンサイエンス、環境保護、そして鳥類研究活動に大きく貢献できる

サイトまたは接続の安全性案内

  • 本サイトを利用するには、JavaScriptとCookieの許可が必要
  • 安全な接続のため、セキュリティ確認と自動認証のプロセスを経る
  • これらのセキュリティ手続きは、ユーザーの個人情報とデータ保護が目的

要約

  • Merlin Bird IDは、AIベースの鳥類識別と種探索に強みを持つグローバルプラットフォーム
  • 簡単な使い方と向上したアルゴリズムにより、自然観察、教育、科学活動の支援に役立つ
  • さまざまな環境や国で、高精度の識別機能を提供する

1件のコメント

 
GN⁺ 2025-06-05
Hacker Newsのコメント
  • 自分はこのアプリが本当に大好きです。1か月ほど前、大きな声でさえずっている鳥が何なのか気になって使い始めたのですが、Tufted Titmouse でした(今では一番好きな鳥の一つで、見た目がものすごくかっこいい)し、Carolina Wren でした(見た目はやや地味ですが、鳴き声だけで十分魅力的です)
    ここ1か月で朝の過ごし方が完全に変わって、室内ではなく裏庭で過ごすようになりました。
    鳥の餌台に餌を入れて掃除し、リス用にピーナッツも置いて、コーヒーと朝食を deck に座って Merlin ID アプリと一緒に楽しむのが日課です。
    新しい人間の言語は勉強できないのに、このアプリを使い続けていたら、今では鳥の種類だけでなく個体ごとの独特な鳴き声や声まで聞き分けられるようになりました。
    唯一望むのは、個々の鳥を記録して、その鳥の録音と写真を一緒に保存できる機能があることです。
    このアプリの開発者たちに拍手を送りたいし、久しぶりに使った中で最高のアプリだと伝えたいです。
    • 何を言いたいのかよく分かりません — 「Explore」タブと Life List で写真と鳴き声を一緒に見られます。
      本当に良いアプリですが、個人的には Life List に鳥を追加する UX がかなりひどいのが残念です。
      音や写真で識別すると、いつどこで見たかを聞かれますが、デフォルト値が本当に良くありません — 現在地と時間を分かっているはずなのに、数か月前の古い場所や時間をランダムに呼び出すことがあります。
      その直前に現在地で何羽入力したかも無視されます。
  • 自分にとって Merlin は、「みんなのポケットの中のコンピューター」が本当に何をできるのかをきちんと示してくれる例です。
    驚くべきアプリで、多くの人を自然に近づけてくれます。
    たまに運営団体への寄付を勧める案内は出ますが、明確で直接的なお願いで、妙な小細工マーケティングやダークパターンは見当たりません。
    • 本当に同感です! 普通のアプリはユーザーを仮想世界に閉じ込めようとしがちですが、Merlin はむしろ本当の世界(自然)へと注意を向けさせてくれる珍しい例です。
      特に音声識別機能は誰でも使えますが、実際には不可能だった体験を可能にしてくれていて(耳だけで種を見分けること)、自然の中で音により集中するよう導いてくれます。
      個人的には Merlin、特に eBird が、鳥見を点数競争のように誘導する傾向があるのは少し残念だと思っています — 鳥の個体数減少を考えると、世界中を飛び回ってできるだけ多くの種を見ることを後押しするのは問題かもしれません。
      とはいえ本当に小さな不満で、Merlin は誰にでも自信を持って勧められる数少ないアプリです。
    • iNaturalist もまた別の宝石のようなアプリです。
      ハッキングに関心のある人たちには、こうしたアプリが AllTrails や Couchsurfing のように商業化されないよう、積極的に支援してほしいです。
  • こういうアプリが注目されるのは本当にうれしいことです。
    開発者や PM がこの投稿を見てフィードバックも拾ってくれたらと思います。
    特に sound ID は、コロンビアのジャングルや森のようにネットワークがまったくない現場でも期待以上によく動きます。
    ただ、アプリの他の部分はかなり不十分です。
    ボタンがしばしば反応せず、画面ごとに一貫性がなく、結果が消えるなど、いろいろ問題があります。
    iNaturalist との連携のような機能もあるとよいですし、以前の録音を開き直すと、その時に識別されていた鳥が「No matches」になってしまいます。
    自然の中で複数人のグループで歩いていて識別に成功しても、誰かに見せようとするともう消えていることがよくあります。
    簡単なフィードバックボタンを追加するだけでも、プロセスはかなり改善されると思います。
    このアプリに関わるすべての開発者と参加者に深く感謝します。
    • ボタンが効かない、画面の一貫性がない、結果が消えるなどの問題
      興味本位で聞きますが、どの端末を使っていますか? 自分は何世代かの Google Pixel で数か月間毎日使っていますが、こうした問題は一度も経験していません。
      「識別されたのに、後で見せようとしたら結果が消えている」というのが何を意味するのかもよく分かりません — 録音中に識別が出たのに、停止したら結果が消えるという意味でしょうか?
      自分の経験では、10分を超える長い録音のときだけ少しラグが出ますが、そこで切って新しく録音を始めるというコツを使っています。

    • コロンビアのジャングルや森でも sound ID がうまく動く
      興味深い体験です。
      自分の場合、sound ID をうまく動かすには、(1) スマホをポケットに入れず空気中に出しておくこと(マイクがふさがれると認識しない)、(2) 自分が動かないこと(自分の足音がどんな小さな鳥の声も邪魔する)、(3) Merlin アプリを「フォーカスモード」にしておくことが必要です — アプリがバックグラウンドにあると、まったく拾っていない気がします(これは単なる自分の思い込みかもしれません)。
      ときどき、大きな鳥が頭上すぐにいても認識しないのに、遠くでかすかに聞こえるものはとても正確に拾います。
      個人的には sonogram(音響スペクトログラム)で、AI が識別に使った部分を目立つように表示してくれたらと思います。
      複数の鳥が同時にさえずると、この sonogram を解釈するのが特に難しいです。

アプリの残りの部分はかなり不十分
自分はむしろまったくそう感じたことがなく、これはたぶん端末の違いかもしれません。
いずれにせよ良いアプリです。

  • このアプリが本当に大好きなユーザーです。
    でも Android では起動してからちょうど 255 秒で必ずクラッシュします(実際に時間まで測りました)。
    バグ報告を送る方法があるのか知りたいです。
  • 自分がヨーロッパにいるとき、2つ目の地域を追加しようとしたらアプリが完全に固まりました。
    再インストールしないと再び使えませんでした。
    iOS では地域情報の追加が完全に壊れています。
  • 私の友人たちが Sound ID 部分の研究チームに参加しています。
    チームは機械学習モデルと評価がきちんと機能するよう、本当に多くの努力を注いでいました。
    Sound ID は、よくある「とりあえずデータを入れて雑に学習させる」ようなアプローチではなく、ドメイン専門家による細かな研究のほうが、より信頼できる結果をもたらすことを示した良い例です。
    • Sound ID の技術は非常に印象的です。
      以前、家の外でいろいろな距離から鳥たちが同時にものすごく騒がしく鳴いていたことがありましたが、このアプリは 30 秒で 6 種類を正確に拾い出しました。
      自分なりに見ても、その 6 種類はどれも妥当に思えました。
    • 「Fred」「Bertha」「Kevin」みたいに、個々の鳥に固有の名前を自動で割り当てる機能があったらいいのにと思います。
      庭によく来る鳥たちは全部種類が分かっているので、今度はどの鳥が来続けているのか、つがいが変わるのか、少し離れた場所からでも「ああ、これは Kevin だな」というふうに見分けたいです。
      ブラックバードのように似た個体が多い種では難しいかもしれませんが、種によっては AI で十分可能そうです。
    • オープン API があったらいいのにと思います。
      自分には鳥の声で鳥を識別するいくつかのアイデアがあって、Merlin の認識技術が外部向けに API として公開されれば、活用するには最高だと思います。
    • 家の近くで毎朝鳴く雄鶏がいます。
      毎回アプリで雄鶏 ID が出るかなと期待するのですが、毎回出ません。
      研究チームの友人たちにぜひ「雄鶏も鳥だ! 世界最高の目覚ましなんだから識別対象に入れてくれ」と伝えてほしいです。
    • 本当に驚くべきアプリですが、ときどき false positive(誤識別)もかなり出ます。
      たぶんこれは技術的に避けがたい限界なのだと思います。
  • 鳥のさえずりをアプリで再生するときは本当に注意すべきです。
    数日前、識別リストに出ていた cardinal の鳴き声をうっかりタップしたところ、うちのフェンスの近くに巣を作っていたオスの cardinal がものすごい反応を示し、その日以来 2 羽とも一度も見ていません。
    毎日見ていた鳥なのに、territory(縄張り)意識が強いせいで、単にアプリで鳴き声を再生しただけで巣を離れてしまったのではないかと心配しています。
    • 何度も「うっかりポケットの中で Merlin アプリが起動してしまった」ことがあります。
      いつもそのたびに「おっ、この鳥すごく近いな?」→「スマホを取り出して Merlin で調べようか」と思った瞬間にそうなります。
    • 鳥見をしていて「calling back」という用語を聞いたことがあります。
      アプリでもこういう警告をもっと強調すべきだと思います — 「鳥を呼び寄せるためにこの機能を使わないでください。自分の参考用としてだけ聞いてください」といった文言です。
      もし自分が鳥で、見知らぬ鳥の声が特定の感情や意味を持っているのに、その音を自分の近くで大きな哺乳類の人間が流していたら、家族を移動させるのは当然の反応だと思います。
      Cardinal は特に縄張り意識が強く、営巣期には互いを追い払います。
      口笛、pishing、スマホの使用など、どれも自然な行動を妨げます。
      車、トラック、芝刈り機、オートバイなど、あらゆる騒音も鳥たちに大きな影響を与えます。
      「Sibley Guides」の playback proper use の資料によると、

ある縄張りで歌を再生すると、その音に隣接する鳥やメスたち全員が注意深く反応し、実在する匿名の侵入者を追い払えなかった場合、その個体の順位が下がったと見なされる、という研究結果もあります。
技術的に、私たちは彼らの言語を複製して再生できるようになってしまっていて、実際に鳥の家族の解体のような影響まで起こり得ます。

  • 興味深い点を一つ紹介します。

Sound ID は音声を視覚的なスペクトログラムに変換し、その後コンピュータビジョンのツール(Photo ID に使われている技術に似たもの)で分析します。
つまり、アプリ上部にスクロール表示されるスペクトログラムは単なる飾りではなく、実際の認識メカニズムなのです。

  • 面白い事実です。
    私は昔、言語学の研究室でスペクトログラムを分析して音素の調音位置を調べていました。
    なので、他の音響表現よりこれをモデル学習に使うのは自然だと感じます。
  • スペクトログラムは、実際の手動識別や、個々の鳴き声を覚えるのにも実用的です(少なくとも自分にとっては)。
  • 音声系ニューラルネットワークのほとんどはスペクトログラムをベースに動いています。
  • 自分は何年も継続して鳥見をしてきましたが、今年初めて音声識別アプリを使うようになりました。
    おかげで音だけで新しい種を 12 種以上見つけられましたし、中には自分ひとりでも鳴き声だけで分かるようになったものもあります。
    こうした技術のおかげで、この趣味をまったく違う形で楽しめるようになりました。
    少なくともこの分野では、機械学習 / AI が明らかに良い影響を与えた例です。
  • 自分もこのアプリをものすごく愛用しているファンです。
    ただ不便なのは、PC から画像を Web 経由でアップロードできないことです。
    DSLR で鳥の写真を撮る利用者としては、画像転送だけでもとても面倒です。
    致命的ではありませんが、結局ほかの方法で鳥を識別するしかなくなります。
    モバイル以外の UX オプションが追加されたら本当に便利だと思います。
    • 私は Birder Framework(鳥類分類コンピュータビジョンツールキット)の作者です — https://gitlab.com/birder/birder
      まだ初期アルファですが、DSLR 撮影写真のワークフローに役立つかもしれません。
      Web ベースの代替が必要なら、Hugging Face のデモスペース もあるので、ブラウザからそのまま画像をアップロードして使えます。
      ただしこれはモデルのデモ用で、使い勝手よりも、地域(ヨーロッパ、アラビア半島など)ごとに手動でモデルを選ばないといけない不便さがあります。
      まだ地域カバレッジは限られていますが、徐々に追加していく予定です。
    • 自分も DSLR で鳥の写真を撮っています。
      識別が必要なときは、モニターをスマホで撮って Merlin に入れるだけです。
      48MP の写真は必要なく、ただのスクリーンショットでも十分です。
    • 自分もこの方法を使っています。
      個人的に投稿してもよいと思える写真だけ識別していて、アップロードすればスマホからもアクセスできます(Flickr、IG など)し、そこから簡単に取ってきてアプリで使えます。
  • 自分は一般的なバードウォッチャーの立場から、この技術に非常に感銘を受けていて、ほぼ全面的に信頼しています。
    ただ、非常によく似た種が出てくる場合だけ、少し疑わしい判断があるかもしれません。
    たとえば、家の周りに Purple Finch が本当にいるのかは少し疑問です(いつも見るのは House Finch ばかりなので)。
    それでも Merlin の信頼性のおかげで、自分のほうが間違っているのかもしれないと思えるほど信じています。
    • 確かによく似た種は、ときどき誤って拾うことがあります — 最近だとカラスや warbler で目立ちました。
      それでも大半は正確な結果で、疑わしいときは自分で鳥を見れば済む話です。
    • 家の周りには Blue Jay がいつもたくさんいるのですが、この鳥たちが特定のタカ類の鳴き声を見事にまねるので、Merlin でもしばしばタカだと識別されます。
      実際のタカの声を聞いても、Jay のものまねとほとんど区別できませんでした。
      理屈の上では本物のタカかもしれませんが、「bald eagle」の識別は近所の子どもたちの叫び声を取り違えたというほうが説得力があります。
    • イギリスに住んでいた自分の経験では、Merlin の典型的なミスはフィンチ類、とくに greenfinch の「at rest」ツイッター音を goldfinch と取り違えることでした。
      この 2 種は見た目なら明確に区別できますが、耳だけでは自分でも聞き分けが難しいので、Merlin を責めるのは酷です。
  • こういう種類のアプリが本当に大好きなユーザーです。
    自分は WhoBird を愛用していますが、このアプリは組み込み型(完全オフライン)で動作し、インターネットがなくても問題なく、fdroid にも登録されています(https://f-droid.org/packages/org.woheller69.whobird/)。
    Merlin も試して、2つのアプリの性能を比べてみるつもりです。
    • Merlin も同様にオフラインで完璧に動作します。
      自分も山の中ではいつもオフラインで使っています。
    • 自分の知る限り、WhoBird も同じモデル(あるいは Cornell 開発)ベースですが、複数羽の同時識別性能ではやはり Merlin のほうが優れています。
    • WhoBird は音声にしか対応しておらず、写真識別はサポートしていません。