DNAはおよそ60〜750MB分のデータかもしれない
(dynomight.net)カウントについて
- ヒトのDNAは約12億ビットを保存でき、情報量としては約1.5GBに相当する。
- ただしDNAには繰り返し配列が多く、親から受け継いだ染色体も似通っているため、実際の情報量は別の見方ができる。
- 単純な保存容量という概念よりも、より精緻な情報の概念が必要になる。
圧縮について
- 情報理論によれば、文字列の情報は圧縮可能な最小長で定義できる。
- DNAはリファレンスゲノムを使えば99%まで圧縮できることもあるが、これは変異部分だけを情報と見なす特殊なケースだ。
- リファレンスなしで圧縮する場合は最大62%まで減らせ、こちらの方がより一般的な情報量と見なせる。
情報について
- 情報量はKolmogorov複雑性(圧縮可能性)またはShannon情報量(確率ベース)で定義される。
- Kolmogorovは絶対的な情報量を、Shannonは相対的なパターンを基準にする。
- DNAはこの両方の観点で意味を持つが、共通の遺伝情報を含められるKolmogorovの方が有用だとする。
生物学について
- DNAのうち実際にタンパク質へ変換されるエクソンは1%だけで、残りは調節機能または未知の機能を持つ。
- 転写、翻訳、スプライシングなどの複雑な過程を通じてタンパク質が生成される。
- さまざまなRNAや遺伝子調節要素が相互作用しており、DNAは単なるコード以上のものだ。
雑然さについて
- DNAは複雑で雑然とした構造を持っており、これは突然変異と進化の結果である。
- 多くのDNAは反復しているか不活性状態にあり、転移因子や突然変異修復機構がその理由を説明する。
- 生物はエラーに強いように設計されており、進化は非効率ささえ活用する形で働いてきた。
情報について、もう一度
- 「表現型Kolmogorov複雑性」を提案し、人間として機能できる最小のDNA圧縮サイズを情報量と見なす。
- これは、機能的に同一の人間を生成できる最短のDNAで測る方法である。
- およそ60MB〜750MBと推定されるが、現時点では明確には分からない値である。
まだコメントはありません。