映画『銀の匙 Silver Spoon』でポアンカレTシャツを調べるために『銀の匙 Silver Spoon 9』を読み返していて出てきたこちらのシーン…
『くらえ ヒトゲノム塩基配列』
『くらえ 円周率10万桁』
↑ここにもサイエンス・ガジェットが出てきた~(^o^)
そこで、ふと…
あれ? そのデータはどうやって入手したんだろう? と興味が湧いてしまった私(^o^;
⇒「円周率10万桁」で検索… これは簡単に入手できる。
⇒「ヒトゲノム塩基配列」で検索… ATGCがズラ~と並んだページは出てきませんね~
「ヒトゲノム塩基配列」はどこかに公開されているはずですよね~
どこにあるんだろ?
検索してみました…
⇒「ヒトゲノム塩基配列 公開データ」で検索
「ゲノム情報」をクリック
⇒NISA DNA Bank ←独立行政法人 農業生物資源研究所(生物研)のページです。
このページの「総合ゲノムデータ情報」の中から適当なところを見つくろって…
『Complete Genomes/ KEGG
KEGGのゲノム解析情報ページ。ヒト、植物、昆虫、微生物等の多数の生物種について情報を公開。』をクリック
⇒KEGG Organisms: Complete Genomes
一覧表のトップに出ている[Homo sapiens (human)]-[RefSeq]をクリック
⇒ftp://ftp.ncbi.nih.gov/refseq/release/vertebrate_mammalian/ の一覧
膨大なファイルのリストが並んでる~!
とりあえず先頭の vertebrate_mammalian.1.1.genomic.fna.gz をダウンロード
約325MB
解凍すると…1.08GB デカい!
vertebrate_mammalian.1.1.genomic.fna というファイルが一つ
.fnaという見知らぬ拡張子のファイルだが、EmEditorで開いてみる。
さすが EmEditor!1.08GBのファイルも難なく開けました。
そして、そこに並んでいた塩基配列… ほんのちょっと、10行ほど…
TGCTTTGTTAGTGAATATAATGTTAAAAATTACCATTGGCTCTAACTTTGCCTTGAAAACAACATGGCTTTTCTTTTTAT
TGAATTTATTAATACTTTTTAAATGATTTCTATTCACTTTTTGAACTTTTATTTATGATAACCCAACAGTTTATTTTATG
TTTGCACGGGAATTCTGGAGAATATCATTGATTGTACTAGCACTTTGGTGGTTCTTCATAAATATATCAGCACTTGGTGG
TTCTCAACATAATATTAAAGCAACTAGGAAAGTAGAACTCTAGAGCTGGAGTGGAAGTTCTGTAGGTTTAAAGTCCAGAT
CAGAGGACTATTAAGTAGATAAAGTTTGTTTATATTGTAGATTAAAGTGTGGACTATCCTTCATTTTCAGATGTGCCTCT
TGAGCAGGGTCTTCATGTTTATATTTGGGCTCTTGTGCAGGGCCTTGGTGTCTATACATGGGTTGTTAATCAATTCAGAG
ACTAGCAATTTTTAAATTTAATATGATCCCTACTGAACATAGGTATTCATTAAAACACCTGCACACCTGGAAAAAGCAAG
TGAAGCTCTTTGTTAGCTGGATCCTTTTTAAAGAGAAACTTATCCTATGGTTTCAGGTCAACCGTGTTAGTTAATATTGG
TATTTACCTTGCTGGAGCCTGCTAATATCTCTGGATAATACTTGTGGGCAATTGCTACATTTGGACATACCCTGCTGGCA
TTTCAGCTTCATGATAAATGACAGGTGGCAGGTGTGTGTCAGCAACATTCTAAGCAAGTGAGTCTTTTCTATCTCAAGTG
お~!
A アデニン adenine
T チミン thymine
G グアニン guanine
C シトシン cytosine
の文字がズラズラと延々と並んでますよ~w(*゚o゚*)w
「なんだそれは?」という方は、こちらを参照してください。
⇒塩基配列 - Wikipedia
あ~Wikipediaの小難しい説明を読むより
⇒「塩基配列」で画像検索 ←こっちで「あ~こんなもんか~」と感じを掴む方がいいかも(^^;
さて、
『くらえ ヒトゲノム塩基配列』と
『くらえ 円周率10万桁』をきっかけに「ヒトゲノム塩基配列」のデータを検索し、そのほんの一部をダウンロードしてみましたが、ヒトゲノム塩基配列のデータはデカいね~!
ヒトゲノムは30億塩基対といわれてますから、ATGCの文字数で30億になります。
円周率10万桁より遙かにデカいですね!
ということで、
『くらえ ヒトゲノム塩基配列』と
『くらえ 円周率10万桁』 どちらが相手によりダメージを与えられるかというと、断然「ヒトゲノム塩基配列」です(^o^)
ただし、30億塩基対のデータを送り出す側(攻撃側)にもかなりのダメージ(通信料)がかかると思われます(^o^;;
ところで、「ヒトゲノムは30億塩基対」といわれてますが、
⇒ヒトゲノム - Wikipedia によりますと…『核ゲノムは約31億塩基対あり』 へ~、30億塩基対じゃなくて、31億塩基対なんだ~!
こちらのページにも『ヒトのゲノムサイズは31億塩基対』と出てました…
⇒ヒトゲノムの完全解読 | Jabion(日本語バイオポータルサイト) ←リンク切れ
※2020/06/28改めて調べたら…
ヒトゲノムは32億5400万塩基対?
ヒトゲノムは31億塩基対でもなくて、32億塩基対のようです。
ヒトゲノム - Wikipedia の次の記述が面白かったです。引用させていただきます。
『このように少ない遺伝子からヒトの複雑な体や脳が構築されているという事実は、科学者にさえ驚きと狼狽を与えた。その後、イネ科の植物の遺伝子がヒトよりずっと多いことや、下等生物と考えられていたウニの遺伝子の数がヒトとほとんど同じであり、しかも70%がヒトと共通していることなどが判明すると、人間が遺伝子の数で他の生物より優位にあるはずだという予想は、間違いであることが確定的となった。』
※「遺伝子」の関連記事:マイクロバイオーム…日経サイエンス2012/10
『人体にあるヒト以外の遺伝子
ヒトの体内や皮膚に住み着いている善玉菌の遺伝子の総合計は、私たちが両親から受け継いだ遺伝子の数をはるかに上回る。』
※さて、ここでクイズです。→ 貝/ウニ/人間 近いのはどれとどれ?
※DNAストラップを作ってみました~
2016/12/23 メリークリスマス☆DNAストラップを作る
2017/01/01 “Happy New Year”DNAストラップを作る
※DNA関連記事
2013/08/10 ロザリンド・フランクリン⇒生物と無生物のあいだ:福岡伸一
2016/07/24 円形コドンテーブルのコースター (ori) 博物ふぇすてぃばる!3
2019/12/29 しめ縄とDNAの二重らせんの右巻きな関係
最近のコメント