最初,人们推测人类所拥有的基因大约有十万多个。当第一代的人类基因组测序结果公布后,研究人员发现人类基因组大约只含有3万到4万个蛋白质编码基因。之后,由于测序技术方法的不断发展,对基因组分析的误差也在逐渐缩小。人类基因组数量也从3-4万,缩水到了25000左右。而后又一项研究表明,人类的基因数出乎意料的少,只有2万多一点点。
下面有一组数据,对比人类基因与其他物种基因的多少:
人类:20000–25000万
果蝇:13600
小线虫:19500
水稻:45000
玉米:50000
老鼠:30000
……
人类在基因数量上居然不如一只老鼠,而一株小麦的基因数居然能比人多出5倍。这怎么可能呢?但事实如此。从事这项研究的科学家弗朗西斯·柯林斯博士很遗憾地表示:「我们人类在这场竞争并没有留下非常深刻的印象。」
目前看来最直接的答案是:「可变剪切」,人类有超过 95% 的基因是可以进行「可变剪切」的,也正因此,人类的基因具有一定程度的压缩性
从图示的结构来看,「可变剪切」像极了计算机编程,可以对一个函数库中的函数进行复用
Alternative splicing occurs as a normal phenomenon in eukaryotes, where it greatly increases the biodiversity of proteins that can be encoded by the genome; in humans, ~95% of multi-exonic genes are alternatively spliced. There are numerous modes of alternative splicing observed, of which the most common is exon skipping. In this mode, a particular exon may be included in mRNAs under some conditions or in particular tissues, and omitted from the mRNA in others.