1.问题发现
在高中生物-遗传与进化-基因的本质学习中,有一个十分经典的问题。
即:给定碱基对数n,不限定每种碱基(A,C,G,T)的个数,求出最多的DNA种数。
在所有的教材,辅导书,以及老师的授课过程中,对于这个问题的答案,一般都是\(4^n\)或者\(\frac {4^n} {2}\)。
对于\(4^n\)的思路,即每个位置有\(4\)种碱基对可能,一共有\(n\)组,根据乘法原理,故为\(4^n\)。
对于\(\frac {4^n} {2}\)的思路,即在上一种思路的基础上,考虑到有重复的情况,便除了个\(2\)。
但是,@thorn,@opethrax以及本人的对于这些答案深感怀疑,于是我们便手算了当碱基对数为\(2\)时的所有情况。
利用计算机程序进行打表,以及查询有关\(DNA\)的资料后,最终我们确定当\(n=2\)时,结果理应为\(10\)。
这个答案都不能用上面的公式解答,于是我们继续思考探索。
2.深入探究
通过@opethrax同学辛苦的打表,观察,他发现存在一些情况被忽略。
原先我们认为,一个\(DNA\)分子拥有\(3'\)与\(5'\)段,\(3\)代表三碳糖,\(5\)代表五碳糖。
如下图,从两条链的\(3'\)端分别扫描,一种序列最多被统计到\(2\)次。
一个是\(AGCTA\),另一种是\(TAGCT\)。
但是,存在一种\(DNA\)分子,从其两条链的\(3'\)端分别扫描,结果相同。
如下图:
都为\(AGCT\)。
所以这种情况下,具有这种性质的\(DNA\)会被少统计一次。
且我们不难发现,满足这种性质当且仅当\(DNA\)链的长度为偶数(如图一,若为奇数,会出现不对称的情况,即不满足这种性质)。
那么我们分类讨论,之前那个\(\frac {4^n} {2}\)的公式,可以在\(n\)为奇数时使用。
对于\(n\)为偶数的情况,我们要在原公式的基础上,加上少统计的个数。
现在的问题,即是寻找拥有这种特殊性质的链的个数。
我们发现,当一条链满足一种类似循环节的方式进行完整地重复,根据碱基互补配对原则,另外一条链也是与其对称的,符合这种特殊性质。
且这种循环节必须要满足一些性质:
1.有且只有AT或GC
2.AGCT全都包含,且要么是AT之间包含CG,要么是CG之间包含AT
所以我们只需要构造出一条链的排列,剩下那条按照碱基互补配对原则填充即可。
这种循环节的长度定为偶数,根据分治的思想,我们不难得出,一条\(DNA\)序列碱基对数为偶数,其有\(4^{\frac {n}{2}}\)条链会被少统计一次。
至此,我们可以得出公式:
\[
a_n=\begin{cases}\frac{4^n}{2}\ \ \ \ \ \ \ \ n=2k+1\\\frac{4^n+4^{\frac{n}{2}}}{2}\ n=2k\ \ (k\in N^*)\end{cases}
\]
这个式子经过打表以及oeis.org的确认,结果正确。
3.声明与感谢
其实\(DNA\)的结构远比人类脑海中想象的要复杂的多,这里我们只是讨论了理论下的情况。
感谢您的阅读。若您存在任何疑问,或觉得我们有些地方存在纰漏,欢迎您联系我们,我们十分乐意与您探讨。
再次感谢两位同学@thorn,@opethrax深夜的探讨与陪伴,若没有他们的帮助,我们很难单独进行下去。
他们两位有关这个内容的博客写的都非常优秀,建议您去访问他们的首页以进行更多的了解。
除非另有说明,本网站上的内容均采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可,请您在转载时注明来源及博客链接。
4.深夜随想
造物主强大的力量是人们无法想象到的。人类很难走到没有任何疑惑的那一天。
每一个个体脑中冒出的新奇想法,或提出的一个问题,都有可能成为筑起人类从无知到有知的桥梁下的一粒石子。
对科学的探索,不是浅尝辄止,而是无穷无尽。
“生于此处却不知此处
日光倾城,万物生长,又是为何
若没有大地的拥抱,我们早已消失于茫茫宇宙之中
若没有原子之稳定,我们亦不复存在
无人问天地变换,斗转星移,是为何故
宇宙又是源于何处
它是否无始无终
时间若愿意倒流,我们的认知是否还会有局限
世间最渺小之物又是什么
滚滚长江,却只留有过去,不知未来
浩淼宇宙,为何我们在此相遇”
——《Moonlight》
来源:https://www.cnblogs.com/BeyondLimits/p/12381403.html