首页 > 其他 > 详细

关于n对碱基的DNA种类数问题

时间:2020-02-29 09:36:16      阅读:99      评论:0      收藏:0      [点我收藏+]

关于n对碱基的DNA种类数问题

正文

某天在册子上做到了这么个问题:

  • 如果有 \(2\)\(A-T\) 碱基对和 \(2\)\(C-G\) 碱基对,那么可能有多少种可能的 \(DNA\) 片段?

我最初想是 \(C^{2}_{4}\times 2^4\div 2\) ,和选项不符,也没多想就过了。


上面那个式子的解释:

  • 考虑 \(4\) 个碱基对的有重复排列,是 \(\frac{4!}{2!\times 2!}\) ,再考虑每个碱基有正反两种放法(如 \(A-T\)\(T-A\) ),所以每个乘 \(2\) 。最后注意到 \(DNA\) 的反向对称使得其翻转过来是一样的,会有中心对称的情况,所以再除以 \(2\)

然后之后又做了关于 “ \(n\) 对碱基的 \(DNA\) 可能有多少种可能 ” 这样的题,答案竟然给了个 \(4^n\) !


\(DNA\) 的种类其实是和上面的解释一样的:

  • \(n\) 个碱基对的排列有 \(2^n\) ,然后每个碱基对两种情况再乘 \(2^n\) ,最后(理应)除 \(2\)

然而还有另外一种理解,可能对下面的思考更有用:

  • 考虑一条链,\(4\) 种碱基的排列有 \(4^n\)? 种 ,另一条靠碱基互补配对确定,最后再除 \(2\)

刚好有几位同学也有此疑问,于是我们开始思考其原因。

首先,有一个理论,由于 \(DNA\) 是有方向的,两端并不一样,一端的磷酸连的是脱氧核糖上的 \(5\) 号碳,所以将其命名为 \(5`\) 端,另一端的羟基连的是 \(3\) 号碳,所以称为 \(3`\) 端。这个理论可能会造成两种可能间的微小的不同。

之后,我们思考了下其多算的原因:

  • 第一种,由于碱基互补:

    \[ \begin{vmatrix} A & T\C & G \end{vmatrix} \;\equiv\; \begin{vmatrix} G & C\T & A \end{vmatrix} \]

  • 第二种,简单的对称:
    \[ \begin{vmatrix} A & T\C & G \end{vmatrix} \;\equiv\; \begin{vmatrix} C & G\A & T \end{vmatrix} \]

然后,枚举了 \(n=2\) 的所有情况
\[ \begin{vmatrix} 3 & 5\A & T\A & T\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\T & A\T & A\3 & 5 \end{vmatrix}\(1) \\begin{vmatrix} 3 & 5\G & C\G & C\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\\ C & G\C & G\3 & 5 \end{vmatrix}\(2) \\begin{vmatrix} 3 & 5\A & G\C & T\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\\ G & C\T & A\3 & 5 \end{vmatrix}\(3) \\begin{vmatrix} 3 & 5\C & G\A & T\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\\ T & A\G & C\3 & 5 \end{vmatrix}\(4) \\begin{vmatrix} 3 & 5\G & C\A & T\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\\ T & A\C & G\3 & 5 \end{vmatrix}\(5) \\begin{vmatrix} 3 & 5\A & T\G & C\3 & 5 \end{vmatrix} \equiv \begin{vmatrix} 3 & 5\\ C & G\T & A\3 & 5 \end{vmatrix}\(6) \\begin{vmatrix} 3 & 5\G & C\C & G\3 & 5 \end{vmatrix}\(7) \\begin{vmatrix} 3 & 5\C & G\G & C\3 & 5 \end{vmatrix}\(8) \\begin{vmatrix} 3 & 5\T & A\A & T\3 & 5 \end{vmatrix}\(9) \\begin{vmatrix} 3 & 5\A & T\T & A\3 & 5 \end{vmatrix}\(10) \]

可以发现,除了最后四种,都重复了两次,这是由于碱基配对的重复。而最后四种乍一看有重复,但是 \(3`\)\(5`\) 是反的。

那么我们的重点就是如何找到只算一次的项。

可以发现,只要是按碱基配对变换后再倒过来和原来一样的链,都只会计一次。

例如:
\[ \begin{vmatrix} 3 & 5\\color{red}{A} & \color{teal}{T}\\color{red}{T} & \color{teal}{A}\\color{red}{G} & \color{teal}{C}\\color{teal}{C} & \color{red}{G}\\color{teal}{A} & \color{red}{T}\\color{teal}{T} & \color{red}{A}\3 & 5 \end{vmatrix}\\]

而如何一样呢,只需要对半分开,然后计算一半长链的排列,另一半按配对填上就行了。即为 \(4^{n\over2}\) 。而只有偶数长度会有这种情况,奇数是不行的。

最后我们只要在除之前将这部分再加一份,求可以不多除了!
\[ Ans(n)=\begin{cases} \frac{4^n}{2} & \text{$n=2k+1$}\\frac{1}{2}\times(4^n+4^{\frac{n}{2}}) & n=2k \end{cases} \]
这就是结论的式子啦!

经过打表检验正确。

至于 \(4^n\) 的来源,我们可以这么想,一般 \(DNA\) 分子是凭依在蛋白质载体上,所以按具体情况有办法区分两条排列一样的链,所以所谓对称就不存在了,但是若是单独讨论 \(DNA\) 答案即为而上述结论。

声明与感谢

感谢两位朋友 \(yyy\)\(zyl\) 的指点。(@opethrax @BeyondLimits


\(\frak by\; thorn\_\)

关于n对碱基的DNA种类数问题

原文:https://www.cnblogs.com/thornblog/p/12381381.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!