logo资料库

最大匹配问题的三链DNA计算模型.pdf

第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
资料共3页,全文预览结束
第 32 2012 卷 第 年 月 12 4 期 安徽理工大学学报( 自然科学版) ( Journal of Anhui University of Science and Technology Natural Science ) Vol. 32 No. 4 Dec. 2012 最大匹配问题的三链 DNA 计算模型 杨 静1,2,殷志祥1,陈明强3,黄凯峰4 安徽理工大学理学院,安徽 淮南 ( 1. 化学工程学院,安徽 淮南 232001 ; 4. ; 安徽理工大学地球与环境学院,安徽 淮南 2. 232001 淮南职业技术学院信电系,安徽 淮南 ) 232001 232001 ; 3. 安徽理工大学 摘 要: 三螺旋结构的 DNA 链具有稳定性,在一定条件下易分解等特点,因此得到的三链模型 具有错解率低的优点。利用三链模型来讨论最大匹配问题,拓展了 DNA 计算解决问题的方法 和应用领域。 关键词: DNA 中图分类号: Q523∶ TP301 计算; 三链 DNA ; 最大匹配 文献标志码: A 文章编号: 1672 - 1098 ( ) 2012 04 - 0047 - 03 Triple - stranded DNA Computing Model of Maximum Matching Problem YANG Jing1 HUANG Kai - feng4 , , China 1. School of Science CHEN Ming - qiang3, YIN Zhi - xiang1, Anhui University of Science and Technology Huainan Anhui 232001 2, , , 2. School of Earth ang Envi- ; ( ronment , Anhui University of Science and Technology , Huainan Anhui 232001 , China ; 3. School of Chemical Engineering , University of Science and Technology , Huainan Anhui 232001 , 4. Department of Information and Electrical Engineering Anhui , ; China , China , ) , Huainan Vocational and Technical College Huainan Anhui 232001 , : Abstract Triple - stranded DNA has the features of stability and under certain conditions can be easily decom- posed. Triple - stranded DNA model has advantages of low rate of wrong solutions. The triple - stranded DNA model was used to discuss the maximum matching problem which expands method for solving the problem and application field of DNA computation. Key words DNA computing ; triple - stranded DNA ; maximum matching : 但 DNA DNA DNA DNA 。DNA 计算是一种以 与相关某些生物酶 基于某些生化反应原理的一 、 计算的优势是 分子具有海量的存储能力及生化反应的 计算目前还 。 计算模型还很不成熟 。 计算模型中,大多数是应用于图与 模 分子结构,开发和研究新 目前常用的有 半环状的 、 本文将用三链 等作为最基本材料的 种新型的分子生物计算方法 利用 巨大并行性等特点进行计算 在实验室阶段,研究的 在已有的 DNA 组合优化中的 NP - 型首先考虑的就是 的分子结构也是目前研究的热点 单链的 单双链混合的 、 及三螺旋等结构的 。 环状的 、 分子结构 计算模型解决最大匹配问题 双链的 、 完全问题[ 建立 DNA DNA DNA DNA 。 。 ] 1 - 7 DNA 。 三链 DNA 1 DNA。2004 蛋白及 1957 W - C 年,文献[ ]首次提出了三链核酸的概 8 念,即在经典的 双螺旋中含有多聚嘌呤那条 链,通过 氢键与大沟中 的第 三 条 链 结 合,从 而 形 成 三 螺 旋 结 构 即 三 链 年,文献[ ]发现寡聚脱氧核苷酸在 9 Hoogsteen Hoogsteen 或反 的存在下,与线性双螺旋 ATPγS RecA 可形成稳定的三链结构 聚脱氧核苷酸在 合,然后在目标双螺旋 过程非常迅速并且不打开 找到后,寡聚脱氧核苷酸在 DNA 在形成的过程中,首先寡 。 的存在下与 蛋白结 上寻找同源序列,这一 同源的双链 蛋白的介导下与 ATPγS 双链 RecA DNA DNA 。 RecA 收稿日期: 2012 - 10 - 15 作者简介: 杨静( 1980 - ) ,女,安徽濉溪人,讲师,在读博士,研究方向: DNA 计算与组合优化 。 中国煤炭期刊网 www.chinacaj.net
84 安徽理工大学学报( 自然科学版) 第 32 卷 目标双螺旋 蛋白介导形成的三链 DNA 形成三链 DNA。 是相当稳定的[ 经证实由 ] 10 DNA RecA 。 。 ① DNA 连接 利用三链模型解决最大匹配问题,需要用到下 链通 面几种分子操作: 过连接酶连接成一条 链利用 切酶在指定位置进行切割; 电泳中得到的最长的 到所求解 分成熟,在生物实验上是可行的 将编码好的 链; 复制 扩增技术进行复制; 内切 提取测序 DNA 将 DNA 利用内 对凝胶 ④ 链进行提取测序,已得 这里所需要的生物操作技术都已经十 DNA PCR 。 ② 。 ③ 。 。 。 图 1 三链中第三条链的形成 最大匹配问题 2 2. 1 问题描述 给定无向图 ( , E V G = M  E 点,则称 惟一的 ,如果 是 M 若 。 G M 中任意两条边在 的一个匹配 G 中没有另外的 G 的最大匹配 的最大匹配; 反过来不成立 如果 。 G 也有可能不是惟一的( 见图 是 M G G E ) ,对边集 一般地, 。 G 的任一子集 中都没有公共端 的匹配不是 ,则称 为 | M' | ≥| M | 的最佳匹配,显然 是 的最佳匹配 { 但是 M M G { e2 M4 = } 为该图的最大匹配,并且均是最佳匹配 M1 = } 和 2 , e4 、M3 = , e6 , e7 e2 e1 } { 。 ) , , e7 、 , , e3 { } , e7 , e6 e1 。 M2 = e7 定温度下使其连接成一条长链,根据 配对原 则,在形成稳定的双链,把此时得到的结果进行提 扩增放在一试管中,作为最初的数 取 纯化 、 据池 W - C 、PCR T0 。 步骤 2: 将 分为两个试管 T0 ( 一般从 开始) ,检查与 的补链分别制作成探针 e1 T1 、T2 。 选取图 的 相关联的边 G 。 利用 e1 P1 、P2 。 P1 从新连接起来, 得到不 P2 T1 、T2 一条边 e1 将边 e1 、e2 将含有边 e1 这时得到的 含有边 T2 。 再混合一起作为试管 的试管 T1 e2 的链分离出来,切掉 e1 试管不含有 同理利用 e1 。 这时将得到的新的试管 T0 。 步骤 3: 检查是否有两边关于顶点关联,若有 这样得 ,直到任两边都没有顶点关联 重复步骤 到的试管中就含有需要的解 1 。 步骤 4: 利用凝胶电泳技术测出最长的 DNA 片段( 可能不止一条) 读出其解,既是所求的最大 匹配 。 。 2. 3 DNA 编码 步骤 1: 将图 个碱基对的 含 G 。 。 DNA DNA 片段表示 20 个碱基对的 的顶点和边进行编码,顶点用 边的编码可用 片段表示,将所有边的编码两 20 端加上限制性内切酶,然后把边所对应的寡聚核苷 酸片段与连接酶一起加入缓冲液,在特定温度下使 其连接成一条长链 加入聚合酶 互补原则,在 端不断地扩增 DNA 链的稳定性 son - Crick 子,从而使所有单链 以增加 底物 的寡聚核苷酸片段的补链) , 进行 纯化后的产物进行分离 初的数据池 Wat- 分 3' 链都以双链的形式存在, 在反应后的产物中加入 的顶点所对应 G 聚合酶及缓冲液 扩增,对这些产物进行纯化,然后对于 作为最 , , e4 分子,适量的引物( 图 DNA , , e2 e3 。 中含有 把这些双链 引物,利用 、 PCR - T0 。T0 , e5 DNA DNA DNA DNA DNA 链{ 。 e1 } , e7 e6 。 图 2 无向图 G 与其最大匹配 M1 、M2 、M3 、M4 : : : : : : : e1 e2 e3 e4 e5 e6 e7 ATGCCTCATACGGCTTTCAG GGCTTATGCAAAGCTTTCTA CCATATAGCTAACCTGCTAG TTGACTCTAGAATTCTCGAT GTAGACTAGCTAGGTTTCTA GATCTAGCTTACTAGTCCCC AAAATTGCCTTGCATATACA 3 图 边的编码 分为两个试管 2. 2 DNA 算法 步骤 1: 将图 的顶点和边进行编码,将所有 边的编码两端加上限制性内切酶,然后把边所对应 的寡聚核苷酸片段与连接酶一起加入缓冲液,在特 G 步骤 2: 将 T0 ( 一般从 关联,将边 一条边 点 v1 e1 e1 e1 、e2 选取图 T1 、T2 。 与 的 关于顶 G 开始) ,检测到 的补链分别制作成探针 e2 e1 P1 、 中国煤炭期刊网 www.chinacaj.net
第 4 期 杨 静,等: 最大匹配问题的三链 计算模型 DNA 94 A e1 e1 DNA DNA P1 。 ATPγS 在表示 Hoogsteen 端添加一个聚酯纤维 链作为模板构造探针 结合生成三螺旋结构的 的寡聚核苷酸片段的补链 单链和抗原蛋白质在含有 DNA ,在标记上生物素 配对原则,这个探针将与含有 单链 P2 。 使 的 。 5' 这些 溶液 混合,在一定条件下生成核蛋白细状体,把这些核 蛋白细状体的 将 第一个探针混合到数据池中,在一定条件下根据 的双链 ,再利用生物操 除 边的编码从链上连同 加热解链,冲洗掉补链,得到的探 , 利用同样的方法可以得到不含有 ,将两个试管混合作 , DNA 作中的分离操作将没有生成三链的双链 去 探针一起切除 针可以再用 还作为试管 T1 。 链,作为试管 的 边 为试管 这时 T0 , , , e4 e7 e3 步骤 3: 检测图 G 试管中含有 , e5 中是否还有边关联,若有,重 必将含有所需 利用内切酶的作用将 。 这时得到的 链不再含有边 T0 。 } 和{ , e6 , e7 , e3 , e6 , e4 DNA DNA DNA DNA DNA 链{ 复上述步骤,得到最终的试管 的解 T0 。 。 。 。 T2 e1 e1 e1 e5 e2 e2 } PCR 扩增和纯化后,提取这些链 。 步骤 4: 利用凝胶电泳技术测出最长的 。 DNA 采用非 测序的方法,进行测序,可得到最 链的碱基排序,也即知道了图的最大匹 { , DNA { } { , e6 , e7 e2 、M3 = e1 e2 , , e7 e3 { e1 } 、M2 = , } e6 , e7 。 M4 = 片段,用 放射性标记 长的 配, M1 = , } 和 e7 DNA e4 结论 3 DNA DNA DNA 链,而双链 利用三链模型来解决最大匹配问题相对其他 模型计算时错解率要低一些,因为生成数据池时, 存在的都是双螺旋结构的 的 的稳定性强,在数据池中就不 稳定性较单链 结构,从而 会出现由于编码问题而出现的 ” 使生物化学反应更为充分,效率更高 而对于三链 的分离较容易些 DNA 。 当然对于实际问题的求解,还存在着一些生物技术 另外,此模型的复杂度 上的问题,需进一步研究 条边的无 与顶点的度有关 作为有 个顶点和 向图,利用三链模型计算它的最大匹配 根据模型 分析,编码及生物操作的复杂度仅随顶点和边的增 的分离也相对双链 发夹 DNA “ 。 。 。 。 m n ) O 。 DNA 加而增加,且呈线性关系 ( 模型中由于需要 n 片段切除,可能 利用内切酶把某条边对应的 会因为生物技术或是问题规模的扩大,而产生伪解 随着生物技术的发展,这些问题会得到解 或错解 目前,在理论上用三链模型已经解决了不少问 决 题,更加体现了这种模型得优点 随着分子生物学 技术的发展,这种 计算模型的生物操作将会 得以更好的实现,模型的通用性将进一步提升 DNA 。 。 。 。 参考文献: [ ] 1 [ ] 2 [ ] 3 [ ] 4 [ ] 5 , , 403 2000 GAO LIN LIU QINGHUA , LIMAN WANG , TOS et al. DNA computing on surfaces ANTHONY G FRU- , [ ] J . Nature 13 ) : ( , XU JIN. DNA solution of vertex cover prob- 175 - 178. lem based on sticker model . Chinese Joumal of Elec- [ ] J tronics , 2002 , 11 ( 2 ) : 280 - 284. KARL HEINZ ZIMMERMANN. Efficient DNA sticker algorithms for NP complete graph problems . Com- puter Physics Communications , 2002 , 144 : [ ] J 297 - 309. , , BRAICH R S CHELYAPOV N JOHNSON et al. Solu- tion of a 20 - varaiable3 - SAT problem on a DNA com- [ ] J puter , 2002 . Science , TAMAR P : , 296 , ADAR R 499 - 502. , et al. Programma- BENENSON Y ble and autonomous computing machine made of bio- 430 - 434. 22 计算机模型( ) : 理 I , 414 ( ) : [ ] J moleccules . Nature [ ] 许进,董亚非,魏小鹏 6 , 2001 粘贴 , ( 49 ] 许 进,李 三 平,董 亚 非,等 [ 7 . 科学通报, 科学通报, 论[ ] . J 2004 ) : 应用[ ] J . ( . Ⅱ DNA ) : 粘 贴 , 49 2004 DNA ( ) : 4 3 205 - 212. S TYAGI , F R KRAMER. Molecular beacon : fluoresce upon hybridization . Nat Biotechnol [ ] J 计 算 机 模 型 299 - 307. probes that , , 1996 [ ] 8 [ ] 9 : 14 303 - 308. SHIGEMORI Y , OISHI M. Specific cleavage of DNA molecules at RecA - mediated triple - stranded struc- [ ] J ture . Nucleic Acids Research 2004 32 15 , , ( ) : 4 563 - 4 575. [ ] 10 RAO B J , DUTREIX M , RADDING C M. Stable three - stranded DNA made by RecA protein . ProNatl Acad Sci USA , 1991 , 88 ( 8 ) : 2 984 - 2 988. [ ] J ( 责任编辑: 何学华,吴晓红) 中国煤炭期刊网 www.chinacaj.net
分享到:
收藏