注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

这里是许博寓的资料

洞明时势知天下否泰;练达人情著百科全书!

 
 
 

日志

 
 
关于我

洞明时事能晓天下泰否 练达人情可著百科全书

文章分类
网易考拉推荐

生物信息学的终端研究是宇宙程序学(一)  

2009-10-27 07:18:25|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

生物信息学的终端研究是宇宙程序学(一)

许博寓/

摘要:宇宙程序学和生物信息学有着必然的内在的联系,二者相辅相成,相得益彰。宇宙程序学在一般规律的研究上,已形成理论体系,而对特殊规律的研究还是一个新课题;生物信息学在特殊规律的研究上已初具规模,而对一般规律的拓展尚待起步。可以预知的是,生物信息学的终端研究必然是宇宙程序学,反过来说,宇宙程序学的终端研究必然是生物信息学。

段落提纲:

1     生物信息学(Bioinformatics)概述

1.1     生物信息学现状

1.2     生物信息学研究的内涵

1.3     生物信息学未来展望

1.4     生物信息学面对的困局

2     宇宙程序学(Universe science program概述

2.1     宇宙程序学基本原理

2.2     宇宙程序学本质元素

2.2.1         太极

2.2.2         两仪

2.2.3         四象

2.2.4         八卦

2.3     宇宙程序学生命模块矩阵

2.4     宇宙程序学生命树

2.5     宇宙程序学时空经纬

2.6     宇宙程序学波浪线运动关系

2.7     宇宙程序学基本物质

2.8     宇宙程序学生命因子反应釜和遗传与变异链的表述

2.9     宇宙程序学信息曲线表达式

    3   宇宙程序学同生物信息学的区别与联系

 

1        生物信息学概述

生物信息学(Bioinformatics),应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。更准确地说,应该是分子生物信息(Molecular Bioinformatics)。

二十世纪80年代末,随着生物学和医学迅速发展研究的需要,应运而生的人类基因组计划顺利推进,产生了海量生物学数据,这些数据隐藏着丰富的生物学知识。如何充分利用这些数据,并通过对数据的分析和处理,揭示这些数据的内涵,得到有用的信息,单一的生物学和生物数学已经难堪大任。于是,一种以生物学和生物数学为基础的,以计算机为主要工具而借助于计算机数据库、网络和应用软件的,囊括数学运算法则、统计学、信息理论、图形学、科学可视化、图像识别、人工智能、密码学、非线性动力学、计算机模拟、机器学习、语言学、数据库、软件工程、计算机网络、分布式系统、生物物理学、生物化学等等学科,充分满足于对生物大分子信息的获取、加工、存储、分类、检索与分析的相互交叉互补的新兴学科——生物信息学由此而诞生,生物信息学包含了数据获取、数据解释、基因组图谱、三维结构预测、分子建模、药物设计、同源比较、分子进化、数据库检索、基因预测、仪器设计、数据库建构、基因调控、基因诊治及治疗等等。极大缓解了基因组计划之海量数据对生物科学研究的挑战。

1.1  生物信息学现状

生物信息学伴随着人类基因组织计划的实施逐渐发展壮大起来,其发展历程大致可分为三个阶段:(1)、前基因组时代:生物信息学的主要工作是数据库的建立,检索工具的开发,以及DNA和蛋白质序列分析;(2)、基因组时代:生物信息学的主要工作是核苷酸序列测定、分析,新基因寻找和识别,数据库系统的建立和交互,应用软件的开发,基因组序列信息的提取分析等;(3)、后基因组时代:生物信息学主要工作是包括蛋白质组学研究以及基因组注释。 随着后基因组时代的到来,基因组学的研究从结构基因组学过渡到功能基因组学,即从"是什么"过渡到"为什么"的研究。

生物信息学的概念从50年产生以来,作为基因组信息学,经过一个酝酿、发起和沉积过程以后,于80年代末随着计算机网络信息快速发展,形成一门独立的学科而迅速膨胀起来。国际生物信息学研究迅速崛起,各种专业研究机构和公司如雨后春笋般涌现,生物科技公司和制药公司内部的生物信息学研究部门与日俱增,短短的几十年时间,生物信息学数据库的建立,生物信息学软件的开发,生物信息学算法的归纳和总结,生物信息学应用导向思路等等,出现了前所未有的蓬勃生机,迅速壮大起来。

1.1.1 生物信息学数据库现状

国际上已建立起许多公共分子信息数据库,包括基因图谱数据库、核酸序列数据库、蛋白质序列数据库、大分子结构数据库等。著名的数据库有美国国家生物技术信息中心(NC-BT)的Gen Bank库;欧洲生物信息学研究所(EBT)的核苷酸序列数据库EMBL;日本生物信息学中心(CIB)的DNA数据仓库DDBT。除此以外,中国的北京大学生物信息中心;北京大学物理化学研究所;北京医科大学生物医学信息;中国科学院微生物研究所;天津大学生物信息中心;中科院计算所智能信息处理重点实验室生物信息学研究组;中国科学院基因组信息学中心等单位相继建立起生物信息学和生物医学信息服务器。现有几百个数据库大致可以分为核苷酸数据库、蛋白质数据库、生物大分子数据库和其他数据库等四大类型,包含了从DNA、蛋白质、细胞等不同层次的不同物种的数据。

1.1.2 生物信息学软件现状

生物信息学软件可以分析和处理实验数据和公共数据,加快研究进度,缩短科研时间;可以提示,指导,替代实验操作,利用对实验数据的分析所得的结论设计下一轮阶段的实验,用计算机管理实验室数据及文献资料,用计算机预测新基因及其结构和功能,还可以对蛋白高级结构进行预测,是生物信息学不可何缺拐杖。序列比对,数据库搜索和查询,研究生物进化,序列装配,寻找基因及模式识别,RNA指纹及限制性内切酶图谱,引物设计,蛋白质motif分析,DNA/RNA二级结构分析,翻译等等都离不开对生物信息学应用软件的依赖。目前生物信息学软件有:序列对比和数据库搜索软件有BLAST, FASTA, BLITZ等,生物大分子可视化软件有Rasmol, Mage, Raster3d, Grasp等,与蛋白质结构有关的程序有Procheck, WHATIF, DSSP等,大型分子生物学软件包如GCG.,各个数据库还有自身的查询系统。在基因识别方面,比著名软件GRAILGeneIDGeneMark等,蛋白质二级结构预测程序PHD Vector NTI Suit 同源比较,DNASIS 2.5 蛋白二级结构预测,Omiga 2.0 ORF MapDnaStar Protean 对氨基酸的亲疏水性分析,Vector NTI Suit 5.5 模拟电泳,Winplas 2.6 质粒构建,OLIGO 5.0 PCR 引物设计,Atheprot 5.0 预测蛋白跨膜区域,Reference Manager 文献管理,RasMol 2.7 显示蛋白质三维结构等等。

1.1.3 生物信息学算法现状

生物信息学在近十年的发展和提高中,经过广大生物信息学科学工作者的努力,归纳、总结、提炼了大量的算法法则和公式,其中最主要的有:A、预测外显子的基本算法,包括(1)最长ORF法,(2) 核苷酸语汇(nucleotide words,即数个连续核苷酸的排列)选用频率的统计差异被用来区别编码和非编码区域6核苷酸(hexmers)的选用差异,(3) 同源比较算法,(4)动态规划算法,(5)基因预测算法:a、法则系统(rule-based system),b、语言学(Linguistic )系统,c、线性判别分析(Linear Discriminant Analysis,LDA),c、决策树(decision tree),dSpliced alignment算法,eFourier analysis等;B、多序列同源比较(multiple-sequence alignment);C、基因表达数据分析;D、调控网络构建。E、序列分析;FDNA片段拼接等等。

1.1.4 生物信息学应用现状

生物信息学主要任务不仅仅是研究数据库、软件、算法,来保存、管理、处理、发布从生物学实验获得的数据,让实验生物学家加快实验进程,帮助设计实验,更快、更有效的验证新的假设。生物信息学更主要而且更重要的功能是发现生物学知识,把现有的数据、信息从各个层次整合来阐明生命的奥秘,这不是实验生物学所做不到的事,也不是理论生物学能做到的事。而要实现这个目的,必须从生物信息学的角度出发,既不是从生物学的角度,也不是从算法的角度,来理解生命?提出课题?那么,如何从生物信息学的角度出发呢?首先,要知道生物信息学的产品是什么,它们不是数据库、也不是软件,而是新的理论、新的分析思路、新的药物、新的营养学、新的生态平衡元素等等。从这个角度出发,目前在系统发育分析、药物设计、基因组注释、数据挖掘用于肿瘤分型诊断、辅助生物学实验(发现候选基因)、电子杂交等等,都取得了令人瞩目的绩效。

1.2生物信息学研究的内涵

生物信息学研究的内容主要包括基因组学和蛋白质组学两个方面,其中,A、基因组学的研究包括:(1)、结构基因组学的研究;(2)、比较基因组学的研究;(3)、功能基因组学的研究;(4)、药物基因组学的研究;(5)、环境基因组学的研究;B、蛋白质组学的研究包括:(1)、蛋白质的结构与功能研究;(2)蛋白质分子相互作用以及其用途的研究。为了有效对基因组学和蛋白质组学的研究,生物信息学的重要研究课题大致上可以分为十个:(1)、大规模基因组测序中的信息分析;(2)、新基因和新SNP的发现与鉴定;(3)、非编码区信息结构分析;(4)、遗传密码的起源和生物进化;(5)、完整基因组的比较研究;(6)、大规模基因功能表达谱的分析;(7)、生物大分子的结构模拟与药物设计;(8)、生物信息学分析方法的研究;(9)、建立国家生物医学数据库与服务系统;(10)、应用与发展研究。

1.3   生物信息学未来展望

 “一场与工业革命和以计算机为基础的革命有相同影响力的变化正在开始。下一个伟大时代将是基因组革命时代,……。”基因组研究乃至整个生物信息学的发展对今后人类社会将产生深远影响。它不仅具有重要的学术价值,还具备潜力无限的商业价值,有着无比远大的发展前景。随着后基因时代的来临,对于人类认知生命、发展生命、进化生命的科学研究与发展将起着不可替代的作用。在21世纪,生物信息学将是生物科学发展的核心领域。生物信息学作为基因组学和蛋白质组学研究的有力武器,被得以广泛地应用。

1.4  生物信息学面对的困局

综上所述,生物信息学研究是利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法,对序列、结构数据进行定性和定量分析,从中获取基因编码、基因调控、序列-结构-功能关系等理性知识,阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联系,探索生命起源、生物进化、生命本质等重大理论问题,最终建立生物学周期表

由此可见,生物信息学研究是从理论上认识生物本质的必要途径,通过生物信息学研究和探索,可以更为全面和深刻地认识生物科学中的本质问题,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。生物信息学的出现,彻底地改变了生物学的研究方式。生物信息学在进行信息处理和分析过程中,去粗取精,去伪存真,发现有用的线索,在此基础上进行有针对性、有明确目的的分子生物学实验。因而,生物信息学在指导实验、精心设计实验方面等等将会发挥重要的作用。

但是,随着生物信息学研究的不断深入,必将进入到一个失去研究方向、失去应用方向、茫然不知巅峰的瓶颈。诚然,生物信息学研究是以基因组学和蛋白质组学为基础,但是,目前的基因组学和蛋白质组学的研究还局限于以人类基因组为主体的特殊规律的研究中,导致生物信息学也仍然局限在对特殊规律的研究之中。宇宙空间具有特殊规律的基因组举不胜举,表现为无限大,尽管这些特殊规律的基因组遵循宇宙生态平衡法则,而相互依赖、相互制约,相互作用,互为因果,然,它们依然呈个性表现形态。而生物信息学研究的最终目的,是要将这些具有个性的生物基因组信息呈圆周链贯串起来,为人类服务,从而促进人类进化。仅仅依赖特殊规律的基因组研究是无法达到这个目的的。比如现有生物信息学中的同源比较,仅仅只是了解了近邻异族基因组的异同,而无法对远戚异族基因组进行甄别。其实,在一个基因组群中,除去紧邻异族基因元素以外,同样存在远戚异族基因元素。远戚异族基因元素是以近邻异族基因元素为桥梁过渡到这个基因组群之中的,它的元素信息包含在近邻异族基因元素之中,通过近邻异族基因元素形态表现出来,而自身的形态被隐藏,其判别式为:55=1+2+3+4+5+6+7+8+9+10。这就是为什么基因组别不同的物质,通过一定的条件,可以互为兼容,相互补充的原因。如人类同绝大多数植物、绝大多数动物和绝大多数微生物的基因组别是不同的,但是,人类的能量又需要吞食这些植物、动物和微生物来补充,他们将基因素相同的可以吸收的东西,充分吸收,将基因素不同的不可以吸收的东西,排弃和排泄,于是,人类得到了他们生存需要的能量。这就是一般规律起着本质的联系作用。故,只有充分搞清楚了宇宙空间基因组群的相互关系以后,在后基因组时代中的研究、开发和应用才有可能做到有的放矢。比如弄清楚远戚异族、近邻异族和这个基因组的关系,非常有助于我们对基因药物、基因保健品、基因食品、以及基因因子的克隆等等的设计,使改造生命的手段更加科学化、客观化、多样化和实际化。那么,怎样搞清楚宇宙空间个性基因组之间的关系呢?最直接的方法,就是将这些特殊规律的基因组群进行归纳、总结、提炼和抽象出具有共性的,即一般规律的基因组排列格式。如果是这样的话,生物信息学就将陷入到一个几乎无法完成的困局之中,因为,要想得到一般规律的基因组格式,必须首先统计清楚特殊规律基因组,或者加权统计清楚特殊规律基因组,这几乎是,或者根本是不可能的。除此以外,另外的方法就是借助于其他研究物质一般规律的学说过渡。因此,研究物质运动一般规律的宇宙程序学,就必然成为生物信息学研究的终端和方向。

【待续】

  评论这张
 
阅读(462)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017