表达基因克隆技术与图谱构建策略研究

人类基因组计划的主要任务之一就是要从大片段基因组区域或整条染色体DNA 上鉴定出基因表达序列(gene expressed sequences)或转录单位(transcription units)。在人类基因组30亿个碱基对中,发生转录的表达序列(即基因)仅占总序列的3~5%。基因组中绝大部分是基因间隔序列(intergenic seguences)或 内含子(intron)和各种各样的重复序列。测定基因表达序列可直接鉴别人类目前认定的6~1 0万(或仅3~5万)个基因在染色体上的位置和排列顺序,这就是人类基因组计划所要构建的 第 四张图谱——基因表达图谱,又称基因转录图谱(gene expression maps or gene transcri ption maps)。

基因表达图谱是指细胞内所有染色体上表达基因的排列和分布,即指细胞中所有mRNA。目前 ,人们把很大精力投入到基因表达图谱的研究上,原因是表达基因序列是通过DNA序列的转 录本—mRNA反转录成互补DNA(complementary DNA,cDNA)获得的,即DNA外显子序列转录后形 成RNA,经过剪切形成mRNA之后,再将mRNA连接成模板,合成cDNA。因此,cDNA基因不包含 非转录的内含子序列,这大大减少了测序的工作量,加快了测序进度,并可以有目的的直接 针对某种功能基因尤其是致病基因进行测序、克隆和鉴定。因此,表达基因图谱可作为致病 基因诊断、克隆和基因治疗的工具,帮助科学家鉴定能指导蛋白质合成和引发疾病的DNA片 段,在此基础上,针对疾病基因靶位进行药物设计。可见,表达基因图谱在医学和制药上有 重要的应用价值。

构建表达基因图谱的前提条件是获得大量的基因转录本mRNA序列(cDNA),该部分序列经转 录、翻译后可直接作为基因表达出来,所以,对cDNA的测序就是寻找基因的表达序列。

在人类基因组测序工作中,“cDNA测序战略”是只测定转录的DNA序列,而不是从“全基因 组 战略”的角度对所有碱基的排序进行测定。具有基因表达功能的cDNA又称表达序列标签(expressed sequence tag,EST),特定的EST序列有时可代表特定的cDNA。实施此战略需从cDNA 文库中获得一些长为300~400个碱基序列的EST,其作用相当于全基因组测序时的序列标定 位点STS。1990年,人类基因组计划提出了大规模cDNA测序战略,并建立了表达序列标签EST测定技术 。

完整物理图谱的构建策略

一、构建完整物理图谱的基本要素

(1) 界标(marker)

界标是绘制图谱的标记工具。构图方法不同,界标的种类、界 标间的 距离、图谱的分辨率也不同。图谱中的界标包括采用家系分析法构建的遗传图谱中的基 因,DNA原位杂交法构建的遗传图谱中的DNA探针,用RFLP、MS、SNP等作为标记构建遗传图 谱中的DNA多态性。低分辨率的物理图谱界标有STS和cDNA(EST) 。高分辨 率的 物理图谱界标:一是基于STS构图法STSs界标;二是限制性酶切指纹法构图中的限制性酶切 位点界标

(2) 作图单位

根据构图方法确定。限制性内切酶的酶切片段是物理图谱的基本单位。以STS 为路标构建图谱是以STS作为基本单位;以碱基构成的终极物理图谱则以碱基对为基本单位 。

(3) 确定标记顺序

确定标记位点相互之间的衔接关系是制作图谱的主要目的。将全基因组 的 不同界标单位进行排序的方法包括:限制性酶切指纹排序、重叠连续克隆序列(STC)排序、 计算机软件排序、染色体步查和跳查填补间隙排序等。目前,新型技术全基组散弹法或鸟枪 法(shot-gun)可随机对DNA进行大规模测序,即绕过BAC克隆逐个排序过程,直接将基因组DN A分解成2Kb左右的小片段进行随机测序,辅之一定数量的10Kb克隆和BAC克隆末端测序(500b p),利用超级计算机进行序列组装。
(4) 具有DNA可复制系统

除可见图谱外,其他图谱的构建均需DNA复制系统。包括YAC、BAC 、粘粒、福斯粘粒、M13和P1等载体系统。上述复制系统在组装DNA片段的容量、插入外源DNA后的稳定性、克隆嵌合体以及构建基因文库所需的克隆数量上均不相同。 Continue reading

物理图谱的构建方法

物理图谱包括染色体图谱或细胞遗传图谱、cDNA图谱以及遗传连锁图谱等类型的 低分辨率物理图谱,另外还包括长片段限制性酶切图谱或限制性位点指纹图谱以及重叠克隆 图谱在内的高分辨率物理图谱。基于STS的物理图谱代表的是各种低分辨率和高分辨率整合 后的完整物理图谱。此外,还有将限制性酶切法与STS作图相结合发展的基因组序列抽样法构建的图谱;电泳技术与FISH技术结合构建的可见图谱 。这些图谱的构建大大推动了精细物理图谱向DNA大规模测序的过渡。

一、低分辨率的物理图谱

1、染色体图谱或细胞遗传图谱

细胞染色体图谱是最早、最经典的物理图谱。染色体图谱中的路标是在各种染料染色显带之 后的染色体带型。这些带型通常把染色体分为10-20个区域,这是所有物理图谱的基础。
原位杂交法是很长一段时间内进行基因定 位的有效方法,也是低分辨率物理图谱的主要绘制方法。与构建遗传图谱不同的是,用原位杂交技术构建的物理图谱是估计每条染色体DNA大分子上的路标的物理学实际距离,即对碱基数目进行估计;而构建遗传图谱时,是将在整个生物中测到的性状利用重组常数确定各种遗传标记和基因间的统计学距离。
原位杂交技术的分辨率较低,仅能达到几个Mb,改进的荧光原位杂交(FISH)技术也只是2~5 Mb的精度范围。在细胞分裂期间,染色体盘曲松散时,可使分辨率提高到0.1Mb。 Continue reading

构建物理图谱的重要工具——克隆载体

将基因组DNA片段克隆进各种载体组建重叠克隆群是物理作图的基本策略,克隆载体在物理图谱构建过程中发挥着不可替代的作用。

凡来源于质粒、噬菌体、细菌等可插入或克隆DNA片段的DNA分子统称为载体。载体的功能是为外源DNA进入受体细胞提供运载工具。经过载体重组的外源DNA比其单独进入受体细胞的效 率提高几个数量级。另外,载体可将外源DNA转移至受体细胞并在受体细胞内准确复制、大 量扩增和明确表达。载体除具备上述功能外,必须具有从一个宿主细胞转移至另一个宿主细 胞的可移动性。

上述克隆库的优点是能随机覆盖基因组很 多倍,并在扩增过程中表现出不易缺失和不易重排的稳定性。 Continue reading

物理图谱的构建策略研究

物理图谱(physical map)是在DNA分子水平上描述染色体中界标间顺序和距离的图 谱。构建物理图谱的目的是分离和鉴定单个基因或某些感兴趣的基因片段,为人类基因组30 亿个碱基测序打下基础。

构建物理图谱是人类基因组计划的重要组成部分。由于到目前为止末能发明直接对基因组DN A整体水平进行分析检测的技术,所以,只有将基因组DNA切割成小片段后插入不同的生物载 体再转染到一些生物体中使其稳定复制,分析其基因片段拷贝,对克隆群插入DNA片段按其在原始基因组上线性顺序进行排序,构建物理图谱。物理图谱的终极图谱是DNA序列图谱。

与遗传图谱相比,物理图谱的分辨率更高,图谱标记更多。因此,在多数生物中,物理图 谱 比遗传图谱更重要。物理图谱是从遗传图谱到序列图谱的中间图谱,在区域性测序、构建较佳克隆时,没有完整及准确的物理图谱是不能够准确完成测序的。构建精确的物理图谱,可发现和分析相应区域的基因序列,实现DNA测序,从序列中克隆基因。目前,分辨率最高的物理图谱是在序列专一位点(seguence-tagged site,STS)作为标记的基础 上,将插入人类DNA片段的克隆群按原来在染色体基因组上的线性顺序构建的图谱。STS可作 为整合遗传图谱和物理图谱的,对采用不同作图技术构建的图谱进行比较 并对其进行整合,最终实现大规模基因组DNA测序。