北京青春痘医院在哪 http://m.39.net/pf/a_8736666.html吴家睿中国科学院上海生命科学研究院生物化学与细胞生物学研究所研究员
吴家睿摄于张掖
宏伟计划的"宏伟"挑战
导读
“人类细胞图谱”(HumanCellAtlas,HCA)是生命科学领域最近兴起的国际大科学计划,其目标是要采用特定的分子标志物来确定人体的所有细胞类型。该计划的实施面临着巨大的挑战;有些挑战是技术性的,也许在未来能够解决;但是,有些挑战是理论性的,反映出研究者的想法与其研究对象的特性之间有着根本的冲突。
动植物等多细胞生物,通常都是由一个细胞——受精卵,通过连续不断的细胞分裂和细胞分化方式发育而成。在这种个体发育过程中,亲代与子代细胞之间以及同代细胞之间具有人类家族谱系那样的“亲缘关系”,故称为细胞谱系(celllineage)。对细胞谱系的研究不仅是发育生物学的主要任务,而且在抗击疾病和衰老等方面也有着重要的应用前景。上个世纪70年代,英国科学家Sulston通过微分干涉显微镜对秀丽隐杆线虫(C.elegans)的整个发育过程进行了持续的观察,描绘出了至今为止在多细胞生物种类中一个最为完整的细胞谱系图[1,2]。这种线虫是一个长约1毫米、非常简单的无脊椎动物,从受精卵到成虫过程中总共分裂产生个“体细胞”(somaticcell);这张线虫细胞谱系图清楚地揭示了这个体细胞中每一个细胞的身世和命运;例如其中的个细胞会在发育过程的特定时期死去[1,2]。
随着当前生命科学研究技术的发展,尤其是单细胞测序技术的成熟,研究者于年10月在英国伦敦召开了一个会议,建议实施一个远比线虫细胞谱系研究宏大的“人类细胞图谱”(HumanCellAtlas,HCA)的国际合作研究计划;该计划堪比“人类基因组计划”,其组织委员会由来自10个国家不同研究机构的27名科学家组成。年5月,HCA的主要领导人RegevA和TeichmannSA及其团队发表了关于这次会议的总结报告,系统地论述了HCA的意义、目标,任务和实施路径[3]。在他们看来,HCA的基本目标是:“采用特定的分子表达谱来确定人体的所有细胞类型,并将此类信息与经典的细胞空间位置和形态的描述连接起来”[3]。但是,与线虫相比,人体大约有40万亿到60万亿个细胞;HCA面临的挑战显然要远远超过人类基因组计划。
完整性的挑战
传统生物学对细胞类型(celltype)的确定,主要是根据其稳定不变的表型特征,如细胞形态、空间位置和生理性质等,如通过形态差异来区分神经细胞和神经胶质细胞。据此人们推测,人体的细胞类型可能从种到种。而HCA则试图从分子水平来对细胞进行分类。中国科学家最近发展了一种高通量的单细胞转录组测序技术,并用该技术对小鼠不同生命阶段的近50种器官组织的40余万个细胞进行了单细胞转录组分析,构建了首个哺乳动物细胞图谱[4]。研究者根据这些转录组数据进行了相应的细胞分类;例如,把怀孕小鼠和未受孕(virgin)小鼠乳腺组织上形态相同的细胞依据其基因表达差异分出了不同的类型[4]。
这种按照分子信息来进行细胞分类的策略显然比传统的细胞分类方法更为精确,但同时也使得细胞类型的标准变得模糊,甚至有时变得比较随意。例如,哺乳动物机体内的分泌器官“胰岛”(pancreaticislet)是由α细胞、β细胞、γ细胞及PP细胞等4种分泌型细胞组成。过去人们认为,这些β细胞是一种高度均一的胰岛素分泌细胞。但是,德国科学家不久前根据一种称为Flattop蛋白的表达与否把成年小鼠的胰岛β细胞分为两个亚群,不表达该蛋白的属于未成熟的β细胞,而表达该蛋白的则属于成熟的β细胞[5]。而另外一项利用专一结合人体β细胞不同膜蛋白的抗体技术的研究揭示,成人的胰岛中存在4种亚型的β细胞[6]。HCA的组织者已经意识到了这样一个问题:他们首先面临的一个挑战是,缺乏对细胞类型和细胞状态(cellstate)的严格定义。细胞类型意味着稳态特征,而细胞状态则是指瞬态特性;由于所有细胞都是处于变化之中,所以这两个概念间的边界难以区分[3]。而在分子水平的细胞分类显然让这个问题更为复杂化。
HCA的组织者提出其理想的终极目标:(1)确定人体中的每一个细胞;(2)确定每个细胞的空间位置;(3)通过细胞谱系确定在人的一生中每一时刻出现过的每个细胞;(4)根据健康状态、基因型、生活方式和外界环境的不同,对每一个个体的细胞图谱进行注释[3]。可以这样说,这一终极目标的实现意味着生命科学的终结。面对这样的终极目标,HCA的组织者不得不承认:“当然,要构建这样的终极图谱是完全不可能的”[3]。
退而求其次,HCA的组织者把实际目标定为“一个基于所有人类细胞的稳定属性和瞬态特征的综合性参考目录,并包括各种细胞的位置和丰度”[3]。值得注意的是,HCA的组织者还试图通过两个研究策略把其实际目标分解得更容易实现。首先是借鉴人类基因组计划分阶段完成的方式,“明智的策略是制定一系列构建细胞图谱‘草图’(draft)的阶段性目标,这些‘草图’将逐渐地增加(人类细胞图谱)分辨的精度、覆盖的广度和解释的深度”[3]。
按照这一策略,HCA目前已经发表了许多人类细胞图谱的阶段性工作,例如,年3月8日,英国Sanger研究所在其网站上宣布,25万个发育细胞作为人类细胞图谱计划的第一步,已经完成单细胞转录组测序工作;美国Broad研究所紧随其后也发布了50多万个人体免疫细胞的单细胞转录组测序数据[7]。此外,中国科学家对人类胚胎8到26周发育过程中前额叶皮层的2多个细胞进行了单细胞转录组测序,发现了神经干细胞、兴奋性神经元、抑制性神经元、星型胶质细胞、少突胶质细胞、小胶质细胞等六大类细胞,并进一步把这六大类细胞精确划分为35个独立的细胞亚型[8]。
虽然这种分阶段研究的策略能够推进HCA的工作,不停地产生人类细胞图谱的各种“草图”,但要想获得人体数十万亿个细胞的“全图”显然并非易事。就以人类基因组计划的“小目标”——弄清人类基因组究竟有多少个基因——为例,从1年人类基因组“草图”的发表到今天将近20年的时间,研究者尚未得到一个确定性结论。1年发表的人类基因组“草图”提出了“高可信度”基因数为;4年的人类基因组“全图”预测出的基因数目在2万到2万5千个之间;美国国立卫生研究院专门负责收集基因的项目“MammalianGeneCollection”在9年宣称人类基因组只有个基因;美国科学家年在预印本网站“bioRxiv”发表的研究论文提出,人类基因组用来编码蛋白质的基因数目是个。
HCA的组织者拟采用的第二个研究策略是“局部采样”。在他们看来,“为了得到人体细胞的精确图谱去对人体中所有细胞进行研究是不可能的,也没有这个必要”[3]。HCA的组织者提出,在细胞图谱的研究过程中,可以先进行少量稀疏的细胞采样,经过分析后再决定更深度的采样方式[3]。此外,作为分子层面的细胞类型分析,也同样可以进行“局部分析”,即首先对采集到的细胞进行低覆盖度(lowcoverage)的转录组测序,以便能找到尽可能多的细胞类型;然后从中再选择少量的细胞进行深度测序,从而能够帮助解释来自低覆盖度的测序数据并增加检测的精度[3]。
如果细胞分类仍然采用传统的表型特征如形态辨识方法,那么这种“局部采样”的研究策略是有一定的合理性,一方面可以按照明确的可操作的标准从一群具有稳定表型特征的细胞中采集样本,另一方面由样本分析得到结果也是具有相应的代表性。但是,HCA的分类方法是建立在分子水平之上,根据什么标准来采集样本就成了一个问题。例如,胰岛β细胞可以按照Flattop蛋白的表达与否进行分类[5],也可以按照结合β细胞不同膜蛋白的抗体特征进行分类[6],但这些细胞的分类标准在采样之前是无从知道的,只能是按照的传统取样方法来提取胰岛β细胞样品。此外,这些细胞分类结果也很难说具有什么样的代表性,胰岛β细胞按照Flattop蛋白的表达情况分出的亚型与按照膜蛋白的抗体结合情况分出的亚型之间是什么关系?这两种生物标志物中谁更具有代表性?
目前人类细胞图谱分析的主要技术是单细胞转录组测序。不久前,英美科学家利用该项技术,改写了成年人血液中特定的免疫细胞图谱,其中DC细胞(dendriticcell)由4种类型扩大为6种,单核细胞(monocyte)由原来的两种类型变成了4种,还发现了一种新的DC祖细胞(DCprogenitor)[9]。在这项工作中,研究者首先采用了一系列特定的抗体来提取和富集血液中的DC细胞和单核细胞,然后再对这些细胞进行单细胞转录组测序[9]。显然,采用的抗体种类对提取细胞样本具有决定性的作用;如果采用了不同的抗体就可能得到不同的细胞,从而出现不同的测序结果。此外,根据单细胞转录组测序数据,研究者对每个细胞选择了平均个特定的基因进行分析,寻找出关键的分子标志物,然后才确定出新的细胞类型[9]。因此,这些新的细胞类型是建立在个别的分子标志物之上,例如,新的DC细胞亚类是由细胞表达的3个抗原——AXL、SIGLEC1和SIGLEC6来决定的,研究者据此把这些细胞命名为“ASDCs”[9]。显然,如果采用不同的分析技术,很有可能从这些DC细胞的转录组数据中找到不同的生物标志物,导致不同的细胞分类。
“局部采样”策略建立在抽样的合理性以及其分析结果的代表性之上;临床研究通常采用的“随机对照试验”(Randomizedcontrolledtrial,RCT)可以视为这个策略的代表。而通过以上分析可以看到,在分子水平进行“局部采样”策略确定的细胞谱系其实并没有真正的“代表性”,一方面研究者很难建立一个符合科学抽样标准的操作方法,只能是采到什么细胞就分析什么细胞;另一方面研究者只能就分析中获得的特定分子标志物进行细胞分类,看到什么分子标志物就说是什么类型的细胞。
生长性的挑战
HCA面临的一个更大的挑战来自时间尺度:多细胞生物从受精卵分裂到个体发育再到衰老的生长过程中,不停地产生着各种新的细胞类型,同时又有许多细胞类型消失。Sulston正是通过对线虫整个生长过程的持续观察,才描绘出了一个完整的细胞谱系图。当然,HCA的组织者并没有忽视这个挑战,并提出了一些应对的措施,“对模式生物来说,可以通过识别共同的祖细胞类型来构建真正的谱系树”;而对人类来说,“更普遍的可行性做法是,通过检测每次细胞分裂时DNA变异的稳定积累(例如体细胞点突变或者微卫星位点的重复序列扩增)来追踪谱系”[3]。
多细胞生物,尤其是哺乳动物等高等生物的发育过程非常复杂,人们现在利用新的技术常常获得与传统发育生物学观点不一致的结果。例如,研究者从受精后5小时到24小时期间的非洲爪蟾胚胎上提取了近14万个细胞,并进行了单细胞转录组测序;根据个基因表达簇(geneexpressionclusters),研究者分出了69个胚胎细胞类型。此外,他们还发现许多胚胎细胞的状态比以往认为的要早得多[10]。这意味着细胞分化在胚胎发育时期的进程要重新定义。另外两项对斑马鱼胚胎发育时期的单细胞转录组测序研究发现,其早期细胞分化的图谱并不是经典的“树状”,在有些“分枝”点的细胞从其转录图谱来看是处于“多种命运”(multiplefates)的状态下,即处于某个分化路径的细胞可以发生转换而进入到其它的分化路径[11,12]。这种“多种命运”特征有可能使得HCA的组织者提出的策略——“通过识别共同的祖细胞类型来构建真正的谱系树”——难以实现。
更值得注意的是对发育涉及到的时间尺度的理解。传统的发育生物学认为,对哺乳动物而言,个体的绝大部分细胞类型在胚胎发育过程中都已经完成,出生之后其机体主要是一个非发育性的“成长”过程。因此,细胞谱系的研究主要
转载请注明:http://www.haimaahm.com/gyfz/10694.html