两毫升唾液中的祖源与家谱:消费级基因检测突围百亿市场

2021-11-19 21:27 来源:

打印 放大 缩小

在消费级基因检测领域,多家公司开展了用户争夺战,例如通过基因信息与家谱相结合的方式,帮助用户寻找自己的家族迁徙过程,寻找失散的家谱。

参天之木,必有其根;怀山之水,必有其源。当李云泽获得自己的家谱,以及家族的迁徙路线图时,不免有些激动。

将装有两毫升唾液的试管寄给基因检测公司三周后,他不仅获得了与自己遗传有关的多种检测信息,同时也顺利匹配到了家谱与家族的信息。

根据23魔方CEO周坤的预计,其正在进行的家谱数据化工程,有望在2020年覆盖80%的用户家庭,帮助其寻找到失散的家谱。

将纸质家谱进行数据化的工作,已经出现多年,如目前上海图书馆已经存有8000部以上的数据化家谱,读者通过互联网即可以查阅相关信息。

但基因检测公司参与这项工程的关键,则是将基因中的Y染色体与家谱信息“配对”,以实现用户更加便利寻亲认宗。

事实上,从2013年开始进入中国的消费级基因检测公司,已经度过了2015年的爆发期和2017年的洗牌期,现存的公司各有优势,但面对未来的不确定性,则要看能否抓住更多消费者的心理需求了。

显然,帮助用户寻找祖源与家谱,是一个好方式。

遗传因素=健康风险?

以服务对象检测的方式和用途不同,基因检测分为消费级基因检测和临床级基因检测,两者的最大区别在于,后者的诊断报告被医疗机构认可,可作为就诊的辅助材料。

消费级基因检测从2013年进入中国市场,彼时由于中国消费者不熟悉,因此消费级基因检测公司多以“噱头”引起关注,如“天才检测”、“情侣关系检测”等常见于广告中。

2015年,随着消费级基因检测费用的降低,迎来了爆发式增长,大量公司开始出现。而到了2017年-2018年,随着头部企业的出现,行业出现洗牌,不少公司随之消失或裁员。

消费级基因检测包括23魔方、微基因、水母基因、360基因、爱基因等。其中23魔方和微基因已经完成了B轮或以上的融资。

临床级基因检测,包括华大基因(300676,股吧),达安基因(002030,股吧)、华因康基因、安诺优达等。

分析机构易观认为,2022年预计参与消费级基因检测的人数,将由2017年的30万人,增长到5000万人,市场规模达到249.5亿元人民币,占整个基因检测行业市场的37.83%。

如何争夺两百亿规模的市场?消费级基因检测公司进行的第一步,均为基因相关疾病的检测。

以国内消费级基因检测的头部企业——23魔方和微基因比较,23魔方为赛默飞世尔科技(ThermoFisherScientific)的80万+位点芯片进行基因分析。微基因使用的是Illumina基因芯片,可进行120万个位点分析。

无论是哪一种方式,其检测结果在经过几年的发展后都有趋同性。21世纪经济报道记者注意到,两款产品的重点均可以检测某些遗传因素造成的健康风险。其中包括对肾结石、高血压、肥胖症、肺纤维化、痛风、类风湿性关节炎、阿尔兹海默症等进行检测。

需要注意的是,即使检测出了用户潜在的风险,并非意味着一定会在未来患病。

“消费级基因检测公司,往往根据已有的研究文献或临床实证进行分析。”从事医疗卫生研究的火石研究院高级行业分析师魏洪泽对21世纪经济报道记者表示。

以23魔方所检测的迟发性阿尔兹海默症为例,遗传风险的评估方式,是通过分析临床1576名平均发病年龄在70岁的患者,以及1741名同年龄段的健康人群的基因数据和表型数据,并修正性别、生活习惯等其他因素的影响后得到的。同时,其参考包含了1997年-2014年间的6份文献。

“每个月我们都会有6-7个项目上线。”周坤说,除对现有的医学数据进行基因点位的分析外,该公司也通过自建的研究所,推出与用户共同进行的基因检测,如“脂肪肝”项目,共有3309个用户作为测试集合,并根据相关算法构建预测模型进行评估。

魏洪泽表示,消费级基因检测单基因突变的位点,但仅有单基因突变而导致疾病相关的案例并不多,因此依靠此类方式进行疾病的检测,意义并不大。

“我认为消费级基因检测公司的发展,还是以半娱乐化的方式为主。”魏洪泽表示。

用历史和科技手段寻根

在遗传疾病检测趋同的情况下,贴近消费者现实需求,比如寻找祖源和家谱,成为了争夺市场的另一个关键。周坤认为,消费级基因的发展,应该遵循“轻健康”模式,帮助用户更加了解自己。包含健康和身世的信息,而非对复杂疾病的预测。

因此通过基因检测,帮助用户寻找祖源,是这些公司挖掘的另一个市场。

从遗传学角度来讲,人类有23对染色体,其中第23对染色体为性染色体,其中男性为XY,女性为XX。其中Y染色体来自父亲,且只能传给儿子。Y染色体一共有5900万个基因点位。

其中有1000万个点位属于稳定区,在基因研究中,任意两个男性的Y染色体比对,只要找到哪一个点位的突变是相同的,就可以推算出两人在多少年前拥有同一个祖先。

周坤表示,稳定区的基因点位,其遗传突变约每140年发生一次。“这是基因检测公司,进行研究祖源的前提条件”。

周坤预计,当拥有30万样本的时候,可以帮助5%的用户,找到自己的三代以内的亲戚关系。当样本量100万的时候,25%的用户将至少有一对三代表亲。达到500万的时候,所有丢失的孩子,都可以通过基因检测,迅速与自己有血缘关系的亲属进行匹配。据周坤的预测,到2020年23魔方就可以实现500万用户的规模。

就目前情况看,大量的用户可以匹配到30位以上的“五代关系”亲属,即在150-300年前的清朝中后期,其存在一位共同的祖先。

周坤表示,五代主要是用于寻踪,一旦五代关系的数据足够庞大,就可以描绘出自己祖辈的迁徙图谱。

另一方面,则是进行家谱数字化。

21世纪经济报道记者了解到,上海图书馆“数据化”了8565种家谱,包括题名、版本、居地、作者、堂号,而该图书馆的阅览室可看到全文的家谱更是达到了1.4万余种。

23魔方相关人士对21世纪经济报道记者表示,现在所做的家谱数据化,家谱来源一方面是民间搜集,包括搜寻现存的民间家谱,以及查询历史古籍记载;另一方面是和国内外的文化机构进行合作,包括各地图书馆,利用他们现存的家谱进行数据化。

21世纪经济报道记者了解到,与目前的数据化家谱相比,23魔方所做工作的区别在于,除了将家谱数据化之外,更重要的是把家谱和人类Y染色体的突变进行关联。

“因为在中国的历史上,家谱、姓氏和Y染色体都是‘传男不传女\’,做这样的关联之后可以帮助用户寻根寻亲,我们将历史与科技做了结合。”上述人士称。

周坤表示,明朝以来的20万部家谱中,有10万部可以覆盖90%的家庭;而其中的3万部,则可覆盖60%的家庭。截止到2019年5月,23魔方已完成4650个家谱的数据化,覆盖8%的中国人;预计到2019年底,23魔方将完成3.4万个家谱的数据化。

“人与人之间的关系,其实并不遥远。”周坤表示。

10万刘家人

事实上,并不遥远的不仅是人与人的关系,消费级基因检测的另一个突破,是通过大量的用户参与,对历史上某些特定家族“寻踪”。

例如在刘邦家族的基因信息发现中,23魔方借助了将Y染色体突变与历史信息结合的方式。

周坤表示,人类历史战乱和灾害不断,因此目前的所有人类,其祖上曾经有一代或几代,出现了出生人口的大爆发,因为如果只生一个孩子,从数学概率上来讲,很难在战乱和灾害年代繁衍后代,因此只有尽可能多的生孩子,才能使得自己的某个或某几个后代能够成功繁衍生息,使祖辈的Y染色体可以遗传下来,他们将这一现象称为“树状人口大爆发”,即多个男性的Y染色体在同一时期或相近时期,拥有同一名父辈的遗传信息。

截至2018年,23魔方拥有了30万用户的基因组数据。他们对这30万用户中,姓刘的用户基因数据进行分析后,发现了一个有趣的现象,就是刘姓用户中大约10%的人,其Y染色体的单倍群(用来标记数千年前的祖先来源)是F155。

同时对染色体中带有F155的用户进行分析,发现其中有24%的用户姓刘。

尽管刘姓在中国是一个大姓,但根据第六次全国人口普查,其占中国总人口比例仅5.38%,约6460万人。

这就意味着,无论是Y染色体中含有F155的人口,或是带有F155染色体的刘姓人口,其两者间有非常高的关联度。

“同时我们又对F155所有的Y染色体做了研究和分析。”周坤称,“我们发现F155这个单倍群,在距今2300年-2000年间,有连续三次的树状人口大爆发。进一步讲,这意味着在这300年间,曾经连续三代左右的人都生过很多的孩子。其中最集中的就是在距今2300年-2150年间,用F155在当时人口中所占比例乘以当时的新增人口,大概推算出来是10万人左右。另外也有家谱保存下来,可以通过历史文献推算校验。”

从逻辑上推断,一个家族能在150年间,相当于6-7代间生出10万的后代,意味着每一代每个男性都要生5-7个男性后代。因此产生的问题是:在距今2300年前,谁有能力繁衍这么多后代?

周坤称,“我们进一步将这些信息与历史记载相对比,发现这三次的人口大爆发刚好跟汉高祖刘邦、汉景帝刘启、光武帝刘秀在位的时间吻合。因此我们推测F155这个单倍群是刘邦或者是刘邦父亲的DNA标记。”

规模用户带来新机会

而对于消费级基因检测的未来,周坤认为,是从简单有趣,到越来越有用的过程。

如目前23魔方的6个用户,已经找到了亲生父母。“通过基因检测,我们帮他们匹配到了远方的堂哥或表姐,从而间接地找到了亲生父母”。

但周坤也坦言,目前40万人的用户规模,尚无法通过检测做出更多的疾病预测。以糖尿病为例,其病因非常复杂,目前无论是哪一类的基因检测,对其基因的破解是有限的,因此对于此类复杂的疾病,尚无介入检测的可能。

但他认为,应该畅想当用户规模在500万-1000万的时候,当有了更大规模的用户数据,届时消费级基因检测也能够承担更多的医学检测。

周坤认为,随着技术的发展,基因检测成本将越来越低,由于检测的底层技术趋同,消费级和临床级基因检测的边界会越来越模糊。

但他也提醒,目前的消费级基因检测,相当于对人体的“出厂配置”进行检测,而人体会受环境等多种后天因素的影响,因此对“出厂配置”的检测不代表最终的结果。

不过,需要注意的是,随着用户规模的不断增长,基因数据有望成为消费级基因公司的核心资产。

若将美国作为对比,2012年末,全美有30万人拥有自己的基因组数据。2017年末,这一数量已经陡然增长至1200万,人口渗透率在五年时间内从0.1%提升到3.75%。

2017年末,中国拥有基因组数据的人数为30万,如果以美国的增速为计算,到2022年有超过5000万中国人拥有基因数据。

在魏洪泽看来,消费级基因公司除了在疾病检测、祖源、家谱方面继续寻求突破外,用户数据的积累一旦突破了几百万到几千万,还将有更多的应用领域。

例如以基因检测作为精准诊断、精准医疗的前提,研发出更适合患者的用药。此外,以基因检测作为指导慢性病患者合理用药的依据,可以减少大量的不必要医疗消费,从而提高国家的医保经费的使用效率。

事实上,在这一方面已经有了先例——2015年6月,北京朝阳医院开设了精准用药门诊,组建药师团队,在门诊为患者提供个性化精准用药方案,并建立基于中国人慢病用药的药物基因组学数据库。

根据2018年上半年精准用药门诊抽样数据显示,504名患者诊后例均减少用药0.5种,精简药物最多者由原来的23种药物减少到6种,门诊精准用药服务平均每月为患者节省药费367.3元。

“由于慢性病的部分用药纳入了国家医保,则可以节省大量的国家医保开支。”魏洪泽说。

进一步讲,从疾病的检测方面来说,消费级基因的发展虽然有天花板,即单基因点位的检测,无法与全基因组测序相比,但“大量的用户数据”累积则是未来最大的不确定因素,这也是资本愿意持续介入的关键。

责任编辑:互联网