有必要保护基因隐私吗? 张帆,阿森纳/战地4 举个栗子 Home · Griffan/FASTQuick Wiki · GitHub 这是一个基因组测序数据的质检工具,通过你的基因测序数据,哪怕很少(1~2X 的覆盖度,只需要知道 10,000 个位点或者更少),就可以在 5 分钟内推测你的祖源来自哪里,推断是否有样品的标记的错误,样品污染等等其它这里不详细介绍的功能。 你可以看到,上面这个图每一种颜色的点就是一个世界上的民族,下面有对应的三个字母的缩写。比如 CEU 就是欧洲人,FIN 就是芬兰人,CHB 就是中国北京汉族,JPT 是日本东京,TSI 是意大利托斯卡纳等等。图中的两个蓝色的点就是我当前测试的两个样品。除了样品的上面提到的 10000 个位点信息,这个工具 FASTQuick 不知道的其它任何信息,但是最后它成功的把 HG00553 这个样品放到了波多黎各的位置处。 上面这个分析的分辨率受之前已有的数据点的采样信息的详细程度所限。以上是用的千人基因组的数据做的示例。这是基因组分析领域非常常规的分析,只不过我的方法这里用的信息量非常少,速度快一点。 举这个例子是想说明,信息就在数据里面,信息本身也是媒介和桥梁。你能怎么搭,就有怎么用的方法。 试想,如果我能收集到更多维度的 feature, 比如身高,比如姓氏,比如纬度,比如,作息时间等等,我们就能够提供更多信息的预测或者判断。看这个项目https://genesforgood.sph.umich.edu/ 其中有来自各地的志愿者参与的各个维度的信息收集的调查,并且是有时间维度的信息采集。 当样本数据足够大的时候,理论上,最后能够找到特定样品的信息(对特定的 statistic 进行 deconvolution 不是不可能)。不过通常大家现在主要关注的是跟疾病健康相关的问题。 现在市场上很有名的 23andme,ancestry 等等著名的基因检测服务公司,实际上已经把入门价格做的很低了。他们赚的钱不一定来自于直接对客户的服务。更重要的是,大型的制药厂,需要这些样品信息去进行新药的研发。人群的基因信息,就是新时代的金矿。 那么,对于普通人的生活,有什么影响呢?设想,我们说一家健康保险的公司(其实保险公司都已经在做这个信息收集了),它在拿到你的基因信息之后完全有能力对你进行未来的健康风险评估,可以调整你的保费,甚至可以拒绝承保(这里应该有法律约束)。那么你的信息就已经在影响你的生活了。那么更进一步,1997 年有一部科幻电影 GATTACA,就完全推广了一种可能的社会秩序,完全取决于你的基因品质的社会秩序。 然而,不同于你的网络上的信息,或者你的犯罪记录等等那些记录在磁盘或者纸张等媒介的信息,基因信息的媒介就是你自己,不可销毁。 知乎用户,一流团队招募蛋白结晶technician;informatics technician; 首先要明确一件事,基因序列是比指纹还要更危险的精准确认身份的信息,这个身份的确认不止于你一个人,可以追溯到你的直系和旁系。基因和指纹一样可以确定你是谁,ID,来自哪个家庭,你家门牌号,你的 SSN 号,驾照信息,在中国就是你的社保号,你的配偶,子女,亲属,所有信息都可以依据你的基因序列确认,确认了你这个人,当然就确认了你周围所有的信息。但在指纹的功能之外,你的基因序列还可以确认你潜在的疾病风险,你的遗传病,给各种诈骗及其他类型的犯罪提供了非常充裕的信息量,甚至还能帮你找到你一辈子都不知道存在的亲生爹娘兄弟姐妹...也因此,你的基因序列还可以出售给一切愿意打探你这些信息从你身上图利的人,可怕 BO? 基因保护目前最大的问题就是未经本人充分知情同意就测序人家的基因来做研究,做各种乱七八糟的事情。充分的知情同意就是被测序人要清楚知道 test 的风险,个人基因序列被掌握后可能的一切风险并且签字同意。这一步是尊重基因隐私最基本,最重要的一步,目前尚做不到。 后面还有严格监管测序单位严禁未经允许的出售基因信息的行为,比如某公司利用自己为客户测序的数据库做科研出售...这些客户得知自己的信息被人研究了还卖了钱,不知心情如何... 第一步之后,就有很多措施亟待开展,政府和国家的监管,检查制度和信息安全管理等。举个简单例子来说,如果美国人掌握了某国官员们的全序列基因信息会怎样呢?嗯,想象空间太大了.. 编个剧本写部电影都够用。 查看知乎原文