近日撰文介绍了谷歌的“基准线项目”(Project:Baseline),这是一个新的健康研究项目,将收集1万个参与者的详尽健康数据。这个项目可能为公众带来巨大的好处,但是它也提出了隐私上的挑战。以下为原文内容:

确切地说,“基准线项目”是由Verily推出的,但Verily也就是之前的谷歌生命科学部门,现在划归到谷歌母公司Alphabet旗下,所以你也可以说它是谷歌的项目。

你要申请参加这个项目吗?那你需要佩戴专门的新式手表,监测你的心率,还要把传感器放在你的床垫下,可以分辨出你什么时候是在睡觉。你要在手机上回答所有问题,每年到谷歌的一个合作点(它和杜克大学、斯坦福大学、洛杉矶一个私人诊所合作设立了三个合作点)那里进行血液检测、成像检测,以及基因组扫描等等。

你可能觉得谷歌反正已经知道了关于我们的一切了——从电邮、照片到通讯录,以及你在互联网上的所有足迹(即使偶尔你使用的是Bing,谷歌也会知道)。所以就算你的心率也被谷歌知道了,那又会怎么样呢?

谁是受益者?

但是,在涉及人类的大型科学研究上,你必须要问一些问题:谁会受益?是你吗?还是其他人?还是收集数据的人?

对大量人群进行的健康研究已经取得了医学上的巨大成功。1948年,在马萨诸塞州弗雷明汉镇开启的弗雷明汉心脏研究项目涵盖5209人,并扩大到了他们的子女和孙辈,研究者每两年对他们进行一次体检,来确定吸烟、高血压和运动不足造成心肺问题。1976年开始的护理健康项目研究的是饮食和身体活动对健康的影响,涵盖人数超过25万。

这样研究理应对收集到的数据进行匿名化处理、取消识别标志,同时保留那些有用的信息,比如血糖水平、体重、心率等等,但你的姓名和地址不会留在里面。这个做法在1948年或1976年更容易实现。而在今天的一些项目迭代中,比如使用生物库中的组织样本数据,或者冰岛对每个公民进行基因序列化,要真正做到匿名非常困难。因为像选民登记、人口普查,以及个人健康信息等大型数据库之间的重叠,意味着一个优秀的编程人员通常可以对这些内容进行“去匿名化”处理。这对数据库涵盖的人来说可能很不利,但是对于想要从中获利的人来说,这倒是个好消息。

要注册“基准线项目”,你要签署同意书,表示同意使用你的匿名数据进行研究。也许最终它们会被出售给客户、商业和学术组织。你需要通过谷歌帐户登录“基准线项目”。 Verily的首席医疗官杰西卡·麦嘉(Jessica Mega)说:“同意书本身就描述了正在收集的不同数据类型。重要的是,它确实区分了哪些信息将成为基准线研究的一部分,哪些信息将存在于你的谷歌帐户中。”也就是说,根据目前的协议,“基准线项目”的研究人员不会把你的基因组与你的谷歌邮件进行同步。

可能你觉得自己本来也没有什么网络隐私,已经放弃抵抗了。“基准线项目”的常见问题页面上说,参与者可以看到自己的一些数据,比如实验室数据和调查问卷数据,也有机会看到一些整体结果。也许对于公共卫生来说,这么做是值得的。1万人放弃一点点隐私,给全世界带来莫大的好处。

项目的规模和深度

谷歌已经与斯坦福大学和杜克大学的团队合作了三年,以了解该项目将测量哪些数据。“我们对人口的了解越多,我们可以为科学做得的贡献就越多,”麦嘉说。

首先获得数据的是斯坦福大学和杜克大学——然后再过两年,他们就会向其他合格的医学研究人员开放这些数据(他们将制定自己的道德伦理准则以及同意书)。斯坦福癌症研究员山姆·甘比尔(Sam Gambhir)参与设计了这个项目,他说,“这个研究不是由假设推动的。这是一个收集纵向数据集的研究。”如果一切按计划进行,该项目会获得很重要数据:血液、基因组、尿液、眼泪,以及通过可穿戴设备收集的心脏、睡眠,心智状态活动数据。甘比尔说:“以前没有人对1万人中每一个人进行如此深入的调查。”

这个项目的规模和深度解释了谷歌参与的原因。即使甘比尔自己有这个想法,又以某种方式获得了联邦的资助(有报道称,该项目需要1亿美元资金), “我们还是需要找到像Verily或者Alphabet那样的公司来合作——由于大数据结构的需要,以及参与者和互联网之间互动性的需要。” 他说。

谷歌可以获得什么好处?

谷歌仍然是一个营利性的商业实体。它需要获得一些东西来出售。“谷歌会开发出这个项目需要工具和技术,”麦嘉说。“我们需要创建新工具,比如Verily Study Watch,它里面有很多不同的传感器。我们正在创建平台,不仅可以传递来自传感器的数据,还可以从经典评估和分析评估中获取数据。”

尽管如此,谷歌的实力是在数据上。去年,谷歌的人工智能公司DeepMind与National Health Service达成了一个共享数据的协议,为对方提供一个帮助治疗急性肾损伤的app和人工智能能力。但这个协议在隐私细节上处理不当,谷歌没有获得数据共享的全权同意书,而且还不清楚该公司如何使用患者的数据。“就目前来说,只是获得先发优势,积累关于疾病的知识以及网络。”康奈尔科技研究员朱莉亚·博尔斯(Julia Powles)表示:“谷歌是世界上最强大的公司。他们有经济条件做这种事情,而且事情看起来与公众利益无法区分。”

在那之后呢?人口研究的最棘手的环节之一就是建立样本。即使有了1万人参加这个项目,你如何确保他们就能代表更广泛的世界?有可能男人太多,老人太多,如此等等,你得出的结果用处不大。例如这个项目的“液体活组织检查”等测试,要求受试者必须能够亲临帕洛阿尔托、达勒姆或洛杉矶。这就潜含着地理偏见。“可穿戴设备本身是否会改变个人的行为?有一些问题,将通过对这1万人进行分组来回答。”甘比尔说:“但是,总是有可能会存在一些偏差,有兴趣来参加这个项目的人本来可能就和其他人有所不同。”

谷歌正在小心地建立样本,以便能在产生统计上显著结果。根据定义,参加者终将是谷歌用户。但差不多所有人都已经是谷歌用户了。“你不需要成为他们研究项目的一部分,他们就已经知道很多关于你的东西了。”博尔斯说。“他们已经有了一半的数据了,10年来你在网上搜索的任何健康问题,他们都知道。”

那么你还想参加这个项目吗?当然你这样做你不仅仅会成为研究的对象,你也会是观众。如果你不介意戴上智能手表,睡在设备上,并传输自己的数据,那么你也可能是这个项目的获益者,获得改善健康状况的方法。你既是客户,也是产品。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-07-19 16:22:05
国际资讯 谷歌推出新型传输设备 最大容量是亚马逊的6倍
对于一个大型企业来说,将存储在其内部数据中心的大量数据传输到云提供商的数据中心,是最昂贵和最耗时的。网络带宽是宝贵的资源,即使你有大量的带宽,在WAN上移动PB数据 <详情>
2017-07-19 13:50:00
云技术 Keras之父、谷歌研究员解析深度学习4大技术方向
Keras 之父 Francois Chollet从技术演化的角度,提出未来深度学习的4大走向:模型即程序、超越反向传播和可微分层、自动化的机器学习、终身学习和重复利用模块化子程序。 <详情>
2017-07-19 11:56:20
云技术 谷歌发布最新硬件 帮助客户向云端传输数据
7月19日消息,据VentureBeat报道,在美国联邦快递FedEx的帮助下,谷歌将通过一种旨在加快云迁移的新硬件,帮助公司将数据传输到云计算中。谷歌的Transfer Appliance允许公 <详情>
2017-07-19 10:03:57
云资讯 谷歌计划推出基于云的量子计算服务
尽管对于是不是已经有人打造出真正的量子计算机的说法尚存争议,谷歌却已经在着手推动量子计算机新技术的新应用和工具的开发了。 <详情>
2017-07-19 09:46:53
国际资讯 谷歌FB等巨头越做越大,专家:政府该不该管管呢
南加州大学传播学院创新实验室荣誉退休教授乔纳森。塔普林(Jonathan Taplin)在华尔街日报发表题为“科技巨头能阻挡吗?”的文章。文章称,谷歌、Facebook、亚马逊等科技 <详情>