在加州大学伯克利分校最近举行的年度会议上,研究人员展示了他们在加速癌症基因治疗和扩展计算机理论领域方面的进展。
加州大学伯克利分校计算机科学系教授David A. Patterson呼吁业界联合使用数百万个基因库来促进癌症治疗。
目前,独立的基因库只有不到10,000条基因信息,其中许多只是基因的部分片段。
“目前,可以说计算机科学用于建立快速而准确的基因管道并促进个性化治疗。
我希望以此来尽快帮助我和我的家人”。
帕特森还透露,目前的研究人员经常在完成实验后删除遗传数据。
计算机科学家大卫·帕特森(David Patterson)希望通过海量数据分析方法来克服癌症基因组问题。
Patterson协助开发了一个名为SNAP的工具,该工具显然提供了更快,更准确的遗传分析,并且也已被癌症研究人员广泛使用。
他指出,然而,仍然需要基准测试工具来改善目前在该领域仍然使用的高度主观的方法。
此外,加州大学正准备斥资6000万美元建立一所新学院,希望在未来十年内在计算机科学方面取得新的突破。
“我们希望开发一种新的作战理论,该理论将远远超出当前的研究范围,并涵盖其他领域中的问题”。
指导这项工作的理查德·卡普(Richard Karp)说。
他指出,“许多现象可以被视为具有计算特征”,如果我们仔细观察活细胞的工作方法,我们可以将其想象为一种信息处理。
经济也是信息处理的活动。
"该校还将在今年5月举办一次学术研讨会,以聚集各界专家,共同研究新理论的可能性。
使用大量数据治疗癌症Patterson的目标是在开发Berkeley子校正中使用大量数据工具,以便它可以导入和分析大量遗传数据以进行癌症研究。
这些工具包包括Spark& mdash;这是一种用于计算机集群的编程语言,它提供的功能类似于Google搜索引擎使用的Map Reduce。
伯克利数据分析系统是基于Spark的开源引擎。
伯克利实验室(Berkeley Lab)的科学家使用算法和计算管道来详细分类大量图像组合,并找出肿瘤的亚型。
它还可以不同程度地分析肿瘤中包含的异质性或组织结构。
然后,计算管道可以使用临床数据对细胞特征进行分类,以预测患者的预后。
同时,它还使用大规模基因组数据,通过海量数据分析来确定每种亚型的分子相关性。
研究人员已经开发出一种可以自动分析大量肿瘤图像以帮助预测对癌症治疗反应的方法。
箭头放大了肿瘤图像的不同区域。
(资料来源:伯克利实验室)当前,海量数据研究面临的挑战是开发一种技术,该技术可以及时,经济高效地解决海量数据问题。
伯克利研究小组正在采取多项行动来应对这一挑战:开发基于统计机器学习的算法;在云中使用多台计算机;并开发筹集资金的技术,以结合人群的力量来帮助回答计算问题。
对于法律和机器来说,这个问题太困难了。
通过这些技术,它将有助于在癌症治疗方面取得突破。
为了实现更快,更经济高效的基因组数据处理,需要一种可以同时使用云机的新基础架构。
当癌症基因的发现和诊断超过这些算法和机器时,也有必要收集每个人的资源和智慧,共同克服挑战。