斯隆数字巡天计划分解的多达15TB的可查找数据使天文学家需要在研究项目上少花数年的时间。在20世纪90年代,天体物理学家AlexSzalay博士和计算机科学家JimGray博士集进行了这样一项头脑风暴:如果数据库可以变为一个数据望远镜,这个望远镜可以展开数据挖掘不会怎么样?如果可以权利用于这样的数据,天文学领域将再次发生完全的转变。
随着时间的流逝,这个点子变为了斯隆数字巡天(SDSS),这是一个由数十家机构的数百名科学家构成的国际合作的组织。斯隆数字巡天的目标是用于坐落于新墨西哥州ApachePoint天文台的专用2.5米望远镜对星空编成索引。配有1.2亿像素摄像头的望远镜可摄制多达四分之一的夜空,一次摄制1.5平方度(1.5squaredegreesatatime)。
该项目用于MicrosoftSQLServer作为后末端数据库。从1998年到2009年间,望远镜同时在光学模式和光谱模式下运营。斯隆数字巡天于2009年停止使用光学照相机,但望远镜仍之后以光谱模式展开观测活动。数据可通过SkyServer数据库(在线门户网站)公开发表提供。
如今,该数据库享有15TB可查找的公共数据集,以及约150TB的额外完整文件和校准文件。将恒星数字化约翰霍普金斯大学文理学院和惠廷工程学院的彭博物理学、天文学和计算机科学卓越教授Szalay说明说道:“在传统的天文学中,项目的点子是由天文学家明确提出来的,但首先,他们必须寻找目标。”在斯隆数字巡天还没正式成立之前,这是一个耗时的过程。
天文学家必需写出议案并自由选择大面积的空域来探寻有可能的目标,对点子展开测试。如果议案被拒绝接受,天文学家就可以购票用于望远镜的时间。Szalay说道:“在长达半年的时间里,你只要有空就不会去山顶的天文台。
如果你很幸运地,正逢那天天晴且无云,你就能将一些数据带回去。”Szalay说道,自此,天文学家有可能要花上几个月的时间对这些数据展开图像处理,或许不会找到几百个目标。一旦有了目标,天文学家将建议用于更加大型的望远镜,详尽探寻这些目标。
在取得用于望远镜的时间并搜集数据后,天文学家将花费几个月的时间来展开数据修改。Szalay说道:“经过宽约两年半的时间,你才能确实测试自己的点子。
”斯隆数字巡天转变了这一切。天文学家现在必需自学如何在SQL中撰写查找,但这样做到可以很大地减缓研究速度。
Szalay说道:“现在你可以转入网站,将这个虚拟世界望远镜指向天空的任何部分——你不必须做到任何数据修改——只需自由选择你想的目标,在五分钟之内,你就可以对准天空后用更大的望远镜来观测(目标)。这使周期减短了数年。”在斯隆数字巡天还没有正式成立之前,天文学家享有将近20万个星系的数据。
如今,斯隆数字巡天享有多达2.2亿个星系的数据。Gray是微软公司的技术研究员,他因为对数据库和事务处理研究的开创性贡献而于1998年取得图灵奖,他与Szalay和斯隆数字巡天进行了密切合作,直到他在2007年进游艇航行时下落不明。Gray是SkyServer和TerraServer-USA的主要贡献者。
(SkyServer和TerraServer-USA于2016年重开,沦为MicrosoftResearchMaps)。Gray和Szalay研发了空间索引技术,以便在斯隆数字巡天副本上展开数据挖掘。Szalay认为,他和Gray创立的空间索引将沦为MicrosoftSQLServer的一部分。
“Szalay及其团队在建构应用程序研究星系的关联特性时找到,其统计分析中的许多模式都牵涉到到各种各样的任务,这些任务在数据库引擎内部的继续执行效果要比外部好,即在平面文件上继续执行效果更佳”,微软公司的副总裁JosephSirosh和微软公司数据集团的首席软件工程师RimmaV.Nehme这样写到。“MicrosoftSQLServer使他们可以用于多个CPU,多个磁盘和大型主存储器对简单的谓词展开高速的顺序搜索。它还不具备简单的索引和数据相连算法,相比之下高于针对平面文件(flatfile)的手写程序。
由于有了简单的查找优化器(queryoptimizer),多日的批处理文件被能在几分钟内运营的数据库查找所代替。”大规模的天文学斯隆数字巡天也在一定程度上使天文学亲民化。
在该项目还没有正式成立之前,只有一流的科学家和天文学家才能用于望远镜和其它仪器来搜集数据。其他科学家不能将就用于他们所获取的数据。Sirosh和Nehme认为,在过去14年中,SkyServer早已记录了多达16亿次网络页面,并产生了科学找到,如数千颗小行星的测量,外部银河系拆分历程的地图。
斯隆数字巡天获取的数据为5,800篇论文和245,000多次提到获取了反对。Szalay说道,世界上约有三分之二的专业天文学社区每天都在用于SkyServer。如今,科学家和天文学家开始利用机器学习和神经网络对大量由斯隆数字巡天获取的数据展开处置,以帮助已完成从图像中清理噪点等任务。
斯隆数字巡天项目还在展开中,但迅速就不会有继任者。大型综合巡天望远镜(LSST)目前正在智利修建。该计划就是利用广角巡天的反射式望远镜,从2022年1月开始,间隔几个夜晚摄制整个可观测的天空,如此持续10年。
图像将由一个32亿像素的CCD光学照相机记录下来。它的尺寸为5.5英尺×9.8英尺(大约等同于小型汽车的大小),是有史以来仅次于的数码相机。大型综合巡天望远镜的科学咨询委员会的成员Szalay回应,大型综合巡天望远镜将需要在短短3个夜晚的时间里已完成斯隆数字巡天要花上8年才能已完成的任务。
它将分解一个约60PB的数据库。
本文来源:welcome壹家彩票-www.tfdy5.com
地址:四川省成都市北碚区同大大楼444号 电话:0898-08980898 手机:14498717261
Copyright © 2002-2024 www.tfdy5.com. welcome壹家彩票科技 版权所有 ICP备案编号:ICP备37580045号-4