近期,上海光源Alessandro Sepe研究员、王春鹏博士与瑞士弗里堡大学合作应Small的邀请,撰写了《Synchrotron Big Data Science》,已经在线出版。
该文章所关注的大数据“洪流”问题,是世界上所有同步辐射装置、中子源和XFEL等大科学装置即将面临的严峻挑战。事实上,目前同步辐射装置所产生的跨学科领域、跨实验方法的海量复杂用户数据,最终只有一小部分被用于科学出版。随着产生量的指数级增长,在未来的几年里,同步辐射用户数据必将远超过采用低效率的基于人力的传统数据分析方法的处理能力,届时同步辐射等大科学装置将无法产出与数据量相匹配的更多有意义的科学发现。这个问题在XFELs中更加明显,XFEL装置每年产生和必须分析的数据将多达数十PB。
以同步辐射设施为核心的“超级设施”愿景
该综述提出为了应对这一挑战,需要一个桥连最前沿科学与最先进技术的高度协调的新方案。因此,该综述概述了大数据科学相关技术应用于同步辐射设施的所有最新研究成果,并概述了目前在用的并不多的旨在解决同步辐射大数据挑战的方案。该综述指出,这些研究成果和尝试性方案的有机结合是将同步辐射装置创造成为“超级设施(Superfalicity)”的基石,同步辐射超级设施是同步辐射大数据与人工智能、高性能超级计算、实时远程无人实验和机器人自动化完全集成的结果。Superfacility将加速国家大型科学设施(如上海光源和张江实验室)多学科科学的科学发现和技术进步,具有明显的社会影响。这也是张江实验室上海光源科学中心的目标,Alessandro Sepe研究员及其工作人员正在为中国第一个同步辐射超级设施做出贡献,旨在支持所有关键的国家科学需求。
Small是在国际具有影响力的同行评议刊物(2017年影响因子9.59)。据统计,该篇报告也是同步辐射大数据领域发表的首篇Small论文。
相关链接:https://onlinelibrary.wiley.com/doi/full/10.1002/smll.201802291