随着科技的飞速发展,科研范式正在经历前所未有的变革。科研信息化基础平台作为现代科学研究的基石,其重要性日益凸显。在第五科研范式——智能化科研的推动下,科研信息化基础平台正面临着新的挑战与机遇。
中国科学院计算机网络信息中心的首席科学家廖方宇及其团队,在最新发表的研究中深入探讨了第五科研范式下新型科研信息化基础平台的架构与关键技术。该研究指出,随着科研范式的演进,科研信息化基础平台必须不断升级,以满足科学研究对算法算力、网络传输能力及数据存储与管理能力的新需求。
科研信息化基础平台集成了网络、数据和计算资源,为科学研究提供了强有力的支撑。从早期的经验科学到理论科学,再到计算科学和数据密集型科学,科研范式的不断变革推动了科研信息化基础平台的持续发展。如今,随着智能化科研范式的兴起,科研信息化基础平台需要更加注重智能算力、大规模数据存储和高吞吐读写、跨域软硬件一体化调度、垂直领域大模型及面向人工智能的高质量数据资源等方面的技术突破。
智能算力是第五科研范式下的核心要素之一。廖方宇团队提出,新型科研信息化基础平台应采用开放式和可扩展的架构,融合多种类型的智能芯片计算资源,形成软硬件齐备的验证环境。平台还需构建可定制的AI、大数据处理和并行计算环境,支持科学研究和技术开发的全生命周期需求。
在数据存储方面,随着科学数据量的爆炸性增长,传统存储系统已无法满足新科研范式下的需求。新型科研信息化基础平台需要实现PB级数据存储和高吞吐读写,采用分布式全闪存储节点和RDMA及NVMe-oF技术,提升存储系统的聚合带宽和IOPS,满足大模型训练的超高IO性能要求。
跨域软硬件一体化调度也是新型科研信息化基础平台面临的重要挑战。在第五科研范式下,科学数据需要在广域网上进行高效传输和处理。为此,平台需要构建灵活的硬件数据平面与软件化、智能化的控制平面,实现数据、网络和算力的智能调度和协同。
垂直领域大模型是第五科研范式下的另一个重要方向。这些模型专注于解决特定科研问题,具有显著的定域性和端到端特性。构建垂直领域大模型需要高质量的带标注领域训练数据集和专门设计的人工神经网络结构。新型科研信息化基础平台应提供这些资源,支持垂直领域大模型的训练和推理。
最后,面向AI的高质量数据资源是新型科研信息化基础平台不可或缺的一部分。高质量的科学数据是自然规律的真实体现,对于AI系统理解、处理科学问题具有重要意义。新型科研信息化基础平台需要完善科学数据治理机制,提升科学数据规范整编、可信流转和关联化组织的水平,为智能化科研范式提供高质量数据供给。
廖方宇团队的研究为新型科研信息化基础平台的发展提供了重要参考。随着技术的不断进步和创新,新型科研信息化基础平台将不断推动科研范式的变革,为科学研究的深入发展提供有力支撑。