国内高校规模最大云上智算平台上线
来源:光明日报
日期:2023-06-28 10:24:17
我国高校规模最大云上智算平台CFFF(Computing for the Future at Fudan)27日在复旦大学上线。这台为发现和解决复杂科学问题而建的科研“超级计算机”由复旦大学与阿里云等共同打造,以先进的公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练——这在国内高校中尚属首例。
“CFFF平台由面向多学科融合创新的AI for Science智能计算集群‘切问’一号和面向高精尖研究的专用高性能计算集群‘近思’一号两部分组成。”复旦大学人工智能创新与产业研究院院长漆远介绍,基于百G高速数据传输网和阿里云全球领先的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,部署在复旦校内的“近思”一号和托管在1500公里外阿里云乌兰察布数据中心的“切问”一号连成了一台真正意义上的“超级计算机”,复旦四校区的所有实验设备都能高速接入,做到异构算力统一管理,计算任务统一调度,满足不同应用场景下的科学智能研究与应用需求。位于“东数西算”节点上的阿里云乌兰察布数据中心,通过飞天智算平台的公共云模式对外提供智能计算服务。
漆远表示,有赖于公共云模式,跑在CFFF平台上的项目可享受到超千卡并行的智能算力,千卡并行的有效算力达到行业领先的92%,可拓展性达到万卡,万卡并行有效算力也可达90%。同时,公共云更加低碳和绿色。阿里云绿色数据中心技术结合乌兰察布当地天然的气候优势,CFFF平台可实现平台年平均PUE小于1.2,每年节省总电力超过2000兆瓦时,年均节碳量达1500吨。
据悉,CFFF平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内。
“基于CFFF平台的千卡并行智能计算只用一天就完成了训练。这在传统的计算平台很难做到。”李昊说。
据了解,这也是CFFF平台上孕育出的第一个大模型。复旦大学校长金力表示,复旦希望基于CFFF平台建成一批具有世界级影响力的科学大模型,如生命科学大模型、材料科学大模型、大气科学大模型、集成电路大模型等。
另据了解,CFFF平台还将持续扩大其算力规模,并向复旦校外的科研机构、高校、医院、高科技企业等开放。当天,面向全球科研人员的首届世界科学智能大赛正式启动,大赛设置生命科学、量子化学等五大赛道,CFFF平台将为参赛队伍提供免费训练算力,并以更普惠的算力长期支持部分科研项目。