运行于集群上的计算服务,为企业提供集群的计算资源管理及分配的功能,LiCO支持多种分布式文件系统,比如NFS, Lustre,GPFS,GlusterFS等,提供基于WEB的、易用的共享文件管理系统,
用户共享空间的隔离,集群管理员使用web平台来管理集群,HPC终端用户使用web平台来提交和管理HPC作业, AI终端用户使用web平台进行AI模型的训练
从事Lico的各功能api的开发,包括集群的节点监控、调度器管理、作业管理、各种分析报告的展示与下载、集群各指标告警设置及通知、用户训练模型的发布功能等
独立负责作业调度器openpbs与Lico的集成,对调度器使用GPU或者MIG训练作业进行了各种调试开发;此外还负责内部obs(open build service)平台的维护运行,用来提供Lico项目代码的rpm打包功能