基于K8s的天基云平台可靠性方案设计
Reliability scheme design of K8s based space-based cloud platform作者机构:中国科学院国家空间科学中心复杂航天系统电子信息技术重点实验室北京100190 中国科学院大学计算机科学与技术学院北京100049
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2024年第45卷第8期
页 面:2548-2554页
学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划基金项目(2022YFF0503900)
主 题:任务冗余 三模冗余 容错 云计算 Docker Kubernetes 天基云
摘 要:针对地面云平台移植到太空中会由于单粒子效应频繁导致其可靠性严重下降的问题,结合具体型号任务,针对K8s云平台研究基于三模冗余的任务容错方案。针对星载计算机功耗受限的问题,在综合考虑功耗和任务实时性的基础上,设计实现2种分别基于传统三模冗余和时间三模冗余的冗余方案;针对核心级别的故障恢复需求和单个卫星搭载节点较少的特点,通过修改K8s源码,实现核心分配功能。相关实验结果表明,该容错机制能有效容忍单粒子翻转导致的错误,支持核心级别的错误恢复和利用核级冗余支持任务容错,同时,具有较小的性能开销。