留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

面向高频动态到达的天文卫星机遇目标任务规划方法

王旭航 吴海燕

王旭航, 吴海燕. 面向高频动态到达的天文卫星机遇目标任务规划方法[J]. 空间科学学报. doi: 10.11728/cjss2025.05.2024-0125
引用本文: 王旭航, 吴海燕. 面向高频动态到达的天文卫星机遇目标任务规划方法[J]. 空间科学学报. doi: 10.11728/cjss2025.05.2024-0125
WANG Xuhang, WU Haiyan. Scheduling Methods for Astronomical Satellite Target of Opportunity Tasks with High-frequency Dynamic Arrivals (in Chinese). Chinese Journal of Space Science, 2025, 45(5): 1-11 doi: 10.11728/cjss2025.05.2024-0125
Citation: WANG Xuhang, WU Haiyan. Scheduling Methods for Astronomical Satellite Target of Opportunity Tasks with High-frequency Dynamic Arrivals (in Chinese). Chinese Journal of Space Science, 2025, 45(5): 1-11 doi: 10.11728/cjss2025.05.2024-0125

面向高频动态到达的天文卫星机遇目标任务规划方法

doi: 10.11728/cjss2025.05.2024-0125 cstr: 32142.14.cjss.2024-0125
基金项目: 中国科学院空间科学战略性先导科技专项资助(XDA15040100)
详细信息
    作者简介:
    • 王旭航 女, 1999年2月出生于河北省石家庄市, 现为中国科学院国家空间科学中心研究生, 主要从事卫星智能运控等方面的研究. E-mail: wangxuhang22@mails.ucas.ac.cn
    通讯作者:
    • 吴海燕 女, 1970年9月出生于江苏省南京市, 硕士研究生导师, 现为中国科学院国家空间科学中心正高级工程师, 主要从事卫星地面应用系统、卫星智能运控技术等方面的研究. E-mail: why@nssc.ac.cn
  • 中图分类号: V474

Scheduling Methods for Astronomical Satellite Target of Opportunity Tasks with High-frequency Dynamic Arrivals

  • 摘要: 以巡天设备每天将探测到数以万计的变源天体以及对变源天体的观测需求增长为背景, 形成了由高频动态到达的机遇目标(ToO)及其后随观测任务组成的长序列任务规划问题. 该问题具有观测事件随机性、数据获取高时效性、可选择性多和约束复杂的特点, 常被视为NP(非确定性多项式)难题, 因此获取监督学习的标签数据不易. 而针对采用无监督学习的深度强化学习(DRL)方法求解长序列任务规划问题时, 卫星作为智能体难以快速收敛至全局最优策略. 为此本文借鉴局部注意力(LA)机制的思想对指针网络(PN)进行改进, 提出局部注意力指针网络(LA-PN)算法. 该算法通过引入时间窗口的方式, 使模型专注于对当前决策有重要影响的序列部分, 减少了无效探索. 通过仿真结果对比分析, 验证算法的收益性、实时性和泛化性.

     

  • 图  1  二维坐标系中卫星望远镜的视场

    Figure  1.  FOV of satellite telescope in two-dimensional coordinate system

    图  2  LA-PN算法模型结构

    Figure  2.  LA-PN algorithm model structure

    图  3  LA-PN算法模型训练总收益收敛曲线

    Figure  3.  LA-PN algorithm model training total rewards

    图  4  模型的推理结果 (红色点表示观测任务时间窗口, 编号表示规划结果任务执行顺序, 蓝色五星表示执行任务前需要调姿)

    Figure  4.  Schematic diagram of the inference results of the model (Red dots represent the time window of observation tasks, numbers represent the sequence of planned result tasks execution, and blue stars represent the need for attitude adjustment before task execution)

    图  5  LA-PN与其他算法各项指标对比

    Figure  5.  Comparison of various indicators between LA-PN and other algorithms

    图  6  算法泛化能力对比

    Figure  6.  Comparison of algorithm generalization ability

    表  1  卫星轨道参数

    Table  1.   Satellite orbit parameters

    参数 取值
    轨道高度/km 7012.2172
    偏心率 0.0002961
    轨道倾角/(°) 28.863529
    升交点赤经/(°) 287.41907
    近地点幅角/(°) 299.01349
    平近点角/(°) 292.49033
    下载: 导出CSV

    表  2  LA-PN算法训练参数设定

    Table  2.   LA-PN algorithm training parameter settings

    参数名参数值含义
    Batch_size128批样本数量
    D5滑动窗口大小
    lr_actor$ 1\times {10}^{-5} $Actor网络的学习率
    lr_critic$ 5\times {10}^{-4} $Critic网络的学习率
    hidden_size512隐含层维度
    下载: 导出CSV

    表  3  数据集中每个任务的元素设定

    Table  3.   Element settings for each task in dataset

    元素 设定
    $ {T}^{\mathrm{w}\mathrm{s}} $ [0 s, 4000 s]
    D [600 s, 700 s]
    $ {T}^{\mathrm{w}\mathrm{e}} $ [$ {T}^{\mathrm{w}\mathrm{s}} $+700 s, $ {T}^{\mathrm{w}\mathrm{s}} $+800 s]
    A [$ -{5}^{°},{5}^{°} $]
    P [0.1, 0.9]
    下载: 导出CSV

    表  4  周期内算法平均执行时间对比

    Table  4.   Comparison of average execution time of algorithms within a cycle

    算法 $ T/(\mathrm{s} \cdot {\mathrm{e}\mathrm{p}\mathrm{o}\mathrm{c}\mathrm{h}}^{-1}) $ $ {R}_{\mathrm{r}\mathrm{a}\mathrm{t}\mathrm{e}}/(\mathrm{\%}) $
    LA-PN 0.396318
    PN 0.308217 273.83
    MHA-PN 0.297375 37.21
    ACO 13.027278 192.80
    下载: 导出CSV
  • [1] 李大林. 天文观测卫星任务规划模型与方法研究[D]. 哈尔滨: 哈尔滨工业大学, 2020

    LI Dalin. Research on Observation Scheduling Model and Method of Astronomy Satellite[D]. Harbin: Harbin Institute of Technology, 2020
    [2] 徐子羚, 刘玉荣, 冯准. 基于遗传算法的Tiling覆盖策略天文卫星任务规划[J]. 空间科学学报, 2022, 42(2): 321-328 doi: 10.11728/cjss2022.02.210112006

    XU Ziling, LIU Yurong, FENG Zhun. Mission planning for astronomical satellite based on genetic algorithm under tiling coverage strategy[J]. Chinese Journal of Space Science, 2022, 42(2): 321-328 doi: 10.11728/cjss2022.02.210112006
    [3] 向尚, 陈盈果, 李国梁, 等. 卫星自主与协同任务调度规划综述[J]. 自动化学报, 2019, 45(2): 252-264

    XIANG Shang, CHEN Yinguo, LI Guoliang, et al. Review on satellite autonomous and collaborative task scheduling planning[J]. Acta Automatica Sinica, 2019, 45(2): 252-264
    [4] 吴海燕, 孟新, 张玉珠, 等. 面向天文观测的空间科学卫星任务规划方法研究[J]. 空间科学学报, 2013, 33(5): 561-568 doi: 10.11728/cjss2013.05.561

    WU Haiyan, MENG Xin, ZHANG Yuzhu, et al. Research on the planning method for astronomy observation mission[J]. Chinese Journal of Space Science, 2013, 33(5): 561-568 doi: 10.11728/cjss2013.05.561
    [5] 黄跃, 屈进禄, 贾淑梅, 等. HXMT卫星长期任务规划算法[J]. 空间科学学报, 2017, 37(6): 766-772 doi: 10.11728/cjss2017.06.766

    HUANG Yue, QU Jinlu, JIA Shumei, et al. Long-term planning algorithm for the HXMT mission[J]. Chinese Journal of Space Science, 2017, 37(6): 766-772 doi: 10.11728/cjss2017.06.766
    [6] 尹晓丹, 白萌, 李卓恒. 超额订购下天文卫星短期任务的聚类规划方法[J]. 南京航空航天大学学报(英文版), 2023, 40(3): 307-322

    YIN Xiaodan, BAI Meng, LI Zhuoheng. Clustering-scheduling methods for oversubscribed short-term tasks of astronomical satellites[J]. Transactions of Nanjing University of Aeronautics and Astronautics, 2023, 40(3): 307-322
    [7] 王海蛟. 基于强化学习的卫星规模化在线调度方法研究[D]. 北京: 中国科学院大学(中国科学院国家空间科学中心), 2018

    WANG Haijiao. Massive Scheduling Method Under Online Situation for Satellites Based on Reinforcement Learning[D]. Beijing: National Space Science Center, Chinese Academy of Sciences, 2018
    [8] 马一凡. 基于深度强化学习的敏捷成像卫星任务规划方法[D]. 杭州: 浙江大学, 2021

    MA Yifan. Agile Imaging Satellite Task Planning Method Based on Deep Reinforcement Learning[D]. Hangzhou: Zhejiang University, 2021
    [9] 赵世杰. 基于强化学习的卫星自主任务规划方法研究与实现[D]. 上海: 华东师范大学, 2024

    ZHAO Shijie. Research and Implementation of Satellite Autonomous Task Planning Method Based on Reinforcement Learning[D]. Shanghai: East China Normal University, 2024
    [10] 刘晓路, 许英杰, 贺仁杰, 等. 面向卫星的在轨服务任务规划方法[J]. 国防科技大学学报, 2020, 42(5): 143-150 doi: 10.11887/j.cn.202005020

    LIU Xiaolu, XU Yingjie, HE Renjie, et al. Satellite-oriented on-orbit service mission planning method[J]. Journal of National University of Defense Technology, 2020, 42(5): 143-150 doi: 10.11887/j.cn.202005020
    [11] 曾而康, 吴海燕, 冯准. 天区机遇目标空间探测任务规划算法[J]. 空间科学学报, 2023, 43(2): 361-368 doi: 10.11728/cjss2023.02.220225020

    ZENG Erkang, WU Haiyan, FENG Zhun. Sky area target of opportunity mission planning method[J]. Chinese Journal of Space Science, 2023, 43(2): 361-368 doi: 10.11728/cjss2023.02.220225020
    [12] CHUNG J, GULCEHRE C, CHO K, et al. Empirical evaluation of gated recurrent neural networks on sequence modeling[OL]. arXiv preprint arXiv: 1412.3555, 2014
    [13] LUONG T, PHAM H, MANNING C D. Effective approaches to attention-based neural machine translation[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon: ACL, 2015
    [14] BELLO I, PHAM H, LE Q V, et al. Neural combinatorial optimization with reinforcement learning[C]//Proceedings of the 5th International Conference on Learning Representations. Toulon: OpenReview. net, 2017
    [15] 赵凡宇. 航天器多目标观测任务调度与规划方法研究[D]. 北京: 北京理工大学, 2015

    ZHAO Fanyu. Mission Scheduling and Planning of Multi-Target Observations for Spacecraft[D]. Beijing: Beijing Institute of Technology, 2015
  • 加载中
图(6) / 表(4)
计量
  • 文章访问数:  222
  • HTML全文浏览量:  32
  • PDF下载量:  9
  • 被引次数: 

    0(来源:Crossref)

    0(来源:其他)

出版历程
  • 收稿日期:  2024-10-08
  • 修回日期:  2025-03-08
  • 网络出版日期:  2025-03-10

目录

    /

    返回文章
    返回