针对可重复使用运载器在模型不确定性影响下的姿态跟踪控制问题,提出了一种基于自适应固定时间强化学习的优化反步控制方法。首先,设计了一种基于双曲正切函数的固定时间控制器,避免了传统分数阶固定时间控制器中存在的奇异问题;其次,针对系统模型不确定性,采用径向基函数神经网络进行逼近,并通过引入串并联估计模型,提升了估计精度和收敛速度;在此基础上,构建“辨识器-执行器-评价器”框架,设计了改进权值自适应更新律,完成了对哈密顿-雅可比-贝尔曼方程的求解,实现了跟踪效果与控制输入的平衡;最后,基于李雅普诺夫理论证明了所提方法的固定时间稳定性,并通过数值仿真验证了算法的有效性。
针对多弹在三维空间按预设时间同时攻击静止目标的制导场景,提出了一种满足固定时间收敛的协同制导律。首先,建立了导弹三维制导恒速模型以及制导误差变量;然后,设计了由固定时间一致性控制器和误差收敛控制器组成的输入变量,构建了满足时间约束的一阶多智能体系统;接着,由系统状态方程推导出比例导引项加时间协同项的协同制导律;最后,通过数值仿真验证了所提制导律的有效性。
针对运载火箭飞行过程视觉遥测与对地目标识别中,感知系统受高频力学振动和复杂光照影响易产生强噪声干扰,且箭载嵌入式平台功耗与算力资源受限导致高精度模型难以部署的问题,提出了一种基于层级敏感度感知的自适应插值量化方法。首先,构建基于数据驱动的量化敏感度评价指标,通过分析模型各层在量化噪声下的特征漂移程度,识别出影响精度的瓶颈层与非敏感层;其次,设计轻量级Alpha控制器,与主干网络联合训练,使其能够根据输入图像的纹理特征实时生成各敏感层的动态插值系数;最后,建立静态量化参数与动态统计值的加权插值机制,在推理阶段利用静态先验对动态参数进行在线校正,以抑制离群值波动。仿真结果表明,该方法在YOLOv8s模型上实现了推理速度与检测精度的有效平衡,在保持低计算开销的同时,显著提升了模型在复杂航天环境下的鲁棒性,适用于箭载算力受限平台的实时视觉监测与目标识别任务。
针对无人机在复杂未知环境下的路径规划中,传统人工势场法(APF)易陷入局部极小值和参数敏感,以及深度强化学习在训练初期收敛慢、样本效率低等问题,提出一种融合近端策略优化(PPO)与改进势场的自适应路径规划算法(PPO-APF)。该算法采用分层架构:上层利用PPO网络根据无人机局部感知信息,自适应输出斥力系数、起效距离及速率调节系数;下层基于引入目标距离因子和运动学约束的改进APF模型生成飞行指令。同时,设计包含路径平滑度与参数稳定性的复合奖励函数以抑制路径抖动。仿真结果表明,在障碍覆盖率约22%的复杂场景中,PPO-APF规划成功率可达97.33%,显著优于改进APF(53.67%)与纯强化学习的PPO(85%)。该算法具备显著“冷启动”优势,能使无人机自主习得狭道减速穿越和提前避让等策略,有效结合了深度强化学习的自适应性与势场法的稳定性。
针对在现有多模态目标跟踪任务中,由于多源模态信息融合方式不完备和交互过程低效所导致的性能受限与计算冗余问题,提出了多模态目标跟踪的星适配器方法(SAMT)。该方法利用多级的交互结构,引入更为高效的星运算算子,实现多源模态信息在特征空间中的充分且紧凑融合;同时,探究多源模态的特征在网络不同层之间的相似性变化规律,设计了一组高效的适配器架构参数。实验结果表明,该方法相较于现有方法,在RGBT234和LasHeR数据集上的精确率与成功率都有一定提升,并且融合网络的计算量降为24.87%,参数量降为48.74%。
针对无人机在未知动态三维环境中导航效率受限以及易陷入局部极小值的问题,提出一种融合时序动态势场预测与自适应评价机制的改进DWA-APF路径规划算法。首先,构建基于速度-加速度估计的时序动态势场模型,通过预测障碍物时空轨迹实现主动规避;其次,设计基于局部环境密度的自适应权重调节策略,动态权衡无人机的通行效率与避障安全性;再次,提出基于代价空间拓扑分析的主动陷阱规避机制,有效克服U型障碍等局部极小值问题;最后,将轨迹二阶差分约束纳入采样评估体系,以保障生成轨迹的动力学可行性。仿真结果表明,相较于传统方法,该算法在复杂动态场景下的飞行时间、路径长度及避障稳定性均有显著改善,具备优异的实时性与鲁棒性。
针对星机双基合成孔径雷达末段制导中二维分辨率易出现剧烈波动与奇异尖峰的问题,提出了一种兼顾构型优化与末段制导可实现性的二维分辨率优化方法。在构型规划阶段采用非支配排序遗传算法进行多目标优化,以场景二维分辨率的平均水平与均匀性为指标,并引入分辨率夹角的统计分位数前移约束以抑制高风险构型;在轨迹生成阶段基于比例导引制导模型设计在线微调修正策略,在飞行过程中实时抑制对分辨率劣化的趋势。消融对比仿真表明,通过构型前移约束与在线修正能够降低分辨率峰值与波动指标,可进一步提升二维分辨率稳定性,为星机双基SAR构型规划与在线制导提供了工程可实现的优化思路。
针对卫星导航系统拒止环境下无人车集群协同定位中超宽带(UWB)测距易受非视距与多径效应干扰的问题,提出了一种鲁棒自适应协同定位算法。首先,采用了随机割森林算法,将测距新息与UWB首径功率比作为输入特征进行异常检测,并依据UWB信号强度构造Huber权重矩阵来修正异常测距值。同时,进一步引入变分贝叶斯自适应机制在线估计测量噪声协方差,形成RRCF-Huber-VBSRCKF算法。实验表明:相比一般SRCKF算法,平均定位误差从0.23 m降至0.14 m,性能提升39.1%;相比RRCF-Huber-SRCKF算法,平均定位误差从0.18 m降至0.14 m,性能提升22.2%,最大误差从0.51 m降至0.39 m,验证了算法的优越性。
针对深度强化学习方法在复杂动态环境中,易受外部噪声干扰及传感器失效等因素影响而出现的控制鲁棒性不足问题,提出了一种融合脉冲神经网络的鲁棒深度强化学习控制算法框架。构建以时空动力学神经元为核心的脉冲Actor网络,并基于TD3算法设计了具备非稳态信号过滤能力的强化学习架构;利用脉冲神经元的时空累积与阈值触发特性,结合多种神经编码机制,建立了应对输入信号波动的生物启发式容错机制。在BipedalWalker-v3连续控制任务中,系统评估了该框架在多种编码方式下对高斯噪声、传感器失效及FGSM对抗攻击的控制性能。实验结果表明,该系统展现出优异的抗干扰能力与策略稳定性。该框架在对抗攻击、传感器失效场景及高斯噪声干扰下,性能均显著优于传统TD3算法,为构建高鲁棒性DRL算法提供了新的思路与技术路径。
针对数据分发服务在航天软件场景下DDS与飞行控制软件紧耦合、应用层状态感知困难和静态QoS策略缺乏灵活性等问题,提出TSM-DDS框架——一种基于DDS的航天装备应用通信服务架构。该架构通过三重机制实现航天通信高可靠保障:1)双任务IPC架构实现控制/通信域异步解耦;2)基于事务管理的握手重传机制实现应用层执行状态感知;3)动态流量控制策略保障高并发传输场景下控制信息的高可靠性。仿真结果表明:TSM层握手重传机制可以感知对端应用层执行状态,并有效保障控制消息执行可靠性,在高并发丢包环境中,动态流量控制策略可以有效保障控制消息传输的高可靠性,简化了DDS复杂的服务质量配置,为DDS在航天控制领域的工程化落地提供了可复用的技术范式。
针对运载火箭地面测发控系统智能化、集成化的需求,提出了一种智能化集成化架构,该架构由测试发射控制功能、辅助决策功能及存取算一体化功能组成。围绕测试发射控制功能,提出了系统综合化、模块化以及集成化设计方法,完成了模块功能、系统功能和软件体系的设计;围绕辅助决策功能,构建了基于历史故障与预案知识库的多智能体协同辅助决策系统,实现了快速响应与精准决策的目标;围绕存取算一体化功能,提出了基于大语言模型的轻量化智能计算平台,实现了数据存储和数据分析等功能的一体化和智能化。
针对混合架构测控系统中资源异构、约束复杂和动态调度困难的问题,提出一种基于多智能体深度强化学习的动态资源调度方法MA-DRS,将多目标和多约束的调度问题建模为马尔可夫决策过程,设计了中心化训练和去中心化执行的多智能体协作框架,并引入异构特征嵌入、优先级经验回放与动态动作掩码等关键技术,以提升学习效率与决策合理性。仿真实验表明,与固定组合、规则调度、遗传算法及单智能体DQN相比,MA-DRS在常规、高并发及故障注入场景下均能显著提升资源利用率、任务完成率与响应速度,并表现出优异的适应性与鲁棒性,为复杂测控系统的智能调度提供了有效解决方案。