本发明公开一种基于多智能体强化学习的无人机集群高效通信方法,构建无人机飞行环境模拟器;随机选取一架无人机作为队长并标记;每架无人机获取并维护本机的局部观测值,将自身观测值进行编码并发送给队长;队长根据每架无人机的自身观测值,分别对全局观测值进行attention注意力机制处理,根据信息的重要程度来决定信息的权重,继而将计算好的观测值发送给每个队友,作为队友的全局观测值;训练阶段以全局观测值作为训练数据,直到策略网络收敛;执行阶段以分布式的方式进行;对队长的存活给一个额外的奖励。本发明可以在通信开销较小的条件下解决无人机集群集中式信息交互的问题,给予无人机自主决策权。
本发明公开了一种基于深度强化学习的全景视频边缘协作缓存替换方法,通过利用边缘缓存在应对VR全景视频流传输挑战方面的优势以及深度强化学习DRL适用于解决复杂问题的特性,在优化缓存效率的基础上,综合提升VR全景视频流传输的各方面性能。本发明充分考虑了多种视频编码版本、可能存在的对全景视频用户视场FoV的预测错误以及面向多用户的长期收益,对传输过程中的成本、视频内容质量不匹配水平以及响应时延进行联合优化,使得用户获得高质量、低成本的全景视频流。
本发明涉及一种苯系物污染土壤的原位化学氧化修复方法,包括土壤修复剂的注入、抽提后异位处置及定期监测,注入的土壤修复剂在地下水径流、渗透及水力梯度的作用下,与污染土层中吸附在土壤颗粒上的污染物充分接触后,利用土壤修复剂的较高氧化还原电位,将其降解成低分子的简单的有机物类,实现对苯系物污染土壤的原位化学氧化修复方法。
本发明公开了一种基于深度强化学习的自动驾驶行为一体化决策方法,从两种基本驾驶行为,即换道和跟驰行为的优先级和逻辑出发,首先采用上下两层深度强化学习模型处理大规模混合状态空间并保证换道决策和跟驰决策的复合动作输出,在上层模型中使用D3QN算法来区分环境的潜在价值和换道决策的价值,在下层模型采用DDPG算法处理跟驰决策从而输出连续的车速控制。选取混合标准驾驶工况对两种算法进行耦合训练之后,在利用NGSIM数据重建的高度复杂的驾驶场景中对模型进行测试。本发明提出的集成驾驶决策模型提高了跟驰与换道决策的协同性,并将车道优势函数与危险动作屏蔽机制整合到决策模型中,显著提升了行驶速度,优于其他的智能驾驶决策模型。
本发明公开了基于深度强化学习的风电机组电网惯量支撑方法,包括以下步骤:(1)获取风机转速、电网频率数据;(2)基于DDPG算法设计改进的风机一次调频控制策略;(3)在训练风速下对DDPG智能体进行训练;(4)利用步骤(3)训练好的智能体,在测试风速下根据风机转速和电网频率在线输出惯量支撑功率,实现风机对电网的惯量支撑。本发明的技术方案在风电机组RSC控制基础上,通过深度确定性策略梯度强化学习算法获得风电机组惯量支撑功率。与传统风机固定系数的一次调频控制相比,本发明提出的方法综合考虑风机稳定与惯量支撑效果,使风机在维持自身稳定运行的前提下充分利用转子动能为电网提供惯量支撑。
本发明提供了一种基于深度强化学习的机器人自适应抓取方法,步骤包括:在距离待抓取目标一定距离时,机器人通过前部的摄像头获取目标的照片,再根据照片利用双目测距方法计算出目标的位置信息,并将计算出的位置信息用于机器人导航;当目标进入机械手臂抓范围内时,再通过前部的摄像头拍摄目标的照片,并利用预先训练过的基于DDPG的深度强化学习网络对照片进行数据降维特征提取;根据特征提取结果得出机器人的控制策略,机器人利用控制策略来控制运动路径和机械手臂的位姿,从而实现目标的自适应抓取。该抓取方法能够对大小形状不同、位置不固定的物体实现自适应抓取,具有良好的市场应用前景。
本发明提供了一种基于深度强化学习的六足机器人实时步态规划方法,步骤包括:由六足机器人获取环境路况信息并制定整体的运动轨迹;通过摄像头获取环境的照片,再根据照片利用双目测距方法计算出目标轨迹的路况信息,并将计算出的轨迹路况信息用于机器人质心运动轨迹导航;在机器人腿的足端摆动空间范围内,拍摄路况环境的照片,并通过预先训练过的基于深度确定性策略梯度(DDPG)的深度强化学习网络对照片进行数据降维和特征提取;根据特征提取结果得出六足机器人的控制策略,六足机器人根据控制策略来控制机器人的落足,实现六足机器人的实时行走。该步态规划的方法能够对路况复杂的非结构环境进行实时规划,对提高六足机器人的环境适应能力具有重要意义。
本实用新型公开一种化学品船液货舱智能监控装置,包括设置在船舶监控室的船舶智能监控计算机以及船舶内的若干液货舱;每一所述的液货舱内均安装有可拆卸更换的雷达测深传感器、压力传感器以及氧气溶度测量仪;并且每一液货舱内的雷达测深传感、压力传感器以及氧气溶度测量仪均与船舶监控室内的智能监控计算机相连。本装置中在舱体内同时安装雷达测深传感器监测液位和温度,安装压力传感器监测舱体内压力,安装氧气溶度传感器监测舱体内氧气溶度;通过对比压力是否与液位成正比、温度是否与压力成正比、氧气溶度是否随着液位变化,多项数据相互对比,交互处理后可准确判断舱体内真实情况,具有随时监控,智能计算,安全性高的特点。
转录因子是生物蛋白质组中一类负责基因表达调控的重要蛋白质,是基因表达调控通路及网络的枢纽,是功能基因组和蛋白质组研究的重要对象;许多疾病都与转录因子的异常表达及活化存在密切的关系,成为转录治疗和药物研究的重要靶点。转录因子表达及活化程度的检测分析是研究其功能的主要手段。本发明“双链核酸分子包被微孔板检测转录因子蛋白”提出了一种检测转录因子表达和活化水平的新方法。运用该方法分析转录因子表达和活化水平包括如下步骤:(a)准备核酸分子;(b)将核酸分子连接固定到微孔板孔内;(c)含转录因子的细胞或组织抽提物与微孔板孵育;(d)转录因子抗体与微孔板孵育;(e)化学标记转录因子二抗与微孔板孵育;(f)对化学标记检测分析。
本发明公开了电化学三电极分析检测技术领域的一种碳纤维微电极在对苯二酚检测中的应用,旨在解决现有技术中对苯二酚检测成本高、样品预处理复杂的技术问题,一种碳纤维微电极在对苯二酚检测中的应用,包括:构建电化学三电极体系,包括以所述碳纤维微电极为工作电极,以铂丝为辅助电极,以Ag/AgCl电极为参比电极;配制不同浓度的对苯二酚溶液;将所述三电极体系分别置于所述不同浓度的对苯二酚溶液中,绘制一定电压范围下,所述三电极体系在所述不同浓度的对苯二酚溶液中的示差脉冲伏安曲线;利用标准曲线法进行定量分析。本发明进行对苯二酚的电化学检测,具有灵敏度高、检测限低、检测成本低、检测范围广、操作简单的特点。
本发明公开一种基于离线强化学习的无人机自主飞行控制方法,包含以下步骤:(1)人为控制无人机执行飞行任务,收集无人机在现实环境中的飞行数据,生成数据集。(2)基于数据集,根据飞行状态和动作设计奖赏函数。(3)基于离线强化学习算法,仅利用数据集训练自主飞行控制策略。(4)在现实环境中,使用自主飞行控制策略操控无人机执行飞行任务,无人机操作员实时监控,测试控制策略性能并收集飞行数据。(5)把收集的新飞行数据加入数据集。(6)迭代执行步骤(2)(3)(4)(5),直到自主飞行控制策略能够完成飞行任务。本发明能够以很低的成本训练出泛化性好、鲁棒的自主飞行控制策略,适用于复杂多变的现实环境。
本发明实施例公开了一种基于深度强化学习的燃料电池系统的燃料供给方法,涉及燃料电池技术领域,能够改善燃料电池的使用效率和寿命。本发明包括:获取燃料电池系统的工况数据的样本集合,根据工况数据的样本集合得到功率需求,DDPG控制器的目标为:在燃料电池系统输出功率,满足能量控制策略需求功率的同时,保持过氧比在预设范围内,工况预测模型包括:氢气流量控制阀模型、空气压缩机模型和燃料电池系统模型;将实际的工况数据输入工况预测模型,得到速度预测序列;利用速度预测序列,得到燃料电池系统的实际功率需求,并根据实际功率需求控制燃料电池系统的氢气流量阀和空气压缩机。本发明适用于氢燃料电池系统。
本发明公开了一种基于深度强化学习的区域智能电网分区评价方法,步骤如下:(1)建立多微网系统分区评价指标体系;(2)设定多微网系统功率平衡限制;(3)建立评价指标权重智能体;(4)构建区内和区间划分效果的评价指标体系;(5)设计多微网分区综合评价指数;(6)设计考虑系统节点变化的多微网重新分区机制。本发明考虑了多项指标,区域智能电网分区评价指标体系比已有的区域智能电网分区指标更全面;本发明采用了深度强化学习方法,基于各节点历史数据确定各项指标权重,更易抵抗监测不良数据对于权重的影响,鲁棒性更强;本发明可根据网络节点状态变化,及时对分区评价指标体系进行更新调整,以保证分区评价指标的合理性和协调性。
本发明是一种基于墨鱼骨有机质的检测底物浓度的高灵敏度传感器,它涉及传感器的设计与底物检测分析,特别涉及一种三维大孔基底材料及其制备过程。该基底材料是由软体动物墨鱼的硬组织(即墨鱼骨或乌贼骨)经多步骤加工和处理而成的有机膜材料,其微观结构是由孔径大小30ΜM~150ΜM的弯曲单向孔通道组成的类似于房架的结构。该基底材料不仅具有很大的比表面积,而且透光性好,具有优良的化学稳定性和韧性,制备该基底材料的原料来源广泛,都是可再生资源,不破坏生态环境,还能废物利用,制备步骤简单却独到。利用该基底材料的独特结构和优良特性,固定过渡金属纳米颗粒制备而成的这种分析传感器不仅制备方法简单,灵敏度高,具有普遍适用性和便捷性。
本申请实施例涉及热仿真技术领域,公开了一种电化学储能机柜热仿真方法及系统。该方法基于电化学储能机柜的机柜参数并建立体热源模型,且将该模型与边界条件和环境参数进行耦合计算,输出仿真值,该方法不需要建立多个耦合模型,能够实现快速仿真,且该方法在获得仿真值后,与外场实际测量值进行对比验证,进一步校正电池单体模型的物性参数,从而使得仿真值更为精确。
本发明公开了一种基于强化学习的自动化机器学习方法,包括以下步骤:使用统一的API接口,屏蔽不同的机器学习算法库之间的异构性,以Python作为编程语言,在Python语言中调用不同机器学习算法库中的算法;将自动化机器学习问题建模为强化学习问题,对候选机器学习算法进行状态空间划分,确定状态间的转移关系,并采用Q‑Learning算法完成搜索机器学习流水线的过程;对数据集进行元特征提取,搜索最相似数据集,并利用所述最相似数据集上的运行信息来加速自动化机器学习的收敛过程。本发明解决了现有的自动化机器学习系统收敛速度慢、可扩展性差以及最终预测性能达不到预期的问题。
本专利公开了一种用于多智能体系统通信和控制的强化学习方法。本方法针对通过一定拓扑结构的通信网络发送和接收消息进行信息共享的多智能体系统,给出了一种强化学习算法,使多智能体系统能够通过训练,在每个智能体上构建通信策略和控制策略,使智能体从传感设备的高维原始输入中提取有效的低维通信信息,从而使整个多智能体系统能够实现高效的信息共享和协同控制。该方法降低了带有复杂动态和高维观测的多智能体系统通信和控制策略设计的复杂程度,同时也降低了智能体之间的通信负荷。
本发明提出了一种基于分时间窗深度强化学习的服务质量评估系统,包括数据采集模块、模型调整模块、奖励反馈模块、并行学习模块、Q表格更新模块、周期迭代模块、预测学习模块、时间窗调整模块,本发明利用强化学习的交互性和决策能力,以及深度学习的感知能力,解决现有质量评估方法中的评估精准性低、时效性差等问题。
本发明公开了一种基于化学反应网络的神经网络元件实现方法,包括如下步骤:(1)数值计算的实现;对于加法、减法和乘法计算,分别构造相应模型进行计算;(2)神经元的实现;利用步骤(1)中的计算模型实现神经元的相关计算。本发明构造了一个功能由化学反应网络实现的神经元,经仿真测试,该神经元在训练过程中能输出正确结果,同时相应地对输入端的权值进行正确调整。
本发明公开了一种基于氧化物异质结的极性溶剂化学传感器,在衬底上制备ZnMgO/ZnO异质结构,通过光刻、热蒸发等半导体工艺在异质结构制作电极,形成肖特基‑欧姆接触的非对称无栅高电子迁移率晶体管(HEMT)结构的化学传感器。ZnMgO/ZnO异质界面形成二维电子气(2DEG),吸附于器件传感区域的极性溶剂分子可以影响异质界面二维电子气(2DEG)的浓度,通过器件漏源电流的变化,从而实现对多种极性溶剂的探测。
本发明设计了一种利用深度强化学习模型Graph Attention based Pointer Network(GAPN)为无线传感器网络中的无人车向传感器节点进行充电的路径规划方法。流程包括如下步骤:(1)收集无线传感网络中每个节点的位置坐标信息及其电量状况(2)根据收集的数据生成与其位置信息相同分布的训练数据集和测试数据集;(3)将制作好的数据集用于GAPN模型训练;(4)将收集到的节点信息输入到完成训练的GAPN模型中,通过模型的处理,输出最终的访问节点序列。本发明基于深度强化学习和图神经网络的方法提出了一种解决无人充电车路径规划的策略,提高了无线传感网络的工作效率,延长了网络的生命周期。
本发明公开了一种基于强化学习的机器类通信设备接入蜂窝数据网络的方法,所述基站对每个机器类通信设备进行调度,在设备需要发送数据时分配上行链路资源,在设备空闲时不分配资源。该方法的具体步骤为:步骤1,基站预测即将需要传输数据的设备,构成活跃设备集合;步骤2,基站使用改进的上置信界算法在活跃设备集合中进行设备选择,并对所选择的设备分配上行链路资源;步骤3,对基站选择的每个设备进行参数更新以及奖励的分配,进入下一时隙,返回步骤1。本发明针对基站预测算法重复多次预测错误的情况进行专门的优化,旨在降低基站预测错误传递的影响。
本发明公开了一种化学氧化土壤修复工艺及模拟试验装置,装置主要包括模拟试验柱、循环淋洗系统、多相氧化加药系统、监测取样装置。所述模拟试验柱的顶部设有顶盖,所述顶盖中间开孔,所述开孔处放入锥形漏斗,所述锥形漏斗连接波纹管,所述波纹管设置在模拟试验柱内;所述的模拟试验柱侧面设有采样孔;所述采样孔通过橡胶塞连接土壤溶液取样器。本发明公开了一种化学氧化土壤修复工艺及模拟试验装置,有效的提高模拟试验的与现场环境的一致性,确保试验参数及结论普适性和准确性。
本发明旨在克服现有电化学储能电站火灾复杂,单一消防系统难以满足需求的不足,提供一种电化学储能电站消防系统,将清洁气体灭火装置和液体灭火剂装置,通过共用一套控制系统和消防管路,有机集成在一套消防系统中,采用总线实现对多种探测信息的收集,通过对共用管路系统的自动控制预设了针对不同火灾发生点和规模的多种火灾抑制和扑灭方法,实现了多层次的精准消防,不但大大提高了火灾扑救的反应速度、提升了降温灭火的效率,还能够大大降低储能电站火灾扑救过程造成的损失,实现消防系统的标准化,减少消防系统的工程量,节约成本,有很高的实用性。
本发明是一种基于墨鱼骨有机质的检测酶类活性的高灵敏度传感器,它涉及传感器的设计与酶类活性检测分析,特别涉及一种三维大孔基底材料及其制备过程。该基底材料是由软体动物墨鱼的硬组织(即墨鱼骨或乌贼骨)经多步骤加工和处理而成的有机膜材料,其微观结构是由孔径大小30ΜM~150ΜM的弯曲单向孔通道组成的类似于房架的结构。该基底材料不仅具有很大的比表面积,而且透光性好,具有优良的化学稳定性和韧性,制备该基底材料的原料来源广泛,都是可再生资源,不破坏生态环境,还能废物利用,制备步骤简单却独到。利用该基底材料的独特结构和优良特性,固定过渡金属纳米颗粒制备而成的这种分析传感器不仅制备方法简单,灵敏度高,具有普遍适用性和便捷性。
本发明公开了一种结合高斯过程与强化学习的服务组合方法,包括如下步骤:1、将服务组合问题建模为一个四元组马尔可夫决策过程;2、应用基于Q‑learning的强化学习方法求解四元组马尔可夫决策过程,得到最优策略;其中通过建立Q值高斯预测模型来对Q值进行更新;3、将最优策略映射为web服务组合的工作流。该方法使用高斯过程对Q值的学习进行建模,从而使其具有更好的精确性和泛化性。
本实用新型涉及一种等离子体增强型化学气相淀积设备薄膜均匀性改善装置。根据量测仪器获得的圆片介质厚度分布图,结合八寸设备生长六寸、八寸圆片的实际情况,通过在八寸分气盘内侧凹槽内增加挡气圆环,腔体上盖出气口零件中心开孔的方式,尽量使气体收敛于六寸圆片区域,减小圆片边缘的气体流量,从而使长膜厚度均匀性改善。本实用新型避免了因长膜均匀性不合格导致的圆片报废风险,该方法可为改善等离子体增强型化学气相淀积设备薄膜均匀性提供一种解决方案。
本发明公开了一种基于物理信息和深度强化学习的电力系统自动化操作方法及装置。该方法设定强化学习训练需要的神经网络结构、参数、状态空间、可选择的动作空间,构建一个深度Q学习智能体,通过最小化线路故障的频率和严重程度来预测自动行动。然后,直接应用电力系统物理信息作为训练已知限定,减少训练数据,加快训练时间。其次,设计用于优化的奖励函数,训练选择不同的动作以达到最大的奖励,寻找最优的自动化操作。本发明结合物理信息特征,基于DQN算法对电力系统各输电线路和变电站拓扑进行了优化控制,兼顾了经济性和有效性。本发明能在较少数据的情况下,实时地进行电力系统稳定控制。
本发明提供了一种基于深度强化学习的航空器间隔管理决策方法,可以实现从输入到输出的端到端的直接控制。本方法将深度强化学习用于航空领域,设计了一种基于深度强化学习的航空器间隔管理决策方法。使用深度循环Q网络对终端区内的态势进行预测判断,通过设计并训练航班调速策略实现终端区内的飞行安全间隔自主保持。使用该方法对繁忙运行情况下的终端区空中航空器进行调配,实现了繁忙扇区的冲突解脱与连续无冲突运行,减轻了管制员面对复杂运行场景的间隔调配决策压力提高扇区管制运行效率与安全保障能力。
中冶有色为您提供最新的江苏南京有色金属分析检测技术理论与应用信息,涵盖发明专利、权利要求、说明书、技术领域、背景技术、实用新型内容及具体实施方式等有色技术内容。打造最具专业性的有色金属技术理论与应用平台!