咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 1 篇 学位论文
  • 1 篇 会议

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 5 篇 控制科学与工程
    • 4 篇 机械工程
    • 4 篇 计算机科学与技术...
    • 2 篇 材料科学与工程(可...
    • 1 篇 仪器科学与技术
    • 1 篇 电气工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 建筑学
    • 1 篇 生物医学工程(可授...
  • 4 篇 理学
    • 3 篇 数学
    • 2 篇 生物学
  • 1 篇 法学
    • 1 篇 社会学
  • 1 篇 医学
    • 1 篇 临床医学
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 8 篇 policy gradient
  • 1 篇 机械臂
  • 1 篇 pspnet
  • 1 篇 monitoring data
  • 1 篇 task offloading
  • 1 篇 cost-sensitive l...
  • 1 篇 simulation data
  • 1 篇 industrial proce...
  • 1 篇 运动跟踪
  • 1 篇 inference
  • 1 篇 short text conve...
  • 1 篇 语义分割
  • 1 篇 generative adver...
  • 1 篇 参数整定
  • 1 篇 blockchain
  • 1 篇 initial residual...
  • 1 篇 比例微分控制
  • 1 篇 deep reinforceme...
  • 1 篇 fault diagnosis
  • 1 篇 强化学习

机构

  • 1 篇 state grid shand...
  • 1 篇 state key labora...
  • 1 篇 national network...
  • 1 篇 吉林大学
  • 1 篇 key laboratory o...
  • 1 篇 key lab of anhui...
  • 1 篇 state grid shand...
  • 1 篇 nanjing universi...
  • 1 篇 measuring center...
  • 1 篇 faculty of infor...
  • 1 篇 空军工程大学

作者

  • 1 篇 贺子厚
  • 1 篇 xinmin zhang
  • 1 篇 saite fan
  • 1 篇 yin yufen
  • 1 篇 zhiru chen
  • 1 篇 yingguang li
  • 1 篇 liang guo
  • 1 篇 宋仕元
  • 1 篇 xuan liu
  • 1 篇 si pengbo
  • 1 篇 张鑫垚
  • 1 篇 changqing liu
  • 1 篇 zhi zhang
  • 1 篇 kai yu
  • 1 篇 韩霖骁
  • 1 篇 shuguo wang
  • 1 篇 张鹏
  • 1 篇 gao yang
  • 1 篇 金凯琦
  • 1 篇 胡剑波

语言

  • 5 篇 英文
  • 3 篇 中文
检索条件"主题词=policy gradient"
8 条 记 录,以下是1-10 订阅
排序:
基于policy gradient的机械臂运动跟踪控制器参数整定
收藏 引用
系统工程与电子技术 2021年 第9期43卷 2605-2611页
作者: 韩霖骁 胡剑波 宋仕元 王应洋 贺子厚 张鹏 空军工程大学装备管理与无人机工程学院 陕西西安710051
针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习policy gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
基于policy gradient强化学习的无人车控制方法研究
基于Policy Gradient强化学习的无人车控制方法研究
收藏 引用
作者: 张鑫垚 吉林大学
学位级别:硕士
自动驾驶技术的开发将会极大地有利于行车安全,减少交通事故的发生,因此在当代,自动驾驶的实现已经势在必行。由于基于模型的控制算法无法适应多变的行车环境,因此能够与环境交互,不断学习环境的强化学习算法将会在智能车领域扮演极为... 详细信息
来源: 同方学位论文库 同方学位论文库 评论
Reinforcement learning-based cost-sensitive classifier for imbalanced fault classification
收藏 引用
Science China(Information Sciences) 2023年 第11期66卷 113-126页
作者: Xinmin ZHANG Saite FAN Zhihuan SONG State Key Laboratory of Industrial Control Technology College of Control Science and Engineering Zhejiang University
Fault classification plays a crucial role in the industrial process monitoring domain. In the datasets collected from real-life industrial processes, the data distribution is usually imbalanced. The datasets contain a... 详细信息
来源: 同方期刊数据库 同方期刊数据库 评论
An Initial Residual Stress Inference Method by Incorporating Monitoring Data and Mechanism Model
收藏 引用
Chinese Journal of Mechanical Engineering 2022年 第5期35卷 47-65页
作者: Shuguo Wang Yingguang Li Changqing Liu Zhiwei Zhao Nanjing University of Aeronautics and Astronautics Nanjing 210016China
Initial residual stress is the main reason causing machining deformation of the workpiece,which has been deemed as one of the most important aspects of machining quality issues.The inference of the distribution of ini... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
Deep reinforcement learning based task offloading in blockchain enabled smart city
收藏 引用
High Technology Letters 2023年 第3期29卷 295-304页
作者: 金凯琦 WU Wenjun GAO Yang YIN Yufen SI Pengbo Faculty of Information Technology Beijing University of TechnologyBeijing 100124P.R.China
With the expansion of cities and emerging complicated application,smart city has become an in-telligent management mechanism.In order to guarantee the information security and quality of service(QoS)of the Internet of... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
Admission Control with Elastic QoS for Video on Demand Systems
收藏 引用
International Journal of Automation and computing 2012年 第5期9卷 467-473页
作者: Fu-Shou Lin 1 Bao-Qun Yin 1,2 Jing Huang 1 Xu-Min Wu 1 1 Key Lab of Anhui Network Communication System and Control, University of Science and Technology of China, Hefei 230027, China 2 National Network New Media Engineering Research Center, Institute of Acoustics, Chinese Academy of Science, Beijing 100190, China Key Lab of Anhui Network Communication System and Control University of Science and Technology of China Hefei China National Network New Media Engineering Research Center Institute of Acoustics Chinese Academy of Science Beijing China
In network service systems, satisfying quality of service (QoS) is one of the main objectives. Admission control and resource allocation strategy can be used to guarantee the QoS requirement. Based on partially observ... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
Generative Adversarial Network Based Status Generation Simulation Approach
收藏 引用
国际计算机前沿大会会议论文集 2021年 第1期 246-255页
作者: Zhiru Chen Zhi Zhang Xi Zhao Liang Guo State Grid ShanDong Marketing Service Center(Metrology Center) Jinan 250000ShandongChina Measuring Center State Grid Shandong Electric Power Research InstituteJinan 250000ShandongChina State Grid Shandong Electric Power Company Jinan 250000ShandongChina
The generative adversarial network based methods have beenapplied in many fields for simulation data generation. For power equipment,due to the combined influences of multiple factors, how to generatereasonable simula... 详细信息
来源: 维普期刊数据库 维普期刊数据库 评论
GLEU-guided Multi-Resolution Network for Short Text Conversation
GLEU-guided Multi-Resolution Network for Short Text Conversa...
收藏 引用
第十四届全国人机语音通讯学术会议
作者: Xuan Liu Kai Yu Key Laboratory of Shanghai Education Commission for Intelligent Interaction and Cognitive Engineering SpeechLab Department of Computer Science and Engineering Brain Science and Technology Research Center Shanghai Jiao Tong University
With the recent development of sequence-to-sequence framework,generation approach for short text conversation becomes attractive.Traditional sequence-to-sequence method for short text conversation often suffers from d... 详细信息
来源: cnki会议 评论