Search Results for author: Hongpeng Cao

Found 7 papers, 1 papers with code

Equivariant Ensembles and Regularization for Reinforcement Learning in Map-based Path Planning

no code implementations • 19 Mar 2024 • Mirco Theile, Hongpeng Cao, Marco Caccamo, Alberto L. Sangiovanni-Vincentelli

In reinforcement learning (RL), exploiting environmental symmetries can significantly enhance efficiency, robustness, and performance.

Inductive Bias Reinforcement Learning (RL)

Paper
Add Code

Physical Deep Reinforcement Learning: Safety and Unknown Unknowns

no code implementations • 26 May 2023 • Hongpeng Cao, Yanbing Mao, Lui Sha, Marco Caccamo

In this paper, we propose the Phy-DRL: a physics-model-regulated deep reinforcement learning framework for safety-critical autonomous systems.

reinforcement-learning

Paper
Add Code

Physical Deep Reinforcement Learning Towards Safety Guarantee

no code implementations • 29 Mar 2023 • Hongpeng Cao, Yanbing Mao, Lui Sha, Marco Caccamo

Deep reinforcement learning (DRL) has achieved tremendous success in many complex decision-making tasks of autonomous systems with high-dimensional state and/or action spaces.

Decision Making reinforcement-learning

Paper
Add Code

6IMPOSE: Bridging the Reality Gap in 6D Pose Estimation for Robotic Grasping

1 code implementation • 30 Aug 2022 • Hongpeng Cao, Lukas Dirnberger, Daniele Bernardini, Cristina Piazza, Marco Caccamo

To overcome this gap, we introduce 6IMPOSE, a novel framework for sim-to-real data generation and 6D pose estimation.

6D Pose Estimation Robotic Grasping

Paper
Code

Sandboxing (AI-based) Unverified Controllers in Stochastic Games: An Abstraction-based Approach with Safe-visor Architecture

no code implementations • 28 Mar 2022 • Bingzhuo Zhong, Hongpeng Cao, Majid Zamani, Marco Caccamo

In this paper, we propose a construction scheme for a Safe-visor architecture for sandboxing unverified controllers, e. g., artificial intelligence-based (a. k. a.

Paper
Add Code

Cloud-Edge Training Architecture for Sim-to-Real Deep Reinforcement Learning

no code implementations • 4 Mar 2022 • Hongpeng Cao, Mirco Theile, Federico G. Wyrwal, Marco Caccamo

To overcome the reality gap, our architecture exploits sim-to-real transfer strategies to continue the training of simulation-pretrained agents on a physical system.

Domain Adaptation reinforcement-learning +1

Paper
Add Code

Safe-visor Architecture for Sandboxing (AI-based) Unverified Controllers in Stochastic Cyber-Physical Systems

no code implementations • 10 Feb 2021 • Bingzhuo Zhong, Abolfazl Lavaei, Hongpeng Cao, Majid Zamani, Marco Caccamo

To cope with this difficulty, we propose in this work a Safe-visor architecture for sandboxing unverified controllers in CPSs operating in noisy environments (a. k. a.

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.