보유 특허 상세 정보를 불러오는 중입니다...
[특허 요약] 공유 메모리를 통한 가상 환경에서의 강화 학습 방법, 공유 메모리를 통한 가상 환경에서의 강화 학습을 위한 시스템, 및 공유 메모리가 제공된다. 본 발명의 일 면(aspect)에 따른 공유 메모리를 통한 가상 환경에서의 강화 학습 방법은 가상 환경에서 공유 메모리를 지정하는 단계; 상기 가상 환경에서 공유 메모리에 이미지를 전송하고, 상기 공유 메모리의 이미지 플래그를 1로 변경하는 단계; 강화 학습 에이전트에서 상기 공유 메모리의 상기 이미지 플래그를 확인하는 단계; 상기 이미지 플래그가 1인 경우 상기 강화 학습 에이전트는 상기 공유 메모리에 전송된 이미지를 수신하고, 상기 이미지 플래그를 0으로 변경하는 단계; 상기 강화 학습 에이전트에서 상기 수신된 이미지를 바탕으로 한 행동을 상기 공유 메모리에 전송하고, 상기 공유 메모리의 행동 플래그를 1로 변경하는 단계; 상기 가상 환경에서 상기 공유 메모리의 상기 행동 플래그를 확인하는 단계; 상기 행동 플래그가 1인 경우 상기 가상 환경은 상기 공유 메모리에 전송된 행동을 수신하고, 상기 행동 플래그를 0으로 변경하는 단계; 상기 가상 환경에서 상기 수신된 행동을 바탕으로 한 보상을 상기 공유 메모리에 전송하고, 상기 공유 메모리의 보상 플래그를 1로 변경하는 단계; 상기 강화 학습 에이전트에서 상기 공유 메모리의 보상 플래그를 확인하는 단계; 및 상기 보상 플래그가 1인 경우 상기 강화 학습 에이전트는 상기 공유 메모리에 전송된 보상을 수신하고, 상기 보상 플래그를 0으로 변경하는 단계를 포함한다.
| 특허 상태 | 공개 |
| 출원인 | 성균관대학교산학협력단, 기초과학연구원 |
| 발명자 | 김형구, 김혜인, 김여원, 벤자민유진도젠, 김종헌 |
| 출원번호 | 1020240066432 |
| 출원일 | 2024.05.22 |
| 등록번호 | 20250167320 |
| 등록일 | 2025.12.01 |
| 중요 키워드 |
공유 메모리를 통한 가상 환경에서의 강화 학습 방법, 공유 메모리를 통한 가상 환경에서의 강화 학습을 위한 시스템, 및 공유 메모리가 제공된다. 본 발명의 일 면(aspect)에 따른 공유 메모리를 통한 가상 환경에서의 강화 학습 방법은 가상 환경에서 공유 메모리를 지정하는 단계; 상기 가상 환경에서 공유 메모리에 이미지를 전송하고, 상기 공유 메모리의 이미지 플래그를 1로 변경하는 단계; 강화 학습 에이전트에서 상기 공유 메모리의 상기 이미지 플래그를 확인하는 단계; 상기 이미지 플래그가 1인 경우 상기 강화 학습 에이전트는 상기 공유 메모리에 전송된 이미지를 수신하고, 상기 이미지 플래그를 0으로 변경하는 단계; 상기 강화 학습 에이전트에서 상기 수신된 이미지를 바탕으로 한 행동을 상기 공유 메모리에 전송하고, 상기 공유 메모리의 행동 플래그를 1로 변경하는 단계; 상기 가상 환경에서 상기 공유 메모리의 상기 행동 플래그를 확인하는 단계; 상기 행동 플래그가 1인 경우 상기 가상 환경은 상기 공유 메모리에 전송된 행동을 수신하고, 상기 행동 플래그를 0으로 변경하는 단계; 상기 가상 환경에서 상기 수신된 행동을 바탕으로 한 보상을 상기 공유 메모리에 전송하고, 상기 공유 메모리의 보상 플래그를 1로 변경하는 단계; 상기 강화 학습 에이전트에서 상기 공유 메모리의 보상 플래그를 확인하는 단계; 및 상기 보상 플래그가 1인 경우 상기 강화 학습 에이전트는 상기 공유 메모리에 전송된 보상을 수신하고, 상기 보상 플래그를 0으로 변경하는 단계를 포함한다.
연관 기술이전 로딩 중...
연관 연구자 로딩 중...