- UNIST 한승열 교수팀, ‘가상 임무’ 스스로 만들어 예습하는 toto korea 토토사이트 학습법 개발

이번 연구를 수행한 한승열(왼쪽) UNIST 교수와 김정모 연구원.[UNIST 제공]
이번 연구를 수행한 한승열(왼쪽) UNIST 교수와 김정모 연구원.[UNIST 제공]

[헤럴드경제=구본혁 기자] 걷고 달릴 수 있는 사람이라면 ‘빠르게 걷기’쯤은 식은 죽 먹기다. 발을 얼마나 자주 떼고, 보폭을 어떻게 조절하는지 배우지 않아도 ‘감’으로 안다. 반면 피지컬 toto korea 토토사이트 로봇은 걷기나 전력 질주를 잘 배웠더라도 적당히 달리는 새로운 임무를 받으면 다리 각도나 힘 조절을 제대로 못 해 엉뚱한 동작을 하거나 멈출 수 있다. 훈련받지 않은 상황에 대한 적응력 부족이 피지컬 toto korea 토토사이트 기술의 한계로 꾸준히 지적돼 왔는데, 이를 해결할 수 있는 새로운 toto korea 토토사이트 메타 강화학습 기법이 등장했다. toto korea 토토사이트 스스로 새로운 임무를 상상해 예습하는 기술이다.

울산과학기술원(UNIST) 인공지능대학원 한승열 교수팀은 학습해본 적 없는 새로운 임무에도 적응할 수 있도록 인공지능을 훈련시키는 기법인 TAVT(Task-Aware Virtual Trtoto korea 토토사이트ning)를 개발했다고 19일 밝혔다.

연구팀이 개발한 학습 기법은 toto korea 토토사이트 스스로 ‘가상의 임무’를 만들어 이를 미리 학습하게 하는 방식이다. 딥러닝 기반의 표현 학습 모듈과 생성 모듈로 구성돼 있다. 표현 학습 모듈이 서로 다른 임무 간의 유사도(거리)를 정량화해 임무 구조(latent representation)를 파악하면, 생성 모듈이 이를 조합해 새로운 가상의 임무를 만든다. 생성된 가상 임무는 원래 임무의 특징을 보존할 수 있도록 설계돼, 학습한 적 없는 상황에 대한 예습 효과가 있다.

개발된 상상 toto korea 토토사이트 기반 학습 기법의 유효성.[UNIST 제공]
개발된 상상 toto korea 토토사이트 기반 학습 기법의 유효성.[UNIST 제공]

연구팀은 이 학습 기법을 치타, 개미, 2족 보행 등 다양한 로봇 시뮬레이션 환경에 적용해본 결과, 훈련하지 않은 toto korea 토토사이트에 대한 적응력이 향상됐음을 확인했다.

특히 치타 로봇 시뮬레이션 실험에서는 TAVT 기법을 적용한 경우, 경험해 보지 못한 중간 속도에서도 목표 속도를 빠르게 파악해 안정적으로 주행을 이어갔다. 반면 기존 메타강화toto korea 토토사이트 기법을 적용한 로봇은 적응이 느리거나 넘어지는 일이 잦았다.

한승열 교수는 “이번 기법은 toto korea 토토사이트 에이전트의 임무 일반화 성능을 높일 수 있는 방식으로, 피지컬 toto korea 토토사이트 로봇이나 자율주행차·드론 등 다양한 상황에서 유연한 대응이 필수적인 분야에 폭넓게 활용될 수 있을 것”이라고 말했다.

이번 연구 결과는 세계 3대 인공지능 학회 중 하나인 2025 ICML(International Conference on Machine Learning)에 채택됐다.


nbgkoo@heraldcorp.com