산업 및 시스템공학과
데이터를 활용한 복잡한 시스템 설계 및 제어Laboratory : http://silab.kaist.ac.kr/
Research contents
Research results
□ 데이터 기반 동적 시스템 모델링 및 제어 인공지능 알고리즘 개발
대상 동적 시스템을 구성하는 agent들의 관계를 여러 타입의 그래프로 표현하고, 해당 그래프로부터 동적시스템의 미래 거동을 예측하거나 시스템 최적 운영 의사결정을 하는 데 필요한 핵심 정보를 도출하는 Graph-Centric Representation Learning 기법을 개발하였습니다. 이와 더불어, 도출된 핵심 정보를 활용하여 다중에이전트 시스템을 분산적으로 제어하는 정책함수를 효과적으로 도출하는 MARL 기법을 개발하였습니다. 동적 시스템 모델링 기법과 Graph-Centric MARL을 개발하는 알고리즘 연구는 아래와 같은 최고 권위 인공지능 학회에서 발표되었습니다.
”Neural Hybrid Automata” (NeurIPS 2021)
“Differentiable Multiple Shooting Layers” (NeurIPS 2021)
“Learning Collaborative Polices for Solving NP-hard Routing Problems” (NeurIPS 2021)
“Dissecting neural odes”(NeurIPS 2020):
“Hypersolvers: Toward fast continuous-depth models (NeurIPS 2020):
□ Graph-Centric MARL을 활용한 반도체 팹의 최적 공정 스케줄링 기법 개발
다양한 종류의 Wafer 제품을 생산하는 반도체 Fab (fabrication facility)는 제품마다 투입부터 Fab Out까지 다양한 공정을 거친다. 형태의 Fab 생산계획을 최적화하는 것은 Flexible Job Shop 문제로 알려져 있으며, 현재 알려진 생산계획 문제 중 가장 높은 복잡도를 가진 문제에 속한다. 전통적으로 불확실성이 존재하는 Flexible Job Shop 문제는 수리적 최적화 기법의 일종인 추계적 조합 최적화를 이용해 풀어왔으나, 계산 시간 복잡도와 모델링 기법의 한계로 인해 현실 적용이 어렵다는 한계가 있다. 본 연구는 Fab의 공정 작업과 현재 가용 가능한 장비들의 관계를 그래프로 표현하고 Graph-Centric MARL을 적용하여 전체 작업시간을 최소화할 수 있는 장비운영 스케줄링을 도출하는 기법을 개발하였다. 제시된 방법론은 Fab 스케줄링 문제의 구조적 특성을 학습한 뒤, 생산 공정의 상황이나 계획 변화가 있더라도 (공정의 순서와 장비 조합의 변화) 별도의 학습 과정 없이 혹은 최소한의 학습만으로 새로운 공정에 대한 최적 스케줄링 도출 가능합니다.
□ 반도체 팹의 무인 반송장치 협동 운영기법 개발
반도체 팹은 수백여 대의 무인반송 로봇 (Overhead Transportation System)을 운영하여 Wafer를 다양한 공정을 처리하는 장비들로 운송한다. 이때 웨이퍼의 물동량을 고려하여 유휴 무인반송 로봇을 최적 위치에 배치해야 반송효율이 증대될 수 있습니다. 본 연구는 반도체 팹의 무인반송 로봇의 선로와 시간에 따라 바뀌는 반송 물동량을 동적 그래프로 표현한 후, Graph-Centric MARL을 활용하여 수백여 대의 반송 로봇의 최적 대기 위치를 결정하는 방법을 제안하였습니다. 제안된 기법은 기존 반송 로봇 운영방식과 비교하여 반송에 걸리는 평균 시간을 10% 이상 단축하였습니다.
□ 서비스 로봇 및 물류 로봇들의 작업 순서 스케줄링 기법 도출
가용 가능한 서비스 로봇들을 활용하여 달성해야 하는 임무를 최단 시간에 수행하는 서비스 로봇 운영전략을 도출하는 스케줄링 문제는 조합 최적화 문제의 한 종류인 vehicle routing problem으로 정식화할 수 있습니다. 그중에서도 전체 임무를 달성하는 시간을 최소화하기 위해 여러 로봇의 작업 순서를 최적화하는 문제는 min-max vehicle routing problem (min-max VRP)로 정의할 수 있다. 연구진은 개별 로봇들이 주변 정보를 개별적으로 취합하고 분석한 후, 해당 정보를 주변 로봇들과 공유하며 최적 행동을 분산적으로 도출하는 전략을 도출함. 해당 전략은 중앙 집중식 데이터 취득 없이 복잡한 planning 문제를 해결할 필요가 없기에 보다 큰 문제를 해결 가능. 또한, 환경과 임무의 변동이 있을 때 문제를 다시 풀 필요 없이 대응 가능합니다.