Im proto_lab wird seit beinahe zwei Jahren an der intelligenten Planung von Produktionsressourcen mithilfe von KI geforscht. So sollen Fertigungsaufträge je nach Prozessschritt Maschinen mit freien Kapazitäten automatisch zugeteilt werden. Nun konnten die Arbeitsergebnisse zum Auftragsplanungsproblem Job Shop Scheduling Problem (JSSP) als wissenschaftliches Paper über MDPI (Herausgeber von wissenschaftlichen Open-Access-Fachzeitschriften) veröffentlicht werden. JSSP fällt in die Kategorie der NP-schweren kombinatorischen Optimierungsprobleme (COP), bei denen eine Lösung des Problems durch erschöpfende Suche nicht mehr möglich ist. Häufig werden dann einfache Heuristiken wie First-In, First-Out, Largest Processing Time First und Metaheuristiken wie die Tabu-Suche eingesetzt. Diese Methoden sind bei sehr komplexen Problemen aber ineffizient, da sie entweder weit vom Optimum entfernt sind oder viel Zeit in Anspruch nehmen. In den letzten Jahren hat Deep Reinforcement Learning (DRL) zur Lösung von COPs an Bedeutung gewonnen und es gibt im Bereich der KI-Forschung vielversprechende Ergebnisse in Bezug auf Lösungsqualität und Recheneffizienz.
Im proto_lab wurde ein neuartiger Ansatz zur Lösung des JSSP entwickelt, der die Verallgemeinerung der Ziele und die Effektivität der Lösung mit DRL untersucht. Es wird der Proximal Policy Optimization (PPO) Algorithmus angewandt, der das Policy-Gradient-Paradigma übernimmt, das sich bei der eingeschränkten Disposition von Aufträgen bewährt hat. Um ein besseres verallgemeinertes Lernen des Problems zu erreichen, wurde eine neue Methode namens Order Swapping Mechanism (OSM) in die Umgebung integriert. In der Publikation wird die Leistung des vorgestellten Ansatzes eingehend analysiert, indem eine Reihe verfügbarer Benchmark-Instanzen verwendet und die Ergebnisse mit den Arbeiten anderer Gruppen verglichen werden.
Link zum Paper