Erstveröffentlichung:
Hardthöhen-Kurier 03/2024
Letzte Aktualisierung:
24.03.2024
Autoren:
Thomas Doll, Daniel Kallfass
Kaum eine Entwicklung der letzten Jahre hat die Welt derart überrascht, wie die Veröffentlichung von ChatGPT im November 2022, welche in Folge einen weltweiten Boom in der Entwicklung neuer KI-Systeme ausgelöst hat. Der Markt ist sowohl von proprietären als auch von Open Source Sprachmodellen (Large Language Models) geradezu überschwemmt worden. Angeführt wird die Entwicklung überwiegend von den US-amerikanischen Tech-Konzernen OpenAI, Microsoft, Meta und Google. Da multimodale Ansätze zunehmend an Bedeutung gewinnen, können mittlerweile auch Audiosignale, Bilder und Videos von den Modellen verarbeitet werden. Der im Februar 2024 vorgestellte Text-zu-Video Generator SORA beispielsweise wird in Expertenkreisen bereits, als das „nächste große Ding“ bezeichnet.
![](https://novumbellum.org/wp-content/uploads/2024/03/Phantasiebild-Microsoft-Text-zu-Bild-Generator.png)
Zweifelsohne haben all diese Entwicklungen nicht nur Auswirkungen auf dem zivilen Sektor, sondern bieten gleichermaßen auch Raum für militärische Anwendungen. Ausgehend von sich abzeichnenden Trends in der Entwicklung Generativer KI-Systeme beschreibt der vorliegende Artikel einen Ansatz der Streitkräftebasis zur Nutzbarmachung der neuen Technologie in militärischen Umgebungen.
Generative KI-Systeme – Entwicklungen und Trends
Die weltweite Forschung an und Entwicklung von Generativen KI-Systemen ist hochdynamisch. Die besten Köpfe der Welt ringen um technologischen Vorsprung und führende IT-Unternehmen um eine möglichst gute Position am Markt. Das von Microsoft mitfinanzierte Unternehmen OpenAI ist mit seinem KI-Modell GPT 4 derzeit unangefochtener Marktführer. Andere namhafte IT-Unternehmen investieren Milliarden in die Entwicklung eigener Produkte. Nicht zu vergessen die unzähligen Start-up Unternehmen, die mit neuen Ansätzen teilweise auch bemerkenswerte Erfolge verbuchen. Im europäischen Raum fällt vor allem das französische Unternehmen Mistral AI auf, dessen offene Sprachmodelle regelmäßig in den Spitzenrängen des Open LLM Leaderboards gelistet werden. Mistrals neuestes Modell soll unter anderem in der Lage sein, die kulturellen Unterschiede und die sprachliche Vielfalt der europäischen Länder zu erfassen. Es beherrscht fließend Englisch, Französisch, Spanisch, Deutsch und Italienisch und soll zudem über ein „tiefes Verständnis von Grammatik und kulturellem Kontext“ verfügen. Im Folgenden werden drei, für die weitere Betrachtung in diesem Artikel, wichtige Trends in der Entwicklung von Generativen KI-Systemen hervorgehoben.
Lokaler Betrieb: Neben der Weiterentwicklung von Large Language Modellen (LLM) mit mehreren hundert Milliarden Parametern, wie z. B. ChatGPT etabliert sich zunehmend auch die Entwicklung von sogenannten Small Language Modellen (SLM) mit bis zu 10 Milliarden Parametern. SLM haben den Vorteil, dass sie auch auf Endgeräten ausführbar sind. Je nach Größe des SLM kommen leistungsfähige Computer, Laptops, Tablets oder gar Smartphones in Frage. LLM dahingegen können nur auf spezialisierten Rechenclustern betrieben und cloudbasiert angeboten werden. Da sowohl das Training dieser Systeme als auch Ihr Betrieb spezielle Hardware und viel Energie erfordern sind sie entsprechend teuer. Dies erklärt unter anderem, wieso neuere Entwicklungen dieser Art oftmals nur kostenpflichtig angeboten werden.
Spezialisierung: Für spezielle Anwendungen entstehen zunehmend spezialisierte Modelle. Dies wird durch sogenanntes Feintuning der Sprachmodelle mit weiteren Daten einer bestimmten Anwendungsdomäne erreicht wie beispielsweise im Finanzwesen, Versicherungswesen oder Rechtswesen. Regelungen, Gesetze und Vorschriften sind hier so spezifisch, dass sie selbst von den leistungsfähigsten LLM nicht umfassend erfasst werden können. Oftmals sind die für das Training erforderlichen Daten nicht zugänglich oder sind gar unternehmensspezifisch und damit besonders geschützt. Soll dieses und weiteres Wissen im Sprachmodell verfügbar gemacht werden, muss entsprechend nachtrainiert werden.
Halluzination: Alle am Markt verfügbaren Generativen KI-Modelle halluzinieren. Sie geben in Ihren Antworten nicht ausschließlich faktenbasiertes Wissen wieder, sondern neigen dazu Information zu erfinden. Wieso dies geschieht, ist noch nicht gänzlich erforscht. Laienhaft ausgedrückt könnte man sagen, dass sie Zusatzinformation generieren, um eine sprachlich bessere Antwort wiedergeben zu können. Vergleicht man die Modelle der verschiedenen Anbieter, so fällt auf, dass die Neigung zur Halluzination unterschiedlich stark ausgeprägt ist. Man darf vermuten, dass einige Hersteller das Problem bereits besser im Griff haben als andere.
Generative KI-Systeme sind vielseitig einsetzbar und bieten auch im militärischen Bereich zahlreiche Anwendungsmöglichkeiten. Mit KI-Systemen ausgestattete Infanteristen könnten im laufenden Gefecht sprachbasierte Lagedarstellungen abfragen. Sich aus einer Situation ergebende Unklarheiten könnten so rasch beseitigt und der Einsatzerfolg gestärkt werden. Auch die Interaktion mit Unbemannten Systemen könnte verbessert werden. Befehle und Aufträge könnten sprachbasiert erteilt werden. Gleichermaßen könnten Unbemannte Systeme auch selbst Lagemeldungen per Sprache absetzten und damit zu einem besseren Lageverständnis beitragen.
Ein weiteres Anwendungsfeld betrifft die Gefechtsstandarbeit. Berichte, E-Mails oder Folien können in kürzerer Zeit erstellt und der Planungszyklus verkürzt werden. Bei Bedarf könnten Wissensabfragen an das System gerichtet und Entscheidungen fundierter getroffen werden. Faktoren wie Feindlage, Einsatzwert, Kampfkraft, oder Geländebeschaffenheit könnten unmittelbar erfragt und vom System bestimmt und beantwortet werden. Darüber hinaus könnten Generative KI-Systeme helfen ein besseres kulturelles Verständnis zu einem potenziellen Gegner oder Einsatzland zu schaffen.
Potenzial welches das Kommando Streitkräftebasis seit März dieses Jahres in der eigens hierfür aufgelegten Studie „Training und Evaluierung eines KI Chatbot zur Unterstützung von Analysesimulationen in der Anwendung von vorschriftsgemäßen Doktrinen und Taktiken“ untersucht.
KI für Taktik Chat in Simulationssystemen – Eine Untersuchung der SKB
Die Studie „KI für Taktik Chat in Simulationssystemen“ – so der Kurztitel der Studie – soll die Frage beantworten ob durch den Einsatz von Generativen KI-Systemen, die mit taktischen Einsatzgrundsätzen sowie Lageentwicklungen aus Gefechtssimulationen trainiert und als taktisches Assistenzsystem verwendet werden, ein Mehrwert für die Bundeswehr in den Bereichen Ausbildung und Einsatzplanung geschaffen werden kann.
![](https://novumbellum.org/wp-content/uploads/2024/03/Generatives-KI-System.png)
Die eingangs erwähnten Trends zum lokalen Betrieb und zur Spezialisierung fließen in die Untersuchung ein. So sollen vorrangig Modelle betrachtet werden, die den Einsatz auf einsatztauglicher Hardware zulassen und für Ihren Gebrauch mit bundeswehrspezifischen Regelungen und Lageinformationen weitertrainiert werden können. Herangezogen werden alle verfügbaren Regelungen mit taktischem Bezug sowie alle verfügbaren taktischen Lagen. Dies betrifft sowohl Reallagen aus offenen Quellen als auch freigegebene Übungslagen aus Beständen der Bundeswehr. Insbesondere auch historische Lagen sollen in das System eintrainiert werden um bei Bedarf von den hier gewonnen Erkenntnissen antizipieren zu können. Im späteren Verlauf der Studie sollen darüber hinaus auch grafische Informationen wie z. B. Operationspläne oder Lagekarten an das Modell übergeben werden.
Mit dem Phänomen des Halluzinierens soll ergebnisoffen umgegangen werden. Es gilt nach Lösungen und Konzepten zu suchen, die den Menschen bei der Gefechtsstandarbeit unterstützen, Systemfehler aber ausschließen. Ein besonderes Augenmerk liegt hierbei auf der Mensch-Maschine-Interaktion. Der Mensch wird in seinem Handeln nicht ersetzt, sondern lediglich unterstützt. Er bleibt für sein Tun verantwortlich und muss die vom System vorgeschlagenen Lösungen bewerten können. Zu Prüfen bleibt, ob im Umgang mit KI-Systemen ausgebildete Soldaten Halluzinationen als solche erkennen können. Dessen ungeachtet wird die Studie auch untersuchen, wie sich am Markt verfügbare Generative KI-Systeme diesbezüglich in naher Zukunft weiterentwickeln. Aktuell liegt die Halluzinationsrate von GPT 4 noch bei 3%, andere Systeme schneiden schlechter ab. Nicht auszuschließen ist jedoch, dass die aktuell global stattfindenden Anstrengungen zur Eingrenzung des Problems weitere Erfolge verzeichnen können.
Die Studie „KI für Taktik Chat in Simulationssystemen“ steht im direkten Zusammenhang mit der in den Jahren 2021 und 2022 durchgeführten Studie „Reinforcement Learning für komplexe Gefechtssituationen (ReLeGs)“. Hier wurde untersucht, ob ein KI-Agent in einer Gefechtsfeldsimulation so trainiert werden kann, dass einem Operateur im Rahmen der Einsatzplanung Hinweise zu möglichen Handlungsoptionen unterbreitet werden können. Die Studie konnte auch ohne den Einsatz eines Generativen KI-Systems (ChatGPT kam erst Ende 2022 auf den Markt) Anfang 2022 mit positivem Ergebnis abgeschlossen werden und liefert für das neu zu erstellende Generative KI-System, die erforderlichen Gefechtsfeldsimulationsanteile.
In Umsetzung der Studie sind zunächst am Markt verfügbare und für die Untersuchung geeignete Generativen KI-Modelle zu identifizieren und mit ihren jeweiligen Grenzen, Vor- und Nachteilen gegeneinander abzuwägen. Ein weiterer wichtiger Arbeitsschritt betrifft die Zusammenstellung, Auswahl und Aufbereitung der erforderlichen Trainingsdaten. Sind alle Entscheidungen zum KI-Modell und den zu verwendenden Trainingsdaten getroffen beginnt die prototypische Realisierung und das eigentliche Training des Generativen KI-Systems für Doktrinen und Taktiken. Nach Abschluss dieser Phase sollte es möglich sein, taktische Fragen an das Sprachmodell zu richten. Das Modell sollte diese mit fundiertem Wissen aus den eintrainierten Regelungen und Lagen beantworten können.
Die in die Studie zusätzlich integrierte Machbarkeitsuntersuchung erfordert den Aufbau einer Test- und Versuchsumgebung, bei der das Sprachmodell in die ReLeGs-Gefechtsfeldsimulation integriert wird. Mit automatisiert generierten grafischen Gefechtslagen soll das Sprachmodell weiter trainiert werden, sodass anschließend auch taktische Fragen im Kontext einer aktuellen Lage sinnvoll beantwortet werden können. Eben dieser Schritt grenzt die Untersuchung von anderen ab, weil hier eine Funktionalität getestet wird, die es so in vergleichbarer Form derzeit nicht gibt. Fertig trainierte Generative KI-Systeme können nach Validierung und Freigabe später auch in C2 Systemen integriert werden.
Auftragnehmer der Studie ist die Airbus Defence and Space, welche in Friedrichshafen am Bodensee mit der Abteilung „Operational Analysis and Studies“ seit über 40 Jahren eine Forschungs- und Studieneinrichtung mit Schwerpunkt Operations Research (OR) und Modellbildung und Simulation (M&S) betreibt. Neben der Entwicklung und Anwendung von militärischen Simulationsumgebungen werden seit 2018 auch KI-Verfahren zur Entscheidungsunterstützung erforscht. In den Studien „Reinforcement Learning für Komplexe Gefechtssituationen“ und „KI für taktische UAS“ beispielsweise konnte ein AlphaStar (DeepMind) basierter Ansatz erfolgreich auf eine militärische Gefechtssimulation übertragen werden. In Fortführung dieser Arbeiten sollen nun offene Sprachmodelle mit militärischem Wissen spezialisiert und an Simulationssysteme gekoppelt werden. Dieser Ansatz kann für ein breites Spektrum militärischer Anwendungen genutzt werden.
Die Studie wird zudem durch das Berliner KI Start-up deepset unterstützt, welches das Open Source End-to-End LLM-Framework „Haystack“ zur Erstellung spezialisierter LLM-basierter Anwendungen für Geschäftskunden entwickelt hat. Um Halluzinationen in LLM zu reduzieren, setzt das Unternehmen sogenannte „Retriever-Augmentation-Systeme“ (RAG) ein. Anstatt sich ausschließlich auf generierte Inhalte zu verlassen, können RAG-Systeme über einen Abgleich mit vertrauenswürdigen Informationen sicherstellen, dass die generierten Antworten auf fundiertem Wissen basieren. Dieser Ansatz ermöglicht eine bessere Kontrolle über die Qualität und Richtigkeit der generierten Inhalte, wodurch das Risiko von Halluzinationen deutlich minimiert wird. Zudem können Zitate mit Quellangaben versehen werden.
Fazit
Mit den in jüngster Vergangenheit erreichten technologischen Durchbrüchen in der Künstlichen Intelligenz, in der Biomedizin oder auch beim Quantencomputing, zeichnen sich einschneidende globale Veränderungen ab. Experten sprechen von einer nächsten Welle industrieller Revolution, die zunehmend auf globaler Ebene stattfinden wird und alles Bisherige in den Schatten stellt. Die Art und Weise, wie sich große IT-Konzerne aktuell ausrichten und wie um Marktanteile auf dem noch neuen KI-Sektor gerungen wird, ist hierfür ein gutes Indiz. Die Geschwindigkeit mit der das Potenzial der neuen KI-Technologie gehoben wird, ist atemberaubend. Kaum eine Woche vergeht, in der nicht ein weiteres bahnbrechendes Produkt oder eine innovative Lösung veröffentlicht wird.
Neben den vielen positiven Aspekten, die von dieser Entwicklung ausgehen, sollte nicht verschwiegen werden, dass von neuen Technologien immer auch neue Gefahren ausgehen. In der Biomedizin die genetische Manipulation menschlichen Erbguts beispielsweise. Bei der Künstlichen Intelligenz die Gefahr einer mit Deep Fakes verseuchten Medienlandschaft bis hin zur Wahlmanipulation im großen Stil. Sicherlich keine guten Aussichten. Gesellschaftlich müssen wir diese und auch alle anderen Gefahren ernst nehmen und verantwortungsbewusst agieren. Tendenziell lässt sich ableiten, dass die Welt unsicherer wird. Der äußeren Sicherheit kommt damit noch mehr Bedeutung zu, als dies seit der Zeitenwende ohnehin schon der Fall ist.
Der Bund stellt zur Verteidigung Streitkräfte auf. Damit diese ihren Auftrag ausführen können müssen sie State of the Art ausgestattet und ausgebildet sein. Weiterentwicklung und Automatisierung haben hierbei schon immer eine wichtige Rolle gespielt. Setzt dieser Prozess erst im Verteidigungsfall ein, ist es längst zu spät. Die in der zivilen KI-Entwicklung derzeit stattfindenden Innovationssprünge wirken sich unmittelbar auch auf militärische Fähigkeiten aus. Ohne gezielte Forschung und Eigenentwicklung können diese nicht adaptiert werden. Die Studie „KI für Taktik Chat in Simulationssystemen“ der SKB leistet genau diesen Beitrag. Sie stellt sicher, dass die Bundeswehr frühzeitig neue Technologien vorantreibt und nicht von ungeahnten Fähigkeiten des Gegners auf dem Gefechtsfeld überrascht wird.