Der amerikanische Gigant im Bereich der künstlichen Intelligenz, OpenAI, hat offiziell das Modell GPT-5.4 eingeführt und damit eine bahnbrechende Funktion zur nativen Computersteuerung vorgestellt. Die neue Architektur ermöglicht es der KI, eigenständig Mauszeiger, Tastatur und Anwendungen zu bedienen, was einen Meilenstein auf dem Weg zu autonomen Agenten darstellt. Das System debütiert in den Versionen Pro und Thinking und bietet Rekordleistung bei professionellen Aufgaben sowie eine tiefe Integration mit Tabellenkalkulationsprogrammen wie Microsoft Excel und Google Sheets.
Computersteuerung durch KI
Das Modell GPT-5.4 kann eigenständig Mauszeiger und Anwendungen im Betriebssystem bedienen.
Integration mit Tabellenkalkulation
Neue Finanz-Plug-ins ermöglichen die Automatisierung der Arbeit in Microsoft Excel und Google Sheets.
Varianten Pro und Thinking
Das System bietet zwei Arbeitsmodi: Geschwindigkeit für Profis und tiefgreifendes Verständnis für komplexe Aufgaben.
Reduzierung sprachlicher Manierismen
Die Version 5.3 Instant wurde modifiziert, um Antworten natürlicher und weniger schematisch zu gestalten.
Das amerikanische Unternehmen OpenAI hat einen bedeutenden Schritt in der Entwicklung von KI-Systemen gemacht, indem es das Modell GPT-5.4 verfügbar gemacht hat. Die Schlüsselinnovation, die diese Lösung von ihren Vorgängern unterscheidet, ist der native Computersteuerungsmodus. Dadurch verwandelt sich ChatGPT von einem bloßen Textgenerator in einen aktiven autonomen Agenten, der Daten zwischen Fenstern kopieren, Dateien verwalten und komplexe Operationen in einer grafischen Umgebung ausführen kann. Der Hersteller legte einen besonderen Schwerpunkt auf den Finanzsektor, indem er dedizierte Plug-ins für Microsoft Excel und Google Sheets einführte, die eine blitzschnelle Datenanalyse und die Automatisierung der Berichterstattung ermöglichen sollen. Parallel dazu hat das Unternehmen das Basismodell auf die Version 5.3 Instant aktualisiert und reagiert damit auf Beschwerden von Nutzern über einen unnatürlichen Sprachstil und die Tendenz, nervige sprachliche Manierismen zu wiederholen. Seit der Revolution, die 2020 mit dem Modell GPT-3 begann, hat sich die Entwicklung der künstlichen Intelligenz von der einfachen Vorhersage des nächsten Wortes hin zu Systemen entwickelt, die Code schreiben und die gesamte digitale Infrastruktur verwalten können.Interne Tests von OpenAI deuten darauf hin, dass GPT-5.4 in Aufgaben, die Expertenwissen erfordern, Ergebnisse erzielt, die 83 % besser sind als die menschlicher Spezialisten. Die neue Angebotsstruktur teilt sich in die Variante Pro, die für tägliche Hochleistungsarbeit gedacht ist, und die Variante Thinking, die für mehrstufiges Denken und die Echtzeitüberprüfung von Fehlern optimiert ist. Diese strategische Premiere wird als Versuch gesehen, die Marktinitiative angesichts des wachsenden Drucks durch das konkurrierende Modell Claude des Unternehmens Anthropic zurückzugewinnen. Entwickler erhalten Zugang zu einer günstigeren und schnelleren API, was die Einführung der neuen Technologie in der Wirtschaft beschleunigen soll. Die zunehmende Autonomie von KI-Systemen wirft jedoch Fragen zur Betriebssicherheit auf. OpenAI versichert, dass implementierte Sicherheitsprotokolle verhindern, dass das Modell unbefugte destruktive Aktionen unternimmt, und dass jede Sitzung im Computerssteuerungsmodus vollständig vom Nutzer überwacht und jederzeit unterbrochen werden kann. Die Premiere von GPT-5.4 fällt mit der globalen Debatte über Rechtsvorschriften zur Transparenz von Algorithmen und zum Schutz der Privatsphäre von Daten zusammen, die von intelligenten Bots verarbeitet werden. Das neue Modell soll nicht nur bessere Antworten liefern, sondern vor allem Mitarbeiter bei sich wiederholenden, mühsamen digitalen Prozessen ersetzen, was eine Herausforderung für das traditionelle Büroarbeitsmodell darstellt.