
KPMG wycofuje raport o AI po śledztwie, które wykazało, że był pełen halucynacji AI i fałszywych cytatów
Szeroko rozpowszechniony raport KPMG promujący wykorzystanie agentowego AI został wycofany z niektórych stron internetowych po tym, jak śledczy z GPTZero odkryli, że połowa jego twierdzeń była fałszywa lub błędnie przypisana, a tylko pięć z 45 cytatów wskazywało na prawdziwe źródła.
Co opublikował KPMG
W październiku ubiegłego roku KPMG opublikował raport zatytułowany Total Experience: Redefining Excellence in the Age of Agentic AI, który szczegółowo opisywał, w jaki sposób firmy wykorzystują sztuczną inteligencję do obsługi klientów. Firma doradcza, jedna z Wielkiej Czwórki firm audytorsko-doradczych obok Deloitte, PricewaterhouseCoopers i Ernst & Young, przedstawiła dokument jako zaufane badanie branżowe. Według Financial Times, raport został później wycofany z niektórych stron internetowych po tym, jak KPMG został powiadomiony o problemach.
Co wykazało śledztwo
Śledczy z GPTZero, twórcy narzędzi do wykrywania treści generowanych przez AI, przeanalizowali raport i odkryli, że nieścisłości i fałszywe przypisy były powszechne. Spośród 45 cytatów w dokumencie tylko pięć dokładnie wskazywało na prawdziwe źródła. Dwadzieścia osiem cytatów parafrazowało tytuły lub dodawało zmyślone elementy do autentycznych odniesień, podczas gdy dwanaście było sformułowanych zbyt niejasno, aby ustalić, czy w ogóle istniały. GPTZero ukuł termin „vibe citing” na określenie zjawiska generowania przez modele AI wiarygodnie wyglądających, ale fałszywych odniesień. Zespół doszedł również do wniosku, że mniej więcej połowa merytorycznych twierdzeń w raporcie była fałszywa lub błędnie przypisana, co prawdopodobnie wynikało z nadmiernego dostosowania się narzędzia badawczego AI do polecenia znalezienia przykładów agentowego AI.
- Dokładne
- 5 cytaty
- Sparafrazowane lub częściowo zmyślone
- 28 cytaty
- Zbyt niejasne, aby zweryfikować
- 12 cytaty
Trzy sporne studia przypadków
Kilka organizacji wymienionych w raporcie publicznie sprostowało informacje. KPMG twierdził, że Emirates uruchomiło mobilnego chatbota o imieniu Sara, który mógł rozmawiać z pasażerami i zmieniać ich loty. W rzeczywistości Sara była asystentem mobilnym wprowadzonym w 2023 roku, a nie chatbotem opartym na AI i nigdy nie miała możliwości zmiany rezerwacji. KPMG napisał również, że UBS zintegrował agentowe AI w swoich funkcjach doradztwa inwestycyjnego, zarządzania ryzykiem i monitorowania zgodności. Rzecznik UBS powiedział Financial Times, że informacje te są „faktycznie nieprawdziwe”. Szwajcarskie Koleje Federalne (SBB) rzekomo zatrudniały agentów AI, którzy pomagają pasażerom planować, rezerwować i optymalizować podróże na podstawie preferencji, warunków w czasie rzeczywistym i wpływu na emisję dwutlenku węgla; rzecznik SBB powiedział, że twierdzenie to jest „nieprawdziwe”. The Irish Times dodał, że raport zawierał również fałszywe studium przypadku dotyczące brytyjskiej Narodowej Służby Zdrowia.
Szersze konsekwencje
Dyrektor generalny GPTZero, Edward Tian, ostrzegł, że pełne błędów publikacje Wielkiej Czwórki mogą „zatruć studnię informacji”. Ponieważ raporty firm takich jak KPMG są traktowane jako wysoce wiarygodne źródła, są one rutynowo cytowane w innych pracach badawczych, artykułach prasowych i wpisach na blogach. Najnowsze śledztwo GPTZero wykazało również, że część zdyskredytowanych treści była już wchłaniana przez duże modele językowe, co grozi dalszym rozprzestrzenianiem się. Ten epizod następuje po podobnym ujawnieniu w 2025 roku, w którym badanie Prezydenckiej Komisji USA „Make America Healthy Again” zawierało zniekształcone lub zmyślone przypisy.
Vibes mają konsekwencje.
The Irish Times zauważył, że incydent wskazuje na strukturalny problem: AI pozwala firmom doradczym szybko tworzyć raporty, ale gdy nikt nie sprawdza faktów, powstałe dokumenty mogą amplifikować dezinformację w całym ekosystemie wiedzy.


