Bár a mesterséges intelligencia talán uralni próbálja a világot, a macskák titkos trükkjeivel nem bír el.

Amerikai kutatók szerint ha a mesterséges intelligenciának szánt utasításokhoz ártalmatlannak tűnő mondatokat ad a felhasználó, még a legerősebb modelleket is hibára tudja kényszeríteni. A szakemberek egy macskás példát is hoztak erre.
Az amerikai Stanford Egyetem kutatói, akik a ServiceNow és a Collinear AI nevű cégekkel együttműködnek, érdekes eredményekre jutottak a mesterséges intelligencia és a matematikai problémák kapcsolatában. Megállapították, hogy a matematikai feladatokhoz csatolt véletlenszerű mondatok jelentősen megnövelik a fejlett AI modellek hibázási arányát. A kutatók hangsúlyozzák, hogy míg az emberek könnyedén el tudják választani a lényeges információt a zavaró tényezőktől, a mesterséges intelligencia számára ezek a felesleges mondatok óriási zűrzavart okoznak. Például, ha az AI egy olyan mondattal találkozik, mint hogy...
Íme egy egyedibb megfogalmazás: "Meglepő, de a macskák napjának jelentős részét álomban töltik, szinte úgy tűnik, hogy az alvás az egyik legfontosabb tevékenységük."
A CatAttack néven ismert automatizált támadási mechanizmus egy innovatív megközelítést alkalmaz, amely során először gyengébb mesterséges intelligencia modelleken teszteli a zavart okozó kifejezéseket. Ha ezek a kísérletek sikeresnek bizonyulnak, akkor a támadásokat a fejlettebb rendszerek, mint például a DeepSeek R1 ellen is bevetik – számol be erről a The Deep View. Ez a folyamat nemcsak a hibák azonosítására szolgál, hanem arra is rávilágít, milyen mértékben érzékeny a mesterséges intelligencia érvelési rendszere a különböző támadásokra. Az eredmények arra figyelmeztetnek, hogy a mesterséges intelligencia nem annyira sebezhetetlen, mint ahogyan azt sokan gondolják.
Az arXiv preprint platformján megjelent tanulmány szerint:
Az érvelési modellek alkalmazása egyre elterjedtebb az oktatási szoftverek, programozási segédletek és döntéstámogató rendszerek világában, ahol a precizitás kiemelkedő jelentőséggel bír. A CatAttack példája világosan illusztrálja, hogy még a látszólag ártalmatlan információs zaj is képes megingatni a megbízhatóságot, különösen akkor, amikor a pontosság mindenek felett áll.