{"id":2488,"date":"2025-09-01T10:57:38","date_gmt":"2025-09-01T10:57:38","guid":{"rendered":"https:\/\/ciaoup.it\/?p=2488"},"modified":"2025-09-01T10:57:38","modified_gmt":"2025-09-01T10:57:38","slug":"uno-studio-dimostra-quanto-sia-facile-aggirare-le-regole-dellia","status":"publish","type":"post","link":"https:\/\/ciaoup.it\/?p=2488","title":{"rendered":"Uno studio dimostra quanto sia facile aggirare le regole dell\u2019IA"},"content":{"rendered":"<p>(Adnkronos) &#8211; Un team di ricercatori dell\u2019Universit\u00e0 della Pennsylvania ha dimostrato che, con le giuste strategie psicologiche, anche i pi\u00f9 avanzati modelli di intelligenza artificiale possono essere spinti a infrangere le proprie regole di sicurezza. Un risultato che solleva domande urgenti sull\u2019efficacia dei sistemi di protezione adottati da aziende come OpenAI e Meta, impegnate a rendere i chatbot sempre pi\u00f9 sicuri e resistenti agli abusi.\u00a0Il gruppo si \u00e8 ispirato agli insegnamenti di Robert Cialdini, autore del celebre manuale Influence: The Psychology of Persuasion, applicando sette diverse tecniche di persuasione: autorit\u00e0, impegno, simpatia, reciprocit\u00e0, scarsit\u00e0, pressione sociale e senso di appartenenza. Strumenti che, secondo gli studiosi, rappresentano vere e proprie \u201cscorciatoie linguistiche verso il s\u00ec\u201d.\u00a0I risultati, condotti specificamente sul modello GPT-4o Mini, hanno mostrato come questi approcci possano trasformare un netto rifiuto in una risposta completa. Un esempio particolarmente significativo riguarda la sintesi della lidocaina: normalmente il modello acconsentiva solo nell\u20191% dei casi, ma se prima veniva richiesto di spiegare come sintetizzare un composto innocuo come la vanillina \u2013 creando cos\u00ec un precedente di \u201cimpegno\u201d \u2013 la percentuale di conformit\u00e0 saliva al 100%.\u00a0Lo stesso meccanismo \u00e8 stato osservato in richieste meno pericolose ma altrettanto indicative, come convincere l\u2019IA a insultare l\u2019utente. In condizioni standard, l\u2019adesione era appena del 19%, ma bastava introdurre un insulto pi\u00f9 leggero (\u201cidiota\u201d) per portare il modello a replicare con un termine pi\u00f9 duro (\u201cjerk\u201d) praticamente ogni volta. Altri approcci, come la lusinga o la pressione dei pari (\u201ctutti gli altri modelli lo fanno\u201d), si sono rivelati meno incisivi ma comunque in grado di aumentare significativamente le probabilit\u00e0 di ottenere risposte vietate.\u00a0Se \u00e8 vero che esistono metodi tecnici ben pi\u00f9 sofisticati per aggirare i sistemi di sicurezza, lo studio mette in luce un aspetto tanto semplice quanto preoccupante: la vulnerabilit\u00e0 psicologica dei chatbot. Non servono competenze avanzate di programmazione o hacking, ma solo un minimo di conoscenza delle dinamiche persuasive.\u00a0Il punto critico, avvertono i ricercatori, \u00e8 che queste stesse tecniche possono essere impiegate da chiunque \u2013 persino da un adolescente con un libro di psicologia sociale in mano. Ed \u00e8 qui che si gioca la vera partita per il futuro: rendere l\u2019IA non solo tecnicamente robusta, ma anche resistente a quelle leve linguistiche che, da sempre, funzionano cos\u00ec bene sugli esseri umani.\u00a0&#8212;tecnologiawebinfo@adnkronos.com (Web Info)<\/p>\n<div style=\"display:flex; gap:10px;justify-content:center\" class=\"wps-pgfw-pdf-generate-icon__wrapper-frontend\">\n\t\t<a  href=\"https:\/\/ciaoup.it?action=genpdf&amp;id=2488\" class=\"pgfw-single-pdf-download-button\" ><img src=\"https:\/\/ciaoup.it\/wp-content\/plugins\/pdf-generator-for-wp\/admin\/src\/images\/PDF_Tray.svg\" title=\"Generate PDF\" style=\"width:auto; height:45px;\"><\/a>\n\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>(Adnkronos) &#8211; Un team di ricercatori dell\u2019Universit\u00e0 della Pennsylvania ha dimostrato che, con le giuste&hellip;<\/p>\n","protected":false},"author":1,"featured_media":2489,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[15],"tags":[2,6],"class_list":["post-2488","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia","tag-adnkronos","tag-tecnologia"],"_links":{"self":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/2488","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2488"}],"version-history":[{"count":1,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/2488\/revisions"}],"predecessor-version":[{"id":2525,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/2488\/revisions\/2525"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/media\/2489"}],"wp:attachment":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2488"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2488"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2488"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}