{"id":19717,"date":"2025-10-20T15:28:34","date_gmt":"2025-10-20T15:28:34","guid":{"rendered":"https:\/\/ciaoup.it\/?p=19717"},"modified":"2025-10-20T15:28:34","modified_gmt":"2025-10-20T15:28:34","slug":"comunicato-stampa-sponsorizzato-non-solo-eccitazione-per-lia-nel-campo-della-compliance-ora-anche-risultati-con-progressi-evidenti-nei-modelli-di-ultima-generazione","status":"publish","type":"post","link":"https:\/\/ciaoup.it\/?p=19717","title":{"rendered":"COMUNICATO STAMPA SPONSORIZZATO &#8211; Non solo eccitazione per l&#8217;IA nel campo della compliance, ora anche risultati &#8211; con progressi evidenti nei modelli di ultima generazione"},"content":{"rendered":"<p> (Immediapress) &#8211;<br \/>\nMONACO DI BAVIERA, GERMANIA &#8211; EQS Newswire &#8211; 20 ottobre 2025 &#8211; L&#8217;intelligenza artificiale sta entrando rapidamente a far parte dei flussi di lavoro aziendali \u2013 ma non tutti i modelli danno gli stessi risultati. Per valutare in che misura l&#8217;IA possa essere applicata nella realt\u00e0 della compliance, il nuovo \u2018EQS Benchmark Report: AI Performance in Compliance &amp; Ethics\u2019 ha testato sei tra i principali modelli di IA con 120 scenari di compliance del mondo reale \u2013 da valutazioni di rischi e conflitti di interessi ad audit di terze parti. I risultati evidenziano una precisione quasi perfetta con tassi di accuratezza superiori al 95% nelle operazioni strutturate, come classificazione e processo decisionale, ma un notevole peggioramento in caso di maggiore complessit\u00e0 o ambiguit\u00e0. Realizzato in collaborazione con l&#8217;associazione tedesca Berufsverband der Compliance Manager e.V. (BCM), nel benchmark risulta chiaramente anche il ritmo serrato dello sviluppo, con una performance significativamente superiore dei modelli del 2025 rispetto a quelli del 2024.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\u201cPer molti responsabili della conformit\u00e0, l&#8217;IA continua a rimanere un territorio poco familiare,\u201d spiega Moritz Homann, Director of Product Innovation and AI di EQS Group. \u201cCapire come applicarla in modo efficace e quando ce se possa fidare pu\u00f2 essere difficile \u2013 soprattutto in un ambito sensibile come la compliance, dove non ci sono compromessi in termini di accuratezza, trasparenza e integrit\u00e0.\u201d\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\u201cNel campo della compliance l&#8217;IA pu\u00f2 offrire nuovi livelli di comprensione, ma la nostra responsabilit\u00e0 \u00e8 assicurare che il suo impiego rimanga soggetto a chiari limiti etici e legali,\u201d sottolinea Dr. Gisa Ortwein, la Presidente di BCM. \u201cIniziative come questa valutazione ci aiutano a distinguere tra cosa possa davvero fornire l&#8217;IA e i casi in cui invece il giudizio umano \u00e8 insostituibile. In questo modo salvaguardiamo l&#8217;integrit\u00e0 accogliendo l&#8217;innovazione \u2013 e assicuriamo che l&#8217;adozione dell&#8217;IA faciliti la nostra professione, anzich\u00e9 metterla a rischio.\u201d\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>Il benchmark EQS \u00e8 il primo a valutare l&#8217;IA nel campo della compliance, utilizzando operazioni che riflettono le responsabilit\u00e0 quotidiane dei professionisti di compliance ed etica. Esso misura accuratezza del modello, affidabilit\u00e0 e utilit\u00e0 pratica in prove strutturate, semistrutturate e aperte. \u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nLa performance dei modelli pi\u00f9 recenti \u00e8 molto superiore a quella dei modelli usciti solo pochi mesi prima<br \/>\n\u00a0<\/p>\n<p>Gli esiti della valutazione sottolineano la rapidit\u00e0 di evoluzione delle capacit\u00e0 dei modelli. Gemini 2.5 Pro di Google ha raggiunto il punteggio complessivo pi\u00f9 alto di 86,7%, mostrando una performance valida in tutti i tipi di operazioni e di aspetti della compliance. Con un punteggio complessivo dell&#8217;86,5%, GPT-5 di OpenAI (il modello standard di ChatGPT dall&#8217;agosto 2025) \u00e8 simile a Gemini nella maggior parte delle categorie, evidenziando una rapida convergenza delle capacit\u00e0 dei migliori modelli. GPT-5 ha registrato una performance particolarmente buona nella creazione di contenuti aperti, mentre Gemini si \u00e8 dimostrato superiore in complessi compiti di analisi e in processi decisionali.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>Segue o3 di OpenAI con una performance dell&#8217;83,3% che mostra chiaramente il progresso di GPT-5 rispetto al modello precedente e anche il rapido ciclo iterativo caratteristico di questo settore. Claude Opus 4.1 di Anthropic ha raggiunto un punteggio dell&#8217;81,5%, con una performance inferiore nelle analisi strutturate e nel ragionamento analitico, mentre all&#8217;ultimo posto si trovano GPT-4o (72,9%) e Mistral Large 2 (70,1%). I risultati riflettono il significativo salto generazionale tra i modelli lanciati nel 2024 e quelli del 2025.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nNella compliance l&#8217;IA eccelle se le regole sono chiare, ma incontra problemi in caso di ambiguit\u00e0<br \/>\n\u00a0<\/p>\n<p>In linea generale i modelli di IA hanno dato i risultati migliori in compiti di compliance strutturati e lineari. Ad esempio, la performance media \u00e8 stata del 90,8% in scenari di processi decisionali basati su una situazione definita e una serie di norme o regolamenti. In compiti che richiedevano di confrontare o stabilire corrispondenze tra set di dati, i modelli hanno raggiunto un punteggio medio del 91,8% e quattro dei sei modelli hanno superato il 95%. \u00a0<\/p>\n<p>\u00a0<\/p>\n<p>I diversi modelli hanno invece fatto registrare performance molto differenziate nelle operazioni pi\u00f9 complesse. Il divario si \u00e8 dimostrato particolarmente grande nelle prove che richiedevano l&#8217;analisi di dati, con una differenza di 60 punti tra i risultati migliori e quelli peggiori. In questa categoria, Gemini 2.5 Pro ha raggiunto un punteggio dell&#8217;88%, seguito da GPT-5 con il 62% \u2013 mentre GPT-4o si \u00e8 classificata all&#8217;ultimo posto con soltanto il 28%. \u00a0<\/p>\n<p>\u00a0<\/p>\n<p>Le prove aperte, come la redazione di briefing esecutivi o rapporti su indagini interne, si sono rivelate piuttosto difficili anche per i modelli pi\u00f9 recenti. I risultati migliori in questa categoria sono stati raggiunti da GPT-5 con un punteggio del 67,4%. A differenza delle prove strutturate, questi compiti sono stati valutati da una giuria composta di persone.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\u201cCi sono alcuni compiti ad alto rischio che i professionisti della compliance non ritengono opportuno affidare completamente all&#8217;IA, e non dovrebbero nemmeno farlo,\u201d commenta Moritz Homann. \u201cL&#8217;efficacia degli strumenti basati sull&#8217;IA risiede nell&#8217;effetto di moltiplicatore di forze, con supporto dei flussi di lavoro della compliance lasciando ai professionisti per\u00f2 la responsabilit\u00e0 ultima e il giudizio. L&#8217;IA pu\u00f2 assumersi una buona parte del lavoro preparatorio, anche nel caso di casi altamente complessi. Permette cos\u00ec di risparmiare tempo prezioso nelle operazioni preliminari di routine e consente agli esperti di concentrarsi sui punti per i quali il loro giudizio \u00e8 indispensabile.\u201d\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nElevata coerenza e basso tasso di allucinazioni<br \/>\n\u00a0<\/p>\n<p>Il benchmark ha testato anche l&#8217;affidabilit\u00e0 facendo ripetere a ogni modello per tre volte i compiti a scelta multipla. La coerenza \u00e8 stata elevata,e la maggior parte dei modelli ha fornito lo stesso risultato in oltre il 95% dei casi. Le allucinazioni, uno dei rischi pi\u00f9 criticati dell&#8217;IA, sono state rare: in tutte le prove e i modelli ne sono stati registrati solo tre casi ovvi, con un tasso pari soltanto allo 0,71%. Ci\u00f2 significa che, se i compiti vengono definiti e contestualizzati chiaramente, i modelli attuali sono in grado di fornire risultati stabili e basati sui fatti negli scenari di compliance. Tuttavia non \u00e8 possibile escludere completamente le allucinazioni, pertanto la supervisione umana rimane essenziale &#8211; specialmente nel caso di contenuti sensibili con implicazioni normative.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nSelezione dei modelli e conseguenze dell&#8217;influsso della formulazione dei prompt<br \/>\n\u00a0<\/p>\n<p>Il rapporto ha evidenziato anche l&#8217;importanza della specificit\u00e0 dei prompt. Nei compiti nei quali ai modelli di IA \u00e8 stato richiesto di individuare red flag dai dati di audit di terze parti, i risultati sono stati diversi a seconda dell&#8217;accuratezza nella formulazione della domanda, ad esempio esplicitando se includere entit\u00e0 affiliate o valutare la gravit\u00e0 delle informazioni trovate. I modelli pi\u00f9 recenti &#8211; GPT-5 e Gemini 2.5 Pro &#8211; hanno mostrato una maggiore capacit\u00e0 di seguire istruzioni complesse e fornire risultati strutturati, con vantaggi chiari per i team di compliance che operano con regolamenti diversificati e set di dati estesi.\u00a0<\/p>\n<p>Moritz Homann: \u201cL&#8217;IA \u00e8 destinata ad affermarsi &#8211; e il modo in cui la implementiamo e utilizziamo oggi sar\u00e0 determinante per il suo ruolo nell&#8217;ambito della compliance negli anni futuri. I team di compliance ed etica non dovrebbero solo tenere sotto controllo i rischi dell&#8217;IA, ma anche applicare loro stessi questa tecnologia. Solo impiegando l&#8217;IA nella pratica possiamo imparare a fare le domande giuste, definire limiti di sicurezza efficienti e creare fiducia. Il nostro obiettivo \u00e8 sostenere questo processo con strumenti pratici, trasparenza e dialogo.\u201d\u00a0<\/p>\n<p>La versione integrale del Benchmark Report di EQS sull&#8217;IA pu\u00f2 essere scaricata dal sito: https:\/\/www.eqs.com\/compliance-wpapers\/ai-performance-compliance-ethics-eqs\/<br \/>\n\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nMetodologia<br \/>\n\u00a0<\/p>\n<p>Il Benchmark Report di EQS sull&#8217;IA ha testato sei modelli linguistici di grandi dimensioni, e cio\u00e8 GPT-5 di OpenAI, GPT-4o e o3, Gemini 2.5 Pro di Google, Claude Opus 4.1 di Anthropic e Mistral Large 2, con 120 operazioni che coprivano dieci ambiti essenziali della compliance. Erano incluse tematiche quali la valutazione dei rischi, la verifica di casi di segnalazioni, l&#8217;efficienza dell&#8217;apprendimento, la valutazione dei regolamenti e l&#8217;analisi di lacune normative.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>Il set di prove \u00e8 stato preparato in base a indicazioni di professionisti della compliance e ha compreso sia contenuti del mondo reale che contenuti sintetici come set di dati HR, risultati di apprendimento e testi di regolamenti. Alcuni compiti avevano una risposta oggettivamente corretta, mentre altri richiedevano un approccio pi\u00f9 soggettivo e incentrato sulle persone per essere considerati nel punteggio. Per questo motivo i risultati aperti sono stati valutati con il sostegno di Berufsverband der Compliance Manager (BCM), i cui membri hanno contribuito a un&#8217;analisi professionale e al feedback sulla qualit\u00e0 e sull&#8217;utilit\u00e0 delle risposte generate dai modelli.\u00a0<\/p>\n<p>\nInformazioni su EQS Group<br \/>\n\u00a0<\/p>\n<p>EQS Group \u00e8 uno dei principali fornitori internazionali di cloud per compliance ed etica, protezione dei dati, gestione della sostenibilit\u00e0 e relazioni con gli investitori. Oltre 14.000 aziende di tutto il mondo impiegano i prodotti di EQS Group per creare fiducia grazie al rispetto affidabile e sicuro di requisiti legali complessi, alla riduzione dei rischi e al reporting trasparente sui risultati dell&#8217;attivit\u00e0 e sul relativo impatto su societ\u00e0 e ambiente.  \u00a0<\/p>\n<p>\u00a0<\/p>\n<p>Le soluzioni di EQS Group sono riunite in una piattaforma su base cloud. Questa permette di trattare in modo professionale processi di ottemperanza per la tutela dei whistleblower e la coordinazione dei casi, gestione della propria policy e processi di approvazione come anche nel caso di partner d&#8217;affari, terzi e rischi, insider list e obblighi di comunicazione. Inoltre EQS Group fornisce software per rispondere a requisiti di due diligence in termini di diritti umani in tutte le catene di fornitura aziendali, assicurando il rispetto delle disposizioni di tutela dei dati come il RGPD e il Regolamento europeo sull&#8217;intelligenza artificiale, inoltre supporta un&#8217;efficiente gestione ESG e un reporting di sostenibilit\u00e0 conforme. Le aziende registrate traggono inoltre vantaggio da una rete globale, un modo mirato di rivolgersi agli investitori e una gestione dei contatti come anche da siti web e webcast IR per una comunicazione efficiente e sicura con gli investitori.\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>EQS Group \u00e8 stato costituito a Monaco di Baviera nel 2000. Oggi il gruppo conta circa 600 professionisti in tutto il mondo. \u00a0<\/p>\n<p>\nhttps:\/\/www.eqs.com\/<br \/>\n\u00a0<\/p>\n<p>\u00a0<\/p>\n<p>\nInformazioni su BCM<br \/>\n\u00a0<\/p>\n<p>In qualit\u00e0 di principale associazione di professionisti, solamente per responsabili della conformit\u00e0 interni di aziende, associazioni e altre organizzazioni, BCM rappresenta gli interessi dei propri membri nei rapporti con decisori politici, mondo degli affari e societ\u00e0. BCM si dedica principalmente a fornire informazioni, promuovere di reti e rafforzare la professione di responsabile della conformit\u00e0. Offre un&#8217;ampia gamma di servizi gratuiti studiati per l&#8217;aggiornamento dei membri in merito alle attuali tematiche di compliance e per la promozione e lo sviluppo continuo della condivisione di conoscenze all&#8217;interno della propria rete.\u00a0<\/p>\n<p>\nwww.compliance-verband.de<br \/>\n\u00a0<\/p>\n<p>\nContatti:<br \/>\nImmediapress<br \/>\nhttps:\/\/www.eqs.com\/<\/p>\n<p>www.compliance-verband.de<br \/>\n\u00a0<\/p>\n<\/p>\n<p>COMUNICATO STAMPA SPONSORIZZATO: Immediapress &#232; un servizio di diffusione di comunicati stampa in testo originale redatto direttamente dall&#8217;ente che lo emette. L&#8217;Adnkronos e Immediapress non sono responsabili per i contenuti dei comunicati trasmessi<\/p>\n<p>&#8212;<\/p>\n<p>immediapress<\/p><\/p>\n<div style=\"display:flex; gap:10px;justify-content:center\" class=\"wps-pgfw-pdf-generate-icon__wrapper-frontend\">\n\t\t<a  href=\"https:\/\/ciaoup.it?action=genpdf&amp;id=19717\" class=\"pgfw-single-pdf-download-button\" ><img src=\"https:\/\/ciaoup.it\/wp-content\/plugins\/pdf-generator-for-wp\/admin\/src\/images\/PDF_Tray.svg\" title=\"Generate PDF\" style=\"width:auto; height:45px;\"><\/a>\n\t\t<\/div>","protected":false},"excerpt":{"rendered":"<p>(Immediapress) &#8211; MONACO DI BAVIERA, GERMANIA &#8211; EQS Newswire &#8211; 20 ottobre 2025 &#8211; L&#8217;intelligenza&hellip;<\/p>\n","protected":false},"author":3,"featured_media":19718,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[23],"class_list":["post-19717","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-comunicati","tag-immediapress"],"_links":{"self":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/19717","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=19717"}],"version-history":[{"count":1,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/19717\/revisions"}],"predecessor-version":[{"id":19794,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/posts\/19717\/revisions\/19794"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=\/wp\/v2\/media\/19718"}],"wp:attachment":[{"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=19717"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=19717"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ciaoup.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=19717"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}