Tech

La Casa Bianca sfida gli hacker a distruggere i migliori modelli di intelligenza artificiale al DEF CON 31 – Ars Technica

Florentina Russo 2 anni ago 3 min read

Un'immagine generata dall'intelligenza artificiale della Casa Bianca davanti a uno sfondo elettronico. — Ingrandire / Un’immagine generata dall’intelligenza artificiale della Casa Bianca davanti a uno sfondo elettronico.

Viaggio Med

Giovedì la Casa Bianca annunciare Una straordinaria collaborazione tra i migliori sviluppatori di intelligenza artificiale, tra cui OpenAI, Google, Antrhopic, Hugging Face, Microsoft, Nvidia e Stability AI, per condividere una valutazione pubblica dei loro sistemi di intelligenza artificiale generativa in DEFCON 31, una conferenza sull’hacking che si terrà a Las Vegas ad agosto. L’evento sarà ospitato da Villaggio dell’Intelligenza ArtificialeComunità di hacker di intelligenza artificiale.

Dallo scorso anno, i Language Large Model (LLM) come ChatGPT sono diventati un modo popolare per velocizzare le attività di scrittura e comunicazione, ma gli amministratori si rendono conto che comportano anche rischi intrinseci. Problemi come la condivisione, il jailbreak e i pregiudizi pongono sfide ai professionisti della sicurezza e al pubblico. per questa ragione Ufficio per la scienza, la tecnologia e la politica della Casa Bianca Sostiene di spingere questi nuovi modelli generativi di intelligenza artificiale ai loro limiti.

“Questo esercizio indipendente fornirà informazioni importanti ai ricercatori e al pubblico sugli impatti di questi modelli e consentirà alle aziende e agli sviluppatori di intelligenza artificiale di adottare misure per risolvere i problemi riscontrati in tali modelli”. Bayan dice Dalla Casa Bianca, che afferma che l’evento è conforme alla legge sui diritti dell’IA dell’amministrazione Biden e al National Institute of Standards and Technology Quadro di gestione del rischio AI.

in parallelo annuncio Scritto dagli organizzatori di AI Village Sven Kattell, Reman Choudhury e Austin Carson definiscono il prossimo evento “il più grande esercizio della squadra rossa mai visto per qualsiasi gruppo di modelli di intelligenza artificiale”. Migliaia di persone parteciperanno alla valutazione del modello AI, che utilizzerà la piattaforma di valutazione sviluppata da Scale AI.

READ Qualcomm è in trattative con Honor per fornire chip e Honor spera di diventare il principale marchio di smartphone in Cina

Il “lavoro di squadra rosso” è un processo mediante il quale gli esperti di sicurezza tentano di scoprire punti deboli o difetti nei sistemi di un’organizzazione per migliorare la sicurezza e la resilienza complessive.

Secondo Cattell, fondatore di AI Village, “i vari problemi con questi modelli non saranno risolti finché più persone non sapranno come progettare e valutare una squadra”. Conducendo il più grande esercizio di squadre rosse di qualsiasi serie di modelli di intelligenza artificiale, AI Village e DEF CON mirano a far crescere una comunità di ricercatori attrezzati per affrontare i punti deboli nei sistemi di intelligenza artificiale.

LLM si è rivelato sorprendentemente difficile da chiudere in parte a causa di una tecnica chiamata “iniezione istantanea”, di cui abbiamo pubblicato una storia a settembre. Il ricercatore di Amnesty International Simon Willison Scritto in dettaglio Sui pericoli dell’iniezione immediata, una tecnica che può far deragliare un modello linguistico dall’eseguire azioni non previste dal suo creatore.

Durante l’evento DEF CON, i partecipanti avranno accesso a diversi LLM tramite laptop forniti dagli organizzatori. Un sistema di punti in stile cattura la bandiera ti incoraggerà a testare un’ampia gamma di potenziali danni. Alla fine, la persona con il maggior numero di punti vincerà la GPU Nvidia di fascia alta.

“Condivideremo ciò che abbiamo imparato da questo evento per aiutare gli altri che vogliono sperimentare la stessa cosa”, ha scritto AI Village. “Più persone conoscono il modo migliore per lavorare con questi modelli e i loro limiti, meglio è.”

DEFCON 31 Si svolgerà dal 10 al 13 agosto 2023 al Caesar’s Forum di Las Vegas.