🌐 Arriva puntuale Marketing Hackers Intelligence, la vostra finestra quotidiana sul futuro. In pochi minuti vi guideremo attraverso i cambiamenti del tecnologici che stanno ridefinendo le regole del gioco. 🔍 Il focus di oggi: Amazon propone un benchmark RAG innovativo, Runway svela Gen-3 Alpha per video iper-realistici, CheckMate rivoluziona la valutazione dei chatbot AI, ChatGPT e Claude 3.5 dominano la classifica AI. Inoltre, Apple lancia il modello AI 4M, mentre Meta AI introduce Llama 3 405b in WhatsApp e aggiorna le etichette per i contenuti generati dall'AI. Infine, GXO Logistics e Agility Robotics collaborano per l'uso di robot umanoidi nei centri logistici. Restare informati sull'AI può aprire a nuove opportunità e vantaggi competitivi.

Runway svela Gen-3 Alpha: l'AI per video iper-realistici

Runway ha lanciato il suo modello Gen-3 Alpha, un sistema di intelligenza artificiale avanzato per la creazione di video. Questa tecnologia consente agli utenti di realizzare filmati estremamente realistici partendo da testo, immagini o video esistenti. A differenza dei modelli Gen-1 e Gen-2, che erano gratuiti, l'accesso a Gen-3 Alpha richiede un piano a pagamento. I prezzi partono da 12 dollari al mese per editor, con fatturazione annuale. Gli sviluppatori prevedono miglioramenti nei prossimi mesi e non escludono una versione gratuita futura. Questa mossa evidenzia il crescente valore commerciale delle tecnologie AI nella produzione video. 📹

VentureBeat

0:00
/0:10

Robot umanoidi nei centri logistici

GXO Logistics e Agility Robotics hanno firmato un accordo pluriennale per l'utilizzo del robot umanoide Digit nelle operazioni logistiche di GXO. Questa collaborazione rappresenta il primo impiego commerciale su larga scala di robot umanoidi nel settore, oltre alla prima implementazione di robot umanoidi con il modello Robots-as-a-Service (RaaS). Digit, progettato per compiti ripetitivi e gravosi come la movimentazione di materiali pesanti in magazzini e centri di distribuzione, integra modelli di intelligenza artificiale per adattarsi ai flussi di lavoro in evoluzione. La decisione di GXO segue un programma pilota conclusosi con successo alla fine dello scorso anno. Le due aziende continueranno a esplorare ulteriori applicazioni per Digit, con l'obiettivo di ampliarne l'uso per soddisfare la crescente domanda nel settore logistico. 📦🤖

IoT World Today

Amazon propone un benchmark RAG innovativo

Amazon ha presentato una proposta per un nuovo processo di valutazione dei sistemi di Retrieval-Augmented generation (RAG), che uniscono modelli linguistici avanzati con database specializzati. Il benchmark punta a offrire un metodo standardizzato, scalabile e interpretabile per misurare le prestazioni dei sistemi RAG su diverse attività e domini di dati. I risultati preliminari mostrano che la scelta del metodo di recupero può avere un impatto maggiore rispetto al semplice potenziamento del modello linguistico. Inoltre, componenti di recupero mal allineati possono compromettere le prestazioni complessive rispetto a un modello linguistico autonomo. La proposta di Amazon sottolinea l'importanza di sviluppare robusti framework valutativi mentre le tecnologie di intelligenza artificiale generativa continuano a evolversi rapidamente. 📈

ZDNet

CheckMate: valutare i chatbot AI

Una nuova piattaforma open-source chiamata CheckMate sta ridefinendo il modo di valutare i modelli linguistici di grandi dimensioni (LLM). Questo strumento permette agli utenti di interagire direttamente con sistemi come InstructGPT, ChatGPT e GPT-4, fornendo un'analisi dettagliata delle loro prestazioni. La ricerca tramite CheckMate ha mostrato che, sebbene gli LLM siano abili in compiti come la risoluzione di problemi matematici universitari, possono comunque fornire informazioni inesatte. È stato rilevato che i modelli migliori comunicano l'incertezza, accettano correzioni dagli utenti e offrono motivazioni concise per le loro raccomandazioni. Gli esperti suggeriscono agli utenti di verificare attentamente gli output degli LLM, considerando le limitazioni attuali di questi sistemi. Questa piattaforma rappresenta un passo importante verso una comprensione e valutazione più critica delle capacità e dei limiti degli assistenti basati sull'intelligenza artificiale. 🎓🤖

AIhub
Checkmate

LMSYS ORG Rivela la Nuova Classifica dell'Arena Multimodale

LMSYS ORG ha lanciato una nuova funzione nell'Arena Chatbot che include il supporto per le immagini, permettendo agli utenti di valutare i modelli di linguaggio visivo di OpenAI, Anthropic, Google e altri importanti fornitori. In sole due settimane, l'iniziativa ha raccolto oltre 17.000 voti degli utenti in più di 60 lingue.

La classifica dei modelli multimodali ha rivelato alcuni risultati sorprendenti. Al primo posto troviamo GPT-4o, con un punteggio Arena di 1226, seguito da vicino da Claude 3.5 Sonnet con un punteggio di 1209. Gemini 1.5 Pro si piazza al terzo posto con un punteggio di 1171, mentre GPT-4 Turbo è quarto con un punteggio di 1167.

Le posizioni successive vedono Claude 3 Opus e Gemini 1.5 Flash praticamente alla pari, con punteggi rispettivamente di 1084 e 1079. Claude 3 Sonnet occupa il settimo posto con un punteggio di 1050, mentre Llava 1.6 34B e Claude 3 Haiku chiudono la top ten con punteggi di 1014 e 1000.

Questi risultati evidenziano la superiorità di GPT-4o e Claude 3.5 nelle performance multimodali, con un divario significativo rispetto ai loro concorrenti più vicini. Questo è particolarmente evidente nelle attività che coinvolgono la visione, dove GPT-4o e Claude 3.5 dimostrano una maggiore efficacia.

Con questo aggiornamento, LMSYS ORG continua a spingere i confini dell'IA, offrendo agli utenti nuove opportunità di interazione e valutazione dei modelli di linguaggio visivo. L'organizzazione prevede di espandere ulteriormente le funzionalità dell'Arena Multimodale, includendo supporto per più immagini, PDF, video e audio.

The Multimodal Arena is Here!

Apple svela un modello AI 4M

Apple ha lanciato una demo pubblica del suo modello di intelligenza artificiale 4M, segnando una svolta rispetto alla consueta riservatezza dell'azienda. Questo sistema versatile è in grado di elaborare e generare contenuti attraverso molteplici modalità, evidenziando le capacità di Apple nel campo dell'AI. L'architettura unificata del modello 4M per diverse modalità potrebbe portare ad applicazioni AI più coerenti e versatili nell'ecosistema Apple. Il tempismo del lancio, subito dopo la WWDC, suggerisce una strategia coordinata per affermarsi come protagonista nel settore dell'AI, coniugando applicazioni pratiche per i consumatori e capacità di ricerca all'avanguardia. 📊🔍

VentureBeat

Meta AI lancia WhatsApp con Llama 3 405B

L'ultima versione beta di WhatsApp per Android integra Meta AI con i modelli Llama 3. Gli utenti possono ora scegliere tra Llama 3-70B e Llama 3-405B per alimentare il chatbot Meta AI. Il modello 405B, più avanzato, è adatto a gestire query complesse, ma l'accesso è limitato a un numero ristretto di richieste settimanali. La strategia di Meta prevede il rilascio open source dei modelli Llama per renderli accessibili a un ampio spettro di utenti e sviluppatori, puntando a eguagliare le prestazioni di modelli proprietari come GPT-4. L'integrazione di Meta AI in WhatsApp mira a migliorare l'esperienza utente, offrendo un controllo maggiore sulle conversazioni guidate dall'intelligenza artificiale. 📱💬

Nowadais

Meta aggiorna le etichette AI

Meta sta perfezionando il sistema di etichettatura dei contenuti generati dall'intelligenza artificiale sulle proprie piattaforme social. L'azienda ha deciso di sostituire la dicitura "Made with AI" con "AI Info" dopo le critiche ricevute da alcuni artisti. I sistemi di rilevamento di Meta, infatti, classificavano erroneamente come generate dall'AI anche immagini che avevano subito solo lievi modifiche. Questa revisione si inserisce in un contesto in cui la rapida diffusione delle tecnologie di intelligenza artificiale rende sempre più arduo per gli utenti discernere i contenuti autentici da quelli artificiali. Una problematica che desta particolare preoccupazione in vista delle imminenti elezioni presidenziali statunitensi del 2024. 🔍

CNET

Se avete apprezzato queste informazioni, aiutateci a crescere: condividetele con la vostra rete di colleghi e amici e invitateli a iscriversi per diffondere la conoscenza. Continuate a seguirci per rimanere sempre aggiornati nel mondo dell'intelligenza artificiale e scoprire nuove opportunità.

Condividi questo post