Topic Hub · 12 articoli

AI Locale & Open Source

L'AI locale permette di eseguire modelli direttamente su hardware proprio (laptop, server aziendale, edge device) senza dipendere da API cloud. Vantaggi: privacy totale, costi prevedibili, latenza minima, controllo completo. Strumenti come Ollama, llama.cpp e MLX hanno reso l'inferenza locale accessibile anche su Mac e PC consumer.

Tutti gli articoli su AI Locale & Open Source

Google

7 apr 2026•3 min

Google rilascia in silenzio un'app di dettatura AI che funziona offline

Google AI Edge Eloquent, disponibile su iOS, utilizza modelli ASR basati su Gemma per trascrizioni locali e pulizia automatica del testo.

Edge AISpeech-to-Text +2

Leggi l'articolo

Falcon Perception: un Transformer early-fusion per la segmentazione open-vocabulary

Computer Vision

2 apr 2026•3 min

Falcon Perception: un Transformer early-fusion per la segmentazione open-vocabulary

TII UAE rilascia un modello unificato per la comprensione visiva guidata dal linguaggio, superando SAM 3 in alcuni benchmark.

Multimodal AITransformer +1

Leggi l'articolo

Ollama

1 apr 2026•3 min

Ollama integra MLX di Apple per accelerare i modelli locali su Mac

Il runtime per LLM locali aggiunge il supporto al framework MLX, migliora la cache e adotta la compressione NVFP4 di Nvidia, puntando a maggiore efficienza su Apple Silicon.

Apple MLXAI Locale +2

Leggi l'articolo

web design

31 mar 2026•2 min

Pretext: un nuovo standard open source per il web design basato su 'vibe coding'

Un ingegnere di Midjourney rilascia uno strumento che promette di semplificare la creazione di interfacce web attraverso descrizioni testuali.

open sourcefrontend development +1

Leggi l'articolo

Nvidia

24 mar 2026•3 min

Nvidia rilascia la ricetta open source di Nemotron-Cascade 2, modello da 3B parametri attivi

Il modello di Nvidia ottiene medaglie d'oro in matematica e coding, aprendo la metodologia di post-training.

Large Language ModelsOpen Source +1

Leggi l'articolo

NVIDIA

18 mar 2026•3 min

NVIDIA rilascia Nemotron 3 Nano 4B, modello ibrido per AI locale efficiente

Un modello da 4 miliardi di parametri con architettura Mamba-Transformer ottimizzato per l'esecuzione su dispositivi edge e GPU consumer.

Small Language ModelsEdge AI +1

Leggi l'articolo

Perplexity

14 mar 2026•2 min

Perplexity lancia Personal Computer, un agente AI che opera in locale su Mac

Il nuovo sistema trasforma un computer dedicato in un assistente digitale con accesso completo a file e app, gestibile da remoto.

AI AgentLocal AI +2

Leggi l'articolo

Nvidia

12 mar 2026•3 min

Nvidia rilascia Nemotron-3 Super, un modello open-weight che combina tre architetture per elevate prestazioni in throughput

Il nuovo modello di Nvidia, disponibile con pesi aperti, supera GPT-OSS e Qwen in velocità di inferenza unendo Transformer, MoE e architetture sequenziali.

Large Language ModelOpen Source AI +2

Leggi l'articolo

Nvidia

10 mar 2026•2 min

Nvidia prepara NemoClaw, una piattaforma open source per agenti AI enterprise

Il chipmaker punta a fornire strumenti di sicurezza e privacy per l'automazione di task aziendali, aprendo la piattaforma anche a chi non usa i suoi chip.

Agenti AIOpen Source +1

Leggi l'articolo

OpenAI

9 mar 2026•3 min

OpenAI offre ChatGPT Pro e Codex ai maintainer open source

Sei mesi di accesso gratuito per i progetti più popolari, in risposta all'iniziativa simile di Anthropic.

Open SourceSviluppatori +1

Leggi l'articolo

Claude di Anthropic individua 22 vulnerabilità in Firefox in due settimane

Sicurezza Informatica

7 mar 2026•2 min

Claude di Anthropic individua 22 vulnerabilità in Firefox in due settimane

Un esperimento di sicurezza con Mozilla mostra il potenziale e i limiti dell'AI per l'audit del codice open source.

Intelligenza ArtificialeOpen Source +1

Leggi l'articolo

Alibaba

6 mar 2026•3 min

Alibaba rilascia la serie Qwen 3.5 Small: modelli da 0.8B a 9B parametri per inferenza locale

I nuovi modelli open-weight di Alibaba Cloud sono ottimizzati per l'esecuzione su dispositivi consumer, con performance competitive su benchmark specifici.

QwenOpen Source +4

Leggi l'articolo

Domande frequenti su AI Locale & Open Source

Come si esegue un modello AI in locale?

Il modo più semplice è installare Ollama (`ollama run qwen3.5:9b`) o LM Studio. Per maggior controllo, llama.cpp permette di eseguire modelli quantizzati in formato GGUF. Su Mac con Apple Silicon, MLX di Apple offre performance superiori. Hugging Face Transformers è la libreria di riferimento per ricerca e prototipazione.

Che hardware serve per far girare un LLM in locale?

Un modello da 7-9B parametri quantizzato gira con 8-16 GB di RAM su CPU moderna o GPU integrata. Modelli da 27-35B richiedono 24+ GB di VRAM o RAM unificata (es. Mac M3 Max). Modelli da 70B+ necessitano di una GPU dedicata da 48+ GB o setup multi-GPU. La quantizzazione 4-bit riduce significativamente i requisiti.

Quali sono i migliori modelli open source nel 2026?

Qwen 3.5 (Alibaba) domina nel rapporto qualità/dimensioni. Llama 4 (Meta) resta lo standard per fine-tuning. DeepSeek per il reasoning matematico. Mistral per task in lingue europee. Per coding, Qwen Coder e DeepSeek Coder. Tutti con licenze permissive (Apache 2.0 o simili).

Esplora altri topic

Vibe Coding & AI Editors Nuovi Modelli AI Agenti AI AI per il Business