Published on

Google lancia un nuovo modello di incorporamento testuale basato su Gemini

Authors
  • avatar
    Name
    Tech Istantenews
    Twitter

Riassunto

Google ha recentemente introdotto un nuovo modello sperimentale di "embedding" per il testo, chiamato Gemini Embedding, all'interno del suo API per sviluppatori Gemini. Questo modello rappresenta un passo avanti significativo nel campo dell'intelligenza artificiale applicata al trattamento del linguaggio naturale.

Gli embedding sono rappresentazioni numeriche di input testuali come parole e frasi, che catturano il significato semantico del testo. Questi modelli sono utilizzati in una vasta gamma di applicazioni, tra cui il recupero e la classificazione di documenti, e sono apprezzati per la loro capacità di ridurre i costi migliorando al contempo la latenza.

Google non è nuova al mondo degli embedding, ma Gemini Embedding segna un'evoluzione importante, essendo il primo modello di embedding addestrato sulla famiglia di modelli AI Gemini. Questo nuovo modello ha ereditato la comprensione del linguaggio e del contesto sfumato di Gemini, rendendolo applicabile a una vasta gamma di utilizzi. Google afferma che Gemini Embedding è stato addestrato per essere estremamente generale, offrendo prestazioni eccezionali in diversi domini, tra cui finanza, scienza, legge, ricerca e molto altro.

Secondo Google, Gemini Embedding supera le prestazioni del precedente modello di embedding all'avanguardia, text-embedding-004, e raggiunge risultati competitivi sui benchmark di embedding più popolari. Rispetto a text-embedding-004, Gemini Embedding può accettare porzioni di testo e codice più grandi in una sola volta e supporta il doppio delle lingue, superando le 100.

Tuttavia, Gemini Embedding è attualmente in una fase sperimentale con capacità limitata e soggetta a cambiamenti. Google sta lavorando per rilasciare una versione stabile e generalmente disponibile nei prossimi mesi.

Questo nuovo modello rappresenta un passo significativo nel campo dell'intelligenza artificiale, offrendo nuove possibilità per l'elaborazione del linguaggio naturale e migliorando le capacità di comprensione e classificazione del testo in diversi contesti applicativi.