Recensione: Google Cloud AI illumina il machine learning

Google ha uno dei più grandi stack di machine learning nel settore, attualmente incentrato sulla sua Google Cloud AI e sulla piattaforma di Machine Learning. Google ha sviluppato TensorFlow come open source anni fa, ma TensorFlow è ancora il framework di deep learning più maturo e ampiamente citato. Allo stesso modo, Google ha sviluppato Kubernetes come open source anni fa, ma è ancora il sistema di gestione dei contenitori dominante.

Google è una delle principali fonti di strumenti e infrastrutture per sviluppatori, data scientist ed esperti di machine learning, ma storicamente l'intelligenza artificiale di Google non è stata così attraente per gli analisti aziendali che mancano di una seria scienza dei dati o background di programmazione. Sta iniziando a cambiare.

La piattaforma di intelligenza artificiale e machine learning di Google Cloud include blocchi predefiniti di intelligenza artificiale, piattaforma e acceleratori di intelligenza artificiale e soluzioni di intelligenza artificiale. Le soluzioni AI sono abbastanza nuove e rivolte ai manager aziendali piuttosto che ai data scientist. Possono includere la consulenza di Google o dei suoi partner.

Gli elementi costitutivi dell'IA, pre-addestrati ma personalizzabili, possono essere utilizzati senza una conoscenza approfondita della programmazione o della scienza dei dati. Tuttavia, sono spesso utilizzati da esperti di dati per ragioni pragmatiche, essenzialmente per fare cose senza una formazione approfondita del modello.

La piattaforma AI e gli acceleratori sono generalmente per scienziati di dati seri e richiedono abilità di codifica, conoscenza delle tecniche di preparazione dei dati e molto tempo di formazione. Consiglio di andarci solo dopo aver provato gli elementi costitutivi pertinenti.

Ci sono ancora alcuni collegamenti mancanti nelle offerte AI di Google Cloud, specialmente nella preparazione dei dati. La cosa più vicina a Google Cloud a un servizio di importazione e condizionamento dei dati è Cloud Dataprep di terze parti di Trifacta; L'ho provato un anno fa e sono rimasto deluso. L'ingegneria delle funzionalità incorporata in Cloud AutoML Tables è promettente, tuttavia, e sarebbe utile avere quel tipo di servizio disponibile per altri scenari.

Il lato debole dell'IA ha a che fare con l'etica e la responsabilità (o la loro mancanza), insieme a pregiudizi persistenti del modello (spesso a causa di dati distorti utilizzati per la formazione). Google ha pubblicato i suoi principi sull'intelligenza artificiale nel 2018. È un lavoro in corso, ma è una base di orientamento, come discusso in un recente post del blog sull'AI responsabile.

C'è molta concorrenza nel mercato dell'IA (oltre una dozzina di fornitori) e molta concorrenza nel mercato del cloud pubblico (oltre mezza dozzina di fornitori credibili). Per rendere giustizia ai confronti, dovrei scrivere un articolo almeno cinque volte più lungo di questo, quindi per quanto odio lasciarli fuori, dovrò omettere la maggior parte dei confronti tra prodotti. Per il confronto più ovvio, posso riassumere: AWS fa la maggior parte di ciò che fa Google, ed è anche molto buono, ma generalmente applica prezzi più alti.

Blocchi predefiniti di Google Cloud AI

I Building Blocks di Google Cloud AI sono componenti facili da usare che puoi incorporare nelle tue applicazioni per aggiungere dati visivi, linguistici, di conversazione e strutturati. Molti degli elementi costitutivi dell'IA sono reti neurali pre-addestrate, ma possono essere personalizzati con l'apprendimento del trasferimento e la ricerca nella rete neurale se non soddisfano le tue esigenze immediatamente. AutoML Tables è leggermente diverso, in quanto automatizza il processo che un data scientist utilizzerebbe per trovare il miglior modello di machine learning per un set di dati tabulari.

AutoML

I servizi AutoML di Google Cloud forniscono reti neurali profonde personalizzate per la traduzione di coppie di lingue, la classificazione di testi, il rilevamento di oggetti, la classificazione di immagini e la classificazione e il monitoraggio di oggetti video. Richiedono dati con tag per l'addestramento, ma non richiedono una conoscenza significativa di deep learning, transfer learning o programmazione.

Google Cloud AutoML personalizza le reti neurali profonde ad alta precisione e testate in battaglia di Google per i tuoi dati taggati. Anziché iniziare da zero durante l'addestramento dei modelli dai dati, AutoML implementa l'apprendimento automatico del trasferimento profondo (il che significa che parte da una rete neurale profonda esistente addestrata su altri dati) e la ricerca dell'architettura neurale (il che significa che trova la giusta combinazione di livelli di rete aggiuntivi ) per la traduzione di coppie linguistiche e gli altri servizi sopra elencati.

In ogni area, Google dispone già di uno o più servizi pre-addestrati basati su reti neurali profonde e enormi set di dati etichettati. Questi potrebbero funzionare per i tuoi dati senza modifiche e dovresti testarlo per risparmiare tempo e denaro. Se non fanno quello che ti serve, Google Cloud AutoML ti aiuta a creare un modello che lo fa, senza che tu sappia come eseguire l'apprendimento del trasferimento o come progettare reti neurali.

Il transfer learning offre due grandi vantaggi rispetto all'addestramento di una rete neurale da zero. Innanzitutto, richiede molti meno dati per l'addestramento, poiché la maggior parte dei livelli della rete è già ben addestrata. In secondo luogo, si allena molto più velocemente, poiché ottimizza solo gli strati finali.

Sebbene i servizi AutoML di Google Cloud fossero presentati insieme come un pacchetto, ora sono elencati con i loro servizi pre-addestrati di base. Ciò che la maggior parte delle altre aziende chiama AutoML viene eseguito da Google Cloud AutoML Tables.

Leggi la recensione completa di Google Cloud AutoML

Tabelle AutoML

Il normale processo di data science per molti problemi di regressione e classificazione consiste nel creare una tabella di dati per l'addestramento, pulire e condizionare i dati, eseguire l'ingegnerizzazione delle caratteristiche e provare ad addestrare tutti i modelli appropriati sulla tabella trasformata, incluso un passaggio per l'ottimizzazione i migliori iperparametri dei modelli. Le tabelle AutoML di Google Cloud possono eseguire automaticamente l'intero processo una volta identificato manualmente il campo di destinazione.

Tabelle AutoML cerca automaticamente dati strutturati nello zoo dei modelli di Google per trovare il modello migliore per le tue esigenze, che vanno dai modelli di regressione lineare / logistica per set di dati più semplici a metodi avanzati di ricerca profonda, di insieme e di architettura per quelli più grandi e complessi. Automatizza la progettazione delle funzionalità su una vasta gamma di primitive di dati tabulari, come numeri, classi, stringhe, timestamp ed elenchi, e ti aiuta a rilevare e occuparti di valori mancanti, valori anomali e altri problemi di dati comuni.

La sua interfaccia senza codice ti guida attraverso l'intero ciclo di vita del machine learning end-to-end, rendendo facile per tutti i membri del tuo team creare modelli e incorporarli in modo affidabile in applicazioni più ampie. Le tabelle AutoML forniscono dati di input estesi e funzionalità di spiegabilità del comportamento del modello, oltre a guardrail per evitare errori comuni. AutoML Tables è disponibile anche in ambienti API e notebook.

AutoML Tables compete con Driverless AI e molte altre implementazioni e framework di AutoML.

API Vision

L'API di Google Cloud Vision è un servizio di machine learning pre-addestrato per la categorizzazione delle immagini e l'estrazione di varie funzionalità. Può classificare le immagini in migliaia di categorie pre-addestrate, che vanno da oggetti generici e animali trovati nell'immagine (come un gatto), a condizioni generali (ad esempio, crepuscolo), a punti di riferimento specifici (Torre Eiffel, Grand Canyon), e identificare le proprietà generali dell'immagine, come i suoi colori dominanti. Può isolare aree che sono volti, quindi applicare analisi geometriche (orientamento facciale e punti di riferimento) ed emotive ai volti, sebbene non riconosca i volti come appartenenti a persone specifiche, ad eccezione delle celebrità (che richiedono una licenza d'uso speciale). L'API Vision utilizza l'OCR per rilevare il testo all'interno delle immagini in più di 50 lingue e vari tipi di file. Può anche identificare i loghi dei prodotti e rilevare adulti,contenuti violenti e medici.

Leggi la recensione completa delle API di Google Cloud Machine Learning

API Video Intelligence

L'API Google Cloud Video Intelligence riconosce automaticamente più di 20.000 oggetti, luoghi e azioni nei video archiviati e in streaming. Distingue inoltre i cambi di scena ed estrae metadati ricchi a livello di video, ripresa o fotogramma. Esegue inoltre il rilevamento e l'estrazione del testo tramite OCR, rileva il contenuto esplicito, automatizza i sottotitoli e i sottotitoli, riconosce i loghi e rileva volti, persone e pose.

Google consiglia l'API Video Intelligence per estrarre i metadati per indicizzare, organizzare e cercare i contenuti video. Può trascrivere video e generare sottotitoli, nonché contrassegnare e filtrare contenuti inappropriati, il tutto in modo più conveniente rispetto ai trascrittori umani. I casi d'uso includono moderazione dei contenuti, consigli sui contenuti, archivi multimediali e pubblicità contestuale.

API Natural Language

L'elaborazione del linguaggio naturale (PNL) è una parte importante della "salsa segreta" che fa funzionare bene l'input alla Ricerca Google e l'Assistente Google. L'API di Google Cloud Natural Language espone la stessa tecnologia ai tuoi programmi. Può eseguire analisi della sintassi (vedere l'immagine sotto), estrazione di entità, analisi del sentiment e classificazione dei contenuti, in 10 lingue. Puoi specificare la lingua se la conosci; in caso contrario, l'API tenterà di rilevare automaticamente la lingua. Un'API separata, attualmente disponibile per l'accesso anticipato su richiesta, è specializzata in contenuti correlati all'assistenza sanitaria.

Leggi la recensione completa delle API di Google Cloud Machine Learning

Traduzione

L'API di Google Cloud Translation può tradurre oltre un centinaio di coppie di lingue, può rilevare automaticamente la lingua di origine se non la specifichi ed è disponibile in tre versioni: Basic, Advanced e Media Translation. L'API di traduzione avanzata supporta un glossario, la traduzione in batch e l'uso di modelli personalizzati. L'API di traduzione di base è essenzialmente ciò che viene utilizzato dall'interfaccia consumer di Google Translate. AutoML Translation ti consente di addestrare modelli personalizzati utilizzando l'apprendimento di trasferimento.

L'API di traduzione multimediale traduce il contenuto direttamente dall'audio (voce), file audio o flussi, in 12 lingue e genera automaticamente la punteggiatura. Sono disponibili modelli separati per video e audio per telefonate.

Leggi la recensione completa delle API di Google Cloud Machine Learning