Publié le 10 avril 2024, modifié le 5 mai 2024 par Alexandre Duval

Google a mis à jour son modèle d'intelligence artificielle incroyablement puissant Gemini Pro 1.5 pour lui donner la possibilité d'entendre pour la première fois le contenu d'un fichier audio ou vidéo.
La mise à jour a été annoncée sur Google Next, le géant de la recherche confirmant que le modèle peut écouter un clip téléchargé et fournir des informations sans avoir besoin d'une transcription écrite.

  • Google met à jour son modèle d'intelligence artificielle Gemini Pro 1.5
  • Cette mise à jour permet au modèle d'entendre et de comprendre du contenu audio ou vidéo
  • Gemini peut générer des transcriptions et trouver des moments spécifiques dans les fichiers multimédias
  • D'autres annonces ont été faites lors de la conférence Google Next, notamment sur l'amélioration du modèle Imagen AI et son intégration avec la recherche Google.

Cela signifie que vous pouvez lui faire une présentation documentaire ou vidéo et lui poser des questions sur n'importe quel moment, audio et vidéo, du clip.
Cela fait partie d’une initiative plus large de Google visant à créer davantage de modèles multimodaux capables de comprendre une variété de types de saisie au-delà du simple texte. Cette décision est possible grâce au fait que la famille de modèles Gemini est formée simultanément à l'audio, à la vidéo, au texte et au code.

Quoi de neuf dans Gemini Pro 1.5 ?

(Crédit image : Google)Google a lancé Gemini Pro 1.5 en février avec une fenêtre contextuelle d'un million de jetons.

Ceci, combiné aux données de formation multimodales, lui permet de traiter des vidéos.
Le géant de la technologie a désormais ajouté le son aux options de saisie. Cela signifie que vous pouvez lui proposer un podcast et lui faire écouter des moments clés ou des mentions spécifiques.

Il peut faire la même chose pour l'audio joint à un fichier vidéo, tout en analysant également le contenu vidéo.
La mise à jour signifie également que Gemini peut désormais générer des transcriptions pour les clips vidéo, quelle que soit leur durée d'exécution, et trouver un moment spécifique dans le fichier audio ou vidéo.
La nouvelle mise à jour fait partie du niveau intermédiaire de la famille Gemini, qui se décline en trois facteurs de forme : le petit Nano pour l'appareil, Pro alimentant la version gratuite du chatbot Gemini et Ultra alimentant Gemini Advanced.

Améliorez votre vie avec une dose quotidienne des plus grandes actualités technologiques, des astuces de style de vie et notre analyse organisée. Soyez le premier informé des gadgets de pointe et des meilleures offres.
Pour une raison quelconque, Google n'a publié que la mise à jour 1.

5 de Gemini Pro plutôt que d'Ultra, ce qui signifie que son modèle de niveau intermédiaire surpasse désormais la version la plus avancée. On ne sait pas s'il y aura un Gemini Ultra 1.5 ou quand il sera accessible s'il est lancé.

La fenêtre contextuelle massive — commençant à 250 000 (similaire à Claude 3 Opus) et pouvant atteindre plus d'un million pour certains utilisateurs approuvés — signifie que vous n'avez pas non plus besoin d'affiner un modèle sur des données spécifiques. Vous pouvez charger ces données au début d’une discussion et simplement poser des questions.
La mise à jour signifie également que Gemini peut désormais générer des transcriptions pour les clips vidéo, quelle que soit leur durée d'exécution, et trouver un moment spécifique dans le fichier audio ou vidéo.

Comment accéder à Gemini Pro 1.5 ?

(Crédit image : Google)J'imagine qu'à un moment donné, Google mettra à jour son chatbot Gemini pour utiliser les modèles 1.5, peut-être après la conférence des développeurs Google I/O le mois prochain.

Pour l'instant, il n'est disponible que via le tableau de bord des développeurs Google Cloud, VertexAI.
Bien que VertexAI soit un outil puissant pour interagir avec une gamme de modèles, créer des applications d'IA et tester ce qui est possible, il n'est pas largement accessible et s'adresse principalement aux développeurs, aux entreprises et aux chercheurs plutôt qu'aux consommateurs.
Grâce à VertexAI, vous pouvez insérer toute forme de média visuel ou audio, comme un court métrage ou une personne donnant une conférence, et ajouter une invite de texte.

Cela pourrait être « donnez-moi cinq puces résumant le discours » ou « combien de fois ont-ils dit Gémeaux ».
Le public principal de Google pour Gemini Pro 1.5 est celui des entreprises avec des partenariats déjà en cours avec TBS, REplit et d'autres qui l'utilisent pour le balisage de métadonnées et la création de code.

Google a également commencé à utiliser Gemini Pro 1.5 dans ses propres produits, notamment l'assistant de codage Generative AI Code Assist pour suivre les modifications dans les bases de code à grande échelle.

Qu'est-ce que Google a annoncé d'autre ?

Lancement du nouveau développeur @Google aujourd'hui : – Gemini 1.

5 Pro est désormais disponible dans plus de 180 pays via l'API Gemini en version préliminaire publique – Prend en charge la capacité de compréhension audio (parole) et une nouvelle API de fichiers pour faciliter la gestion des fichiers – Nouveau modèle d'intégration ! https://t.co/wJk1e1BG1EA9 avril 2024
Voir plus
Les modifications apportées à Gemini Pro 1.5 ont été annoncées lors de Google Next, ainsi qu'une mise à jour importante du modèle d'image DeepMind AI Imagen 2 qui alimente les capacités de génération d'images Gemini.

Il s'agit d'une peinture et d'un support où les utilisateurs peuvent supprimer ou ajouter n'importe quel élément d'une image générée. Ceci est similaire aux mises à jour qu’OpenAI a récemment apportées à son modèle DALL-E.
Google va également commencer à ancrer ses réponses IA sur Gemini et d'autres plates-formes avec la recherche Google afin qu'elles contiennent toujours des informations à jour.

En savoir plus sur le Guide de Tom

FAQ

Comment utiliser Google Gemini Pro ?

Pour utiliser Google Gemini Pro, il suffit de se rendre sur la page d'accueil dédiée à cet outil. Ensuite, il faut créer un compte en fournissant des informations telles que le nom de l'entreprise et l'adresse e-mail. Une fois connecté, il est possible de naviguer à travers les différentes fonctionnalités proposées par Google Gemini Pro pour améliorer sa stratégie publicitaire en ligne.

Qu'est-ce que Google Gemini Pro ?

Google Gemini Pro est une plateforme publicitaire de Google qui permet aux annonceurs de gérer leurs campagnes publicitaires sur mobile et tablette. Cette plateforme est utilisée pour cibler spécifiquement les utilisateurs d'appareils mobiles en fonction de leur emplacement géographique et de leurs centres d'intérêt.

Elle offre également des options avancées de suivi et de mesure des performances pour aider les annonceurs à maximiser l'impact de leurs annonces sur ces appareils populaires.

Google Gemini Pro est-il gratuit ?

Oui, Google Gemini Pro est un outil gratuit qui permet de gérer efficacement vos campagnes publicitaires sur le réseau de recherche de Google. Il offre notamment des fonctionnalités avancées pour cibler au mieux votre audience et maximiser votre retour sur investissement.

Vous pouvez y accéder en vous connectant à votre compte Google Ads et en sélectionnant l'option "Gemini Pro" dans le menu. Profitez ainsi d'une expérience publicitaire personnalisée sans frais supplémentaires !

Comment utiliser la version 1.5 de Google Gemini Pro ?

Pour utiliser la version 1.5 de Google Gemini Pro, vous devez tout d'abord créer un compte sur la plateforme et y connecter vos comptes publicitaires.

Ensuite, vous pourrez créer des campagnes publicitaires ciblant spécifiquement les utilisateurs mobiles grâce aux fonctionnalités avancées de cette version. N'hésitez pas à consulter les tutoriels et guides disponibles pour tirer le meilleur parti de l'outil afin d'optimiser votre stratégie marketing sur mobile.

Quel est le prix de Google Gemini Pro en France ?

Le prix de Google Gemini Pro en France varie selon les fonctionnalités que vous souhaitez utiliser. En moyenne, il est proposé à partir de 50 euros par mois.

Cependant, il est possible de souscrire à des forfaits plus complets et donc plus chers. Il est également possible d'obtenir des remises ou tarifs spéciaux en fonction du volume de publicité achetée.

Categories: IA

Alexandre Duval

Alexandre Duval

S’abonner
Notification pour
guest

Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x