Quel est le futur de l’intelligence artificielle ?

Vous n’êtes pas sans savoir que l’intelligence artificielle (IA) est l’un de mes sujets de prédilection depuis de nombreuses années. Nous avons notamment été l’une des premières institutions financières à annoncer l’arrivée du phénomène ChatGPT (OpenAI) dont tout monde parle depuis quelques semaines. Cependant, le secteur de l’IA est en constante progression et n’attend pas que l’on en parle pour évoluer. Je vous propose aujourd’hui de passer
en revue les nouvelles technologies en préparation qui feront beaucoup de bruit en 2023. Synthèse et analyse.

a. Les faits

Le logiciel de traitement du langage naturel conçu par OpenAI fascine les internautes du monde entier. Depuis
quelques semaines il n’y a pas un jour sans qu’un journal, un réseau social ou une émission de télévision ne
parlent de ce qui est considéré comme un « nouveau phénomène ».

Si le monde découvre aujourd’hui ChatGPT, la communauté scientifique travaille sur ces modèles depuis
quelques années. ChatGPT appartient à la famille des “(gros) modèles de langue” (comme l’appelle la
spécialiste de l’intelligence artificielle Laure Soulier) qui ont pour objectif d’apprendre des représentations de
mots, de phrases ou de documents.

Cette approche a émergé en 2003 puis a connu une explosion en 2013 avec des modèles (du type Word2vec
ou FastTExt). Ils ont pour objectif de capturer la sémantique des mots en apprenant à prédire la probabilité
des mots en fonction des mots employés dans une phrase, et ce sur la base d’un nombre important
d’exemples.

Révolution pour le commun des mortels, la version actuelle de ChatGPT (3.0) commence déjà « à dater ». Je
vous propose ainsi de découvrir les prochaines nouveautés qui vont bientôt faire l’actualité.

b. L’intelligence artificielle de demain

Avec une croissance annoncée de plus de 20% pour le marché mondial en 2022, l’intelligence artificielle est
un secteur qui semble avoir de belles années devant soi. Les récentes innovations dans le domaine ont
effectivement montré que le développement de l’intelligence artificielle n’est pas près de s’arrêter.

Si l’intelligence artificielle attire autant les convoitises, c’est tout particulièrement en raison de sa possible
intégration dans un très grand nombre de secteurs. La conception d’algorithmes d’intelligence artificielle
toujours plus poussée a notamment grandement augmenté leur fiabilité et leur précision sur des sujets
complexes. À cela se rajoute la capacité des intelligences artificielles à améliorer constamment leur travail en
s’appuyant sur les gigantesques bases de données mises à leur disposition.

Mais quels sont réellement les prochains phénomènes dont vous allez tous parler ?

Si on vous parle aujourd’hui de ChatGPT, il faut savoir que c’est la version 3.0. La version 4.0 devrait être
lancée sous peu. Il s’agit de la dernière version de la série GPT créée par OpenAI, qui utilise des techniques
d’apprentissage automatique pour générer des textes de type humain et est considérée comme l’un des
modèles linguistiques les plus avancés actuellement disponibles.

Avec GPT-4, vous pouvez écrire un eBook entier en 10 minutes ou obtenir 100 idées de posts sur les médias
sociaux en moins de 2.

GPT-4 est un modèle pré-entraîné, ce qui signifie qu’il a été entraîné sur un ensemble massif de données de
texte et peut être utilisé avec plus de précision pour les tâches de traitement du langage.

Il est capable de générer du texte sur la base de l’entrée qui lui est fournie et peut même continuer à générer
du texte sur la base de sa sortie précédente.

Quelle est la différence entre GPT-3 et GPT-4 ? Le GPT-4 n’a pas encore été publié, mais si l’on se base sur
les modèles précédents, on peut supposer que la plus grande différence sera une capacité accrue à effectuer
un apprentissage non supervisé.

Cela signifie qu’il peut apprendre et améliorer ses performances sans avoir besoin d’étiquettes détaillées ou de supervision.

Voici quelques-unes des capacités les plus remarquables de GPT-4 :

  • Un entraînement plus poussé : GPT-4 est entraîné sur un jeu de données massif de milliards de paramètres.
  • Entraînement diversifié : Il a été entraîné sur un large éventail de données, telles que des blogs, des sites Web et des livres.
  • Précision et grammaire : GPT-4 ayant reçu une formation plus poussée, il est capable de générer des textes plus précis et grammaticalement corrects.
  • Traduction et résumé : GPT-4 est capable d’effectuer des tâches telles que la traduction et le résumé avec une grande précision.

Investissement : OpenAI et Microsoft

AnthropicAI a été créé par Dario Amodei et sa sœur. Si ces noms ne vous disent absolument rien, Dario Amodei est l’ancien vice-président de la recherche chez … OpenAI !

Crée en 2021, Anthropic a mené des recherches pour rendre les systèmes plus orientables, plus robustes et plus interprétables. En ce qui concerne l’interprétabilité, elle a fait des progrès dans la rétro-ingénierie
mathématique du comportement de petits modèles de langage et a commencé à comprendre la source du comportement de correspondance des motifs dans les grands modèles de langage.

En ce qui concerne la dirigeabilité et la robustesse, il a développé des techniques de base pour rendre les
grands modèles de langage plus “utiles et inoffensifs”, et a poursuivi avec l’apprentissage par renforcement
pour améliorer encore ces propriétés, ainsi que la publication d’un ensemble de données pour aider d’autres
laboratoires de recherche à former des modèles qui sont plus alignés sur les préférences humaines. Il a
également publié une analyse des changements soudains de performance dans les grands modèles
linguistiques et des impacts sociétaux de ce phénomène, ce qui démontre la nécessité d’étudier les questions
de sécurité à l’échelle.

L’objectif de cette recherche est de développer les composants techniques nécessaires pour construire des modèles à grande échelle dotés de meilleures protections implicites et nécessitant moins d’interventions après
la formation, ainsi que de développer les outils nécessaires pour examiner de plus près ces modèles afin d’être sûr que les protections fonctionnent réellement. L’entreprise met également en place des équipes et des
partenariats destinés à étudier l’impact politique et sociétal de ces modèles.

Investissement : Privé, mais l’entreprise vient de lever à nouveau 580 millions de dollars notamment chez Caroline Ellison, Jim McClave, Nishad Singh, Jaan Tallinn, and the Center for Emerging Risk Research (CERR).

DeepMind est une division d’Alphabet, Inc. chargée de développer une technologie d’intelligence artificielle
(IA) à usage général. Cette technologie est également connue sous le nom de Google DeepMind.

DeepMind utilise des données brutes de pixels en entrée et apprend par l’expérience. L’IA utilise
l’apprentissage profond sur un réseau neuronal convolutionnel, avec une technique d’apprentissage par
renforcement sans modèle appelée Q-learning.

Bien que l’idée d’une IA à usage général soit controversée, Google a entrepris d’établir et d’améliorer sa
propriété d’IA sur une grande variété de motifs. La technologie DeepMind a été mise au défi d’apprendre des
jeux par elle-même. Par exemple, lorsqu’elle a été chargée de battre la bibliothèque de jeux Atari, elle a appris
à comprendre les jeux sans modifier le code. Au bout d’un certain temps, l’IA a pu jouer à ces jeux mieux et
avec plus d’efficacité que les humains.

Pour repousser les limites de l’IA, DeepMind s’est donné pour mission de vaincre le jeu de société Go. Le Go
est un défi informatique pour l’IA, en grande partie à cause de la complexité du choix parmi l’immense nombre
de mouvements possibles dans le jeu.

DeepMind a développé un projet spécial appelé AlphaGo, un programme informatique conçu pour jouer au jeu
de société. Après de nombreuses versions de modèles d’IA à apprentissage supervisé, AlphaGo a battu le
joueur numéro 1 mondial en 2017. La même année, DeepMind a publié une nouvelle version nommée AlphaGo Zero, utilisant l’apprentissage par renforcement non supervisé, qui a constamment surpassé les
versions précédentes du programme.

En dehors des jeux, DeepMind a été utilisé pour améliorer l’efficacité énergétique dans les centres de
données déjà optimisés de Google. DeepMind a pu améliorer de 15 % les efforts des spécialistes précédents,
ce qui a permis de réduire de 40 % les coûts de refroidissement. Il a également été utilisé dans le
développement de Google Assistant et aide à créer des recommandations d’applications personnalisées dans Google Play.

Investissement : Alphabet

Le 29 septembre dernier, Meta annonçait Make-A-Video, un nouveau système d’IA qui permet aux gens de
transformer des petits textes en brefs clips vidéo de haute qualité. Make-A-Video s’appuie sur les progrès
récents de Meta AI en matière de recherche sur la technologie générative et a le potentiel d’ouvrir de
nouvelles opportunités pour les créateurs et les artistes.

Le système apprend à quoi ressemble le monde à partir de données texte-image appariées et comment le
monde bouge à partir de séquences vidéo sans texte associé. « Dans le cadre de notre engagement continu
en faveur de la science ouverte, nous partageons les détails dans un document de recherche et prévoyons de
publier une expérience de démonstration. »

La recherche sur l’IA générative fait progresser l’expression créative en donnant aux gens des outils pour
créer rapidement et facilement du nouveau contenu. Avec seulement quelques mots ou lignes de texte, Make-A-Video peut donner vie à l’imagination et créer des vidéos uniques en leur genre, pleines de couleurs vives,
de personnages et de paysages. Le système peut également créer des vidéos à partir d’images ou prendre des vidéos existantes et en créer de nouvelles qui sont similaires.

Make-A-Video fait suite à l’annonce faite plus tôt dans l’année de Make-A-Scene, une méthode d’IA générative
multimodale qui permet aux gens de mieux contrôler le contenu généré par l’IA qu’ils créent. « Avec Make-AScene, nous avons montré comment les gens peuvent créer des illustrations photoréalistes et des œuvres
d’art dignes d’un livre d’histoires à partir de mots, de lignes de texte et de croquis de forme libre. »

« Nous voulons réfléchir à la manière dont nous construisons de nouveaux systèmes d’IA générative comme
celui-ci. Make-A-Video utilise des ensembles de données accessibles au public, ce qui ajoute un niveau
supplémentaire de transparence à la recherche. Nous partageons ouvertement cette recherche et les résultats
de l’IA générative avec la communauté afin d’obtenir son avis, et nous continuerons à utiliser notre cadre d’IA
responsable pour affiner et faire évoluer notre approche de cette technologie émergente. »

Investissement : Meta

Stability AI est une entreprise qui produit des outils d’IA ouverts. Son objectif déclaré est de rendre l’IA
accessible à tous, comme l’indique sa devise (“AI by the people, for the people”). Emad Mostaque, le
fondateur de Stability AI, définit son objectif comme la “démocratisation de l’IA”.

Il n’y a pas de rose sans épine et la démocratisation de l’IA générative suscite des critiques quant à l’utilisation
abusive de Stable Diffusion, l’un des outils d’IA générative de la société. Cet outil open-source permet aux
utilisateurs de générer des images à partir de descriptions textuelles.

Les critiques adressées à l’outil peuvent être classées comme suit :

  • Génération de contenu offensif : Même si Stable Diffusion inclut des filtres de contenu, le code et le modèle partagés publiquement peuvent être utilisés pour les contourner. Cela distingue la Diffusion
    Stable d’autres outils d’IA générative texte-image comme DALL-E et MidJourney.
  • Utilisation abusive contre les droits personnels : Un problème majeur pour les utilisateurs qui
    échappent à ces filtres est que cela peut mettre en danger les droits personnels, en particulier les
    droits des femmes, des enfants et des minorités. Le chantage, la maltraitance des enfants et
    l’exploitation sexuelle sont quelques-unes des conséquences destructrices possibles des qualités
    incontrôlées et sous-développées d’un tel outil. Les statistiques révèlent que 96 % des deepfakes sont
    des contenus sexuels non autorisés, et que la quasi-totalité d’entre eux vise les femmes.
  • Violation des droits d’auteur : La violation des droits d’auteur est une autre préoccupation
    importante concernant Stable Diffusion. Même si l’entreprise s’efforce de trouver des solutions pour
    éviter de telles situations4, il est avancé que les utilisateurs peuvent également y remédier en utilisant
    un code et un modèle à source ouverte, ce qui permet de créer des analogues d’œuvres d’art
    existantes.

L’argument principal des dirigeants de Stability AI repose sur la croyance en la neutralité des avancées
technologiques, ainsi que sur l’optimisme quant à l’utilisation constructive des outils, plutôt que leur mauvaise
utilisation. Le fondateur de Stability AI estime que la technologie de l’IA générative nécessite la transparence
plutôt que des mécanismes de contrôle pour son développement.

Investissement : Privé, Emad Mostaque

Appelé LaMDA, ou Language Model for Dialogue Applications, le chat bot de Google a fait l’objet d’une
attention particulière cet été lorsqu’un ingénieur de Google, Blake Lemoine, a affirmé qu’il était intelligent. La
technologie a montré à quel point la technologie des robots de conversation s’était améliorée au cours des
derniers mois.

Google pourrait toutefois hésiter à déployer cette nouvelle technologie pour remplacer la recherche en ligne,
car elle n’est pas adaptée à la diffusion de publicités numériques, qui ont représenté plus de 80 % des
revenus de la société l’année dernière.

Sundar Pichai, le directeur général de Google, a souligné l’importance de l’intelligence artificielle pour son
entreprise. Même si Google perfectionne les robots de conversation, il doit s’attaquer à un autre problème : Cette technologie cannibalise-t-elle les lucratives annonces de recherche de l’entreprise ? Si un chatbot
répond à des requêtes avec des phrases serrées, les gens ont moins de raisons de cliquer sur les liens
publicitaires.

Sundar Pichai a participé à une série de réunions visant à définir la stratégie de Google en matière
d’intelligence artificielle et a bouleversé le travail de nombreux groupes au sein de l’entreprise pour répondre à
la menace que représente ChatGPT. Les employés ont également été chargés de construire des produits d’IA
capables de créer des œuvres d’art et d’autres images, comme la technologie DALL-E d’OpenAI, qui a été
utilisée par plus de trois millions de personnes.

Investissement : Google

Neeva est le premier moteur de recherche privé au monde centré sur l’utilisateur. Neeva ramène la recherche
à ses racines en se concentrant entièrement sur l’utilisateur, en fournissant des résultats de haute qualité sans
aucune publicité, en donnant aux utilisateurs le contrôle de leurs sources et en protégeant leur vie privée en
bloquant les trackers. La technologie de recherche indépendante de Neeva offre des expériences visuelles
riches, intègre le contenu de forums communautaires et permet d’effectuer des recherches sur des
applications personnelles.

Neeva compte déjà 600 000 utilisateurs conquis en moins de 12 mois et poursuit son expansion européenne
grâce au succès d’un tour de financement de série B de 40 millions de dollars réalisé en 2021. Fondée par
Sridhar Ramaswamy (ex-SVP of Ads chez Google) et Vivek Raghunathan (ex-VP of Monetization chez
YouTube), Neeva réinvente la recherche sur le web et remet en question la domination de Google dans ce domaine.

Neeva privilégie le parcours utilisateur et permet aux consommateurs de personnaliser leur expérience de
recherche sur le web. En s’affranchissant des publicités et des annonceurs, Neeva se libère de l’influence des
entreprises qui ont pollué l’expérience de recherche traditionnelle.
Ce moteur de recherche fournit des résultats honnêtes et permet aux utilisateurs de sélectionner les sources
d’information, telles que les médias en ligne, les sites de e-commerce, d’ingénierie, de voyage et autres, en
fonction de leurs préférences personnelles et de leur pertinence, plutôt qu’en fonction des suggestions des
annonceurs. Neeva respecte également la vie privée des utilisateurs en bloquant le suivi par des tiers et en ne
tirant jamais profit des données des utilisateurs.

Neeva propose un modèle freemium et lancera d’abord son service de base privé et sans publicité en Europe,
puis introduira son modèle d’abonnement premium (4.9 dollars par mois) avec des fonctionnalités
supplémentaires telles qu’un VPN et un gestionnaire de mots de passe. Neeva exploite sa propre technologie
indépendante, qui renvoie des résultats instantanés avec des niveaux élevés de précision, en puisant dans un
index de milliards de pages Web.

En outre, Neeva permet aux utilisateurs de connecter des applications personnelles comme la messagerie
électronique, Dropbox, Slack, Figma et d’autres, ce qui facilite la recherche dans les documents personnels
les plus importants tout en maintenant des contrôles stricts de la confidentialité.

Investissement : Fondée par Sridhar Ramaswamy (ex-SVP of Ads chez Google) et Vivek Raghunathan (exVP of Monetization chez YouTube),. Neeva est financé par 6 investisseurs. Inovia Capital et Sequoia Capital
sont les investisseurs les plus récents.

La majeure partie des entreprises citées ci-dessus sont américaines, mais lorsque l’on parle de l’IA, il ne faut
surtout pas oublier la Chine. En effet, en 2021, la Chine a produit environ 43 000 des 135 000 articles de
recherche sur l’IA, soit à peu près deux fois plus que les États-Unis.

Selon une étude réalisée par le journal japonais Nikkei en collaboration avec l’éditeur scientifique néerlandais
Elsevier, la même année, la Chine sera à l’origine de 7 401 des articles les plus cités, soit environ 70 % de
plus que les États-Unis.

L’étude, qui a utilisé des mots-clés associés à l’IA pour rechercher des articles universitaires et des articles de
conférence portant sur l’IA, a révélé que les entreprises chinoises Tencent, Alibaba et Huawei Technologies
figurent parmi les dix premières sociétés produisant des recherches sur l’IA. Baidu, le principal moteur de
recherche chinois, arrive en onzième position en termes de quantité et de qualité de la recherche sur l’IA.

Qui plus est, la Chine va probablement poursuivre sur sa lancée, puisqu’un plan gouvernemental de 2017 a
fixé l’objectif de devenir le premier centre mondial d’innovation en IA d’ici 2030.

L’Académie des sciences chinoise, affiliée au gouvernement et principale institution scientifique du pays,
dispose de vastes capacités de recherche. L’université Tsinghua, une université de recherche publique située
à Pékin, est également un point chaud de l’IA.

La nécessité d’accélérer la recherche, le développement et l’application des technologies de pointe, y compris
l’IA, a été soulignée dans les priorités économiques pour 2023 exposées lors de la Conférence centrale sur le
travail économique de décembre dernier, très suivie, où le président Xi Jinping a pris la parole.

Le ministère de l’Industrie et des Technologies de l’information a déclaré mercredi dernier que le
développement de l’IA et d’autres industries émergentes était une priorité essentielle pour 2023.

Investissement : Tencent, Alibaba et Huawei Technologies

c. Synthèse

Si tout le monde parle de ChatGPT aujourd’hui, de l’eau a coulé sous les ponts depuis 2022. De nouvelles
applications vont voir le jour sous peu et faire parler d’elles dans un second temps. Les sociétés citées dans
cette analyse devraient faire les grands titres des journaux, soyez les premiers à le savoir !