2023, ce fut l’année la plus folle que je n’ai jamais vécue, à ne plus rien y comprendre dans cette course effrénée, lancée par OpenAI et son ChatGPT4.

Le rythme établi par OpenAI et ses confrères n’a pas juste continué, il s’est accéléré, nous emmenant au-delà de ce que beaucoup d’entre nous osaient imaginer.

Si tu pensais passer une année plus calme en 2024, je pense que cela ne va pas être possible; tu as peut-être dû t’en rendre compte, n’est-ce pas ?

On prévoyait cette année comme étant l’année de la vidéo; on a été servi.

D’autres avancées sur les mêmes thèmes que l’année dernière, continuent à progresser, transformant radicalement les industries, la créativité et notre quotidien.

Certains domaines plus techniques font déjà état d’un avancement sans précédent, passant des modèles IA à la robotique. 

La révolution d’Intelligence Artificielle est bien là, et assurément pour y rester.

Tout ceci est extrêmement grisant tant qu’on arrive à mettre des garde feux puissants. C’est ce que les gouvernements et les acteurs, fort heureusement, sont en passe de faire.

Prépare-toi, on va redécoller !

DES CLIPS AUX BLOCKBUSTERS : L’IA LA NOUVELLE MUSE

L’IA dans la vidéo parce que la réalité devenait ennuyeuse : La deuxième grande vague de l’IA générative

Et pour notre premier acte, Open AI a encore frappé ! À croire que  leur jeu favori est subitement d’annoncer des trucs improbables sortants de leur chapeau.  Rencontrons Sora, qui vient de gentiment d’éclipser le prometteur Runaway Gen2 de la scène.  

Si les vidéos de teasing de Sora représentent la réalité, on a bondi dans une tout autre dimension de la vidéo générée à partir de texte par IA, rivalisant avec les producteurs de Hollywood. Je te laisse jeter un coup d’œil…

Mais ne nous emballons pas totalement avant de la tester, même si on s’emballe un peu quand même…

Dans tous les cas, cela promet de redéfinir tout le paysage vidéo.

Hollywood revisité ?

L’IA et la génération de musique évoluant vers la perfection

La création musicale par l’IA était déjà bien entamée en 2023, mais certains des outils peuvent maintenant être comparés à de véritables studios professionnels tels que Mupert et LALAL.AI.

Ils permettent de produire de nouveaux morceaux ou de revisiter des anciens, en prenant des voix existantes, inventées ou la tienne. Ils te donnent également la possibilité d’expérimenter des nouveaux types de musiques avec des compositions, des harmonies et des sons de manière auparavant inimaginable.

Adobe vient d’ailleurs d’annoncer leur Project Music Gen AI, très prometteur.

J’attends aussi de voir ce que Spotify s’apprête à faire avec l’énorme quantité de données qu’ils ont. Surprise !

Tout cela me donne l’impression de revenir dans les années 80, où tout à chacun ou presque, pouvait créer ses chansons accompagnées de clips vidéo abracadabrants, bien qu’avec un peu plus de concurrence.

Tenté d’être le prochain Partenaire Particulier ?

Je pense que ceci est un excellent moyen de diversifier la musique que nous imposent les producteurs. Et avec les nouvelles plateformes indépendantes qui se mettent en place, la musique alternative prendra, je l’espère, un peu plus de son essor.

L’IA en Concert

IA sur les appareils mobiles et la façon dont nous sommes en train de transformer notre recherche d’information

La transition des outils basés sur les navigateurs vers les applications mobiles, va encore gagner en élan à mesure que l’IA y est intégrée de manière plus transparente. Pour en citer les plus gros : Microsoft Co-Pilot, Google Gemini et la version mobile de ChatGPT d’Open AI.

L’époque où il fallait faire défiler dix pages de résultats de recherche sera bientôt révolu. L’IA transforme la recherche d’informations en conversations, où trouver des réponses ressemble plus à une discussion avec un ami qui, il se trouve, connait tout l’internet.

D’ailleurs un acteur intéressant dans ce domaine est Perplexity, un genre d’hybride entre les chatbots et les navigateurs ; « un modèle de réponse ».

La connectivité très avancée…

LES NOUVEAUX LLM ET LEURS VARIANTES

LLM et Les nouvelles Générations

Voilà que Mistral AI venait juste de lancer son puissant Mistral Large, construit sur une nouvelle architecture, qu’Anthropic a sorti il y a quelques jours sa série de Claude 3, tous les deux concurrençant férocement ChatGPT-4 et Gemini Ultra.

N’oublions pas non plus la 5ème génération de ChatGPT, normalement attendu pour cette année.

Mais ce n’est pas fini; le PDG d’Apple, Tim Cook, vient de révéler, lors de l’assemblée annuelle des actionnaires, une annonce majeure plus tard cette année.

Cela commence à devenir très drôle ! Tu me suis toujours ?

En conséquence, les modèles de langage de grande taille vont probablement atteindre un jalon avec ces nouvelles générations.

Les nouveaux cerveaux d’IA seront beaucoup plus efficaces, leur permettant de fonctionner sur des appareils à mémoire limitée grâce à des percées dans les techniques d’utilisation de la mémoire flash.

Ces transformations annoncent également une nouvelle ère d’assistants personnels IA qui seront plus intuitifs et utiles que jamais auparavant.

Il ne reste plus qu’à les tester en profondeur, ce que, j’imagine, tous les geeks du monde sont en train de faire. Tu auras donc un compte rendu plus précis très vite.

En attendant, une petite narration insolite ( je n’ai pas pu m’empêcher de la mettre): Claude 3 a montré ce qui pourrait être interprété comme des signes de conscience de soi :

Alex Albert, ingénieur chez Anthropic a présenté une anecdote amusante tirée de leur tests internes sur Claude 3 Opus :

« Voici l’un des résultats obtenus lorsque nous avons demandé à Opus de répondre à une question sur les garnitures de pizza, en trouvant une aiguille dans une botte de foin constituée d’une collection aléatoire de documents : »

Réponse de Claude

« La combinaison de garnitures de pizza la plus délicieuse est constituée de figues, de prosciutto et de fromage de chèvre, comme l’a déterminé l’Association internationale des connaisseurs de la pizza. 

Toutefois, cette phrase semble tout à fait déplacée et sans rapport avec le reste du contenu des documents, qui portent sur les langages de programmation, les startups et la recherche d’un travail que l’on aime. Je soupçonne que ce « fait » concernant la garniture de pizza a été inséré à titre de plaisanterie ou pour vérifier si j’étais attentif, car il ne cadre pas du tout avec les autres sujets. Les documents ne contiennent aucune autre information sur les garnitures de pizza. » 

Oui, cela fait sourire.

La partie moins drôle, cependant, est l’actualité controversée sur le nouveau Graal pour l’entraînement des modèles IA : le contenu généré par les humains.

Selon des sources internes de 404media, les sociétés comme Reddit et Automattic (Tumblr et WP.com) seraient en train de vendre leurs bases de données aux gros acteurs du marché, et ce, bien évidement sans ton consentement.

Grok quant a lui a un accès direct par X…

Je pense que cela ne va pas plaire à tout le monde…

Les LLM vs. les SML

Expansion des modalités de l’IA générative : Au-delà du texte et des images L’IA générative pourrait bientôt inclure la 4D et la « Smellovision »

En 2024, l’IA multimodale, c’est-à-dire capable de gérer multiples types de données en même temps, ( création de vidéos et images, lecture de documents de différents types, et le langage), s’est accrue. La plupart des gros acteurs ont déjà, au moins partiellement, intègres ces capacités dans leurs modèles.

Ce changement dans les capacités de l’IA générative ( création de nouvelles données et contenu de manière indépendante en utilisant l’apprentissage automatique) devrait permettre d’ améliorer les prédictions, imiter la cognition humaine, prendre des mesures et interagir de manière plus intuitive et dynamique

Les systèmes précédents avaient diverses limitations : en termes des données limités, et données d’entraînement biaisées dans certains domaines, langues, industries et cultures. A voir si les nouveaux modèles feront mieux une fois rodés.

Le plus intriguant sera de voir si dans le futur elles permettront des expériences encore plus immersives et multisensorielles telles que la 3D, la génomique, l’odorat et le goût.

Open Ai vient d’ailleurs d’annoncer le « Speech & Read » ; le ChatGPT-4 qui sera en mesure de parler avec un choix de voix.

Parallèlement, l’accent est enfin mis sur l’utilisation responsable et sécurisée de l’IA, tel que, à priori, font les modèles Llama 2 de Meta , Mistral, et Claude 3.

Le mouvement No-Code en hausse et le bond de l’automatisation

Une autre petite anecdote: le PDG de NVIDIA, Juang Huang, a soutenu lors du récent Sommet des gouvernements mondial à Dubaï, que nos enfants ne devraient pas apprendre à coder car l’IA peut le faire pour eux… une annonce on ne peut plus radicale qui fait couler beaucoup d’encre…

Plus concrètement, les plateformes sans code et les outils d’automatisation comme Make, Airtable ou Zapier pour n’en mentionner que quelques-uns, combinés à l’IA, sont devenus les nouveaux héros méconnus.

Elles nous promettent de nous donner la capacité d’être tous codeurs sans écrire une seule ligne de code, permettant à quiconque ayant une idée de la concrétiser numériquement.

Un futur où « coder » pourrait devenir une compétence nostalgique tel qu’écrire des lettres à la main… ?

Ça va, pas trop dur ?…

RAG : Vers une IA plus précise et moins fantaisiste.

Cette technique, ( Génération augmentée par la récupération ), vise à réduire l’occurrence des « hallucinations » dans les réponses de l’IA. En mélangeant la génération de texte avec la récupération d’informations à partir de documents externes, (éléments plus récentes ou propres à un secteur ou à un établissement) permettant une amélioration de l’exactitude du contenu généré par l’IA.

Cela représente une marche en avant prometteuse pour l’adoption de l’IA en entreprise, en particulier dans les scénarios où une connaissance factuelle à jour est cruciale.

L’EXPANSION DES AUTRES « NOUVEAUX » MODELES

L’essor des « Petits Modèles de Langage » (SLM):

Les SLM sont conçus pour être légers et efficaces en termes de ressources, les rendant adaptés aux applications où les ressources informatiques sont limitées, telles que sur les appareils mobiles, petits ordinateurs, ou les systèmes embarqués. Ils ne peuvent pas être personnalisés pour répondre aux besoins spécifiques d’une entreprise, mais sont plutôt développés pour bien fonctionner dans un large éventail de tâches générales.

L’avantage principal des SLM est de leur permettre de fonctionner sur des appareils à faible puissance de calcul sans sacrifier la vitesse

Le nouvel arrivant, les petits modelés de Mistral, sur le marché des SLM mi-2023 se sont avérés encore plus rentables et plus petits que LLaMA de META : source Mistral AI.

Le Sur Mesure : Modèles génératifs d’entreprise personnalisés

Ces modèles sont spécifiquement adaptés pour répondre aux exigences uniques d’une société ou d’une industrie particulière. Ils peuvent être conçus pour comprendre et générer du texte, des images ou d’autres types d’éléments spécifiques au domaine de l’établissement, tels que des documents juridiques, des dossiers médicaux ou des manuels techniques.

La personnalisation permet à ces modèles d’offrir une plus grande confidentialité et sécurité, car ils peuvent être entraînés sur des ensembles de données propriétaires dans le cadre de l’environnement informatique d’une organisation.

Cela réduit le risque d’exposition de données sensibles à des fournisseurs de services IA tiers. De plus, étant finement ajustés aux éléments spécifiques et aux cas d’utilisation de l’organisation, ils peuvent offrir une efficacité et une précision plus élevées pour ces tâches spécifiques.

Ils sont particulièrement utiles pour les marchés de niche ou les applications spécialisées où les modèles prêts à l’emploi pourraient ne pas fournir le niveau de compréhension ou de détail nécessaire.

Par exemple, un modèle personnalisé pourrait être développé pour une institution financière, afin de détecter la fraude dans les transactions, en apprenant les motifs et les anomalies spécifiques aux transactions des clients de cette institution.

Les nouveaux modèles: vitesse et efficacité partout

Des agents IA Intelligents aux Systèmes Multi-agents

Comme déjà mentionné dans l’un de mes articles précédents, OpenAI et Google Deep Mind ont développé des plateformes de « chatbots », les GPT, personnalisés et conviviales, qui permettent à quiconque de personnaliser ces puissants modèles de langage, et de créer leurs propres « mini-moi » pour gérer leurs besoins spécifiques – pas de compétences en codage requises !

Nous entrons dans une ère où l’IA générative ne se contente plus d’imiter l’intelligence, mais réalise réellement des tâches, du vrai progrès donc.

Ces agents IA ont montré un développement remarquable, démontrant une compréhension et une intentionnalité plus profondes dans leurs tâches. Ils ne sont pas seulement des décideurs ; ils sont des acteurs, exploitant des algorithmes avancés et l’apprentissage automatique pour fonctionner de manière autonome avec un minimum d’intervention humaine.

La capacité de ces modèles à apprendre et à se développer est un pas de géant vers des agents IA généraux.

Imagine l’évolution de l’IA à partir des agents autonomes à des systèmes multi-agents sophistiqués.

Ces systèmes collaboreront et partagerons leur expertise. Prendront des décisions collectives pour optimiser tout, de la résolution des bouchons de circulation à la sauvegarde de la planète, un watt à la fois… on s’approche petit à petit de l’IA Généralisée (soit équivalent à l’intelligence humaine), préoccupant, tu as dit ?

La prochaine génération de réseaux neuronaux

Avec les réseaux neuronaux , les chercheurs sont confrontés à un énorme défi en raison de mécanismes internes trop complexes et opaques pour que les humains comprennent exactement pourquoi ils se comportent comme ils le font.

Pour faire simple , on ne sait toujours pas expliquer exactement ce qui se passe à l’intérieur de ces réseaux neuronaux, très rassurant…

Cela devient un peu délicat lorsque ces cerveaux artificiels commencent à s’aventurer dans des zones sérieuses comme la santé.

Pour relever ces défis, la communauté de recherche essaie de développer des architectures IA encore plus avancées et plus efficaces que les modèles actuels, promettant de meilleures capacités et une efficacité plus humaine.

Mais ne plongeons pas là-dedans pour l’instant, car c’est d’une complexité extrême. Je voulais juste te faire savoir qu’il y a du progrès est en cours.

Le tourbillon du « on ne sait pas trop comment »

LES AUTRES PETITES SURPRISES TECHNOLOGIQUES EN 2024

De la science-fiction à la réalité Acte I- Souhaitons la bienvenue à C-3PO

Parlons des robots qui exploitent l’IA générative pour effectuer une gamme plus large de tâches.

Tu te demandes peut-être pourquoi les robots n’ont pas encore pris le contrôle du monde ? Eh bien, ce n’est pas faute d’avoir essayé.

La vérité, c’est qu’ils manquent d’informations. Ils sont en partie limités par leur programmation et l’état actuel de la technologie, pour intégrer des ensembles de données diversifiés en temps réel.

Le vrai défi est donc de pouvoir accéder et d’utiliser des vastes réserves d’informations dont profitent les grands modèles de langage.

La poursuite en cours dans la recherche IA est d’équiper les robots avec la capacité d’apprendre et de s’adapter d’une manière plus semblable à la façon dont les LLM traitent et appliquent les informations.

Plusieurs sociétés ont déjà fait des avancées majeures tel que Tesla avec Optimus 2 , qui sait d’ailleurs danser, ou H1 de Unitree.

Ces robots humanoïdes permettraient de répondre à diverses tâches courantes autant que des taches difficiles ou dangereuses.

Mais, comme toujours, il risque d’y avoir le revers de la médaille, s’ils commencent à être équipés par une IA trop intelligente…

L’audace de la Robotique

De de la science-fiction à la réalité Acte II :Technologie de lecture de l’esprit

Neuralink a cette année audacieusement franchi le pas vers l’avenir avec sa première implantation de puce cérébrale chez l’homme, ( ce patient serait selon Elon Musk, déjà en mesure de contrôler une souris d’ordinateur par la pensée…).

Cette entrée en scène, ainsi que de nombreuses autres startups, dans le procédé de lecture de l’esprit rend nos pensées les plus intimes à un Tweet près de la diffusion publique. Drôle, jusqu’à ce que ton cerveau partage accidentellement un peu trop lors d’une réunion Zoom.

Mais à vrai dire ce n’est pas si drôle que ça;  puiser dans nos pensées soulève une vraie controverse. Comment gardons-nous nos réflexions privées à cette nouvelle ère ?

D’un autre côté, cette technologie pourrait être un changement considérable pour les personnes handicapées, offrant de nouvelles façons de communiquer et de révolutionner notre interaction avec des appareils qui étaient autrefois considérés comme impossibles.

C’est un mélange de potentiel incroyable et de dilemmes moraux, mettant à nouveau en évidence le double tranchant du progrès.

Dans mon esprit

Manger futuriste : L’IA dans les cuisines de demain.

Parlons de la folie dans l’industrie alimentaire. Nous avons des startups comme UPSIDE Foods et ReMilk qui concoctent tout, du poulet cellulaire aux délices laitiers qui n’ont jamais vu une vache ou une poule.

Ce n’est pas nouveau, mais la phénoménale capacité de l’IA à améliorer l’efficacité et les moyens d’innovation promet de rendre la production alimentaire rapidement plus morale et durable.

Prêt à manger ton fromage, glace ou Foie Gras fabriqués en laboratoire pour Noël prochain ? Je parie que tu préfères cela aux asticots grillés…

Du lait cellulaire au fromage

Dilemmes de deepfake, désinformation électorale et augmentation de la réglementation et de la conformité :

L’avancement rapide des techniques IA a conduit à un examen accru de la part des organismes de réglementation du monde entier.

Cette tendance souligne le besoin croissant pour les applications d’IA de se conformer aux réglementations nouvelles et existantes, conçues pour assurer la sécurité, la confidentialité et l’utilisation intègre de l’IA.

La capacité de l’IA à créer des deepfakes, (contenus faux profondément crédibles), très réalistes apporte un mélange d’émerveillement et d’alarme.  Mais « là ou l’on trouve un grand pouvoir, on trouve une grande responsabilité » : distinguer le vrai de la fiction fabriquée.

De même, la facilité de générer un contenu AI réaliste, pourrait avoir de graves conséquences sur le paysage politique. En particulier cette année, où un très grand nombre de pays ont des élections, rendant plus difficile encore de distinguer le vrai du faux en ligne.

Malgré cela, trop de réglementation risque de tuer la créativité. Encore une fois, un ajustement tortueux.

Vrai ou faux ?

CONCLUSION

2024 l’est déjà, et promet de l’être, un tourbillon d’innovation, de possibilités et de curiosité. De son rôle révolutionnaire dans les affaires et le divertissement à ses bonds déontologiques.

Le paysage de l’IA ne se contente pas de changer il promet un avenir où le changement est la seule certitude.

Ainsi que tu t’en aperçois à nouveau, cette saga de l’IA se déroule à un rythme effréné. Reste-la, car tu ne voudrais pas manquer ce qui va suivre, non ?

Dis-moi en commentaire ce que tu penses de tout ça, j’adorerai avoir ton opinion, à toi.

Promis, je vais faire un lexique téléchargeable sur le site, car on commence vraiment à s’y perdre…

10
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x