Multimodal
Le texte n’était qu’un début. L’IA multimodale voit, entend et compose : image, audio, vidéo réunis dans un même modèle. Les sens des machines s’étendent, et avec eux le champ des usages.
On suit ces avancées et ce qu’elles ouvrent, de la création à une interaction enfin naturelle, en passant par les modèles phares comme Gemini. Mais plus une IA perçoit le réel, plus une question s’impose : comment distinguer encore ce qu’elle capte de ce qu’elle invente ?
articles