DeepSeek : la nouvelle étoile montante de l’intelligence artificielle chinoise

DeepSeek : la nouvelle étoile montante de l’intelligence artificielle chinoise

DeepSeek est rapidement devenu un phénomène mondial cette année, propulsé en tête des classements des applications sur l’Apple App Store et Google Play. Cette startup chinoise, issue du monde de la finance quantitative, bouleverse le paysage de l’IA grâce à ses modèles performants et à une stratégie commerciale particulièrement audacieuse.

Des origines dans la finance quantitative

DeepSeek est née à l’initiative de High-Flyer Capital Management, un fonds spéculatif chinois fondé par Liang Wenfeng, passionné par l’IA et le trading algorithmique. Lancé en 2019, ce fonds utilise l’intelligence artificielle pour orienter ses décisions financières. En 2023, DeepSeek s’est démarqué en devenant un laboratoire indépendant dédié à la recherche et au développement des outils d’IA, bénéficiant du soutien financier de High-Flyer.

Contrairement à d’autres entreprises, DeepSeek a investi dès ses débuts dans ses propres centres de données pour entraîner ses modèles. Cependant, les restrictions américaines sur l’exportation de matériel technologique imposent des contraintes notables, notamment avec l’utilisation de chips Nvidia H800, moins puissants que les versions disponibles aux États-Unis.

Des modèles IA puissants et accessibles

La force de DeepSeek réside dans la qualité de ses modèles. Depuis novembre 2023, avec DeepSeek Coder, LLM et Chat, la société a su capter l’attention, mais c’est le lancement en 2024 de DeepSeek-V2, un système polyvalent d’analyse texte-image, qui a véritablement marqué les esprits. Ce modèle se distingue par son efficacité à un coût nettement inférieur à ses concurrents.

La sortie de DeepSeek-V3 fin 2024 a renforcé cette réputation. Selon les tests internes, il surpasse à la fois des modèles ouverts comme Llama de Meta et des modèles propriétaires comme GPT-4o d’OpenAI. Par ailleurs, leur modèle R1, spécialisé dans le raisonnement, est capable d’auto-vérifier ses données, augmentant la fiabilité dans des domaines complexes comme la physique ou les mathématiques.

Il faut cependant noter que ces modèles sont soumis aux règles strictes du gouvernement chinois, ce qui limite certaines réponses, notamment sur des sujets sensibles tels que Tiananmen ou la question taïwanaise.

Une stratégie disruptive et controversée

DeepSeek adopte un modèle économique atypique : ses services sont proposés à des tarifs très bas, voire gratuits, et la société refuse pour l’instant les fonds d’investisseurs externes. Cette politique nourrit des débats sur la viabilité économique réelle de l’entreprise, certains experts doutant des chiffres officiels.

Les développeurs sont néanmoins séduits par l’accès permis à ces modèles sous licences permissives, permettant un usage commercial. Sur la plateforme Hugging Face, par exemple, plus de 500 modèles dérivés de R1 ont été créés et totalisent des millions de téléchargements.

Ce succès n’est pas sans provoquer des réactions fortes : la montée en puissance de DeepSeek a fait chuter le cours de l’action Nvidia, suscité des comparaisons avec des géants comme OpenAI et déclenché des mesures de bannissement par des gouvernements et entreprises préoccupés par des enjeux de sécurité et de contrôle des données.

Microsoft intègre DeepSeek dans son offre Azure AI Foundry, mais interdit son utilisation à ses employés pour raisons de sécurité. Plusieurs pays et régions, dont la Corée du Sud et l’État de New York, ont également restreint son usage sur leurs appareils gouvernementaux.

Perspectives et enjeux futurs

DeepSeek continue de progresser techniquement, avec des mises à jour régulières, mais son avenir reste incertain face aux pressions politiques et commerciales. Aux États-Unis, le climat est de plus en plus méfiant vis-à-vis de cette technologie étrangère, envisageant même des interdictions plus larges.

En résumé, DeepSeek est une illustration saisissante des évolutions rapides de l’intelligence artificielle dans un contexte géopolitique tendu, mêlant innovation technologique, enjeux commerciaux et préoccupations de souveraineté numérique.

👉 Source ici

A lire ensuite