La Data Science au service de la Production

Source : Scasicomp

Écrit par Marc Ruhlmann

Accéder à l'article original

• Analyse de l'article

► Qu'est ce que la "Data Science" ?

La Data Science est en plein boom dans la majeu partie des secteurs d'activité. Elle consiste à créer de la valeur avec les données. Ses besoins en ressources informatiques ne cessent alors de croître tout comme son poids stratégique. Ainsi, de nouveaux défis se présentent pour les équipe administant les infrastructur informatique. Comment fournir les performance et la scécurisation des données au Data Scientists ? Comment assurer la transition des tests de programmes d’Intelligence Articielle (IA) sur un poste de travail, ou dans le Cloud, vers une infrastructure Cloud-hybride ? C'est ce que nou allon découvire dans cet articles.

► La Data Scienceserait – t – elle déjà omniprésente ?

Il faut savoir que la Data Science est les diverses techniques qui l'accompagnent, l'IA, le Machine Learning (apprentissage automatique) et le Deep Learning (apprentissage profond), font de plus en plus partie de nos vie. que se soit dans la dernière application sur smartphone de "face-swap" ou une autre.


Avant, dans des temps ancien, la stratégie d'une société était fortement assistée par l'informatique, par des outils de Business Intelligence(BI). Ces derniers s’appuient majoritairement sur les données de l’ERP qui ne représentent qu’une fraction infime de toutes celles générées dans l’entreprise. Quid de celles générées par l’Internet of Things (IoT), les équipements d’infrastructure, les applications et terminaux mobiles ? Elles possèdent également une valeur à exploiter par les compagnies pour leur donner un avantage stratégique et concurrentiel. Encore faut-il avoir les outils pour les gérer efficacement !

► Comment exploiter efficacement la globalité des données générées ?

La forte croissance des données produites implique l’utilisation d’outils diérents des outils traditionnels.
Ces outils permettent aux data scientists d’entrainer et exploiter leurs algorithmes ou modèles qu’ils soient «traditionnels», de Machine Learning ou de Deep Learning.

Mais où sont les données ?

Ces «tools» entrent progressivement au sein des entreprises. Généralement, ils font leur apparition sur un périmètre restreint (quelques stations de travail ou un périmètre Cloud étroit). Ils sont souvent gérés directement par les développeurs et les métiers en mode «Shadow IT», Une enquête réalisée par le CESIN (Club des Experts de la Sécurité de l’Information et du Numérique) et Symantec révèle qu’en moyenne 1.700 CloudApps sont utilisées par entreprise. L’utilisation de ces applications est en croissance de + 30% depuis 2016.

► Comment gérer la montée en charge et la résilience pour mon infrastructure de Data Science?

Les nouveaux outils de Data Science ont été conçus par des développeurs dont la vision était de faire simple et ecace concernant l’infrastructure. Il s’agissait d’empiler les serveurs de congurations identiques, en mode ”pizza box”, et d’intégrer les mécanismes de résilience à l’applicatif. Cela fonctionne très bien. Cependant, des limitations à ce modèle apparaissent, notamment du point de vue des administrateurs d’infrastructures. Ces contraintes sont identiques à celles auxquelles les applications «traditionnelles» sont confrontées. Nous pouvons donc ici à apporter des réponses similaires. Les infrastructures de type convergées ont ici toute leur place

Article un peut compliquer à comprendre, à la fois dans les mot utilisés que dans l'explication, mais si on prend le temps de le lire, il nous permet de mieu interpreter et de mieu comprendre la Data Science et sont fonctionnement grâce au Deep Learning.

• Points de vues

L'auteur a un point de vue biaiser car Scasicomp est une entreprise qui travaille dans le domaine du deep learning et de la Data Science.

Pour le lecteur on peut avoir du mal à lire l'article mais si on sait prendre sont temps pour bien lire et analyser ce que raconte l'article, on comprend rapidement que ici le deep learning est important au bon fonctionnement de la Data Science.