Bénéficiez d’insights à partir de toutes vos données et créez des solutions d’intelligence artificielle (IA) avec Azure Databricks, configurez votre environnement Apache Spark™ en quelques minutes, tirez parti d’une mise à l’échelle automatique et collaborez sur des projets partagés dans un espace de travail interactif.
Azure Databricks prend en charge Python, Scala, R, Java et SQL, ainsi que des infrastructures et bibliothèques de science des données telles que TensorFlow, PyTorch et scikit-learn.
Apache Spark™ est une marque commerciale d’Apache Software Foundation.
Ingénierie données fiable
Traitement des données à grande échelle pour les charges de travail Batch et de streaming
Analytiques de toutes vos données
Activez l’analytique pour les données les plus complètes et les plus récentes
Science des données collaborative
Simplifiez et accélérez la science des données sur les jeux de données volumineux
Disponible en open source
Environnement Apache Spark rapide et optimisé
Principales fonctionnalités du service
Moteur Spark optimisé
Traitement de données simple sur l’infrastructure à mise à l’échelle automatique, grâce à une instance Apache Spark™ fortement optimisée pour des gains de performances pouvant être multiplié par 50.
Temps d’exécution Machine Learning
Accès en un clic à des environnements Machine Learning préconfigurés pour un Machine Learning augmenté avec des infrastructures de pointe et populaires telles que PyTorch, TensorFlow et scikit-Learn.
MLflow
Suivez et partagez des expériences, reproduisez des exécutions et gérez les modèles de manière collaborative à partir d’un référentiel central.
Choix du langage
Recourez à votre langage préféré, notamment Python, Scala, R, Spark SQL et .Net, que vous utilisiez des ressources de calcul serverless ou provisionnées.
Blocs-notes collaboratifs
Affichez et explorez rapidement les données, trouvez et partagez de nouveaux insights et créez des modèles de manière collaborative avec les langages et les outils de votre choix.
Delta Lake
Intégrez la fiabilité et la scalabilité des données à votre lac de données actuel avec une couche de stockage transactionnel open source conçue pour le cycle de vie complet des données.
Espaces de travail interactifs
Activez une collaboration fluide entre experts en mégadonnées, ingénieurs de données et analystes d’affaires.
Sécurité de niveau d’entreprise
La sécurité native et fluide garantit la protection de vos données là où elles résident et crée des espaces de travail analytiques conformes, privés et isolés pour des milliers d’utilisateurs et de jeux de données.
Prêt pour la production
Exécutez et mettez à l’échelle vos charges de travail de données les plus critiques en toute confiance sur une plateforme de données de confiance, avec des intégrations d’écosystème pour CI/CD et la supervision.
En savoir plus en consultant les exemples d’architecture de solution
Science des données et Machine Learning avec Azure Databricks
Extrayez des insights des données de streaming en direct en toute facilité. Capturez des données en continu à partir de n’importe quel appareil IoT ou de journaux de parcours de visite de site web, et traitez-les en temps quasi réel.
Architecture d’analyse moderne avec Azure Databricks
Convertissez vos données en insights actionnables à l’aide d’outils Machine Learning d’une qualité exceptionnelle. Cette architecture vous permet de combiner toutes sortes de données, quelle qu’en soit l’échelle, et de construire et déployer des modèles d’apprentissage automatique à grande échelle.
Pipelines d’ingestion, ETL et de traitement de flux avec Azure Databricks
Accélérez et gérez votre cycle de vie Machine Learning de bout en bout avec Azure Databricks, MLflow et Azure Machine Learning pour créer, partager, déployer et gérer des applications Machine Learning.