Show cover of #DataOops

#DataOops

DataOops : savoir-faire et compétences réunies autour des sujets données et DevOps. On y parle : - databases & performances : techniques d'optimisations, bonnes et mauvaises pratiques, détections des problèmes et même de hardware et de cloud - modélisations des données : les différents types de modélisation et leur spécificités. - devops : des bases du devops aux éléments les plus pointus et bien sur les liens entre les 3 domaines Retrouves nous sur https://www.dataoops.org pour plus de détails.

Tracks

Episode 31 : REX dataoops SQL Server et IOT, Observabilité, DataMesh
4 sujets dans cet épisode : Une REX sur un problème de modélisation de données IOT dans SQL Server. L'arrivée des fonctionnalités spatiales sur DuckDB. Discussion sur l'observabilité : théorie et un exemple de log machine friendly avec Serilog. Discussion sur le datamesh
99:00 5/28/23
Episode 30 : Parquet to SQL / 3 000 milliards de lignes dans SQL Server
On parle de chargement de données Parquet dans SQL Server via C# et bulkcopy. On parle également des bonnes pratiques pour sql server pour stocker 3000 milliards de lignes. Dernière partie avec une overview
68:10 5/12/23
Episode 29 : TPCH MSSQL entre dans la danse + ChatGpt Premiers tests
TPCH : nouveaux tests avec SQL Server et influence de la collation sur les performances. Autres Tests TPCH SF100 : DuckDB & Hyper sur un laptop vs, Snowflake (XS to 4xLarge). Quelques mots sur nos premiers essais avec ChatGPT
81:36 4/27/23
Episode 28 : TPCH Cloud Databases vs DuckDB, les outils autour de Terraform et les extended events sur SQL Server.
On parle un tout petit peu de chatGPT mais d'abord des évènements étendus (extended events) sur SQL Server et de leurs capacités à faire remonter des informations précieuses pour le diagnostique voir l'analyse du code. Ensuite nous abordons le benchmark TPCH et la comparaison des performances des bases Cloud comme comme Snowflake, BigQuery, SingleStore et Synapse vs DuckDB. Eric nous parle également des outils permettant se faciliter la vie avec Terraform.
100:07 4/1/23
Episode 27 : Data Virtualisation + Hardware NVMe-oF
Data virtualisation remise au gout du jour avec sql server 2022, la data virtualisation permet d'accéder à de nombreuses sources (SGBDR, Datalake, Fichiers...) depuis un point unique. Ce type d'architecture permet de simplifier le paysage architectural. On en parle sur Dataoops. Les disques NVMe apparus il y a quelques années on permis d'accélerer considérablement les accès disques. Les SAN en bénéficient maintenant plus efficacement avec le NVMe-oF : NVMe over Fabric.
75:30 3/18/23
Episode 26 : Big Data is Dead (DuckDB) / Data Gouvernance
On discute de l'article Big Data is Dead : de Jordan Tigani. On discute des avantages de DuckDB. Puis un on aborde la data gouvernance avec Fabien
77:52 2/26/23
Episode 25 : DataLakeHouse, ADBC et Configuration VMWare pour les bases de données
1) Premières impression sur le DatalakeHouse de Databricks. 2) Le protocole ADBC (Arrow Database Connectivity) 3) Bonnes pratiques de configuration des VMs pour les bases de données
76:13 1/23/23
Episode 24 : MongoDB avec Frédéric Favelin
MongoDB est devenu la principale base de données NoSQL du marché. De type document, elle cherche à toucher le plus de cas d'usages possibles. Frédéric Favelin Directeur Technique chez MongoDB viens nous parler de ses spécificités.
61:02 12/24/22
Episode 23 : PowerBI External Tools
Les external tools de powerBI permettent d'augmenter la productivité des développements. Fabien nous explique comment et quels tools choisir
56:56 12/14/22
Episode 22 : Datalake & Datasharing + DevOps & FinOps + Silicon Chalet
Un tour d'horizon sur les solutions Datalake du marché et discussion sur le Datasharing Coté Devops : comme le devops est perçu suivant le type d'entreprise FinOps : pilotage des couts News : Nouveau Meetup Silicon Chalet
95:03 10/28/22