پردازش داده ها, کلان داده
چگونه با نامگذاری ناهماهنگ فیلدها (Inconsistent Field Naming) در میان منابع مختلف برخورد کنیم؟
Data pipelineها بیشتر از آنچه اکثر تیمها تصور میکنند خراب میشوند — نه بهخاطر رکوردهای گمشده یا کوئریهای کند، بلکه به این دلیل که همان attribute (ویژگی) در سیستمهای مختلف با نامهای متفاوت ظاهر میشود. یک CRM ممکن است customer_id را ذخیره کند، سیستم billing آن را CustomerId بنامد، و یک CSV قدیمی هنوز از […]