شخصان يناقشان

كتاب تمهيدي حول إعداد البيانات المعززة

يمكنك تسريع وقت شركتك في الوصول إلى الإحصاءات باستخدام التعلم الآلي والتحليلات المعززة الأخرى.


ما المقصود بإعداد البيانات المعززة؟

ببساطة، يُمكّن إعداد البيانات المعزز رجال الأعمال والعاملين الآخرين الذين يفتقرون إلى الخبرة العميقة في علم البيانات والتحليلات لإنشاء مجموعات بيانات غنية وموثوقة للتحليل. بدعم من التعلم الآلي (ML) والذكاء الاصطناعي (AI) - ويتم توفيرهما على منصة آلية ذاتية الخدمة - تحول أدوات إعداد البيانات المعززة عملية العثور على البيانات الأولية وفحصها وتحويلها إلى نماذج قابلة للاستهلاك. لا تحل محل الذكاء البشري والوعي السياقي؛ يعززونها.

لاكتساب ميزة تنافسية، يعتمد القادة ومديرو مجموعة الأعمال والشركاء وغيرهم على ذكاء الأعمال (BI) وتحليلات الأعمال لتزويدهم برؤى دقيقة وذات صلة في الوقت المناسب. باستخدام إعداد البيانات المعزز، يمكن لشركتك المساعدة في إضفاء اللامركزية على إعداد البيانات وإضفاء الطابع الديمقراطي عليه حتى يتمكن المزيد من الموظفين من المساعدة في إنشاء تلك الأفكار.


كيف يتم استخدام أدوات إعداد البيانات المعززة؟

تعمل أدوات إعداد البيانات المعززة على تبسيط الخطوة الأولى وربما الأكثر أهمية في معالجة البيانات — إنشاء مجموعات البيانات اللازمة لإنشاء نماذج التحليلات واختبارها وتدريبها.

تقليديًا، كان إعداد البيانات يندرج في مجال الفرق الفنية التي كتبت التعليمات البرمجية واستخدمت البرامج المتخصصة لاستخراج البيانات من أنظمة التشغيل الداخلية وتنظيفها وهيكلها وتحميلها في مستودعات البيانات. قد تكون هذه العمليات، المعروفة باسم استخراج البيانات وتحويلها وتحميلها (ETL)، معقدة وتستغرق وقتًا طويلاً ومعرضة للخطأ.

لم يكن لدى معظم مستخدمي الأعمال العاديين المهارات أو الوقت للقيام بعمل ETL بأنفسهم. حتى علماء بيانات المواطنين - محللو الأعمال والمطورون وغيرهم ممن يفتقرون إلى التدريب الرسمي على علوم البيانات ولكنهم يؤدون بعض التحليلات المتقدمة - وجدوا أنفسهم يعتمدون على مهندسي البيانات وغيرهم من المتخصصين في البيانات لتحديد البيانات التي يجب تحليلها وكيفية تحليلها.

لقد تغيّر الزمن. الآن، تخزن المؤسسات كميات هائلة من البيانات المهيكلة وشبه المهيكلة وغير المهيكلة، بما في ذلك النصوص والصور، في تطبيقات وأنظمة متعددة. نادرًا ما يكون لدى فرق تكنولوجيا المعلومات وإدارة البيانات المركزية الوقت والموارد اللازمة لجمع البيانات وإعدادها، ناهيك عن النماذج ودراستها، لدعم جميع مبادرات التحليلات المتنوعة للشركة.

بفضل أدوات إعداد البيانات المعززة، يمكن لعدد أكبر من الأشخاص التقدم وتقديم المساعدة. تتميز هذه الأدوات بواجهات محادثة تعمل بالإشارة والنقر، وتوجه المستخدمين بثبات من خلال القرارات المستندة إلى البيانات المتعلقة بإعداد البيانات.


ما خطوات إعداد البيانات؟

تتكون عملية إعداد البيانات، المعروفة أيضًا باسم مناظرة البيانات أو تغييرها، من سلسلة من الأنشطة المتسلسلة لدمج البيانات وهيكلتها وتنظيمها. تتوج خطوات إعداد البيانات، الموضحة أدناه في الفئات شائعة الاستخدام، في إنشاء مجموعة بيانات واحدة موثوق بها للإبلاغ عن حالة استخدام محددة أو أكثر:

  1. المجموعة. مسترشدًا بأهداف التحليل المقصود، يحدد فريق التحليلات البيانات ذات الصلة ويسحبها من مصادر البيانات الداخلية والخارجية. على سبيل المثال، إذا كان الهدف هو إلقاء الضوء على تفضيلات منتجات العملاء، فيمكن للفريق استخلاص بيانات كمية ونوعية من تطبيقات إدارة علاقات العملاء والمبيعات، واستطلاعات العملاء، والملاحظات على وسائل التواصل الاجتماعي. خلال هذه المرحلة، يجب على الفريق التشاور مع جميع أصحاب المصلحة واستخدام مجموعات بيانات موثوقة، وإلا فإنه يخاطر بالنتائج المتحيزة أو المنحرفة.
  2. الاكتشاف والتنميط. من خلال المراحل التكرارية للاستكشاف والتحليل، يفحص الفريق البيانات الأولية التي تم جمعها لفهم الهيكل العام والمحتوى الفردي بشكل أفضل داخل كل مجموعة بيانات. كما يدرس العلاقات عبر مجموعات البيانات. من خلال تحديد سمات البيانات، يقوم الفريق بجمع وتلخيص الإحصائيات حول الحالات الشاذة والتناقضات والفجوات والقضايا الأخرى التي يجب معالجتها قبل استخدام البيانات لتطوير نماذج التحليلات وتدريبها. على سبيل المثال، غالبًا ما يختلف العميل والمريض ومجموعات البيانات الأخرى التي تحتوي على الأسماء والعناوين المخزنة عبر الأنظمة في التهجئة وغيرها من الطرق.
  3. التطهير. في هذه المرحلة، يجب على الفريق تصحيح جميع مشكلات جودة البيانات بدقة. يتضمن التطهير أنشطة مثل ملء القيم المفقودة، وتصحيح البيانات المعيبة أو إزالتها، وتصفية البيانات غير ذات الصلة، وإخفاء البيانات الحساسة. تستغرق خطوة إعداد البيانات هذه وقتًا طويلاً ومملة، وهي ضرورية لضمان دقة البيانات واتساقها. التطهير مهم بشكل خاص عند العمل مع البيانات الضخمة بسبب أحجام البيانات الهائلة التي يجب تنسيقها.
  4. الهيكلة. تستلزم هذه الخطوة تطوير مخطط قاعدة بيانات يصف كيفية تنظيم البيانات في جداول لتمكين الوصول السلس عن طريق أدوات النمذجة. يمكن اعتبار المخطط هيكلًا دائمًا يضم البيانات المتغيرة باستمرار بطريقة موحدة. يتم تعريف جميع المكونات التخطيطية.
  5. التحول والإثراء. بمجرد تعيين المخطط، يجب على الفريق التأكد من توافق جميع البيانات. ستحتاج بعض تنسيقات البيانات الموجودة إلى التغيير، مثل تعديل التسلسلات الهرمية وإضافة أو دمج أو حذف الأعمدة والحقول. يمكن للفريق أيضًا تحسين البيانات بمعلومات سلوكية وديموغرافية وجغرافية ومعلومات سياقية أخرى مأخوذة من مصادر داخل المؤسسة وخارجها. تمكّن مجموعة البيانات المخصّصة من تدريب نماذج التحليلات بمجموعات بيانات أكثر شمولاً وبالتالي تقديم رؤى أكثر دقة وقيمة.
  6. تصديق. الآن، يجب على الفريق استخدام البرامج النصية أو الأدوات المكتوبة للتحقق من جودة ودقة مجموعة البيانات الخاصة به. كما أنه يؤكد أن بنية البيانات والتنسيق يتوافقان مع متطلبات المشروع بحيث يمكن للمستخدمين وأدوات نمذجة المشروع الوصول إلى البيانات بسهولة. اعتمادًا على حجم مجموعة البيانات، قد يختار الفريق اختبار عينة بيانات بدلاً من مجموعة البيانات الكاملة. يجب أن يحل أي مشاكل قبل الانتقال إلى الخطوة الأخيرة في عملية إعداد البيانات.
  7. النشر. عندما يكون الفريق واثقًا من جودة بياناته، فإنه ينقلها إلى مستودع البيانات المستهدف أو بحيرة البيانات أو أي مستودع آخر. هنا، يمكن للفريق والآخرين داخل المؤسسة الوصول إليها لتطوير واختبار نماذج التحليلات.

كيف يعزز التعلم الآلي إعداد البيانات والنمذجة؟

أصبحت تحليلات البيانات المعززة ممكنة من خلال التحليلات المعززة، بما في ذلك ML، والأتمتة، وإنشاء اللغة الطبيعية (NLG)، وتصور البيانات. على سبيل المثال، يعتمد اكتشاف البيانات المعززة بشكل كبير على ML - وهو نوع من الذكاء الاصطناعي يستخدم الخوارزميات والنماذج الإحصائية للتعلم من البيانات والتكيف دون مساعدة بشرية.

باستخدام ML، تطبق أدوات الاكتشاف المعرفة المكتسبة للنظر في أنواع مجموعات البيانات المطلوبة بالنظر إلى المشكلة التي يجب أن يحلها النموذج والفرضية المراد اختبارها. كما أنهم يأخذون بعين الاعتبار السياق الذي تم فيه جمع مجموعات البيانات. بعد ذلك، تقوم الأدوات بسرعة بتحليل الاستنتاجات واستخلاصها من الأنماط الموجودة في مجموعات البيانات وتقترح بذكاء تلك التي يجب دمجها.

لا يستخدم اكتشاف البيانات المعزز التعلم الآلي فحسب، بل يساعد أيضًا في ضمان إعداد البيانات الفعال لنماذج التعلم الآلي. على سبيل المثال، تستخدم أدوات الاكتشاف خوارزميات ML لإنشاء توصيات للمستخدمين حول كيفية تطهير وإثراء البيانات وتحويلها إلى تنسيق مناسب لتحليل نموذج ML.


كيف يمكن لشركتك الاستفادة من إعداد البيانات المعزز؟

كل يوم، يحدد قادة الأعمال والفرق عبر المجالات طرقًا جديدة وإستراتيجية للاستفادة من البيانات. من خلال إعداد البيانات المعزز، يمكنهم العمل على الأفكار المبتكرة لمشروعات التحليل دون مساعدة متخصصي تكنولوجيا المعلومات.

يمكن أن تصل فوائد إعداد البيانات المعزز عبر مؤسستك:

  • تعزيز الإنتاجية -باستخدام واجهات المستخدم الرسومية البديهية مع أدوات الخدمة الذاتية الآلية، يمكن لمستخدمي الأعمال المهرة جمع البيانات بسرعة من مصادر متعددة ومتباينة وتشغيلها من خلال التنميط والتنظيف ووظائف إعداد البيانات الرئيسية الأخرى. يساعد إعداد البيانات المعزز أيضًا في تقليل المهام التي تستغرق وقتًا طويلاً لمحترفي تكنولوجيا المعلومات والبيانات أو التخلص منها.
  • تقديم بيانات عالية الجودة -عند إعداد البيانات يدويًا، يمكن حتى لعلماء البيانات ذوي الخبرة تقديم بيانات غير دقيقة وغير ذات صلة عن طريق الخطأ - أو يفشلون في تضمين البيانات المهمة. يمكن لإعداد البيانات المعززة تحديد مشكلات الجودة وتصحيحها تلقائيًا، مما يساعد على ضمان إنتاج مجموعة بياناتك لنتائج صحيحة.
  • تسريع عائد الاستثمار -تؤدي زيادة الإنتاجية في الواجهة الأمامية لمشروعات التحليلات إلى توفير المزيد من الوقت والموارد لنمذجة البيانات والتعدين والتحليل. بدلاً من الانشغال بالأعمال اليدوية لإعداد البيانات، يمكن للمستخدمين التركيز على دراسة الأفكار وتطبيقها لتحويل العمليات التجارية والتحديات. بمجرد الإنشاء، يمكن أن تحتوي مجموعة البيانات على العديد من التطبيقات، ما يؤدي إلى زيادة تحسين استثماراتك.
  • محركات إضفاء الطابع الديمقراطي على البيانات -لأنها مجهزة للمساعدة في إعداد البيانات للتحليل ونشره، يمكن للمستخدمين غير المتخصصين أن يصبحوا أكثر راحة في التعامل مع البيانات الأولية. بالإضافة إلى ذلك، يمكن للمستخدمين الأكثر دراية بمشكلة التحليلات الاستفادة من معارفهم وخبراتهم التجارية لاختيار مجموعات بيانات ذات دلالة إحصائية والمساعدة في هيكلة وإثراء البيانات لدعم أهداف المشروع. مع نمو المعرفة بالبيانات في مؤسستك، يكتسب الأشخاص ثقة أكبر في القرارات والإستراتيجيات القائمة على البيانات.
  • تحسين سرعة الأعمال -قادر على إعداد مجموعات بيانات شاملة بسرعة، ويمكن للمستخدمين إطلاق مشروعات تحليلات جديدة بسرعة لدعم الأعمال المتغيرة وظروف السوق. كلما كان الوقت المستغرق في الحصول على الرؤى بشكل أسرع، زادت سرعة تطبيق شركتك لتلك الأفكار لاكتساب ميزة تنافسية.

كيف تقوم الشركات بتطبيق إعداد البيانات المعزز؟

عبر المجالات، تستخدم المعلومات المهنية الشركات البيانات أدوات تحليلات الأعمال وتستمد منها قيمة أكبر. على سبيل المثال، بعد دمج إعداد البيانات المعزز في مهام سير العمل الخاصة بهم، قامت المؤسسات التالية بجمع البيانات ومعالجتها بكفاءة لدعم تحليلاتها:

الخدمات المصرفية

لفهم العملاء الذين من المرجح أن يستخدموا خدمات استثمار الثروات بشكل أفضل - ومن ثم استهدافهم بعروض ترويجية مخصصة - قام بنك كبير بجمع وتوحيد بيانات الحساب والإيداع والسحب وبيانات بطاقات الائتمان بسرعة من جميع فروعه وشبكة ATM. كما أنها قامت بسحب البيانات الديموغرافية والاجتماعية الاقتصادية وغيرها من البيانات السياقية من مصادر خارجية.

البيع بالتجزئة

سعت سلسلة صيدليات دولية إلى معرفة سبب ضعف أداء مكياج اسم علامتها التجارية في بعض المواقع دون غيرها. لقد جمعت بين نقاط البيع وفئة المنتج وولاء العملاء ونقاط المروج الصافي وبيانات التسعير من أنظمتها الداخلية مع البيانات الجغرافية الخارجية لبناء مجموعة بيانات غنية للتحليل.

الزراعة

أرادت شركة تكنولوجيا زراعية صغيرة استخدام الخوارزميات الخاصة بها لدراسة اتجاهات غلة المحاصيل في المناطق التي تعاني من الجفاف حتى تتمكن من تقديم المشورة لصغار المزارعين بشأن المحاصيل التي يجب زراعتها ومتى. بالاستفادة من مجمعات البيانات الضخمة التي تحتفظ بها المؤسسات العامة والخاصة، قامت بتجميع البيانات المتعلقة بمتغيرات متعددة، بما في ذلك الظروف الجوية ودرجات حرارة التربة ومحتوى الرطوبة واستخدام المياه وحالة المحاصيل.

القانوني

قامت شركة قانونية تدافع عن عميل شركة في دعوى قضائية كبيرة بتحليل ملايين رسائل البريد الإلكتروني للعملاء وغيرها من المستندات غير المنظمة للتاريخ ذي الصلة. من خلال الحد بشكل كبير من أنشطة اكتشاف البيانات اليدوية والمتكررة، كان لدى الشركة المزيد من الوقت لمراجعة النتائج ذات الصلة وتحليلها.

الحكومة

أرادت حكومة ولاية أمريكية استخدام ممارسات الصيانة التنبؤية للمساعدة في خفض تكاليف الوقود والصيانة والخدمات لأسطولها من السيارات والآلات الثقيلة. لتحديد المركبات التي تحتاج إلى خدمة بشكل أفضل ومتى، وقرب كل مركبة في الوقت الفعلي من مرفق الخدمة، قام فريق إدارة الأصول بدمج المعلومات من سجلات صيانة السيارة وأجهزة استشعار الأداء مع بيانات GPS الخارجية.


كيف يمكن لشركتك تنفيذ حل إعداد البيانات المعزز؟

قبل تقديم إعداد البيانات المعزز للموظفين، يجب أن تكسب شركتك ثقتهم. قد يشعر بعض الأفراد بالقلق من أن التقنيات الجديدة ستغير أو حتى تلغي أدوارهم. لتعزيز القبول، يمكن للمديرين دعوة الفرق المتأثرة للمساعدة في تحديد عمليات إعداد البيانات الجديدة ومناقشة كيفية تطور أدوارهم. أيضًا، يساعد تعزيز المعرفة بالبيانات بشكل استباقي عبر المؤسسة، خاصة بين الفِرق التي ليست على دراية بتحليلات البيانات المعززة، على تعزيز الثقة في الرؤى الناتجة.

عند اختيار حل إعداد بيانات الخدمة الذاتية، اطرح الأسئلة التالية:

  • هل سيتصل الحل بمجموعة متنوعة من مصادر البيانات، سواء في أماكن العمل أو في السحابة؟
  • هل يمكنها العمل مع البيانات الأولية شبه المهيكلة وغير المهيكلة؟
  • إلى أي مدى يتم أتمتة عملية إعداد البيانات؟
  • هل يحتوي على أدوات قوية وبديهية؟
  • هل يدعم الحل التعاون بين المؤسسات ومشاركة البيانات؟
  • هل يمكنه التوسع للتعامل مع البيانات الضخمة؟
  • هل ستدعم الأنظمة الأساسية للتحليلات السحابية؟ إذا كان الأمر كذلك، فما هي بالضبط؟
  • هل ستمكّن أمان البيانات والخصوصية وتدعم الامتثال التنظيمي؟
  • ما التكلفة، مع الأخذ في الاعتبار تراخيص البرامج، ومتطلبات المعالجة والتخزين، وإعداد الموظفين وتدريبهم؟

بمجرد أن تقرر الحل، ابدأ بالتنفيذ على نطاق صغير. اطلب من علم البيانات، والأعمال التجارية، وأصحاب المصلحة الآخرين تحديد عدد قليل من الفرق المثقفة بالبيانات مع حالات الاستخدام التي تناسب إعداد البيانات المعزز. بناءً على أهداف شركتك لتحليل البيانات المعزز، اطرح الحل تدريجيًا على الفِرق الأخرى.

ناقش المزيد من القيمة من بياناتك باستخدام Microsoft Power BI

يمكن أن يساعد Microsoft Power BI شركتك في جعل تحليلات البيانات المعززة عملية أبسط وأسرع وأكثر شمولاً. بناءً على استفسارات NLG وتوصياتها وبمساعدة تصورات البيانات، يمكن لفرق العمل إعداد مجموعات بيانات دقيقة وشاملة بشكل أسرع وأكثر ثقة لإنشاء رؤى الجودة.


الأسئلة المتداولة

ما المقصود بإعداد البيانات؟

يتضمن إعداد البيانات جميع مراحل إنشاء مجموعات بيانات عالية الجودة ودقيقة وشاملة لذكاء الأعمال وتحليلات الأعمال. يساعد على ضمان قدرة المؤسسة على إنشاء الرؤى اللازمة لاكتساب ميزة تنافسية.

ما المقصود بأدوات تحضير البيانات؟

تسهل أدوات إعداد البيانات جمع البيانات واكتشافها وتصنيفها وتنظيفها وهيكليتها وتحويلها وإثرائها والتحقق من صحتها ونشرها.

ما المقصود بعملية إعداد البيانات المعززة؟

تستخدم عملية إعداد البيانات المعززة التحليلات المعززة - بما في ذلك ML وNLG وتصور البيانات - لتحويل الأنشطة التقليدية المملة والمستهلكة للوقت إلى تدفقات عمل آلية وأكثر ذكاءً.

لماذا يعد إعداد البيانات المعزز مهمًا؟

يمكن أن يقدم إعداد البيانات المعزز العديد من الفوائد. يمكنه زيادة الإنتاجية وتشغيل التحليلات باستخدام بيانات عالية الجودة وتسريع عائد الاستثمار في مشروعات التحليلات وإضفاء الطابع الديمقراطي على البيانات وتحسين سرعة الأعمال.

ما المقصود بإعداد البيانات للتعلم الآلي؟

يوفر الإعداد الفعال للبيانات لتطبيقات التعلم الآلي مجموعات بيانات عالية الجودة لبناء نماذج ML واختبارها. على سبيل المثال، تستخدم العديد من أدوات إعداد البيانات المعززة خوارزميات ML لتقديم توصيات للمستخدمين حول كيفية تطهير وإثراء البيانات وتحويلها إلى تنسيق مناسب لتحليل نموذج ML.