تخزين البيانات: التعريف والأنواع والأمثلة والأدوات

تخزين البيانات: التعريف والأنواع والأمثلة والأدوات
رصيد الصورة: Freepik.com
جدول المحتويات إخفاء
  1. ما هو تخزين البيانات؟ 
  2. كيف يعمل تخزين البيانات؟
  3. أنواع مستودعات البيانات
    1. # 1. مستودع بيانات المؤسسة (EDW):
    2. # 2. مخزن البيانات التشغيلية (ODS):
    3. # 3. مارت البيانات:
  4. ما هي المراحل الثلاث لتخزين البيانات؟ 
    1. # 1. قاعدة البيانات غير المتصلة:
    2. # 2. مستودع البيانات في الوقت الفعلي:
    3. # 3. مستودع البيانات المتكامل:
  5. كيف تقوم ببناء مستودع بيانات بسيط؟ 
    1. الخطوة 1: تحديد أهداف العمل
    2. الخطوة الثانية: جمع المعلومات وتحليلها
    3. الخطوة الثالثة: تحديد العمليات التجارية الأساسية:
    4. الخطوة 4: بناء نموذج بيانات مفاهيمي:
    5. الخطوة 5: تحديد مصادر البيانات وتخطيط عمليات تحويل البيانات:
    6. الخطوة 6: تعيين مدة التتبع:
    7. الخطوة السابعة: تنفيذ الخطة:
  6. أفضل 10 أدوات لتخزين البيانات في عام 2023
    1. # 1. الانزياح الأحمر في أمازون: 
    2. # 2. مايكروسوفت أزور: 
    3. # 3. Google BigQuery: 
    4. # 4. ندفة الثلج: 
    5. # 5. مايكرو فوكس فيرتكا: 
    6. # 6. أمازون دينامو دي بي: 
    7. # 7. PostgreSQL: 
    8. # 8. أمازون S3: 
    9. # 9. تيراتا: 
    10. # 10. أمازون RDS: 
  7. ما هو تخزين بيانات SQL؟ 
  8. ما هو مستودع البيانات في ETL؟ 
  9. ما هي مفاهيم Etl؟ 
    1. # 1. اِستِخلاص: 
    2. # 2. تحول: 
    3. # 3. حمولة: 
  10. ما هو الفرق بين قاعدة البيانات ومخزن البيانات؟ 
  11. ما هي مفاهيم تخزين البيانات؟
    1. # 1. مصادر البيانات: 
    2. # 2. نمذجة البيانات: 
    3. # 3. تكامل البيانات: 
    4. # 4. مخزن البيانات: 
    5. # 5. الدخول الى البيانات: 
    6. # 6. مراقبة البيانات: 
    7. # 7. مارت البيانات: 
  12. ما هو تخزين البيانات السحابية؟
  13. ما هو تخزين بيانات Azure؟
  14. ما هو تخزين البيانات ندفة الثلج؟
  15. هل يتطلب تخزين البيانات ترميزًا؟
  16. مقالات ذات صلة: 
  17. المراجع:

يُعد تخزين البيانات أمرًا بالغ الأهمية للمؤسسات للإبلاغ بكفاءة عن كميات كبيرة من البيانات وتحليلها عبر مستويات مختلفة ، بما في ذلك خدمة العملاء وتكامل الشركاء والقرارات التنفيذية. فهم هذه المفاهيم أمر ضروري.

دعنا نفحص بعض مفاهيم تخزين البيانات الرئيسية في هذه المقالة لفهم أهمية تخزين البيانات.

ما هو تخزين البيانات؟ 

مستودع البيانات هو المكان الذي تخزن فيه شركة أو مؤسسة أخرى بيانات إلكترونية سرية. يمكن فهم عمليات المؤسسة بشكل أفضل باستخدام البيانات التاريخية التي يهدف مستودع البيانات إلى جمعها وتنظيمها.

بالإضافة إلى ذلك ، يعد مستودع البيانات عنصرًا حاسمًا في ذكاء الأعمال. يشمل هذا المصطلح الأوسع معلومات البنية التحتية التي تستخدمها الشركات المعاصرة لمراقبة نجاحاتها وإخفاقاتها السابقة وتوجيه قراراتها المستقبلية.

لاحظ أن: 

  • مستودع البيانات هو المكان الذي تقوم فيه شركة أو مؤسسة أخرى بتخزين المعلومات بمرور الوقت.
  • يضيف الأشخاص من مجموعة متنوعة من الأقسام المهمة ، بما في ذلك التسويق والمبيعات ، بيانات جديدة بشكل دوري.
  • يتحول المستودع إلى مستودع للبيانات التاريخية التي يمكن الرجوع إليها وتحليلها للمساعدة في اتخاذ القرارات التجارية.
  • يعد تحديد المعلومات الضرورية للمؤسسة وتحديد مصادر المعلومات من المكونات الأساسية في إنشاء مستودع بيانات ناجح.
  • تم تصميم قاعدة البيانات لتوفير بيانات في الوقت الفعلي. يتم إنشاء مستودع البيانات كمستودع للبيانات القديمة.

كيف يعمل تخزين البيانات؟

تخزين البيانات ، الذي أدخله باحثو IBM Barry Devlin و Paul Murphy في عام 1988 ، هو أداة لتحليل البيانات التاريخية من مصادر مختلفة. إنه يمكّن المستخدمين من تشغيل الاستعلامات والتحليلات على بيانات المعاملات ، مما يوفر رؤى حول أداء الشركة.

لاحظ أن البيانات التي تمت إضافتها إلى المستودع ثابتة وغير قابلة للتغيير. بالإضافة إلى ذلك ، يعمل المستودع كمصدر بيانات للتحليلات التاريخية ، مع التركيز على التعديلات على مر السنين. يجب حفظ البيانات المخزنة بطريقة آمنة ويمكن الاعتماد عليها وقابلة للاسترداد ويمكن التحكم فيها.

أنواع مستودعات البيانات

# 1. مستودع بيانات المؤسسة (EDW):

يقدم المستودع المركزي المسمى مستودع بيانات المؤسسة (EDW) خدمات دعم القرار للمؤسسة بأكملها. علاوة على ذلك ، تتكون EDWs عادةً من عدة قواعد بيانات توفر طريقة موحدة لتصنيف البيانات وتنظيمها حسب الموضوع.

# 2. مخزن البيانات التشغيلية (ODS):

تُعرف قاعدة البيانات المركزية لمستودع بيانات المؤسسة للإبلاغ التشغيلي واتخاذ القرار باسم ODS (EDW). بالإضافة إلى ذلك ، بينما يدعم EDW القرارات التكتيكية والاستراتيجية ، فهو مكون تكميلي يوفر تحديثات في الوقت الفعلي للمهام الروتينية مثل سجلات الموظفين.

# 3. مارت البيانات:

سوق البيانات هو مجموعة فرعية من مستودع البيانات يركز على فريق معين أو خط عمل. بالإضافة إلى ذلك ، فإنه يوفر وصولاً سريعًا إلى بيانات محددة ، مما يتيح للمستخدمين اكتساب رؤى مهمة دون إضاعة الوقت في البحث في مستودع البيانات بأكمله.

ما هي المراحل الثلاث لتخزين البيانات؟ 

# 1. قاعدة البيانات غير المتصلة:

في هذه المرحلة ، يتم نقل البيانات من الأنظمة المستخدمة للعمليات اليومية إلى خادم خارجي للنسخ الاحتياطي. لا تتداخل البيانات مع العمليات الحالية ، مثل التحميل وإعداد التقارير.

  • مستودع البيانات غير المتصل:

لا يتم ضمان أن تكون البيانات حديثة دائمًا في هذا الوقت. من قاعدة البيانات التشغيلية ، يتم تحديث البيانات بانتظام (أسبوعيًا ، شهريًا ، إلخ).

# 2. مستودع البيانات في الوقت الفعلي:

في هذه المرحلة ، يتم تحديث مستودعات البيانات في كل مرة تحدث فيها معاملة في قاعدة البيانات التشغيلية. بالإضافة إلى ذلك ، يتم استخدام المشغلات المستندة إلى الحدث لجمع البيانات وتنبيه مستودع البيانات عند الحاجة إلى تحديث السجلات. حجز تذكرة طيران هو توضيح.

# 3. مستودع البيانات المتكامل:

في هذه المرحلة ، في كل مرة يتم فيها تنفيذ عملية بواسطة أنظمة التشغيل ، تتلقى مستودعات البيانات تحديثًا. لتوفير أحدث البيانات وتجنب الاضطرابات في جمع البيانات ، يقومون أيضًا بنقلها مرة أخرى إلى أنظمة التشغيل. لاحظ أن هذه المرحلة من البيانات هي الأكثر تحديثًا وأمانًا. ونتيجة لذلك ، تعتبر هذه الخطوة الأكثر ثقة.

كيف تقوم ببناء مستودع بيانات بسيط؟ 

الخطوة 1: تحديد أهداف العمل

يتوسع العمل بسرعة ويحتاج إلى فريق متوازن جيدًا من الموظفين الإداريين والمبيعات والإنتاج والدعم. يجب تقييم فعالية زيادة التوظيف العام ، وتحسين فريق المبيعات ، وتحقيق التوازن بين التركيز الوطني والإقليمي من قبل صانعي القرار الرئيسيين. 

يتضمن ذلك المالك والرئيس وأربعة مديرين رئيسيين يتشاركون في الموارد وجهات الاتصال وفرص المبيعات والموظفين أثناء الإشراف على مراكز الربح. بالإضافة إلى ذلك ، يجب أن يربط النظام المزيد من المعلومات ، مثل حجم العقد ، بالعوامل التي تؤدي إلى عقود أكبر واتخاذ قرارات مستنيرة. يقود المنظمة مؤشرات الأداء الرئيسية مثل الوحدات المباعة ، وإجمالي الربح ، وصافي الربح ، والساعات التي يتم قضاؤها ، وتعليم الطلاب ، وتكرار تسجيل الطلاب.

الخطوة الثانية: جمع المعلومات وتحليلها

يجب على القادة استنباط معلومات حول الأداء من خلال الأسئلة وجمع البيانات من مصادر مختلفة ، بما في ذلك برامج المحاسبة وبرامج إدارة علاقات العملاء وأنظمة تتبع الوقت. يمكن للمحللين والمديرين والمساعدين الإداريين إنتاج تقارير تحليلية وموجزة تتضمن بيانات تم التغاضي عنها. قد يكون من الصعب على مصممي مستودعات البيانات جمع هذه المعلومات ، ولكن من الضروري فهم وجودها وكيفية جمعها ومعالجتها. 

بالإضافة إلى ذلك ، يعد فهم العملية والغرض منها ضروريًا لتصميم مستودع بيانات ، حيث يسمح بأتمتة مهام إعداد التقارير دون تحديد الأشخاص المعنيين وفهمهم.

الخطوة الثالثة: تحديد العمليات التجارية الأساسية:

ابحث عن الكيانات التي تتفاعل لإنشاء المؤشرات لربط مؤشرات الأداء الرئيسية في مستودع البيانات. على سبيل المثال ، يتضمن بيع التدريب العديد من العوامل البشرية والتجارية ، بما في ذلك العملاء والمدربين ومقدمات المنتجات الجديدة والعروض الترويجية وتوظيف مندوبي مبيعات جدد. يتم تخزين مؤشرات الأداء الرئيسية لعملية تجارية معينة في مستودع البيانات ، والتي تربطها أيضًا بالعوامل التي أدت إليها. 

بالإضافة إلى ذلك ، يتم تخزين هذه المؤشرات في جداول الحقائق ، ويتم عمل جداول الأبعاد لربطها بالأبعاد التي أنتجتها. 

الخطوة 4: بناء نموذج بيانات مفاهيمي:

بعد تحديد العمليات التجارية ، يمكنك إنشاء نموذج مفاهيمي للبيانات. أنت تختار الموضوعات التي سيتم تقديمها كجداول حقائق والأبعاد التي سيتم ربطها بالحقائق. حدد تنسيق تخزين المعلومات ومؤشرات الأداء الرئيسية لكل عملية تجارية بالتفصيل. لاحظ أنه نظرًا لأنه سيتم دمج البيانات لتشكيل مكعبات OLAP ، يجب أن تكون في وحدة قياس متسقة. 

علاوة على ذلك ، على الرغم من أن الأمر قد يبدو سهلاً ، إلا أن العملية ليست كذلك. يجب عليك تحديد عملة ، على سبيل المثال ، إذا كانت المنظمة دولية وتحتفظ بالنقود في متناول اليد. الخطوة التالية هي تحديد متى وبأي سعر صرف ستقوم بتحويل العملات الأخرى إلى العملة التي حددتها. 

الخطوة 5: تحديد مصادر البيانات وتخطيط عمليات تحويل البيانات:

لإدارة البيانات بشكل فعال في مستودع البيانات ، حدد مصادر المعلومات الهامة ونقلها إلى بنية موحدة ومتسقة. بالإضافة إلى ذلك ، يتضمن ذلك ربط المعلومات بين قواعد بيانات إدارة علاقات العملاء الداخلية وقواعد بيانات إعداد تقارير الوقت ، بالإضافة إلى تنقية البيانات لضمان التحليل الدقيق. يمكن القيام بذلك عندما: 

  • تأكد من اكتمال بيانات المصدر قبل استخدامها ، إما برمجيًا أو يدويًا. 
  • حدد أكثر الوسائل فعالية من حيث التكلفة لتصحيح البيانات وتوقع تلك التكاليف كجزء من تكلفة النظام. 
  • قم بإجراء تحويلات البيانات باستخدام أدوات مثل خدمات تحويل البيانات (DTS) مع مراعاة تكلفة التدريب والصيانة. 
  • جدولة استخراج البيانات لتقليل التأثير على مستخدمي النظام وضمان سلامة البيانات.

الخطوة 6: تعيين مدة التتبع:

يجب أن تكون أرشفة البيانات متسقة بمرور الوقت لأن مستودعات البيانات تحتاج إلى مساحة تخزين كبيرة. من خلال الأبعاد المشتركة ، يمكن ربط هياكل البيانات المختلفة ذات الحبوب المختلفة. يمكن تخزين البيانات التي تم تلخيصها بمرور الوقت في مجموعة متنوعة من التنسيقات ، بما في ذلك اليوم أو الأسبوع أو الشهر.

علاوة على ذلك ، اعتمادًا على عمر البيانات ، يمكن أن تعمل الأدوات التحليلية بأحجام مختلفة من الحبوب ، ويمكن تحويل البيانات التاريخية القديمة المستوردة إلى التنسيق المناسب.

الخطوة السابعة: تنفيذ الخطة:

وضع خطة لمشاريع مستودع البيانات لتقدير مراحل العمل والجدول الزمني. قم بتطبيق سوق البيانات لعرض قدرات النظام ، ودمج هياكل البيانات الجديدة لأنها تتلاءم معًا مثل أحجية الصور المقطوعة. يضمن هذا النهج نجاح المشروع ويحافظ على نطاق مشاريع مستودعات البيانات الكبيرة.

بالإضافة إلى ذلك ، يمكن لصناع القرار الوصول إلى البيانات التاريخية الموحدة والمتسقة حول عمليات مؤسستهم بفضل أنظمة تخزين البيانات. من خلال التخطيط الدقيق ، يمكن للنظام توفير معلومات مهمة حول كيفية تفاعل المتغيرات لصالح المنظمة أو تعريضها للخطر. يمكن إدارة التكاليف ، ويمكن أن تصبح هذه الأداة القوية حقيقة واقعة من خلال خطة مدروسة جيدًا.

أفضل 10 أدوات لتخزين البيانات في عام 2023

هناك العديد من الأدوات لتخزين البيانات القائمة على السحابة. نتيجة لذلك ، يصبح اختيار أفضل أدوات مستودع البيانات لمشروعنا أمرًا صعبًا. أهم 10 أدوات لتخزين البيانات هي كما يلي:  

# 1. الانزياح الأحمر في أمازون: 

Amazon Redshift عبارة عن مستودع بيانات قائم على السحابة قادر على معالجة بيتابايت من البيانات وتقديم استعلام سريع باستخدام العملاء المستندة إلى SQL وأدوات ذكاء الأعمال. بالإضافة إلى ذلك ، يتكامل مع AWS ويدعم عمليات تصدير البيانات المفتوحة ، مما يجعل اعتماد النظام الأساسي والتأقلم معه أمرًا سهلاً.

# 2. مايكروسوفت أزور: 

بدأت Microsoft في إنشاء التطبيقات والخدمات واختبارها ونشرها وإدارتها ، وكل ذلك ممكن على نظام الحوسبة السحابية العامة المعروف باسم Azure. توفر Azure البنية التحتية كخدمة (IaaS) والنظام الأساسي كخدمة (PaaS) والبرنامج كخدمة (SaaS) من بين أكثر من 200 منتج وخدمة. 

بالإضافة إلى ذلك ، فإنه يوفر إمكانية النقل والتكامل وأساسًا آمنًا لكل من الأمان التشغيلي والبنية التحتية المادية. يمكن استضافة تطبيقات الويب والخدمات وواجهات برمجة التطبيقات المريحة وإدارتها بواسطة Azure Apps.

# 3. Google BigQuery: 

BigQuery عبارة عن مستودع بيانات بدون خادم مزود بإمكانيات ANSI SQL والتعلم الآلي ، تم تطويرها في عام 2010. بالإضافة إلى ذلك ، إنها خدمة تحليلات قائمة على السحابة ومناسبة لمجموعات البيانات الكبيرة للقراءة فقط وتقدم خدمات القياس التلقائي للتكامل السلس مع التطبيقات الحالية واستثمارات تكنولوجيا المعلومات .

# 4. ندفة الثلج: 

يتم إنشاء منصة مستودع بيانات قائمة على السحابة تسمى Snowflake باستخدام Microsoft Azure أو Amazon Web Services. أصبحت معالجة بيانات SQL أكثر بساطة من خلال إمكاناتها المستقلة للتخزين والحساب. علاوة على ذلك ، يوفر Snowflake قوة حوسبة ديناميكية قابلة للتطوير مع رسوم قائمة على الاستخدام. مع قيمة تخزين مماثلة لـ Amazon S3 ، فإنه يوفر حسابًا وتخزينًا منفصلين. 

بالإضافة إلى ذلك ، يسمح Snowflake باستنساخ قواعد البيانات والجداول والمخططات بدون مساحة. ومع ذلك ، يمكن إنشاء مؤشرات للبيانات المخزنة.

# 5. مايكرو فوكس فيرتكا: 

بالنسبة لأحمال عمل البيانات الضخمة ، تعد Micro Focus Vertica قاعدة بيانات MPP ذاتية المراقبة توفر قابلية التوسع والمرونة والتحليلات المتقدمة. بالإضافة إلى ذلك ، منهجية موجهة نحو الأعمدة ومستودع تحليلي موحد تسهل عمليات مثل تحسين الشبكة ، والتعرف على العملاء ، والصيانة التنبؤية ، والامتثال الاقتصادي.

# 6. أمازون دينامو دي بي: 

Amazon DynamoDB هي خدمة مستودع بيانات NoSQL مملوكة وتدعم القيمة الأساسية وهياكل بيانات المستندات. إنه جزء من Amazon Web Services ويوفر توفرًا عاليًا وموثوقية وقابلية توسعة تدريجية. 

بالإضافة إلى ذلك ، تم تصميم DynamoDB لحالات استخدام OLTP والاستعلامات التحليلية ويتماشى مع قيم التطبيقات بدون خادم الخاصة بالتوسيع التلقائي ، والدفع لكل ما تستخدمه ، والبساطة ، وعدم وجود خوادم لإدارتها. لاحظ أنه يُستخدم على نطاق واسع للتطبيقات بدون خادم والتي تعمل على AWS.

# 7. PostgreSQL: 

يعد PostgreSQL نظامًا قويًا لإدارة قواعد البيانات مع أكثر من 20 عامًا من تطوير المجتمع. إنه بمثابة مستودع البيانات الرئيسي للتطبيقات الجغرافية المكانية والتحليلات والجوال وتطبيقات الويب. يدعم إصدار أكثر تعقيدًا من SQL ، PostgreSQL ، ميزات مثل المشغلات والاستعلامات الفرعية والمفاتيح الخارجية. 

بالإضافة إلى ذلك ، فهو مناسب أيضًا لتخزين البيانات وتطبيقات التحليل ، وبرامج ذكاء الأعمال ، وأنظمة OLTP و OLAP التي تحتاج إلى عمليات قراءة وكتابة سريعة.

# 8. أمازون S3: 

Amazon S3 هي خدمة تخزين NoSQL توفر الاستقرار وإمكانية الوصول والأداء والأمان وقابلية التوسع غير المحدودة بأسعار منخفضة. بالإضافة إلى ذلك ، فهو يدعم البيانات الضخمة وغير المهيكلة وشبه المهيكلة ، ويسمح بتنظيم المستخدم ، ويوفر إمكانية الاشتراك في أنظمة مماثلة. في حين أنه أبطأ من DynamoDB ، فإنه يضع معيارًا للتخزين السحابي للأعمال.

# 9. تيراتا: 

بالنسبة لتطبيقات تخزين البيانات الضخمة ، يعد Teradata نظامًا شائعًا لإدارة قواعد البيانات العلائقية يستخدم التوازي وبنية MPP لتخفيف الحمل وتحقيق نتائج ثاقبة. بالإضافة إلى ذلك ، فإنه يلبي متطلبات التكامل و ETL من خلال استيعاب البيانات ومعالجتها وإدارتها من خلال واجهة سهلة الاستخدام.

# 10. أمازون RDS: 

أصبح توسيع نطاق قواعد البيانات العلائقية على سحابة AWS ممكنًا بواسطة RDS ، وهي خدمة تخزين بيانات سحابية PaaS. كما يوفر أيضًا أجهزة ميسورة التكلفة لإدارة المهام الصعبة مثل تثبيت البرامج والتخزين والنسخ المتماثل والتعافي من الكوارث. 

بالإضافة إلى ذلك ، يدعم RDS ستة محركات لقواعد البيانات: Amazon Aurora و PostgreSQL و MySQL و MariaDB و Oracle Information و SQL Server ، بالإضافة إلى ثلاث فئات مثيلات.

ما هو تخزين بيانات SQL؟ 

SQL Data Warehouse هو Enterprise Data Warehouse (EDW) يدير استعلامات معقدة عبر بيتابايت من البيانات بسرعة بفضل المعالجة المتوازية الضخمة (MPP). 

علاوة على ذلك ، كعنصر حاسم في حل البيانات الضخمة ، استخدم مستودع بيانات SQL. يتم استخدام التخزين العمودي بواسطة SQL Data Warehouse لتخزين البيانات في جداول علائقية ، مما يقلل من تكاليف تخزين البيانات ويعزز أداء الاستعلام. لاحظ أنه لتوزيع معالجة البيانات عبر عدة عقد ، يستخدم SQL Data Warehouse بنية قابلة للتوسيع.

ما هو مستودع البيانات في ETL؟ 

ETL ، التي تعني الاستخراج والتحويل والتحميل ، هي عملية تستخدم في تخزين البيانات لجمع البيانات من مصادر مختلفة ، وتنسيقها للتحميل في مستودع ، ثم تحميلها هناك. 

ما هي مفاهيم Etl؟ 

يمكن تقسيم عملية ETL إلى المراحل الثلاث التالية:

# 1. اِستِخلاص: 

يعد استخراج البيانات من مصادر مختلفة ، بما في ذلك أنظمة المعاملات وجداول البيانات والملفات الثابتة ، الخطوة الأولى في عملية ETL. تعد قراءة المعلومات من الأنظمة الأصلية ووضعها بعيدًا في منطقة التدريج جزءًا من هذه الخطوة.

# 2. تحول: 

يتم وضع البيانات المستخرجة من خلال هذه العملية في تنسيق يمكن تحميله في مستودع البيانات. قد يستلزم ذلك تحويل أنواع البيانات ، ودمج البيانات من مصادر مختلفة ، وتنظيف البيانات والتحقق منها ، وإنشاء حقول بيانات جديدة.

# 3. حمولة: 

يتم تحميل البيانات في مستودع البيانات بعد أن يتم تحويلها. في هذه الخطوة ، يتم عمل هياكل البيانات المادية وتحميل البيانات في المستودع.

ما هو الفرق بين قاعدة البيانات ومخزن البيانات؟ 

على عكس مستودع البيانات ، الذي يستخدم لتخزين كل من البيانات الحالية والتاريخية لنظام واحد أو أكثر مع مخطط محدد مسبقًا وثابت لغرض التحليل ، تقوم قواعد البيانات بتخزين البيانات المطلوبة لتشغيل تطبيق اليوم. 

قاعدة البيانات هي مجموعة مخططة من البيانات التي تم تنظيمها وعادة ما يتم الاحتفاظ بها إلكترونيًا على جهاز الكمبيوتر. لاحظ أن نظام إدارة قواعد البيانات (DBMS) يشرف عادةً على قاعدة البيانات.

ما هي مفاهيم تخزين البيانات؟

فيما يلي بعض المفاهيم الأساسية المتعلقة بتخزين البيانات:

# 1. مصادر البيانات: 

كثيرًا ما يتم دمج البيانات من قواعد البيانات التشغيلية ومصادر البيانات الخارجية والملفات الثابتة والمصادر الأخرى في مستودعات البيانات. لاحظ أنه يتم استخدام ETL (الاستخراج والتحويل والتحميل) لتحميل هذه البيانات في مستودع البيانات.

# 2. نمذجة البيانات: 

تُعرف عملية إنشاء مخطط يشير إلى البيانات في مستودع البيانات باسم نمذجة البيانات. لذلك ، عمل الأبعاد (مثل الوقت والمنتج والعميل) وجداول الحقائق بمقاييس (مثل المبيعات والإيرادات والأرباح)

# 3. تكامل البيانات: 

تُعرف طريقة دمج البيانات من مصادر متعددة في عرض واحد وموحد باسم تكامل البيانات. بالإضافة إلى ذلك ، يمكن إصلاح التناقضات في البيانات ، ويمكن تنظيف البيانات وتعديلها لتلائم نموذج البيانات.

# 4. مخزن البيانات: 

كثيرًا ما يستخدم نظام إدارة قواعد البيانات الارتباطية (RDBMS) في مستودعات البيانات لتخزين البيانات. للاستعلام الفعال ، يتم فهرسة البيانات وتنظيمها في جداول.

# 5. الدخول الى البيانات: 

يمكن استخدام أدوات ذكاء الأعمال (BI) ، مثل برامج التقارير والتحليلات ، للوصول إلى البيانات في مستودع البيانات. لاحظ أنه يمكن لمستخدمي هذه الأدوات الاستعلام عن البيانات وإنتاج التقارير وعرض الرؤى.

# 6. مراقبة البيانات: 

تشير إدارة البيانات إلى العمليات والسياسات والمعايير التي تضمن الموثوقية والاتساق والالتزام بالبيانات في مستودع البيانات. لاحظ أن التحقق من خصوصية البيانات وأمن البيانات وأمن البيانات كلها مدرجة في هذا.

# 7. مارت البيانات: 

MART البيانات هو جزء من مستودع البيانات الذي تم إنشاؤه لدعم وحدة تنظيمية أو قسم معين. يتم اختيار جزء من البيانات من مستودع البيانات ، ثم يتم تطبيق تحويلات إضافية فريدة لوظيفة الأعمال لإنشاء مجموعات بيانات.

ما هو تخزين البيانات السحابية؟

مستودع البيانات السحابية عبارة عن قاعدة بيانات خدمة مُدارة ومجهزة لتحليلات ومعلومات الأعمال القابلة للتطوير في السحابة العامة.

بالإضافة إلى ذلك ، يسمح تخزين البيانات السحابية بالنمو الديناميكي وتقلص مستودعات البيانات لتلبية متطلبات وميزانيات الأعمال المتغيرة. يقوم بتخزين المعلومات من مصادر متنوعة مثل IoT و CRM وأنظمة التمويل ، مما يوفر بيانات منظمة وموحدة لمختلف حالات استخدام ذكاء الأعمال والتحليلات.

ما هو تخزين بيانات Azure؟

عادةً ما يتم تخزين البيانات من مصادر مختلفة ، مثل معاملات العملاء أو تطبيقات الأعمال ، في قواعد بيانات OTP أو مشاركات الشبكة أو Azure Storage Blobs أو بحيرات البيانات. تُستخدم طبقة مخزن البيانات التحليلية لتلبية استفسارات التحليلات وإعداد التقارير مقابل مستودع البيانات. 

بالإضافة إلى ذلك ، يوفر Azure إمكانات المتجر التحليلية من خلال Synapse أو HDInsight أو Hive أو الاستعلام التفاعلي. التنسيق مطلوب لنقل البيانات أو نسخها من التخزين إلى مستودع البيانات باستخدام Azure Data Factory أو Oozie.

ما هو تخزين البيانات ندفة الثلج؟

تجمع سحابة بيانات Snowflake بين الأداء العالي والتزامن العالي والبساطة والقدرة على تحمل التكاليف إلى درجة غير ممكنة مع مستودعات البيانات الأخرى. تم تصميمه بهيكل جديد حاصل على براءة اختراع للتعامل مع جميع جوانب البيانات والتحليلات.

بالإضافة إلى ذلك ، تدمج Snowflake التخزين والحوسبة والخدمات ، مما يسمح بالتوسع والانكماش المستقلين ، مما يجعلها أكثر استجابة وقابلية للتكيف. علاوة على ذلك ، فإنه يستخدم مستودعًا مركزيًا للبيانات الثابتة ومجموعات حساب MPP ، مع كل عقدة توطين جزءًا من مجموعة البيانات. 

هل يتطلب تخزين البيانات ترميزًا؟

تعد برمجة مستودعات البيانات واختبارها وتصحيحها من مسؤوليات أخصائي برمجة مستودع البيانات ، بالإضافة إلى إجراءات الترميز والتوثيق. درجة البكالوريوس ضرورية. بالإضافة إلى ذلك ، عادةً ما يشرف مدير أو رئيس وحدة أو قسم على متخصص في برمجة مستودع البيانات.

بيانات المستهلك: التعريف ، والأنواع ، وكيف يستخدمونها

عالم البيانات مقابل محلل البيانات: مقارنة كاملة 2023

ما هو علم البيانات: دليل لعلوم البيانات والتحليلات

ما هو APACHE: فهم نظرة عامة متعمقة لخادم الويب Apache

المراجع:

معهد تمويل الشركات 

كورسيرا

Investopedia

اترك تعليق

لن يتم نشر عنوان بريدك الإلكتروني. الحقول المشار إليها إلزامية *

قد يعجبك أيضاً
أهمية برامج مراقبة النظام عن بعد في البنية التحتية لتكنولوجيا المعلومات
تفاصيل أكثر

أهمية برامج مراقبة النظام عن بعد في البنية التحتية لتكنولوجيا المعلومات

جدول المحتويات إخفاء الفوائد المحورية الإشراف الشامل الأمان المعزز الصيانة الوقائية نظرة عامة مالية تعزيز الإنتاجية التشغيلية تحسين الموارد تأمين مستقبل الأعمال دور العمل عن بعد ...