يمكن أن يؤدي اختيار بنية البيانات الصحيحة إلى جعل برنامجك أكثر كفاءة. فيما يلي دليل لمساعدتك في اتخاذ القرار الصحيح.

قد يكون اختيار أفضل بنية بيانات لأهدافك أمرًا صعبًا في ظل وجود العديد من الخيارات المتاحة. عند اختيار بنية البيانات ، ضع في اعتبارك البيانات التي ستتعامل معها ، والعمليات التي سيتم إجراؤها على البيانات ، والبيئة التي سينفذ فيها تطبيقك.

افهم بياناتك

يعد فهم البيانات التي ستتعامل معها قبل اختيار بنية البيانات أمرًا حيويًا. هياكل البيانات المشتركة التي تعمل مع أنواع بيانات مختلفة تشمل المصفوفات والقوائم المرتبطة والأشجار والرسوم البيانية وجداول التجزئة.

على سبيل المثال ، عندما تحتاج إلى الوصول إلى العناصر بشكل عشوائي من بياناتك ، فقد تكون المصفوفات هي الخيار الأفضل. في حالة احتياجك باستمرار إلى إضافة عناصر من قائمة أو حذفها ، وقد يتغير حجم القائمة أيضًا ، فيمكن أن تكون القوائم المرتبطة مفيدة بشكل خاص.

عندما تحتاج إلى تخزين مستويات متعددة من البيانات بشكل فعال ، مثل هياكل السجلات ، وتنفيذ عمليات مثل البحث والفرز ، فإن الأشجار تكون مفيدة.

عندما تحتاج إلى وصف التفاعلات بين الكيانات ، مثل تلك الموجودة في الشبكات الاجتماعية ، وتنفيذ عمليات مثل أقصر مسار واتصال ، فإن الرسوم البيانية هي المفضلة. تعد جداول التجزئة مفيدة لعمليات البحث عن المفاتيح السريعة.

instagram viewer

ضع في اعتبارك العمليات التي سيتم إجراؤها على البيانات

أثناء اختيار بنية البيانات ، يجب أيضًا مراعاة العمليات التي سيتم إجراؤها على البيانات. تعمل هياكل البيانات المختلفة على تحسين العديد من الإجراءات ، مثل الفرز والبحث والإدراج والحذف.

على سبيل المثال ، تعتبر القوائم المرتبطة أفضل لإجراءات مثل الإدراج والحذف ، لكن الأشجار الثنائية هي الأفضل للبحث والفرز. يمكن أن يكون جدول التجزئة هو الخيار الأفضل إذا كان التطبيق الخاص بك يتطلب إدراجًا وبحثًا في وقت واحد.

تقييم البيئة

عند التفكير في بنية البيانات ، يجب عليك تقييم البيئة التي سيتم تشغيل التطبيق فيها. تؤثر البيئة على مدى جودة هياكل البيانات التي يمكن الوصول إليها ومدى سرعة الوصول إليها.

ضع في اعتبارك العوامل التالية عند تقييم حالتك الحالية:

  1. قوة المعالجة: اختر هياكل البيانات لتطبيقاتك التي تعمل بشكل جيد على أجهزة الكمبيوتر ذات قوة معالجة قليلة أثناء التشغيل على النظام الأساسي. على سبيل المثال ، قد تكون هياكل البيانات الأبسط مثل المصفوفات أكثر ملاءمة من الأشجار أو الرسوم البيانية.
  2. التزامن: يجب عليك اختيار هيكل بيانات آمن لمؤشر الترابط يمكنه التعامل مع الوصول المتزامن دون تلف البيانات ؛ إذا كان التطبيق الخاص بك يعمل في بيئة متزامنة ، حيث تصل سلاسل أو عمليات متعددة إلى بنية البيانات في وقت واحد. في هذه الحالة ، هياكل البيانات الخالية من القفل مثل ConcurrentLinkedQueue و ConcurrentHashMap قد تكون أكثر ملاءمة من تلك التقليدية مثل ArrayList و HashMap.
  3. شبكة الكمون: إذا كان تطبيقك يتطلب نقل البيانات عبر شبكة ، فيجب مراعاة زمن انتقال الشبكة أثناء اتخاذ قرار بشأن أفضل بنية بيانات. في مثل هذه الحالات ، قد يساعد استخدام بنية البيانات التي تقيد مكالمات الشبكة أو تقلل من كمية نقل البيانات في تحسين التنفيذ.

هياكل البيانات المشتركة وحالات استخدامها

فيما يلي ملخص للعديد من هياكل البيانات الشائعة واستخدامها.

  1. المصفوفات: هذه بنية بيانات بسيطة وفعالة قد تحتوي على سلسلة ذات حجم ثابت من العناصر من نفس نوع البيانات. لكي يعملوا بشكل صحيح ، يحتاجون إلى وصول سريع ومباشر إلى كائنات محددة عبر فهرس.
  2. القوائم المرتبطة: القوائم المرتبطة تتكون من العقد ، والتي تحتوي على عنصر ومرجع إلى العقدة التالية و / أو العقدة السابقة. بسبب عملياتها الفعالة ، فإن القوائم المرتبطة هي الأنسب في المواقف التي تتطلب إدراج عنصر أو حذفه بشكل متكرر. ومع ذلك ، فإن الوصول إلى العناصر الفردية عن طريق الفهرس في القوائم المرتبطة يكون أبطأ مقارنة بالمصفوفات.
  3. قوائم الانتظار والأكوام: تلتزم الحزم بقاعدة Last-In-First-Out (LIFO) ، حيث يكون العنصر الأخير الذي تم إدراجه هو العنصر الأول الذي تمت إزالته. تخضع قوائم الانتظار لمبدأ الوارد أولاً يصرف أولاً (FIFO) حيث يكون العنصر الأول المضاف هو العنصر الأول الذي تم حذفه أيضًا.
  4. جداول تجزئة: جداول التجزئة هي شكل من أشكال بنية البيانات التي تحتوي على أزواج المفتاح والقيمة. أفضل حل هو استخدام جداول التجزئة عندما يكون عدد المكونات غير متوقع ، وتحتاج إلى وصول سريع إلى القيم عن طريق المفتاح.
  5. الأشجار: الأشجار هي هياكل بيانات هرمية قد تخزن مجموعة من العناصر في تسلسل هرمي. أفضل استخدامات لـ أشجار البحث الثنائية هي في هياكل بيانات هرمية حيث قد تمثل العلاقات بين عناصر البيانات بنية تشبه الشجرة.

اختيار بنية البيانات الصحيحة

قبل اختيار بنية البيانات ، ضع في اعتبارك بيانات التطبيق والالتزامات والبيئة. أثناء اختيارك ، فكر في العناصر التالية:

  1. تعقيد الوقت: قد يتأثر أداء تطبيقك بشكل كبير بالتعقيد الزمني لهيكل بياناتك. إذا كان التطبيق الخاص بك يتطلب عمليات بحث أو استرجاع متكررة ، فاستخدم بنية بيانات ذات تعقيد زمني أقل ، مثل جدول التجزئة.
  2. تعقيد الفضاء: يعتبر التعقيد المكاني لهيكل البيانات من الاعتبارات المهمة الأخرى. إذا كان التطبيق الخاص بك يستهلك الكثير من الذاكرة ، فاختر بنية بيانات ذات مساحة أقل ، مثل المصفوفة. إذا لم تكن المساحة مصدر قلق ، فيمكنك استخدام بنية بيانات ذات تعقيد أكبر للمساحة ، مثل الشجرة.
  3. قراءة مقابل. كتابة العمليات: إذا كان تطبيقك يستخدم الكثير من عمليات الكتابة ، فاختر بنية بيانات ذات أداء إدراج أسرع ، مثل جدول التجزئة. إذا كان التطبيق الخاص بك يستدعي العديد من عمليات القراءة ، فاختر بنية بيانات ذات سرعة بحث أسرع ، مثل شجرة البحث الثنائية.
  4. نوع البيانات: البيانات التي تتعامل معها قد تؤثر أيضًا على هيكل البيانات الذي اخترته. على سبيل المثال ، يمكنك استخدام هيكل بيانات قائم على الشجرة إذا كانت بياناتك هرمية. إذا كانت لديك بيانات بسيطة تحتاج إلى الوصول إليها بشكل عشوائي ، فإن اختيار بنية بيانات قائمة على المصفوفة يمكن أن يكون خيارك الأفضل.
  5. المكتبات المتاحة: ضع في اعتبارك المكتبات التي يمكن الوصول إليها بسهولة من أجل بنية البيانات التي تفكر فيها. قد يكون من الأسهل التنفيذ والصيانة إذا كانت لغة البرمجة الخاصة بك تحتوي على مكتبات مضمنة متاحة لهيكل بيانات معين.

يوضح مثال Python التالي كيفية تحديد أفضل بنية بيانات لحالة استخدام معينة.

ضع في اعتبارك الحالة التي تقوم فيها بتطوير تطبيق نظام ملفات يجب أن يقوم بتخزين واسترداد الملفات في تسلسل هرمي. يجب عليك اختيار بنية بيانات يمكنها تمثيل هذا الهيكل الهرمي بكفاءة وتنفيذ العمليات بسرعة مثل البحث والإدراج والحذف.

قد يكون من الجيد استخدام هيكل بيانات قائم على الشجرة مثل البحث الثنائي أو شجرة B. إذا كان عدد الإدخالات في كل دليل صغيرًا نسبيًا ولم تكن الشجرة عميقة جدًا ، فستعمل شجرة البحث الثنائية بشكل جيد. ستكون شجرة B أكثر ملاءمة لأعداد أكبر من الملفات وهياكل الدليل الأعمق.

يوجد أدناه مثال لشجرة بحث ثنائية في بايثون.

فصلالعقدة:
def__فيه__(الذات ، القيمة):

self.value = القيمة
self.left_child = لا أحد
النفس. right_child = لا أحد

فصلBinarySearchTree:

def__فيه__(الذات):
جذر النفس = لا أحد
defإدراج(الذات ، القيمة):

لو الجذور الذاتية يكونلا أحد:
self.root = العقدة (القيمة)

آخر:
self._insert (قيمة ، self.root)
def_إدراج(self، value، current_node):

لو القيمة لو current_node.left_child يكونلا أحد:
current_node.left_child = عقدة (قيمة)

آخر:
self._insert (القيمة ، current_node.left_child)
أليف القيمة> current_node.value:
لو Current_node.right_child يكونلا أحد:
current_node.right_child = عقدة (قيمة)
آخر:
self._insert (القيمة ، current_node.right_child)

آخر:
مطبعة("القيمة موجودة بالفعل في الشجرة.")
defيبحث(الذات ، القيمة):
لو الجذور الذاتية يكونلالا أحد:
يعود self._search (القيمة ، self.root)

آخر:
يعودخطأ شنيع
def_يبحث(self، value، current_node):

لو القيمة == current_node.value:
يعودحقيقي

أليف قيمة و current_node.left_child يكونلالا أحد:
يعود self._search (القيمة ، current_node.left_child)

أليف value> current_node.value و Current_node.right_child يكونلالا أحد:
يعود self._search (القيمة ، current_node.right_child)

آخر:
يعودخطأ شنيع

في هذا التنفيذ ، تقوم ببناء فئتين: أ BinarySearchTree فئة تدير عمليات الإدراج والبحث و أ العقدة فئة ترمز إلى عقدة في شجرة البحث الثنائية.

بينما تقوم طريقة insert بإدراج عقدة جديدة في الموقع المناسب في الشجرة بناءً على قيمتها ، تبحث طريقة البحث عن عقدة ذات قيمة محددة. التعقيد الزمني لكلتا العمليتين في شجرة متوازنة هو O (تسجيل ن).

حدد هيكل البيانات الأمثل

يمكن تحسين سرعة تطبيقك وقدرته على التكيف بشكل كبير من خلال بنية البيانات التي اخترتها. يمكن أن يساعدك أخذ بياناتك وعملياتك وبيئتك في الاعتبار في اختيار أفضل بنية بيانات.

تعتبر الاعتبارات مثل تعقيد الوقت ، وتعقيد المساحة ، وعمليات القراءة مقابل الكتابة ، والتزامن ، ونوع البيانات ، وإمكانية الوصول إلى المكتبة مهمة.

من خلال تقييم وزن كل مكون ، يجب عليك اختيار هيكل البيانات الذي يلبي احتياجات التطبيق الخاص بك.