Article image




إنه محرك البحث "داتاست سيرش"، المخصص لمجموعات البيانات، والذي يسمح بالبحث فيما يقرب من 25 مليون مجموعة بيانات مختلفة متاحة للعموم.

2020-01-27 17:21:26

27 يناير 2020

أعلنت شركة جوجل مؤخراً أن محرك البحث “داتاست سيرش” الخاص بها والمخصص لمجموعات البيانات -وهو خدمة تسمح لك بالبحث عما يقرب من 25 مليون مجموعة بيانات مختلفة متاحة للعموم- قد أتم المرحلة التجريبية، وبات جاهزاً للاستخدام العام.

ما حكاية داتاست سيرش؟
هناك الملايين من مجموعات البيانات المتوافرة عبر الإنترنت، والتي تتعلق تقريباً بأي موضوع يثير اهتمامك. فإذا كنت ترغب في شراء جرو على سبيل المثال، فبإمكانك العثور على مجموعات من البيانات التي تضم في تفاصيلها شكاوى عدد من الأشخاص الذين اشتروا جراء من قبلك، أو دراسات عن الإدراك عند جراء الكلاب. وإذا كنت تحب التزلج، فبإمكانك العثور على بيانات حول إيرادات منتجعات التزلج، أو معدلات الإصابة أو حتى أرقام المشاركة.

لذلك قام محرك البحث داتاست سيرش بفهرسة ما يقرب من 25 مليوناً من مجموعات البيانات هذه، مما يتيح لك موقعاً فريداً من نوعه يمكّنك من البحث عن مجموعات البيانات والعثور على الروابط التي توصلك إلى مصادر البيانات. وعلى مدار العام الماضي، قام عدد كبير من المستخدمين بتجربة هذه الأداة، وقدموا ملاحظاتهم، والآن أصبح استخدام داتاست سيرش متاحاً للعموم بشكل رسمي.

ما الجديد في داتاست سيرش؟
استناداً إلى ما تعلمته جوجل من أوائل الجهات التي تبنّت استخدام داتاسيت سيرش، فقد أضافت عدداً من الميزات الجديدة؛ حيث بات بإمكانك الآن فلترة النتائج بناءً على نوع مجموعة البيانات الذي تريده (مثال: جداول، صور، نصوص)، أو ما إذا كانت مجموعة البيانات متاحة بالمجان من قِبل مزود الخدمة.

إذا كانت مجموعة البيانات متعلقة بمنطقة جغرافية ما، فبإمكانك رؤية الخريطة. بالإضافة إلى ذلك، فإن المنتج متوافر الآن على الهواتف الذكية، وقد تم تحسين جودة توصيف مجموعات البيانات بشكل كبير. الشيء الوحيد الذي لم يتغير: هو أن بإمكان أي شخص ينشر البيانات أن يجعل مجموعات البيانات الخاصة به قابلة للاكتشاف عبر داتاست سيرش، من خلال استخدام معيار مفتوح (schema.org) لوصف خصائص مجموعة بياناته على صفحة الويب الخاصة به.

ما مجموعة البيانات التي يمكنك العثور عليها في داتاست سيرش؟
يمكن لداتاست سيرش أيضاً أن يقدم لك لمحة عن البيانات الموجودة على الإنترنت. وفيما يلي بعض النقاط البارزة.

إن أكبر الموضوعات التي تغطيها مجموعات البيانات هي علوم الأرض، وعلم الأحياء، والزراعة. وغالبية الحكومات في العالم، تنشر بياناتها وتقوم بوصفها باستخدام schema.org.

تأتي الولايات المتحدة في صدارة الترتيب من حيث عدد مجموعات البيانات الحكومية المفتوحة والمتاحة، والذي يفوق 2 مليون مجموعة. أما تنسيق البيانات الأكثر شعبية فهو الجداول؛ حيث يمكنك العثور على أكثر من 6 ملايين جدول منها على داتاست سيرش.

ولا يزال عدد مجموعات البيانات التي يمكنك العثور عليها في داتاست سيرش يتزايد باستمرار. إن كان لديك مجموعة بيانات على موقعك الإلكتروني، ووصفتها باستخدام schema.org، وهو معيار مفتوح، فسيتمكن الآخرون من العثور عليها في داتاست سيرش.

وإن كنت تعلم بوجود مجموعة بيانات معينة، ولكنك غير قادر على العثور عليها في داتاست سيرش، فاطلب عندها من مزود الخدمة أن يضيف التوصيفات بحسب schema.org، وسيتمكن الآخرون بعد ذلك من معرفة مجموعة البيانات الخاصة بهم أيضاً.

ما الخطوة التالية؟
أصبح داتاست سيرش متاحاً للاستخدام العام، ولكن جوجل ستواصل تحسين المنتج، سواء كان لديها نسخة تجريبية بجانبه أم لا. فإذا لم يسبق لك أن جربته من قبل، فقم بتجربته الآن، وأخبرنا برأيك!