وفّر 50٪ من خلال الاشتراك السنوي في مجرة واحصل على تصفح لا محدود لأفضل محتوى عربي على الإنترنت.
content_cookies111:string(1825) "{"id":19481,"content_cookies":null,"user_header":{"SERVER_SOFTWARE":"Apache\/2.4.52 (Debian)","REQUEST_URI":"\/technodad\/%D8%A7%D9%84%D9%85%D8%B9%D8%A7%D9%84%D8%AC%D8%A9-%D8%A7%D9%84%D9%85%D8%B3%D8%A8%D9%82%D8%A9-%D9%84%D9%84%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA\/","REDIRECT_STATUS":"200","HTTP_X_FORWARDED_PROTO":"https","HTTP_CONNECTION":"upgrade","HTTP_HOST":"technologyreview.ae","HTTP_CF_CONNECTING_IP":"3.236.46.172","HTTP_CF_IPCOUNTRY":"US","HTTP_ACCEPT_ENCODING":"gzip","HTTP_CF_RAY":"80f3b8a5d84307f4-IAD","HTTP_CF_VISITOR":"{\\\"scheme\\\":\\\"https\\\"}","HTTP_USER_AGENT":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)","HTTP_ACCEPT":"text\/html,application\/xhtml+xml,application\/xml;q=0.9,*\/*;q=0.8","HTTP_ACCEPT_LANGUAGE":"en-US,en;q=0.5","HTTP_CDN_LOOP":"cloudflare","PATH":"\/usr\/local\/sbin:\/usr\/local\/bin:\/usr\/sbin:\/usr\/bin:\/sbin:\/bin","SERVER_SIGNATURE":"Apache\/2.4.52 (Debian) Server at technologyreview.ae Port 80<\/address>\n","SERVER_NAME":"technologyreview.ae","SERVER_ADDR":"172.18.0.9","SERVER_PORT":"80","REMOTE_ADDR":"3.236.46.172","DOCUMENT_ROOT":"\/var\/www\/html","REQUEST_SCHEME":"http","CONTEXT_PREFIX":"","CONTEXT_DOCUMENT_ROOT":"\/var\/www\/html","SERVER_ADMIN":"webmaster@localhost","SCRIPT_FILENAME":"\/var\/www\/html\/index.php","REMOTE_PORT":"33948","REDIRECT_URL":"\/technodad\/\u0627\u0644\u0645\u0639\u0627\u0644\u062c\u0629-\u0627\u0644\u0645\u0633\u0628\u0642\u0629-\u0644\u0644\u0628\u064a\u0627\u0646\u0627\u062a\/","GATEWAY_INTERFACE":"CGI\/1.1","SERVER_PROTOCOL":"HTTP\/1.1","REQUEST_METHOD":"GET","QUERY_STRING":"","SCRIPT_NAME":"\/index.php","PHP_SELF":"\/index.php","REQUEST_TIME_FLOAT":1696152986.775286,"REQUEST_TIME":1696152986,"argv":[],"argc":0,"HTTPS":"on"},"user_ip":"3.236.46.172","user_agent":"CCBot\/2.0 (https:\/\/commoncrawl.org\/faq\/)"}"
check_post_to_show:object(stdClass)#29286 (13) { ["is_valid"]=> int(1) ["global_remaining_posts_to_view"]=> int(0) ["remaining_posts_to_view"]=> int(0) ["number_all_post"]=> int(0) ["number_post_read"]=> int(0) ["exceeded_daily_limit"]=> int(0) ["is_watched_before"]=> int(0) ["user_agent"]=> string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)" ["user_ip"]=> string(12) "3.236.46.172" ["user_header"]=> object(stdClass)#29294 (40) { ["SERVER_SOFTWARE"]=> string(22) "Apache/2.4.52 (Debian)" ["REQUEST_URI"]=> string(152) "/technodad/%D8%A7%D9%84%D9%85%D8%B9%D8%A7%D9%84%D8%AC%D8%A9-%D8%A7%D9%84%D9%85%D8%B3%D8%A8%D9%82%D8%A9-%D9%84%D9%84%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA/" ["REDIRECT_STATUS"]=> string(3) "200" ["HTTP_X_FORWARDED_PROTO"]=> string(5) "https" ["HTTP_CONNECTION"]=> string(7) "upgrade" ["HTTP_HOST"]=> string(19) "technologyreview.ae" ["HTTP_CF_CONNECTING_IP"]=> string(12) "3.236.46.172" ["HTTP_CF_IPCOUNTRY"]=> string(2) "US" ["HTTP_ACCEPT_ENCODING"]=> string(4) "gzip" ["HTTP_CF_RAY"]=> string(20) "80f3b8a5d84307f4-IAD" ["HTTP_CF_VISITOR"]=> string(22) "{\"scheme\":\"https\"}" ["HTTP_USER_AGENT"]=> string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)" ["HTTP_ACCEPT"]=> string(63) "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8" ["HTTP_ACCEPT_LANGUAGE"]=> string(14) "en-US,en;q=0.5" ["HTTP_CDN_LOOP"]=> string(10) "cloudflare" ["PATH"]=> string(60) "/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" ["SERVER_SIGNATURE"]=> string(79) "Apache/2.4.52 (Debian) Server at technologyreview.ae Port 80" ["SERVER_NAME"]=> string(19) "technologyreview.ae" ["SERVER_ADDR"]=> string(10) "172.18.0.9" ["SERVER_PORT"]=> string(2) "80" ["REMOTE_ADDR"]=> string(12) "3.236.46.172" ["DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["REQUEST_SCHEME"]=> string(4) "http" ["CONTEXT_PREFIX"]=> NULL ["CONTEXT_DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["SERVER_ADMIN"]=> string(19) "webmaster@localhost" ["SCRIPT_FILENAME"]=> string(23) "/var/www/html/index.php" ["REMOTE_PORT"]=> string(5) "33948" ["REDIRECT_URL"]=> string(60) "/technodad/المعالجة-المسبقة-للبيانات/" ["GATEWAY_INTERFACE"]=> string(7) "CGI/1.1" ["SERVER_PROTOCOL"]=> string(8) "HTTP/1.1" ["REQUEST_METHOD"]=> string(3) "GET" ["QUERY_STRING"]=> NULL ["SCRIPT_NAME"]=> string(10) "/index.php" ["PHP_SELF"]=> string(10) "/index.php" ["REQUEST_TIME_FLOAT"]=> float(1696152986.7753) ["REQUEST_TIME"]=> int(1696152986) ["argv"]=> array(0) { } ["argc"]=> int(0) ["HTTPS"]=> string(2) "on" } ["content_user_category"]=> string(4) "paid" ["content_cookies"]=> object(stdClass)#29292 (3) { ["status"]=> int(0) ["sso"]=> object(stdClass)#29295 (2) { ["content_id"]=> int(20686) ["client_id"]=> string(36) "1d1883f4-87d0-4156-8903-e6ceb0cb4224" } ["count_read"]=> NULL } ["is_agent_bot"]=> int(1) }
check_post_to_show:object(stdClass)#29286 (13) { ["is_valid"]=> int(1) ["global_remaining_posts_to_view"]=> int(0) ["remaining_posts_to_view"]=> int(0) ["number_all_post"]=> int(0) ["number_post_read"]=> int(0) ["exceeded_daily_limit"]=> int(0) ["is_watched_before"]=> int(0) ["user_agent"]=> string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)" ["user_ip"]=> string(12) "3.236.46.172" ["user_header"]=> object(stdClass)#29294 (40) { ["SERVER_SOFTWARE"]=> string(22) "Apache/2.4.52 (Debian)" ["REQUEST_URI"]=> string(152) "/technodad/%D8%A7%D9%84%D9%85%D8%B9%D8%A7%D9%84%D8%AC%D8%A9-%D8%A7%D9%84%D9%85%D8%B3%D8%A8%D9%82%D8%A9-%D9%84%D9%84%D8%A8%D9%8A%D8%A7%D9%86%D8%A7%D8%AA/" ["REDIRECT_STATUS"]=> string(3) "200" ["HTTP_X_FORWARDED_PROTO"]=> string(5) "https" ["HTTP_CONNECTION"]=> string(7) "upgrade" ["HTTP_HOST"]=> string(19) "technologyreview.ae" ["HTTP_CF_CONNECTING_IP"]=> string(12) "3.236.46.172" ["HTTP_CF_IPCOUNTRY"]=> string(2) "US" ["HTTP_ACCEPT_ENCODING"]=> string(4) "gzip" ["HTTP_CF_RAY"]=> string(20) "80f3b8a5d84307f4-IAD" ["HTTP_CF_VISITOR"]=> string(22) "{\"scheme\":\"https\"}" ["HTTP_USER_AGENT"]=> string(40) "CCBot/2.0 (https://commoncrawl.org/faq/)" ["HTTP_ACCEPT"]=> string(63) "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8" ["HTTP_ACCEPT_LANGUAGE"]=> string(14) "en-US,en;q=0.5" ["HTTP_CDN_LOOP"]=> string(10) "cloudflare" ["PATH"]=> string(60) "/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin" ["SERVER_SIGNATURE"]=> string(79) "Apache/2.4.52 (Debian) Server at technologyreview.ae Port 80" ["SERVER_NAME"]=> string(19) "technologyreview.ae" ["SERVER_ADDR"]=> string(10) "172.18.0.9" ["SERVER_PORT"]=> string(2) "80" ["REMOTE_ADDR"]=> string(12) "3.236.46.172" ["DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["REQUEST_SCHEME"]=> string(4) "http" ["CONTEXT_PREFIX"]=> NULL ["CONTEXT_DOCUMENT_ROOT"]=> string(13) "/var/www/html" ["SERVER_ADMIN"]=> string(19) "webmaster@localhost" ["SCRIPT_FILENAME"]=> string(23) "/var/www/html/index.php" ["REMOTE_PORT"]=> string(5) "33948" ["REDIRECT_URL"]=> string(60) "/technodad/المعالجة-المسبقة-للبيانات/" ["GATEWAY_INTERFACE"]=> string(7) "CGI/1.1" ["SERVER_PROTOCOL"]=> string(8) "HTTP/1.1" ["REQUEST_METHOD"]=> string(3) "GET" ["QUERY_STRING"]=> NULL ["SCRIPT_NAME"]=> string(10) "/index.php" ["PHP_SELF"]=> string(10) "/index.php" ["REQUEST_TIME_FLOAT"]=> float(1696152986.7753) ["REQUEST_TIME"]=> int(1696152986) ["argv"]=> array(0) { } ["argc"]=> int(0) ["HTTPS"]=> string(2) "on" } ["content_user_category"]=> string(4) "paid" ["content_cookies"]=> object(stdClass)#29292 (3) { ["status"]=> int(0) ["sso"]=> object(stdClass)#29295 (2) { ["content_id"]=> int(20686) ["client_id"]=> string(36) "1d1883f4-87d0-4156-8903-e6ceb0cb4224" } ["count_read"]=> NULL } ["is_agent_bot"]=> int(1) }
مصطلح يصف أي نوع من أنواع المعالجة الأولية التي تتم على البيانات الخام لتحضيرها لإجراء عمليات معالجة متقدمة أخرى. سابقاً كانت تقنيات المعالجة المسبقة للبيانات تُستخدم كخطوة تحضيرية في تنقيب البيانات فقط. وقد تطورت هذه التقنيات اليوم لتشمل استخداماتها تحضير البيانات لتدريب نماذج التعلم الآلي والذكاء الاصطناعي وتحليلات البيانات المختلفة. وبات من الممكن استخدامها مع مجموعة متنوعة من مصادر البيانات؛ بما في ذلك البيانات المخزنة في الملفات أو قواعد البيانات أو غيرها.
تهدف تقنيات المعالجة المسبقة للبيانات إلى تحويل بيانات العالم الحقيقي إلى صيغة مفهومة تُسهّل وتزيد كفاءة عمليات المعالجة المطلوبة. وتختلف هذه التقنيات باختلاف التطبيق المرغوب، فعلى سبيل المثال في حال استخدام البيانات لتدريب شبكة عصبونية اصطناعية، هناك عدد من الأدوات والطرق المختلفة التي تستخدم لمعالجتها بشكل مسبق. وأهم تلك الطرق أخذ العينات والتحويل وإزالة الضجيج والتطبيع واستخلاص الميزات وغيرها.
غالباً ما تحتوي بيانات العالم الحقيقي على الكثير من الضجيج والأخطاء والقيم المفقودة. وقد تكون هذه البيانات بصيغة غير قابلة للاستخدام المباشر في التطبيقات المختلفة مثل التنقيب أو التعلم الآلي. لذلك تعتبر المعالجة المسبقة للبيانات خطوة أساسية لا بد منها لتنظيف تلك البيانات وتحويلها إلى صيغة مناسبة للاستخدام بالشكل المطلوب. وبشكل عام في سياق الذكاء الاصطناعي تهدف المعالجة المسبقة إلى رفع جودة مجموعات البيانات لتحسين دقة وكفاءة النماذج والأنظمة المختلفة.
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.