سؤال للخبير: هل صحيح أن الشبكات الاجتماعية تراقبنا؟
ديمتري كوركين
ردود على MAJORITY الأسئلة الولايات المتحدة اعتدنا على البحث على الانترنت. في سلسلة المواد الجديدة ، نطرح هذه الأسئلة: حرق ، غير متوقع أو واسع الانتشار - للمهنيين في مختلف المجالات.
لم يُطلق برنامج "10 Year Challenge flash" ، الذي تم إطلاقه في الشبكات الاجتماعية في بداية العام ، نظريات المؤامرة القائلة بأن هدف الحملة هو جمع صور للمستخدمين وتدريبهم على التعرف على نظام التعرف على الوجوه ، ولكن أيضًا جعلهم يفكرون مرة أخرى في مقدار ما يعرفونه عنا. الشبكات الاجتماعية والأطراف الثالثة التي تعمل معهم (من الشركات التجارية إلى الوكالات الحكومية).
حقيقة أن عمالقة التكنولوجيا يقومون بجمع وتحليل ما يطلق عليه البصمات الرقمية التي يتركها المليارات من المستخدمين يوميًا لا يمثل سرًا لأحد. والوعي بهذا يثير نوعًا جديدًا من الخوف من "الأخ الأكبر": الشبكات الاجتماعية تعرف الكثير عنا ، لكن ماذا لو كانوا يعرفون الكثير عنا؟ هل يمكن استخدام البيانات الضخمة لمعرفة جميع الروابط ، الأذواق ، عادات الشخص ، ماضيه وحاضره؟ وإذا كان الأمر كذلك ، فما الضرر الذي قد تسببه رغبتنا في التواصل الاجتماعي عبر الإنترنت ، من أجل أن نشارك طواعية المعلومات عن أنفسنا؟
لقد سألنا الخبراء حول كيفية معالجة بيانات المستخدم من قبل الشركات الكبيرة وما مدى خطورة التوريث على الشبكات الاجتماعية.
ليليا زمنخوفا
باحث في مركز أبحاث العلوم والتكنولوجيا في الجامعة الأوروبية في سانت بطرسبرغ
تحتوي البصمة الرقمية على جميع الأنواع الممكنة من البيانات - النصوص والصور وتسجيلات الصوت والفيديو ، وتحديد الموقع الجغرافي ، والكثير من البيانات الوصفية (على سبيل المثال ، طراز الأداة ، ومشغل الهاتف المحمول ، ونظام التشغيل ، وديناميات الزيارات ، وما إلى ذلك). وليس نحن وحدنا الذين نجددون بصمتنا الرقمية. الشبكات الاجتماعية تشكلنا كمستخدمين بمساعدة ثلاثة مصادر للبيانات: حقيقة أننا أنفسنا نبلغ عن أنفسنا ؛ أن الآخرين يبلغون عنا. وما يجري في معظم الأحيان دون علمنا. خاصة مبهمة الماضي. نحن ، كقاعدة عامة ، لا نقرأ اتفاقيات المستخدم وسياساته لجمع واستخدام البيانات الشخصية. نلاحظ فقط أن هذا "الصندوق الأسود" يؤثر بطريقة أو بأخرى على تجربة المستخدم لدينا: الإعلانات المستهدفة ، اقتراحات من الأصدقاء ، توصيات للموسيقى ، إجراء إطلاق الأخبار ... نقوم ببناء جزء صغير من هذه التجربة بأنفسنا ، عندما نقوم ببناء موجز الأخبار يدويًا ، ولكن بشكل أساسي الخوارزميات أداء الوظائف المضمنة في ملفات التعريف الافتراضية. هذا هو السبب في أننا لن نتخلص أبدًا من الإعلانات السياقية أو الاقتراحات المتطفلة للمجموعات أو (وليس) الأصدقاء. تستخدم الشبكات الاجتماعية كشركات بيانات عن مستخدميها للأغراض التجارية ، وتقدم منصة خاصة بهم لبيع المحتوى المستهدف. وعلى طول الطريق ، يواصلون جمع البيانات المتعلقة بنا: على سبيل المثال ، إذا كنت قد دفعت ثمن الإعلان مرة واحدة على الأقل ، فستظل البطاقة المصرفية وبيانات المعاملات في الشركة أيضًا. يمكن أيضًا توفير البيانات للوكالات الحكومية عندما تكون هناك حاجة كبيرة: على سبيل المثال ، يتعاون Facebook بانتظام مع الوكالات الحكومية الأمريكية ، وفقًا لسياسة الشفافية.
بالإضافة إلى السياسة الداخلية للشبكات الاجتماعية ، هناك واحد من التفاصيل المهمة: يمكن ربط الحسابات بمئات الآلاف من التطبيقات والوظائف الأخرى. هذا ، على سبيل المثال ، كان السبب في مناقشات كبيرة العام الماضي حول وصول الجهات الخارجية لبيانات المستخدم. تم إجراء محاولة مهمة لتنظيم حرية المطورين في الاتحاد الأوروبي - دخلت اللوائح العامة لحماية البيانات حيز التنفيذ في العام الماضي. قرر عدم نقل مشاكل البيانات ، لكنه لفت انتباه المستخدمين إلى هذا السؤال. هذا لا يلزمنا بقراءة جميع اتفاقيات المستخدم ، ولكنه يجعلنا نفكر ، على الأقل ، أكثر مسؤولية عن آثارنا الرقمية ونتبع القواعد الأولية للنظافة الرقمية.
فاليريا كارافايفا
عالم البيانات في Spiking
في بعض الأحيان ، لا نفكر في عدد المسارات التي نتركها على الويب ومقدار ما بعد ذلك يساعد الشركات ، وليس فقط الشبكات الاجتماعية - على الرغم من الشبكات الاجتماعية أيضًا. تقوم الشبكات الاجتماعية بجمع البيانات ليس فقط من أجلها ، بل يمكنها أيضًا بيعها - أعرف ذلك ، لأنني عملت في إحدى وكالات الإعلان ، وقمنا بشراء البيانات من Facebook. وفي أغلب الأحيان ، نحن المستخدمون ، نوافق على ذلك دون ملاحظة ذلك. يقضي الأشخاص نصف حياتهم على الشبكات الاجتماعية ويقدمون الكثير من المعلومات عن أنفسهم.
لكن كان من الممكن جمع البيانات من قبل - فلماذا بدأت تتحدث عن البيانات الضخمة مؤخرًا فقط؟ بادئ ذي بدء ، نظرًا لأن طاقة الحوسبة تنمو وبالتالي تصبح أرخص. إن القضية الرئيسية للبيانات الضخمة ليست في كيفية جمع البيانات - من حيث المبدأ ، يمكن لكل واحد منا اليوم جمع وتخزين تيرابايت من المعلومات - ولكن كيفية التعامل معها. معظم البيانات التي تم الحصول عليها من الشبكات الاجتماعية (النص والصوت والصور والفيديو) ليست منظمة بأي شكل من الأشكال ، وبالتالي دون تعلم الآلة البيانات الكبيرة غير مجدية. الآن ، نظرًا لحقيقة أن الطاقة والذاكرة أصبحت أرخص ، ازداد الطلب على الشبكات العصبية والتعلم العميق - لقد تعلمنا أخيرًا معالجة صفائف البيانات الكبيرة.
خذ ، على سبيل المثال ، الصور - وهذه بيانات كبيرة حقًا ، يمكنها تقديم الكثير من المعلومات. هناك الملايين من الصور ، ولكن ماذا تفعل معهم؟ كيف يمكنك الاستفادة منها؟ ما الأنماط التي يخبرك بها؟ التعلم الآلي ، في الواقع ، لم يذهب بعيدا. هذه ليست عملية بسيطة كما يبدو: لا يوجد شيء من هذا القبيل تضغط على زر وتتلقى حسابات كاملة في الأسبوع.
يسبق التعلم الآلي بمهام أكثر تعقيدًا. يجب أولاً معالجة الصور نفسها بشكل صحيح (على سبيل المثال ، الصور التي يتم اقتصاصها وتوسيطها ؛ هذا أمر مهم للتعلم) - هذه هي المرحلة الأولى ، والتي عادة ما تستغرق وقتًا طويلاً. المرحلة الثانية هي اختيار بنية شبكة مناسبة لحل المشكلة. وبصورة تقريبية ، تقوم ببناء عشر شبكات عصبية مختلفة ، وهي تعطي عشر نتائج مختلفة. ثم تحتاج إلى تقييم النتائج بطريقة أو بأخرى. وبعد ذلك ، مع احتمال كبير ، تعود إلى المرحلة الأولى. من المستحيل إنشاء شبكة عالمية واحدة لأي مهمة: إما أن تنشئها من نقطة الصفر أو تعدل شبكة موجودة. التعرف على الوجوه هو مهمة واحدة ، والاعتراف بالقطط مهمة أخرى.
في عملية التعلم الآلي ، نشارك أيضًا ، دون معرفة ذلك. على سبيل المثال ، عن طريق تقديم captcha على المواقع: باستخدام captcha ، درب Google الشبكات العصبية لرقمنة الكتب.
يجب أن نفهم أن الشركات التي تجمع البيانات الكبيرة ليست مهتمة بملفاتنا الشخصية. يحتاجون إلى بيانات حول الكثير من الأشخاص المختلفين المهتمين بشيء معين. بالنسبة للخدمات الخاصة ، أعتقد أنه يمكنهم جمع البيانات دون اللجوء إلى الشبكات الاجتماعية. أعتقد أن مخاوفنا من أننا نراقبها سوف تنتقل قريبًا. هذا هو العالم الجديد: من الممكن عدم وراثة الويب ، ولكنه صعب. من الأسهل عدم الظهور على الويب على الإطلاق.
الصور: antonsov85 - stock.adobe.com