تحلیل جامع داده‌های یک کمپین توییتری/ چگونه مزدوران و ربات‌های حامی پهلوی و منافقین برای هشتگ سفارشی نشست ورشو همکاری می‌کنند؟

کد خبر: 922597

در آستانه نشست ورشو، هشتگ #WeSupportPolandSummit در توییتر ترند شد که تعجب بسیاری از کاربران را برانگیخت. شیوه انتشار محتوا و سبک محتوا نشان از یک عملیات هماهنگ و استفاده از ربات برای ترند کردن این هشتگ داشت.

تحلیل جامع داده‌های یک کمپین توییتری/ چگونه مزدوران و ربات‌های حامی پهلوی و منافقین برای هشتگ سفارشی نشست ورشو همکاری می‌کنند؟

سرویس سیاسی فردا: در آستانه نشست ورشو، هشتگ #WeSupportPolandSummit در توییتر ترند شد که تعجب بسیاری از کاربران را برانگیخت. شیوه انتشار محتوا و سبک محتوا نشان از یک عملیات هماهنگ و استفاده از ربات برای ترند کردن این هشتگ داشت.

یک مرکز دانشگاهی تحلیلی از کاربران، سرشاخه‌ها، جریانات و گروهک‌های موثر در این باره انجام داده است و نشان داده است برخی گروه‌های تجزیه‌طلب و تروریستی ظرفیت‌های خود را برای این هشتگ به میدان آورده‌اند

۱ـ چکیده

در آستانه نشست لهستان، که به گفته مایک پمپئو، وزیر امور خارجه آمریکا، قرار بود به اجلاسی ضدایرانی تبدیل شود، یک کمپین توئیتری با هشتگ #WeSupportPolandSummit از تاریخ ۲۷ دی (۱۷ ژانویه) در جهت حمایت از این نشست به راه افتاد. این گزارش به تحلیل تمام توییت‌هایی که حاوی هشتگ فوق بوده و در بازه زمانی ده روز بعد از انتشار اولین توییت منتشر شده‌اند می‌پردازد. خلاصه یافته‌های این تحقیق به شرح ذیل است:

  • در مجموع تعداد ۱۱۳٬۸۸۴ توئیت توسط ۶٬۶۲۲ کاربر منحصربه‌فرد منتشر شده است، که تعداد ۹۶٬۹۹۱ توئیت از آن‌ها (۸۵ درصد از کل) بازنشر توئیت‌های دیگر (ریتوئیت) بوده‌اند.
  • افراد فعال در این کمپین توییتری را به پنج گروه کلی می‌توان تقسیم کرد:
    1. براندازان و حامیان رضا پهلوی (۵۸ درصد)
    2. منافقین (۲۴ درصد)
    3. کاربران خارجی و ایرانی حامی اسرائیل (۸ درصد)
    4. کاربران خارجی و ایرانی حامی ایران (۷ درصد)
    5. حامیان جنبش «ایرانارشسیم» (۱.۵ درصد)
  • شواهدی مبنی بر فعالیت گروهی و هماهنگ کاربران عربستانی وجود ندارد و فقط تعداد محدودی کاربر به رهبری «محمد مجید الأحوازی» در این کمپین توئیتری فعال بوده‌اند.
  • بر اساس محاسبات پیچیده مبتنی بر حدود ۱٬۲۰۰ شاخص کمّی، ۲۴ درصد از مجموع کاربران فعال در این رخداد توئیتری به احتمال زیاد روبات (بات) هستند، که ۳۲ درصد از مجموع توئیت‌ها توسط آن‌ها منتشر شده است.

۲ـ روش تحقیق

۲ـ۱ـ داده‌ها

با استفاده از رابط کاربری توئیتر (Twitter API) تمام توئیت‌هایی که حاوی هشتگ #WeSupportPolandSummit بودند در بازه زمانی ده روز بعد از انتشار اولین توئیت جمع‌آوری شدند. آمار مربوط به این توئیت‌ها در جدول ۱ نشان داده شده‌اند. در مجموع تعداد ۱۱۳٬۸۸۴ توئیت توسط ۶٬۶۲۲ کاربر منحصربه‌فرد منتشر شده است که تعداد ۹۶٬۹۹۱ از آن‌ها بازنشر توئیت‌های دیگران (ریتوئیت) بوده‌اند.

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

جدول ۱: آمار مربوط به توئیت‌های منتشر شده با موضوع نشست لهستان در بازه زمانی ده روز بعد از انتشار اولین توئیت

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۲ـ۲ـ ایجاد شبکه ریتوئیت و شناسایی گروه‌های مختلف

در حال حاضر موثرترین روش برای شناسایی گروه‌های مختلفی که در تولید و انتشار خبر در یک واقعه خاص فعال بوده‌اند ایجاد و تحلیل شبکه گردش اطلاعات است. به عنوان مثال، در مورد شبکه اجتماعی توئیتر باید شبکه ریتوئیت بین کاربران را ایجاد کرد و با استفاده از روش‌های «شناسایی گروه‌ها[1]» به کشف گروه‌های مختلف کاربران پرداخت. این روش‌ها بر اساس شباهت‌های ساختاری بین کاربران آن‌ها را در گروه‌های مختلف دسته‌بندی می‌کنند. سپس بر اساس روش‌های تحلیل متن و کاربرانی که در هر کدام از دسته‌ها قرار گرفته‌اند و نظرات کارشناسی خبرگان می توان گروه‌ها را نام‌گذاری کرد.

۳ـ نتایج

۳ـ۱ـ شناسایی اولین کاربران

اولین کاربرانی که اقدام که به نشر توئیت با هشتگ #WeSupportPolandSummit کردند کاربرانی از گروه‌های منافقین و براندازان حامی پهلوی بودند. نام کاربری، گروهی که کاربر متعلق به آن است، زمان انتشار، و متن توئیت ۱۰ کاربر اول در جدول ۱پ (پیوست همین گزارش) نشان داده است.

۳ـ۲ـ شناسایی گروه‌های مختلف کاربران

شکل ۱ شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروه‌های مختلف شناسایی‌شده را نشان می‌دهد. در این شبکه، هر یک از گره‌ها نمایان‌گر یک حساب کاربری است که حداقل یک توئیت با هشتگ #WeSupportPolandSummit را در بازه زمانی ده روز بعد از انتشار اولین توئیت منشتر کرده است. هر رنگ نشان‌دهنده یک گروه از کاربران است که توسط یکی از الگوریتم‌های «شناسایی گروه‌ها» کشف شده است. برای اطلاع از محتوا و نام‌گذاری هر یک از گروه‌ها باید از روش‌های تحلیل متن استفاده کرد و هشتگ‌ها، کلمات، و عبارات پرکاربرد هر یک از گروه‌ها را استخراج کرد و با توجه به کاربران تاثیرگذار موجود در هر گروه و نظر خبره در مورد ماهیت هر یک از گروه‌ها تصمیم‌گیری کرد.

جدول ۲ تعداد کاربران موجود در هر گروه، کاربران تاثیرگذار، هشتگ‌های پرکاربرد، و نام پیشنهادی هر گروه را نشان می‌دهد. ملاحظه می‌شود که ۵۸٪ از کاربران از براندازان حامی پهلوی و ۲۴٪ از منافقین بوده‌اند. حدود ۸٪ از کاربران ایرانی و خارجی مخالف ایران هستند که عمدتا با بازی‌گردانی حساب توئیتر وزارت خارجه اسرائیل فعالیت می‌کردند. تعداد کمی از کاربران این گروه نیز به رهبری «محمد مجید الأحوازی» فعالیت می‌کردند (شکل ۱پ). اما در مجموع، در مقایسه با کمپین توئیتری فرشید هکی، نشانه‌ای از اقدام گروهی و هماهنگ از طرف عربستان دیده نمی‌شود. در حدود ۷٪ از کاربران نیز به رهبری «جف گلبرگ» و یک سایت خبری لهستانی (شکل ۲پ) از حامیان ایران بودند. همچنین ۱٪ از کاربران نیز از حامیان گروه «ایرانارشیسم» به رهبری «علی عبدالرضایی» هستند.

شکل ۱: شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروه‌های مختلف آن‌ها. هر رنگ نشان‌دهنده یک گروه از کاربران است. اندازه گره و فونت نشان‌دهنده میزان ریتوئیت شدن است.

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

جدول ۲: آمار کاربران موجود در هر یک از گروه‌های شناسایی شده

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۳ـ۳ـ شناسایی کاربران تاثیرگذار

در یک دسته‌بندی کلی، دو دسته از کاربران را می‌توان به عنوان کاربران تاثیرگذار شناسایی کرد[2]:

۱) کاربرانی که مطالب آن‌ها بیشترین بازنشر را داشته است؛

۲) کاربرانی که نقش پل ارتباطی بین گروه‌های مختلف را دارند (واسطه یا بروکر).

۳ـ۳ـ۱ـ کاربران با نرخ بالای ریتوئیت شدن

جدول ۳ ده کاربر دارای بیشترین نرخ ریتوئیت‌شدن را نشان می‌دهد. در جدول ۳، کاملا مشخص است که اکثر کاربران فاقد نام واقعی هستند و تقریبا هیچ یک از کاربران از افراد یا گروه‌های شناخته‌شده سیاسی داخل یا خارج از کشور نیستند. این امر می تواند به عنوان یکی از نشانه‌هایی که احتمال عملیات نفوذ مجازی خارجی بودن این رخداد توئیتری را افزایش می دهد قلمداد شود. در شبکه ریتوئیت نمایش داده شده در شکل ۱، اندازه گره‌ها و فونت آن‌ها متناسب با میزان ریتوئیت شدن کاربران تنظیم شده است تا کاربران تاثیرگذار به راحتی قابل شناسایی باشند.

جدول ۳: کاربران با نرخ بالای ریتوئیت شدن

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۳ـ۳ـ۲ـ کاربران تاثیرگذار به لحاظ پل ارتباطی بودن

نوع دیگری از کاربران اثرگذار آن دسته از کاربرانی هستند که نقش پل ارتباطی بین گروه‌های مختلف را دارند. به عبارت دیگر، اگر این کاربران نبودند، شدت اتصال آن گروه‌ها به بکدیگر کمتر می‌شد و مطالب منتشر شده در هر یک از گروه‌ها به تعداد کمتری از کاربران سایر گروه‌ها منتقل می‌شد. اهمیت این کاربران از آن جهت است که حذف آن‌ها باعث کاهش عملکرد شبکه جریان اطلاعات می‌شود. در ادبیات علوم شبکه و علوم اجتماعی محاسباتی، از شاخص مرکزیت «میانیت» [3] برای شناسایی این دسته از کاربران استفاده می‌شود. در شکل ۲ کاربرانی که به لحاظ شاخص میانیت از اهمیت بالاتری برخوردارند با اندازه بزرگتری نشان داده شده‌اند. جدول ۴ کاربرانی که دارای بالاترین میزان شاخص مرکزیت میانیت هستند را نشان می‌دهد.

شکل ۲: شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروه‌های مختلف آن‌ها. هر رنگ نشان‌دهنده یک گروه از کاربران است. اندازه گره و فونت نشان‌دهنده شاخص مرکزیت میانیت است.

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

جدول ۳: کاربران با نرخ بالای شاخص مرکزیت میانیت

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۳ـ۴ـ نمودار فعالیت گروه های مختلف

شکل ۳ نمودار تعداد توئیت‌های منتشر شده درباره نشست لهستان به تفکیک گروه‌های مختلف کاربران را نشان می‌دهد. همان‌طور که در شکل ۳ مشاهده می‌شود، فعالیت تمام گروه‌ها به صورت تقریبا هم‌زمان از روز ۱۷ ژانویه شروع و در روز ۲۲ ژانویه پایان یافته است. نکته قابل توجه در شکل ۳ آخرین ساعات روز ۲۰ ژانویه است که تعداد توئیت‌های منتشر شده توسط حامیان پهلوی ناگهان افزایش چشم‌گیری داشته است، که به احتمال زیاد نشان‌دهنده استفاده از بات (روبات) به منظور انجام یک عملیات گروهی و هماهنگ است.

شکل 3 : نمودار تعداد توئیت‌های منتشر شده به تفکیک گروه‌های مختلف برآورد شده از کاربران

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۴ـ بررسی وجود روبات (بات) بین کاربران

روبات‌ها آن دسته از کاربران فضای مجازی هستند که به صورت برنامه‌ریزی شده و خودمختار عمل می‌کنند. روبات‌ها می‌توانند بر اساس دستورالعملی که از قبل توسط یک برنامه رایانه‌ای به آن‌ها داده شده است به لایک کردن، ریتوئیت کردن، پاسخ دادن، و ارسال پیام خصوصی بپردازند. در صورتی که از روبات‌ها برای انجام عملیات نفوذ مجازی استفاده شود، از شبکه‌ای از تعداد زیادی از آن‌ها جهت انتشار اخبار، بازنشر اخباری که توسط دیگران منتشر شده است، یا کامنت‌گذاری استفاده می‌شود.

تشخیص بات بودن یک حساب کاربری توئیتر در اغلب موارد کار ساده‌ای نیست و نیازمند استفاده از مدل‌های بسیار پیچیده است. متاسفانه بعضا دیده می‌شود که افرادی صرفا با تکیه بر مواردی چون نام‌کاربری غیرواقعی، تعداد فالوئر کم و تعداد توئیت‌های زیاد، یا نرخ بالای توئیت کردن اقدام به اظهارنظر در مورد بات بودن یا نبودن یک حساب کاربری می‌کنند. این گونه اظهارنظرها نه تنها واکنش متقابل طرف مقابل را در پی خواهد داشت، بلکه منجر به کاهش اعتبار سایر یافته‌ها و گفته‌های آن‌ها نیز می‌شود. ذکر این نکته نیز ضروری است که تمایز قائل شدن بین کاربرانی که رفتاری شبیه بات‌ها دارند (مثلا از اپلیکیشن‌های قابل برنامه‌ریزی برای توئیت کردن استفاده می‌کنند)، و بات‌های واقعی بسیار دشوار است.

یکی از معروف‌ترین و پرکاربردترین مدل‌هایی که برای تشخیص بات بودن حساب‌های توئیتر ارائه شده است، مدلی است که توسط محققین «مرکز مطالعات شبکه‌ها و سیستم‌های پیچیده» دانشگاه ایندیانا معرفی شده است[4]. جدیدترین نسخه این مدل، که مبتنی بر روش‌های «یادگیری ماشین» کار می‌کند، بر اساس حدود ۱٬۲۰۰ شاخص مختلف به محاسبه «نمره‌ی بات بودن» برای هر حساب توئیتری می‌پردازد. این نمره یک عدد حقیقی بین صفر و یک است، که صفر نشان‌دهنده انسان بودن کامل و یک نشان‌دهنده بات بودن کامل است. در واقع نمره محاسبه شده نشان‌گر درجه‌ی رفتار خودکار و روبات‌گونه داشتن حساب‌های کاربری است. بر اساس آخرین تنظیمات صورت گرفته در مدل، نمرات بالاتر از ۰.۵ به احتمال بسیار زیادی بات هستند، اما باید توجه کرد که تعدادی از آن‌ها ممکن است کاربران واقعی‌ای باشند که رفتاری شبیه بات‌ها دارند. بنابراین باید توجه شود که دقت هیچ مدل یادگیری ماشینی صدرصد نیست و همواره درصدی از خطای تشخیص وجود دارد . با این وجود اما، استفاده از این مدل‌ها تنها راه‌حل علمی و منطقی موجود برای شناسایی تقریبی بات‌ها در مقیاس بزرگ است.

جدول ۴ تعداد و درصد بات‌های موجود بین هر یک از ۵ گروه شناسایی‌شده را نشان می‌دهد. ملاحظه می‌شود که بر مبنای مدل و فرضیات استفاده شده، ۲۴ درصد از مجموع ۶٬۶۲۲ کاربری که در این کمپین توئیتری فعال بوده‌اند به احتمال زیاد بات هستند، که بیش از ۳۲ درصد از مجموع توئیت‌ها توسط آن‌ها منتشر شده است. همچنین، ۲۴ درصد از مجموع کاربران موجود در گروه حامیان پهلوی، ۳۰ درصد از کاربران موجود در گروه منافقین، و ۲۰ درصد از کاربران موجود در گروه حامیان اسرائیل (و عربستان) به احتمال زیاد بات هستند. لیست بات‌های شناسایی شده در گروه حامیان پهلوی، منافقین، و حامیان اسرائیل و نمره بات بودن آن‌ها به ترتیب در جداول ۲پ، ۳پ، و ۴پ ارائه شده است.

جدول ۴: تعداد بات‌های موجود در هر یک از گروه‌های شناسایی شده

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۶ـ پیوست

جدول۱پ: ده توئیت اول در مورد نشست لهستان به همراه نام کاربری و زمان انتشار توئیت

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

شکل ۱پ: تنها توئیت محمد مجید الاحوازی درباره نشست لهستان

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

تحلیل جامع داده‌های کمپین توئیتری نشست لهستان

۰

دیدگاه تان را بنویسید

 

نیازمندیها