تحلیل جامع دادههای یک کمپین توییتری/ چگونه مزدوران و رباتهای حامی پهلوی و منافقین برای هشتگ سفارشی نشست ورشو همکاری میکنند؟
در آستانه نشست ورشو، هشتگ #WeSupportPolandSummit در توییتر ترند شد که تعجب بسیاری از کاربران را برانگیخت. شیوه انتشار محتوا و سبک محتوا نشان از یک عملیات هماهنگ و استفاده از ربات برای ترند کردن این هشتگ داشت.
سرویس سیاسی فردا: در آستانه نشست ورشو، هشتگ #WeSupportPolandSummit در توییتر ترند شد که تعجب بسیاری از کاربران را برانگیخت. شیوه انتشار محتوا و سبک محتوا نشان از یک عملیات هماهنگ و استفاده از ربات برای ترند کردن این هشتگ داشت.
یک مرکز دانشگاهی تحلیلی از کاربران، سرشاخهها، جریانات و گروهکهای موثر در این باره انجام داده است و نشان داده است برخی گروههای تجزیهطلب و تروریستی ظرفیتهای خود را برای این هشتگ به میدان آوردهاند
۱ـ چکیده
در آستانه نشست لهستان، که به گفته مایک پمپئو، وزیر امور خارجه آمریکا، قرار بود به اجلاسی ضدایرانی تبدیل شود، یک کمپین توئیتری با هشتگ #WeSupportPolandSummit از تاریخ ۲۷ دی (۱۷ ژانویه) در جهت حمایت از این نشست به راه افتاد. این گزارش به تحلیل تمام توییتهایی که حاوی هشتگ فوق بوده و در بازه زمانی ده روز بعد از انتشار اولین توییت منتشر شدهاند میپردازد. خلاصه یافتههای این تحقیق به شرح ذیل است:
- در مجموع تعداد ۱۱۳٬۸۸۴ توئیت توسط ۶٬۶۲۲ کاربر منحصربهفرد منتشر شده است، که تعداد ۹۶٬۹۹۱ توئیت از آنها (۸۵ درصد از کل) بازنشر توئیتهای دیگر (ریتوئیت) بودهاند.
- افراد فعال در این کمپین توییتری را به پنج گروه کلی میتوان تقسیم کرد:
- براندازان و حامیان رضا پهلوی (۵۸ درصد)
- منافقین (۲۴ درصد)
- کاربران خارجی و ایرانی حامی اسرائیل (۸ درصد)
- کاربران خارجی و ایرانی حامی ایران (۷ درصد)
- حامیان جنبش «ایرانارشسیم» (۱.۵ درصد)
- شواهدی مبنی بر فعالیت گروهی و هماهنگ کاربران عربستانی وجود ندارد و فقط تعداد محدودی کاربر به رهبری «محمد مجید الأحوازی» در این کمپین توئیتری فعال بودهاند.
- بر اساس محاسبات پیچیده مبتنی بر حدود ۱٬۲۰۰ شاخص کمّی، ۲۴ درصد از مجموع کاربران فعال در این رخداد توئیتری به احتمال زیاد روبات (بات) هستند، که ۳۲ درصد از مجموع توئیتها توسط آنها منتشر شده است.
۲ـ روش تحقیق
۲ـ۱ـ دادهها
با استفاده از رابط کاربری توئیتر (Twitter API) تمام توئیتهایی که حاوی هشتگ #WeSupportPolandSummit بودند در بازه زمانی ده روز بعد از انتشار اولین توئیت جمعآوری شدند. آمار مربوط به این توئیتها در جدول ۱ نشان داده شدهاند. در مجموع تعداد ۱۱۳٬۸۸۴ توئیت توسط ۶٬۶۲۲ کاربر منحصربهفرد منتشر شده است که تعداد ۹۶٬۹۹۱ از آنها بازنشر توئیتهای دیگران (ریتوئیت) بودهاند.
جدول ۱: آمار مربوط به توئیتهای منتشر شده با موضوع نشست لهستان در بازه زمانی ده روز بعد از انتشار اولین توئیت
۲ـ۲ـ ایجاد شبکه ریتوئیت و شناسایی گروههای مختلف
در حال حاضر موثرترین روش برای شناسایی گروههای مختلفی که در تولید و انتشار خبر در یک واقعه خاص فعال بودهاند ایجاد و تحلیل شبکه گردش اطلاعات است. به عنوان مثال، در مورد شبکه اجتماعی توئیتر باید شبکه ریتوئیت بین کاربران را ایجاد کرد و با استفاده از روشهای «شناسایی گروهها[1]» به کشف گروههای مختلف کاربران پرداخت. این روشها بر اساس شباهتهای ساختاری بین کاربران آنها را در گروههای مختلف دستهبندی میکنند. سپس بر اساس روشهای تحلیل متن و کاربرانی که در هر کدام از دستهها قرار گرفتهاند و نظرات کارشناسی خبرگان می توان گروهها را نامگذاری کرد.
۳ـ نتایج
۳ـ۱ـ شناسایی اولین کاربران
اولین کاربرانی که اقدام که به نشر توئیت با هشتگ #WeSupportPolandSummit کردند کاربرانی از گروههای منافقین و براندازان حامی پهلوی بودند. نام کاربری، گروهی که کاربر متعلق به آن است، زمان انتشار، و متن توئیت ۱۰ کاربر اول در جدول ۱پ (پیوست همین گزارش) نشان داده است.
۳ـ۲ـ شناسایی گروههای مختلف کاربران
شکل ۱ شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروههای مختلف شناساییشده را نشان میدهد. در این شبکه، هر یک از گرهها نمایانگر یک حساب کاربری است که حداقل یک توئیت با هشتگ #WeSupportPolandSummit را در بازه زمانی ده روز بعد از انتشار اولین توئیت منشتر کرده است. هر رنگ نشاندهنده یک گروه از کاربران است که توسط یکی از الگوریتمهای «شناسایی گروهها» کشف شده است. برای اطلاع از محتوا و نامگذاری هر یک از گروهها باید از روشهای تحلیل متن استفاده کرد و هشتگها، کلمات، و عبارات پرکاربرد هر یک از گروهها را استخراج کرد و با توجه به کاربران تاثیرگذار موجود در هر گروه و نظر خبره در مورد ماهیت هر یک از گروهها تصمیمگیری کرد.
جدول ۲ تعداد کاربران موجود در هر گروه، کاربران تاثیرگذار، هشتگهای پرکاربرد، و نام پیشنهادی هر گروه را نشان میدهد. ملاحظه میشود که ۵۸٪ از کاربران از براندازان حامی پهلوی و ۲۴٪ از منافقین بودهاند. حدود ۸٪ از کاربران ایرانی و خارجی مخالف ایران هستند که عمدتا با بازیگردانی حساب توئیتر وزارت خارجه اسرائیل فعالیت میکردند. تعداد کمی از کاربران این گروه نیز به رهبری «محمد مجید الأحوازی» فعالیت میکردند (شکل ۱پ). اما در مجموع، در مقایسه با کمپین توئیتری فرشید هکی، نشانهای از اقدام گروهی و هماهنگ از طرف عربستان دیده نمیشود. در حدود ۷٪ از کاربران نیز به رهبری «جف گلبرگ» و یک سایت خبری لهستانی (شکل ۲پ) از حامیان ایران بودند. همچنین ۱٪ از کاربران نیز از حامیان گروه «ایرانارشیسم» به رهبری «علی عبدالرضایی» هستند.
شکل ۱: شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروههای مختلف آنها. هر رنگ نشاندهنده یک گروه از کاربران است. اندازه گره و فونت نشاندهنده میزان ریتوئیت شدن است.
جدول ۲: آمار کاربران موجود در هر یک از گروههای شناسایی شده
۳ـ۳ـ شناسایی کاربران تاثیرگذار
در یک دستهبندی کلی، دو دسته از کاربران را میتوان به عنوان کاربران تاثیرگذار شناسایی کرد[2]:
۱) کاربرانی که مطالب آنها بیشترین بازنشر را داشته است؛
۲) کاربرانی که نقش پل ارتباطی بین گروههای مختلف را دارند (واسطه یا بروکر).
۳ـ۳ـ۱ـ کاربران با نرخ بالای ریتوئیت شدن
جدول ۳ ده کاربر دارای بیشترین نرخ ریتوئیتشدن را نشان میدهد. در جدول ۳، کاملا مشخص است که اکثر کاربران فاقد نام واقعی هستند و تقریبا هیچ یک از کاربران از افراد یا گروههای شناختهشده سیاسی داخل یا خارج از کشور نیستند. این امر می تواند به عنوان یکی از نشانههایی که احتمال عملیات نفوذ مجازی خارجی بودن این رخداد توئیتری را افزایش می دهد قلمداد شود. در شبکه ریتوئیت نمایش داده شده در شکل ۱، اندازه گرهها و فونت آنها متناسب با میزان ریتوئیت شدن کاربران تنظیم شده است تا کاربران تاثیرگذار به راحتی قابل شناسایی باشند.
جدول ۳: کاربران با نرخ بالای ریتوئیت شدن
۳ـ۳ـ۲ـ کاربران تاثیرگذار به لحاظ پل ارتباطی بودن
نوع دیگری از کاربران اثرگذار آن دسته از کاربرانی هستند که نقش پل ارتباطی بین گروههای مختلف را دارند. به عبارت دیگر، اگر این کاربران نبودند، شدت اتصال آن گروهها به بکدیگر کمتر میشد و مطالب منتشر شده در هر یک از گروهها به تعداد کمتری از کاربران سایر گروهها منتقل میشد. اهمیت این کاربران از آن جهت است که حذف آنها باعث کاهش عملکرد شبکه جریان اطلاعات میشود. در ادبیات علوم شبکه و علوم اجتماعی محاسباتی، از شاخص مرکزیت «میانیت» [3] برای شناسایی این دسته از کاربران استفاده میشود. در شکل ۲ کاربرانی که به لحاظ شاخص میانیت از اهمیت بالاتری برخوردارند با اندازه بزرگتری نشان داده شدهاند. جدول ۴ کاربرانی که دارای بالاترین میزان شاخص مرکزیت میانیت هستند را نشان میدهد.
شکل ۲: شبکه ریتوئیت کاربران فعال در کمپین نشست لهستان و گروههای مختلف آنها. هر رنگ نشاندهنده یک گروه از کاربران است. اندازه گره و فونت نشاندهنده شاخص مرکزیت میانیت است.
جدول ۳: کاربران با نرخ بالای شاخص مرکزیت میانیت
۳ـ۴ـ نمودار فعالیت گروه های مختلف
شکل ۳ نمودار تعداد توئیتهای منتشر شده درباره نشست لهستان به تفکیک گروههای مختلف کاربران را نشان میدهد. همانطور که در شکل ۳ مشاهده میشود، فعالیت تمام گروهها به صورت تقریبا همزمان از روز ۱۷ ژانویه شروع و در روز ۲۲ ژانویه پایان یافته است. نکته قابل توجه در شکل ۳ آخرین ساعات روز ۲۰ ژانویه است که تعداد توئیتهای منتشر شده توسط حامیان پهلوی ناگهان افزایش چشمگیری داشته است، که به احتمال زیاد نشاندهنده استفاده از بات (روبات) به منظور انجام یک عملیات گروهی و هماهنگ است.
شکل 3 : نمودار تعداد توئیتهای منتشر شده به تفکیک گروههای مختلف برآورد شده از کاربران
۴ـ بررسی وجود روبات (بات) بین کاربران
روباتها آن دسته از کاربران فضای مجازی هستند که به صورت برنامهریزی شده و خودمختار عمل میکنند. روباتها میتوانند بر اساس دستورالعملی که از قبل توسط یک برنامه رایانهای به آنها داده شده است به لایک کردن، ریتوئیت کردن، پاسخ دادن، و ارسال پیام خصوصی بپردازند. در صورتی که از روباتها برای انجام عملیات نفوذ مجازی استفاده شود، از شبکهای از تعداد زیادی از آنها جهت انتشار اخبار، بازنشر اخباری که توسط دیگران منتشر شده است، یا کامنتگذاری استفاده میشود.
تشخیص بات بودن یک حساب کاربری توئیتر در اغلب موارد کار سادهای نیست و نیازمند استفاده از مدلهای بسیار پیچیده است. متاسفانه بعضا دیده میشود که افرادی صرفا با تکیه بر مواردی چون نامکاربری غیرواقعی، تعداد فالوئر کم و تعداد توئیتهای زیاد، یا نرخ بالای توئیت کردن اقدام به اظهارنظر در مورد بات بودن یا نبودن یک حساب کاربری میکنند. این گونه اظهارنظرها نه تنها واکنش متقابل طرف مقابل را در پی خواهد داشت، بلکه منجر به کاهش اعتبار سایر یافتهها و گفتههای آنها نیز میشود. ذکر این نکته نیز ضروری است که تمایز قائل شدن بین کاربرانی که رفتاری شبیه باتها دارند (مثلا از اپلیکیشنهای قابل برنامهریزی برای توئیت کردن استفاده میکنند)، و باتهای واقعی بسیار دشوار است.
یکی از معروفترین و پرکاربردترین مدلهایی که برای تشخیص بات بودن حسابهای توئیتر ارائه شده است، مدلی است که توسط محققین «مرکز مطالعات شبکهها و سیستمهای پیچیده» دانشگاه ایندیانا معرفی شده است[4]. جدیدترین نسخه این مدل، که مبتنی بر روشهای «یادگیری ماشین» کار میکند، بر اساس حدود ۱٬۲۰۰ شاخص مختلف به محاسبه «نمرهی بات بودن» برای هر حساب توئیتری میپردازد. این نمره یک عدد حقیقی بین صفر و یک است، که صفر نشاندهنده انسان بودن کامل و یک نشاندهنده بات بودن کامل است. در واقع نمره محاسبه شده نشانگر درجهی رفتار خودکار و روباتگونه داشتن حسابهای کاربری است. بر اساس آخرین تنظیمات صورت گرفته در مدل، نمرات بالاتر از ۰.۵ به احتمال بسیار زیادی بات هستند، اما باید توجه کرد که تعدادی از آنها ممکن است کاربران واقعیای باشند که رفتاری شبیه باتها دارند. بنابراین باید توجه شود که دقت هیچ مدل یادگیری ماشینی صدرصد نیست و همواره درصدی از خطای تشخیص وجود دارد . با این وجود اما، استفاده از این مدلها تنها راهحل علمی و منطقی موجود برای شناسایی تقریبی باتها در مقیاس بزرگ است.
جدول ۴ تعداد و درصد باتهای موجود بین هر یک از ۵ گروه شناساییشده را نشان میدهد. ملاحظه میشود که بر مبنای مدل و فرضیات استفاده شده، ۲۴ درصد از مجموع ۶٬۶۲۲ کاربری که در این کمپین توئیتری فعال بودهاند به احتمال زیاد بات هستند، که بیش از ۳۲ درصد از مجموع توئیتها توسط آنها منتشر شده است. همچنین، ۲۴ درصد از مجموع کاربران موجود در گروه حامیان پهلوی، ۳۰ درصد از کاربران موجود در گروه منافقین، و ۲۰ درصد از کاربران موجود در گروه حامیان اسرائیل (و عربستان) به احتمال زیاد بات هستند. لیست باتهای شناسایی شده در گروه حامیان پهلوی، منافقین، و حامیان اسرائیل و نمره بات بودن آنها به ترتیب در جداول ۲پ، ۳پ، و ۴پ ارائه شده است.
جدول ۴: تعداد باتهای موجود در هر یک از گروههای شناسایی شده
۶ـ پیوست
جدول۱پ: ده توئیت اول در مورد نشست لهستان به همراه نام کاربری و زمان انتشار توئیت
شکل ۱پ: تنها توئیت محمد مجید الاحوازی درباره نشست لهستان
دیدگاه تان را بنویسید