P{W|W}>P{M|W} and …

برای‌ام کس‌ای offline گذاشته بود به این مضمون که اسم‌ات را آخر این لیست اضافه کن و برای دیگران بفرست. در نتیجه لیست‌اش تشکیل می‌شد از اسامی‌ی آدم‌ها. لیست این‌گونه بود:

shiva, payam, sara, parinaz, mani, parsa, paniz, zahra, saghar, niusha, jafar, sa’eed, sina, maryam, shadi, roya, mona, dina, nami, keyvan, ashkan, parichehr, sanaz, pegah, tina, sepehr, shayan, ali, amirhossein, shafagh, azita, navid, mohammad, shiva atieh ,sadaf, shirin, mahyar, armita, nina, Mona, dorsa, behrang, saba, taraneh, Simin, Reyhaneh, hasty, SAM, mohammad, mahsa, mahdis, mahsa, shahin.kami, morteza, farokh, PedrAm

بنا به دلایل تاریخی دخترها را با صفر و پسرها را با یک نمایش دادم. لیست بدین‌گونه شد:

01001100001110000011100001111001100010000100000110001111

چه چیزی می‌بینید؟ من حلقه‌های درون‌گروهی‌ی دختران را در این سری‌ی اعداد می‌بینم.

تکمیلی: بیایید کمی بیش‌تر داده‌ها را بکاویم و ببینیم آیا چیزی ازشان در می‌آید یا خیر. برای شروع، احتمال‌های شرطی را محاسبه می‌کنم. با احتمال شرطی‌ی مرتبه اول شروع می‌کنم: تنها فرد فعلی و فرد بعدی را در نظر می‌گیرم. با شمارش داده‌ها به دست می‌آورم که:

P{Girl|Girl} = 0.7 P{Boy|Girl} = 0.3
P{Boy|Boy} = 0.59 P{Girl|Boy} = 0.41

دانش‌ای مثل P{Girl|Girl} نشان می‌دهد اگر من دختر باشم با چه احتمالی به یک دختر این پیام را می‌فرستم. هر دو جنس تمایل دارند تا این پیام را به هم‌جنس خود بفرستند. این تمایل برای دختران حدود ده درصد بیش‌تر است.

حال بیاییم سوال دیگری را مطرح کنیم: آیا این‌که نفر پیشین‌ای که پیام را برای من فرستاده چه کس‌ای باشد تاثیری در تصمیم من به این‌که پیام را به چه کس‌ای بفرستم دارد یا خیر؟

P{t:Girl|(t-1:Girl,t-2:Girl)} = 0.6 P{t:Boy|(t-1:Girl,t-2:Girl)} = 0.4
P{Boy|(Boy,Boy)} = 0.5 P{Girl|(Boy,Boy)} = 0.5
P{t:Boy|t-1:Boy,t-2:Girl} = 0.7 P{t:Girl|t-1:Boy,t-2:Girl} = 0.3
P{t:Boy|t-1:Girl,t-2:Boy} = 0 P{t:Girl|t-1:Girl, t-2:Boy} = 1

پدیده‌های جالبی مشاهده می‌شود. اگر من دختر باشم و نفر پیشین نیز دختر باشد، به احتمال ۰.۴ این پیام را به دختری خواهم فرستاد. اما اگر نفر پیشین‌ام یک پسر باشد، امکان ندارد برای پسری پیام را بفرستم. مشابه چنین پدیده‌ای -اما خفیف‌تر- برای پسرها نیز وجود دارد. گویا نوعی مقاومت در برابر انتشار پیام وجود دارد. مقاومت‌ای که جلوی به جنس مخالف فرستادن را می‌گیرد و این مقاومت وقتی بیش‌تر می‌شود که نفری پیشین من از جنس مخالف‌ام باشم.

حالا این تحلیل‌ها چقدر جدی‌اند؟! نه خیلی زیاد ولی نه خیلی کم! مهم‌ترین مشکل‌اش مشخص نبودن میزان معناداری‌ی نتایج است. وقتی تعداد نمونه‌ها کم باشد، احتمال این‌که نتیجه‌ای سودار (biased) به نظر برسد کم نیست. بیایید یک تحلیل کوچک بکنیم. فرض کنیم واقعا تفاوتی وجود ندارد و احتمال این‌که نفر بعدی پسر یا دختر باشد مستقل از نفر فعلی و برابر نیم باشد. فرض کنیم توزیع انتخاب بین دختر و پسر در همه جا مستقل و ثابت باشد (یعنی iid باشد). آن‌گاه احتمال این‌که به تصادف این نتیجه حاصل شود که دختران در ۶۰ درصد موارد پیام را به دختران می‌فرستند (و نه به پسران) برابر یک درصد است. این نتیجه البته هیچ اهمیتی ندارد. چون فرضا حالت ۶۵ درصد فرستادن نیز رخ‌داد مستقلی است و باید در نظر گرفته شود. اگر این را در نظر بگیریم و احتمال این‌که نتیجه‌ی اتفاقی‌ای (یعنی الکی و به دور از وجود واقعیت عینی) با پانزده درصد تمایل بیش‌تر حاصل شود (یعنی دختران ۵۷ درصد موارد یا بیش‌تر به دختران بفرستند) ۲۴ درصد است. خیلی زیاد نیست، اما کم هم نیست! به عبارت با احتمال ۷۵ درصد دختران بیش‌تر به دختران می‌فرستند تا پسران. دیگر حالت‌های دیگر و تحلیل دقیق‌ترش بماند برای کس‌ای که قرار است از این کارها نان در بیاورد. فقط این‌که چون تعداد نمونه‌های ممکن به حالت‌های ممکن احتمال‌های شرطی‌ی مرتبه دوم (این‌که نفر پیشین من که باشد تا من به که بدهم) کم‌تر است، دقت آن نتایج نیز کم‌تر خواهد بود.
پ.ن: کلمه‌ای را اشتباه نوشته بودم که تصحیح کردم: گر من دختر باشم و نفر پیشین نیز دختر باشد، به احتمال یک بود که تبدیل شد به ۰.۴.

Advertisements

25 نظر برای “P{W|W}>P{M|W} and …

  1. هیچ دختری هم نیست که بین پسرها ساندویچ شده باشه، اما دو تا پسر هستند که بین دختر ها ساندویچ شدن. یعنی به طور معمول تعداد دوستان دختر یک پسر بیشتر از تعداد دوستای پسر یک دختره یا اینکه پسر ها ترجیح می دن انزژی شون رو تو offline گذاشتن بیشتر صرف دختر ها کنند !

  2. من با نظر دوم untitled موافق‌ام! تعداد دوستان دختر پسرها برابر با تعداد دوستان پسر دخترها است (البته الزاما چگالی‌شان یک‌سان نیست).

  3. با تحلیل خیلی موافق نیستم. تعدادِ (بلندترین) رشته‌هایِ فقط صفر یا فقط یک را در این جدول لیست کرده‌ام.

    اندازه‌یِ گروه‌ها | 1 | 2 | 3 | 4 | 5 | تعدادِ گروه | تعدادِ فرد
    تعدادِ گروه‌هایِ 0 | 1 | 2 | 2 | 3 | 2 | 10 | 33
    تعدادِ گروه‌هایِ 1 | 3 | 3 | 3 | 1 | 0 | 10 | 22

    می‌بینیم که تعدادِ دخترها ۱۱ تا بیشتر از پسرهاست، و علتِ بزرگتر بودنِ دسته‌هایِ زنانه می‌تواند همین باشد. می‌بینیم اگر ردیفِ پایینی را یکی به سمتِ چپ بلغزانیم (با توجه به داشتنِ ۱۰ گروهِ پسرانه، یعنی تعدادِ پسرها را ۱۰ تن اضافه کنیم، تا اختلافِ‌شان با دخترها به ۱ تقلیل یابد) توزیع تقریباً به همان توزیعِ گروه‌هایِ 1 بدل خواهد شد. اگر (در افزودنِ آن ۱۰ تن) گروه‌هایِ بزرگ‌تر تمایلِ بیشتری به جذبِ فردِ جدید داشته باشند (به خاطرِ جاهایِ بیشتری که برایِ قراردادن‌اش دارند) حتی ممکن است کفه به سودِ 1ها عوض شود، و اگر افرادِ جدید را در کلِ رشته به صورتِ random اضافه کنیم هم گروه‌هایِ 0 شکسته و کوچک‌تر خواهند شد. بنابراین درکل به نظرم رشته تقریباً متعادل است، و نمی‌توان چنان نتیجه‌ای از آن گرفت.

    کم‌بودنِ تعدادِ 1ها را هم دو جور می‌شود تحلیل کرد: یا ایمیل کمتر به دستِ پسرها رسیده (افراد بیشتر تمایل داشته‌اند آن را برایِ دخترها فوروارد کنند) یا آنکه پسرها کمتر مایل به فوروارد کردنِ آن بوده، و ترجیح می‌داده‌اند از آن صرفِ نظر کنند.

  4. هومممم! به نظر من که این تحقیق! کمی بیش‌تر باید جلو برود، میزان داده‌های‌اش کم است … من می‌توانم این نتیجه را بگیرم که احتمالا تعداد اعضای �روه‌های پسرانه کم‌تر از دخترانه است. چون من گروه‌های پسرانه هم این‌جا می‌بینم!

  5. من از این نوشته‌ات خوش‌ام آمد. تیپ نوشته‌های قدیمی‌ات هم بود. من بحث تحلیل آماری اش را نمی‌کنم چون بدون وجود داده‌های بیشتر تحلیل معنا داری نیست اما method خیلی خوب بود.

    نکته ظریف‌اش نفرستادن پیغام به هم جنس از طرف پسرها در صورت گرفتن پیغام از یک دختر، بسیار جالب بود. ((:

  6. تفاوتی در ماهیت کار ایجاد نمی‌کند. تفاوت در این است که نشان می‌دهد آدم‌ها با چه کسانی دوست‌اند. و البته به نظر می‌رسد همه فقط این‌کار را نمی‌کنند چون شخص قبلی در تصمیم فرد فعلی تفاوت ایجاد می‌کند (ولی مثلا لیست دوستان نمی‌تواند چندان وابسته به جنسیت فرد قبلی باشد).
    جدا از این، اگر لیست دوستان را یک‌نواخت از دو جنس در نظر بگیریم، نتایج را متعادل می‌کند. یعنی انتخاب‌های واقعی شدیدتر از این‌اند.

  7. من فكر می كنم كه این جمل� یه جورهایی تناقض داره. یعنی در هر دو صورت اگه شما دختر باشید باید برای یك دختر پیام را بفرستید چه قبل از شما پسر باشه یا قبل از شما دختر باشه. اگه اشتباه می گم› راهنمایی كن:

    «پدیده‌های جالبی مشاهده می‌شود. اگر من دختر باشم و نفر پیشین نیز دختر باشد، به احتمال یک این پیام را به دختری خواهم فرستاد. اما اگر نفر پیشین‌ام یک پسر باشد، امکان ندارد برای پسری پیام را بفرستم. «

  8. من کلا مخالفم برای من اصلا فرقی نمیکنه اف لاین رو از دختر گرفته باشم و یا پسر و وقتی می خوام همین اف رو برای کسی بفرستم به سلیقه اش فکر می کنم و اینکه طرف از این اف خوشش خواهد امد یا نه ( بدون اینکه به جنسیتش توجه کنم )

  9. به کنجکاوی که آدرس ای-میل‌اش کنجکاوری‌ی مرا برانگیخت: یک تصحیح‌ای انجام دادم. ببینید الان به‌تر شده است؟
    به مریم: کلا مخالف‌اید؟ با چی؟! با همه چیز؟ اگر فقط موضوع این نوشته است، شاید بتوانم کمک کنم: من فرضیه‌ای برای موافقت یا مخالفت بیان نکردم. تنها یک سری عدد را شمردم و نتیجه‌اش را به صورت جملات زبانی درآوردم. در ضمن در مورد میزان صحت‌شان نیز چیزهایی گفتم. پس اگر کس‌ای جور دیگری رفتار کرد نه به معنای غلط بودن این نتایج است و نه به معنای غیرممکن بودن رفتار او. احتمالات است دیگر: صد بار سکه بیندازی هفتاد درصد بین ۴۵ تا ۵۵ بار رو می‌آید!

  10. hameye harfat ghabool vali nagofti ke in natayej cheghadr statically significant hastan yani ehtemale inke in reshteye to az ye tozi’e kamelan random entekhab shode bashe chiye? be ebarati che error-bari rooye in a’adadi ke dadi mizari? we need a marcov chain monte carlo simulation of this event!

  11. سلام مراد!

    در پاراگراف آخر �ک چیزی نوشته‌ام. تحلیل کامل نکرده‌ام اما سر دستی برای یکی دو حالت این‌طور به دست می‌آید که احتمال این‌که این داده‌ها اتفاقی به دست آمده باشند (با یک سری فرض در مورد توزیع از-پیش) برای نتیجه‌ی این‌که دخترها بیش‌تر به دخترها می‌فرستند تا به پسرها حدود ۲۵ درصد است. تحلیل دقیق‌اش وقت بیش‌تری می‌گرفت و من حوصله نداشتم! (در واقع برای یک پست وبلاگ بس بود.)

  12. سلام دختر پسرش فرقی نمیکنه اهمیتش اینجاست که فهمش چقدره و جنبش چقدره و ارزشی که داره

    البته! ولی من زیاد متوجه ربطش نشدم. بعضی وقت‌ها راجع به A حرف می‌زنیم، بعضی وقت‌ها هم راجع به B. (سولوژن)

  13. محشر بود دمت گرم! بازم از این کارا بکن. ادبیات آماری و ریاضی خیلی کم تو سایتا و وبلاگا دیده میشه در حالیکه زبان خیلی خوبیه برای گفتن خیلی چیزا. شاید علتش این باشه که اکثر اینترنتیا و وبلاگیا زورنالیستن و رشته های انسانی خوندن. موفق باشی

  14. بازتاب: Anti Memoirs

  15. Hi, I think if you want to know that, you will send to whom your series you can train a Neural Network (newff) and will see good results!!!! as a apredictor.

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s