دکترای پوست تخم‌مرغ و مساله‌ی کمینه‌سازی تاسف‌ در انتخاب دوست‌دختر

نام‌اش را به خاطر ندارم. سال دوم راه‌نمایی بود. کلاس حرفه و فن. معلم تازه‌ای که به جای آقای موثق (که این هم ماجراها برای خود دارد) آمده بود. یادم نیست چه کاره بود. شاید پزشک یا چیزی در آن حدود. نام‌اش را نیز به خاطر نمی‌آورم. به نظرم جوان (یا میان‌سال) قد بلندی بود با اداهای خاص خودش. به نظرم آدم بدی نمی‌آمد. البته درست یادم نیست.
به هر حال …
به خاطر می‌آورم روزی داشت برای‌مان صحبت می‌کرد که علم چقدر تخصص‌ای است و مردم روی مسایل خیلی جزیی‌ای کار می‌کنند و از این حرف‌ها. می‌گفت یکی از دوستان‌اش (یا شاید هم یک بابایی به طور کلی!) هست که دکترای‌اش را روی پوست تخم مرغ گرفته است! باور کنید، همین را گفت! و باور نمی‌کنید که ما چقدر خندیدیم. کلاس منفجر شد. تاثیر این حرف (و میزان تخصص!)‌ آن‌قدر زیاد بود که الان بعد از n سال (و محض اطلاع، n به طرز قابل قبول‌ای بیش از ۵ سال است) هنوز آن شرایط را به خاطر دارم. دکترای پوست تخم مرغ؟! هه!

شما هم خندیدید؟ به نظرتان مسخره است که آدم برود دکترای‌اش را درباره‌ی پوست تخم مرغ بگیرد؟!
متاسفانه باید اعلام کنم که اگر این روزها کس‌ای چنین چیزی به‌ام بگوید، ازش می‌پرسم راجع به چه چیز پوست تخم مرغ‌داری پژوهش می‌کنی. موضوع به آن کلی‌ای که معنا ندارد!!!

دی‌شب در راه بازگشت به خانه داشتم فکر می‌کردم که مساله‌ی زیر چقدر جالب است:
فرض کنید دو تا دوست‌دختر دارید! هر کدام اخلاق خاص خودشان را دارند و [طبیعتا] اخلاق‌شان خیلی بگیر نگیر دارد. بعضی وقت‌ها حال‌شان خوب است و سر کیف‌اند و حسابی شما را خوش‌حال می‌کنند و بعضی وقت‌ها حال‌تان را می‌گیرند (خب، البته همه‌ی آدم‌ها این‌طوری نیستند. بعضی‌ها حتما و بدون تامل حال‌تان را می‌گیرند. اندک موردی هم دیده شده است که در بیش‌تر مواقع این‌کار را نمی‌کند. بگذریم …). شما دوست دارید بیش‌ترین لذت ممکن را از رابطه‌تان ببرید. در نتیجه به‌تر است با دختری دوست باشید که به طور متوسط شما را بیش‌تر خوش‌حال می‌کند.
اما مشکل این است که شما نمی‌دانید کدام یک به‌تر است. بعضی وقت‌ها این به‌تر است، بعضی وقت‌ها آن. اما به هر حال یکی‌شان به طور متوسط به‌تر است که البته شما نمی‌دانید کدام. کاری که می‌توانید بکنید این است که مدتی با این دوست باشید و بعد ببینید به طور متوسط چقدر خوش‌حال شده‌اید، بعد بروید سراغ دیگری و ببینید به طور متوسط چقدر خوش‌حال بوده‌اید و در نهایت این دو متوسط را مقایسه کنید و بعد از آن بچسبید به آن‌ای که متوسط بالاتری دارد.
این روش یک عیب دارد. شما خیلی راحت نمی‌توانید متوسط وضعیت شخص‌ای را خیلی راحت در بیاورید. با دو سه تجربه نمی‌تواند نظری در مورد شخص داد. بیست تجربه چطور است؟ بد نیست، اما باز هم کافی نیست. در واقع همیشه احتمال خطا در قضاوت‌تان وجود دارد. پس نمی‌توان به صرف چند تجربه‌ی به‌تر با یکی، دیگری را به کل رد کرد چون ممکن است به طور اتفاقی این چند نمونه تجربه با یکی به‌تر از دیگری در آمده باشد ولی واقعیت (متوسط واقعی!) برعکس باشد.
سوال این است: چطوری باید با دوست دخترهای‌تان قرار بگذارید تا در نهایت «اون به‌تره» را پیدا کنید؟ یا به عبارت دیگر، راه حل با کم‌ترین تاسف چیست؟ (regret minimization problem!)
البته این مساله کمینه در جوامع آکادمیک این‌قدر عملی مطرح نمی‌شود. در واقع صورت اصلی‌ی این مساله به نام n-armed bandit معروف است و هیچ ربطی به مسایل ناموسی ندارد. اما اساس هر دوی‌شان یکی است.

خب! همه‌ی این‌ها که چه؟ آها! ملت سال‌ها است روی این مساله (و تغییرات‌اش) کار کرده‌اند و هنوز هم کار می‌کنند. در واقع فکر کنم بشود روی چنین مساله‌ای دکترا گرفت (البته طبیعتا با یک سری تغییرات). تازه به نظر شخصی‌ام (من معمولا نظرات‌ام شخصی‌اند!)، این مساله‌ی جالب‌ای است و درباره‌اش کار کردن بامزه.
پوستِ تخم مرغ دیگر، نه؟!

29 نظر برای “دکترای پوست تخم‌مرغ و مساله‌ی کمینه‌سازی تاسف‌ در انتخاب دوست‌دختر

  1. من فکر نمی کنم آدم ها تا این اندازه شبیه دستمال کاغذی باشند که بتوانیم هر کدام شان را خواستیم تجربه کنیم و بعد دور بیاندازیم. اگر این گونه باشد که وجدان و تعهد در یک رابطه ی دوستی بی ارزش می شوند.

  2. به ری‌را: تفسیر این مثال به دستمال کاغذی و دور انداختن و غیره به نظرم زیادی شدید و تند است و نه من از آن استفاده کرده‌ام و نه قصدم آن بوده است. شاید عبارت «تلاش برای شناخت» دقیق‌تر باشد. برای شناختن آدم‌ها و پیداکردن مناسب‌ترین فرد (شما که منکر چنین لزومی نیستید؟) و هم‌چنین ساختن رابطه‌ی دوستی نیاز به شناخت طرف مقابل داریم. شناخت نیز با تجربه به دست می‌آید و این تجربه خطاپذیر است. همه‌ی حرف آن مثال در این است که این مساله راحت حل نمی‌شود و از نظر تئوری مساله‌ی دشواری است.
    به آیدا: اممم … اگر ناموسی نباشد، شبه‌ناموسی که هست!

  3. پسران این مرز و بوم این مقطع علمی رو به طور مادر زادی احتمالا در دوران پر افتخار جنینی می گذرانند :دی
    آگاهان می گویند برخی حتی تبحر خاصی در گزینش یک دوست دختر از بین 4 یا بیشتر را هم دارند.!

  4. به شانه بسر: نمی‌دانم، اما فکر نکنم خیلی هم زیاد باشد. به هر حال این مساله پنجاه سال است درست و حسابی حل نشده. شاید مشکل این است که کس‌ای این‌طوری که من تعریف کردم مساله را باز نمی‌کند! (;
    به آهو: فکر نکنم خیلی به‌تر از بقیه‌ی پسران عالم باشند. بگذریم که به هر حال دختران و پسران با هم تکامل یافته‌اند و کم و بیش از ابزارهای قابل مقایسه‌ای (ولی نه یک‌سان) برخوردارند.

  5. این مسئله‌ی n-armed bandit که احیاناً آن مسئله‌ی n-army معروف نیست؟ وقت‌داری یک‌کم درباره‌ی این مسئله بتوضیحی؟

    اممم… به نظرم هم مسئله را باید بیش‌تر باز کرد، هم به راه‌حل‌های دیگری که متصور است فکر کرد. این تجربه تجربه‌ی خاصی است و باید راه‌حل‌های آن در موارد مختلف تاحدودی شخصی‌سازی شود. 🙂

  6. how abt if u set the proposal topic to «regret minimization problem for finding the most energizer Partner, regardless the sex of the buddy»?
    ?then..would there be any scholarship or grant
    if so, i’m the Volunteer
    D:

  7. fek konam khoshhal nashid age har 2 dokhtar ham gheire shoma pesare morede azmayeshi dashte bashand?che niazi be in kar ast vaghti mitoonid ba yeki be ham bezanid va ba dygray bemanid gozinesh oghada ham sakht nis,dokhtarha ham faghat baraye sargarm kardane shoma nistan ke haletoono khob konan in ye rabeteye ensanie rabeteye 2 adam va ba in taryf nemishe ke tarafetoon khoobe age haletoono khob kone!in toosyf bacheganas .az shoma entezare bishtar az in miraft.agar ravabetetoono bar in bana mizaryd ke taraf haletoono khob kone!khob haminam pish miad ke motevaset va average begyryd…!va natoonid entekhanb konid .agar az mozee khodkhahitoon biayn pain va bar mabnaye avatef bana bezaryd onvaght hich vaght sedaghat va rastyo ke mabnaye har rabeteyie kenar nemizaryd

  8. به محسن مومنی: متاسفانه مساله‌ی n-army را نمی‌شناسم. در نتیجه نمی‌دانم همین است یا نه. اما n-armed bandit مساله‌ی معروف‌ای است و احتمالا معروف‌ترین نام به کار رفته برای این مساله.
    این مساله این‌گونه تعریف می‌شود:

    قمارخانه‌ای را در نظر بگیرید که در آن ماشین‌اش هست که n دست‌گیره دارد. هر کدام از دست‌گیره‌ها را که بکشید مقداری سود یا ضرر می‌کنید (یعنی یا کمی پول به شما می‌دهد یا کمی پول ازتان می‌خواهد). این مقدار تصادفی است و در طول زمان تغییر می‌کند. یعنی اگر یک دست‌گیره را دو بار بکشید، مقدار سود یا ضررتان یک‌سان نیست.
    اینک فرض کنیم که متوسط سود (یا ضرر – اگر منفی باشد) هر دست‌گیره مقدار ثابت‌ای است که البته بر شما دانسته نیست (اما متوسط سود دست‌گیره‌های متفاوت یک‌سان نیستند). توجه کنید که تنها متوسط ثابت است و نه مقداری که از هر بار کشیدن دست‌گیره به دست می‌آید.
    حال هدف این است که دست‌گیره‌ها را طوری بکشید که در نهایت بیش‌ترین سود ممکن را ببرید.
    از آن‌جا که شما نمی‌دانید متوسط سود هر دست‌گیره چقدر است، پس باید سعی کنید تخمین‌ای از آن سود به دست آورید. اما توجه کنید که اگر خیلی بخواهید تخمین‌تان دقیق باشد، ممکن است سود ناشی از کشیدن دست‌گیره‌ی دیگری را که متوسط به‌تری دارد از دست بدهید. برعکس، اگر بخواهید دست‌گیره‌های دیگر را زیاد آزمایش کنید، تخمین‌تان دقت‌اش کم می‌شود و ممکن است دست‌گیره‌ای را که واقعا به‌تر است از دست بدهید.

    این صورت‌ای از مساله است. مساله فرم‌های دیگری هم دارد. مثلا متوسط سود هر دست‌گیره ثابت نیست اما توزیع تصادفی‌ی هر دست‌گیره را می‌دانید (در واقع مشکل دیگر تخمین متوسط نیست، موضوع این است که از کدام دست‌گیره باید استفاده کنید). و یا مثلا حالت‌ای که سود هر دست‌گیره به پارامترهای دیگری هم بستگی دارد (مثلا وضعیت آب و هوا!). و حالت‌های دیگر …

    به Rahil: شاید! به هر حال می‌شود تغییرش داد و شاید هم هم‌چنان پول‌ای برای پرداخت باقی بماند. (;

  9. به رکسانا:
    ۱) لطفا پاسخ‌ام به کامنت ری‌را را بخوانید. احتمالا روشن‌گر است.
    ۲) من به کس‌ای توصیه نکرده‌ام که این‌گونه دوستان‌اش را پیدا کند. لطفا به آن «فرض کنید …» ابتدای پاراگراف مورد نظر دوباره توجه کنید. وقتی چنان چیزی ابتدای توصیف چیزی می‌آید،‌ یک مساله با شرایط خاصِ خودش تعریف می‌شود.
    ۳) اگر به نوشته دقت کنید، من به کس‌ای توصیه نکرده‌ام این‌گونه زندگی کند، بلکه تنها یک شرایط خاص را -که با عبارت «فرض کنید …» توصیف می‌شود- تحلیل (و البته تنها کیفی) کرده‌ام. تحلیل شرایط معادل توصیه‌ی اخلاقی نیست.
    ۴) معیار شما برای انتخاب یک فرد چیست؟ چطوری به شناخت فرد مقابل می‌رسید؟ روابط انسانی بدون صرف وقت معنادار است؟ آن وقت صرف‌شده برای چه صرف می‌شود؟ لطفا توضیح دهید.
    ۵) این‌که شما به این نتیجه رسیده‌اید که من از موضع خودخواهی به این نتایج رسیده‌ام اشتباه است. گویا متاسفانه نتوانسته‌ام در این نوشته منظور خودم را به درستی برسانم (و منظورم تنها چیزی که نبود، توصیه‌ی اخلاقی برای روابط صحیح انسانی بود).
    ۶) لطفا پنگلیش کامنت نگذارید. خواندن‌اش سخت است – مخصوصا وقتی راست‌چین نشان داده می‌شود.

  10. چه بسیار جالب بود! سولو به نظرم برای اجتناب از تداوم دعواهای جنسیتی، بی خیال پیشرفت علم شو و بگذار ملت کارشان را بکنند و محققان هم با همان قمارخانه خودشان سرگرم باشند ؛)

  11. به حمیدرضا: شاید برای همین است که می‌گویند پژوهش در ایران نهادین نیست! از یک طرف که بروی به قبای دین برمی‌خورد، از طرف دیگر به قبای سنت، از طرف دیگر نیز به روابط انسانی توهین می‌شود و طرف نهایی نیز اوستا-کار مکانیک یا برق‌کار به‌اش برمی‌خورد اگر بگویی دست‌گاه‌ای که می‌سازی کج است. (البته این حرف‌ام کمی شوخی بود!).
    به بی‌تا: من‌ام شنیده بودم چنین چیزی را. می‌گویند در مورد عشق و این حرف‌ها به‌تر است زیاد به معشوق فکر نکنی (البته دلیل‌اش را معمولا نمی‌گویند). به هر حال چشم … ! (;

  12. خوب امیر مسعود جان اون یکم فرآیندی که با هم از دکتر نادر یاد گرفتیم می گفت اگر سیگنالت یقینی یا دترمینیستیک!! نباشه نمی تونی ممان هاشو ثابت فر ض کنی.در مورد دخترها ( یا پسر ها!! بهشون بر نخوره) و کلا انسان ها که یکمی زیادی غیر یقینی هستن نمیشه میانگینشون (تازه رو حساب کرد مگه اینکه مشاهداتت بی نهایت باشه که اونم امکان پذیر نیست فکر کنم برای همینه که از درس فرآیند ها تصادفی هم سخت ترن.

  13. به محمد: لازمه‌اش یقینی‌بودن سیگنال نیست. سیگنال اگر غیرایستا (non-stationary) باشد نمی‌توان ممان‌های‌اش را ثابت فرض کرد، وگرنه فرض stationary بودن (یا wide-sense stationary) کافی است والبته فرض غیرمعمول‌ای هم نیست.
    اما حرف‌ات درست است. دنیای واقعی معمولا پیچیده‌تر از مدل‌هایی است که علم با آن سر و کار دارد. مدل‌ها ساده‌ترند و در نتیجه دقت‌شان کم‌تر است. اما از طرف دیگر ممکن است اگر شانس داشته باشیم قابل تحلیل باشند و بتوانیم چیزهایی در موردشان بگوییم. آن وقت می‌توانیم با تقریب در مورد دنیای واقعی نیز حرف بزنیم.
    به هر حال کار دیگری نمی‌شود کرد. به‌ترین وسیله‌ای که در اختیار داریم همین علم است – که البته بعضی وقت‌ها هم بد جواب نمی‌دهد (مثلا فیزیک نیوتونی دقیق نیست، اما با آن می‌توانیم هواپیما بسازیم. یا مدل‌های مداری استاندارد، سیگنال را به صورت موج در نظر نمی‌گیرد اما باز هم می‌توان بسیاری از مدارات الکترونیک را با استفاده از همان مدل‌ها تحلیل کرد و برای بچه‌ها اسباب‌بازی ساخت!).
    آها … تا یادم نرفته بگویم برای این مساله‌ی bandit، اگر مدل احتمالی را بدانیم (در واقع joint distribution) دیگر لازم نیست فرض‌ای مثل iid بودن بکنیم. یعنی با دانستن joint distribution هم مساله قابل حل است.

    از مدل‌های ما است. در واقع کاربرد مدل‌ها هم همین است که دنیای واقعی را با تقریب توصیف کنند. تقریب‌ای که دقت را کم می‌کند اما در عوض مساله را تا حدی ساده می‌کند که بتوان در موردش چیزی گفت.

  14. به سولوژن(!): فکر کنم معروف‌ترین اسم به کار رفته‌ در مورد این مسئله multi-armed bandit باشه.
    و در ضمن دقت کن که تمام ایده‌هایی‌ که حداقل من می‌شناسم در باره‌ی این مسئله، یه فرض اساسی در باره‌ی infinite horizon بودن دارند که خُب…خیلی با چند سال فرق داره، حتی از دیدگاه مهندسی.
    یعنی اصولا وقتی زمان explore کردن‌ت قابل صرف نظر در برابر زمان exploit کردن‌ت نیست، و تازه معمولا راه برگشتی هم -معمولا- وجود نداره، فکر کنم خیلی راه نامعقول‌تری نباشه سراغ مثلا اونی رفتن که از اسمش بیشتر خوشم می‌اد‌. وقتی که این همه مقایسه‌شون سخت‌ه که مجبوری با کلی ارفاق با multiarmed bandit مدل‌ش کنی، شاید بهتر باشه که انتخاب کنی.
    اصولا زحمت برای بالا بردن دقت از یه جایی به طور وحشتناکی با شیب تندی می‌ره بالا (اگه اصولا از یه حدی بتونه بالاتر بره).

    و خُب…طبعا همه‌ی این حرفا در مورد یه مسئله‌ی انسانی‌ه، و الا که خود مسئله‌ی اصلی رو یه بار که رفتیم لاس‌وگاس(!!) با تمام پس‌اندازمون – اعم از ارز(‍!) و دانش‌ (!!!) – به طور کاملا اکسپریمنتال حل می‌کنیم :دی

  15. مسائلی مثل k-armed bandit و البته مسائلی مثل مساله یافتن دوست دختر بهینه تا زمانی جالب به نظر می رسند که خواص محیطی که پسر داستان ما در اون قرار داره (محیط در اینجا فقط شامل دو دختر میشه) با گذشت زمان تغییر نکنه و به اصطلاح stationary باشه. اما اگر سایر agent های محیط (دخترها) خاصیت یادگیری و تطبیق داشته باشن اونوقت ما به روشهای یادگیری نیاز داریم که هیچ وقت متوقف نشن. یعنی یه جورایی همیشه باشد در حال یادگیری باشیم. مثلا اگر بعد از n مرحله به این نتیجه رسیدیم که دختر A دختر بهینه است، ممکن است رفتار ما با دختر B باعث بشه که بهد از گذشت مدت زمانی دختر B بهینه بشه! پس الگوریتم یادگیری هیچ وقت نباید متوقف بشه. اما سوال اینجاست که در این صورت مساله exploration vs. exploitation را در یک محیط non-stationary چه جوری handle کنیم؟

  16. آره درست میگی ایستا بودن برای پیدا کردن ممان کافیه 🙂 ولی فکر نکنم آدما ایستا هم باشن :))
    ضمنا اگر joint distribution رو داشتیم که دیگه خیلی وضعمون خوب بود. کلا این نگاه خیلی خنده داره و این مساله پیچیده تر از اونیه که با این محاسبات قابل حل باشه. البته الگوریتم های هوشمند بیولوژیکی مثل اون چیزایی که خودمون باهاش فکر می کنیم از پسش بر میان ولی نه همیشه 😉

  17. عجب بحث جالب توجهی بوده و من غافل بودم. یه کم مثال ها رو عوض می کردین هم به جایی بر نمی خورد . نه؟ مثلا یه تجدید نظر در جنس مثال ها خیال خیلی ها رو راحت می کرد.

  18. this is actually an interesting variant of the multi-armed bandit problem, since there’s a cost associated to switching! let’s say, you’re allowed to get back to a girl at most k times; what’s the optimal algorithm in this case?

  19. به آرش: بله! multi-armed bandit نام معروف‌تری است از n-armed و … . در مورد نوع ساختار نتایج باید بگویم که روش‌ای که به طور ضمنی اشاره کردم، نتیجه‌اش asymptotical نیست، بلکه finite-sample است. در واقع کران‌ای برای regret می‌دهد که خوش‌فرم است و اگر اشتباه نکنم، فرم کران‌اش بهینه است (و البته نه الزاما ثابت‌های‌اش). به طور مشخص‌تر منظورم الگوریتم UCB1 است و مقاله‌ی Auer.

    به آرش دیگر: بله! حرف‌تان کاملا درست است. در این‌جا فرض شده است که توزیع پاداش iid است. هدف‌ام از این مثال توصیه‌ی یک راه‌حل برای یک مساله‌ی واقعی نبود، بلکه نشان‌دادن این‌که یک مساله‌ی ریز چقدر می‌تواند جزییات داشته باشد بود و البته کمی شوخی‌کردن. یک مساله‌ی دیگری که این وسط اهمیت دارد (جدا از non-stationary بودن یا adversarial بودن طرف مقابل (که البته دومی به احتمال زیاد اولی را نتیجه می‌دهد)، این است که هیچ مفهوم حالت‌ای در نظر نگرفته‌ام. انسان‌ها در شرایط مختلف یک‌جور رفتار نمی‌کنند.

    به zita: بله! در نظر نگرفته‌ام. به توضیح‌ای که به «آرش دیگر» داده‌ام مراجعه کنید.

    به محمد: و البته باز هم مساله‌ی ساده‌ای نبود. اما یک سوال اساسی برای‌ام پیش می‌آید: منظورت از الگوریتم‌های هوش‌مند بیولوژیکی چیست و چرا آن‌ها می‌توانند از پس این جور سوال‌ها (حداقل بعضی وقت‌ها) بر بیاید؟ آیا آن‌ها از ریاضی‌ی دیگری استفاده می‌کنند؟

    به آزاد: آن توصیه بستگی دارد به هدف شخص.

    به «از زندگی»: سعی می‌کنم دفعه‌ی بعد برعکس بنویسم که عدالت در مجموع وبلاگ رعایت شده باشد.

    به یکی از چهارنفر: نه! نیستم!

    به محمد: جالب شد! دقیقا چه چیزهایی را می‌دانیم؟ می‌دانیم که توزیع پاداش هر کدام iid است، ولی توزیع را نمی‌شناسیم. در ضمن هر بار تعویض انتخاب یک بازو باعث دریافت هزینه‌ی ثابت‌ای می‌شود. هدف هم بیشینه‌کردن پاداش متوسط (با افق بی‌نهایت) است. درست فهمیده‌ام؟ (چون بیشینه k بار استفاده کردن هر بازو کمی مساله را به نظرم عجیب می‌کند در حالت افق نامحدود و پاداش متوسط. اگر پاداش discounted باشد یا افق محدود باشد (مثلا به M حرکت) برای‌ام قابل فهم است.)

  20. همه مثال ها رو خوندم و خیلی جالب بود ، اما در آخر حق با اون دوستمونه که گفته هوش بیولوژیکی خیلی بهتر و سریعتر از پس این مسدله بخصوص ( کمینگی تاسف در انتخاب دوست دختر / پسر ) بر میاد .

    یکی از دلایلش اینه که همونطور که سولوین گفته مدل ها همه واقعیت نیستند .
    در این مورد بخصوص توصیه من اینه که جز اونایی که در این زمینه متخصصن بقیه به همون هوش بیولوژیکی خودشون اکتفا کنن .

برای ری را پاسخی بگذارید لغو پاسخ