khatam.ac.ir
سمپوزیوم علمی به مناسبت «روز علوم داده» در دانشگاه خاتم برگزار شد
تاریخ انتشار: پنجشنبه ۲ آذر ۱۴۰۲
سمپوزیوم علمی «روز علوم داده» با حضور جمعی از متخصصان، پژوهشگران و علاقهمندان حوزه دادهکاوی در دانشگاه خاتم در تهران برگزار شد.
به گزارش خبرنگار روابط عمومی و سایت دانشگاه خاتم، این سمپوزیوم علمی با حضور جمعی از متخصصان و علاقهمندان حوزه دادهکاوی، استادان و دانشجویان این رشته در دانشگاه خاتم و همچنین برخی از مراکز علمی و تحقیقاتی کشور و پژوهشگران این عرصه، با ارائه مقالاتی متنوع و جدید همراه با نشست پرسش و پاسخ، روز چهارشنبه ۱ آذرماه ۱۴۰۲ در محل سالن آمفی تئاتر دانشگاه خاتم در تهران برگزار شد.
سخنران نخست این سمپوزیوم دکتر بهنام بهرک استاد موسسه تیاس بود که به ارائه مقالهای تحت عنوان «بررسی تبعیض جنسیتی و ملیتی در پذیرش دانشجویان در دانشکدههای علوم کامپیوتر دانشگاههای برتر آمریکای شمالی» پرداخت.
وی با اعلام اینکه این مقاله کار مشترک او و دو دانشجوی خودش بوده و اکتبر سال جاری میلادی به چاپ رسیده است، گفت: ایده اصلی مقاله را یکی از دانشجویانم ارائه کرد که ۳ سال قبل در حال اپلای کردن بود و حین انجام کارهای مربوط به اپلای به این ایده رسید که استادان ایرانی بهتر از استادهای غیرایرانی جوابش را داده بودند.
دکتر بهرک افزود: هر سال تعداد زیادی دانشجو از نقاط مختلف جهان با استادن دانشگاههای آمریکای شمالی برای اپلای کردن تماس میگیرند و جوابهایی را از آنها دریافت میکنند. ما در این پژوهش میخواستیم بدانیم آیا این استادها در پذیرش دانشجویان خود از گرایش و تمایل خاصی برخوردار هستند؟ آیا بیشتر مایل به جذب دانشجوی همجنس خود هستند یا برعکس؟ آیا بیشتر تمایل دارند دانشجویان هموطن خود را جذب کنند یا در این رابطه جهتگیری خاصی وجود ندارد؟ و اگر بایاسهایی در این رابطه وجود دارد، آیا این بایاسها در طول زمان افزایش یافته یا کاهش؟
دکتر بهرک اضافه کرد: اولین کار استفاده از یک دیتاست بود که در این مورد دیتاست خاصی وجود نداشت و ما مجبور بودیم به جمعآوری داده که چالشهای زیادی داشت و البته در نهایت یکی از موارد مهمی که داورهای ژورنال را مجاب به پذیرش مقاله کرد، جمعآوری این دادهها بود.
وی گفت: تمرکز ما در این مطالعه روی رشته کامپیوتر بود و ۲۵ دانشگاه برتر کانادا و آمریکا را برای مطالعه انتخاب کردیم و از سال ۲۰۲۱ تا ۲۰۲۲ کار جمعآوری دیتا را انجام دادیم و سپس شروع به تحلیل دادهها کردیم. منابعی که برای جمعآوری داده از آنها استفاده کردیم، رزومه افراد (دانشجویان/استادان)، لینکدین آنها، گوگل اسکالر و وبسایت استادان بود، و ابزارهایی هم که برای تحلیل دادهها از آنها استفاده کردیم، سلنیوم (برای جمعآوری دادههای لینکدین)، گوگل سرچ، گوگل مپ API و Name2GAN بود.
دکتر بهنام بهرک ادامه داد: در نهایت دیتاهای مربوط به ۱۴ هزار دانشجو و ۷۴۰ استاد علوم کامپیوتر از ۲۵ دانشگاه در آمریکای شمالی (آمریکا و کانادا) را جمعآوری و سپس تحلیل کردیم. ارزیابی دادهها نشان میدهد که رتبه سوم تعداد دانشجویان خارجی علوم کامپیوتر در دانشگاههای برتر آمریکای شمالی بعد از چین و هند، متعلق به ایران بود. این مسئله عیناً در مورد استادان این ۲۵ دانشگاه نیز صدق میکند؛ یعنی رتبه سوم استادان خارجی علوم کامپیوتر در آمریکای شمالی بعد از هند و چین متعلق به ایران بود. این دو یافته از پژوهشِ ما، روند فرار مغزها را به خوبی نشان میدهد.
این استاد موسسه تیاس در ادامه اضافه کرد: در تحلیل آماری دادههای مربوط به جنسیت هم مشخص شد که تبعیض جنسیتی به طور معنیداری وجود ندارد اما در مورد ملیت سوگیری آشکاری به ملیت خود استاد وجود داشت؛ به این معنا که غالبا استاد چینی ترجیح میدهد دانشجویی از کشور خودش را پذیرش کند، به همین ترتیب استاد هندی، دانشجوی هندی و استاد ایرانی، دانشجوی ایرانی را جذب میکند و الی آخر.
بهرک گفت: همچنین ارزیابی دادهها نشان میدهد که نسبتِ استاد/دانشجو با جنسیت همسان در طول زمان با روند بسیار ملایمی در حال کم شدن است و از طرف دیگر، نسبت استاد/دانشجو با ملیت یکسان در طول زمان به همان شکل سابق در حال افزایش است.
این استاد موسسه تیاس تاکید کرد: دادهها همچنین نشان داد که تنوع جنسیتی در کل این دانشگاهها (۲۵ دانشگاه آمریکای شمالی) رو به افزایش و در مقابل، تنوع ملیتی رو به کاهش است؛ به خصوص از سال ۲۰۱۶ تا ۲۰۲۰. به نظر میرسد یک سری از ملیتها در این روند در حال حذف شدن هستند.
به گفته وی و بر اساس نتایج این تحقیق، در روند پذیرش دانشجو از کشورهای دیگر در دانشگاههای آمریکای شمالی، سوگیری جنسیتی وجود ندارد اما سوگیری ملیتی مشاهده میشود. همچنین تنوع جنسیتی افزایش و تنوع ملیتی کاهش پیدا کرده است. همچنین نشان داده شده است که تنوع ملیتی یک گروه تحقیقاتی با میزان موفقیت آکادمیک گروه مرتبط است.
در ادامه برنامههای سمپوزیوم علوم داده در دانشگاه خاتم، دکتر صادق علیاکبری از دانشگاه شهید بهشتی به ارائه سخنرانی با عنوان «مقدمهای بر فرآیندکاوی» پرداخت و گفت: فرایندهای کسب و کار مجموعهای از فعالیتها هستند که هر کدام را فردی انجام میدهد و قرار بر این است که به یک هدف مشخص و دارای ارزش برای مجموعه منتج شود.
وی افزود: در حوزههای دیگر هم کاربردهای نوینی برای فرایندکاوی به وجود آمده است. مثلا در جستجو در وب یا همان وبگردی، ممکن است با تحلیلهای کلان به این نتیجه برسیم که کاربران عموما از الگوی خاصی در وبگردی پیروی میکنند که نتایج آن کاربردهای فراوانی و با ارزشی میتواند داشته باشد.
در ادامه دکتر فاطمه قاسمی، استاد دانشگاه تهران، در مورد یک روش نوین برای طبقه بندی ترافیک در شبکه به کمک ترکیب شبکههای عصبی عمیق و یادگیری اتومات صحبت کرد و گفت: طبقه بندی ترافیک شبکه برای مدیریت شبکه برای مثال در متعادل کردن حجم دادهها و جلوگیری از حملهها لازم است. این طبقهبندی با پیشرفت اینترنت با چالشهای بسیاری روبروست.
همچنین دکتر یداله یعقوبزاده، استاد موسسه تیاس و دانشگاه تهران در سخنانی درباره ChatGPT ضمن بررسی تاریخچه NLP (پردازش زبانهای طبیعی) از ساخت زبان تا شکلگیری ترجمه و حالا هم ChatGPT درباره آینده آن نیز گفت: قطعا آینده را نمیتوان پیشبینی کرد ولی یکی از حوزههایی که به نظر میرسد داغ میشود، فردی شدن ChatGPT است؛ مثلا شما میتوانید ChatGPT خودتان را داشته باشید و این قطعا هیجانانگیز است.
در ادامه، زهرا سادات دلبری دانشجوی رشته علوم دادهی موسسه تیاس در دانشگاه خاتم مقالهای با عنوان «سخنان نفرت در توئیترِ فارسی» ارائه کرد.
در ادامه دکتر محمد محمودی متخصص در حوزه یادگیری ماشینی به طرح مباحثی درباره حریم خصوصی در این حوزه پرداخت و گفت: خیلیها دوست دارند درج اطلاعات خصوصیشان در شبکههای اجتماعی همیشگی نباشد و اگر زمانی خواستند، بتوانند آن را حذف و به عبارت دقیقتر دسترسی دیگران را به آن مسدود کنند. این موضوع ما را به مبحث «حق فراموشی» میرساند که نخستین بار به لحاظ حقوقی به تصویب قوانینی در اتحادیه اروپا انجامید، ولی این امر در حال گسترش است. اما تحقیقات نشان میدهند در مواردی پاک کردن اطلاعات آنلاین بعضا باعث میشود که اطلاعات شخصیِ فرد حتی به صورت راحتتری قابل استخراج باشد. بنابراین استفاده صرف از «پاک کردن داده» لزوما بهترین راه برای حل این مشکل نیست.
بر اساس این گزارش، سمپوزیوم علوم داده با برگزاریِ نشستِ پرسش و پاسخ میان استادان مدعو و مخاطبان حاضر در برنامه به کار خود پایان داد.