دکتر عباسعلی داداشی رودباری
استادیار
دکتر عباسعلی داداشی رودباری
استادیار
دانشکده ادبیات و علوم انسانی
جغرافیا
سرفصل مطالب
# سرفصل مطالب طرح درس (براساس سرفصل)
1 جلسه 1: مقدمه‌ای بر آمار پیشرفته در علوم آب و هوا و معرفی ابزارهای مدرن: در این جلسه ضمن معرفی اهداف کلی درس، به جایگاه حیاتی آمار پیشرفته و علم داده در تحقیقات آب و هواشناسی پرداخته می‌شود. مفاهیم بنیادی مانند انواع داده‌های اقلیمی (شبکه‌ای، نقطه‌ای)، مقیاس‌های زمانی-مکانی و چالش‌های آماری این حوزه بررسی می‌گردند. سپس اکوسیستم‌های مدرن تحلیل داده، خصوصاً زبان برنامه‌نویسی R، محیط RStudio و پلتفرم‌های ابری مانند Posit Cloud معرفی می‌شوند تا دانشجویان بتوانند بدون موانع فنی و تنها با یک مرورگر، تحلیل‌های پیشرفته را آغاز کرده و تمرکز خود را بر یادگیری مفاهیم آماری معطوف سازند.
2 جلسه 2: بازآموزی تئوری احتمالات و توزیع‌های آماری کلیدی در اقلیم‌شناسی: این جلسه به بازبینی عمیق مفاهیم بنیادی تئوری احتمالات به عنوان سنگ بنای تحلیل‌های آماری اختصاص دارد و مفاهیمی چون متغیرهای تصادفی، توابع CDF و PDF مرور می‌شوند. تمرکز اصلی بر توزیع‌های آماری پرکاربرد در مدل‌سازی پدیده‌های اقلیمی مانند نرمال، گاما، گامبل، وایبول و پواسون است. کاربرد این توزیع‌ها در تحلیل داده‌های بارش، دما و رخدادهای فرین با مثال‌های عملی تشریح شده و دانشجویان نحوه شبیه‌سازی و برازش آن‌ها به داده‌های واقعی را با استفاده از R تمرین خواهند کرد.
3 جلسه 3: کاربرد عملی ماتریس‌ها و جبر خطی در تحلیل داده‌های اقلیمی: این جلسه کاربردهای عملی ماتریس‌ها را به عنوان زبان محاسباتی علم داده مدرن بررسی می‌کند. مفاهیمی چون عملیات ماتریسی، مقادیر ویژه و بردارهای ویژه به صورت شهودی و با مثال‌های کاربردی در نمایش داده‌های چندبعدی اقلیمی و محاسبات آماری مانند کوواریانس آموزش داده می‌شوند. برای افزایش سرعت و کارایی محاسبات، از پکیج بهینه‌سازی شده Matrix در R برای کار با ماتریس‌های بزرگ و پراکنده که در داده‌های شبکه‌ای رایج هستند، استفاده خواهد شد.
4 جلسه 4: آزمون‌های آماری پارامتری و ناپارامتری: انتخاب و تفسیر: این جلسه به آزمون فرضیه‌ها، یکی از ارکان آمار استنباطی، می‌پردازد و تفاوت‌های اساسی بین روش‌های پارامتری و ناپارامتری را تشریح می‌کند. آزمون‌های رایج مانند t-test، ANOVA، من-ویتنی، کروسکال-والیس و کای-دو با کاربردهای مشخص در علوم اقلیم معرفی می‌شوند. تاکید اصلی بر بررسی مفروضات آزمون‌ها (مانند نرمال بودن داده‌ها) و انتخاب آزمون مناسب بوده و دانشجویان نحوه اجرای این آزمون‌ها در R و تفسیر صحیح نتایج، به ویژه مقدار احتمال (p-value) و اندازه اثر (effect size)، را فرا می‌گیرند.
5 جلسه 5: مبانی رگرسیون خطی ساده و چندگانه: رگرسیون به عنوان ابزاری قدرتمند برای مدل‌سازی روابط بین متغیرها معرفی می‌شود. این جلسه با رگرسیون خطی ساده و مفاهیم کلیدی آن مانند روش حداقل مربعات (OLS)، ضریب تعیین (R2) و تحلیل باقیمانده‌ها آغاز می‌شود. سپس بحث به رگرسیون خطی چندگانه برای بررسی اثر همزمان چند متغیر گسترش یافته و چالش‌هایی مانند هم‌خطی چندگانه (Multicollinearity) مورد بررسی قرار می‌گیرد. برای پیاده‌سازی، ارزیابی و مصورسازی این مدل‌ها از پکیج پیشرفته rms (Regression Modeling Strategies) در R استفاده خواهد شد.
6 جلسه 6: تحلیل واریانس (ANOVA) و تحلیل واریانس فضایی (Spatial ANOVA): در این جلسه، تحلیل واریانس (ANOVA) به عنوان روشی برای مقایسه میانگین چندین گروه معرفی و انواع مدل‌های آن (یک‌طرفه و دوطرفه) بررسی می‌شود. سپس این مفهوم به حوزه مکان گسترش یافته و تحلیل واریانس فضایی برای تفکیک منابع تغییرپذیری در داده‌های اقلیمی آموزش داده می‌شود. با استفاده از پکیج VCA (Variance Component Analysis) در R، سهم منابع مختلف خطا یا تغییرپذیری (مانند تغییرات بین ایستگاهی یا زمانی) در کل واریانس یک متغیر اقلیمی برآورد می‌گردد که در ارزیابی مدل‌ها و شبکه‌های دیدبانی کاربرد دارد.
7 جلسه 7: تحلیل همبستگی: از همبستگی ساده تا همبستگی فضایی: این جلسه به بررسی انواع همبستگی‌ها اختصاص دارد و ضمن مرور همبستگی پیرسون و اسپیرمن، مفهوم همبستگی با تأخیر (Lagged Correlation) برای شناسایی روابط زمانی بین سری‌های اقلیمی معرفی می‌شود. بخش اصلی جلسه بر خودهمبستگی فضایی (Spatial Autocorrelation) و قانون اول جغرافیای توبلر متمرکز است. برای مصورسازی و تحلیل ماتریس‌های همبستگی، از پکیج قدرتمند corrplot در R استفاده خواهد شد که امکانات بصری برای کشف الگوهای پنهان و نمایش سطح معنی‌داری همبستگی‌ها را فراهم می‌کند.
8 جلسه 8: مقدمه‌ای بر روش‌های آمار چند متغیره و کاهش ابعاد: با توجه به ماهیت چندبعدی داده‌های اقلیمی، این جلسه به معرفی روش‌های آماری تحلیل همزمان چندین متغیر می‌پردازد. تمرکز اصلی بر تکنیک‌های کاهش ابعاد (Dimensionality Reduction)، به ویژه تحلیل مؤلفه‌های اصلی (Principal Component Analysis - PCA)، خواهد بود. کاربرد PCA در خلاصه‌سازی اطلاعات و شناسایی الگوهای غالب تغییرپذیری فضایی-زمانی اقلیم، مانند نوسان شمالگان (AO)، با مثال‌های واقعی به صورت عملی تشریح خواهد شد.
9 جلسه 9: تحلیل سری‌های زمانی (بخش اول): تجزیه و تحلیل مقدماتی: این جلسه، بخش اول از بحث دو جلسه‌ای تحلیل سری‌های زمانی است و بر تجزیه و تحلیل مقدماتی تمرکز دارد. مفهوم تجزیه یک سری زمانی اقلیمی به مؤلفه‌های اصلی روند (Trend) و تناوب (Seasonality) به تفصیل آموزش داده می‌شود. دانشجویان با استفاده از روش‌های گرافیکی و آماری در R، یاد می‌گیرند که چگونه یک سری زمانی را به این مؤلفه‌ها تجزیه کرده و ویژگی‌های هر بخش را به صورت جداگانه تحلیل کنند.
10 جلسه 10: تحلیل سری‌های زمانی (بخش دوم): شناسایی روند و نقاط تغییر: در ادامه بحث سری‌های زمانی، این جلسه بر شناسایی روند و نقاط تغییر ناگهانی (Change-Points) به عنوان یکی از جنبه‌های کلیدی مطالعات تغییر اقلیم متمرکز است. آزمون‌های ناپارامتری قدرتمند مانند آزمون من-کندال و برآوردگر شیب سن با استفاده از پکیج تخصصی trend در R آموزش داده می‌شوند. این پکیج ابزارهای جامعی برای تشخیص روند، شناسایی نقاط تغییر (مانند آزمونPettitt) و ارزیابی تصادفی بودن داده‌ها فراهم کرده و کاربرد آن در تحلیل روندهای دمایی و بارشی به صورت عملی نمایش داده می‌شود.
11 جلسه 11: مدل‌های پیش‌بینی (بخش اول): مدل‌های قطعی و تصادفی (زنجیره مارکف): این جلسه با تشریح تفاوت بین مدل‌های قطعی (Deterministic) و تصادفی (Stochastic) می پردازد. زنجیره مارکف به عنوان یک مدل تصادفی ساده و قدرتمند برای مدل‌سازی سیستم‌هایی با حالت‌های متغیر (مانند روزهای بارانی و خشک) معرفی می‌گردد. مفاهیم کلیدی آن شامل ماتریس احتمال انتقال و حالت پایدار، با مثال‌های اقلیم‌شناسی آموزش داده خواهد شد تا پایه‌ای برای درک مدل‌های پیچیده‌تر فراهم آید.
12 جلسه 12: مدل‌های پیش‌بینی (بخش دوم): مدل‌های آشوبمند و درستی سنجی پیش‌بینی/پیش‌نگری: این جلسه به بررسی مدل‌های پیچیده‌تر مبتنی بر تئوری آشوب (Chaos Theory) برای توصیف سیستم‌های دینامیکی غیرخطی مانند اتمسفر می‌پردازد. بخش مهم دیگر به درستی سنجی و ارزیابی کیفیت مدل‌های پیش‌بینی/پیش‌نگری اختصاص دارد. برای این منظور، از پکیج استاندارد و متن-باز s2dverification در R استفاده خواهد شد که مجموعه‌ای از معیارهای پیشرفته ارزیابی (Verification Scores) را برای سنجش مهارت (Skill) و کیفیت یک سیستم پیش‌بینی/پیش‌نگری فراهم می‌کند.
13 جلسه 13: تدوین مدل‌های شناسایی اقلیم مکان (تحلیل خوشه‌ای): هدف این جلسه، طبقه‌بندی یا پهنه‌بندی اقلیمی بر اساس داده‌های چند متغیره است. روش‌های تحلیل خوشه‌ای ( Cluster Analysis) مانند الگوریتم‌های سلسله‌مراتبی و تفکیکی (K-means) به عنوان ابزاری برای گروه‌بندی مکان‌های با ویژگی‌های اقلیمی مشابه، به تفصیل آموزش داده خواهند شد. دانشجویان یاد می‌گیرند که چگونه با استفاده از داده‌های چند متغیره اقلیمی، پهنه‌های اقلیمی همگن را شناسایی کرده و نتایج را بر روی نقشه به تصویر بکشند.
14 جلسه 14: کاربرد عملی برنامه‌نویسی در تحلیل‌های آماری اقلیمی: این جلسه با هدف توسعه مهارت‌های برنامه‌نویسی، بر خودکارسازی تحلیل‌های آماری و پیاده‌سازی الگوریتم‌های سفارشی متمرکز است. مفاهیم مهمی مانند نوشتن توابع، استفاده از حلقه‌ها برای افزایش کارایی کد در R آموزش داده می‌شود. دانشجویان یک تحلیل کامل آماری را در قالب یک اسکریپت قابل تکرار (Reproducible Script) پیاده‌سازی کنند که مهارتی ضروری برای انجام تحقیقات مدرن و شفاف است.
15 جلسه 15: ارائه پروژه‌های عملی و کار با نرم‌افزارهای تحلیل آماری: این جلسه به ارائه پروژه‌های نهایی دانشجویان اختصاص دارد که طی آن، یک مجموعه داده اقلیمی واقعی را با استفاده از تکنیک‌های آموخته شده تحلیل و نتایج را ارائه می‌دهند. این جلسه فرصتی برای اشتراک تجربه و یادگیری از یکدیگر است. همچنین، زمان کوتاهی به مرور سریع سایر نرم‌افزارهای تخصصی مانند پایتون (با کتابخانه‌های Pandas, SciPy, xarray) و GIS و جایگاه آن‌ها در کنار R اختصاص می‌یابد.
16 جلسه 16: جمع‌بندی نهایی، مرور کلی مطالب و رفع اشکال: جلسه پایانی به مرور نظام‌مند تمامی مفاهیم و تکنیک‌های تدریس شده اختصاص دارد و یک نقشه راه مفهومی برای درک ارتباط بین روش‌های مختلف آماری ارائه می‌شود. بخش قابل توجهی از این جلسه به پرسش و پاسخ و رفع اشکالات باقی‌مانده دانشجویان اختصاص خواهد.