کتاب های مرتبط
آمار فضایی (تحلیل داده های مکانی) تالیف دکتر سعید جوی زاده
آمار فضایی یکی از شاخههای آمار است که بر تحلیل دادههایی با ویژگیهای فضایی یا جغرافیایی تمرکز دارد. این شاخه شامل مطالعه الگوها، روابط و تغییرپذیری دادهها در فضا، همچنین توسعه روشهای آماری برای تحلیل و مدلسازی دادههای فضایی است.
آمار فضایی در زمینههای گستردهای از جمله جغرافیا، اکولوژی، اپیدمیولوژی، بهداشت عمومی، کشاورزی و برنامهریزی شهری استفاده میشود. این شاخه به پژوهشگران و عملکردکنندگان کمک میکند تا الگوها و روابط فضایی را درک کنند، مناطق داغ و خوشههای رویدادها یا پدیدهها را شناسایی کنند و پیشبینیهایی درباره روندهای آینده بدهند.
یکی از چالشهای اصلی در آمار فضایی، مقابله با خودهمبستگی فضایی ذاتی دادهها است که بدین معنا است که مشاهداتی که در نزدیکی یکدیگر در فضا هستند، احتمالاً شبیهتر از مشاهداتی هستند که دورتر از هم هستند. این مسئله باور استقلالی که برای بسیاری از روشهای آماری لازم است نقض میکند و به تکنیکهای ویژهای برای محاسبه وابستگی فضایی نیاز دارد.
روشهای متداولی که در آمار فضایی استفاده میشوند شامل تحلیل خودهمبستگی فضایی، تحلیل رگرسیون فضایی، ژئواستاتیستیک و تحلیل الگوی نقطهای فضایی است. تحلیل خودهمبستگی فضایی شامل اندازهگیری درجه شباهت بین مشاهدات همسایه است و میتواند به شناسایی الگوهای فضایی در دادهها کمک کند. تحلیل رگرسیون فضایی برای مدل کردن رابطه بین متغیر وابسته و یک یا چند متغیر مستقل استفاده میشود، در حالی که وابستگی فضایی را در نظر میگیرد.
آمار فضایی شاخهای از علم آمار است که درباره پدیدههای وابسته به مکان بحث میکند؛ بنابراین در سالهای اخیر توجه زیادی به تحلیل دادههای فضایی شده است. دادههایی که نیازمند فنون منحصر به فرد خود میباشند و با فنون دادههای غیر فضایی تفاوت دارند. این گونه تحلیلها میتواند
عرصههای وسیعی در زمینه تحقیقاتی و پژوهشی بر روی دانشجویان، پژوهشگران، برنامهریزان و تحلیلگران بگشاید. از آن جا که در بسیاری از تحقیقات علمی، توجه به مکان از اهمیت بهسزایی برخوردار است در نتیجه آمار فضایی در بسیاری از رشتهها کاربرد دارد. پیشرفتهای ایجاد شده در زمینه جمعآوری و پردازش دادههای فضایی امکان کاربرد آمار فضایی را بیش از پیش گسترش داده است (عسکری، 1390). در این فصل به اختصار به آمار فضایی و کاربردهای آن اشاره میشود.
آمار فضایی یکی از شاخههای آمار است که به تجزیه و تحلیل و تفسیر دادههای فضایی میپردازد. این شاخه چندرشتهای است که از تکنیکهای ریاضی، آمار، جغرافیا و علوم کامپیوتر برای مطالعه الگوها، روابط و فرآیندهای فضایی استفاده میکند. آمار فضایی به خصوص در زمینههایی مانند علوم محیطی، اکولوژی، اپیدمیولوژی، برنامهریزی شهری و حمل و نقل، مفید است.
مفاهیم کلیدی در آمار فضایی شامل:
- دادههای فضایی: دادههای فضایی یا جغرافیایی به دادههایی اطلاق میشود که شامل جنبه فضایی یا جغرافیایی هستند. این دادهها میتوانند به صورت نقاط، خطوط، چندضلعیها یا شبکههای raster نمایش داده شوند. فرمتهای معمول دادههای فضایی شامل shapefiles، GeoJSON و فایلهای raster هستند.
- خودهمبستگی فضایی: خودهمبستگی فضایی یک معیار برای اندازهگیری درجه همبستگی متغیر با خودش در فضا است. این مفهوم در آمار فضایی بسیار مهم است زیرا به شناسایی الگوهای فضایی کمک میکند و مشخص میکند که الگوهای مشاهده شده تصادفی هستند یا دارای ساختار فضایی هستند.
- وابستگی فضایی: وابستگی فضایی به تمایل مشاهدات نزدیک به هم در فضا برای شباهت بیشتر نسبت به مشاهداتی است که دورتر هستند. این مفهوم به طور مستقیم با خودهمبستگی فضایی مرتبط است و در مدلسازی دادههای فضایی به عنوان یک معیار مهم در نظر گرفته میشود.
- تخمین فضایی: تخمین فضایی یک تکنیک است که برای تخمین مقادیر یک متغیر در مکانهایی که مشاهده نشدهاند، بر اساس مقادیر مشاهده شده در مکانهای نزدیک استفاده میشود. روشهای معمول تخمین فضایی شامل inverse distance weighting (IDW)، kriging و spline interpolation هستند.
- رگرسیون فضایی: رگرسیون فضایی یک مجموعه از روشهای آماری است که برای مدلسازی رابطه بین یک متغیر و یک یا چند متغیر مستقل با در نظر گرفتن وابستگی فضایی استفاده میشود. مدلهای رگرسیون فضایی به دو دسته اصلی مدلهای فضایی با تاخیر و مدلهای خطای فضایی تقسیم میشوند.
- ژئواستاتیستیک: ژئواستاتیستیک یک زیرشاخه از آمار فضایی است که بر روی تحلیل و مدلسازی دادههای پیوسته فضایی مانند ارتفاع، دما یا ویژگیهای خاک تمرکز دارد. تکنیکهای کلیدی در ژئواستاتیستیک شامل تجزیه و تحلیل واریوگرام و کریجینگ هستند.
- تحلیل الگوی نقطهای: تحلیل الگوی نقطهای مجموعهای از تکنیکهایی است که برای مطالعه توزیع فضایی نقاط مانند موقعیت درختان، ساختمانها یا موارد بیماری استفاده میشود. روشهای معمول تحلیل الگوی نقطهای شامل تحلیل همسایگی نزدیکترین نقطه، Ripley's K-function و تخمین چگالی هستند.
- خوشهبندی فضایی: خوشهبندی فضایی به شناسایی گروهها یا خوشههایی از مشاهدات اشاره دارد که بیشتر به یکدیگر شبیه هستند تا به مشاهدات در گروههای دیگر. تکنیکهای خوشهبندی فضایی شامل خوشهبندی سلسله مراتبی، خوشهبندی k-means و آمار جدید Getis-Ord Gi* هستند.
- وزنهای فضایی: وزنهای فضایی برای نمایش روابط فضایی بین مشاهدات در مجموعه داده استفاده میشوند. آنها ممکن است بر اساس فاصله، همسایگی یا معیارهای دیگر مبتنی بر فضا باشند و در روشهای آمار فضایی مختلفی مانند خودهمبستگی فضایی و رگرسیون فضایی استفاده میشوند.
- نرمافزار تحلیل فضایی: چندین بسته نرمافزاری و زبان برنامهنویسی وجود دارد که آمار فضایی را پشتیبانی میکنند، از جمله R، Python، ArcGIS، QGIS و GeoDa.
درباره نویسنده کتاب آمار فضایی دکتر سعید جوی زاده :
دکتر سعید جوی زاده، متخصص آمار فضایی و سیستم های اطلاعات جغرافیایی، با بیش از 15 سال سابقه تدریس و تحقیق در این حوزه، یکی از اساتید برجسته در زمینه آمار فضایی در ایران است. او دارای مدرک دکترای از دانشگاه خوارزمی و مدرک کارشناسی ارشد سیستم های اطلاعات جغرافیایی از دانشگاهخوارزمی است.
دکتر جوی زاده نویسنده کتابهای مرتبط با آمار فضایی است و در تدریس در دانشگاهها و برگزاری کارگاهها و سمینارهای آموزشی در زمینه آمار فضایی و نرم افزارهای مربوطه فعالیت دارد. همچنین، او با مسلط بودن به نرم افزارهای arcgis، ENVI، Erdas، Geoda، Arcgis pro و qgis، توانسته است تجربیات خود را در این زمینه به دانشجویان و پژوهشگران انتقال دهد.
دکتر جوی زاده به عنوان یکی از افراد فعال در حوزه آمار فضایی در ایران، هر ساله کارگاه ها و سمینار های فراوانی را برای دانشجویان ایرانی برگزار می کند و به ارائه راهکارهای عملی و کاربردی در این زمینه می پردازد. در کل، دکتر سعید جوی زاده با تلاش و پشتکار خود، موفق به ایجاد تأثیر قابل توجهی در حوزه آمار فضایی و سیستم های اطلاعات جغرافیایی در ایران شده است.
1-2 تاریخچه علم آمار
میتوان منشأ ظهور آمار به صورت توصیف اطلاعات را به سرشماریهایی که حدود 4000 سال قبل از میلاد مسیح توسط بابلیها و مصریها و بعداً توسط امپراتوریهای روم و ایران درباره اطلاعات مربوط به زاد و ولد و دارائیهای افراد زیر سلطه خود انجام میگرفته داشت. بدیهی است که این گونه سرشماریهای بسیار ابتدایی، که به هیچ رو با آمار امروز قابل مقایسه نیست بنای آمار کنونی را پیریزی و آغاز نموده است. در همین زمان بود که روشهایی برای
جمعآوری، تنظیم و تلخیص دادهها ابداع گردید.
آمار در قرن چهاردهم برای محاسبه نرخ بیمه، جمعآوری اطلاعات درباره تولد و وفات، تصادفات و حوادث رایج گردید. در اواسط قرن شانزدهم اولین کتاب احتمال توسط کاردن[1] با عنوان "بازیها و شانس" نوشته شد، او در این کتاب روشهای تقلب در بازیهای قمار را ارائه داد. به علاوه وی، موضوع پیشبینی در نتایج حاصل از انجام آزمایشها را مطرح نمود. یکی از کارهای او پیشبینی روز وفات خودش بود که برای اثبات صحت پیشبینی در آن روز خودکشی نمود. در اواسط قرن هفدهم پاسکال[2] و فرما[3] اولین کسانی بودند که مطالعه احتمال را به طور علمی شروع کردند. در همین سالها مطالعات آماری نیز به صورت توصیفی انجام میگرفت. مثلاً حس کنجکاوی صاحب فروشگاهی به نام گرونت[4] (1674-1620) وی را به مطالعه و تحلیل نشریه هفتگی کلیسا به نام سیاهه مرگ و میرکه حاوی فهرست تولدها، تعمیدها، مرگ و میرها و علل آنها بود کشاند. او نتایج و مشاهدات خود را در کتابی تحت عنوان مشاهدات طبیعی و غیرطبیعی بر اساس سیاهه مرگ و میر منتشر کرد. این نشریه اولین تفسیر واقعی از پدیده اجتماعی و بیولوژیکی بر اساس انبوهی از دادههای خام بود و بسیاری از دانشمندان تصور میکنند که این میتواند تولد جدیدی از علم آمار باشد. گرونت بر اساس نتایج مشاهدات به یک سازگاری شگفت انگیز بین حوادثی که به نظر میرسید تصادفاً اتفاق میافتند رسید. از این رو تغییرات پیشبینی یا درک برخی حقایق دنیایی که در آن زندگی میکنیم بسیار ارزشمند بودند (نوئل[5]، 1991). از دیگر کارهای دانشمندانی که در این قرن مشاهده شده میتوان به مطالعات مندل در مورد قانون وراثت، گالتون در بکارگیری همبستگی و ارتباط بین صفات و به ویژه فیشر در ابداع روشهای مختلف استنباط آماری اشاره نمود.
از طرفی با ظهور سرمایهداری و گسترش تجارت، آمار در معرض مسائل پیچیدهتری قرار
میگیرد و با افزایش حجم اطلاعات جمعآوری شده کارکردهای کارهای آماری توسعه مییابند. به طوری که آمار از نظر ماهیت عمیقتر، از نظر موضوع مورد مطالعه وسیعتر و از نظر وسائلی که به کار گرفته میشوند کاملتر میشود (فينبرگ[6]، 2014). از شروع قرن بیستم همه ساله روشهای متعددی برای جمعآوری، تجزیه و تحلیل اطلاعات ارائه گردیده که همچنان ادامه دارد.
1-3 مفهوم علم آمار
واژه آمار از کلمه لاتین "Status" سرچشمه ميگيرد و به معنی حالت، وضع یا موقعیت میباشد. از این کلمه به عنوان ریشه واژه "Statistica" (آمار) ياد ميشود. نقش اساسی آمار عبارت است از بیان و کاربردهای مدلهای تصادفی و استدلالهای آماری در برابر روشها و تفکر ریاضی محض (باتاچاریا[7] و همکاران، 1977). ریاضی بر پایه نظریه اعداد، هندسی اقلیدسی و جبر از چند قرن پیش همواره مورد توجه و احترام دانشمندان و فلاسفه بوده و میباشد؛ اما موضوع آمار، هنر و علم جمعآوری، تعبیر و تجزیه و تحلیل دادهها و استخراج تصمیمهای منطقی میباشد (ريچارد[8]، 2012). در مورد پدیدههای مورد بررسی و با توجه به مراحل اساسی یک تحقیق علمی، آشکار است که آمار در قلمرو تمامی تحقیقات علمی به کار میرود. به طور خلاصه آمار به دلیل نیازهایی مانند توصیف وضع کنونی، مقایسه وضع کنونی و گذشته، پیشبینی وضع آینده، یافتن نقاط ضعف و قوت جامعه و سنجش ارتباطات و رابطه متغیرها به وجود آمده است. آمار به دو شاخه کلی آمار فضایی[9] (مکانی) و آمار کلاسیک[10] تقسیم میشود.
1-4 مفهوم آمار کلاسیک
در آمار کلاسیک فرض بر این است که مشاهدات در شرایط یکسان و به صورت مستقل از هم جمعآوری شدهاند. به عبارتی هر آزمایش از آزمایشهای قبلی و بعدی مستقل است. از سوی دیگر تکرار آزمایش در هر مرحله نیز امکانپذیر است. این دو ویژگی اساس تعریف متغیر تصادفی است. در آمار کلاسیک استقلال متغیرها به صورت زیر تعریف میشود:
1-5 مفهوم آمار فضایی
آمار فضایی شاخهای از آمار است که درباره پدیدههای وابسته به مکان بحث میکند. در آمار فضایی معمولاً انتظار میرود بین پدیدههای مجاور رابطه نسبتاً قابل توجهی وجود داشته باشد (مارتينز[11] و همکاران، 2016). این شاخه از آمار میکوشد تا بین مقادیر مختلف یک متغیر، فاصله و جهتگیري آنها ارتباط برقرار کند. این ارتباط فضایی، ساختار فضایی[12] نام دارد. موقعیت مکانی، تأثیرپذیری مکانی و به کارگیری نقشه از موضوعات مهم در آمار فضایی محسوب میشود. در اين جا به طور مختصر به توضيح اين موارد پرداخته میشود.
1-5-1 موقعیت مکانی
موقعیت مکانی هر نقطه روی کره زمین به صورت مختصات جغرافیایی برحسب درجه و دقیقه بیان میشود که بر مبنای هندسه کروی استوار است. در اين حالت موقعيت هر نقطه بر روي کره زمين نسبت به خط استوا (عرض جغرافيايي) و نصفالنهار گرينويچ (طول جغرافيايي) مشخص ميشود. روش دیگر ارائه موقعیت مکانی هر نقطه روی سطح دوبعدی، سیستم مختصات دکارتی است. برای تصویر سطح کره زمین بر روی سطح کاغذ از سیستم تصویر مرکاتور جانبی جهانی[13] استفاده میشود که متریک است و طول و عرض هر نقطه جغرافیایی را در مختصات دکارتی به صورت و نمایش میدهد. در اين سیستم کره زمین به 60 نوار عمودی یا منطقه هریک به طول 6 درجه تقسیم میشود. محدوده شمالی این سیستم عرض جغرافیایی 84 درجه و محدوده جنوبی آن تا درجه 80 میباشد. برای مناطق بالاتر و پایینتر از این عرضها، از سیستم تصویر صفحهای تحت عنوان سیستم استریوگرافیک قطبی جهانی استفاده میشود. هر کدام از نوارهای 60 گانه با یک عدد مشخص میشود. به نوار بین 174 تا 180 درجه عدد یک را اختصاص میدهند و هر چه به سمت شرق جلو برویم اعداد افزایش پیدا میکند. بنابرا؛ منطقه 31 دارای طول صفر تا 6 درجه شرقی است. ایران نیز در منطقههای 38، 39، 40 و 41 قرار گرفته است (محمدزاده، 1394).
با توجه به این که در آمار فضایی موقعیت مکانی هر نقطه به صورت مختصات دکارتی در نظر گرفته میشود، لازم است تا موقعیت جغرافیایی مشاهدات با استفاده از سیستم به مختصات دکارتی تبدیل شود. لازم به ذکر است که مختصات جدید موقعیت دادههای واقع در یک ناحیه در سیستم تبدیل ، با تعیین فاصله هر موقعیت از وسط آن ناحیه ( محل (اطع خط استوا با نصفالنهار میانی ناحیه) محاسبه شود. بناب؛ ین استفاده از این سیستم برای دادههایی که در نواحی مختلف قرار دارند، صحیح نیست. در این گونه موارد از سیستم لامبرت استفاده میشود که مبدأ سنجش فاصله موقعیتها را یک نقطه دلخواه (به طور مثال تقاطع خط استوا با نصفالنهار گرینویچ) فرض میکند و فاصله هر موقعیت از آن نقطه را ارائه میدهد (محمدزاده،1394).
1-5-2 تأثیرپذیری مکانی
مطالعهی تأثیرپذیری یک مکان از مکانهای دیگر در آمار فضايي اهميت زيادي دارد. مطالعه تأثيرپذيري مکاني دارای سابقه بسیار طولانی است که به کارهای کری[14] (1858)، رونستین[15] (1885)، ریلی[16] (1929)، زیپف[17] (1949) و استورت و وارنتز[18] (1958) باز میگردد. در واقع سنگ بنای تأثیرپذیری مکانی به معادله معروف نیوتن ( ) برمیگردد که در آن و سنجشی از جرم در مکان 1 و 2 و فاصله بین جرمها است. این قانون فیزیک که توسط نظریهپردازان مکانی اصلاح شده، برای مطالعه و پیشبینی انواع گستردهای از تأثیرپذیری مکانی مانند حمل و نقل، انتشار اطلاعات، رشد اقتصادی و ... مورد استفاده قرار گرفته است. ویلسون[19] (1967) به جای وابستگی به قیاسهای علم فیزیک، قانون احتمالاتی را تدبیر کرد. از جمله تأثيرپذيريهاي مکاني موجود در طبيعت، تأثير ساختارها و پديدههاي زمينشناسي بر یکديگر ميباشد. براي نمونه گنبدهاي نمکي که در برخي از مناطق زاگرس رخنمون پيدا کردهاند با تأثير بر روي آبهاي زيرزميني اطراف باعث شور شدن و غير قابل استفاده شدن آنها ميشوند. يکی از پارامترهايي که با استفاده از آن میتوان کیفیت عمومی آب را مورد بررسی قرار داد، پارامتر هدایت الکتريکي [20] است که تابع مستقیم املاح موجود در آب ميباشد و با افزايش شوري بر مقدار آن افزوده ميشود. نقشه زير نشاندهنده تغييرات هدايت الکتريکي آبهاي زيرزميني دشت داراب (استان فارس) است که با درونيابي مقادير هدايت الکتريکي تعدادي از چاههاي موجود در اين دشت به دست آمده است. همانگونه که ملاحظه ميشود مکان قرارگيري گنبد نمکي در شمال دشت بر روي کیفيت آب زيرزميني تأثيرگذار است و باعث افزايش شوري آن شده است.
[1] Kardon
[2] Pascal
[3] Fermat
[4] Grunt
[5] Noel
[6] Fienberg
[7] Bhattacharyya
[8] Richard
[9] Spatial Statistics
[10] Classic Statistics
[11] Martinez
[12] Spatial Structure
[13] Universal Transverse Mercator
[14] Carey
[15] Ravenstein
[16] Reilly
[17] Zipf
[18] Stewart and Warntz
[19] Wilson
[20] Electrical Conductivity
Reviews