انتخاب صفحه

فهرست مطالب
فصل 1 مقدمه

در زندگی امروزی داشتن اطلاعات به‌روز، یک برتری بزرگ به شمار می‌آید که به تصمیم‌گیری درست و زندگی بهتر در جوامع انسانی منجر می‌شود. یکی از مهم‌تر ین اطلاعات، نقشه‌های به‌روز پوشش اراضی است که برای تصمیم‌گیری صحیح و مدیریت و برنامه‌ریزی آگاهانه برای مدیران (شهری) مورد نیاز است.
سنجش از دور یک منبع غنی برای تولید بسیاری از اطلاعات مکانی و محیطی است و یکی از بنیادی‌ترین اطلاعاتی که تولید می‌کند نقشه‌های پوشش اراضی است . اطلاعات پوشش اراضی برای تولید نقشه‌های کاربری اراضی، مطالعه تغییرات محیطی و برقراری ارتباط بین عوامل انسانی مختلف و متغیرهای فیزیکی محیط مورد استفاده قرار می‌گیرد. برای تولید نقشه‌های پوشش اراضی ابتدا بایستی این اطلاعات از تصاویر ماهواره‌ای و داده‌های دیگر استخراج شود. تفسیر بصری و الگوریتم‌های یادگیری ماشینی دو روش متداول برای استخراج اطلاعات از تصاویر ماهواره‌های و داده‌های سنجش از دور است، که هر یک دارای مزایا و معایبی می‌باشند. در برخی موارد استخراج اطلاعات از تصاویر ماهواره‌ای و هوایی توسط عامل انسانی نتایج مطلوب‌تری نسبت به روش‌های خودکار یا نیمه ‌خودکار تولید می‌کند. اما در جوامع امروزی تولید اطلاعات توسط عامل انسانی و به روش‌های سنتی دیگر پاسخگوی نیازهای موجود نیست و لازم است روش‌های خودکار و عاری از دخالت انسان توسعه داده شود. در این راستا پیوسته الگوریتم‌های یادگیری جدیدتری توسعه داده می‌شود تا این نیاز را برطرف سازد. در زمینه استخراج اطلاعات از تصاویر سنجش از دور به روش سنتی، مسائلی که بایستی مورد توجه واقع شود عبارت‌اند از: 1- حجم زیاد و رشد سریع داده‌ها و تصاویر در سنجش از دور، 2- زمان‌بر بودن استخراج اطلاعات توسط انسان و از طرف دیگر 3- پیچیدگی عوارض برای تفسیر بصری و استخراج به وسیله چشم ممکن است باعث خطا ‌گردد و در برخی موارد نیز استخراج اطلاعات به این روش غیرممکن می‌شود. راه‌حل این مسئله استفاده از الگوریتم‌های یادگیری ماشینی است که هدف نهایی آن‌ها استخراج اطلاعات بدون دخالت انسان است . مهم‌تر ین کاری که الگوریتم‌های یادگیری ماشینی در سنجش از دور انجام می‌دهند طبقه‌بندی داده‌ها به کلاس‌های اطلاعاتی است. الگوریتم‌های یادگیری ماشینی متداول در سنجش از دور مثل روش‌های طبقه‌بندی بیشینه شباهت (MLC )، ماشین بردار پشتیبان (SVM ) و شبکه‌های عصبی مصنوعی (ANN ) دارای مشکلاتی مثل 1- نیازمندی به داده‌های آموزشی زیاد و بدون خطا، 2- نیازمندی به تعیین بهینه و صحیح پارامترهای آغازکننده، 3- محاسبات زیاد و 4- دقت پایین در استخراج اطلاعات هستند. جنگل تصادفی (RF ) یک الگوریتم یادگیری ماشینی جدید است که با ترکیب طبقه‌بندی‌کننده‌های درختی نتایج رضایت‌بخشی را در طبقه‌بندی تولید می‌کند هم‌چنین استفاده از این روش می‌تواند برخی از مشکلات مطرح در الگوریتم‌های قبلی را رفع کند.
ارزش اطلاعاتی یک تصویر بیشتر از هزار کلمه است. سنجش از دور تصاویری با اطلاعات گوناگون از محیط را در اختیار ما قرار می‌دهد. همان ‌طور که گفته شد می‌توان با طبقه‌بندی تصاویر به این اطلاعات دست یافت. در بیشتر موارد در طبقه‌بندی تصاویر از روش‌های پیکسل-مبنا استفاده می‌شود. این روش‌ها پیکسل‌های تصویر را بر اساس اطلاعات عددی آن‌ها طبقه‌بندی می‌کنند. اما معمولاً عوارضی که در اکثر موارد در یک تصویر به دنبال آن هستیم، تک ‌پیکسلی نیستند بلکه به صورت مجموعه‌ای از پیکسل‌ها یا یک شی هستند. لذا در این تحقیق نیز با توجه به این که هدف طبقه‌بندی پوشش اراضی است و عوارض نهایی مورد نظر، تک ‌پیکسلی نیستند، ابتدا یک قطعه‌بندی روی تصویر انجام می‌شود تا اشیا تصویری تولید شوند و سپس این اشیا با توجه به ویژگی‌هایی که دارند طبقه‌بندی می‌شوند تا کلاس‌های اطلاعاتی پوشش اراضی را ارائه دهند.

1-1 پیشگفتار…………………………………………………………………… 2
1-2 ضرورت‌ها، انگیزه‌ها و ویژگی‌های تحقیق………………………………. 4
1-3 اهداف و سؤالات تحقیق………………………………………………….. 5
1-4 روش تحقیق……………………………………………………………… 6
1-5 معرفی اختصاری سایر فصول…………………………………………… 7

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فصل 2 مروری بر تحقیقات پیشین

در این فصل رویکردهای طبقه‌بندی پوشش اراضی، به خصوص نواحی شهری با استفاده از تصاویر ماهواره‌ای مرور شده است. در بخش ‏2-2 روش‌های متفاوت طبقه‌بندی پوشش اراضی در زمینه سنجش از دور ارائه شده است. بخش ‏2-3 نیز فن‌های انتخاب ویژگی را با مقایسه روش‌های متفاوت مرور می‌کند. در بخش ‏2-4 به مرور چند روش مهم انتخاب و کاهش باند پرداخته شده است. در نهایت در بخش ‏2-5 خلاصه‌ای از مطالب فصل آورده شده است.
عموماً رویکردهای طبقه‌بندی تصویر با عناوین نظارت‌شده و نظارت‌نشده؛ یا پارامتریک و غیرپارامتریک؛ یا سخت و نرم (فازی)؛ یا پیکسلی (شامل روش‌های پیکسل-مبنا که در آن بر روی تک-پیکس‌ها آنالیز و تحلیل انجام می‌شود و شی-گرا یا شی-مبنا که بر روی گروهی از پیکسل‌ها که در این روش‌ها نماینده یک قطعه از تصویر هستند، تحلیل صورت می‌گیرد)، زیرپیکسلی، و پارسلی دسته‌بندی می‌شوند (Lu and Weng, 2007).
در ادامه تعدادی از مهم‌تر ین روش‌ها و تحقیقات انجام‌گرفته جهت طبقه‌بندی پوشش اراضی؛ روش‌های نظارت‌شده و نظارت‌نشده طبقه‌بندی پیکسل-مبنا؛ روش‌ طبقه‌بندی شی‌گرا؛ فن‌های طبقه‌بندی دانش-پایه؛ فن‌های پیشرفته بهبود طبقه‌بندی و روش‌های انتخاب و کاهش فضای ویژگی مرور شده است.
2-2 مروری بر روش‌های طبقه‌بندی پوشش اراضی
در دهه‌های اخیر، تحقیقات قابل‌توجهی برای بهبود عملکرد طبقه‌بندی پوشش اراضی در سه ناحیه اصلی صورت گرفته است: (1) توسعه و به‌کارگیری روش‌های طبقه‌بندی پیشرفته؛ (2) استفاده از چندین ویژگی داده‌های سنجش از دور، شامل ویژگی‌های بافت و تلفیق داده سنسورهای مختلف؛ (3) و کاهش افزونگی داده (Lu and Weng, 2007, Lu et al., 2007). بنابراین، تمرکز اصلی این بخش، به‌کارگیری یک طبقه‌بندی‌کننده مناسب به عنوان رویکرد استخراج و انتخاب ویژگی مناسب است .
به طور کلی، رویکردهای طبقه‌بندی پوشش اراضی کاربری می‌تواند به عنوان طبقه‌بندی نظارت‌شده و نظارت‌نشده، یا پارامتریک و غیرپارامتریک، یا پیکسل-مبنا و شی-مبنا، یا سخت و نرم دسته‌بندی شوند. این بخش روش‌های طبقه‌بندی را به طبقه‌بندی شی-مبنا، پیکسل-مبنای نظارت‌نشده، پیکسل-مبنای نظارت‌شده، و دانش-پایه دسته‌بندی می‌کند (Lu and Weng, 2007).
2-2-1 فن‏های طبقه‏بندی شی‏گرا
یک طبقه‌بندی شی-مبنا (OBC ) از دو مرحله اصلی تشکیل می‌شود. نخست، قطعه‌بندی تصویر پیکسل‌ها را به صورت اشیا باهم‌ دیگر ادغام می‌کند. در این مرحله از قطعه‌بندی با یک مقیاس، حضور یک شی کلاسی؛ و اندازه یک شی را که نتیجه طبقه‌بندی را تحت تأثیر قرار می‌دهد، را تعیین می‌شود. سپس طبقه‌بندی بر مبنای اشیا (نه تک پیکسل‌ها) انجام می‌شود. ثابت شده که روش OBC قادر است عملکرد خوبی برای داده‌های چند-منبعی فراهم کند (Geneletti and Gorte, 2003, Benz et al., 2004, Gitas et al., 2004, Walter, 2004).
Zhou و Troy (2008) یک رویکرد طبقه‌بندی شی-مبنا برای تحلیل و توصیف ساختار صحنه شهری در سطح پارسل با استفاده از تصاویر هوایی با قدرت تفکیک مکانی بالا و داده لیدار به کار بردند (Zhou and Troy, 2008). یک شبکه سلسله‌مراتبی سه-سطحی برای طبقه‌بندی کلاس‌های مختلف در سطوح مختلف ایجاد شده بود. Hussaain و همکارانش (2011) یک طبقه‌بندی شی-گرا با استفاده از تصاویر نیم-متری GeoEye-1 و لیدار جهت طبقه‌بندی پوشش اراضی انجام دادند. در این تحقیق هر یک از کلاس‌ها به طور جداگانه و یک به یک طبقه‌بندی شد (Hussain et al., 2011). تحقیق ایشان نشان داد که تلفیق تصاویر نوری و داده لیدار نتایج قابل قبولی برای مناطق شهری متراکم تولید می‌کند. Meng و همکارانش. (2012) یک رویکرد برای تشخیص ساختمان از داده لیدار و تصاویر هوایی به منظور آنالیز کاربری اراضی ارائه دادند (Meng et al., 2012).
روش‌های OBC مزایایی برای طبقه‌بندی پوشش اراضی شهری با داده‌های سنجش از دور چندطیفی فراهم می‌کنند (Blaschke, 2010)، قطعه‌بندی تصویر در مرحله آغازی روش‌های OBC ممکن است پیکسل‌های مربوط به کلاس‌های مختلف را در یک کلاس گروه‌بندی کند که باعث کاهش صحت طبقه‌بندی می‌شود (Wang et al., 2004). علاوه بر این برای استفاده از روش‌های OBC جهت جستجوی تکراری پارامترهای قطعه‌بندی که اهمیت حیاتی در نتایج طبقه‌بندی نهایی دارند، بایستی دانش اولیه از محدوده مورد مطالعه در دست باشد.
2-2-2 فن‏های طبقه‏بندی نظارت‏نشده پیکسل-مبنا
روش‌های طبقه‌بندی نظارت‌نشده در چندین تحقیق در طبقه‌بندی پوشش اراضی پیاده‌سازی شده است (Koltunov and Ben‐Dor, 2001, Jiang et al., 2004, Shah et al., 2004). در این نوع طبقه‌بندی‌کننده‌ها، هیچ اطلاعات یا نمونه‌های آموزشی قبلی از کلاس‌ها استفاده نمی‌شود (Mather and Tso, 2009). تمام ورودی‌ها در تعدادی خوشه، بر اساس اطلاعات آماری طبیعی موجود در داده‌های سنجش از دور، طبقه‌بندی می‌شوند، و سپس خوشه‌ها توسط (فرد) تحلیل‌گر برچسب‌گذاری شده و باهم ادغام می‌گردند. معمول‌ترین طبقه‌بندی نظارت‌نشده به‌کار برده شده، روش آنالیز داده خود-سازمان‌دهنده (ISODATA) یا Iterative self-organizing data analysis (Ball and Hall, 1965) و الگوریتم خوشه‌بندی K-means (MacQueen, 1967) است . یک روش خوشه‌بندی نظارت‌نشده برای استخراج ساختمان از داده لیدار استفاده‌شده است (Hao et al., 2009).
با وجود مزیت طبقه‌بندی بدون نیاز به نمونه‌های آموزشی قبلی از کلاس‌ها، طبقه‌بندی‌کننده‌های نظارت¬نشده نیازمند انتخاب حد آستانه‌های صحیح برای تعیین انواع پوشش اراضی مختلف می‌باشند. عملکرد این روش¬ها به طور اصلی به تحلیل‌گر یا طبقه¬بندی¬کننده¬هایی که در ادامه خوشه‌بندی برای ادغام خوشه‌ها در کلاس‌های پوشش اراضی نهایی به کار برده می‌شوند، بستگی دارد. علاوه بر این، به‌کارگیری دانش دیگر درباره داده‌های سنجش از دور جهت مشارکت در طبقه‌بندی نظارت¬نشده برای بهبود بیشتر نتایج آسان نیست (Jain et al., 2000).
2-2-3 فن‏های طبقه‏بندی نظارت‏شده پیکسل-مبنا
اتخاذ روش¬های یادگیری ماشین از بازشناسی الگو و دید کامپیوتر یک کار تخصصی در زمینه طبقه‌بندی پوشش اراضی در نواحی شهری می¬باشد (Rottensteiner, 2010, Vatsavai et al., 2011). یادگیری ماشین شاخه¬ای از هوش مصنوعی می¬باشد و به طور کلی با طراحی و توسعه روش¬هایی که به کامپیوترها اجازه می¬دهد تا عملکرد خود را در کارها به وسیله یادگیری از تجربه¬ها بهینه کنند (Mitchell, 1997). قسمت اصلی¬ الگوریتم¬های یادگیری ماشین در زمینه سنجش از دور، به طبقه¬بندی نظارت¬شده که اغلب در طبقه¬بندی¬های پوشش اراضی به کار می¬رود تمرکز دارد و طرح کلی یک طبقه-بندی ساده را فراهم می¬کند تا بتواند به وسیله یادگیری از نمونه¬های آموزشی، اشیا را از صحنه¬های پیچیده به طور درست و سریع استخراج نماید. طبقه¬بندی¬کننده¬هایی که از نظریه بیز استفاده می‌کنند، یکی از فن‌های سنتی در طبقه¬بندی الگوها می¬باشند. طبقه¬بندی¬کننده¬های بیز، توابع چگالی احتمال خاصی را برای هر کلاس جهت محاسبه احتمالات مؤخر در نظر می¬گیرند. رویکرد طبقه‌بندی بیشینه شباهت (MLC )، که بر اساس قواعد بیز است، یکی از محبوب¬ترین طبقه¬بندی¬کننده¬های نظارت¬شده در زمینه سنجش از دور برای طبقه‌بندی پوشش اراضی می¬باشد (Bartels and Wei, 2006, Vatsavai et al., 2011). احتمالات مؤخر با استفاده از تابع چگالی احتمال برای هر کلاس و احتمالات مقدم که به احتمال وقوع هر کلاس در مجموعه داده مربوط می¬شوند، محاسبه می¬شوند. سپس یک پیکسل به کلاسی که دارای بالاترین احتمالات مؤخر مبتنی بر قانون بیشینه مؤخر ( MAP) باشد، منتسب می-شود، که ساده‌شده¬ترین مورد از قوانین بیز است . MLC بر اساس یک مدل توزیع گوسین می¬باشد که از داده¬های آموزشی برآورد می¬شود. برای این کار، تابع چگالی احتمال برای هر کلاس را می¬توان به وسیله مقدار میانگین و ماتریس کوریانس تولید کرد. با این وجود، عملکرد MLC به علت محاسبات بالا برای هر پیکسل، و صحت نتایج ضعیف به خصوص زمانی¬که تعداد نمونه¬های آموزشی محدود است، نمی¬تواند موثر و برتر باشد (Jin, 2012). روش MLC یک طبقه‌بندی‌کننده آماری یا پارامتریک است که در آن آگاهی از توزیع آماری داده الزامی است. برخلاف روش‌های آماری مثل MLC، روش‌های غیرپارامتریک، نیازی به دانستن توزیع آماری داده‌ها ندارند. در ادامه تعدادی از تحقیقات صورت گرفته به کمک طبقه‌بندی‌کننده‌های غیرپارامتریک مورد بررسی قرار گرفته است.
2-3 مروری بر روش‌های طبقه‌بندی جدید در سنجش از دور
در سال‌های اخیر الگوریتم‌های هوشمند مدرن، نقش مهمی در طبقه‌بندی داده‌های سنجش از دور داشتند. مهم‌تر ین الگوریتم‌های هوشمند عبارت‌اند از شبکه‌های عصبی مصنوعی (ANN )، ماشین‌های بردار پشتیبان (SVMs )، درخت تصمیم (DT ) و الگوریتم‌های ترکیبی یا گروهی که در این بخش تعدادی از کارهای انجام‌گرفته در سنجش از مرور شده است.
2-3-1 طبقه‌بندی با شبکه‌های عصبی مصنوعی
شبکه¬های عصبی ( NN) در بسیاری از کاربردهای سنجش از دور از جمله برای طبقه¬بندی تصاویر ابرطیفی (Ratle et al., 2010)، SAR (Bruzzone et al., 2004)، تصاویر با قدرت تفکیک بالا (Del Frate et al., 2007)، چندطیفی (Dixon and Candade, 2008)، و مجموعه داده چندمنبعی (Koetz et al., 2008) مورد ارزیابی واقع شده است. مطالعات قبلی نشان داده است که نتایج آن‌ها بهتر از MLC و یا حداقل شبیه به نتایج MLC و Spectral Angle Mapper (SAM) می¬باشد (Petropoulos et al., 2010). یک شبکه عصبی طبق Haykin، (1999)، عبارت است از یک پردازنده با توزیع موازی حجیم که از واحدهای پردازشی ساده با یک میل طبیعی برای ذخیره کردن دانش تجربی و در دسترس قرار دادن آن برای استفاده بعدی، تشکیل شده است (Haykin, 1999). هیچ پیش‌فرض توزیع آماری از داده نیز برای NN نیاز نمی¬باشد. در بین الگوریتم¬های بسیار شبکه عصبی، رویکردهایی که به طور گسترده برای طبقه¬بندی پوشش اراضی استفاده شده، عبارت‌اند از شبکه¬های پرسپترون چندلایه با پس¬انتشار خطا (MLP) (Murthy et al., 2003, Estep et al., 2004, Verbeke et al., 2004, Fuller, 2005)، شبکه¬های RBF [Foody, 2004a]، شبکه¬های ART (Muchoney and Strahler, 2002, Liu et al., 2004)، و شبکه¬های SOM (Nadir Kurnaz et al., 2005, Filippi and Jensen, 2006). با وجود این طبقه¬بندی¬کننده NN ممکن است در برخی از کاربردهای سنجش از دور به علت ساختار محاسباتی پیچیده و نیاز به داده آموزشی بیشتر، قابل استفاده نباشد (Mas and Flores, 2008). محدودیت دیگر شبکه¬های عصبی این است که راه دقیقی برای انتخاب بهینه پارامترهای آن وجود ندارد (Stathakis, 2009) و انتخاب لایه¬های پنهان و گره¬ها در هر لایه برای ساختار شبکه عصبی کار آسانی نیست (Mather and Tso, 2009).

2-1 مقدمه……………………………………………………………………. 10
2-2 مروری بر روش‌های طبقه‌بندی پوشش اراضی……………………… 10
2-2-1 فن‏های طبقه‏بندی شی‏گرا……………………………………………. 11
2-2-2 فن‏های طبقه‏بندی نظارت‏نشده پیکسل-مبنا……………………….. 12
2-2-3 فن‏های طبقه‏بندی نظارت‏شده پیکسل-مبنا …………………………12
2-3 مروری بر روش‌های طبقه‌بندی جدید در سنجش از دور…………… 13
2-3-1 طبقه‌بندی با شبکه‌های عصبی مصنوعی……………………….. 14
2-3-2 طبقه‌بندی با درختان تصمیم………………………………………. 15
2-3-3 طبقه‌بندی با روش‌های مبتنی بر ماشین بردار پشتیبان………. 15
2-3-4 فن‌های طبقه‌بندی دانش-پایه……………………………………. 17
2-3-5 طبقه‌بندی با الگوریتم‌های ترکیبی………………………………. 18
2-4 روش‌های انتخاب و کاهش فضای ویژگی…………………………. 21
2-5 خلاصه فصل ……………………………………………………………22

فصل 3 مفاهیم و روش‌ها

در این فصل، مفاهیم اصلی بازشناسی الگو برای طبقه‌بندی و قطعه‌بندی معرفی می‌شود. همچنین روش کار کلی طبقه¬بندی¬کننده¬های مبتنی بر SVM، ANN و RF ارائه می‌گردد. بخش ‏3-2 مفاهیم اصلی مورد استفاده در بازشناسی الگو را بیان می‌کند. در بخش ‏3-3 الگوریتم یادگیری متداول مثل درخت تصمیم، شبکه‌های عصبی، بیز و روش‌های مبتنی بر ماشین‌های بردار پشتیبان بررسی می‌گردد. در بخش ‏3-4 روش‌های مجموعه‌ای و در دو بخش دیگر بعد از آن روش‌های Boosting و Bagging توضیح داد شده است. بخش ‏3-6-3 نظریه¬های ساخت جنگل تصادفی، و معیار انتخاب ویژگی را توضیح می¬دهد. در بخش ‏3-7 قطعه‌بندی تصویر توضیح داده می‌شود. بخش ‏3-8 روش متداول ارزیابی دقت طبقه‌بندی را شرح می‌دهد. در انتها نیز خلاصه¬ای از مطالب فصل در بخش ‏3-9 ارائه می¬گردد. لازم به ذکر است که کلمات و اصطلاحات خاص به صورت پررنگ تایپ شده‌اند.
3-2 مفاهیم پایه
یکی از کارهای اصلی یادگیری ماشینی، بازشناسی الگو و داده کاوی، ساخت مدل‌های خوب از مجموعه داده ‌ها است. یک “مجموعه داده” به طور کلی از بردارهای ویژگی تشکیل می‌شود که هر بردار ویژگی توصیفی از یک شی با استفاده از مجموعه‌ای از ویژگی ‌ها است. تعداد ویژگی‌های یک مجموعه داده بُعد گفته می‌شود. به ویژگی‌ها، توصیفات ، به یک بردار ویژگی یک نمونه ‌، و گاهی به یک مجموعه داده یک الگو گفته می‌شود.
یک “مدل” معمولاً یا یک مدل پیش‌بینی‌کننده است یا ساختار داده است که می‌خواهیم از یک مجموعه داده آن را بسازیم یا کشف کنیم، مثل یک درخت تصمیم، یک شبکه عصبی، یک ماشین بردار پشتیبان و غیره. پروسه تولید مدل‌ها از داده، یادگیری یا آموزش گفته می‌شود که به وسیله یک الگوریتم یادگیری به دست می‌آید. روش متفاوتی برای یادگیری وجود دارد که از بین آن‌ها یادگیری نظارت‌شده و یادگیری نظارت‌نشده معمول‌تر هستند. در یادگیری نظارت‌شده هدف، پیش‌بینی یک ویژگی هدف بر روی نمونه‌های مجهول است و مدل آموزش داده شده، یک پیش‌بینی‌کننده گفته می‌شود. پیش‌بینی کننده معمولاً برای برچسب‌گذاری نمونه‌های مجهول استفاده می‌شود. اگر برچسب‌ها به صورت صریح (categorical) باشند این کار، طبقه‌بندی گفته می‌شود و به یادگیرنده یا پیش‌بینی‌کننده، طبقه‌بندی‌کننده گفته می‌شود؛ اگر برچسب‌ها به صورت عددی باشند، در این صورت به این کار، رگرسیون، و به یادگیرنده یا پیش‌بینی‌کننده، مدل رگرسیون برازش‌شده گفته می‌شود. برای هر دو مورد، پروسه آموزش ساخته شده بر روی مجموعه داده‌های حاوی اطلاعات برچسب‌ها، و نمونه‌ای با برچسب معلوم نیز یک مثال گفته می‌شود. یادگیری نظارت‌نشده از اطلاعات برچسب‌ها استفاده نمی‌کند و هدف آن کشف برخی توزیع‌های اطلاعاتی ذاتی در داده‌ها است. یک وظیفه متداول، خوشه‌بندی است که هدفش کشف ساختار خوشه‌ای داده‌های نقطه‌ای است (Zhou, 2012).
به طور اساسی “خوب” بودن یک مدل به توانایی آن در برآورده کردن نیازهای کاربر بستگی دارد. یک راهبرد متداول برای انتخاب مدل مناسب برای یک کاربرد خاص، ارزیابی و برآورد عملکرد مدل‌ها است. از آنجا که هدف اساسی یادگیری، تعمیم (یعنی توانایی تعمیم “دانش” یادگرفته شده از مجموعه‌های معلوم به مجموعه‌های مجهول) است بنابراین یک الگوریتم یادگیری خوب باید خطای تعمیم کوچک‌تری داشته باشد که خطای پیش‌بینی نیز گفته می‌شود. روش متداول برای ارزیابی این است که داده تستی که برچسب‌های ground-truth آن‌ها معلوم است طبقه‌بندی شود و خطای تست به عنوان برآوردی از خطای تعمیم در نظر گرفته شود. پروسه اعمال مدل بر روی داده استفاده نشده، تست کردن، گفته می‌شود. قبل از تست کردن، ممکن است لازم شود تا مدل پیکربندی شود، برای مثال جهت تنظیم پارامترهای مدل بایستی داده‌‌هایی با ground-truth معلوم استفاده می‌شود تا عملکرد مدل برای تنظیم پارامترها ارزیابی شود؛ به این کار، اعتبارسنجی و به داده استفاده‌شده به این منظور داده اعتبارسنجی گفته می‌شود. عموماً داده‌های تست نباید با داده‌های آموزشی و داده اعتبارسنجی دارای همپوشانی باشد؛ در غیر این صورت عملکرد برآورد شده بیش از حد خوش-بینانه می‌شود (Zhou, 2012)

یک شبکه عصبی

یک شبکه عصبی

3-1 مقدمه……………………………………………………………….. 25
3-2 مفاهیم پایه………………………………………………………….. 25
3-3 الگوریتم‌های یادگیری متداول……………………………………… 27
3-3-1 آنالیز جداسازی خطی…………………………………………… 27
3-3-2 درخت‌های تصمیم………………………………………………… 28
3-3-3 شبکه‌های عصبی……………………………………………….. 31
3-3-4 طبقه‌بندی‌کننده بیز ساده………………………………………. 33
3-3-5 روش‌های مبتنی بر ماشین‌های بردار پشتیبان و کرنل………. 34
3-4 روشهای دسته جمعی ……………………………………………..39
3-5 تقویت……………………………………………………………….. 41
3-6 روش Bagging ا……………………………………………………..42
3-6-1 دو الگوی گروهی………………………………………………… 42
3-6-2 الگوریتم Bagging ا………………………………………………..43
3-6-3 جنگل تصادفی…………………………………………………… 47
3-6-4 انتخاب ویژگی با کمک شاخص تعیین اهمیت ویژگی RF ا…..51
3-7 قطعه‌بندی تصویر …………………………………………………….53
3-7-1 قطعه‌بندی به روش چند رزولوشنه…………………………….. 54
3-7-2 روش برآورد مقیاس مناسب برای قطعه‌بندی تصویر………….. 58
3-8 برآورد دقت طبقه‌بندی……………………………………………… 59
3-8-1 ماتریس ابهام……………………………………………………. 60
3-9 خلاصه……………………………………………………………… 62

فصل 4 روش تحقیق و نتایج

در این فصل، روش کار برای این تحقیق ارائه می¬شود. در بخش ‏4-2 اطلاعاتی از مجموعه داده استفاده‌شده برای تحقیق ارائه می‌شود. بخش ‏4-3 روش کار را ارائه می‌کند که شامل روند کلی روش پیشنهادی، نحوه انتخاب باند با RF (بخش ‏4-3-1)، و قطعه‌بندی تصویر (بخش ‏4-3-2) است. در بخش ‏4-4 نتایج ارزیابی روش‌های به‌کار‌رفته ارائه شده است و در نهایت در بخش ‎0 خلاصه‌ای از مطالب فصل گفته شده است.
4-2 داده‌ها و منطقه مورد مطالعه
برای پیاده‌سازی و ارزیابی روش پیشنهادی از یک تصویر ابرطیفی با 144 باند و یک مدل رقومی سطح که از داده‌های لیدار تولید شده استفاده‌شده است. در شکل ‏4 1 و شکل ‏4 2 نمایی از داده‌های به کار برده شده نشان داده شده و مشخصات آن‌ها نیز در جدول ‏4 1 ارائه شده است. هر دو داده دارای قدرت تفکیک یکسان 5/2 متری است . همچنین هر دو داده قبلاً زمین مرجع و هم-مرجع شده‌اند و نیازی به تصحیحات هندسی و رادیومتریک ندارند. تصویر به‌کار‌رفته دارای 144 باند در ناحیه طیفی 380 نانومتر تا 1050 نانومتر است . داده لیدار توسط NCALM از فراز محوطه دانشگاه Houston و منطقه شهری اطراف آن در تاریخ 22 ژوئن 2012 میلادی در بازه زمانی 14:37:55 تا 15:38:10 اخذ شده است. داده ابرطیفی نیز در تاریخ 3 ژوئن 2012 میلادی در بازه زمانی 17:37:10 تا 17:39:50 از همان منطقه اخذ شده است. در لحظه تصویربرداری ارتفاع متوسط سنجنده لیدار در حدود 2000 فوت و ارتفاع متوسط سنجنده ابرطیفی حدود 5500 فوت بود.

4-1 مقدمه……………………………………………………………… 64
4-2 داده‌ها و منطقه مورد مطالعه……………………………………. 64
4-3 روش پیشنهادی تحقیق…………………………………………. 66
4-3-1 انتخاب باند با کمک شاخص اهمیت ویژگی RF ا……………69
4-3-2 قطعه‌بندی تصویر ابرطیفی……………………………………. 70
4-3-3 گروه‌های ویژگی………………………………………………. 71
4-3-4 طبقه‌بندی…………………………………………………….. 72
4-4 ارزیابی…………………………………………………………… 74
4-4-1 نتایج ارزیابی دقت کلی و ضریب کاپا……………………….. 74
4-4-2 ارزیابی زمانی روش‌های طبقه‌بندی……………………….. 79
4-4-3 نتایج طبقه‌بندی به تفکیک کلاس‌ها………………………. 80
4-4-4 ارزیابی بصری………………………………………………. 84
4-5 جمع‌بندی مطالب فصل……………………………………….. 88

برای دانلود رایگان قسمت های بیشتراز فایل به انتهای مطلب مراجعه کنید

فصل 5 نتیجه‌گیری و پیشنهادها

91
5-1 مقدمه………………………………………………………….. 91
5-2 خلاصه تحقیق…………………………………………………. 91
5-3 دستاوردهای تحقیق…………………………………………… 92
5-4 پیشنهادها……………………………………………………… 95
منابع………………………………………………………………….. 97

Abstract
Urban land cover classification is an important research subject in remote sensing community because of its ability to connect human elements with physical environments and to achieve better resource management. Requirement of up to date, correct and detailed knowledge of urban land cover information obtained from remote sensing data is felt increasingly among societies. Regarding recent advances in data, technology and remote sensing theories, the importance of this issue is highlighted. New advanced sensors, have a great potential in urban classification. However performance of traditional classification methods because of complex image interpretation is limited; and studying newer methods for solving this issue is necessary. On the other hand, new methods in pattern recognition like Random Forest (RF) as a novel machine learning algorithm has been interesting subject in image classification and pattern recognition field. In this research, a new method based on combination of object based and RF classification is proposed for an urban area. Then the obtained results are compared with conventional methods. Among pixel-based classification algorithms, RF showed the best overall accuracy (OA) about 82%.Among object-based classification methods, SVM and RF showed the best OAs about 79% and 77% respectively. With suggested method for classification of object-based features obtained from one level of multi resolution segmentation, overall accuracy was improved for RF method, from 75% to 76%, for SVM, from 75% to 78%, for Neural Networks, from 70% to 75% and for Maximum Likelihood, from 44% to 77%. This research shows that suggested method can improve the performance of land cover classification using satellite images.



بلافاصله بعد از پرداخت به ایمیلی که در مرحله بعد وارد میکنید ارسال میشود.


فایل pdf غیر قابل ویرایش

قیمت25000تومان

خرید فایل word

قیمت35000تومان