دانلود پایان نامه ارشد: ارتقاء وضوح تصویر رنگی از روی رشته ای از تصاویر وضوح پایین

:
استفاده از فیلمها و تصاویری با قدرت تفکیکپذیری بالا، در اکثر کاربردهای الکترونیکی مورد نیاز است. تمایل برای استفاده از تصاویری با وضوح بالا از دو زمینه اصلی نشات میگیرد: بهبود اطلاعات تصویری برای تفسیر انسان؛ و کمک به درک دستگاههای خودکار. وضوح تصویر، جزئیات موجود در تصویر را توصیف میکند. در وضوح بالاتر، جزئیات تصویر بیشتر است. وضوح یک تصویر دیجیتال را می‌توان در بسیاری از زمینه های مختلف طبقه بندی کرد: وضوح پیکسلی، وضوح فضایی، وضوح طیفی، وضوح زمانی و وضوح رادیومتری [1]. در این پایاننامه، مباحث در حوزهی وضوح فضایی مطرح میشود.
وضوح فضایی: یک تصویر دیجیتال از عناصر تصویر کوچکی به نام پیکسل ساخته شده است. وضوح فضایی، به تراکم پیکسلها در یک تصویر اشاره دارد و معیار سنجش آن پیکسل در واحد سطح است.
شکل 1-1 آزمون کلاسیک برای تعیین وضوح فضایی یک سیستم تصویربرداری را نشان می‌دهد. وضوح فضایی تصویر ابتدا توسط حسگرهای تصویربرداری و یا دستگاه اکتساب تصویر محدود میشود. در دوربین دیجیتال، تصویربرداری بر روی فیلم صورت نمی‌گیرد بلکه توسط یک حسگر حساس (دستگاه جفت‌کنندهی بار (CCD) [1] یا نیم‌رسانای اکسید فلزی مکمل (CMOS) [2] ) انجام می‌پذیرد. این حسگرها معمولاً در یک آرایه دو بعدی، برای گرفتن سیگنال تصویر دو بعدی مرتب شدهاند. در وهله اول، اندازه حسگر و یا به طور معادل تعداد عناصر حسگر به ازای هر واحد سطح، وضوح فضایی تصویر را تعیین میکند. حسگرها با تراکم بالاتر، وضوح فضایی بیشتری را برای سیستم تصویربرداری ممکن میسازد. سیستم تصویربرداری با آشکارسازهای ناکافی، تصاویری کم وضوح با اثرات بلوکی ایجاد میکند که ناشی از فرکانس پایین نمونه برداری فضایی است. تلاش‌های بسیاری جهت افزایش وضوح تصاویر دیجیتالی صورت گرفته است، که به دو بخش کلی نرم‌افزاری و سخت‌افزاری قابل تقسیم بندی می‌باشند.
در بخش سخت‌افزاری با هرچه غنیتر نمودن تعداد پیکسل‌های موجود بر روی حسگرهای دوربین‌های دیجیتالی در واحد سطح، می‌توان درجه تفکیک تصویر را افزایش داد. بعلاوه، با هرچه کوچکتر نمودن سلول‌های حسگرهای دوربین‌های دیجیتالی، مقدار نور مؤثر دریافت

شده توسط هر سلول، کاهش می‌یابد؛ البته می‌توان با ایجاد شبکه‌ای از عدسی‌های محدب بر روی لایه فوقانی سلول‌های حسگر، مقدار نور مؤثر دریافتی توسط هر سلول حسگر را افرایش داد. لیکن به دلیل وجود تعداد بسیار زیاد سلول‌های حسگر، نویز ضربه ای ناشی از قطع و وصل جریان در درون این شبکه سلولی، همچنان وجود داشته و عامل مؤثری جهت کاهش کیفیت تصویر نهایی می‌گردد[2].

در حالی که وضوح فضایی تصویر توسط حسگرهای تصویر محدود میشود، جزئیات تصویر (باندهای فرکانس بالا) نیز به دلیل تاری لنز (مرتبط با تابع نقطه گستر حسگر)، اثرات انحراف لنز، انکسار روزنه و تاری نوری با توجه به حرکت، محدود میشوند. بنابراین روش سخت‌افزاری جهت رسیدن به تصاویری با کیفیت و وضوح بالاتر، بسیار پرهزینه و عملاً تا حدی غیر ممکن می‌باشد و معمولاً نمی‌توان از حد معینی، بدلیل محدودیت‌های تکنیکی موجود در تکنولوژی ساخت مدارات مجتمع، فراتر رفت. علاوه بر هزینه، وضوح یک دوربین نظارتی نیز به علت سرعت دوربین و سخت افزار ذخیره سازی محدود شده است. در بعضی موارد دیگر مانند تصاویر ماهوارهای، استفاده از حسگرهای وضوح بالا به دلیل محدودیت‌های فیزیکی آن دشوار است.
استفاده از روش نرم‌افزاری، جهت پذیرش خرابیهای تصویر و استفاده از پردازش سیگنال در پس پردازش عکسهای گرفته شده، به منظور تعامل بین هزینههای محاسباتی با هزینههای سخت افزاری، مطرح می‌گردد. روشهای نرم افزاری از لحاظ اقتصادی مقرون به صرفه می‌باشد و امکان تولید تصویری با وضوح بالاتر توسط همان دوربین‌های تصویربرداری دیجیتالی کم وضوح را فراهم میآورد.
یکی از تکنیک‌های مطرح شده در بعد نرم‌افزاری، جهت افزایش کیفیت تصویر چه از لحاظ تعداد پیکسل‌ها و چه از لحاظ کاهش مقدار نویز، تکنیک فراتفکیک پذیری (SR)می‌باشد. این تکنیک از لحاظ نامگذاری بدلیل آنکه قادر خواهیم بود از محدوده توانایی سیستم تصویر برداری فراتر رویم، فرا تفکیک پذیری نامیده می‌شود، و عمدتا به دو گروه روشهای مبتنی بر یادگیری و روشهای مبتنی بر بازسازی چند فریمی تقسیم میشوند [4]. در روشهای مبتنی بر یادگیری، تنها از یک تصویر کم وضوح (LR) برای ایجاد تصویری با وضوح بالا (HR) استفاده میشود. این رویکرد، زیر گروهی از روش های یادگیری ماشین است. برخی از روشهای پیشنهادی در این حوزه در [10-4] آورده شده است. گروه بعدی، روشهای مبتنی بر بازسازی چندفریمی است که تمرکز ما در این پایان نامه بر روی این دسته از تکنیکها میباشد.
در تکنیک‌های فراتفکیکپذیری چند فریمی، تلفیق چندین تصویر با وضوح پائینتر باعث تولید تصویر نهایی با وضوح بالاتر می‌گردد. این فرآیند موجب بازسازی اجزای فرکانس بالا و حذف خرابیهایی که به علت تصویربرداری با دوربین کم وضوح ایجاد شده است، میشود. ایده اصلی در تکنیکهای فراتفکیک پذیری چند فریمی، ترکیب اطلاعات غیر زائد موجود در فریم‌های کم وضوح برای تولید یک تصویر با وضوح بالا است [3]. روشی که به طور تنگاتنگ باSR مرتبط است رویکرد درون‌یابی تصویر میباشد، که می‌تواند برای افزایش اندازه تصویر مورد استفاده قرار گیرد. اما، از آنجا که هیچ اطلاعات اضافی ایجاد نمیشود، کیفیت درون‌یابی تک تصویر با توجه به ماهیت بدحالت[4] مسئله، بسیار محدود است، و اجزای فرکانسی از دست رفته را نمیتواند بازیابی کند. اما در زمینه SR، مشاهدات متعدد کم وضوح برای بازسازی در دسترس هستند. اطلاعات غیر زائد موجود در این تصاویرکم وضوح، به طور معمول توسط جابجاییهای در حد کسری از واحد پیکسل، که بین این تصاویر اتفاق میافتد، ایجاد میشود. این جابجاییهای در حد کسری از واحد پیکسل ممکن است به دلیل حرکات غیر کنترل شده بین سیستم تصویربرداری و صحنه رخ دهد، به عنوان مثال، حرکت شی؛ و یا بعلت حرکات کنترل شده، مانند سیستم تصویربرداری ماهواره ای در مدار زمین که با سرعت و مسیر از پیش تعریف شده در حال حرکت است.
هر فریم کم وضوح، مشاهده اعوجاجی از صحنه واقعی است. فراتفکیکپذیری تنها در صورتی که حرکت در حد کسری از واحد پیکسل بین این فریم وضوح پایین وجود داشته باشد، امکان پذیر است. شکل 1-2 نمودار سادهای از توصیف ایده اولیه بازسازی SR را نشان میدهد. در فرآیند تصویربرداری، دوربین چندین فریم LR را از صحنهHR ضبط میکند. این تصاویر LR، نسبت به یکدیگر شیفتهای حد کسری از واحد پیکسل دارند و همچنین با نرخ پایین نمونهبرداری شدهاند. ساخت و ساز تکنیکهای SR چند فریمی، معکوس این فرآیند است؛ همترازی مشاهدات LR در دقت کسری از پیکسل، و ترکیب آن‌ها به یک شبکه تصویر HR (درون‌یابی) که حاصل آن غلبه بر محدودیتهای تصویربرداری دوربین است.
اصول اولیه الگوریتم فراتفکیکپذیری مبتنی بر حرکت را با آزمایش بسیار سادهای که در شکل 1-3 نشان داده شده، توضیح میدهیم. مطابق شکل 1-3(الف)، صحنه متشکل از چهار پیکسل با وضوح بالا است. دوربین خیالی با حرکت کسری از پیکسل کنترل شده، متشکل از تنها یک پیکسل، قطاری از تصاویر را از این صحنه را ایجاد میکند. شکلهای 1-3(ب)-(ه)، چگونگی ایجاد این تصاویر را نشان میدهد. البته هیچ کدام از این تصاویر با کیفیت پایین نمی‌تواند جزئیات تصویر زمینهای را نشان دهد. با فرض این که تابع نقطه گستر (PSF)[1] دوربین خیالی (که پدیدهی ماتی نوری در یک دوربین را مدل میکند) یک تابع خطی شناخته شده است، و سطح خاکستری تمام پیکسل های مرزی صفر است، معادلات زیر، تصاویر کم وضوح تار شده را با نوع وضوح بالا مربوط با میسازد.
که و ، تصاویر کم وضوح ، X مقادیر سطح خاکستری پیکسل در تصویر با وضوح بالا،H عناصرPSF مشخص و v نویز تصادفی اضافه شده ازCCD به فریم‌های کیفیت پایین است. در مواردی که نویز اضافه شده کوچک باشد، با حل مجموعه معادلات خطی فوق، میتوان مقادیر پیکسل وضوح بالا را بدست آورد. متأسفانه، همان‌طور که در بخش بعد خواهیم دید، فرض ساده مطرح شده در بالا به ندرت در شرایط واقعی معتبر خواهد بود.
فراتفکیک پذیری در بسیاری از زمینه‌ها مطرح می‌شود، مانند:
– ویدیو نظارتی [12،13] : بزرگ نمایی منطقه مورد نظر (ROI) در ویدئو برای درک انسان (به عنوان مثال دیدن پلاک خودرو در ویدئو)، افزایش وضوح تشخیص هدف اتوماتیک (به عنوان مثال سعی به تشخیص چهره جنایتکار) .
– سنجش از راه دور [14] : چند عکس از یک منطقه گرفته می‌شود، و یک تصویر با وضوح بهبود یافته را می‌توان یافت.
– تصویربرداری پزشکی (CT، MRI، اولتراسوند و غیره) [18-15] : چند تصویر با وضوح محدود را می‌توان به دست آورد، و روش SR می‌تواند به منظور افزایش وضوح استفاده شود.
– تبدیل استانداردهای ویدئویی، به عنوان مثال تبدیل سیگنال ویدیویی NTSC به سیگنال HDTV.
با این حال، خواهیم دید که فراتفکیکپذیری، مسئلهای با محاسبات پیچیده و بدحالت است. تمامی این موارد فراتفکیکپذیری را به یکی از جذاب‌ترین زمینه های تحقیقاتی در پردازش تصویر تبدیل کردهاست.
1-1- فراتفکیک پذیری به عنوان یک مسئله معکوس
الگوریتم‌های فراتفکیک پذیری در تلاشند تا تصویری با وضوح بالا را که توسط محدودیت‌های یک سیستم تصویربرداری نوری خراب شده است، بازسازی کنند. این نوع مسئله یک مثال از مسئله معکوسی است، که در آن منبع اطلاعات (تصویر با وضوح بالا) از دادههای مشاهده شده (وضوح تصویر کم و یا تصاویر) تخمین زده میشود. به طور کلی، در حل مسئلهی معکوس نیاز به ساخت یک مدل رو به جلو است. رایج‌ترین مدل رو به جلو برای حل مسئله فراتفکیک پذیری، خطی و به صورت زیر فرموله میشود.
که در آن تصویر و یا مجموعه ای از تصاویر کم وضوح، تصویر مجهول با وضوح بالا و نویز تصادفی ذاتی در سیستم تصویربرداری است. در این رابطه تصاویر ورودی و خروجی سیستم را بصورت برداری در نظر گرفته و از نماد و برای تاکید بر برداری بودن تصویر خروجی و ورودی استفاده میکنیم. در این فرمول، تصاویر به صورت بردار از جاروب تصاویر دو بعدی در امتداد سطرها بدست آمدهاند. ماتریس M در مدل مستقیم فوق نشان دهنده سیستم تصویربرداری، متشکل از فرآیندهای متعددی است که بر کیفیت تصاویر تخمین زده شده اثر میگذارد. ساده‌ترین شکل ماتریس M همانی است، که ساده‌ترین نوع این مسئله و بعنوان یک مسئله حذف نویز ساده در نظر گرفته میشود. مسائل جالب توجه تر (و سخت‌تر برای حل) را می‌توان با توجه به مدل‌های پیچیده تر برای M تعریف کرد. به عنوان مثال، برای تعریف مسئله فراتفکیکپذیری در مقیاس خاکستری، یک سیستم تصویربرداری که شامل ماتی، تاری، و نمونه برداری با نرخ پایین از دادهها است را در نظر گرفتیم (در فصل 2 و 3 تعریف شده است). علاوه بر این، اضافه کردن فرآیند فیلتر کردن رنگ به مدل قبل، ما را قادر به حل مسئله موزائیک زدایی[1] چند قابی که در فصل 4 تعریف شده، میسازد.
[1] Demosaic
[1] Point Spread Function
[1] Super-Resolution
[2] Low Resolution
[3] High Resolution
[4] یک مسئله زمانی بدحالت (ill-posed) است که، الف) بینهایت جواب داشته باشد. ب) جواب منحصر بفرد نداشته باشد. ج) تغییر مقدار اولیه روی جواب نهایی بیتاثیر باشد.
[1] Charge Coupled Device
[2] Complementary Metal-Oxide-Semiconductor