اطلاعیه

Collapse
No announcement yet.

سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

Collapse
X
 
  • فیلتر
  • زمان
  • Show
Clear All
new posts

    سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

    سلام
    ضمن تشکر از مسئولان بخش پر محتوای پردازش تصویر من چند تا سوال دارم که ممنون میشم کامل و جامع منو راهنمایی کنید که تموم شک وشبهه ها و سوالات من در این مورد رفع بشه . لازم بذکر هست که این مباحث مربوط به شبکه های عصبی ولی برای تشخیص و بازشناسی حروف دست نوشت پیشنهاد شده که مربوط به پردازش تصویر اسناد دست نویس و در نهایت شناسایی حروف و کلمات اون اسناد هست /
    سوال اول: روش کوانیتزاسیون برداری با الگوریتم LBG با معیار فاصله اقلیدسی چه روشی هست؟ چه جوری کار میکنه؟
    و کاربردهای اون چیه؟
    سوال دوم : از الگوریتمهای Momentum gradient descent learning rule و Adaptive gradient descent learning rule که مربوط به شبکه های عصبی هست چه طور استفاده میکنند؟کاربرد؟کارایی؟ و هدف از استفاده این الگوریتمها چیه؟ کلا یه توضیحی که بتونه این سوالارو پاسخ بده در این زمینه میخوام؟ این الگوریتمها در محیط متلب قابل پیاده سازی هست که متاسفانه من در این زمینه تجربه و گاهی ندارم. مردد بودم که این تاپیک رو در بخش شبکه های عصبی ایجاد کنم یا پردازش تصویر؟اگه در انتخاب مکان درست اشتباه کردم ، عذرخواهی میکنم .
    بازم ممنون
    [url=http://wiki.eca.ir/]http://www.ecapic.ir/image/ECA-091005091909.gif[/url

    #2
    پاسخ : سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

    سلام.
    در مورد سوال اولتون من خودم کار نکردم یه نگاهی به این لینک بندازید:
    http://en.wikipedia.org/wiki/Linde-Buzo-Gray_algorithm#The_algorithm

    در مورد سوال دوم باید بگم شبکه های عصبی رو از یه دید میشه به دو دسته تقسیم کرد.
    1. دسته آموزش با نظارت
    2. دسته آموزش بدون نظارت

    این روش هایی که شما اسم بردید روش های آموزش شبکه عصبی با نظارت هست یعنی دسته اول. شبکه عصبی در یک فضای جدید بعدی خطوط یا منحنی هایی را رسم میکنه (بسته به نوع نورون) این خطوط و دسته ها میتونن یک مسئله چندین بعدی رو حل کنن به این معنی که مثلا شما در همین مسئله بازشناسی ارقام دست نوشته، 20 تا ویژگی از هر رقم استخراج کردید و شبکه عصبی باید با این 20 ویژگی که بهش یه بردار 20 بعدی هم میگن، ارقام رو تشخیص بده یعنی ورودی هاش رو به 10 دسته که صفر تا 9 باشه تقسیم کنه، شبکه عصبی کارش اینه که توی این فضای 20 بعدی خطوط و یا منحنی های رو رسم میکنه (بسته به هسته نورون و نوع شبکه عصبی استفاده شده) تا بتونه مثلا ویژگی های رقم صفر رو در یک دسته قرار بده ، ویژگی های رقم 1 رو در یک دسته دیگه و ... ، اینکه این خطوط رو کجاها رسم کنه که اگه ویژگی های رقم صفر اومد نورون مربطو به رقم صفر فعال بشه، همون روش آموزشه، که شما دوتاش رو اسم بردی.
    در مورد کدنویسی شبکه های عصبی خود متلب توابعی برای اینکار داره یعنی کد شبکه عصبی رو خودش داره با روش های اموزش پیشرفته. ولی اگه خودت بخواهی کد بنویسی توی تاپیک های مهم این بخش من یه کد کامل از شبکه عصبی MLP گذاشتم.
    موفق باشید
    شأن انسان در ایمان و هجرت و جهاد است و هجرت، مقدمهآ‌ی جهاد فیآ‌سبیلآ‌الله.
    هجرت، هجرت از سنگینیآ‌هاست و جاذبهآ‌هایی که تو را به خاک میآ‌چسباند.
    چکمهآ‌هایت را بپوش، رهآ‌توشهآ‌ات را بردار و هجرت کن.

    دیدگاه


      #3
      پاسخ : سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

      با سلام
      ممنون آقای نحوی اما من همچنان سوال دارم :
      اینجا چند تا سوال دیگه هم هست : میخوام بدونمMSE چیه؟ که برای دسته بندی استفاده میشه؟ و اصلا کارا و لازم هست؟
      سوال دوم این که فرض میکنیم این پروژه قراره آماده شه منظورم همین بازشناسی هست اما نمیخوایم از نرم افزار متلب که یه نرم افزار پیش پا افتاده و همه گیر هست برای این کار استفاده کنیم در این صورت پیشنهاد شما چیه؟ میدونین من برنامه ای تشخیص حروف و عدد رو در محیط دلفی و وی.بی. نوشتم اما میخوام محیط تست درستی نظریه ای که داده میشه یه محیط کاملا استاندارد و مورد قبول تمامی حرفه ایها در این زمینه باشه؟ مثلا یه سوال اینه که در سیستم های بازشناسی انگلیسی پژوهشگران چطوری نظریه هاشون رو برای صاحب نظران در سراسر دنیا اثبات کردن؟
      ممنون بازم سوال دارم اما کم کم میپرسم .. بعد از این که جواب این سوالارو گرفتم .
      [url=http://wiki.eca.ir/]http://www.ecapic.ir/image/ECA-091005091909.gif[/url

      دیدگاه


        #4
        پاسخ : سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

        نوشته اصلی توسط ellisa
        با سلام
        ممنون آقای نحوی اما من همچنان سوال دارم :
        اینجا چند تا سوال دیگه هم هست : میخوام بدونمMSE چیه؟ که برای دسته بندی استفاده میشه؟ و اصلا کارا و لازم هست؟
        سوال دوم این که فرض میکنیم این پروژه قراره آماده شه منظورم همین بازشناسی هست اما نمیخوایم از نرم افزار متلب که یه نرم افزار پیش پا افتاده و همه گیر هست برای این کار استفاده کنیم در این صورت پیشنهاد شما چیه؟ میدونین من برنامه ای تشخیص حروف و عدد رو در محیط دلفی و وی.بی. نوشتم اما میخوام محیط تست درستی نظریه ای که داده میشه یه محیط کاملا استاندارد و مورد قبول تمامی حرفه ایها در این زمینه باشه؟ مثلا یه سوال اینه که در سیستم های بازشناسی انگلیسی پژوهشگران چطوری نظریه هاشون رو برای صاحب نظران در سراسر دنیا اثبات کردن؟
        ممنون بازم سوال دارم اما کم کم میپرسم .. بعد از این که جواب این سوالارو گرفتم .
        سلام خوبی دوست عزیز؟
        MSE مخفف Mean squared error هست. یعنی متوسط مربعات خطا، به صورت خیلی ساده بگم زمانی که شما شروع به آموزش شبکه میکنید باید یه معیاری برای سنجش میزان یادگیری شبکه داشته باشید، به این صورت عمل میشه که شما یه Target یا هدف دارید و یه خروجی شبکه عصبی، ایده آل اینه که خروجی شبکه عصبی عینا بشه هدف ولی خطا وجود داره، برای اینکه بفهمیم شبکه چقدر آموزش دیده (در واقع مقدار کمینه MSE ، معیاری برای توقف آموزش هم هست) اختلاف هدف با خروجی شبکه عصبی برای تک تک نورون های خروجی محاسبه میشه، به توان 2 میرسن و میانگینشون گرفته میشه هر چی این عدد کوچکتر باشه شبکه بهتر آموزش دیده.

        دیدتون رو نسبت به متلب بهتر کنید، این نرم افزار بزرگترین و قوی ترین نرم افزار پژوهشی در اکثر زمینه های علمیه، اکثر گزارش های در مقالات بازشناسی ارقام با نرم افزار متلب هست و اگر غیر این باشه در مقاله آورده میشه و جزئیات پیاده سازی مطرح میشه. نوشتن مقاله هم که روش خودش رو داره توی بخش پردازش تصویر بگردید من یه پروژه در این زمینه توی سایت گذاشتم که یه مقاله داخلی هم ازش چاپ شد. اون مقاله رو هم یه نگاهی بندازید شاید کمکتون کنه.
        موفق باشید
        شأن انسان در ایمان و هجرت و جهاد است و هجرت، مقدمهآ‌ی جهاد فیآ‌سبیلآ‌الله.
        هجرت، هجرت از سنگینیآ‌هاست و جاذبهآ‌هایی که تو را به خاک میآ‌چسباند.
        چکمهآ‌هایت را بپوش، رهآ‌توشهآ‌ات را بردار و هجرت کن.

        دیدگاه


          #5
          پاسخ : سوال در مورد پردازش تصویر و شناسایی حروف دست نویس با استفاده از شبکه های عصبی

          نوشته اصلی توسط محمد نحوی

          دیدتون رو نسبت به متلب بهتر کنید، این نرم افزار بزرگترین و قوی ترین نرم افزار پژوهشی در اکثر زمینه های علمیه، اکثر گزارش های در مقالات بازشناسی ارقام با نرم افزار متلب هست و اگر غیر این باشه در مقاله آورده میشه و جزئیات پیاده سازی مطرح میشه. نوشتن مقاله هم که روش خودش رو داره توی بخش پردازش تصویر بگردید من یه پروژه در این زمینه توی سایت گذاشتم که یه مقاله داخلی هم ازش چاپ شد. اون مقاله رو هم یه نگاهی بندازید شاید کمکتون کنه.
          موفق باشید

          سلام ممنون برای جوابتون و ممنون میشم لطف کنید و پیاماتون رو بخونید . من ادامه سوالام رو اونجا ازتون پرسیدم البته با تشکر فراوان از شما
          [url=http://wiki.eca.ir/]http://www.ecapic.ir/image/ECA-091005091909.gif[/url

          دیدگاه

          لطفا صبر کنید...
          X