پاورپوینت نقش فناوری اُ. سی. آر. در کتابخانه های دیجیتالی
قابل ویرایش 22 اسلاید
قسمتی از اسلایدها
امروزه با توجه به پیشرفتهای حاصل شده در زمینه بازشناسی نوشتار، فناوری بازشناسی خودکار تحت عنوان بازشناسی نوری حروف (OCR) شکل گرفته است.
از لحاظ کاربردی، اُ. سی. آر. برنامهای است که با استفاده از روشهای گوناگون هوش مصنوعی، اسناد و مدارک، کتابها و اصولاً هر نوع ماده چاپی، تایپی و یا حتی دستنویس را به متون قابل ویرایش و یا قابل جستجو تبدیل میکند. (C. Liu & K. Nakashima, 2004)
هنگامی که یک سند متنی اسکن می شود، رایانه این متن را به صورت یک تصویر گرافیکی تشخیص می دهد. در نتیجه کاربران قادر نخواهند بود که متن موجود در تصویر سند را ویرایش کرده، مطالعه نموده و یا مورد جستجو قرار دهند. اینجاست که محتویات تصاویر قابل شناسایی شده و به صورت یک فایل در رایانه ذخیره می گردد.
کتابخانه دیجیتالی مجموعه ای از اطلاعات سازماندهی شده در قالب الکترونیکی است که در آن:
اطلاعات دیجیتالی باید مبتنی بر اصول مجموعه سازی، گردآوری یا تولید شده باشند.
اطلاعات دیجیتالی باید به صورت منسجم و مناسبی نظیر دیگر منابع اطلاعاتی در کتابخانه ها توسط استفاده کنندگان قابل دسترس و بازیابی باشند.
اطلاعات دیجیتالی باید در مدت زمان طولانی به مثابه منابع اطلاعاتی پایدار قابل دسترس باشند.
فهرست مطالب و اسلایدها
مقدمه
تاریخچه سیستم های اُ. سی. آر.
سیستم های نسل اول:
سیستم های نسل دوم:
سیستم های نسل سوم:
معرفی باز شناسی نوری حروف
سیستم های اُ. سی. آر در کتابخانه های دیجیتالی
مزایای بکارگیری سیستم های اُ. سی. آر در کتابخانه های دیجیتالی
جنبه های کاربردی سیستم اُ. سی. آر در نرم افزارهای جامع کتابخانه های الکترونیکی
نرم افزارهای تجاری اُ سی آر لاتین و فارسی
دریافت و بازشناسی متن تصاویر اسناد با فرمت های مختلف به صورت تک قاب یا چند قاب
کتابهای الکترونیکی
روزنامه ها و نشریات الکترونیکی
سیستم اتوماسیون اداری
مراحل انجام کار سیستم اُ. سی. آر در نرم افزار کتابخانه الکترونیکی
تحلیل ویژگیهای متون فارسی از دید گاه پردازش سیستمی در اُ. سی. آر
قابل ویرایش 22 اسلاید
قسمتی از اسلایدها
امروزه با توجه به پیشرفتهای حاصل شده در زمینه بازشناسی نوشتار، فناوری بازشناسی خودکار تحت عنوان بازشناسی نوری حروف (OCR) شکل گرفته است.
از لحاظ کاربردی، اُ. سی. آر. برنامهای است که با استفاده از روشهای گوناگون هوش مصنوعی، اسناد و مدارک، کتابها و اصولاً هر نوع ماده چاپی، تایپی و یا حتی دستنویس را به متون قابل ویرایش و یا قابل جستجو تبدیل میکند. (C. Liu & K. Nakashima, 2004)
هنگامی که یک سند متنی اسکن می شود، رایانه این متن را به صورت یک تصویر گرافیکی تشخیص می دهد. در نتیجه کاربران قادر نخواهند بود که متن موجود در تصویر سند را ویرایش کرده، مطالعه نموده و یا مورد جستجو قرار دهند. اینجاست که محتویات تصاویر قابل شناسایی شده و به صورت یک فایل در رایانه ذخیره می گردد.
کتابخانه دیجیتالی مجموعه ای از اطلاعات سازماندهی شده در قالب الکترونیکی است که در آن:
اطلاعات دیجیتالی باید مبتنی بر اصول مجموعه سازی، گردآوری یا تولید شده باشند.
اطلاعات دیجیتالی باید به صورت منسجم و مناسبی نظیر دیگر منابع اطلاعاتی در کتابخانه ها توسط استفاده کنندگان قابل دسترس و بازیابی باشند.
اطلاعات دیجیتالی باید در مدت زمان طولانی به مثابه منابع اطلاعاتی پایدار قابل دسترس باشند.
فهرست مطالب و اسلایدها
مقدمه
تاریخچه سیستم های اُ. سی. آر.
سیستم های نسل اول:
سیستم های نسل دوم:
سیستم های نسل سوم:
معرفی باز شناسی نوری حروف
سیستم های اُ. سی. آر در کتابخانه های دیجیتالی
مزایای بکارگیری سیستم های اُ. سی. آر در کتابخانه های دیجیتالی
جنبه های کاربردی سیستم اُ. سی. آر در نرم افزارهای جامع کتابخانه های الکترونیکی
نرم افزارهای تجاری اُ سی آر لاتین و فارسی
دریافت و بازشناسی متن تصاویر اسناد با فرمت های مختلف به صورت تک قاب یا چند قاب
کتابهای الکترونیکی
روزنامه ها و نشریات الکترونیکی
سیستم اتوماسیون اداری
مراحل انجام کار سیستم اُ. سی. آر در نرم افزار کتابخانه الکترونیکی
تحلیل ویژگیهای متون فارسی از دید گاه پردازش سیستمی در اُ. سی. آر