উইকিসংকলন:বাংলা ওসিআর

বাংলা অপটিক্যাল ক্যারেক্টার রিডার (বাংলা ওসিআর)

গুগুল বাংলা ওসিআরসম্পাদনা

গুগল ড্রাইভ দিয়ে উইকিসংকলনের জন্য স্ক্যানকৃত বাংলা ফাইল (জেপিজি, জেপিইজি, পিএনজি) এবং পিডিএফ ফাইল (২ এমবি) আপলোড করে তাকে টেক্সট বা লেখায় রুপান্তর করা যায়, যার ফলে আর আমাদের টাইপ করার দিন শেষ। পিডিএফ ফাইলের ক্ষেত্রে প্রথম ১০টি পাতা রুপান্তর করতে পারে।

এই জন্য যা করতে হবে
  1. . প্রথমে আপনাকে গুগল ড্রাইভে jpg. jpeg, png কিংবা pdf ফাইলটি আপলোড করতে হবে। (বাংলা: নতুন > ফাইল আপলোড করুন English: New > upload file)
  2. . আপলোড করার পর ফাইলের উপর রাইট (ডান) ক্লিক করে Google দস্তাবেজ নির্বাচন করতে হবে। (বাংলা: এর মাধ্যমে খুলুন > Google দস্তাবেজ English: Open with > Google docs)
  3. . এতে নতুন যে পাতা আসবে সেখানে স্ক্যান করা ফাইলের লেখা থাকবে। আপনাকে শুধু লেখাগুলি কপি বা অনুলিপি করতে হবে। এরপর উইকিসংকলের পাতায় পেস্ট বা প্রতিলেপন করতে হবে।

[টীকা: বন্ধনীতে বাংলাEnglish লেখা অর্থ হল আপনার গুগল ড্রাইভের ভাষা বাংলা হলে কি লেখা আসবে আর English হলে কি লেখা আসবে]

 
ধাপসমূহ (ইংরেজি ইন্টারফেস)

অঙ্কুর প্রকল্পের বাংলা ওসিআরসম্পাদনা

অঙ্কুর প্রকল্পের প্রতিষ্ঠাতা ও মুখ্য সমন্বয়কারী হচ্ছেন যুক্তরাষ্ট্র প্রবাসী তানিম আহমেদ। এই সংগঠনের সাফল্যের মূলে রয়েছে সংগঠনের কর্মীদের অক্লান্ত পরিশ্রম। এই প্রকল্পে অংশগ্রহণকারী যুক্তরাষ্ট্র প্রবাসীদের মাঝে আরো রয়েছেন- দীপায়ন সরকার, কৌশিক ঘোষ, শরিফ ইসলাম। ভারতে অবস্থানরত বাঙালিদের মধ্যে রয়েছেন ইন্দ্রনীল দাশগুপ্ত, রুনা ভট্টাচার্য, শান্তনু চ্যাটার্জি, সায়মিন্দু দাশগুপ্ত। বাংলাদেশে যারা এ প্রকল্পে কাজ করে যাচ্ছেন তারা হচ্ছেন- জামিল আহমেদ, খন্দকার মুজাহিদুল ইসলাম, মোহাম্মদ খালিদ আদনান, প্রজ্ঞাসহ আরো অনেকে।অঙ্কুরের সাথে কাজ করতে আগ্রহী হলে তাদের সাথে যোগাযোগ করতে পারেন http://www.ankurbangla.org ev http://bengalinux.org ঠিকানায়।

সিআরবিএলপি বাংলা ওসিআরসম্পাদনা

২০০৯ সালে ব্র্যাক বিশ্ববিদ্যালয় সেন্টার ফর রিসার্চ অন বাংলা ল্যাঙ্গুয়েজ প্রসেসিং সিআরবিএলপি ওসিআর তৈরির উদ্যোগ নেয়। ওসিআর শব্দটি Optical Character Reader/ Recogniser-এর সংক্ষিপ্ত রূপ। এর কাজ হচ্ছে সাধারণ স্ক্যান করা কোনো নথির চিত্রকে সম্পাদনযোগ্য লেখায় পরিণত করা। বাজারে কিছু জনপ্রিয় ওসিআর-এর মাঝে রয়েছে ABBYY Fine Reader ও Omnipage। চিত্রের নথিকে সম্পাদনযোগ্য লেখায় রূপান্তরিত করায় এদের জুড়ি নেই। কিন্তু এগুলোর কোনোটিই বাংলা ফন্টে লেখা নথির চিত্রকে লেখায় রূপান্তর করতে পারে না। তাই বাংলা লেখা ইমেজকে টেক্সটে পরিণত করার লক্ষ্যে এ প্রতিষ্ঠান বাংলা ওসিআর বানানোর উদ্যোগ নেয় এবং সফলতা লাভ করে। নানা চরাইউৎরাই পেরিয়ে এ সফটওয়্যার এখন বেশ ভালোই কাজ করতে পারে। সফটওয়্যারটির নতুন সংস্করণটি হচ্ছে বাংলা ওসিআর ০.৬ আলফা। এটি অনেকগুলো চিত্রের ফরমেট সমর্থন করে। সফটওয়্যারটি পুরোপুরিভাবে কাজে লাগানোর জন্য আপনার পিসিতে থাকতে হবে .NET Framework 2.0, Visual C++ 2005 ও Java Runtime Environment।

টিম ইঞ্জিনের বাংলা ওসিআরসম্পাদনা

খবরে প্রকাশ বাংলা ওসিআর তৈরি করেছেন টিম ইঞ্জিনের সফটওয়্যার তৈরির প্রধান নির্মাণকৌশলী হিসেবে কাজ করেছেন এসএম আল-আমিন (সম্রাট) ও তার দল। প্রকল্পের সমন্বয়কারী ছিলেন নাফিসা রেজা বর্ষা।

আরো দেখুনসম্পাদনা