সুপ্রিয়, উইকিসংকলনে আপনাকে স্বাগতম!

এই প্রকল্পে আপনার আগ্রহের জন্য আপনাকে ধন্যবাদ; আশা করি আপনি এই সম্প্রদায় এবং এখানে আপনার কাজে আনন্দ পাবেন। সাহায্যের প্রয়োজনে প্রাথমিকভাবে আপনি আমাদের সহায়িকা পাতাটি দেখতে পারেন (বিশেষ করে লেখা যোগ এবং উইকিসংকলনের রচনাশৈলী) পাতা দু’টো। এছাড়া সম্প্রদায়কে সর্বজনীন কোনো প্রশ্ন বা সম্প্রদায়ের সাথে কোনো কিছু আলোচনা করতে আলোচনা সভা ব্যবহার করতে পারেন। পাশাপাশি সম্প্রদায়ের প্রবেশদ্বার আপনাকে এখানে কাজ করার জন্য একটি তালিকামূলক ধারণা দেবে যার মাধ্যমে আপনি এখানে কাজ করার ব্যাপারে প্রয়োজনীয় দিক নির্দেশনা পাবেন। সেই সাথে আপনার যদি কোনো প্রশ্ন থাকে, তাহলে তা অবলীলায় আমার আলাপের পাতায় বার্তা রাখতে পারেন। উইকিবইয়ে আপনার আগ্রহের জন্য আবারও ধন্যবাদ ও কৃতজ্ঞতা। — তানভিরআলাপ১৮:৪৫, ১৯ ডিসেম্বর ২০১১ (ইউটিসি)উত্তর দিন

OCR ক্রিপ্টের জন্য বট অ্যাকাউন্ট ব্যবহার করুন

সম্পাদনা

স্ক্রিপ্টের মাধ্যমে ইম্পোর্ট করা হলে প্রচুর ট্রাফিক তৈরী হবে। অনুগ্রহ করে একটি বট অ্যাকাউন্ট তৈরী করুন এবং সম্পাদনাগুলো সেই অ্যাকাউন্ট থেকে করুন। অন্যথা সাম্প্রতিক পরিবর্তন পাতাটি ইমপোর্ট লগে পূর্ণ হয়ে যাব। --নাসির খান সৈকতআলাপ ১৩:১৩, ১৫ ফেব্রুয়ারি ২০১৬ (ইউটিসি)উত্তর দিন

পরামর্শর জন্য ধন্যবাদ। প্রথমটি সরাসরি করে ফেলেছি। পরেরগুলোতে বট ব্যবহার করব। Tarunno (আলাপ) ১৩:৩৩, ১৫ ফেব্রুয়ারি ২০১৬ (ইউটিসি)উত্তর দিন

Kindly give details

সম্পাদনা

নির্ঘণ্ট আলাপ:রসায়ন ব্যবহার - প্রথম ভাগ.pdf Kindly give details, how you solved the issues? It is a lesson for me.--Info-farmer (আলাপ) ১৭:০৫, ২০ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন

@Info-farmer: in some PDF files we have this kind of issue. Some PDFs are not simple image PDF. There are few transparent texts overlays on top of the PDF images. For these cases, I suspect, on scanning > PDF conversion process, there was a failed attempt to OCR these pages, thus left garbage on top of the image layer. You can see these texts, if you open that PDF on a PDF reader and left-click + drag across the page. So, when we upload these to Google Drive, API only returns the texts on text layer rather than OCR the image.
I solve this problem manually. I download the PDF, then convert every page as JPGs and then re-convert these JPG to PDF. Then start doing OCR. I started to script a bash script for the whole conversion process but didn't finish it due to other busyness. - Tarunno (আলাপ) ১৯:৫৩, ২০ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
so, resolution needed. Thanks indeed Brother. I applied here to get bot flag. Is there, any further procedures, i have to follow? or i need more support. Now i am unable to run fast. Every page needs 10 seconds to upload now without interuption --Info-farmer (আলাপ) ০০:৫৬, ২১ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
Pls give the commands to do as you. When i do OCR on some files, i am facing the same resolution hurdle. i used pdftk &convert commands. but the output pdf file pages are not in order. So, i want to followyour instructions. Info-farmer (আলাপ) ১৪:৫৯, ২২ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
@Info-farmer: You can get bot flag seven days after the request here, on notifying Meta (which, I expect, one of the admins will do). Hrishikes (আলাপ) ০৫:৫০, ২১ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
@Info-farmer: Let me complete the bash script I started to work on. That will make life easier. - Tarunno (আলাপ) ১৭:৫৯, ২২ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
@Info-farmer: Here is the script: script Steps are simple, 1. Download script to a new folder. 2. Download the problematic PDFs in to the same folder. 3. From terminal go to that folder using 'cd' command. 4. run 'sh pdf-jpg-pdf-r.sh' 5. when it's done, you will find the new PDFs inside the folder. Note: it has recursive functionality. So you can convert more than one PDF in single run. - Tarunno (আলাপ) ১৪:৫৬, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
Hi, Tarunno, Can you please document any developments done by you regarding OCR in this page. It will be helpful for other users also. Thanks in advance. -- বোধিসত্ত্ব (আলাপ) ১৪:৩৭, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
@Bodhisattwa: That page contains information about the OCR4Wikisource codes. This script is not a part of that. I am not sure whether it fits on that page. Currently I am caught up with a lot of things. Can you help me with documenting this? - Tarunno (আলাপ) ১৪:৫৬, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
Ok, I will try to start a new help page regarding Google OCR. I will let you know by then. Thanks. -- বোধিসত্ত্ব (আলাপ) ১৫:০০, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
There is a help page concerning Google OCR. I think, your developments can fit there. Isn't it? -- বোধিসত্ত্ব (আলাপ) ১৫:০৫, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন
Yes, I think it fits here. - Tarunno (আলাপ) ১৫:৩৭, ২৬ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন

বট সারাংশ

সম্পাদনা

শাবাব ভাই, আপনার বটের সারাংশ Text from Google OCR-এর পরিবর্তে গুগল ওসিআর ব্যবহার করে লেখা যোগ দেয়ার অনুরোধ করছি। তানভির ভাইয়ের বটটির মত। ধন্যবাদ। --Aftabuzzaman (আলাপ) ১৩:০৮, ২৭ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন

ঠিক আছে, করে দেব -- Tarunno (আলাপ) ১৩:১০, ২৭ এপ্রিল ২০১৬ (ইউটিসি)উত্তর দিন

Share your experience and feedback as a Wikimedian in this global survey

সম্পাদনা
  1. This survey is primarily meant to get feedback on the Wikimedia Foundation's current work, not long-term strategy.
  2. Legal stuff: No purchase necessary. Must be the age of majority to participate. Sponsored by the Wikimedia Foundation located at 149 New Montgomery, San Francisco, CA, USA, 94105. Ends January 31, 2017. Void where prohibited. Click here for contest rules.

Indic Wikisource Proofreadthon II 2020

সম্পাদনা

Sorry for writing this message in English - feel free to help us translating it