প্রতি বছর অনলাইনে এক ট্রিলিয়নেরও বেশি ছবি আপলোড করা হয়, এবং সেগুলোর মধ্যে অনেকগুলোতে দরকারি লেখা থাকে—যেমন উদ্ধৃতি, পরিসংখ্যান, বা এমন কোনো অংশ যা ডিজিটাইজ করা প্রয়োজন (উদাহরণস্বরূপ, লাইব্রেরির কোনো দুর্লভ বই)। সৌভাগ্যবশত, ছবি থেকে লেখা বের করার বেশ কয়েকটি সহজ উপায় রয়েছে। এই নিবন্ধে ছবির লেখাকে সম্পাদনাযোগ্য ও অনুসন্ধানযোগ্য লেখায় রূপান্তর করার পাঁচটি কার্যকর ও বিনামূল্যের পদ্ধতির পাশাপাশি এর সাধারণ ব্যবহার এবং সীমাবদ্ধতাগুলো ধাপে ধাপে আলোচনা করা হয়েছে।
ছবি থেকে কীভাবে লেখা বের করবেন
আপনি বিভিন্ন উপায়ে ছবি থেকে লেখা বের করতে পারেন, যার মধ্যে রয়েছে:
- একটি অনলাইন ইমেজ-টু-টেক্সট এক্সট্র্যাক্টর (OCR) ব্যবহার করে
- গুগল ড্রাইভের মাধ্যমে একটি ছবিকে সম্পাদনাযোগ্য লেখায় রূপান্তর করে
- মাইক্রোসফট ওয়ার্ড বা এআই চ্যাট টুল ব্যবহার করে
- গুগল লেন্সের মতো মোবাইল টুল ব্যবহার করে
নিচে পাঁচটি কার্যকরী পদ্ধতি এবং ধাপে ধাপে নির্দেশাবলী দেওয়া হলো।
১. একটি ইমেজ টেক্সট এক্সট্র্যাক্টর (অনলাইন OCR) ব্যবহার করুন একটি ইমেজ টেক্সট এক্সট্র্যাক্টর হলো সবচেয়ে দ্রুত এবং সরাসরি বিকল্প। বেশিরভাগ অনলাইন টুল সাধারণ ইমেজ ফরম্যাট (PNG, JPG, WEBP) এবং পিডিএফ সমর্থন করে এবং সম্পাদনাযোগ্য লেখা ফেরত দেয় যা আপনি কপি বা ডাউনলোড করতে পারেন।
সাধারণ ধাপসমূহ:
১. আপনার ব্রাউজারে ইমেজ-টু-টেক্সট পরিষেবাটি খুলুন (যেমন, ইমেজ টু টেক্সট কনভার্টার বা অন্য কোনো বিনামূল্যের OCR)।
২. ইমেজ বা পিডিএফ আপলোড করুন অথবা ড্র্যাগ-অ্যান্ড-ড্রপ করুন।
৩. (ঐচ্ছিক) এডিটর ব্যবহার করে ইমেজটি ক্রপ বা রোটেট করুন, যাতে টুলটি শুধুমাত্র কাঙ্ক্ষিত অংশটি পড়তে পারে।
৪. কনভার্ট (বা এক্সট্র্যাক্ট) এ ক্লিক করুন এবং কয়েক সেকেন্ড অপেক্ষা করুন।
৫. ফলাফলটি TXT, DOC, বা PDF হিসাবে ডাউনলোড করুন, অথবা আউটপুটটি আপনার ক্লিপবোর্ডে কপি করুন।
দ্রষ্টব্য: রূপান্তরের গতি ফাইলের আকারের উপর নির্ভর করে। AI দ্বারা উন্নত আধুনিক OCR টুলগুলো প্রায়শই জটিল লেআউট এবং নয়েজযুক্ত ব্যাকগ্রাউন্ড আরও নির্ভুলভাবে পরিচালনা করে।
১. গুগল ড্রাইভ (গুগল ডক্স) দিয়ে ছবিটি রূপান্তর করুন গুগল ড্রাইভ, গুগল ডক্স-এ ছবি খুলে তা থেকে টেক্সট বের করতে পারে। এটি সুবিধাজনক এবং বিনামূল্যে, যদিও ফরম্যাটিং সংরক্ষিত নাও থাকতে পারে।
ধাপসমূহ:
১. ছবিটি বা পিডিএফ ফাইলটি গুগল ড্রাইভে আপলোড করুন।
২. ফাইলটির উপর রাইট-ক্লিক করে > ওপেন উইথ > গুগল ডক্স নির্বাচন করুন।
৩. একটি নতুন ডক্স ফাইল খুলবে, যেখানে ছবিটি এবং তার নিচে বের করা, অনুসন্ধানযোগ্য টেক্সট থাকবে।
দ্রষ্টব্য: গুগল ডক্স প্রায়শই মূল ফরম্যাটিং এবং জটিল বিন্যাস ধরে রাখতে পারে না, তাই আউটপুটটি প্রুফরিড এবং রিফরম্যাট করার জন্য প্রস্তুত থাকুন।
১. মাইক্রোসফট ওয়ার্ড ব্যবহার করে টেক্সট বের করুন ওয়ার্ড, ডকুমেন্ট -> পিডিএফ -> ওয়ার্ড প্রক্রিয়ার মাধ্যমে একটি ছবি থেকে টেক্সট বের করতে পারে। আপনি যদি আগে থেকেই ওয়ার্ড ব্যবহার করে থাকেন, তবে এটি আপনার জন্য সুবিধাজনক হবে।
ধাপসমূহ:
১. একটি নতুন ওয়ার্ড ডকুমেন্টে ছবিটি যুক্ত করুন।
২. ডকুমেন্টটি পিডিএফ হিসেবে সেভ করুন (ফাইল -> সেভ অ্যাজ -> পিডিএফ)।
৩. পিডিএফ-এর উপর রাইট-ক্লিক করে মাইক্রোসফট ওয়ার্ড দিয়ে খুলুন (অথবা ওয়ার্ড খুলে ফাইল -> ওপেন -> পিডিএফটি নির্বাচন করুন)।
৪. ওয়ার্ড পিডিএফটি রূপান্তর করার জন্য অনুরোধ করবে; নিশ্চিত করুন এবং বের করা টেক্সটটি পর্যালোচনা করুন।
দ্রষ্টব্য: ছবির মানের উপর নির্ভুলতা নির্ভর করে; স্ক্যান করা ছবি বা কম রেজোলিউশনের ছবিতে ফলাফল ভালো নাও হতে পারে।
১. ছবি সমর্থন করে এমন এআই টুল ব্যবহার করুন অনেক এআই চ্যাটবট এবং অ্যাসিস্ট্যান্ট (যেমন, ছবি সমর্থনসহ চ্যাটজিপিটি, ক্লড, জেমিনি) আপলোড করা ছবি থেকে টেক্সট পড়তে এবং বের করতে পারে।
ধাপসমূহ:
১. আপনার পছন্দের এআই টুলটি খুলুন এবং ছবিটি আপলোড করুন। ২. অ্যাসিস্ট্যান্টকে “এই ছবি থেকে টেক্সট বের করতে” (বা এই ধরনের কোনো নির্দেশ) বলুন।
৩. এআই-এর দেওয়া উত্তর থেকে বের করা টেক্সটটি কপি করুন।
দ্রষ্টব্য: এআই টুলগুলো বিশেষ করে মিশ্র কন্টেন্ট, বহুভাষিক টেক্সট, অথবা যখন আপনি আউটপুটকে সংক্ষিপ্ত বা নতুন ফরম্যাটে সাজাতে চান, তখন খুব সহায়ক হতে পারে। ছবিতে সংবেদনশীল তথ্য থাকলে প্রতিটি টুলের গোপনীয়তা নীতি (privacy policy) দেখে নিন।
১. গুগল লেন্স (মোবাইল) দিয়ে টেক্সট বের করুন গুগল লেন্স মোবাইল ডিভাইসে দ্রুত ক্যামেরা থেকে টেক্সটে রূপান্তর করার সুবিধা দেয়।
ধাপসমূহ:
১. গুগল লেন্স বা গুগল ফটোস অ্যাপ খুলুন এবং ছবিটি নির্বাচন করুন, অথবা লেন্স ক্যামেরা সরাসরি ব্যবহার করুন।
২. আপনার পছন্দের টেক্সটটি হাইলাইট করতে “টেক্সট নির্বাচন করুন” (Select text) বিকল্পে ট্যাপ করুন।
৩. টেক্সটটি আপনার ক্লিপবোর্ডে কপি করতে “কপি” (Copy) বিকল্পে ট্যাপ করুন, অথবা “অনুসন্ধান” (Search) বা “অনুবাদ” (Translate)-এর মতো বিল্ট-ইন বিকল্পগুলো ব্যবহার করুন। দ্রষ্টব্য: গুগল লেন্স দ্রুত এবং ছবির মধ্যে থাকা মুদ্রিত লেখার জন্য ভালোভাবে কাজ করে। অগোছালো হাতের লেখার ক্ষেত্রে এটি কম নির্ভরযোগ্য হতে পারে।
কোন প্রযুক্তি ইমেজ থেকে টেক্সট বের করতে ব্যবহৃত হয়?
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) হলো মূল প্রযুক্তি যা ইমেজ-ভিত্তিক টেক্সট পড়তে এবং ডিজিটাল টেক্সটে রূপান্তর করতে ব্যবহৃত হয়। আধুনিক OCR সিস্টেমগুলো প্রায়শই নির্ভুলতা বাড়াতে, বিভিন্ন ধরনের ফন্ট চিনতে এবং ঝাপসা বা জটিল ব্যাকগ্রাউন্ড সামলাতে AI এবং মেশিন লার্নিং অন্তর্ভুক্ত করে।
পিডিএফ ইমেজ থেকে টেক্সট বের করা
পিডিএফ ইমেজের জন্য একটি ইমেজ টেক্সট এক্সট্র্যাক্টর (OCR) সাধারণত সবচেয়ে কার্যকর বিকল্প। আপনি পিডিএফ রূপান্তর করার জন্য গুগল ডক্স বা ওয়ার্ডও ব্যবহার করতে পারেন, কিন্তু পিডিএফটি যদি একটি স্ক্যান করা ইমেজ হয় বা ছবির মান কম হয়, তবে ফলাফল খারাপ হতে পারে। আরও ভালো ফলাফলের জন্য, এমন একটি OCR টুল ব্যবহার করুন যা পিডিএফ ইনপুট এবং AI-বর্ধিত শনাক্তকরণ সমর্থন করে।
হাতে লেখা টেক্সট বের করা
হাতে লেখা টেক্সট রূপান্তর করা কঠিন। কিছু পদ্ধতি (গুগল ড্রাইভ, গুগল লেন্স) হাতে লেখার ক্ষেত্রে সমস্যা করে। AI-চালিত ইমেজ-টু-টেক্সট টুল বা বিশেষায়িত হ্যান্ডরাইটিং-টু-টেক্সট কনভার্টারগুলো সাধারণত আরও ভালো ফলাফল দেয়। নির্ভুলতা এখনও হাতের লেখার স্পষ্টতা এবং ছবির মানের উপর নির্ভর করে।
ইমেজ থেকে টেক্সট নিষ্কাশনের প্রয়োগ
সাধারণ ব্যবহারগুলোর মধ্যে রয়েছে:
- পড়াশোনা: বইয়ের পাতা, স্ক্রিনশট বা স্ক্যান করা নোট ডিজিটাইজ করা
- নোট নেওয়া: হাতে লেখা বা প্রিন্ট করা নোটকে ডিজিটাল টেক্সটে রূপান্তর করা
- ডেটা এন্ট্রি: সময় বাঁচাতে এবং হাতে এন্ট্রির ভুল কমাতে রসিদ, ফর্ম এবং টেবিল থেকে টেক্সট নিষ্কাশন করা
- অফিসের কাজ: কাগজবিহীন কর্মপ্রবাহকে সমর্থন করার জন্য ইমেল, প্রেজেন্টেশন বা স্ক্যান করা ডকুমেন্টের ছবি থেকে টেক্সট কপি করা
উপসংহার
এই পাঁচটি পদ্ধতি—অনলাইন ইমেজ টেক্সট এক্সট্র্যাক্টর, গুগল ড্রাইভ, মাইক্রোসফট ওয়ার্ড, এআই টুলস এবং গুগল লেন্স—ইমেজ থেকে টেক্সট নিষ্কাশনের বেশিরভাগ প্রয়োজন মেটায়। আপনার ইমেজের ফরম্যাট, টেক্সটের মান এবং গোপনীয়তার প্রয়োজনীয়তার জন্য সবচেয়ে উপযুক্ত পদ্ধতিটি বেছে নিন। প্রতিটি পদ্ধতির নির্ভুলতা এবং ফরম্যাটিং সংরক্ষণের ক্ষেত্রে কিছু সীমাবদ্ধতা রয়েছে, তাই প্রয়োজনে প্রুফরিড করুন এবং পুনরায় ফরম্যাট করুন।