ছবি থেকে টেক্সট বের করা: ৫টি বিনামূল্যে, সহজ পদ্ধতি
প্রতি বছর অনলাইনে এক ট্রিলিয়নেরও বেশি ছবি আপলোড করা হয় এবং এর মধ্যে অনেকগুলিতে দরকারী টেক্সট থাকে—উদ্ধৃতি, পরিসংখ্যান, অথবা প্যাসেজ যা ডিজিটাইজ করা প্রয়োজন (উদাহরণস্বরূপ, লাইব্রেরিতে থাকা একটি বিরল বই)। সৌভাগ্যবশত, ছবি থেকে টেক্সট বের করার বেশ কয়েকটি সহজ উপায় রয়েছে। এই নিবন্ধটি আপনাকে ছবির টেক্সটকে সম্পাদনাযোগ্য, অনুসন্ধানযোগ্য টেক্সটে রূপান্তর করার জন্য পাঁচটি কার্যকর, বিনামূল্যের পদ্ধতি, এবং সাধারণ ব্যবহারের ক্ষেত্রে এবং সীমাবদ্ধতা সম্পর্কে আলোচনা করবে।
ছবি থেকে টেক্সট কীভাবে বের করবেন
আপনি একাধিক উপায়ে ছবি থেকে টেক্সট বের করতে পারেন, যার মধ্যে রয়েছে:
- একটি অনলাইন ইমেজ-টু-টেক্সট এক্সট্র্যাক্টর (OCR) ব্যবহার করা
- গুগল ড্রাইভের মাধ্যমে একটি ছবিকে সম্পাদনাযোগ্য টেক্সটে রূপান্তর করা
- মাইক্রোসফ্ট ওয়ার্ড বা এআই চ্যাট টুল ব্যবহার করা
- গুগল লেন্সের মতো মোবাইল টুল ব্যবহার করা
নীচে পাঁচটি ব্যবহারিক পদ্ধতি এবং ধাপে ধাপে নির্দেশাবলী দেওয়া হল।
১. একটি ইমেজ টেক্সট এক্সট্র্যাক্টর (অনলাইন OCR) ব্যবহার করুন
একটি ইমেজ টেক্সট এক্সট্র্যাক্টর হল দ্রুততম, সবচেয়ে সরাসরি বিকল্প। বেশিরভাগ অনলাইন টুল সাধারণ ইমেজ ফরম্যাট (PNG, JPG, WEBP) এবং PDF সমর্থন করে এবং আপনি কপি বা ডাউনলোড করতে পারেন এমন সম্পাদনাযোগ্য টেক্সট ফেরত দেবে।
সাধারণ ধাপ:
১. আপনার ব্রাউজারে ইমেজ-টু-টেক্সট পরিষেবা খুলুন (যেমন, ইমেজ টু টেক্সট কনভার্টার বা অন্য কোনও বিনামূল্যের OCR)।
২. ইমেজ বা PDF আপলোড বা টেনে এনে ছেড়ে দিন। ৩. (ঐচ্ছিক) ইমেজটি ক্রপ বা ঘোরানোর জন্য এডিটর ব্যবহার করুন যাতে টুলটি কেবল পছন্দসই এলাকাটি পড়ে।
৪. কনভার্ট (অথবা এক্সট্র্যাক্ট) এ ক্লিক করুন এবং কয়েক সেকেন্ড অপেক্ষা করুন। ৫. ফলাফলটি TXT, DOC, অথবা PDF হিসাবে ডাউনলোড করুন, অথবা আউটপুটটি আপনার ক্লিপবোর্ডে কপি করুন।
বিঃদ্রঃ: রূপান্তরের গতি ফাইলের আকারের উপর নির্ভর করে। AI দিয়ে বর্ধিত আধুনিক OCR সরঞ্জামগুলি প্রায়শই জটিল লেআউট এবং কোলাহলপূর্ণ ব্যাকগ্রাউন্ডগুলিকে আরও সঠিকভাবে পরিচালনা করে।
- Google Drive (Google Docs) দিয়ে ছবি রূপান্তর করুন Google Drive ছবিগুলিকে Google Docs-এ খোলার মাধ্যমে সেগুলো থেকে টেক্সট বের করতে পারে। এটি সুবিধাজনক এবং বিনামূল্যে, যদিও ফর্ম্যাটিং সংরক্ষণ করা নাও হতে পারে।
পদক্ষেপ:
১. ছবি বা PDF গুগল ড্রাইভে আপলোড করুন।
২. ফাইলটিতে ডান-ক্লিক করুন > গুগল ডক্স দিয়ে খুলুন।
৩. একটি নতুন ডক্স ফাইল খুলবে যেখানে ছবিটি এবং এর নীচে এক্সট্র্যাক্ট করা, অনুসন্ধানযোগ্য টেক্সট থাকবে।
দ্রষ্টব্য: গুগল ডক্স প্রায়শই মূল ফর্ম্যাটিং এবং জটিল লেআউট ধরে রাখতে লড়াই করে, তাই আউটপুট প্রুফরিড এবং পুনরায় ফর্ম্যাট করার আশা করে।
১. মাইক্রোসফ্ট ওয়ার্ড ব্যবহার করে টেক্সট এক্সট্র্যাক্ট করুন ডকুমেন্ট -> পিডিএফ -> ওয়ার্ড ফ্লো রূপান্তর করে ওয়ার্ড একটি ছবি থেকে টেক্সট এক্সট্র্যাক্ট করতে পারে। আপনি যদি ইতিমধ্যেই ওয়ার্ডের সাথে কাজ করেন তবে এটি কার্যকর।
পদক্ষেপ:
১. একটি নতুন ওয়ার্ড ডকুমেন্টে ছবিটি সন্নিবেশ করান।
২. ডকুমেন্টটি PDF হিসেবে সংরক্ষণ করুন (ফাইল > সেভ অ্যাজ > PDF)।
৩. PDF-এ রাইট-ক্লিক করুন এবং Microsoft Word দিয়ে এটি খুলুন (অথবা Word খুলুন এবং File > Open > PDF নির্বাচন করুন)।
৪. Word PDF রূপান্তর করতে বলবে; এক্সট্রাক্ট করা টেক্সট নিশ্চিত করুন এবং পর্যালোচনা করুন।
দ্রষ্টব্য: ছবির মানের উপর নির্ভর করে নির্ভুলতা পরিবর্তিত হয়; স্ক্যান করা ছবি বা কম রেজোলিউশনের ছবি খারাপ ফলাফল দিতে পারে।
১. ছবি সমর্থনকারী AI টুল ব্যবহার করুন অনেক AI চ্যাটবট এবং সহকারী (যেমন, ইমেজ সাপোর্ট সহ ChatGPT, Claude, Gemini) আপলোড করা ছবি থেকে টেক্সট পড়তে এবং এক্সট্রাক্ট করতে পারে।
ধাপ:
১. আপনার পছন্দের AI টুলটি খুলুন এবং ছবি আপলোড করুন। ২. সহকারীকে "এই ছবি থেকে টেক্সট এক্সট্রাক্ট" (অথবা অনুরূপ প্রম্পট) করতে বলুন।
৩. AI প্রতিক্রিয়া থেকে এক্সট্রাক্ট করা টেক্সট কপি করুন।
দ্রষ্টব্য: AI টুলগুলি মিশ্র কন্টেন্ট, বহু-ভাষার টেক্সট, অথবা যখন আপনি টুলটি আউটপুট সংক্ষিপ্ত বা পুনরায় ফর্ম্যাট করতে চান তখন বিশেষভাবে সহায়ক হতে পারে। ছবিতে সংবেদনশীল তথ্য আছে কিনা তা প্রতিটি টুলের গোপনীয়তা নীতি পরীক্ষা করে দেখুন।
১. গুগল লেন্স (মোবাইল) দিয়ে টেক্সট এক্সট্র্যাক্ট করুন গুগল লেন্স মোবাইল ডিভাইসে দ্রুত, ক্যামেরা থেকে টেক্সট রূপান্তর প্রদান করে।
ধাপ:
১. গুগল লেন্স অথবা গুগল ফটো অ্যাপ খুলুন এবং ছবি নির্বাচন করুন, অথবা লেন্স ক্যামেরা লাইভ ব্যবহার করুন। ২. আপনার পছন্দের টেক্সট হাইলাইট করতে "টেক্সট নির্বাচন করুন" এ ট্যাপ করুন। ৩. আপনার ক্লিপবোর্ডে টেক্সট কপি করতে "কপি করুন" এ ট্যাপ করুন, অথবা "অনুবাদ করুন" এর মতো অন্তর্নির্মিত বিকল্পগুলি ব্যবহার করুন। দ্রষ্টব্য: গুগল লেন্স দ্রুত এবং ছবিতে মুদ্রিত লেখার জন্য ভালো কাজ করে। অগোছালো হাতের লেখার জন্য এটি কম নির্ভরযোগ্য হতে পারে।
কোন প্রযুক্তি ইমেজ টেক্সট এক্সট্রাকশনকে শক্তিশালী করে?
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) হল মূল প্রযুক্তি যা ইমেজ-ভিত্তিক টেক্সট পড়ার এবং ডিজিটাল টেক্সটে রূপান্তর করার জন্য ব্যবহৃত হয়। আধুনিক OCR সিস্টেমগুলি প্রায়শই সঠিকতা উন্নত করতে, বিভিন্ন ফন্ট সনাক্ত করতে এবং কোলাহলপূর্ণ বা জটিল ব্যাকগ্রাউন্ড পরিচালনা করতে AI এবং মেশিন লার্নিং ব্যবহার করে।
PDF ছবি থেকে টেক্সট এক্সট্রাক্ট করা
একটি ইমেজ টেক্সট এক্সট্রাক্টর (OCR) সাধারণত PDF ছবির জন্য সবচেয়ে কার্যকর পছন্দ। আপনি PDF রূপান্তর করতে Google Docs বা Word ব্যবহার করতে পারেন, তবে PDF স্ক্যান করা ছবি হলে বা ছবির মান কম হলে ফলাফল খারাপ হতে পারে। আরও ভালো ফলাফলের জন্য, PDF ইনপুট এবং AI-বর্ধিত স্বীকৃতি সমর্থন করে এমন একটি OCR টুল ব্যবহার করুন।
হাতে লেখা টেক্সট এক্সট্রাক্ট করা
হাতে লেখা টেক্সট রূপান্তর করা কঠিন। কিছু পদ্ধতি (গুগল ড্রাইভ, গুগল লেন্স) হাতের লেখার সাথে লড়াই করে। AI-চালিত ইমেজ-টু-টেক্সট টুল বা বিশেষায়িত হাতের লেখা-টু-টেক্সট কনভার্টার সাধারণত ভাল ফলাফল প্রদান করে। সঠিকতা এখনও হাতের লেখার সুস্পষ্টতা এবং ছবির মানের উপর নির্ভর করে।
ছবির লেখা নিষ্কাশনের প্রয়োগ
সাধারণ ব্যবহারের মধ্যে রয়েছে:
- অধ্যয়ন: বইয়ের পৃষ্ঠা, স্ক্রিনশট, অথবা স্ক্যান করা নোট ডিজিটাইজ করা
- নোট নেওয়া: হাতে লেখা বা মুদ্রিত নোটগুলিকে ডিজিটাল টেক্সটে রূপান্তর করা
- ডেটা এন্ট্রি: সময় বাঁচাতে এবং ম্যানুয়াল এন্ট্রি ত্রুটি কমাতে রসিদ, ফর্ম এবং টেবিল থেকে টেক্সট বের করা
- অফিসের কাজ: কাগজবিহীন কর্মপ্রবাহ সমর্থন করার জন্য ইমেল, উপস্থাপনা বা স্ক্যান করা নথিতে ছবি থেকে টেক্সট কপি করা
উপসংহার
এই পাঁচটি পদ্ধতি—অনলাইন ইমেজ টেক্সট নিষ্কাশনকারী, গুগল ড্রাইভ, মাইক্রোসফ্ট ওয়ার্ড, এআই টুলস এবং গুগল লেন্স—ছবি থেকে টেক্সট বের করার বেশিরভাগ চাহিদা পূরণ করে। আপনার ছবির ফর্ম্যাট, টেক্সটের মান এবং গোপনীয়তার প্রয়োজনীয়তার জন্য সবচেয়ে উপযুক্ত পদ্ধতিটি বেছে নিন। প্রতিটি পদ্ধতির নির্ভুলতা এবং ফর্ম্যাটিং সংরক্ষণের ক্ষেত্রে ট্রেড-অফ রয়েছে, তাই প্রয়োজনে প্রুফরিড এবং পুনরায় ফর্ম্যাট করুন।