Teksto ištraukimas iš vaizdų: 5 nemokami, paprasti metodai
Kasmet internete įkeliama daugiau nei trilijonas vaizdų, ir daugelyje jų yra naudingo teksto – citatų, statistikos ar ištraukų, kurias reikia suskaitmeninti (pavyzdžiui, reta knyga bibliotekoje). Laimei, yra keletas paprastų būdų, kaip išgauti tekstą iš paveikslėlių. Šiame straipsnyje apžvelgiami penki veiksmingi, nemokami metodai, kaip konvertuoti vaizdų tekstą į redaguojamą, ieškomą tekstą, taip pat dažniausiai pasitaikantys naudojimo atvejai ir apribojimai.
Kaip išgauti tekstą iš paveikslėlio
Tekstą iš vaizdų galite išgauti keliais būdais, įskaitant:
- Naudojant internetinį vaizdų konvertavimo į tekstą įrankį (OCR)
- Vaizdo konvertavimą į redaguojamą tekstą naudojant „Google“ diską
- Naudojant „Microsoft Word“ arba dirbtinio intelekto pokalbių įrankius
- Naudojant mobiliuosius įrankius, tokius kaip „Google Lens“
Žemiau pateikiami penki praktiniai metodai ir nuoseklios instrukcijos.
- Naudokite vaizdų teksto ištraukiklį (internetinį OCR) Vaizdų teksto ištraukiklis yra greičiausias ir tiesiausias pasirinkimas. Dauguma internetinių įrankių palaiko įprastus vaizdo formatus (PNG, JPG, WEBP) ir PDF failus ir pateikia redaguojamą tekstą, kurį galite nukopijuoti arba atsisiųsti.
Tipiniai veiksmai:
-
Naršyklėje atidarykite vaizdo konvertavimo į tekstą paslaugą (pvz., „Image To Text Converter“ arba kitą nemokamą OCR).
-
Įkelkite arba nuvilkite vaizdą arba PDF failą.
-
(Pasirinktinai) Naudokite redaktorių, kad apkirptumėte arba pasuktumėte vaizdą, jog įrankis nuskaitytų tik norimą sritį.
-
Spustelėkite „Konvertuoti“ (arba „Išskleisti“) ir palaukite kelias sekundes.
-
Atsisiųskite rezultatą kaip TXT, DOC arba PDF arba nukopijuokite išvestį į iškarpinę.
Pastabos: Konvertavimo greitis priklauso nuo failo dydžio. Šiuolaikinės OCR priemonės, papildytos dirbtiniu intelektu, dažnai tiksliau apdoroja sudėtingus išdėstymus ir triukšmingus fonus.
- Konvertuokite vaizdą naudodami „Google“ diską („Google“ dokumentus) „Google“ diskas gali išgauti tekstą iš vaizdų, atidarydamas juos „Google“ dokumentuose. Tai patogu ir nemokama, nors formatavimas gali būti neišsaugotas.
Veiksmai:
-
Įkelkite vaizdą arba PDF failą į „Google“ diską.
-
Dešiniuoju pelės mygtuku spustelėkite failą > Atidaryti naudojant > „Google“ dokumentai.
-
Atidaromas naujas dokumentų failas su vaizdu ir ištrauktu, ieškomu tekstu po juo.
Pastabos: „Google“ dokumentams dažnai sunku išlaikyti originalų formatavimą ir sudėtingus išdėstymus, todėl tikėkitės, kad reikės redaguoti ir performatuoti išvestį.
- Išskirkite tekstą naudodami „Microsoft Word“ „Word“ gali išgauti tekstą iš vaizdo konvertuodama srautą į Dokumentas -> PDF -> „Word“. Tai naudinga, jei jau dirbate su „Word“.
Veiksmai:
-
Įterpkite vaizdą į naują „Word“ dokumentą.
-
Įrašykite dokumentą kaip PDF (Failas > Įrašyti kaip > PDF).
-
Dešiniuoju pelės mygtuku spustelėkite PDF failą ir atidarykite jį naudodami „Microsoft Word“ (arba atidarykite „Word“ ir pasirinkite Failas > Atidaryti > pasirinkti PDF failą).
-
„Word“ paragins konvertuoti PDF failą; patvirtinkite ir peržiūrėkite ištrauktą tekstą.
Pastabos: tikslumas priklauso nuo vaizdo kokybės; nuskaityti vaizdai arba mažos raiškos nuotraukos gali duoti prastus rezultatus.
- Naudokite dirbtinio intelekto įrankius, kurie palaiko vaizdus Daugelis dirbtinio intelekto pokalbių robotų ir asistentų (pvz., „ChatGPT“ su vaizdų palaikymu, „Claude“, „Gemini“) gali skaityti ir išgauti tekstą iš įkeltų vaizdų.
Veiksmai:
-
Atidarykite pasirinktą dirbtinio intelekto įrankį ir įkelkite vaizdą. 2. Paprašykite asistento „ištraukti tekstą iš šio paveikslėlio“ (arba pateikti panašų raginimą).
-
Nukopijuokite ištrauktą tekstą iš dirbtinio intelekto atsakymo.
Pastabos: dirbtinio intelekto įrankiai gali būti ypač naudingi mišriam turiniui, daugiakalbiam tekstui arba kai norite, kad įrankis apibendrintų arba performatuotų išvestį. Jei paveikslėlyje yra neskelbtinos informacijos, patikrinkite kiekvieno įrankio privatumo politiką.
- Ištraukite tekstą naudodami „Google Lens“ (mobiliesiems) „Google Lens“ teikia greitą konvertavimą iš kameros į tekstą mobiliuosiuose įrenginiuose.
Veiksmai:
-
Atidarykite „Google Lens“ arba „Google“ nuotraukų programėlę ir pasirinkite nuotrauką arba naudokite „Lens“ kameros tiesioginį vaizdą.
-
Palieskite „Pasirinkti tekstą“, kad pažymėtumėte norimą tekstą.
-
Palieskite „Kopijuoti“, kad nukopijuotumėte tekstą į iškarpinę, arba naudokite integruotas parinktis, pvz., „Ieškoti“ arba „Versti“. Pastabos: „Google Lens“ yra greitas ir gerai veikia su spausdintu tekstu nuotraukose. Jis gali būti mažiau patikimas su netvarkingu ranka rašytu tekstu.
Kokia technologija leidžia išgauti vaizdų tekstą?
Optinis simbolių atpažinimas (OCR) yra pagrindinė technologija, naudojama vaizdų pagrindu sukurtam tekstui skaityti ir konvertuoti į skaitmeninį tekstą. Šiuolaikinės OCR sistemos dažnai apima dirbtinį intelektą ir mašininį mokymąsi, kad pagerintų tikslumą, atpažintų įvairius šriftus ir tvarkytų triukšmingus ar sudėtingus fonus.
Teksto išgavimas iš PDF vaizdų
Vaizdų teksto išgavimo priemonė (OCR) paprastai yra efektyviausias PDF vaizdų pasirinkimas. PDF failams konvertuoti taip pat galite naudoti „Google Docs“ arba „Word“, tačiau rezultatai gali nukentėti, jei PDF yra nuskaitytas vaizdas arba vaizdo kokybė yra prasta. Norėdami gauti geresnių rezultatų, naudokite OCR įrankį, kuris palaiko PDF įvestį ir dirbtinio intelekto patobulintą atpažinimą.
Ranka rašyto teksto išgavimas
Ranka rašytą tekstą sunkiau konvertuoti. Kai kurie metodai („Google“ diskas, „Google Lens“) sunkiai skaito ranka rašytą tekstą. Dirbtinio intelekto valdomi vaizdo į tekstą įrankiai arba specializuoti ranka rašyto teksto keitikliai paprastai pateikia geresnius rezultatus. Tikslumas vis tiek priklauso nuo ranka rašyto teksto įskaitomumo ir vaizdo kokybės.
Vaizdo teksto išgavimo taikymas
Dažniausiai naudojami:
- Mokymasis: knygų puslapių, ekrano kopijų ar nuskaitytų užrašų skaitmeninimas
- Užrašų darymas: ranka rašytų ar spausdintų užrašų konvertavimas į skaitmeninį tekstą
- Duomenų įvedimas: teksto išgavimas iš kvitų, formų ir lentelių, siekiant sutaupyti laiko ir sumažinti rankinio įvedimo klaidas
- Darbas biure: teksto kopijavimas iš vaizdų el. laiškuose, pristatymuose ar nuskaitytuose dokumentuose, siekiant palaikyti darbo eigą be popieriaus
Išvada
Šie penki metodai – internetiniai vaizdų teksto išgavimo įrankiai, „Google“ diskas, „Microsoft Word“, dirbtinio intelekto įrankiai ir „Google Lens“ – patenkina daugumą teksto išgavimo iš vaizdų poreikių. Pasirinkite metodą, kuris geriausiai atitinka jūsų vaizdo formatą, teksto kokybę ir privatumo reikalavimus. Kiekvienas metodas turi kompromisų tikslumo ir formatavimo išsaugojimo srityje, todėl prireikus patikrinkite ir performatuokite.