Урок:

OCR-технології для розпізнавання тексту з паперових документів"

16.04.2025
1 0
Вміст уроку:
1
2
3
4
5
6
7
8

Урок не містить жодного завдання. Додайте завдання.

Щоб додати завдання, оберіть категорію завдання на панелі запитань.

1

"OCR-технології для розпізнавання тексту з паперових документів"


🎯 Мета:

  • Ознайомитися з принципом роботи OCR (Optical Character Recognition).

  • Навчитися використовувати прості інструменти для розпізнавання тексту з зображення.

  • Отримати навички перевірки, редагування та збереження розпізнаного тексту.


🧰 Необхідне обладнання:

  • Комп’ютер з доступом до Інтернету або встановленим Python.

  • Встановлений Tesseract OCR (для версії з кодом).

  • Програма або сервіс:

2

📌 Частина 1: Теоретичний вступ (коротко для учнів)

OCR (оптичне розпізнавання символів) — це технологія, яка дозволяє "зчитати" текст із відсканованих документів або фотографій та перетворити його в редагований текстовий формат.

📄 Наприклад:

  • Скан паспорта → текстовий файл;

  • Фото сторінки книги → Word-документ.

3

3 з 12 балів

✅ Частина 2: Практика (онлайн)

🖥 Онлайн-варіант:

  1. Перейди на сайт: https://www.onlineocr.net

  2. Завантаж зображення (наприклад, фото сторінки з підручника).

  3. Обери мову: Ukrainian.

  4. Формат виводу: Text або Word.

  5. Натисни Convert.

  6. Скопіюй результат, перевір правильність розпізнавання.

  7. Збережи у файл: Розпізнаний_текст.txt

4

Частина 3: Практика з Python (поглиблений рівень)

📄 Вхідне зображення: document.png

5

5 з 12 балів

0800ni8f-0463-564x390.png

6

Пояснення:

  • pytesseract — інтерфейс до OCR-двигуна Tesseract.

  • imagetostring(...) — виконує розпізнавання.

  • lang="ukr" — задає мову розпізнавання.

  • open(...) — зберігає текст у файл.

7

3 з 12 балів

📝 Завдання для учнів:

  1. Знайди фото тексту (наприклад, уривок із книжки або документа).

  2. Розпізнай текст за допомогою онлайн-сервісу або Python-програми.

  3. Порівняй розпізнаний текст із оригіналом — виправ помилки.

  4. Збережи результат у .txt або .docx файл.

  5. Напиши 2–3 речення:
    Чи була точність розпізнавання високою?
    Де були помилки і чому вони могли виникнути?

8

1 з 12 балів

Розширення / проєкт:

  • Порівняй 2 OCR-сервіси (наприклад, onlineocr.net vs i2OCR.com).

  • Відскануй текст різного шрифту/якості — як це впливає на результат?

  • Створи таблицю точності розпізнавання (кількість помилок на 100 слів).


✅ Очікувані результати:

  • Учень вміє розпізнавати текст із зображень.

  • Розуміє, де OCR працює добре, а де — з помилками.

  • Отримує навичку обробки тексту з фото чи відсканованих документів.

Рефлексія від 0 учнів

Сподобався:

0

Так: 0

Ні: 0

Зрозумілий:

0

Так: 0

Ні: 0

Потрібні роз'яснення:

0

Ні: 0

Так: 0

Рекомендуємо

Офісні вебдодатки. Використання інтернет-середовищ для створення та публікації спільних документів різних видів. Рівні доступу. ГР2

Офісні вебдодатки. Використання інтернет-середовищ для створення та публікації спільних документів різних видів. Рівні доступу. ГР2

170

Аватар профіля Кутенський Василь Григорович
Інформатика
7 клас

50 грн

Практична робота № 2 «Хмарні сервіси»

Практична робота № 2 «Хмарні сервіси»

93

Аватар профіля Кутенський Василь Григорович
Інформатика
7 клас

50 грн

Тема: «Навчання в Інтернеті. Професії майбутнього – аналіз тенденцій на ринку праці. Роль інформаційної технології в роботі сучасного працівника»

Тема: «Навчання в Інтернеті. Професії майбутнього – аналіз тенденцій на ринку праці. Роль інформаційної технології в роботі сучасного працівника»

85

Аватар профіля Кутенський Василь Григорович
Інформатика
10 клас

83 грн

«Операції над файлами та папками» (Група 2, Група 3),

«Операції над файлами та папками» (Група 2, Група 3),

131

Аватар профіля Кутенський Василь Григорович
Інформатика
5 клас

50 грн

Практична робота 1. Виконання операцій над файлами та папками. ГР2, ГР3

Практична робота 1. Виконання операцій над файлами та папками. ГР2, ГР3

78

Аватар профіля Кутенський Василь Григорович
Інформатика
5 клас

50 грн

Тема: Системи керування вмістом для веб-ресурсів (CMS)

Тема: Системи керування вмістом для веб-ресурсів (CMS)

67

Аватар профіля Кутенський Василь Григорович
Інформатика
10 клас

50 грн

Схожі уроки

Впорядкування, пошук і фільтрування даних.

Впорядкування, пошук і фільтрування даних.

1292

Аватар профіля Вожга Ірина Леонідівна
Інформатика
9 клас

Створення й уведення структури таблиць. Поняття таблиці, поля, запису. Створення таблиць, означення полів і ключів у середовищі СКБД. Властивості полів, типи даних.

Створення й уведення структури таблиць. Поняття таблиці, поля, запису. Створення таблиць, означення полів і ключів у середовищі СКБД. Властивості полів, типи даних.

1115

Аватар профіля Савка-Ржематорська Оксана Василівна
Інформатика
9 клас

Цикли з передумовою у вкладених циклах

Цикли з передумовою у вкладених циклах

1346

Аватар профіля Вожга Ірина Леонідівна
Інформатика
6 клас

Налаштування часових параметрів аудіо- та відеоряду.

Налаштування часових параметрів аудіо- та відеоряду.

498

Аватар профіля Солодовнікова Катерина Олексіївна
Інформатика
8 клас

Елемент керування «кнопка». Поняття об’єкту та його властивостей і методів (на прикладі елементів екранної форми). Властивості і методи елементів керування.

Елемент керування «кнопка». Поняття об’єкту та його властивостей і методів (на прикладі елементів екранної форми). Властивості і методи елементів керування.

653

Аватар профіля Пилипенко Олена Володимирівна
Інформатика
8 клас

Елемент керування кнопка

Елемент керування кнопка

284

Аватар профіля Пилипенко Олена Володимирівна
Інформатика
8 клас