Всеосвіта

Головне меню порталу

Головне меню порталу

Основи статистичного аналізу даних. Ряди даних. Обчислення основних статистичних характеристик вибірки

Інформатика

Для кого: 10 Клас

8 проходжень

2 запитань

28.11.2022

98

0

Вміст уроку:

Завдання №1 Теоретичний блок

Завдання №2 Теоретичний блок

Аналіз даних — розділ математики та інформатики, що займається розробкою методів опрацювання даних незалежно від їх природи.

Для аналізу даних потрібні знання предметної області та знання математики й статистики.

Статистика (від лат. status — стан) — це наука про отримання, опрацювання й аналіз кількісних даних, які характеризують масові явища.

Розрізняють чотири етапи аналізу даних:

1. Отримання даних;

2. Опрацювання даних;

3. Аналіз результатів опрацювання даних;

4. Інтерпретація результатів.
Багаторазове вимірювання та збереження при цьому відповідних результатів приводить до накопичення даних, які опрацьовують спеціальними методами, які вивчаються у статистиці. Такі дані називаються статистичними даними.

Статистичні дані — сукупність упорядкованих, класифікованих  даних про деяке масове явище або процес.

Статистичні дані дають змогу не тільки охопити картину певного питання на даний час, а й планувати необхідні дії на майбутнє.

Велику множину об’єктів, що є предметом статистичного дослідження, називають генеральною„ сукупністю.

Дослідник, як правило, не має змоги оперувати всією генеральною сукупністю. Наприклад, опитати кожного громадянина країни нереально. Натомість досліджують вибірку — деяку множину об’єктів, вибраних з генеральної сукупності, і, проаналізувавши її, роблять висновки щодо властивостей генеральної сукупності загалом.
Маючи в розпорядженні дані статистичного спостереження, що характеризують те чи інше явище, перш за все необхідно їх упорядкувати, тобто надати характер системності.

Статистичний ряд розподілу — це впорядковані статистичні дані.

Ряди розподілу одиниць сукупності за ознаками, що мають кількісний вираз, називаються варіаційними рядами. У таких рядах значення ознаки (варіанти) розташовані в порядку зростання або спадання.

Варіанта — це окреме значення групувальної ознаки; частота — число, яке показує, скільки разів трапляється кожна варіанта

Дискретні варіаційні ряди — це такі ряди розподілу, в яких варіанта як величина кількісної ознаки може набувати тільки певного значення.
Інтервальні варіаційні ряди —
такі ряди розподілу, в яких значення варіанти дано у вигляді інтервалів, тобто значення ознак можуть відрізнятися одне від одного на як завгодно малу величину.

Основними статистичними характеристиками вибірки є середнє, мода та медіана, які ще називають мірами центральної тенденції.

Медіану можна визначити як точку на ряді розподілу (впорядкований набір значень змінної для різних спостережень).

Мода — це значення, яке найчастіше трапляється.

У табличному процесорі центральна тенденція представлена функціями з категорії Статистичні, та майже всі вони призначені для обчислення узагальнювальних статистичних характеристик вибірки.
Найважливішими функціями категорії Статистичні є:

  • AVERAGE (число1; число2;…) (рос. СРЗНАЧ) — обчислює середнє значення;

  • МАХ (число1; число2;…) (рос. МАКС) — обчислює максимальне значення;

  • МІN (число1; число2;…) (рос. МИН) — обчислює мінімальне значення;

  • МЕDІАN (число1; число2;…) (рос. МЕДИАНА) — повертає медіану;

  • МОDЕ (число1; число2;…) (рос. МОДА) — повертає моду;

  • RANK (число; посилання; порядок) (рос. РАНГ) — повертає ранг числа у списку чисел, тобто його номер у впорядкованій послідовності чисел із вказаного діапазону.

Рефлексія від 6 учнів

Сподобався

6 0

Зрозумілий

6 0

Потрібні роз'яснення

6 0