COUNTIF
Функція COUNTIF повертає кількість клітинок у збірнику, які задовольняють задану умову.
COUNTIF(перевірити-масив; умова)
перевірити-масив: збірник, що містить значення для перевірки. Аргумент перевірити-масив може містити будь-який тип значення.
умова: вираз, який порівнює чи перевіряє значення, даючи в результаті логічне значення TRUE або FALSE. умова може містити оператори порівнювання, константи, оператор об’єднання (амперсанд), посилання та символи підстановки. Символи підстановки можна використовувати для заміни одного чи кількох символів у виразі. Ви можете використовувати «?» (знак питання), щоб замінити один символ, знак «*» (зірочка) для замінення кількох символів, а знак «~» (тильда), щоб указати, що наступний символ необхідно дібрати, а не використовувати як символ підстановки. умова замість символів підстановки може містити функцію REGEX.
Примітки
Кожне значення перевірити-масив порівнюється з аргументом умова. Якщо значення задовольняє умову, воно включається в підрахунок.
Приклади |
---|
Дані в наведеній таблиці не є змістовними, проте вони дають зрозуміти, який тип аргументів функція COUNTIF включає в свої результати. Задано наведену нижче таблицю: |
A | B | C | D | |
---|---|---|---|---|
1 | 100 | 200 | 300 | 400 |
2 | lorem | ipsum | dolor | sit |
3 | 100 | 200 | 300 | sit |
4 | TRUE | TRUE | FALSE | FALSE |
5 | 200 | 400 |
=COUNTIF(A1:D1; ">0") повертає 4, оскільки всі клітинки в збірнику мають значення, більше нуля. =COUNTIF(A3:D3; ">=100") повертає 3, оскільки всі три числа більші або дорівнюють 100, а текстове значення ігнорується в порівнянні. =COUNTIF(A1:D5; "=ipsum") повертає 1, оскільки текстовий рядок перевірки «ipsum» один раз з’являється в збірнику, на який посилається діапазон. =COUNTIF(A1:D5; "=*t") повертає 2, оскільки рядок, який закінчується буквою «t», з’являється двічі в збірнику, на який посилається діапазон. |
Приклад — результати опитування |
---|
У цьому прикладі зібрано ілюстрації застосування статистичних функцій. Він базований на гіпотетичному опитуванні. Опитування було коротким (5 питань) і мале невелику кількість респондентів (10). На кожне питання можна було дати відповідь за шкалою від 1 до 5 (припустімо, в діапазоні від «ніколи» до «завжди») або не відповідати. Кожне опитування отримало порядковий номер (ID#) перед відправленням. У таблиці нижче наведено результати опитування. Питання, відповіді на яких виявилися поза діапазоном припустимих значень (неправильні або без відповіді), в таблиці позначені порожніми клітинками. |
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
1 | ID# | Q1 | Q2 | Q3 | Q4 | Q5 |
2 | 101 | 5 | 4 | 4 | 3 | 4 |
3 | 105 | 3 | 2 | 2 | 3 | 3 |
4 | 102 | 4 | 4 | 4 | 4 | |
5 | 104 | 3 | 4 | 2 | 4 | 3 |
6 | 107 | 4 | 3 | 3 | ||
7 | 106 | 4 | 3 | 3 | 4 | |
8 | 109 | 3 | 4 | 1 | 3 | 4 |
9 | 111 | 5 | 2 | 2 | 5 | 3 |
10 | 121 | 4 | 2 | 3 | 3 | 4 |
11 | 115 | 3 | 3 | 3 | 3 |
Для ілюстрації застосування функцій припустімо, що порядкові номери анкет мають буквений префікс і що шкала відповідей була A–E, а не 1–5. Тоді таблиця виглядатиме так: |
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
1 | ID# | Q1 | Q2 | Q3 | Q4 | Q5 |
2 | 101 | E | D | D | C | D |
3 | 105 | C | B | B | C | C |
4 | 102 | D | D | D | D | |
5 | 104 | C | D | B | D | C |
6 | 107 | D | C | C | ||
7 | 106 | D | C | C | D | |
8 | 109 | C | D | A | C | D |
9 | 111 | E | B | B | E | C |
10 | 121 | D | B | C | D | |
11 | 115 | C | C | C | C | C |
Використовуючи цю таблицю даних і доступні статистичні функції, можна отримати певні висновки з результатів опитування. Пам’ятайте, що приклад не дуже об’ємний, тому результати можуть здатися очевидними. Якщо взяти більшу кількість респондентів і питань, то результати аналізу вже не видаватимуться очевидними. |
Функція й аргументи | Опис результатів |
---|---|
=CORREL(B2:B11;C2:C11) | Визначає кореляцію питання 1 і питання 2 за допомогою аналізу лінійної регресії. Кореляція — це міра того, наскільки близько дві змінні (в цьому випадку, відповіді в анкеті) змінюються разом. Ось як це виглядає в питаннях: Якщо респондент на питання 1 дав відповідь вищу (чи нижчу), ніж середнє значення відповіді для питання 1, то чи дав респондент на питання 2 відповідь так саму вищу (або нижчу) за середнє значення відповідей на питання 2? У цьому прикладі відповіді не дуже добре корелюють (-0,1732) |
=COUNT(A2:A11) чи =COUNTA(A2:A11) | Визначає загальну кількість заповнених анкет (10). Зверніть увагу, що якщо номер анкети не числовий, потрібно використовувати функцію COUNTA, а не COUNT. |
=COUNT(B2:B11) чи =COUNTA(B2:B11) | Визначає загальну кількість відповідей на перше запитання (9). Розширивши цю формулу в даному рядку, можна визначити загальну кількість відповідей на кожне з питань. Оскільки всі дані є числовими, функція COUNTA поверне такі самі результати. Якщо ж в опитуванні для нумерації анкет використовуються літери A-E замість цифр 15, потрібно вибрати функцію COUNTA, щоб отримати правильні результати. |
=COUNTBLANK(B2:B11) | Визначає кількість порожніх клітинок, що позначають неправильні чи відсутні відповіді. Якщо розширити цю формулу в даному рядку, то виявиться, що питання 3 (стовпець D) має 3 неправильні відповіді. Це може спонукати вас до перегляду формулювання питання в анкеті, щоб воно не було настільки погано сформульованим, адже жодне з інших питань не має такої кількості неправильних відповідей. |
=COUNTIF(B2:B11;"=5") | Визначає кількість респондентів, що дали відповідь 5 на певне питання (в цьому прикладі — на питання 1). Якщо розширити цю формулу на даний рядок, ви дізнаєтеся, що респонденти дали відповідь 5 тільки на питання 1 і 4. Якщо анкети пронумеровані від А до E, потрібно використати функцію =COUNTIF(B2:B11;"=E"). |
=COVAR(B2:B11;C2:C11) | Визначає коваріацію питань 1 і 2. Коваріація — це міра того, наскільки близько дві змінні (в цьому випадку, відповіді в анкеті) змінюються разом. Ось як це виглядає в питаннях: Якщо респондент на питання 1 дав відповідь вищу (чи нижчу), ніж середнє значення відповіді для питання 1, то чи дав респондент на питання 2 відповідь так саму вищу (або нижчу) за середнє значення відповідей на питання 2? Примітка. Функція COVAR не працюватиме з таблицями з буквеними визначниками A–E, оскільки для неї потрібні тільки числові аргументи. |
=STDEV(B2:B11) чи =STDEVP(B2:B11) | Визначає стандартне відхилення — один із визначників дисперсії — для відповідей на питання 1. Якщо розширити цю формулу в даному рядку, то виявиться, що відповіді на питання 3 мають найвище стандартне відхилення. Якщо потрібно вивчити відповіді з усієї популяції опитаних, а не з певної вибірки, варто використовувати функцію STDEVP замість STDEV. Зауважте, що STDEV є квадратним коренем від функції VAR. |
=VAR(B2:B11) чи =VARP(B2:B11) | Визначає варіантність — один із визначників дисперсії — для відповідей на питання 1. Якщо розширити цю формулу в даному рядку, то виявиться, що відповіді на питання 5 мають найнижчу варіантність. Якщо потрібно вивчити відповіді з усієї популяції опитаних, а не з певної вибірки, варто використовувати функцію VARP замість VARP. Зауважте, що VARP є квадратом від функції VAR. |
Приклад використання REGEX |
---|
Задано наведену нижче таблицю: |
A | B | |
---|---|---|
1 | 45 | john@appleseed.com |
2 | 41 | Aaron |
3 | 29 | janedoe@appleseed.com |
4 | 64 | jake@appleseed.com |
5 | 12 | Sarah |
=COUNTIF(B1:B5, REGEX(“([A-Z0-9a-z._%+-]+)@([A-Za-z0-9.-]+\.[A-Za-z]{2,4})”)) повертає кількість клітинок з діапазону B1:B5, які містять електронні адреси. |