Если нужен быстрый маршрут: начните не с полного списка терминов, а с пяти зон риска.
- P0: вход, деньги, данные, ключевой сценарий и публикация в сторе.
- P1: скорость, уведомления, аналитика, популярные устройства и плохая сеть.
- P2: микротексты, редкие состояния, вторичные анимации и полировка.
- Ручная проверка: смысл, удобство, реальные устройства и релизное решение.
- Автотесты: повторяемый регресс, API, сборка и критичные сценарии.
1. Короткий ответ: приложение тестируют не «видами», а рисками
В учебниках и курсах можно встретить десятки видов тестирования: функциональное, регрессионное, модульное, интеграционное, нагрузочное, приемочное, исследовательское, тестирование безопасности, совместимости, доступности и так далее. Список полезный, но для бизнеса он часто создает ложное ощущение: будто качество появляется, когда команда прошла все пункты подряд.
На практике сильный QA начинается с другого вопроса: какой сбой будет стоить дороже всего именно этому приложению? Для маркетплейса это может быть оплата и каталог. Для медицинского сервиса — данные, роли и приватность. Для приложения с подпиской — восстановление покупки, списание, пробный период и поддержка пользователя. Для B2B-приложения — интеграции, права доступа и стабильность на корпоративных устройствах.
Android Developers в официальной документации, обновленной 19 мая 2026 года, тоже предлагает смотреть на тесты через предмет проверки, глубину и место запуска. Для бизнеса здесь важна не классификация сама по себе, а перевод этой рамки в риск конкретного продукта: что сломает оплату, данные, публикацию, удержание или доверие.
Практический вывод: не спрашивайте «какие виды тестирования существуют?». Спрашивайте: «какие проверки закрывают P0-риски, какие защищают рост, а какие можно перенести в следующую итерацию?»
2. Сначала разберем путаницу: виды, уровни, методы и этапы
Большая часть споров о тестировании возникает из-за терминов. Один человек говорит «виды тестирования» и имеет в виду нагрузку, безопасность и UX. Второй думает про модульные, интеграционные и сквозные проверки. Третий — про ручные проверки и автотесты. Все трое частично правы, но смешивают разные оси.
Виды отвечают на вопрос «что проверяем»
- Функциональность: приложение делает то, что обещано в сценарии.
- Интеграции: API, платежи, CRM, уведомления, аналитика и внешние сервисы работают вместе.
- Совместимость: iOS, Android, версии ОС, устройства, сеть, язык, разрешения и обновления не ломают сценарий.
- Производительность и стабильность: приложение быстро стартует, не зависает, не падает и не съедает ресурсы сверх меры.
- Безопасность и приватность: данные, роли, токены, права доступа, SDK и API не создают лишний риск.
- Доступность и удобство: интерфейс понятен, не ловит пользователя в тупик и доступен людям с разными ограничениями.
Уровни отвечают на вопрос «на какой глубине проверяем»
ISTQB CTFL v4.0.1 фиксирует привычные уровни: модульный, интеграция компонентов, системный, системная интеграция и приемка. Перевод на обычный язык простой: сначала проверяем маленькие части, затем связи между ними, затем всю систему и готовность результата для пользователя или бизнеса.
Методы отвечают на вопрос «как проверяем»
Ручная проверка полезна там, где важны смысл, контекст, реальное устройство и исследование. Автотесты сильны там, где сценарий повторяемый и должен быстро проверяться на каждой сборке. Сквозные проверки подтверждают путь пользователя целиком, а исследовательские помогают найти то, что не попало в формальный сценарий.
Этапы отвечают на вопрос «когда проверяем»
Ошибка — оставлять QA на последнюю неделю. Проверки начинаются до кода: с риск-карты, требований к аналитике и критериев приемки. Потом идут проверки в разработке, перед релизом, во время публикации и в первые 7/14/30 дней после запуска.
3. P0/P1/P2: какие тесты нужны приложению первыми
Для статьи о видах тестирования важно не утонуть в каталоге. Поэтому держим простую модель: P0, P1 и P2. Здесь P означает приоритет: P0 — нельзя выпускать, P1 — важно исправить скоро, P2 — можно планировать. Такая модель не заменяет профессиональную QA-документацию, но помогает собственнику, PM и команде одинаково понимать риск.
P0: блокеры релиза
P0 — это все, что ломает деньги, данные, вход, публикацию или доверие пользователя. Если пользователь не может зарегистрироваться, оплатить, восстановить подписку, пройти ключевой сценарий или приложение падает при обычном действии, выпускать такую сборку опасно.
P1: качество роста
P1 не всегда блокирует публикацию, но влияет на стоимость привлечения и удержание: скорость запуска, уведомления, глубокие ссылки, корректность событий аналитики, качество ошибок, работа на популярных устройствах, стабильность в плохой сети.
P2: улучшения без блокировки запуска
P2 — это микротексты, вторичные анимации, редкие сочетания настроек, дополнительные варианты экранов, A/B-идеи и полировка. Их нельзя игнорировать, но нельзя ставить выше платежей, входа, данных и стабильности.
4. Функциональное и интеграционное тестирование: деньги, вход и данные
Функциональное тестирование отвечает на самый базовый вопрос: делает ли приложение то, что должно делать? Но «должно» нельзя понимать абстрактно. Для бизнеса это конкретные пользовательские пути.
- Регистрация и вход: электронная почта, телефон, социальный вход, восстановление пароля, повторный вход, блокировки и ошибки.
- Первый сценарий: пользователь должен понять, куда нажать, что выбрать и как дойти до ценности продукта.
- Оплата и подписка: успешное списание, отмена, возврат, пробный период, восстановление покупки, смена тарифа.
- Роли и доступы: пользователь видит только свои данные, менеджер — свои права, администратор — расширенный контур.
- Интеграции: серверная часть, API, CRM, платежный шлюз, сервис уведомлений, аналитика, электронная почта и SMS.
Хороший функциональный тест не звучит как «проверить оплату». Он звучит как сценарий: «новый пользователь устанавливает приложение, входит по телефону, выбирает тариф, оплачивает картой, видит активную подписку, событие оплаты приходит в аналитику, чек уходит на электронную почту». Чем ближе сценарий к деньгам, тем выше его приоритет.
Что спросить у команды: покажите не список экранов, а 5-10 критичных сквозных сценариев с устройством, версией ОС, тестовыми данными, ожидаемым результатом и фактом прохождения.
5. Дымовая проверка, регресс и приемка: как не сломать старое новой сборкой
Когда команда добавляет новую функцию, риск появляется не только в этой функции. Новая сборка может сломать старый вход, оплату, уведомления, аналитическое событие или экран, который разработчик даже не открывал. Для этого нужны дымовая проверка, регрессионное и приемочное тестирование.
Дымовая проверка
Дымовая проверка — короткая проверка, что сборка вообще пригодна для дальнейшего тестирования. Приложение запускается, пользователь входит, открывает ключевые экраны, проходит базовое действие, видит корректную ошибку сети. Если она не прошла, нет смысла тратить часы на глубокую проверку.
Регрессионное тестирование
Регресс проверяет, не сломалась ли уже работающая функциональность. Его частично автоматизируют: модульные тесты, API, критичные сквозные сценарии, стабильные проверки в сборочном процессе. Но финальный регресс на реальных устройствах все равно нужен там, где важны UI, платежи, разрешения, сеть и интеграции.
Приемочное тестирование
Приемка отвечает не на вопрос «нашли ли баги», а на вопрос «можно ли бизнесу принять эту сборку». Здесь важны критерии «выпускать или не выпускать»: какие P0 закрыты, какие P1 остаются, какие P2 перенесены, кто отвечает за исправление и когда будет повторная проверка.
DORA в материале про автоматизацию тестирования, обновленном 17 июля 2025 года, отдельно подчеркивает: быстрые автотесты, приемочные проверки, ручное исследование, проверки удобства и приемка должны работать вместе. Автотесты ускоряют обратную связь, но не отменяют человеческую проверку смысла и риска.
6. Совместимость: iOS, Android, устройства, сеть и обновления
Совместимость — это не «открыли на одном iPhone и одном Android». Приложение живет в разных версиях ОС, на разных экранах, с разными разрешениями, в плохой сети, после обновления, при смене языка, с ограничениями батареи и в фоне.
Android Developers в разделе о стратегии тестирования показывает, что на уровне релизной сборки проверки расширяют на разные телефоны, складные устройства и планшеты. Это не значит, что маленькому продукту нужен парк из десятков устройств. Но это значит, что матрица устройств должна быть осознанной, а не случайной.
- iOS: текущая и предыдущая стабильная версия, разные размеры экранов, TestFlight, разрешения, StoreKit, уведомления, поведение в фоне.
- Android: несколько популярных версий ОС, разные производители, слабое устройство, разрешения, фоновые ограничения, Google Play Services.
- Сеть: Wi-Fi, мобильная сеть, плохое соединение, offline, восстановление после разрыва.
- Обновления: установка с нуля, обновление с предыдущей версии, удаление, повторная установка, сохранение данных.
7. Производительность и стабильность: что измерять до и после релиза
Производительность и стабильность — это слой, где особенно опасны фразы «у нас вроде нормально». У пользователя нет терпения разбираться, почему экран завис. У стора тоже есть свои сигналы качества.
Для Android официальные пороги Google Play Android vitals на 5 июня 2026 года такие: если более 0,47% активных пользователей за день сталкиваются с заметным зависанием приложения, это считается плохим поведением приложения в целом; если более 1,09% активных пользователей за день сталкиваются с заметным падением, это тоже плохое поведение в целом; если на одной модели устройства заметное падение затрагивает 8% пользователей, это уже плохое поведение на конкретном устройстве. Android Developers также объясняет: зависание при обработке ввода фиксируется, если приложение не отвечает на действие пользователя в течение 5 секунд.
В Apple App Store Transparency Report за 2024 год указано: было проверено 7 771 599 заявок на проверку приложений, отклонено 1 931 400, а категория «Производительность» дала 1 235 471 причин отказа. Это не «прогноз отказа» для конкретного приложения, но практический вывод для QA: техническая готовность — не вторичная косметика.
Нагрузочное, производительность и стабильность: где граница
Нагрузочное тестирование проверяет, выдержат ли сервер, API, платежи и внешние сервисы ожидаемый поток пользователей и пики. Тестирование производительности смотрит, насколько быстро приложение запускается, открывает экраны и отвечает на действия. Тестирование стабильности проверяет, не растут ли зависания, падения, утечки памяти и ошибки на длинной сессии.
Для простого MVP без резкого наплыва пользователей часто достаточно P0-сценариев, реальных устройств и мониторинга после запуска. Если ожидается распродажа, запись на старт, рекламный трафик, корпоративный запуск или платежный пик, нагрузку нужно моделировать до релиза.
8. Безопасность, приватность и доступность: проверки, которые нельзя оставлять «на потом»
Безопасность и приватность часто вспоминают в конце, когда приложение уже собрано. Это поздно. Если роли доступа, хранение токенов, разрешения, SDK, API и пользовательские данные продуманы после разработки, исправления становятся дорогими и неприятными.
Безопасность и API
Для мобильной безопасности разумная рамка — OWASP MASVS. Версия MASVS v2.1.0 вышла 18 января 2024 года и добавила MASVS-PRIVACY, где отдельное внимание уделяется минимизации доступа к чувствительным данным, прозрачности сбора и контролю пользователя. Для API полезен OWASP API Security Top 10 2023: там акцент на авторизации, доступе к объектам, ограничении чувствительных бизнес-потоков и безопасном потреблении API.
Приватность и требования стора
Для iOS с 1 мая 2024 года Apple требует манифесты приватности, обоснования доступа для перечисленных API и действительные подписи для новых сторонних SDK. Это не «бумажка для юриста», а практический чек перед публикацией: какие SDK подключены, какие данные они трогают, есть ли нужные объяснения и подписи.
Google в публикации от 19 февраля 2026 года сообщил, что за 2025 год предотвратил публикацию более 1,75 млн приложений, нарушающих политики Google Play. Для команды это означает, что релизный QA должен включать не только баги интерфейса, но и соответствие требованиям платформы.
Доступность
Доступность тоже не стоит сводить к «для больших корпораций». Если приложение или PWA содержит формы, платежи, личный кабинет, заказ или запись, интерфейс должен быть понятен людям с разными возможностями. WCAG 2.2 стала W3C Recommendation 12 декабря 2024 года и дает проверяемую рамку для web-контента; для нативных приложений ее принципы помогают проверять текст, контраст, фокус, ошибки, управление и понятность сценариев.
Осторожная формулировка: OWASP и WCAG не гарантируют «полную безопасность» или «идеальную доступность». Они дают рамку, чтобы команда не проверяла эти темы хаотично.
9. Что автоматизировать, а что проверять руками
Автотесты нужны не ради процента покрытия, а ради быстрой обратной связи. Если один и тот же сценарий повторяется на каждой сборке и ошибка в нем дорога, его нужно автоматизировать. Если сценарий зависит от восприятия, текста, удобства, реального устройства или продуктового компромисса, его должен посмотреть человек.
- Автоматизировать в первую очередь: модульные тесты, API, критичный регресс, дымовую проверку, сборку, проверку событий аналитики, базовые проверки прав доступа.
- Проверять руками: первый сценарий, тексты ошибок, доступность, платежи на реальных устройствах, визуальные состояния, исследовательские проверки, решение «выпускать или не выпускать» перед релизом.
- Комбинировать: сквозные сценарии, где автотест дает повторяемость, а ручная проверка подтверждает смысл и поведение на устройстве.
Искусственный интеллект может ускорить черновики тест-кейсов, анализ логов и поиск повторяющихся дефектов. Но по World Quality Report 2025-26 только 15% организаций масштабировали генеративный ИИ в QA на уровне предприятия, тогда как 43% остаются на стадии экспериментов. Практическое правило простое: ИИ полезен как помощник, но решение о релизном риске должен принимать человек с контекстом продукта.
10. Минимальный QA-контур для MVP, нормальный контур на 2 недели и зрелая система
Нельзя одинаково тестировать лендинговое приложение с одной формой, fintech-сервис с платежами и B2B-систему с ролями. Правильная глубина зависит от риска.
MVP: 1-3 дня на P0
- Установка, вход, первый сценарий, платеж или заявка.
- 3-5 реальных устройств, плохая сеть, повторный запуск.
- Дымовая проверка, критичный регресс, базовая аналитика.
- Список P0-дефектов и решение «выпускать или не выпускать».
Коммерческий релиз: 5-10 рабочих дней
- P0 и P1-матрица по устройствам, ролям, интеграциям и сторам.
- Регресс, сквозные сценарии, проверка приватности, метаданных и логов.
- Часть автотестов на API, дымовую проверку и критичный регресс.
- Отчет с приоритетами, ответственными и повторной проверкой.
Зрелый продукт: непрерывный QA
- Автотесты в сборочном процессе, релизные сборки, ночные проверки.
- Матрица устройств, контроль Android vitals, логи падений, отзывы, воронка.
- План тестирования безопасности, доступности и приватности перед крупными изменениями.
- Контроль первых 7/14/30 дней после релиза.
11. Какой QA-отчет запросить у подрядчика
Если подрядчик присылает только «мы все проверили», у вас нет управляемого качества. Нормальный отчет должен помочь принять решение: выпускать, исправлять или переносить.
- Сборка: версия приложения, окружение, дата, ссылка на сборку, тестовые данные.
- Устройство: модель, ОС, сеть, язык, эмулятор или реальное устройство.
- Сценарий: шаги, ожидаемый результат, фактический результат, видео или скриншот.
- Риск: P0/P1/P2, влияние на деньги, пользователя, данные, публикацию или аналитику.
- Ответственный: кто исправляет, срок, статус повторной проверки.
- Решение: можно выпускать, нельзя выпускать, можно выпускать с оговоркой и планом исправления.
Для сложных продуктов добавляют логи, трассировку ошибки, ссылку на задачу, связанный API-запрос, данные из аналитики и отметку, влияет ли дефект на App Store, Google Play или юридические требования.
Дальше по ситуации. Если вы уже близко к запуску, свяжите эту карту с материалом про проверку качества приложения перед релизом. Если проект еще планируется, полезны ориентиры по стоимости мобильного приложения. Для соседнего web/PWA-сценария есть отдельный разбор видов тестирования сайтов.
12. Источники данных и стандартов
- Android Developers: основы тестирования Android-приложений — обновлено 19 мая 2026.
- Android Developers: стратегии тестирования — обновлено 5 марта 2026.
- Google Play Console Help: Android vitals — пороги ANR/crash.
- Android Developers: ANRs и Crashes.
- Apple App Store Transparency Report 2024.
- Google Security Blog: Keeping Google Play & Android app ecosystems safe in 2025 — 19 февраля 2026.
- Apple Developer News: Privacy requirement for app submissions starts May 1 — 26 апреля 2024.
- ISTQB CTFL Syllabus v4.0.1 — 15 сентября 2024.
- OWASP MASVS v2.1.0 Release & MASVS-PRIVACY — 18 января 2024.
- OWASP API Security Top 10 2023 — 3 июля 2023.
- W3C WCAG 2.2 — W3C Recommendation от 12 декабря 2024.
- DORA: автоматизация тестирования — обновлено 17 июля 2025.
- Capgemini World Quality Report 2025-26.
FAQ
Какие виды тестирования приложений обязательны перед релизом?
Для коммерческого приложения обязательный минимум — функциональные сценарии, дымовая проверка, регресс по критичным функциям, совместимость на ключевых устройствах, стабильность, безопасность, проверка приватности, а также проверка аналитики и публикации в сторах.
Чем функциональное тестирование отличается от регрессионного?
Функциональное тестирование отвечает на вопрос, работает ли конкретный сценарий сейчас. Регрессионное проверяет, не сломала ли новая сборка то, что уже работало раньше.
Нужно ли тестировать приложение на реальных устройствах?
Да. Эмуляторы полезны, но они не заменяют реальные устройства: сеть, датчики, платежи, уведомления, разрешения, производительность и поведение ОС часто отличаются от лабораторной среды.
Что автоматизировать в первую очередь?
Сначала автоматизируют быстрые и повторяемые проверки: модульные тесты, API, критичный регресс, сборку и дымовую проверку. UX, доступность, исследовательские проверки и релизные компромиссы оставляют человеку.
Сколько времени закладывать на QA для MVP?
Для простого MVP нужен минимум 1-3 дня на P0-контур перед публикацией. Если есть платежи, подписки, роли, интеграции или две платформы, лучше планировать отдельный цикл на 5-10 рабочих дней.
Можно ли выпускаться с открытыми дефектами?
Можно, если это не P0 и по каждому дефекту понятны риск, влияние на пользователя, ответственный и срок исправления. Выпуск с неизвестным риском — не экономия, а азартная ставка.
Хотите понять, какие тесты нужны именно вашему приложению до релиза?
Соберем QA-карту P0/P1/P2: критичные сценарии, матрицу устройств, проверку требований стора и приватности, метрики стабильности и список рисков с решением «чинить до релиза / можно вынести в план».