Thank you for reading this post, don't forget to subscribe!
Вы никогда не знаете, что произойдет с приложением завтра. Возможно, количество ваших пользователей увеличиться в 5 раз. Возможно, резко начнет набирать популярность второстепенная функция. И она создаст новые проблемы. Чем больше будет становиться система, тем более сложным (= менее эффективным) будет становиться долгосрочное планирование.
Успешность работы над крупным приложением подразумевает вовсе не детальное планирование всех аспектов. Основное усилие должно быть направлено на обеспечение гибкости системы. Гибкость позволит быстро вносить изменения. Это наиболее важное свойство любой быстрорастущей системы.
Постепенный рост
Не пытайтесь спрогнозировать объем аудитории на год вперед. То же самое касается и архитектуры приложения. Основа успешной разработки — постепенные решения. Это применимо и к программной и к аппаратной части.
Если Вы запускаете новое приложение, нет смысла сразу обеспечивать инфраструктуру, которая способна выдержать миллионы посетителей. Используйте облака для хостинга новых проектов. Это позволит снизить затраты на сервера и упростить их управление.
Многие облачные хостинги предоставляют услуги приватной сети. Это позволит безопасно использовать несколько серверов прямо в облаке. Таким образом, вы сможете выполнять первые шаги в масштабировании без переезда на физику.
Простые решения
Простые решения разрабатывать крайне сложно. Тем не менее, лучше потратить время и усилия на упрощение решений (как для разработки так и для пользователей). Гибкая система не бывает сложной.
Архитектурные решения
Масштабирование любого Web приложения — это постепенный процесс, который включает:
- Анализ нагрузки.
- Определение наиболее подверженных нагрузке участков.
- Вынесение таких участков на отдельные узлы и их оптимизация.
- Повтор пункта 1.
1. Простая архитектура Web приложения
Новое приложение обычно запускается на одном сервере, на котором работают и Web сервер и база данных и само приложение:
Это разумно, т.к. это экономит время и деньги на запуск. Используйте именно такой подход для старта. Если боитесь не выдержать стартовую нагрузку — возьмите мощный сервер в аренду. Только в исключительных ситуациях, когда вы абсолютно точно уверены в большой стартовой нагрузке, переходите сразу к тому, что описано ниже.
2. Отделение базы данных
Чаще всего, первым узлом, который оказывается под нагрузкой, является база данных. Это понятно. Каждый запрос от пользователя к приложению — это обычно от 10 до 100 запросов к базе данных:
Вынесение базы данных на отдельный сервер позволит увеличить ее производительность и снизить ее негативное влияние на остальные компоненты (PHP, Nginx и т.п.). Для подключения к MySQL на отдельном сервере используйте IP адрес этого сервера:
1 |
mysql_connect('<b>10.10.0.2</b>', 'user', 'pwd'); |
10.10.0.2 — IP адрес MySQL во внутренней сети
Пауза в работе при переносе
Перенос базы данных на другой сервер может стать проблемой для работающего приложения, т.к. займет какое-то время. Вы можете:
- Использовать простое решение — разместить объявление о плановых работах на сайте и сделать перенос. Лучше это делать глубокой ночью, когда активность аудитории минимальна.
- Использовать репликацию для синхронизации данных с одного сервера на другой. В этом случае мастером будет старый сервер, а слейвом новый. После настройки достаточно поменять IP адрес базы в приложении на новый сервер. А далее — выключить старый сервер. Читайте как настроить MySQL репликацию на работающем сервере без простоев.
После выделения MySQL на отдельный сервер, убедитесь в его оптимальной настройке.
Масштабирование баз данных — одна из самых сложных задач во время роста проекта. Существует очень много практик — денормализация, репликации, шардинг и многие другие. Читайте материалы по масштабированию БД.
3. Отделение Web сервера
Далее на очереди Web сервер. Его выделение на отдельный узел позволит оставить больше ресурсов для приложения (в примере — PHP):
В этом случае Вам придется настроить deployment приложения и на сервер Nginx и на сервер с PHP. Сервер PHP обычно называют бекендом. Тогда Nginx будет отдавать файлы статики самостоятельно, а PHP сервер будет занят только обработкой скриптов. Nginx позволяет подключаться к бекенду по IP адресу:
[codesyntax lang="php"]
1 2 3 4 5 6 7 8 9 10 11 12 13 |
server { server_name ruhighload.com; root /var/www/ruhighload; index index.php; location ~* \.(php)$ { fastcgi_pass 10.10.10.1:9000; fastcgi_index index.php; include fastcgi_params; fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; } } |
[/codesyntax]
Все файлы статики Nginx будет отдавать без обращения на бекенд
Если Вы используете загрузку файлов, вам нужно будет выделить файловое хранилище на отдельный узел (об этом — ниже).
4. Несколько PHP бекендов
Когда нагрузка растет, Web приложение постепенно начинает работать все медленнее. В какой-то момент причина будет лежать уже в самой реализации. Тогда стоит установить несколько PHP бекендов:
Все бекенды важно иметь одинаковой конфигурации. Nginx умеет балансировать нагрузку между ними. Для этого Вам необходимо выделить список бекендов в upstream и использовать его в конфигурации:
[codesyntax lang="php"]
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
upstream backend { server 10.10.10.1; server 10.10.10.2; server 10.10.10.3; } server { server_name ruhighload.com; root /var/www/ruhighload; index index.php; location ~* \.(php)$ { fastcgi_pass backend; fastcgi_index index.php; include fastcgi_params; fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name; } } |
[/codesyntax]
Nginx будет равномерно распределять нагрузку между указанными бекендами
Вы можете использовать веса бекендов, если одни из них мощнее, чем другие:
[codesyntax lang="php"]
1 2 3 4 5 |
upstream backend { server 10.10.10.1 weight=10; server 10.10.10.2 weight=2; server 10.10.10.3 weight=4; } |
[/codesyntax]
Из каждых 16 запросов, первый бекенд обработает 10, второй — 2, а третий — 4
Сессии
Как только вы начнете использовать несколько бекендов, запросы от одного пользователя будут попадать на разные сервера. Это потребует использования единого хранилища для сессий, например Memcache.
5. Кэширование
Подключение серверов кэширования — одна из самых простых задач:
Memcache обеспечивает использование нескольких серверов в стандартной поставке:
[codesyntax lang="php"]
1 2 3 4 5 6 |
<? $m = new Memcache; $m->addServer('10.5.0.1'); $m->addServer('10.5.0.2'); ... $m->get('user1') |
[/codesyntax]
Подключаем Memcache к нескольким серверам сразу
Memcache самостоятельно распределит нагрузку между используемыми серверами. Для этого он использует алгоритм постоянного хеширования. Вам понадобится следить за вытеснениями и вовремя добавлять новое оборудование.
6. Очереди задач
Очереди задач позволяют выполнять тяжелые операции асинхронно, не замедляя основного приложения.
Сервер очереди принимает задачи от приложения. Worker-сервера обрабатывают задачи. Их количество следует увеличивать, когда среднее количество задач в очереди будет постепенно расти.
7. Балансировка DNS
DNS поддерживает балансировку на основе Round Robin. Это позволяет указать несколько IP адресов принимающих Web серверов (называются фронтендами):
Для использования этого механизма, необходимо установить несколько одинаковых фронтендов. Тогда в DNS следует указывать такие А записи:
[codesyntax lang="php"]
1 2 3 4 |
.... ruhighload.com IN A 1.2.3.90 IN A 1.2.3.91 IN A 1.2.3.92 |
[/codesyntax]
Используем несколько IP адресов для одной А записи
В этом случае DNS будет отдавать разные IP адреса разным клиентам. Таким образом будет происходить балансировка между фронтендами.
8. Файловые хранилища
Загрузка и обработка файлов обычно происходит на бекенде. Когда бекендов несколько, это неудобно:
- Придется помнить, на какой бекенд был загружен файл.
- Загрузка и обработка файлов (например, видео или фото) может сильно снижать производительность бекенда.
- Придется использовать сервера с большими дисками, в чем обычно нет необходимости для бекендов.
Правильным решением будет использование отдельных серверов для загрузки, хранения и обработки файлов:
На практике это реализуется так:
- Выделяется отдельный субдомен для сервера файлов.
- На сервере разворачивается Nginx и небольшое приложение, которое умеет сохранять (и обрабатывать, если нужно) файлы.
- Масштабирование происходит путем добавления новых серверов и субдоменов (images1, images2, images3 и т.п.).
Загрузка файлов
Загрузку удобно перекладывать на клиентскую сторону. Тогда форма будет отправлять запрос на конкретный сервер:
[codesyntax lang="php"]
1 2 3 4 |
<form action="http://images1.ruhighload.com/upload.php" method="post" enctype="multipart/form-data"> <input type="file" name="file"> <input type="submit" value="Загрузить"> </form> |
[/codesyntax]
Домены можно генерировать случайным образом из уже существующих:
1 2 |
<form action="http://images<b><?=mt_rand(1, 10)?></b>.ruhighload.com/upload.php" method="post" enctype="multipart/form-data"> ... |
AJAX загрузка
Не забываем про CORS:
1 2 3 |
<? header('Access-Control-Allow-Origin: http://test.com'); ... |
Это позволит отправлять AJAX запросы с домена test.com на домены загрузки