refactor: update Nginx configuration and Docker setup

- Change user directive in Nginx configuration from 'nginx' to 'www-data'. - Update upstream server configurations in Nginx to use 'localhost' instead of service names. - Modify Nginx server block to redirect HTTP to a status page instead of Grafana. - Rename Alertmanager location from '/alertmanager/' to '/alerts/' for consistency. - Remove deprecated status page configuration and related files. - Adjust Prometheus configuration to reflect the new Docker network settings.
2025-09-18 21:21:23 +03:00
parent 9ec3f02767
commit 1db579797d
10 changed files with 629 additions and 608 deletions
--- a/FIX_PROMLEMS.md
+++ b/FIX_PROMLEMS.md
@@ -0,0 +1,92 @@
 # FIX_PROBLEMS.md
 ## Текущий статус Prometheus
 ### ✅ Что работает:
 - Prometheus доступен по `https://188.68.223.37/prometheus/`
 - Nginx проксирование настроено правильно
 - Другие таргеты работают (Node Exporter, боты)
 - Grafana работает по `https://188.68.223.37/grafana/`
 ### ❌ Что не работает:
 #### 1. Самомониторинг Prometheus
 - **Статус:** `"health":"down"` с ошибкой 404
 - **Проблема:** Prometheus не может получить доступ к своим метрикам по `/metrics`
 - **Ошибка:** `"server returned HTTP status 404 Not Found"`
 - **Причина:** Prometheus не экспортирует метрики по эндпоинту `/metrics` внутри контейнера
 #### 2. Редирект в Prometheus
 - **Проблема:** Редирект с `https://188.68.223.37/prometheus/` на `https://188.68.223.37/prometheus/prometheus/query`
 - **Причина:** Неправильная конфигурация Nginx proxy_pass
 - **Статус:** ТРЕБУЕТ ИСПРАВЛЕНИЯ
 ### 🔧 Быстрые исправления:
 #### Исправление редиректа Prometheus:
 Проблема в конфигурации Nginx - нужно убрать слэш в `proxy_pass`:
 ```nginx
 # Было:
 proxy_pass http://prometheus_backend/;
 # Должно быть:
 proxy_pass http://prometheus_backend;
 ```
 #### Исправление самомониторинга:
 Проблема в том, что Prometheus не экспортирует метрики. Возможные решения:
 1. Убрать job 'prometheus' из конфигурации
 2. Добавить параметры для экспорта метрик
 3. Использовать другой подход для самомониторинга
 ### 📋 Следующие шаги:
 1. ✅ Исправить редирект Prometheus
 2. ❌ Решить проблему с самомониторингом (пропущено)
 3. ✅ Исправить главную страницу
 4. ✅ Исправить Alertmanager
 5. 🔄 Настроить безопасность
 6. 🔄 Настроить Uptime Kuma
 ---
 ## Этап 5: Настройка безопасности
 ### План действий:
 1. **Добавить базовую аутентификацию для Prometheus**
   - Создать файл с логином/паролем
   - Настроить Nginx для запроса аутентификации
   - Проверить, что теперь требуется логин/пароль
 2. **Добавить базовую аутентификацию для Alertmanager**
   - Создать файл с логином/паролем
   - Настроить Nginx для запроса аутентификации
   - Проверить, что теперь требуется логин/пароль
 3. **Перезагрузить Nginx**
   - Применить новые настройки безопасности
 4. **Проверить, что теперь требуется логин/пароль**
   - Убедиться, что Prometheus и Alertmanager защищены
 **Цель:** Сейчас Prometheus и Alertmanager доступны без аутентификации, что небезопасно. Нужно добавить базовую HTTP аутентификацию.
 ---
 ## Этап 6: Настройка Uptime Kuma
 ### План действий:
 1. **Проверить статус Uptime Kuma**
   - Убедиться, что контейнер запущен
   - Проверить логи на наличие ошибок
 2. **Настроить мониторинг основных сервисов**
   - Добавить мониторинг Grafana
   - Добавить мониторинг Prometheus
   - Добавить мониторинг Alertmanager
   - Добавить мониторинг ботов
 3. **Проверить доступность `/status/`**
   - Убедиться, что страница работает
   - Проверить отображение статуса сервисов
 **Цель:** Uptime Kuma должен показывать статус всех сервисов и их доступность.
--- a/docker-compose.yml
+++ b/docker-compose.yml
@@ -39,7 +39,6 @@ services:
      - GF_INSTALL_PLUGINS=grafana-clock-panel,grafana-simple-json-datasource
      - GF_SERVER_ROOT_URL=https://${SERVER_IP}/grafana/
      - GF_SERVER_SERVE_FROM_SUB_PATH=true
      - GF_SERVER_DOMAIN=${SERVER_IP}
    ports:
      - "3000:3000"
    volumes:
@@ -111,7 +110,7 @@ services:
    environment:
      - SERVER_IP=${SERVER_IP}
    volumes:
-      - ./infra/nginx/nginx.conf:/etc/nginx/templates/nginx.conf.template:ro
+      - ./infra/nginx/nginx.conf:/etc/nginx/nginx.conf:ro
      - ./infra/nginx/conf.d:/etc/nginx/conf.d:ro
      - ./infra/nginx/ssl:/etc/nginx/ssl:ro
      - ./infra/nginx/.htpasswd:/etc/nginx/.htpasswd:ro
@@ -255,4 +254,5 @@ networks:
    driver: bridge
    ipam:
      config:
-        - subnet: 192.168.100.0/24
+        - subnet: 172.20.0.0/16
          gateway: 172.20.0.1
--- a/infra/alertmanager/alertmanager.yml
+++ b/infra/alertmanager/alertmanager.yml
@@ -94,92 +94,26 @@ receivers:
      - url: 'http://localhost:5001/'
        send_resolved: true
-  # Critical alerts - immediate notification via multiple channels
+  # Critical alerts - immediate notification via webhook
  - name: 'critical-alerts'
    email_configs:
      - to: 'admin@{{DOMAIN}}'
        subject: '🚨 CRITICAL ALERT: {{ .GroupLabels.alertname }}'
        body: |
          {{ range .Alerts }}
          Alert: {{ .Annotations.summary }}
          Description: {{ .Annotations.description }}
          Severity: {{ .Labels.severity }}
          Service: {{ .Labels.service }}
          Instance: {{ .Labels.instance }}
          Time: {{ .StartsAt }}
          {{ end }}
        html: |
          <h2>🚨 Critical Alert</h2>
          <table>
            <tr><td><strong>Alert:</strong></td><td>{{ .GroupLabels.alertname }}</td></tr>
            <tr><td><strong>Service:</strong></td><td>{{ .GroupLabels.service }}</td></tr>
            <tr><td><strong>Time:</strong></td><td>{{ .GroupLabels.time }}</td></tr>
          </table>
          <h3>Alerts:</h3>
          <ul>
          {{ range .Alerts }}
            <li><strong>{{ .Annotations.summary }}</strong><br/>
                {{ .Annotations.description }}<br/>
                <small>Instance: {{ .Labels.instance }} | Time: {{ .StartsAt }}</small>
            </li>
          {{ end }}
          </ul>
    webhook_configs:
      - url: 'http://localhost:5001/critical'
        send_resolved: true
  # Warning alerts - less urgent notification
  - name: 'warning-alerts'
    email_configs:
      - to: 'admin@{{DOMAIN}}'
        subject: '⚠️ WARNING: {{ .GroupLabels.alertname }}'
        body: |
          {{ range .Alerts }}
          Alert: {{ .Annotations.summary }}
          Description: {{ .Annotations.description }}
          Severity: {{ .Labels.severity }}
          Service: {{ .Labels.service }}
          Instance: {{ .Labels.instance }}
          Time: {{ .StartsAt }}
          {{ end }}
    webhook_configs:
      - url: 'http://localhost:5001/warning'
        send_resolved: true
  # Bot-specific alerts
  - name: 'bot-alerts'
    email_configs:
      - to: 'bot-admin@{{DOMAIN}}'
        subject: '🤖 Bot Alert: {{ .GroupLabels.alertname }}'
        body: |
          Bot Alert: {{ .GroupLabels.alertname }}
          Service: {{ .GroupLabels.service }}
          {{ range .Alerts }}
          - {{ .Annotations.summary }}
            {{ .Annotations.description }}
            Instance: {{ .Labels.instance }}
            Time: {{ .StartsAt }}
          {{ end }}
    webhook_configs:
      - url: 'http://localhost:5001/bot'
        send_resolved: true
  # Infrastructure alerts
  - name: 'infrastructure-alerts'
    email_configs:
      - to: 'infra@{{DOMAIN}}'
        subject: '🏗️ Infrastructure Alert: {{ .GroupLabels.alertname }}'
        body: |
          Infrastructure Alert: {{ .GroupLabels.alertname }}
          Service: {{ .GroupLabels.service }}
          {{ range .Alerts }}
          - {{ .Annotations.summary }}
            {{ .Annotations.description }}
            Instance: {{ .Labels.instance }}
            Time: {{ .StartsAt }}
          {{ end }}
    webhook_configs:
      - url: 'http://localhost:5001/infrastructure'
        send_resolved: true
--- a/infra/ansible/playbook.yml
+++ b/infra/ansible/playbook.yml
--- a/infra/nginx/conf.d/alertmanager.conf
+++ b/infra/nginx/conf.d/alertmanager.conf
@@ -2,12 +2,12 @@
 # Proxies requests to Alertmanager
 # Alertmanager location
-location /alertmanager/ {
+location /alerts/ {
    # Rate limiting
    limit_req zone=api burst=10 nodelay;
    # Remove trailing slash for proxy
-    rewrite ^/alertmanager/(.*)$ /$1 break;
+    rewrite ^/alerts/(.*)$ /$1 break;
    # Proxy to Alertmanager
    proxy_pass http://alertmanager_backend;
--- a/infra/nginx/conf.d/grafana.conf
+++ b/infra/nginx/conf.d/grafana.conf
@@ -1,6 +1,6 @@
 # Grafana proxy configuration
 location /grafana/ {
-    proxy_pass http://grafana_backend/;
+    proxy_pass http://grafana_backend;
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
--- a/infra/nginx/conf.d/status.conf
+++ b/infra/nginx/conf.d/status.conf
@@ -1,43 +0,0 @@
 # Status page configuration (Uptime Kuma integration)
 # Rate limiting for status page
 location /status {
    # Rate limiting
    limit_req zone=status burst=5 nodelay;
    # Proxy to Uptime Kuma
    proxy_pass http://uptime_kuma_backend;
    proxy_set_header Host $host;
    proxy_set_header X-Real-IP $remote_addr;
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header X-Forwarded-Proto $scheme;
    # WebSocket support
    proxy_http_version 1.1;
    proxy_set_header Upgrade $http_upgrade;
    proxy_set_header Connection "upgrade";
    # Timeouts
    proxy_connect_timeout 30s;
    proxy_send_timeout 30s;
    proxy_read_timeout 30s;
    # Buffer settings
    proxy_buffering on;
    proxy_buffer_size 4k;
    proxy_buffers 8 4k;
    # Security headers
    add_header X-Frame-Options "SAMEORIGIN" always;
    add_header X-Content-Type-Options "nosniff" always;
 }
 # Nginx status stub (for monitoring)
 location /nginx_status {
    stub_status on;
    access_log off;
    allow 127.0.0.1;
    allow 172.16.0.0/12;  # Docker networks
    allow 192.168.0.0/16; # Private networks
    deny all;
 }
--- a/infra/nginx/conf.d/uptime-kuma.conf
+++ b/infra/nginx/conf.d/uptime-kuma.conf
@@ -1,12 +1,6 @@
 # Uptime Kuma Nginx Configuration
 # Proxies requests to Uptime Kuma status page
 # Upstream for Uptime Kuma
 upstream uptime_kuma_backend {
    server uptime-kuma:3001;
    keepalive 32;
 }
 # Status page location
 location /status {
    # Rate limiting
--- a/infra/nginx/nginx.conf
+++ b/infra/nginx/nginx.conf
@@ -1,4 +1,4 @@
-user nginx;
+user www-data;
 worker_processes auto;
 error_log /var/log/nginx/error.log warn;
 pid /var/run/nginx.pid;
@@ -65,26 +65,27 @@ http {
    # Upstream configurations
    upstream grafana_backend {
-        server grafana:3000;
+        server localhost:3000;
        keepalive 32;
    }
    upstream prometheus_backend {
-        server prometheus:9090;
+        server localhost:9090;
        keepalive 32;
    }
    upstream uptime_kuma_backend {
-        server uptime-kuma:3001;
+        server localhost:3001;
        keepalive 32;
    }
    upstream alertmanager_backend {
-        server alertmanager:9093;
+        server localhost:9093;
        keepalive 32;
    }
    # Main server block
    # Redirect HTTP to HTTPS
    server {
        listen 80;
        server_name _;
@@ -96,8 +97,8 @@ http {
        server_name _;
        # SSL configuration (self-signed certificate)
-        ssl_certificate /etc/letsencrypt/live/{{SERVER_IP}}/fullchain.pem;
+        ssl_certificate /etc/nginx/ssl/fullchain.pem;
-        ssl_certificate_key /etc/letsencrypt/live/{{SERVER_IP}}/privkey.pem;еще 
+        ssl_certificate_key /etc/nginx/ssl/privkey.pem;
        ssl_protocols TLSv1.2 TLSv1.3;
        ssl_ciphers ECDHE-RSA-AES128-GCM-SHA256:ECDHE-RSA-AES256-GCM-SHA384:ECDHE-RSA-AES128-SHA256:ECDHE-RSA-AES256-SHA384;
        ssl_prefer_server_ciphers off;
@@ -108,9 +109,10 @@ http {
        add_header X-Frame-Options "SAMEORIGIN" always;
        add_header X-Content-Type-Options "nosniff" always;
-        # Redirect root to Grafana
+        # Root page - show simple status
        location = / {
-            return 301 /grafana/;
+            return 200 "Bot Infrastructure Status\n\nServices:\n- Grafana: /grafana/\n- Prometheus: /prometheus/\n- Uptime Kuma: /status/\n- Alertmanager: /alerts/\n";
            add_header Content-Type text/plain;
        }
        # Health check endpoint
--- a/infra/prometheus/prometheus.yml
+++ b/infra/prometheus/prometheus.yml
@@ -13,7 +13,7 @@ scrape_configs:
  # Job для мониторинга Node Exporter
  - job_name: 'node'
    static_configs:
-      - targets: ['172.17.0.1:9100']  # Специальное имя для доступа к хосту
+      - targets: ['172.20.0.1:9100']  # IP хоста в Docker сети bots_network
        labels:
          instance: 'main-server'