MCP در پروداکشن

قبلاً چی گفتیم؟

تا اینجای سری، از مفاهیم پایه MCP شروع کردیم، معماری رو شناختیم، سرور ساختیم، به کلاینت‌ها وصل کردیم و امنیت رو بررسی کردیم. حالا وقتشه یه سوال مهم رو جواب بدیم: چطور همه اینها رو به محیط واقعی ببریم؟

توسعه لوکال با پروداکشن فرق داره. توی لوکال، سرور رو با npx اجرا می‌کنی و تمام. ولی وقتی قراره یه سیستم واقعی باشه که ۲۴ ساعته کار کنه، کاربرهای مختلف داشته باشه و با دیتای واقعی سروکار داشته باشه، یه عالمه چالش جدید پیش میاد.

مخاطب این قسمت

این قسمت بیشتر برای کسایی هست که می‌خوان MCP رو توی پروژه‌های واقعی استفاده کنن. اگه فقط برای استفاده شخصی MCP رو تنظیم می‌کنی، بخش‌های معماری و Scaling رو می‌تونی فعلاً رد کنی.

از توسعه تا استقرار

قبل از هر چیز، بذار یه تصویر کلی بدم. وقتی می‌خوای یه MCP Server رو به پروداکشن ببری، این مراحل رو داری:

توسعه و تست لوکال: سرور رو می‌سازی و لوکال تست می‌کنی (اینو بلدی)
بسته‌بندی: سرور رو آماده deploy می‌کنی (Docker، npm package، یا binary)
استقرار: سرور رو روی سرور یا cloud deploy می‌کنی
پیکربندی: تنظیمات محیطی، secrets و اتصالات رو ست می‌کنی
مانیتورینگ: مطمئن می‌شی همه‌چیز درست کار می‌کنه

تشبیه

فرق توسعه لوکال و پروداکشن مثل فرق آشپزی خونگی و رستوران هست. توی خونه، غذا رو درست می‌کنی و می‌خوری. ولی رستوران باید منو داشته باشه، آشپزخونه استاندارد داشته باشه، مواد اولیه ثابت داشته باشه، و بتونه ۱۰۰ نفر رو همزمان سرو کنه. MCP در پروداکشن هم همین‌طوره.

بسته‌بندی با Docker

محبوب‌ترین روش برای deploy کردن MCP Serverها، Docker هست. چرا؟ چون:

ایزوله‌ست: سرور توی container خودش اجرا می‌شه و به بقیه سیستم دسترسی نداره
تکرارپذیره: همون image که لوکال تست کردی، عیناً توی پروداکشن اجرا می‌شه
مقیاس‌پذیره: می‌تونی چند نسخه از یه سرور رو همزمان اجرا کنی

یه Dockerfile ساده برای یه MCP Server ممکنه این‌شکلی باشه:

FROM node:20-slim
WORKDIR /app
COPY package*.json ./
RUN npm ci --production
COPY . .
EXPOSE 3000
CMD ["node", "server.js"]

نکته مهم اینه که secrets رو هرگز توی Docker image نذار. از environment variables استفاده کن و موقع اجرای container بهش پاس بده.

هشدار

اگه MCP Server لوکال (stdio) می‌سازی، Docker لازم نیست. Docker برای وقتیه که سرور رو ریموت (SSE/HTTP) deploy می‌کنی.

Docker Compose برای چند سرور

وقتی چند MCP Server داری که با هم کار می‌کنن، Docker Compose عالیه. مثلاً فرض کن یه سرور دیتابیس، یه سرور فایل و یه سرور ایمیل داری:

version: "3.8"
services:
  mcp-database:
    build: ./servers/database
    environment:
      - DB_HOST=postgres
      - DB_PASSWORD_FILE=/run/secrets/db_pass
    secrets:
      - db_pass

  mcp-files:
    build: ./servers/files
    volumes:
      - ./shared-data:/data:ro

  mcp-email:
    build: ./servers/email
    environment:
      - SMTP_HOST=smtp.example.com

secrets:
  db_pass:
    file: ./secrets/db_password.txt

توجه کن که سرور فایل با :ro (read-only) mount شده. این یه نمونه عملی از اصل حداقل دسترسی هست که قسمت قبلی بررسی کردیم.

هاست کردن روی Cloud

اگه Docker رو آماده کردی، قدم بعدی اینه که کجا اجراش کنی. چند گزینه محبوب:

۱. VPS ساده (مثل DigitalOcean، Hetzner، Liara)

ساده‌ترین روش: یه VPS بگیر، Docker نصب کن، و container رو اجرا کن. مزیتش سادگی و کنترل کامله. عیبش اینه که خودت باید scaling و مدیریت سرور رو انجام بدی.

این روش برای پروژه‌های کوچک و متوسط عالیه.

۲. Container Services (مثل AWS ECS، Google Cloud Run، Azure Container Instances)

اگه نمی‌خوای سرور مدیریت کنی، می‌تونی container رو مستقیماً روی سرویس‌های ابری اجرا کنی. این سرویس‌ها خودشون scaling، restart و مدیریت منابع رو انجام می‌دن.

مخصوصاً Google Cloud Run برای MCP Serverهای HTTP خیلی مناسبه چون فقط وقتی درخواست داری هزینه می‌بری (pay-per-request).

۳. Kubernetes

برای پروژه‌های بزرگ و سازمانی، Kubernetes بهترین انتخابه. ولی پیچیدگیش هم بیشتره. اگه تیمت کوچکه و تازه شروع کردی، از گزینه‌های ساده‌تر شروع کن.

توصیه

شروع کن با ساده‌ترین راه‌حل. یه VPS ساده با Docker خیلی وقتا کافیه. وقتی واقعاً نیاز به scaling داشتی، بعداً migrate کن. بهینه‌سازی زودهنگام دشمن پیشرفته.

مقیاس‌پذیری (Scaling)

وقتی تعداد کاربرها یا درخواست‌ها زیاد بشه، یه نسخه از MCP Server کافی نیست. بذار ببینیم چه چالش‌هایی پیش میاد و چطور حلشون کنیم.

Horizontal Scaling

ساده‌ترین روش مقیاس‌پذیری اینه که چند نسخه از سرور رو اجرا کنی و ترافیک رو بینشون پخش کنی (Load Balancing). این برای MCP Serverهای HTTP خوب جواب می‌ده.

ولی یه نکته مهم: اگه سرورت state (حالت) نگه می‌داره، scaling پیچیده‌تر می‌شه. مثلاً اگه session اتصال دیتابیس رو نگه می‌داره، باید مطمئن بشی درخواست‌های بعدی به همون نسخه می‌رن (sticky sessions) یا state رو بین نسخه‌ها share کنی.

نکته

بهترین روش: MCP Serverهات رو تا حد ممکن stateless (بدون حالت) بساز. هر درخواست مستقل از قبلی باشه. اگه state لازمه، اون رو توی یه سرویس خارجی مثل Redis نگه دار.

Connection Pooling

اگه MCP Server به دیتابیس وصل می‌شه، حتماً از Connection Pool استفاده کن. به جای اینکه برای هر درخواست یه اتصال جدید بسازی و ببندی، یه مجموعه اتصال آماده داشته باش و ازشون استفاده مجدد کن.

این هم سرعت رو بالا می‌بره هم فشار روی دیتابیس رو کم می‌کنه.

Caching

بعضی ابزارهای MCP نتایج تکراری برمی‌گردونن. مثلاً اگه سرور لیست فایل‌های یه فولدر رو می‌خونه و فایل‌ها زیاد تغییر نمی‌کنن، می‌تونی نتیجه رو cache کنی و دفعه بعد سریع‌تر جواب بدی.

ولی مراقب باش: cache invalidation (بی‌اعتبار کردن cache) یکی از سخت‌ترین مشکلات مهندسی نرم‌افزاره. فقط جایی cache کن که مطمئنی داده زیاد تغییر نمی‌کنه.

مدیریت خطا (Error Handling)

توی محیط پروداکشن، خطا اتفاق می‌افته. سوال اینه که سیستمت چطور باهاش برخورد می‌کنه.

اصول مدیریت خطا

۱. خطاها رو بخور نه! — هر خطایی باید لاگ بشه و اگه لازمه، به کاربر اطلاع داده بشه. هرگز خطا رو نادیده نگیر.

۲. پیام‌های خطای مفید: «یه خطا پیش اومد» کمکی نمی‌کنه. «اتصال به دیتابیس ممکن نیست — سرور PostgreSQL روی پورت 5432 جواب نمی‌ده» خیلی بهتره.

۳. Retry با احتیاط: بعضی خطاها موقتی هستن (مثل timeout شبکه). برای اینها retry منطقیه. ولی با exponential backoff — یعنی هر بار فاصله retry رو بیشتر کن (۱ ثانیه، ۲ ثانیه، ۴ ثانیه…). این از فشار بیش از حد روی سرویس جلوگیری می‌کنه.

۴. Circuit Breaker: اگه یه سرویس خارجی مشکل داره، بهتره بعد از چند تلاش ناموفق، موقتاً قطعش کنی تا بهبود پیدا کنه. مثلاً اگه API خارجی ۵ بار پشت سر هم timeout داد، ۳۰ ثانیه درخواست نفرست و بعد دوباره تلاش کن.

تشبیه

Circuit Breaker مثل فیوز برق خونه‌ته. وقتی مشکلی پیش میاد، فیوز قطع می‌کنه تا از خرابی بیشتر جلوگیری کنه. بعد از رفع مشکل، دوباره وصلش می‌کنی.

Graceful Degradation

سیستمت باید طوری طراحی بشه که اگه یه بخشش از کار افتاد، کل سیستم از کار نیفته. مثلاً اگه سرور Slack مشکل داره، بقیه سرورها (دیتابیس، فایل) باید به کارشون ادامه بدن.

مدل AI هم باید بتونه با نبود یه ابزار کنار بیاد. مثلاً اگه ابزار ارسال ایمیل در دسترس نیست، می‌تونه بگه «الان نمی‌تونم ایمیل بفرستم ولی گزارش آماده‌ست» به جای اینکه کلاً crash کنه.

مانیتورینگ در پروداکشن

توی قسمت امنیت درباره لاگ صحبت کردیم. ولی مانیتورینگ پروداکشن فراتر از لاگه:

متریک‌های کلیدی

زمان پاسخ‌دهی (Latency): هر ابزار چقدر طول می‌کشه جواب بده
نرخ خطا (Error Rate): چه درصدی از درخواست‌ها fail می‌شن
مصرف منابع: CPU، RAM، اتصالات دیتابیس
تعداد درخواست‌ها (Throughput): چند درخواست در ثانیه پردازش می‌شه
وضعیت سلامت (Health): آیا سرور زنده و سالمه

Health Check Endpoint

هر MCP Server باید یه health check endpoint داشته باشه — یه URL ساده (مثلاً /health) که فقط بگه «من سالمم» یا «مشکل دارم». سرویس‌های مانیتورینگ و load balancer از این endpoint استفاده می‌کنن.

یه health check خوب فقط نباید بگه «سرور بالاست». باید بررسی کنه:

اتصال دیتابیس برقراره؟
اتصالات خارجی (API ها) جواب می‌دن؟
دیسک فضای کافی داره؟

ابزارهای مانیتورینگ

برای مانیتورینگ MCP Serverها می‌تونی از ابزارهای استاندارد استفاده کنی:

Prometheus + Grafana: برای متریک‌ها و داشبورد
ELK Stack (Elasticsearch, Logstash, Kibana): برای لاگ‌ها
Sentry: برای ردیابی خطاها
Uptime Robot / Healthchecks.io: برای مانیتورینگ ساده uptime

نکته

شروع کن ساده. حتی یه اسکریپت bash که هر ۵ دقیقه health check endpoint رو چک کنه، بهتر از هیچ چیزه. بعداً ابزارهای حرفه‌ای‌تر اضافه کن.

الگوهای معماری واقعی

بذار چند الگوی معماری رو ببینیم که توی پروژه‌های واقعی استفاده می‌شن.

الگوی ۱: Gateway Pattern

یه لایه gateway (دروازه) بین کلاینت‌ها و MCP Serverها قرار می‌دی. این gateway مسئولیت‌های مشترک مثل احراز هویت، rate limiting و لاگ رو انجام می‌ده. سرورها فقط کار اصلی‌شون رو انجام می‌دن.

مزیت: منطق مشترک رو یه جا می‌نویسی. سرورها ساده‌تر می‌شن.

الگوی ۲: Sidecar Pattern

هر MCP Server یه «همراه» (sidecar) داره که مسئول لاگ، مانیتورینگ و ارتباطات امن هست. سرور اصلی فقط با sidecar حرف می‌زنه و sidecar با دنیای بیرون.

این الگو توی Kubernetes خیلی رایجه و برای محیط‌های بزرگ مناسبه.

الگوی ۳: Serverless

هر MCP Tool رو به صورت یه function جداگانه deploy می‌کنی (مثلاً AWS Lambda یا Google Cloud Functions). فقط وقتی درخواست داری هزینه می‌بری و scaling خودکاره.

مناسب برای ابزارهایی که استفاده‌شون نامنظمه (مثلاً یه ابزار گزارشگیری هفتگی).

کدوم رو انتخاب کنم؟

پروژه شخصی/کوچک: Docker روی VPS ساده
پروژه متوسط: Docker Compose + Gateway Pattern
پروژه بزرگ/سازمانی: Kubernetes + Sidecar + مانیتورینگ کامل
ابزارهای پراکنده: Serverless

یه مثال واقعی: معماری تیم پشتیبانی

بذار یه مثال کامل بزنم. فرض کن می‌خوای یه سیستم MCP برای تیم پشتیبانی شرکتت بسازی:

سرورها:

سرور CRM: دسترسی به اطلاعات مشتری (read-only)
سرور تیکت: خوندن و بروزرسانی تیکت‌های پشتیبانی
سرور Knowledge Base: جستجو در مستندات داخلی
سرور ایمیل: ارسال پاسخ به مشتری

معماری:

یه API Gateway با احراز هویت JWT جلوی همه سرورها
هر سرور توی Docker container جداگانه
Rate limiting: حداکثر ۵۰ درخواست در دقیقه برای هر کارشناس
لاگ: همه درخواست‌ها توی ELK Stack
Health check: هر ۳۰ ثانیه
تایید انسانی: ارسال ایمیل نیاز به تایید مدیر داره

کارشناس پشتیبانی توی Claude Desktop می‌نویسه: «مشتری علی احمدی مشکل صورتحسابش رو گفته. تیکتش رو پیدا کن، آخرین فاکتور رو چک کن و یه ایمیل پاسخ حرفه‌ای بنویس.»

Claude از سرور CRM اطلاعات مشتری رو می‌گیره، از سرور تیکت تیکت مربوطه رو پیدا می‌کنه، از Knowledge Base الگوی پاسخ رو می‌خونه، و یه ایمیل آماده تایید می‌ده. بعد از تایید کارشناس، ایمیل فرستاده می‌شه.

نکات نهایی پروداکشن

چند نکته آخر که توی پروداکشن خیلی مهمن:

۱. Backup: تنظیمات MCP و لاگ‌ها رو backup بگیر. اگه سرور از دست بره، باید بتونی سریع برشگردونی.

۲. Documentation: مستند کن کدوم سرورها فعالن، چه دسترسی‌هایی دارن و چطور تنظیم شدن. ماه دیگه خودت یادت نمیاد.

۳. Testing: قبل از هر بروزرسانی، توی محیط staging تست کن. مستقیم پروداکشن رو تغییر نده.

۴. Rollback Plan: همیشه یه نسخه قبلی آماده داشته باش. اگه بروزرسانی خراب شد، بتونی سریع برگردی.

۵. Cost Monitoring: مخصوصاً اگه از سرویس‌های ابری استفاده می‌کنی، هزینه‌ها رو مانیتور کن. یه MCP Server که بی‌وقفه API پولی صدا بزنه، می‌تونه صورتحساب سنگینی بسازه.

خلاصه سری

تبریک! به آخر این بخش از سری MCP رسیدی. بذار خلاصه کنم چی یاد گرفتی:

قسمت‌های قبلی: MCP چیه، معماری Client-Server، ساخت سرور، سه قابلیت اصلی
قسمت ۵: اتصال به Claude Desktop و Claude Code، اکوسیستم باز MCP
قسمت ۶: ریسک‌های امنیتی و پنج اصل محافظت
قسمت ۷ (همین قسمت): Docker، Cloud، Scaling، Error Handling، مانیتورینگ و الگوهای معماری

MCP هنوز یه تکنولوژی جوانه و سریع داره تغییر می‌کنه. بهترین کار اینه که شروع کنی — یه سرور ساده بساز، وصلش کن و باهاش کار کن. هر چقدر بیشتر تمرین کنی، بهتر می‌فهمی کجاها به دردت می‌خوره.

قسمت بعدی

قسمت بعدی سری درباره ساخت MCP Server برای دیتابیس هست. یاد می‌گیریم چطور AI رو به صورت امن و کنترل‌شده به دیتابیس وصل کنیم. منتظر باش!