در حال بارگذاری...

عبارات منظم

عبارات منظم یا Regular Expressions (Regex) یک ابزار قدرتمند برای شناسایی، اعتبارسنجی و پردازش متن است که در توسعه نرم‌افزار و معماری سیستم اهمیت زیادی دارد. با استفاده از عبارات منظم می‌توان متون پیچیده را به‌صورت دقیق جستجو، استخراج و اصلاح کرد، بدون نیاز به حلقه‌های پیچیده یا شرایط تو در تو. این ابزار برای اعتبارسنجی داده‌ها، تحلیل لاگ‌ها، پردازش رشته‌ها و پیاده‌سازی الگوریتم‌های پیشرفته جستجو بسیار کاربردی است.
در توسعه Backend، از عبارات منظم برای بررسی فرمت ایمیل، شماره تلفن یا شناسه‌های کاربری، تحلیل لاگ‌های سرور، پاکسازی داده‌ها و اتوماسیون فرآیندهای متنی استفاده می‌شود. فهم دقیق سینتکس Regex، ساختار داده‌های حاصل از تطابق و الگوریتم‌های زیرساختی برای نوشتن کد بهینه و قابل نگهداری ضروری است. همچنین با بهره‌گیری از اصول شی‌گرایی می‌توان منطق Regex را در کلاس‌های قابل استفاده مجدد کپسوله کرد که باعث افزایش مقیاس‌پذیری و پایداری سیستم‌های پیچیده می‌شود.
در این آموزش، خواننده با سینتکس پایه و پیشرفته عبارات منظم، تکنیک‌های شناسایی الگوها و مثال‌های عملی در محیط توسعه نرم‌افزار آشنا می‌شود. همچنین روش‌های جلوگیری از خطاهای رایج مانند نشت حافظه، مدیریت نادرست خطاها و الگوریتم‌های ناکارآمد ارائه خواهد شد. پس از مطالعه، قادر خواهید بود راه‌حل‌های امن، بهینه و قابل نگهداری برای پردازش متن با عبارات منظم ایجاد کنید.

مثال پایه

python
PYTHON Code
import re

# متن نمونه

text = "ایمیل کاربر: [[email protected]](mailto:[email protected])"

# الگوی Regex برای ایمیل

pattern = r"\[a-zA-Z0-9._%+-]+@\[a-zA-Z0-9.-]+.\[a-zA-Z]{2,}"

# جستجوی الگو در متن

match = re.search(pattern, text)

if match:
print("ایمیل یافت شد:", match.group())
else:
print("ایمیل یافت نشد")

در این مثال ابتدا ماژول re در پایتون وارد شده است که توابع پایه برای Regex را فراهم می‌کند. متغیر text شامل یک رشته با ایمیل است.
الگوی Regex شامل بخش‌های زیر است:

  • [a-zA-Z0-9._%+-]+: بخش نام کاربری ایمیل که شامل حروف، اعداد و برخی کاراکترهای خاص است. '+' تضمین می‌کند که حداقل یک کاراکتر موجود باشد.
  • @: جداکننده نام کاربری و دامنه.
  • [a-zA-Z0-9.-]+: بخش دامنه ایمیل را تطبیق می‌دهد.
  • .[a-zA-Z]{2,}: بخش دامنه سطح بالا مانند .com یا .org.
    تابع re.search اولین تطابق الگو را در متن پیدا می‌کند و match.group() رشته یافته را بازمی‌گرداند. این مثال نشان می‌دهد چگونه می‌توان با استفاده از Regex داده‌ها را اعتبارسنجی و متن را استخراج کرد. رعایت بهترین شیوه‌ها شامل بررسی وجود match قبل از استفاده از group() و نوشتن الگوهای واضح و بهینه است.

مثال کاربردی

python
PYTHON Code
import re

class EmailValidator:
def init(self, pattern=None):
self.pattern = pattern or r"\[a-zA-Z0-9._%+-]+@\[a-zA-Z0-9.-]+.\[a-zA-Z]{2,}"

def validate(self, email):
if not isinstance(email, str):
raise TypeError("ایمیل باید یک رشته باشد")
return bool(re.fullmatch(self.pattern, email))

# لیست ایمیل‌ها برای اعتبارسنجی

emails = \["[[email protected]](mailto:[email protected])", "invalid-email@", "[[email protected]](mailto:[email protected])"]

validator = EmailValidator()
for email in emails:
try:
if validator.validate(email):
print(f"{email} معتبر است")
else:
print(f"{email} نامعتبر است")
except Exception as e:
print(f"خطا در اعتبارسنجی {email}: {e}")

در این مثال، منطق Regex در یک ساختار شی‌گرایانه کپسوله شده است. کلاس EmailValidator امکان استفاده از الگوی سفارشی یا الگوی پیش‌فرض را فراهم می‌کند. متد validate نوع ورودی را بررسی می‌کند و از re.fullmatch برای تطبیق کامل رشته استفاده می‌کند.
نکات کلیدی:

  • بررسی نوع ورودی با isinstance باعث افزایش پایداری می‌شود.
  • re.fullmatch اطمینان می‌دهد کل رشته با الگو مطابقت داشته باشد.
  • مدیریت استثناها (Exception Handling) از ایجاد خطاهای runtime جلوگیری می‌کند.
    این روش برای سیستم‌های Backend مناسب است زیرا باعث افزایش قابلیت استفاده مجدد، وضوح و پردازش امن ورودی‌ها می‌شود.

بهترین شیوه‌ها و اشتباهات رایج:

  • نوشتن الگوهای واضح برای جلوگیری از تطابق‌های غیرمنتظره.
  • انتخاب تابع مناسب: re.search، re.match یا re.fullmatch بر اساس نیاز.
  • استفاده از re.compile برای الگوهای پرتکرار به منظور بهبود عملکرد.
  • عدم ایجاد مکرر شیء Regex در حلقه‌ها برای کاهش مصرف حافظه.
  • بررسی ورودی و مدیریت Exceptions برای اطمینان از پایداری سیستم.
  • استفاده از quantifierهای non-greedy برای جلوگیری از backtracking زیاد.
  • استفاده از re.findall یا re.finditer برای بررسی تمام تطابق‌ها در debug.
    با رعایت این نکات می‌توان از نشت حافظه، الگوریتم‌های ناکارآمد و خطاهای زمان اجرا جلوگیری کرد و پردازش متنی امن و بهینه داشت.

📊 جدول مرجع

Element/Concept Description Usage Example
"." مطابقت با هر کاراکتر به جز newline re.search(r".", "abc")
"*" مطابقت با صفر یا بیشتر از عنصر قبلی re.search(r"a*", "aaa")
"+" مطابقت با یک یا بیشتر از عنصر قبلی re.search(r"a+", "aaa")
"\[]" مطابقت با هر کاراکتر داخل براکت‌ها re.search(r"\[a-z]", "سلام")
"^" "مطابقت با ابتدای رشته" re.match(r"^سلام", "سلام دنیا")
"\$" "مطابقت با انتهای رشته" re.search(r"دنیا\$", "سلام دنیا")

عبارات منظم ابزار قدرتمند و کارآمد برای پردازش متن، اعتبارسنجی و استخراج داده‌ها هستند. تسلط بر Regex امکان پیاده‌سازی اعتبارسنجی‌های پیچیده، تحلیل لاگ‌ها و اتوماسیون فرآیندهای متنی با دقت بالا را فراهم می‌کند.
گام‌های بعدی شامل یادگیری ویژگی‌های پیشرفته مانند گروپینگ، backreferences، lookahead/ lookbehind و الگوهای پیچیده جایگزینی است. توصیه می‌شود بر روی داده‌های واقعی تمرین کنید، منطق Regex را در کلاس‌ها کپسوله کنید و آن را با الگوریتم‌ها ترکیب کنید تا راه‌حل‌های Backend مقیاس‌پذیر ایجاد شود. منابع: مستندات رسمی Python re، سایت‌های تعاملی تست Regex و راهنماهای حل مسئله الگوریتمی.

🧠 دانش خود را بیازمایید

آماده شروع

آزمون دانش شما

درک خود از این موضوع را با سوالات کاربردی بسنجید.

4
سوالات
🎯
70%
برای قبولی
♾️
زمان
🔄
تلاش‌ها

📝 دستورالعمل‌ها

  • هر سوال را با دقت بخوانید
  • بهترین پاسخ را برای هر سوال انتخاب کنید
  • می‌توانید آزمون را هر چند بار که می‌خواهید تکرار کنید
  • پیشرفت شما در بالا نمایش داده می‌شود