سوگیری انتخاب (Selection Bias) در اپیدمیولوژی تحلیلی
درک یک خطای نظاممند در قلب پژوهشهای اپیدمیولوژیک

در پژوهشهای اپیدمیولوژیک، هدف اصلی آن است که با استفاده از دادههای مشاهدهای، ارتباط واقعی میان مواجههها (Exposures) و پیامدهای سلامت (Outcomes) شناسایی شود. اما دستیابی به برآوردی دقیق از این ارتباط، تنها زمانی ممکن است که افراد مورد مطالعه نمایندهای واقعی از جمعیت هدف باشند. هرگاه این شرط نقض شود، نتایج مطالعه در معرض سوگیری انتخاب (Selection Bias) قرار میگیرد. زکلو و نیتو در بخش ۴/۲ از کتاب Epidemiology: Beyond the Basics این پدیده را یکی از مهمترین تهدیدهای اعتبار درونی (Internal Validity) مطالعهها میدانند و آن را چنین تعریف میکنند: «سوگیری انتخاب زمانی رخ میدهد که احتمال ورود افراد به مطالعه، یا باقی ماندن آنها در مطالعه، به گونهای با مواجهه و پیامد مرتبط باشد که باعث تغییر در برآورد واقعی ارتباط میان آن دو گردد.» بهعبارت دیگر، این نوع سوگیری حاصل انتخاب غیرتصادفی یا نامتوازن گروههاست؛ به گونهای که تفاوت در مواجهه یا پیامد میان شرکتکنندگان و افراد خارج از مطالعه موجب تحریف نتایج میشود. Epiran در این پست قصد دارد بسیار کوتاه به خلاصه این بخش از کتاب بپردازد و مخاطبانش را با سوگیری انتخاب بیشتر آشنا نماید.
ماهیت و منشاء سوگیری انتخاب:
سوگیری انتخاب ممکن است در مراحل مختلف پژوهش رخ دهد:
-
پیش از ورود به مطالعه (در طراحی و گزینش):
زمانی که انتخاب موارد و شاهدها (در مطالعات مورد-شاهدی) یا انتخاب افراد در معرض و غیر در معرض (در مطالعات کوهوورت) بهصورت نامتوازن انجام شود.-
مثال: در یک مطالعه مورد-شاهدی دربارهٔ ارتباط سیگار با سرطان ریه، اگر شاهدها از میان افرادی انتخاب شوند که بهدلیل بیماریهای دیگر در بیمارستان بستریاند و خود احتمال سیگار کشیدن در آنها متفاوت است، سوگیری انتخاب رخ میدهد.
-
-
در حین پیگیری (Attrition Bias):
در مطالعات طولی، زمانی که میزان ریزش نمونهها با مواجهه یا پیامد مرتبط باشد، یعنی احتمال ترک مطالعه در بین گروهها متفاوت است.-
مثال: در مطالعهای کوهوورت دربارهٔ فعالیت بدنی و بیماری قلبی، اگر افراد کمتحرک زودتر از مطالعه خارج شوند (به علت بیماری یا مرگ)، خطر واقعی بیماری قلبی در گروه کمتحرک کمتر از واقع برآورد میشود.
-
-
پس از وقوع پیامد (در ثبت دادهها یا مراجعه):
گاهی احتمال تشخیص یا گزارش پیامد، بسته به وضعیت مواجهه متفاوت است.-
مثال: زنان دارای تحصیلات بالا ممکن است بیشتر به غربالگری سرطان پستان مراجعه کنند؛ در نتیجه، میزان بروز سرطان در این گروه ظاهراً بالاتر دیده میشود، در حالی که تفاوت واقعی ممکن است اندک باشد.
-
انواع مهم سوگیری انتخاب:
۱. سوگیری برکسون (Berkson’s Bias)
زکلو و نیتو این نوع سوگیری را یکی از مثالهای کلاسیک در مطالعات بیمارستانی میدانند. در این حالت، انتخاب هر دو گروه «مورد» و «شاهد» از بین بیماران بستریشده انجام میشود. چون بستریشدن ممکن است با هر دو عامل مواجهه و پیامد مرتبط باشد، احتمال ترکیب خاصی از مواجهه و بیماری در بین بستریها بیشتر یا کمتر از جمعیت عمومی است.
بهطور مثال، اگر دیابت و بیماری قلبی هر دو احتمال بستریشدن را افزایش دهند، در مطالعهای بیمارستانی ممکن است ارتباطی کاذب میان این دو مشاهده شود، حتی اگر در جامعه ارتباطی وجود نداشته باشد.
۲. سوگیری ناشی از خودانتخابی (Volunteer Bias)
زمانی رخ میدهد که شرکت در مطالعه داوطلبانه است. معمولاً افراد سالمتر، تحصیلکردهتر یا دارای انگیزههای سلامتمحور بیشتر در چنین مطالعاتی شرکت میکنند. در نتیجه، جمعیت مطالعه از نظر رفتارهای سلامت با جمعیت واقعی تفاوت دارد.
این پدیده در مطالعات غربالگری (Screening Studies) و مطالعات سلامت جمعیتی رایج است.
۳. سوگیری بقا (Survivor or Prevalence-Incidence Bias)
در مطالعات مقطعی، فقط افرادی بررسی میشوند که هنوز زنده و قابل مشاهدهاند. اگر بیماری باعث مرگ زودرس شود، موارد شدیدتر از مطالعه حذف میشوند و تنها موارد خفیف باقی میمانند. این امر منجر به برآورد کمتر از واقع ارتباط بین مواجهه و بیماری میشود.
نمونهٔ کلاسیک: در بررسی ارتباط فشار خون بالا با سکته مغزی، بیماران سکتهٔ مرگبار در مطالعه حضور ندارند.
۴. سوگیری ناشی از ریزش (Loss to Follow-up Bias)
در مطالعات طولی، خروج نامتناسب گروهها (مثلاً مهاجرت، مرگ، یا عدم پیگیری) منجر به از دست رفتن تعادل اولیه میان گروهها میشود. اگر احتمال خروج با متغیرهای اصلی مرتبط باشد، برآورد خطر بهصورت نظاممند منحرف میشود.
پیامدهای سوگیری انتخاب بر اعتبار نتایج:
نویسندگان تأکید میکنند که اثر سوگیری انتخاب بر اعتبار درونی (Internal Validity) بسیار جدی است، زیرا برآوردهای نهایی دیگر نمایندهٔ واقعی جمعیت هدف نیستند. بهعلاوه، این سوگیریها معمولاً غیرقابل اصلاح در مرحلهٔ تحلیل آماری هستند. برخلاف خطاهای تصادفی، افزایش حجم نمونه کمکی به حذف سوگیری انتخاب نمیکند؛ چرا که منشاء آن ساختاری و سیستماتیک است.
راهکارهای پیشگیری و کنترل:
در طراحی مطالعه
-
تعریف دقیق جمعیت پایه (Base Population):
مشخصکردن دقیق افرادی که واجد شرایط ورود به مطالعه هستند، تا بتوان موارد و شاهدها را از همان جمعیت انتخاب کرد. -
کنترل مسیر انتخاب:
اطمینان از اینکه مسیر ورود موارد و شاهدها به مطالعه مشابه است (مثلاً هر دو از همان بیمارستان یا جامعه انتخاب شوند). -
استفاده از معیارهای ورود و خروج استاندارد و شفاف:
جلوگیری از تصمیمگیریهای سلیقهای در گزینش شرکتکنندگان.
در اجرای مطالعه
-
افزایش نرخ پاسخگویی (Response Rate):
از طریق تماسهای مکرر، انگیزههای اخلاقی و آموزش شرکتکنندگان. -
پیگیری فعال در مطالعات طولی:
بهمنظور کاهش ریزش نمونهها (attrition) و جمعآوری داده از افرادی که ترک مطالعه کردهاند.
در تحلیل دادهها
-
تحلیل حساسیت (Sensitivity Analysis):
ارزیابی اینکه تغییر مفروضات دربارهٔ دادههای ازدسترفته تا چه حد نتایج را تغییر میدهد. -
وزندهی براساس احتمال انتخاب:
در برخی موارد، استفاده از روشهای آماری مانند inverse probability weighting میتواند اثر سوگیری انتخاب را تا حدودی کاهش دهد.
سخن پایانی:
سوگیری انتخاب، پدیدهای است که در سکوت و اغلب بدون نشانهٔ ظاهری، بنیان استنباط علمی را تهدید میکند. پژوهشگر اپیدمیولوژی باید آن را نهتنها بهعنوان یک مفهوم نظری، بلکه بهعنوان یک خطر واقعی در هر مرحله از پژوهش مدنظر قرار دهد. زکلو و نیتو در کتاب «اپیدمیولوژی فراتر از مبانی» تأکید میکنند که تشخیص، پیشگیری و تحلیل دقیق سوگیری انتخاب از نشانههای بلوغ علمی اپیدمیولوژیست ها است. در نهایت، صداقت علمی ایجاب میکند که در هر گزارش تحقیقاتی، پژوهشگر بهصراحت احتمال وجود این نوع سوگیری را بیان و تأثیر احتمالی آن را بر یافتهها تحلیل کند.
منبع این پست:
فصل ۴ کتاب اپیدمیولوژی فراتر از مبانی نوشته زکلو و نیتو – بخش ۲-۴ ( سوگیری انتخاب)



