امروزه رویکردهای یادگیری ماشین بهطور گستردهای در تجزیه و تحلیل دادههای حجیم استفاده میشود. با توجه به فناوری جدید و تولید دادههای با بازده بالا در زیست شناسی (مانند دادههای تعیین توالی نسل جدید)، استفاده از روش یادگیری ماشین بر روی دادههای بزرگ بیولوژیکی میتواند به درک مکانیسم بیماری پیچیده مانند سرطان کمک کند. استخراج ژنهای کاندیدا بهعنوان یک هدف درمانی یا نشانگرهای زیستی از دادههای بیولوژیکی حجیم مانند دادههای بیان ژن را میتوان بهعنوان اولین مرحله در درمان سرطان در نظر گرفت. بنابراین، توسعه یک رویکرد کارآمد برای تجزیه و تحلیل چنین دادههایی نقشی اساسی در بیوانفورماتیک و زیستشناسی محاسباتی دارد. در این مقاله، ما با اعمال الگوریتم رقابت جهانی و ماشین بردار پشتیبان بر روی دادههای بیان ژن مربوط به سرطان ریه تلاش کردهایم ژنهای مرتبط با سرطان ریه را بهعنوان نشانگرهای زیستی بالقوه کشف کنیم. دادههای مورد استفاده، دادههای بهدست آمده از تکنولوژی RNA-Seq و مربوط به نمونههای سرطان ریه و همینطور نمونههای بافت سالم هستند که از پایگاه دادهی TCGA دریافت شدهاند. این دادههای شامل بیان ژنهای mRNA در نمونههای بافت سرطانی و سالم میباشند. نتایج بررسی منجر به کشف ژنهای با اهمیتی شد که با توجه به مقالات قبلی منتشر شده نقش مهمی در شکلگیری سرطان دارند و نقش آنها در شکلگیری سرطان ریه را نیز میتواند در مطالعات آینده مورد بررسی قرار داد. همچنین نتایج اعتبار سنجی روش پیشنهادی نشان دهندهی قدرت روشهای مبتنی بر یادگیری ماشین در تحلیل دادههایی بیان ژن هستند.
بازنشر اطلاعات | |
![]() |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |