تحقیق روش های یاد گیری شبکه های تنظیم کننده ژنی

پیشینه تحقیق و پایان نامه و پروژه دانشجویی

پیشینه تحقیق روش های یاد گیری شبکه های تنظیم کننده ژنی دارای ۴۳ صفحه می باشد فایل پیشینه تحقیق به صورت ورد  word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود  آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.

فهرست مطالب

مقدمه    ۴
۲-۱- مقدمات زیستی    ۷
۲-۱-۱- ژن    ۷
۲-۱-۲- بیان ژن    ۸
۲-۱-۳- شبکه های تنظیم کننده ژنی    ۹
۲-۲-روش های یاد گیری شبکه های تنظیم کننده ژنی    ۱۰
۲-۲-۱- روش های مبتنی بر خوشه بندی    ۱۰
۲-۲-۲- روش های مبتنی بر رگرسیون    ۱۱
۲-۲-۳- روش های مبتنی بر اطلاعات متقابل    ۱۲
۲-۲-۴- روش های تابعی    ۱۲
۲-۲-۵- روش های مبتنی بر تئوری سیستم    ۱۲
۲-۲-۶- روش های بیزین    ۱۳
۳-۱-مقدمه    ۱۶
۳-۲- شبکه های بیزین دینامیک    ۱۷
۳-۳- یادگیری شبکه های بیزین دینامیک    ۱۹
۳-۳-۱- روش های امتیازدهی بیزین    ۲۰
۳-۳-۱-۱- امتیازدهی به روش K2    ۲۲
۳-۳-۱-۲- امتیازدهی به روش BDe    ۲۲
۳-۳-۲- روش های امتیازدهی بر اساس تئوری اطلاعات    ۲۳
۳-۳-۲-۱- امتیازدهی به روش log-likelihood (LL)    ۲۳
۳-۳-۲-۲- امتیازدهی به روش BIC    ۲۴
۳-۳-۲-۳- امتیازدهی به روش AIC    ۲۵
۳-۳-۲-۴- امتیازدهی به روش MIT    ۲۵
۳-۳-۳- پیچیدگی زمانی یادگیری شبکه های بیزین دینامیک    ۲۶
۳-۴- شبکه های تصادفی و شبکه های Scale-Free    ۲۸
۳-۵- روش پیشنهادی    ۳۲
فهرست منابع    ۴۱

منابع

[۱] Sima, Chao, Jianping Hua, and Sungwon Jung. “Inference of gene regulatory networks using time-series data: a survey.” Current genomics 10, no. 6 (2009): 416.

[۲] Pham, Tuan D., Christine Wells, and Denis Crane. “Analysis of microarray gene expression data.” Current bioinformatics 1, no. 1 (2006): 37-53.

[۳] Akutsu, Tatsuya, Satoru Miyano, and Satoru Kuhara. “Identification of genetic networks from a small number of gene expression patterns under the Boolean network model.” In Pacific Symposium on Biocomputing, vol. 4, pp. 17-28. Maui, Hawaii: World Scientific, 1999.

[۴] Shmulevich, Ilya, Edward R. Dougherty, Seungchan Kim, and Wei Zhang. “Probabilistic Boolean networks: a rule-based uncertainty model for gene regulatory networks.” Bioinformatics 18, no. 2 (2002): 261-274.

[۵] De Hoon, Michiel, Seiya Imoto, Kazuo Kobayashi, Naotake Ogasawara, and Satoru Miyano. “Inferring gene regulatory networks from time-ordered gene expression data of Bacillus subtilis using differential equations.” In Biocomputing 2003: Proc. Pacific Symposium, vol. 8, pp. 17-28. 2002.

[۶] Friedman, Nir, Michal Linial, Iftach Nachman, and Dana Pe’er. “Using Bayesian networks to analyze expression data.” Journal of computational biology 7, no. 3-4 (2000): 601-620.

[۷] Perrin, Bruno-Edouard, Liva Ralaivola, Aurelien Mazurie, Samuele Bottani, Jacques Mallet, and Florence d’Alche–Buc. “Gene networks inference using dynamic Bayesian networks.” Bioinformatics 19, no. suppl 2 (2003): ii138-ii148.

[۸] Zou, Min, and Suzanne D. Conzen. “A new dynamic Bayesian network (DBN) approach for identifying gene regulatory networks from time course microarray data.” Bioinformatics 21, no. 1 (2005): 71-79.

[۹] Kim, Sun Yong, Seiya Imoto, and Satoru Miyano. “Inferring gene networks from time series microarray data using dynamic Bayesian networks.” Briefings in bioinformatics 4, no. 3 (2003): 228-235.

[۱۰] Husmeier, Dirk. “Sensitivity and specificity of inferring genetic regulatory interactions from microarray experiments with dynamic Bayesian networks.” Bioinformatics 19, no. 17 (2003): 2271-2282.

[۱۱] Hecker, Michael, Sandro Lambeck, Susanne Toepfer, Eugene van Someren, and Reinhard Guthke. “Gene regulatory network inference: Data integration in dynamic models—A.” Biosystems 96 (2009): 86-103.

[۱۲] Sandy Shaw, Evidence of Scale-free Topology and Dynamics in Gene Regulatory Networks, Proceedings of the ISCA 12th International Conference on Intelligent and Adaptive Systems and Software Engineering, Vol. 0 (2003), pp. 37-40

مقدمه

در هر سلول یک ارگانیزم زنده، هر لحظه، هزاران ژن با هم در ارتباط هستند تا فرآیندهای پیچیده زیستی را انجام پذیر سازند. شبکه های تنظیم کننده ژنتیکی[۱] مجموعه ای از قسمت های DNA در سلول می باشد که به طور غیر مستقیم (به وسیله RNA یا پروتئین های تولیدی) با یکدیگر و مواد دیگر درون سلول ارتباط دارند و بدین طریق سرعت رونویسی[۲] از روی ژن ها را برای تشکیل mRNA کنترل می کنند. هر مولکول mRNA یک پروتئین خاص با کارایی خاصی را تولید می کند. بعضی از پروتئین ها فقط برای فعال یا غیر فعال کردن ژن ها استفاده می شوند. این گونه پروتئین ها فاکتورهای رونویسی[۳] نامیده می شوند و اصلی ترین نقش را در شبکه تنظیم ژنی ایفا می کنند. به بیان دیگر شبکه تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن است که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد. از این رو تشخیص و مهندسی معکوس شبکه های تنظیم کننده ژنتیکی به یکی از مهم ترین زمینه های تحقیقاتی تبدیل شده است [۱].

عموماً برای تشکیل شبکه های تنظیم کننده ژنتیکی از داده های Microarray استفاده می کنند. Microarray یک تکنولوژی است که قابلیت اندازه گیری هم زمان میزان بیان[۴] mRNA مربوط به هزاران ژن را بوجود آورده است و می تواند اطلاعات مربوط به ارتباط ژن ها را در سطح ژنوم در اختیار ما قرار دهد [۲]. اما راه حل ساده ای برای تشخیص شبکه های تنظیم کننده ژنتیکی از روی داده های Microarray وجود ندارد. در بیشتر موارد تعداد مجهولات مسئله بسیار زیاد است. این در حالی است که تعداد کمی داده در اختیار داریم. همچنین در بسیاری از موارد میزان خطا در اندازه گیری های موجود بالاست و یا با مشکل عدم وجود اندازه گیری برای بعضی از متغیرها مواجه هستیم.

داده های Microarray را می توان به دو نوع ایستا[۵] و سری زمانی[۶] تقسیم نمود. حالت اول تصویری است از بیان ژن ها در یک لحظه و شرایطی خاص. در حالت دوم بیان ژن ها در یک فرآیند درون سلولی در طول زمان اندازه گیری می شود. این سری های زمانی منعکس کننده فرآیندهای دینامیک درون سلولی هستند. اکثر روش های اولیه ای که برای آنالیز داده های سری زمانی Microarray استفاده می شدند در واقع روش هایی بودند که برای داده های ایستا طراحی شده بودند. در چند سال اخیر روش هایی برای کار با داده های سری زمانی به طور خاص مطرح شده اند که قادرند علاوه بر حل مشکلاتی که مخصوص داده های سری زمانی هستند، از ویژگی های منحصر به فرد این گونه داده ها نیز استفاده کنند. با این حال کار کردن با داده های سری زمانی نیازمند ظرافت و دقت بیشتری نسبت به داده های ایستا است و عمل مهندسی معکوس شبکه های تنظیم کننده ژنتیکی در این موارد مشکل تر است.

روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده اند که مهمترین آن ها عبارتند از: شبکه های بولین [۳]، شبکه های بولین تصادفی [۴]، معادلات دیفرانسیل [۵] و شبکه های بیزین[۷] [۶]. در این میان، شبکه های بیزین که قادرند رابطه علت و معلولی بین متغیر ها را بر اساس روابط احتمالاتی بیان کنند توجه زیادی را به خود معطوف کرده اند. به علت نویزی بودن داده های Microarray، استفاده از مدل های احتمالاتی به میزان زیادی می تواند کارایی مدل را افزایش دهد. علیرغم موفقیت نسبی شبکه های بیزین، عدم امکان وجود حلقه[۸] در این شبکه ها کارایی آنها را در بسیاری از موارد محدود می کند چون در شبکه های تنظیم کننده ژنتیکی واقعی حلقه های بازخورد[۹] متداول هستند. از این رو زمانی که با داده های سری زمانی مواجه هستیم شبکه های بیزین دینامیک به گزینه ای مناسب برای مدل کردن تبدیل می شود [۷،۸،۹]. شبکه های بیزین دینامیک فرم عمومی تری از شبکه های بیزین هستند که می توانند داده های با تاخیرهای زمانی را مدل کنند.

شبکه های بیزین دینامیک مزایای ویژه ای دارا می باشند که باعث شده تا این مدل توجه زیادی را به خود جلب کند. اول اینکه در این نوع مدل قادر هستیم تا روابط علت و معلولی بین متغیر ها را مستقیماً نشان داده و از اطلاعات موجود در این مورد استفاده کنیم. دومین امتیاز این مدل ماهیت تصادفی آن است. فرآیند های مربوط به تنظیمات ژنی فرآیند های تصادفی هستند و حتی اگر خود این فرآیندها ذاتاً قطعی باشند، میزان زیاد خطا در اندازه گیری های انجام شده باعث می شوند تا فرآیند ها از دید ما تصادفی باشند. سومین موردی که باعث برتری این مدل می شود قابلیت این شبکه ها برای دنبال کردن تغییر متغیرها در طول زمان است.

علیرغم این ویژگی ها مهندسی معکوس شبکه های تنظیم ژن از روی داده های سری زمانی به وسیله شبکه های بیزین دینامیک به هیچ عنوان امری بدیهی نیست. غالباً تعداد نمونه های موجود برای آموزش مدل از تعداد مجهولات مسئله بسیار کمتر است [۱۰]. همچنین در مقادیر اندازه گیری شده خطای زیادی وجود دارد و در مواردی برای بعضی از متغیرها اندازه گیری صورت نگرفته است. در حال حاضر در اکثر موارد در آزمایش هایی با تعداد کمی ژن یا داده های شبیه سازی شده به کار گرفته شده اند. میزان پیچیدگی زیاد این مدل ها و همچنین کمی دقت آنها از مهم ترین نواقص آن ها می باشند. برای بدست آوردن مدل هایی برای کار با داده های حجم بالا و افزایش کارایی مدل های تولید شده به تحقیقات بیشتری در این زمینه نیاز است.

یکی از عمده ترین روش هایی که برای بالا بردن دقت شبکه های استنتاج شده و جبران کمبود داده های آموزشی طی فرآیند یادگیری شبکه به کار گرفته می شود استفاده از دانش اولیه در مورد شبکه های تنظیم کننده ژنی است [۱۱]. یکی از منابع عمده این دانش اولیه اطلاعاتی است که در مورد ساختار کلی شبکه های تنظیم کننده ژن بدست آمده است. تحقیقات انجام شده نشان می دهند که این شبکه ها از نظر ارتباطی خلوت[۱۰] هستند. به بیان دیگر تعداد یال های موجود در این شبکه ها کم است. همچنین شواهد بسیاری بدست آمده اند که نشان می دهند توزیع درجه خروجی در شبکه های تنظیم ژنی از قانون توانی[۱۱] پیروی می کنند [۱۲،۱۳]. در واقع این شبکه ها در درجه خروجی scale-free هستند. این در حالی است که درجه ورودی در آن ها از توزیع پواسن با میانگین کم پیروی می کند [۱۴،۱۵،۱۶].

به زبان زیستی، در شبکه های تنظیم کننده ژنی بیان هر ژن توسط تعداد کمی ژن دیگر تنظیم می شود و همچنین اکثر ژن ها بر روی تعداد کمی ژن دیگر اثر تنظیم کنندگی دارند. اما، تعداد محدودی از ژن ها وجود دارند که بر روی بیان تعداد زیادی از ژن های دیگر اثر دارند. این ژن ها که عمده ترین نقش را در شبکه های تنظیم کننده ژنی بر عهده دارند hub نامیده می شوند.

با وجود اینکه شواهد بسیاری در تایید ساختار scale-free شبکه های تنظیم کننده ژنی بدست آمده است، تمامی روش های یادگیری شبکه های بیزین دینامیک این گونه شبکه ها را شبکه هایی با ساختار تصادفی در نظر می گیرند و یا تنها پیچیدگی شبکه را کنترل می کنند.

۲-۱- مقدمات زیستی

در زیر به بیان مفاهیم مربوط به ژن، بیان ژن و شبکه های تنظیمات ژنی پرداخته می شود.

۲-۱-۱- ژن[۱۲]

ژن قسمتی از DNA است که یک خصوصیت ویژه موروثی را کد می کند. دنباله های دیگر موجود در DNA اهداف ساختاری دارند و یا نقش تنظیم کننده را برای استفاده از اطلاعات ژن ها ایفا می کنند. طول یک ژن بر اساس تعداد بازهای موجود در آن بیان می شود و می تواند از چند صد تا چند صد هزار باز را شامل شود؛ اما به طور متوسط یک ژن شامل صد هزار تا صد و پنجاه هزار باز است.

یک ژن می تواند بیش از یک فرم داشته باشد که هر کدام یک آلل[۱۳] خوانده می شوند. آلل های مختلف می توانند خصوصیات فنوتیپیکی مختلفی را ایجاد کنند. برای مثال آلل های مختلف ژن مرتبط با رنگ چشم می توانند موجب ایجاد چشم با رنگ سبز یا قهوه ای شوند. با این وجود، بسیاری از اختلافات ژنی تأثیر قابل مشاهده ای ندارند.

ژن ها دستور العمل ساخت پروتئین یا RNA را کد می کنند. پروتئین ها مهم ترین واحد کاری سلول ها هستند و در تقریباً در تمام فرآیندهای سلولی نقش اساسی ایفا می کنند. گروهی از پروتئین ها ساختاری هستند و مسئولیت شکل دادن به سلول ها و بافت ها را بر عهده دارند. گروه دیگر پروتئین ها آنزیم هستند و باعث سرعت بخشیدن به واکنش های درون سلول می شوند. برخی از پروتئین ها نقش جا به جا کردن مولکول های دیگر را برعهده دارند و برخی دیگر مسئول ارسال و دریافت سیگنال هستند. یکی دیگر از نقش های مهم پروتئین ها تنظیم فرآیندهای درون سلول است.

۲-۱-۲- بیان ژن[۱۴]

در تمامی ارگانیسم ها دو مرحله اصلی برای ساخت پروتئین از روی ژنی که آن پروتئین را کد می کند وجود دارد. در مرحله اول، طی فرآیندی به نام نسخه برداری[۱۵]، از روی DNA حاوی ژن مورد نظر RNA پیام رسان[۱۶] (mRNA) تولید می شود. در مرحله دوم که ترجمه[۱۷] نام دارد، از روی mRNA پروتئین ساخته می شود. فرآیندی که طی آن یک مولکول عملیاتی زیستی از نوع RNA یا پروتئین تولید می شود بیان ژن نام دارد. مولکول تولید شده محصول ژن[۱۸] خوانده می شود.

۲-۱-۳- شبکه های تنظیم کننده ژنی

یک شبکه تنظیمات ژنی مجموعه ای است از قسمت هایی از DNA که به طور غیر مستقیم، از طریق محصول ژنی که می تواند پروتئین یا RNA باشد، با یکدیگر و مواد دیگر درون سلول در تعاملند و در نتیجه این تعامل نرخ تولید mRNA از روی ژن ها را کنترل می کند. قبلاً اشاره شد که پروتئین ها نقش های مختلف و اساسی در سلول ایفا می کنند. بعضی از پروتئین ها وظیفه فعال یا غیر فعال کردن ژن ها را بر عهده دارند. به این گونه پروتئین ها فاکتورهای رونویسی[۱۹] گفته می شود و نقش اصلی را در شبکه های تنظیم ژنی بازی می کنند.

در پیش هسته ای ها، شبکه های تنظیمات به محیط خارجی سلول واکنش نشان می دهند و بدین وسیله شرایط را برای زنده ماندن سلول در آن محیط فراهم می سازند. در ارگانیسم های چند سلولی مانند حیوانات همین شبکه ها شکل بدن را کنترل می کنند. در فرآیند تقسیم سلولی، ژنوم سلول های فرزند به طور کامل با ژنوم سلول مولد یکی است اما ژن هایی که در هر یک از این سلول ها فعالند می توانند با هم متفاوت باشند.

یکی از ویژگی های مهم حیوانات چند سلولی استفاده از گرادیان های مورفوژنی است که یک سیستم مکان یابی را بوجود می آورند که به سلول اطلاع می دهد که در چه نقطه ای از بدن قرار گرفته است و متعاقباً چه ویژگی هایی باید داشته باشد.

[۱] Gene regulatory networks

[۲] Transcription

[۳] Transcription factor

[۴] Expression level

[۵] Static

[۶] Time-Series

[۷] Bayesian networks

[۸] Cycle

[۹] Feedback loops

[۱۰] Sparse connectivity

[۱۱] Power-law

[۱۲] Gene

[۱۳] Allele

[۱۴] Gene Expression

[۱۵] Transcription

[۱۶] Messenger RNA

[۱۷] Translation

[۱۸] Gene product

[۱۹] Transcription factor

50,000 ریال – خرید

تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید. 

مطالب پیشنهادی: برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

جستجو پیشرفته

دسته‌ها

آخرین بروز رسانی

    جمعه, ۷ اردیبهشت , ۱۴۰۳
اولین پایگاه اینترنتی اشتراک و فروش فایلهای دیجیتال ایران
wpdesign Group طراحی و پشتیبانی سایت توسط digitaliran.ir صورت گرفته است
تمامی حقوق برایpayandaneshjo.irمحفوظ می باشد.