پیشینه تحقیق مراحل کلی مدلسازی به روش پارامتری دارای ۳۶ صفحه می باشد فایل پیشینه تحقیق به صورت ورد word و قابل ویرایش می باشد. بلافاصله بعد از پرداخت و خرید لینک دنلود فایل نمایش داده می شود و قادر خواهید بود آن را دانلود و دریافت نمایید . ضمناً لینک دانلود فایل همان لحظه به آدرس ایمیل ثبت شده شما ارسال می گردد.
۱) جمعآوری سری دادهها ۴
۱-۱) روشهای تقسیم بندی سری دادهها ۵
۱-۱-۱) تحلیل خوشهای (CA) ۶
۲-۱-۱) انواع خوشهبندی ۶
۱-۱-۳) اندازهگیری فاصله ۷
۱-۱-۴) دستهبندی تفکیکی ۸
۱-۱-۴-۲) دسته بندی مبهم C- میانگین ۸
۱-۱-۴-۳) الگوریتم دستهبندی QT ۹
۱-۱-۴-۱) خوشه بندی K- میانگین ۹
۲) بهینهسازی ساختارهای مولکولی ۱۱
۳) محاسبه توصیفکنندههای مولکولی ۱۲
۳-۱) توصیفکنندههای ساختاری ۱۳
۳-۲) توصیفکنندههای توپولوژیکی ۱۳
۳-۲-۱) توصیفکنندههای جزء ۱۳
۳-۲-۲) اندیسهای توپولوژی ۱۴
۳-۲-۳) توصیفکنندههای زیرساختاری ۱۴
۳-۲-۴) توصیفکنندههای محیطی ۱۴
۳-۳) توصیفکنندههای هندسی ۱۵
۳-۴) توصیفکنندههای الکترونی ۱۵
۳-۵) توصیفکنندههای فیزیکو- شیمیایی ۱۵
۳-۶) توصیفکنندههای توسعهیافته ۱۶
۳-۷) توصیفکنندههای LFER ۱۶
۴) تجزیه و تحلیل آماری توصیفکنندهها و انتخاب مؤثرترین آنها ۱۷
۴-۱) الگوریتم ژنتیک (GA) ۱۸
۴-۱-۱) اصول الگوریتمهای ژنتیکی ۱۸
۴-۱-۲) روشهای انتخاب ۲۰
۵) ایجاد مدلهای آماری ۲۱
۵-۱) رگرسیون خطی چندگانه ۲۱
۵-۲) شبکههای عصبی پرسپترون چند لایه(MLP) ۲۲
۵-۲-۱) تک نرون و ساختار (MLP) ۲۳
۵-۲-۲) پرسپترون چند لایه ۲۵
۵-۲-۳) آموزش شبکههای عصبی MLP ۲۵
۶) انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخاب شده ۲۸
۶-۱) قلمرو کاربرد مدل ۳۲
منابع: ۳۴
Vapnik, V. The Nature of statistical learning theory, Springer-Verlag, New York, 1995.
Puzyn, V.; Leszczynski, J.; Cronin, M.T.D. Recent Advances in QSAR Studies, Springer
Science, New York, 2010.
Kowalski, B. J. chern. Info. Compuy. Sci. 15, 1975, 203.
Massan, D.L.; Vandeginste, B.C.M.; Deming, S.N.; Kaufman, L. Chemometrics: a text book, Elsevier, Amsterdom, 1998.
Walden, P. Molecular weights and electrical conductivity of several fused salts, Bull. Acad. Imper. Sci, St.Petersburg, 1914.
Hurley, F.H.; Wier, T.P. J. Electrochem. Soc. 98, 1951, 207.
Thuy Pham, T.P.; Cho, C.W.; Yun, Y.S. Water Res. 44, 2010, 352.
Earle, M.J.; Seddon, K.R. Pure Appl. Chem. 72, 2000, 1391.
Bourbigou, H.O.; Magna, L.; Morvan, D. Appl. Catal. A 373, 2010, 1056.
Olivier-Bourbigou, H.; Magna, L.; Morvan, D. Applied Catalysis A: General 373, 2010, 1.
Leonard, J.T.; Roy, K. QSAR Comb. Sci. 25, 2006, 235.
Worth, A.P.; Cronin, M.T.D., Report of the Workshop on the Validation of QSARs and
Other Computational Prediction Models, ATLA 2004, 32, Supp 1, 703.
Ramos, E.U.; Vaes, W.H.J.; Verhaar, H.J.M. Environ Sci Pollut Res. 4, 1997, 83.
Everitt, B.S.; Landau, S.; Leese, M. Cluster Analysis, Edward Arnold London, 2001.
McFarland, J.W.; Gans, D. J. Methods and Principles in Medicinal Chemistry, VCH,
Weinheim, 1995, Vol. 2.
Sambamoorthi, N. Hierarchical Cluster Analysis Some Basics and Algorithms,
CRMportals Inc., 2008.
Frisvad, F. Cluster Analysis for Researchers, Lifetime Learning Publications, Belmont, CA, 1984.
Kraskov, A.; Stögbauer, H.; Andrzejak, R.G.; Grassberger, P. Hierarchical Clustering Based on Mutual Information, Cornell University, 2003.
نتایج مطالعات ساختار- فعالیت/ ویژگی علاوه بر شفافسازی نحوه ارتباط بین خواص مولکولها و ویژگیهای ساختمانی آنها، به پژوهشگران در پیشبینی رفتار مولکولهای جدید براساس رفتار مولکولهای مشابه کمک میکند. به مجموعه ابزارها و روشهایی که به این منظور مورد استفاده قرار میگیرند روشهای پارامتری گویند. در روشهای پارامتری سعی میکنند بین یک سری توصیف کنندههای مولکولی با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار نمایند. توصیفکنندههای مولکولی که به این منظور استفاده میشوند، مقادیر عددی میباشند که جنبههای مختلف ساختاری مولکول را به طور کمینشان میدهند. وقتی خصوصیات ساختاری گونهها و فعالیت آنها توسط اعداد و ارقام بیان میشود میتوان رابطه ریاضی یا کمی، بین ساختار و فعالیت گونه ایجاد کرد. این رابطه میتواند برای پیشبینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد. به عبارتی دیگر در این گونه مطالعات توصیفکنندهها به عنوان متغیرهای مستقل و پارامتر بیولوژیکی یا شیمیایی مورد نظر به عنوان متغیر وابسته در نظر گرفته میشوند. در مرحله مدلسازی مدلی از متغیر وابسته بر حسب متغیرهای مستقل ساخته میشود، سپس در مرحله پیشبینی مدل ساخته شده مورد ارزیابی قرار میگیرد. مراحل کلی مدلسازی به روش پارامتری به شرح زیر است:
۱- جمع آوری سری دادهها
۲- وارد کردن ساختارهای مولکولی و بهینهسازی آنها
۳- محاسبه توصیفکنندههای مولکولی
۴- تجزیه و تحلیل آماری توصیفکندهها و انتخاب مؤثرترین آنها
۵- ایجاد مدلهای آماری
۶- انتخاب بهترین مدل و ارزیابی اعتبار مدل انتخابشده
اولین مرحله، جمعآوری و انتخاب یک سری مولکولی از منابع قابل اعتماد و در دسترس است. بایستی کمیت مورد مدلسازی برای ترکیبات مختلف، در شرایط عملی یکسان بدست آمده باشد تا نتیجه قابل قبولتر و مناسبتری بدست آید. در مدلهای خطی سری دادهها به دو قسمت سری کالیبراسیون [۱] و سری ارزیابی[۲] تقسیم میشوند[۷] . عملیات مدلسازی بر روی سری کالیبراسیون که اکثر مولکولها را در بر میگیرد، انجام میشود. از سری ارزیابی برای بررسی قدرت پیشبینی و اعتبار مدل استفاده میشود. ترکیبات سری ارزیابی به نحوی انتخاب میشوند که نماینده جمعیت مولکولهای سری کالیبراسیون باشند. لازم به ذکر است که مولکولهای سری ارزیابی در هیچ یک از مراحل مدلسازی شرکت ندارند. در مدل سازی به روشهایی مانند شبکه عصبی مصنوعی از سری کالیبراسیون به دلیل استفاده در مرحله آموزش با عنوان سری آموزشی[۳] نام برده میشود. سری ارزیابی نیز به دو دسته به نامهای سری ارزیابی داخلی[۴] یا سری پیشبینی و سری ارزیابی خارجی[۵] تقسیم میشود. سری پیشبینی برای کنترل خطای مدلسازی و جلوگیری از ایجاد آموزش اضافی[۶] در حین ساخت مدل و سری ارزیابی، برای ارزیابی اعتبار مدل و تخمین قدرت پیشگویی آن بهکار میرود.
به طور معمول، دو روش وجود دارند که از رایجترین روشهای تقسیم بندی سری دادهها در مدلسازی QSAR به شمار میروند[۱۶] :
۱- روش انتخاب تصادفی[۷]: در این روش سری دادهها به صورت کاملا تصادفی و بدون در نظر گرفتن هیچ گونه معیار خاصی، به سریهای آموزشی و ارزیابی تقسیم میگردد. عمدهترین نقص این روش این است که در این روش ترکیبات بدون در نظر گرفتن هیچگونه ارتباطی با ساختارشان، دستهبندی میگردند. به همین دلیل احتمال بسیار زیادی وجود دارد که ترکیباتی خارج از قلمرو کاربرد مدل، در سری ارزیابی قرار گیرند[۷] . بنابراین از آنجایی که این ترکیبات توسط مدل برونیابی میشوند، پیشبینیهای مدل برای این ترکیبات غیرقابل اعتماد خواهد بود[۱۷] .
۲- روش مرتبسازیy-[8]: در این روش سری دادهها به صورت نزولی یا صعودی مرتب شده و از هر قسمت آن بهعنوان نماینده یک داده برای قرار گرفتن در سری ارزیابی انتخاب میشود[۷] . حتی در این روش نیز ضمانتی وجود ندارد که سریهای آموزشی و ارزیابی روی تمامی نقاط نماینده در فضای توصیفکنندهها پراکنده بوده و سری آموزشی بتواند تمامی نقاط موجود در سری دادهها را تحت پوشش قرار دهد[۱۸] . در حقیقت انتخاب سریهای آموزشی و ارزیابی باید بر اساس نزدیکی نقاط نمایندهی سری آموزشی به نقاط نمایندهی سری ارزیابی در فضای چند بعدی توصیف کنندهها صورت گیرد. در اصل مفهوم “نزدیکی”، بر اساس مهمترین فرضی است که منجر به شکل گیری روابط QSAR گردیده است[۱۶] :
” ترکیبات مشابه، خصوصیات مشابهی دارند”
در این پروژه از روشی نوین به نام تحلیل خوشهای (CA)[9] [۱۹]جهت انتخاب صحیح اعضای سریهای آموزشی و ارزیابی (براساس ساختار) استفاده شده است که در ادامه معرفی میگردد.
تحلیل خوشهای یا خوشهبندی نسبت دادن یک سری از اشیاء به گروههای معین (یا خوشهها) می باشد، به نحوی که اشیاء موجود دریک خوشه از برخی جهات مشابه بوده ودارای وجه اشتراک باشند. خوشهبندی یکی از روشهای موجود یادگیری غیر نظارت شده است که روشی معمول برای آنالیز آماری دادهها در بسیاری از زمینههای علمی شامل: یادگیری ماشینی[۱۰]، دادهکاوی، تشخیص الگو، آنالیز تصاویر، بازیابی اطلاعات و زیست فناوری[۱۱] می باشند[۲۰] . علاوه بر اصطلاح خوشهبندی عبارات دیگری نیز دررابطه باهمین مفهوم مورد استفاده قرار میگیرند که شامل: طبقهبندی خودکار[۱۲]، دستهبندی عددی[۱۳]، آنالیز ردهشناسی[۱۴] و بتریولوژی[۱۵] میباشند.
الگوریتمهای سلسله مراتبی[۱۶] با استفاده از گروههایی که قبلا تشکیل شدهاند گروههای جدیدی را پیدا میکنند. این الگوریتمها غالبا یا تراکمی (از بالا به پایین) هستند، یا انشعابی (از پایین به بالا). الگوریتمهای تراکمی با هر عنصر که به عنوان یک خوشهی مجزا درنظر گرفته شده است شروع میشوند و آنها را به گروههای بزرگتر تبدیل میکنند[۲۱] . الگوریتمهای انشعابی با تمامی سری داده شروع میشوند و با تقسیم کردن آنها به گروهها یا خوشههای کوچکتر ادامه می یابند (شکل ۲-۱ را ببینید). الگوریتمهای تفکیکی معمولا تمامی خوشهها را به صورت یکباره تعیین میکنند اما میتوانند بعنوان الگوریتمهای انشعابی در خوشهبندی سلسلهای نیز بکار روند. الگوریتمهای خوشهبندی چگالی مبنا[۱۷]، به منظور کشف گروههایی با شکل دلخواه ابداع شدهاند. در این رویکرد یک خوشه بصورت منطقهای درنظر گرفته میشود که چگالی یا تراکم اشیاء در آن از حد آستانه بیشتر باشد. الگوریتمهای خوشهای فضایی[۱۸] ، به دنبال خوشههایی میگردند که فقط بتوان انها را دریک تجسم خاص از دادهها (خمیده، بخشی از فضا) مشاهده کرد[۲۲] .
[۱]. Calibration
[۲]. Validation
[۳]. Training set
[۴]. Internal test set
[۵]. External test set
[۶]. Over training
[۷]. Random selection
[۸]. Y-ranking method
[۹]. Cluster analysis
[۱۰]. Machine learning
[۱۱]. Bioinformatics
[۱۲]. Automatic classification
[۱۳]. Numerical taxonomy
[۱۴]. Typological analysis
[۱۵]. Botryology
[۱۶]. Hierarchical
[۱۷]. Density based clustering
[۱۸]. Subspace clustering method
تمامی فایل های پیشینه تحقیق و پرسشنامه و مقالات مربوطه به صورت فایل دنلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ را پرداخت نمایید.
ارسال نظر