ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی

دانلود پایان نامه ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی

 

                                                                  فهرست مطالب

عنوان                                                                                                                                  صفحه

چکیده

فصل اول: مقدمه. ۱

۱-۱ پیشگفتار. ۲

۱- ۲ بیان مسئله. ۳

۱-۳ اهمیت وضرورت انجام تحقيق.. ۶

۱-۴ جنبه جديدبودن ونوآوري درتحقيق.. ۷

۱-۵ اهداف مشخص تحقيق.. ۸

۱-۶ مروری برساختارپایان نامه. ۸

فصل دوم: مفاهیم. ۹

۲-۱ مقدمه. ۱۰

۲-۲ مدل داده چیست؟. ۱۰

۲-۲-۱ مدل های داده ساخت یافته. ۱۲

۲-۲-۱-۱ مدل داده رابطه ای.. ۱۲

۲-۲-۱-۲ مدل داده شی گرا ۱۴

۲-۲-۱-۳ مدل داده شی رابطه ای.. ۱۶

۲-۲-۲ مدل داده ای غیرساخت یافته. ۱۷

۲-۲-۲-۱ مدل داده ای کلید/ارزش… ۱۹

۲-۲-۲-۲ مدل داده ای سندگرا ۲۱

۲-۲-۲-۳ مدل داده ای ستونی.. ۲۳

۲-۲-۲-۴ پایگاه داده های گراف… ۲۴

عنوان                                                                                                                                  صفحه

۲-۳ مدیریت داده ها ۲۹

۲-۴ داده های پزشکی.. ۳۰

۲-۵ کاربردهای مدیریت داده های پزشکی.. ۳۴

۲-۶ بیماری های ژنتیکی.. ۳۶

۲-۷ انتقال بیماریهای ژنتیکی.. ۳۷

۲-۸ آزمایشهای ژنتیکی.. ۳۸

فصل سوم: پیشینه تحقیق.. ۴۲

۳-۱مقدمه. ۴۳

۳-۲ مدل داده رابطه ای برای بیماریهای همه گیری.. ۴۳

۳-۳ مدل داده شی رابطه ای برای بیمارستانها ۴۴

۳-۴مدل داده گرافی برای بیماری های همه گیری.. ۴۷

فصل چهارم: روش پیشنهادی.. ۴۸

۴-۱مقدمه. ۴۹

۴-۲ موجودیتها ۵۳

۴-۳-صفات مربوط به هریک ازموجودیتها ۵۳

۴-۳-۱انسان سالم. ۵۳

۴-۳-۲انسان ناقل.. ۵۴

۴-۳-۳ انسان درمان شده ۵۴

۴-۳-۴ انسان بیمار. ۵۴

۴-۳-۵پزشک… ۵۵

عنوان                                                                                                                                 صفحه

۴-۳-۶بیماری.. ۵۵

۴-۳-۷علائم. ۵۷

۴-۳-۸ روشهای درمان. ۵۸

۴-۳-۹ دارو. ۵۸

۴-۴مقادیرذخیره شده برروی یالها ۵۹

۴-۵تعیین قابلیتهای مدل داده ۶۰

۴-۵-۱ایجادکردن. ۶۰

۴-۵-۲افزودن. ۶۱

۴-۵-۳به روزرسانی.. ۶۱

۴-۵-۴حذف کردن. ۶۱

۴-۵-۵پرس وجو. ۶۲

۴-۵-۵-۱پرس وجوهای وابسته به یک گره ۶۲

۴-۵-۵-۲پرس وجوهای مربوط به دوگره ۶۶

۴-۵-۵-۳پرس وجوهای بیش از دوگره ۶۸

۴-۶طراحی مدل داده ۷۰

۴-۶-۱ طراحیER. 70

۴-۶-۲ طراحی مدل گرافی.. ۷۲

فصل پنجم: ارزیابی.. ۷۵

۵-۱ مقدمه. ۷۶

۵-۲ روش اول: گروه متمرکز. ۷۷

۵-۲-۱ آشنایی باگروه متمرکز. ۷۷

عنوان                                                                                                                                 صفحه

۵-۲-۲ مزایای گروه متمرکز. ۷۷

۵-۲-۳روش شناسی گروه متمرکز. ۷۷

۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز. ۷۹

۵-۳ روش دوم: پیاده سازی عملی پایگاه داده ۷۹

۵-۳-۱ نرم افزارنئوفرجی.. ۸۰

۵-۳-۲ داده های موردنیاز. ۸۰

۵-۳-۳ ذخیره داده هادرپایگاه داده نئوفرجی.. ۸۱

۵-۴ نتایج.. ۸۳

فصل ششم:جمع بندی و کارهای آتی.. ۹۰

۶-۱ جمع بندی وکارهای آتی.. ۹۱

منابع. ۹۷

 

                                         فهرست جدول ها

عنوان                                                                                                         صفحه

جدول (۳-۱) : پایگاه داده ی سنتی رابطه ای.. ۴۵

جدول (۳-۲) : پایگاه دادهEAV.. 45

جدول(۳-۳) : یک شمای کلیازEAV.. 46

جدول (۵-۱ ): زمان مربوط به پرس وجوهای مختلف… ۸۵

 

فهرست نمودارها

عنوان                                                                                                                            صفحه

نمودار(۵-۱) پرس و جوهای یک گره………………………………………………………………………………….۸۶

نمودار(۵-۲) پرس و جوهای دو گره…………………………………………………………………………………..۸۷

نمودار(۵-۳) پرس و جوهای سه گره………………………………………………………………………………….۸۷

نمودار(۵-۴) پرس و جوهای تمام گره ها……………………………………………………………………………۸۸

نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها……………………………………….۸۹

 

فهرست شکل ها

عنوان                                                                                                     صفحه

شکل(۲-۱ ) نمونه ای اولیه از پایگاه داده گراف…………………………………………………….. …………..۲۷

شکل(۳-۱)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای……………………………………………۴۴

شکل(۳-۲)یک پیاده سازی ساده از EAV/CR…………………………………………………………………….46

شکل (۳-۳) پیاده سازی بیماری همه گیری با پایگاه داده گرافی………………………………. ………….۴۷

شکل (۴-۱) نمودارER…………………………………………………………………………………………. ……….71

شکل (۴-۲) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی……………………………………۷۴

شکل(۵-۱) نمایش تمام گره ها روابط در پایگاه داده گرافی………………………………………………….۸۲

 

چکیده

در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم داده­های پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریع­تر و کارآمدتر این داده­ها نیاز به ذخیره الکترونیکی این داده­ها داریم. داده­های مربوط به بیماری­های ژنتیکی نیز از این دسته داده­ها به حساب می­آیند. با توجه به این مسئله می­بایست پایگاه داده­ای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب می­آید در این مقاله برای ذخیره و بازیابی این داده­ها از مدل داده­ی گرافی که یکی از زیر مجموعه­های مدل داده­های غیر ساخت یافته (NOSQL)است استفاده می­نماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص می­کنیم و بر اساس آن مدل داده گرافی را طراحی می­نماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. هم­چنین از نرم افزار Neo4j استفاده نمودیم که داده­های مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل داده­ها از روابط بین افراد، این مدل داده مدل مناسبی به شمار می­آید.

کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده

اگر مطلب را می پسندید لطفا آنرا به اشتراک بگذارید.

دیدگاهی بنویسید

چهار × چهار =

0