ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی

دانلود پایان نامه ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی

فهرست مطالب

عنوان صفحه

چکیده

فصل اول: مقدمه. ۱

۱-۱ پیشگفتار. ۲

۱- ۲ بیان مسئله. ۳

۱-۳ اهمیت وضرورت انجام تحقيق.. ۶

۱-۴ جنبه جديدبودن ونوآوري درتحقيق.. ۷

۱-۵ اهداف مشخص تحقيق.. ۸

۱-۶ مروری برساختارپایان نامه. ۸

فصل دوم: مفاهیم. ۹

۲-۱ مقدمه. ۱۰

۲-۲ مدل داده چیست؟. ۱۰

۲-۲-۱ مدل های داده ساخت یافته. ۱۲

۲-۲-۱-۱ مدل داده رابطه ای.. ۱۲

۲-۲-۱-۲ مدل داده شی گرا ۱۴

۲-۲-۱-۳ مدل داده شی رابطه ای.. ۱۶

۲-۲-۲ مدل داده ای غیرساخت یافته. ۱۷

۲-۲-۲-۱ مدل داده ای کلید/ارزش… ۱۹

۲-۲-۲-۲ مدل داده ای سندگرا ۲۱

۲-۲-۲-۳ مدل داده ای ستونی.. ۲۳

۲-۲-۲-۴ پایگاه داده های گراف… ۲۴

عنوان صفحه

۲-۳ مدیریت داده ها ۲۹

۲-۴ داده های پزشکی.. ۳۰

۲-۵ کاربردهای مدیریت داده های پزشکی.. ۳۴

۲-۶ بیماری های ژنتیکی.. ۳۶

۲-۷ انتقال بیماریهای ژنتیکی.. ۳۷

۲-۸ آزمایشهای ژنتیکی.. ۳۸

فصل سوم: پیشینه تحقیق.. ۴۲

۳-۱مقدمه. ۴۳

۳-۲ مدل داده رابطه ای برای بیماریهای همه گیری.. ۴۳

۳-۳ مدل داده شی رابطه ای برای بیمارستانها ۴۴

۳-۴مدل داده گرافی برای بیماری های همه گیری.. ۴۷

فصل چهارم: روش پیشنهادی.. ۴۸

۴-۱مقدمه. ۴۹

۴-۲ موجودیتها ۵۳

۴-۳-صفات مربوط به هریک ازموجودیتها ۵۳

۴-۳-۱انسان سالم. ۵۳

۴-۳-۲انسان ناقل.. ۵۴

۴-۳-۳ انسان درمان شده ۵۴

۴-۳-۴ انسان بیمار. ۵۴

۴-۳-۵پزشک… ۵۵

عنوان صفحه

۴-۳-۶بیماری.. ۵۵

۴-۳-۷علائم. ۵۷

۴-۳-۸ روشهای درمان. ۵۸

۴-۳-۹ دارو. ۵۸

۴-۴مقادیرذخیره شده برروی یالها ۵۹

۴-۵تعیین قابلیتهای مدل داده ۶۰

۴-۵-۱ایجادکردن. ۶۰

۴-۵-۲افزودن. ۶۱

۴-۵-۳به روزرسانی.. ۶۱

۴-۵-۴حذف کردن. ۶۱

۴-۵-۵پرس وجو. ۶۲

۴-۵-۵-۱پرس وجوهای وابسته به یک گره ۶۲

۴-۵-۵-۲پرس وجوهای مربوط به دوگره ۶۶

۴-۵-۵-۳پرس وجوهای بیش از دوگره ۶۸

۴-۶طراحی مدل داده ۷۰

۴-۶-۱ طراحیER. 70

۴-۶-۲ طراحی مدل گرافی.. ۷۲

فصل پنجم: ارزیابی.. ۷۵

۵-۱ مقدمه. ۷۶

۵-۲ روش اول: گروه متمرکز. ۷۷

۵-۲-۱ آشنایی باگروه متمرکز. ۷۷

عنوان صفحه

۵-۲-۲ مزایای گروه متمرکز. ۷۷

۵-۲-۳روش شناسی گروه متمرکز. ۷۷

۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز. ۷۹

۵-۳ روش دوم: پیاده سازی عملی پایگاه داده ۷۹

۵-۳-۱ نرم افزارنئوفرجی.. ۸۰

۵-۳-۲ داده های موردنیاز. ۸۰

۵-۳-۳ ذخیره داده هادرپایگاه داده نئوفرجی.. ۸۱

۵-۴ نتایج.. ۸۳

فصل ششم:جمع بندی و کارهای آتی.. ۹۰

۶-۱ جمع بندی وکارهای آتی.. ۹۱

منابع. ۹۷

فهرست جدول ها

عنوان صفحه

جدول (۳-۱) : پایگاه داده ی سنتی رابطه ای.. ۴۵

جدول (۳-۲) : پایگاه دادهEAV.. 45

جدول(۳-۳) : یک شمای کلیازEAV.. 46

جدول (۵-۱ ): زمان مربوط به پرس وجوهای مختلف… ۸۵

فهرست نمودارها

عنوان صفحه

نمودار(۵-۱) پرس و جوهای یک گره………………………………………………………………………………….۸۶

نمودار(۵-۲) پرس و جوهای دو گره…………………………………………………………………………………..۸۷

نمودار(۵-۳) پرس و جوهای سه گره………………………………………………………………………………….۸۷

نمودار(۵-۴) پرس و جوهای تمام گره ها……………………………………………………………………………۸۸

نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها……………………………………….۸۹

فهرست شکل ها

عنوان صفحه

شکل(۲-۱ ) نمونه ای اولیه از پایگاه داده گراف…………………………………………………….. …………..۲۷

شکل(۳-۱)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای……………………………………………۴۴

شکل(۳-۲)یک پیاده سازی ساده از EAV/CR…………………………………………………………………….46

شکل (۳-۳) پیاده سازی بیماری همه گیری با پایگاه داده گرافی………………………………. ………….۴۷

شکل (۴-۱) نمودارER…………………………………………………………………………………………. ……….71

شکل (۴-۲) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی……………………………………۷۴

شکل(۵-۱) نمایش تمام گره ها روابط در پایگاه داده گرافی………………………………………………….۸۲

چکیده

در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم دادههای پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریعتر و کارآمدتر این دادهها نیاز به ذخیره الکترونیکی این دادهها داریم. دادههای مربوط به بیماریهای ژنتیکی نیز از این دسته دادهها به حساب میآیند. با توجه به این مسئله میبایست پایگاه دادهای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب میآید در این مقاله برای ذخیره و بازیابی این دادهها از مدل دادهی گرافی که یکی از زیر مجموعههای مدل دادههای غیر ساخت یافته (NOSQL)است استفاده مینماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص میکنیم و بر اساس آن مدل داده گرافی را طراحی مینماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. همچنین از نرم افزار Neo4j استفاده نمودیم که دادههای مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل دادهها از روابط بین افراد، این مدل داده مدل مناسبی به شمار میآید.

کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده

اگر مطلب را می پسندید لطفا آنرا به اشتراک بگذارید.

مطالب مرتبط

ارائه يک روش تشخيص بات نت هاي نظير به نظيرP2P)) مبتني بر تشابه خوشه اي

دیدگاهی بنویسید

لغو پاسخ