ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی
دانلود پایان نامه ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی
فهرست مطالب
عنوان صفحه
چکیده
۱-۳ اهمیت وضرورت انجام تحقيق.. ۶
۱-۴ جنبه جديدبودن ونوآوري درتحقيق.. ۷
۱-۶ مروری برساختارپایان نامه. ۸
۲-۲-۱ مدل های داده ساخت یافته. ۱۲
۲-۲-۱-۱ مدل داده رابطه ای.. ۱۲
۲-۲-۱-۳ مدل داده شی رابطه ای.. ۱۶
۲-۲-۲ مدل داده ای غیرساخت یافته. ۱۷
۲-۲-۲-۱ مدل داده ای کلید/ارزش… ۱۹
۲-۲-۲-۳ مدل داده ای ستونی.. ۲۳
۲-۲-۲-۴ پایگاه داده های گراف… ۲۴
عنوان صفحه
۲-۵ کاربردهای مدیریت داده های پزشکی.. ۳۴
۲-۷ انتقال بیماریهای ژنتیکی.. ۳۷
۳-۲ مدل داده رابطه ای برای بیماریهای همه گیری.. ۴۳
۳-۳ مدل داده شی رابطه ای برای بیمارستانها ۴۴
۳-۴مدل داده گرافی برای بیماری های همه گیری.. ۴۷
۴-۳-صفات مربوط به هریک ازموجودیتها ۵۳
عنوان صفحه
۴-۴مقادیرذخیره شده برروی یالها ۵۹
۴-۵تعیین قابلیتهای مدل داده ۶۰
۴-۵-۵-۱پرس وجوهای وابسته به یک گره ۶۲
۴-۵-۵-۲پرس وجوهای مربوط به دوگره ۶۶
۴-۵-۵-۳پرس وجوهای بیش از دوگره ۶۸
۵-۲-۱ آشنایی باگروه متمرکز. ۷۷
عنوان صفحه
۵-۲-۳روش شناسی گروه متمرکز. ۷۷
۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز. ۷۹
۵-۳ روش دوم: پیاده سازی عملی پایگاه داده ۷۹
۵-۳-۳ ذخیره داده هادرپایگاه داده نئوفرجی.. ۸۱
فصل ششم:جمع بندی و کارهای آتی.. ۹۰
فهرست جدول ها
عنوان صفحه
جدول (۳-۱) : پایگاه داده ی سنتی رابطه ای.. ۴۵
جدول (۳-۲) : پایگاه دادهEAV.. 45
جدول(۳-۳) : یک شمای کلیازEAV.. 46
جدول (۵-۱ ): زمان مربوط به پرس وجوهای مختلف… ۸۵
فهرست نمودارها
عنوان صفحه
نمودار(۵-۱) پرس و جوهای یک گره………………………………………………………………………………….۸۶
نمودار(۵-۲) پرس و جوهای دو گره…………………………………………………………………………………..۸۷
نمودار(۵-۳) پرس و جوهای سه گره………………………………………………………………………………….۸۷
نمودار(۵-۴) پرس و جوهای تمام گره ها……………………………………………………………………………۸۸
نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها……………………………………….۸۹
فهرست شکل ها
عنوان صفحه
شکل(۲-۱ ) نمونه ای اولیه از پایگاه داده گراف…………………………………………………….. …………..۲۷
شکل(۳-۱)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای……………………………………………۴۴
شکل(۳-۲)یک پیاده سازی ساده از EAV/CR…………………………………………………………………….46
شکل (۳-۳) پیاده سازی بیماری همه گیری با پایگاه داده گرافی………………………………. ………….۴۷
شکل (۴-۱) نمودارER…………………………………………………………………………………………. ……….71
شکل (۴-۲) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی……………………………………۷۴
شکل(۵-۱) نمایش تمام گره ها روابط در پایگاه داده گرافی………………………………………………….۸۲
در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم دادههای پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریعتر و کارآمدتر این دادهها نیاز به ذخیره الکترونیکی این دادهها داریم. دادههای مربوط به بیماریهای ژنتیکی نیز از این دسته دادهها به حساب میآیند. با توجه به این مسئله میبایست پایگاه دادهای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب میآید در این مقاله برای ذخیره و بازیابی این دادهها از مدل دادهی گرافی که یکی از زیر مجموعههای مدل دادههای غیر ساخت یافته (NOSQL)است استفاده مینماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص میکنیم و بر اساس آن مدل داده گرافی را طراحی مینماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. همچنین از نرم افزار Neo4j استفاده نمودیم که دادههای مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل دادهها از روابط بین افراد، این مدل داده مدل مناسبی به شمار میآید.
کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده
دیدگاهی بنویسید