موضوع : متن کامل پایان نامه انگلیسی : گروه بندی استاندارد دارویی Next-Generation برای واکنش های طولانی مدت QT با یادگیری ماشینی
رشته : داروسازی – پزشکی – پرستاری – هوش مصنوعی – کامپیوتر
سال انتشار : 2021
زبان : انگلیسی
مقطع : دکترا
چکیده (ترجمه ماشینی ) :
هدف این پروژه حمایت از مراقبت دارویی، علم و فعالیت های مربوط به ایمنی دارو و پیشگیری از واکنش های نامطلوب دارویی (ADRs) است. ما بر روی یک ADR خاص به نام طولانی شدن QT تمرکز می کنیم، یک واکنش جدی که بر ضربان قلب تأثیر می گذارد. هدف اصلی ما گروه بندی مواد دارویی است که ممکن است باعث طولانی شدن QT شود. این گروه بندی را می توان در تجزیه و تحلیل ایمنی و برای لیست های حذف در مطالعات بالینی استفاده کرد. ترجیحاً باید بر اساس سطح همبستگی مشکوک رتبه بندی شود. ما می خواستیم یک فرآیند خودکار و استاندارد ایجاد کنیم.
گزارشهای مرتبط با ایمنی دارو که ADRهای تجربهشده بیماران و محصولات دارویی مصرفشده را توصیف میکنند، در پایگاهدادهای به نام VigiBase جمعآوری میشوند که ما از آن بهعنوان منبعی برای استخراج مواد استفاده کردهایم. ADR ها در متن های آزاد توصیف شده و با استفاده از اصطلاحات استاندارد بین المللی کدگذاری شده اند. این به ما کمک می کند تا داده ها و مواد تشکیل دهنده را فیلتر کنیم که در گزارشی که طولانی شدن QT را توضیح می دهد. برای گسترش دامنه پروژه خود به منظور گنجاندن داده های رمزگذاری نشده، ما این فرآیند را گسترش دادیم تا از کلمات متن آزاد استفاده کنیم که ADR را به عنوان ورودی توصیف می کند. با پردازش و فیلتر کردن دادههای متن آزاد و آموزش یک مدل طبقهبندی برای پردازش زبان طبیعی که توسط Google در دادههای VigiBase منتشر شده است، میتوانیم پیشبینی کنیم که آیا متن آزاد به معنای واقعی کلمه طولانی شدن QT را توصیف میکند یا خیر. این طبقه بندی منجر به امتیاز F1 98٪ شد.
برای مواد استخراجشده از VigiBase، ما میخواستیم تأیید کنیم که آیا ارتباط شناختهشدهای با طولانیشدن QT وجود دارد یا خیر. رخدادهای VigiBase پارامتری است که باید در نظر گرفته شود، اما ممکن است گمراهکننده باشد، زیرا یک گزارش میتواند شامل چندین دارو باشد، و یک دارو میتواند شامل چندین ماده باشد که اعتبار سنجی علت را دشوار میکند. برای اعتبار سنجی، از برچسب های محصول متصل به هر عنصر مورد علاقه استفاده کردیم. ما از ابزاری برای دانلود، اسکن و کدگذاری برچسبهای محصول استفاده کردیم تا ببینیم کدام یک از آنها طولانی شدن QT را ذکر کردهاند. برای رتبه بندی لیست نهایی مواد تشکیل دهنده خود بر اساس سطح همبستگی مشکوک طولانی شدن QT، از یک مدل رگرسیون لجستیک چند جمله ای استفاده کردیم. به عنوان داده آموزشی، ما از یک زیرمجموعه داده که به صورت دستی توسط داروسازان برچسب گذاری شده بود استفاده کردیم. با استفاده از دادههای اعتبارسنجی بدون برچسب، دقت مدل 68٪ بود. تجزیه و تحلیل داده های آموزشی نشان داد که به راحتی به صورت خطی از هم جدا نمی شود و عملکرد طبقه بندی محدود را توضیح می دهد. فهرست رتبه بندی نهایی موادی که مشکوک به طولانی شدن QT هستند شامل 1086 ماده است.