دادهکاوی بهعنوان فنی برای شناسایی و تشخیص بیماریها و دستهبندی بیماران در مدیریت بیماری و پیدا کردن الگوهایی برای تشخیص سریعتر بیماران و جلوگیری از بروز عوارض در آنها میتواند کمک بسیار بزرگی باشد. افزایش دقت تشخیص، کاهش هزینهها و کاهش منابع انسانی بهعنوان مزایای معرفی دادهکاوی در تجزیهوتحلیل پزشکی توسط خواجوی و جایالاکشی ثابتشده است. در این مقاله به بررسی ارتباط بین عوارض مشاهدهشده در بیماران دیابتی نوع دو و برخی ویژگیهای آنها از قبیل میزان قند خون، فشارخون، سن و سابقه خانوادگی بیماران بر اساس روش درخت تصمیم پرداختهشده است. جامعه آماری این تحقیق و منبع اطلاعاتی شامل؛ اطلاعات این تحقیق از یک مرکز درمان دیابت در شمال ایران جمعآوریشده است. اطلاعات پروندهها مربوط به سال 1388 است.856 رکورد اولیه از بیماران وجود داشت که پس از پالایش و حذف رکوردهایی که اطلاعات اصلی آنها وجود نداشت به 254 رکورد نهایی شده است. روند انجام تحقیق در این مقاله شامل مراحل زیر است
1-شناسایی سیستم که شامل شناسایی مفاهیم دیابت و شناسایی انواع دیابت و عوارض آن است
2-شناخت دادهها و آمادهسازی دادهها که شامل؛ جمعآوری پروندهها و استخراج فیلدهای کلیدی، بررسی رابطه بین فیلدها، حذف رکوردهای ناقص، محاسبه شاخصها و نسبت فیلدها و تعیین شاخص برای دادههای پیوسته
3-فرایند مدلسازی که از روشهای الگوریتم درخت تصمیم (C5.0) و شبکه عصبی مصنوعی استفادهشده است و در آخر استخراج قوانین از درخت تصمیم (C5.0)
4-ارزیابی که شامل؛ ارزیابی مدلها، شناسایی مدل با بیشترین دقت، محاسبه شاخصهای شفافیت، حساسیت و دقت و صحت
5-کشف دانش با کمک متخصصین
6-توسعه که شامل بررسی نتایج چندین آزمایش متوالی، بررسی میزان کنترل قند خون و تأثیر عدم کنترل این ویژگیها
نتایج این بررسی نشان داده است که عوارض این بیماری را بر اساس دودسته میکروواسکولار و ماکروواسکولار دستهبندیشده است. بهترین نتایج از الگوریتم درخت C5.0 به دست آمد که دقت مدل آن برابر 06/89 درصد و صحت مدل 74/89 درصد است. با استفاده از قوانین ایجادشده، برای یک نمونه جدید با ویژگیهای مشخص، میتواند پیشبینی کرد که این فرد احتمالاً دچار چه نوع عارضهای خواهد شد. با کنترل عوامل تأثیرگذار بر بروز عارضه در هر بیمار، میتوان امیدوار بود از بروز عارضه تا حدی اجتناب کرد و یا آن را به تعویق انداخت.