مقاله رشته مهندسی نرم افزار با عنوان داده کاوه
در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است |
![]() |
دسته بندی | کامپیوتر و IT |
فرمت فایل | doc |
حجم فایل | 904 کیلو بایت |
تعداد صفحات فایل | 21 |
مقاله رشته مهندسی نرم افزار با عنوان داده کاوه
*یک PDF با 31 صفحه بصورت رایگان ضمیمه شده است:)
مقدمه
از
سال 1950 به بعد که رایانه ، در تحلیل و ذخیره سازی داده ها به کار رفت ،
حجم اطلاعات ذخیره شده درآن پس از حدود 20 سال دو برابر شد و همزمان با
پیشرفت فناوری اطلاعات ، حجم داده ها در پایگاه داده ها هر دو سال یک بار ،
دو برابر شد و همچنان باسرعت بیش تری نسبت به گذشته حجم اطلاعات ذخیره
شده بیش تروبیش تر می شود . با وجود شبکه جهانی وب ، سیستم های یکپارچه
اطلاعاتی ، سیستم های یکپارچه بانکی ، تجارت الکترونیکی و ... لحظه به لحظه
به حجم داده ها در پایگاه داده ها اضافه شده و باعث به وجود آمدن
انبارهای ( توده های ) عظیمی از داده ها شده است ، به طوری که ضرورت کشف و
استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده
است .
شدت رقابت ها در عرصه های علمی ، اجتماعی ، اقتصادی ، سیاسی و نظامی
نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دو چندان کرده است . بنا
براین نیاز به طراحی سیستم هایی که قادر به اکتشاف سریع اطلاعات مورد علاقه
کاربران با تاکید بر حداقل مداخله انسانی باشند از یک سو و روی آوردن به
روش های تحلیل متناسب با حجم داده های حجیم ازسوی دیگر ، به خوبــــــی
احســاس می شود . در حال حاضر ، داده کاوی مهم ترین فناوری برای بهره وری
موثر ، صحیح و سریع ازداده های حجیم است و اهمیت آن رو به فزونی است
داده
کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ،
فراگیری ماشین داده می باشد. داده کاوی فرآیندی پیچیده جهت شناسایی
الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده
می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
داده
کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و
فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.داده ها اغلب حجیم
می باشند و به تنهایی قابل استفاده نیستند،اما دانش نهفته در داده ها قابل
استفاده می باشد.بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی
الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش
نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می
شود.در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود
. منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر
مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است .
کلمات کلیدی:
داده کاوی
DATA MINING
استخراج اطلاعات
دسته بندی داده ها
فرآیند و مراحل داده کاوی
تفاوت داده کاوی و آنالیز های آماری
تاریخچه
با توجه به وجود اطلاعات ارزشمند در پایگاه های داده ای در اواخر دهه
80 میلادی ، تلاش برای استخراج و استفاده از اطلاعات پایگاه های داده ای
شروع شد . داده کاوی فرایندی است که در آغاز دهه 90 پا به عرصه ظهور گذاشته
و با نگرشی نو ، به مسئله استخراج اطلاعــات از پایگـــاه داده ها می
پردازد . در سال 1989 و 1991 کارگاه های کشف دانش از پایگاه داده ها توسط
پیاتتسکی و همکارانش و در فاصله سال های 1991 تا 1994 کارگاه های فوق ،
توسط فایاد و پیا تتسکی و دیگران برگزار شد .
به
طور رسمی اصطلاح داده کاوی برای اولین بار توسط « فیاض » در اولیـن
کنفرانس بین المللی « کشف دانش و داده کاوی » در سال 1995 مطرح شد . از
سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد.و در سال 1996 ، اولین
شماره مجله کشف دانش از پایگاه داده ها منتشر شد .امروزه کنفرانس های
مختلفی دراین زمینه در سراسر دنیا برگزار می شود . داده کاوی حاصل تحول
تدریجی در طول تاریخ بوده و از اوایل دهه 90 همزمان با همه گیر شدن استفاده
از پایگاه های داده ای به عنوان یک علم مطرح شده است.