دانلود مقاله متن کاوی و ارزیابی مهمترین متد های متن کاوی

متن کاوی و ارزیابی مهمترین متد های متن کاوی

در این مقاله ما به بررسی یکی از جدیدترین زمینههای مورد تحقیق در داده کاوی، متن کاوی می پردازیم در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات میگیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند

دانلود متن کاوی و ارزیابی مهمترین متد های متن کاوی

الگوریتم خوشه بندی
روش های استخراج اطلاعات
متن کاوی
داده کاوی
یکپارچه  کردن داده کاوی
دسته بندی و مرتب سازی داده ها
دانلود مقاله متن کاوی و ارزیابی مهمترین متد های متن کاوی
سیستم همکاری در فروش فایل
همکاری در فروش فایل
فروش فایل
خرید مقاله و تحقیق رشته نرم افزار
fileina
فروشگاه ساز فایل
فروشگاه فایل
دسته بندی مهندسی نرم افزار
فرمت فایل doc
حجم فایل 404 کیلو بایت
تعداد صفحات فایل 33

متن کاوی و ارزیابی مهمترین متد های متن کاوی

 
چکیده
    رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین ، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و..... روش ها و ایده هایی را کاوش کرده اند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه داده های غیرمتنی بکار می بریم، غیر ممکن می سازد. بنابراین روش ها و الگوریتم-های پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده می کند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی می کند. 
 
در این مقاله ما به بررسی یکی از جدیدترین زمینه-های مورد تحقیق در داده کاوی، متن کاوی می پردازیم. در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات می-گیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند.
 
 
کلمات کلیدی:

متن کاوی

داده کاوی

استخراج اطلاعات

یکپارچه  کردن داده کاوی

دسته بندی و مرتب سازی داده ها

 
 
 
مقدمه
   بخش قابل توجهی از اطلاعات قابل دسترس در پایگاه داده های متنی (یا پایگاه داده های سند ) که شامل مجموعه بزرگی از اسناد منابع مختلف (مثلا مقالات خبری، paperها، کتاب ها، ایمیل ها و صفحات وب) ذخیره شده اند. پایگاه داده های متنی به علت افزایش مقدار اطلاعات موجود به فرم الکترونیکی سریع رشد می کنند. امروزه بیشتر اطلاعات در صنعت، کسب و کار  و سازمان های دیگر به صورت الکترونیکی و به فرم پایگاه داده متنی ذخیره شده اند.   داده های ذخیره شده در بیشتر پایگاه  داده های متنی، داده های نیمه ساختاریافته هستند چون نه به طور کامل غیرساختیافته هستند و نه به طور کامل ساختیافته هستند. 
 
برا ی مثال یک سند شامل تعدادی فیلد ساختیافته مانند عنوان، نویسندگان، تاریخ انتشار، رده  و ..... و از طرف دیگر شامل برخی کامپوننت های متنی غیرساختاریافته مانند چکیده و محتویات است. تکنیک های بازیابی اطلاعات مانند (متدهای ایندکس کردن متن ) برای هندل کردن سندهای غیر ساختاریافته ایجاد شده اند. تکنیک های بازیابی اطلاعات قدیمی برای مقدار زیادی داده متنی که به طور فزاینده افزایش می یابند، ناکارآمد هستند. بدون دانستن محتویات سندها، فرمول بندی کردن Queryهای مناسب برای آنالیز کردن و استخراج کردن اطلاعات مفید از داده، مشکل است.
 
 کاربرها نیاز به ابزارهایی برای مقایسه سندهای مختلف، مرتب کردن سندها بر اساس موبوط بودن آن ها و یافتن الگوها دارند.  بنابراین یکی از جدیدترین زمینه های مورد تحقیق در داده کاوی، متن کاوی برای این منظور گسترش یافت. متن کاوی یعنی جستجوی الگوها در متن غیرساختیافته. متن کاوی برای کشف اتوماتیک دانش مورد علاقه یا مفید از متن نیمه ساختیافته استفاده می شود. چندین تکنیک برای متن کاوی پیشنهاد شده است عبارتند از ساختار مفهومی ،کاوش association ruleها درخت تصمیم گیری، روش های استنتاج قوانین ، همچنین تکنیک های بازیابی اطلاعات برای کارهایی مانند تطبیق دادن سندها، مرتب کردن کردن، کلاسترینگ و.....
 
 
فهرست مطالب
چکیده 3
1 مقدمه 3

1.1 کشف دانش و ارتباط آن متن کاوی 5

2.1 تعاریف متن کاوی 5

3.1 ناحیه های سرچ مرتبط 6
2 روش ها پیش پردازش کردن متون 7
1.2 مدل فضای برداری 9

2.2 پیش پردازش زبان شناختی 10

3 روش های متن کاوی ... 10
1.3 فازهای اصلی فرآیند کتن کاوی... 11
2.3 رده بندی ... 12
1.2.3 انتخاب ترم ایندکس 12
2.2.3 رده کننده Naïve Bayes 12
3.2.3 رده بندی کننده نزدیکترین همسایه 13
4.2.3 درخت تصمیم گیری 14
5.2.3 متدهای هسته و SVM 14
6.2.3 ارزیابی رده بندی کننده ها 15
3.3  استخراج اطلاعات 16
1.3.3 رده بندی برای استخراج اطلاعات 16

2.3.3 مدل مارکوف پنهان 17

3.3.3 فیلدهای رندم شرطی 17

4.3.3 مقایسه روش های استخراج اطلاعات 18

2.2 پیش پردازش زبان شناختی 18
4.3 روش ها ترکیبی 18
1.4.3 روش های dicsotex 18
1.1.4.3 مقدمه 19

2.1.4.3 یکپارچه  کردن داده کاوی و استخراج اطلاعات 19

3.1.4.3 سیستم dicsotex 19
2.4.3روش textminer 21
1.2.4.3 مقدمه 21
2.2.4.3 استخراج اطلاعات 22

3.2.4.3 الگوریتم خوشه بندی 23

3.4.3 یافتن روابط 25
4.4.3 مقایسه روش های ترکیبی 26
4 کاربردهای متن کاوی 26
5 نتیجه گیری و کارهای آینده 27
6 مراجع 28
 
 
 
 
 
 
 

دانلود متن کاوی و ارزیابی مهمترین متد های متن کاوی

دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است

دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

داده کاوی
DATA MINING
استخراج اطلاعات
دسته بندی داده ها
فرآیند و مراحل داده کاوی
تفاوت داده کاوی و آنالیز های آماری
دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه
سیستم همکاری در فروش فایل
همکاری در فروش فایل
فروش فایل
خرید مقاله و تحقیق رشته نرم افزار
fileina
فروشگاه ساز فایل
فروشگاه فایل
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 904 کیلو بایت
تعداد صفحات فایل 21

مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

 

*یک PDF با 31 صفحه بصورت رایگان ضمیمه شده است:)
 
مقدمه
 از سال 1950 به بعد که رایانه ، در تحلیل و ذخیره سازی داده ها به کار رفت ، حجم اطلاعات ذخیره شده درآن پس از حدود 20 سال دو برابر شد و همزمان  با پیشرفت فناوری اطلاعات ، حجم داده ها در پایگاه داده ها هر دو سال یک بار ، دو برابر شد و همچنان  باسرعت بیش تری نسبت به گذشته حجم اطلاعات  ذخیره شده بیش تروبیش تر می شود . با وجود شبکه جهانی وب ، سیستم  های یکپارچه اطلاعاتی ، سیستم های یکپارچه بانکی ، تجارت الکترونیکی و ... لحظه به لحظه به حجم داده ها  در پایگاه داده ها اضافه شده و باعث به وجود آمدن انبارهای ( توده های ) عظیمی از داده ها شده است ، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است .
 
      شدت رقابت ها  در عرصه های علمی ، اجتماعی ، اقتصادی ، سیاسی و نظامی نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دو چندان کرده است . بنا براین نیاز به طراحی سیستم هایی که قادر به اکتشاف سریع اطلاعات مورد علاقه کاربران با تاکید بر حداقل مداخله انسانی باشند از یک سو و روی آوردن به روش های تحلیل متناسب با حجم داده های حجیم ازسوی دیگر ، به خوبــــــی احســاس می شود . در حال حاضر ، داده کاوی مهم ترین فناوری برای بهره وری موثر ، صحیح و سریع ازداده های حجیم است و اهمیت آن رو به فزونی است
داده کاوی پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش مصنوعی ، الگوشناسی ، فراگیری ماشین داده می باشد.  داده کاوی فرآیندی پیچیده جهت شناسایی الگوها و مدل های صحیح، جدید و به صورت بالقوه مفید، در حجم وسیعی از داده می باشد، به طریقی که این الگو ها و مدلها برای انسانها قابل درک باشند.
 
داده کاوی به صورت یک محصول قابل خریداری نمی باشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک پروژه پیاده سازی شود.داده ها اغلب حجیم می باشند و به تنهایی قابل استفاده نیستند،اما دانش نهفته در داده ها قابل استفاده می باشد.بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در داده ها و نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر می شود.در داده کاوی معمولا به کشف الگوهای مفید از میان داده ها اشاره می شود . منظور از الگوی مفید ، مدلی در داده ها است که ارتباط میان یک زیر مجموعه از داده ها را توصیف می کند و معتبر ، ساده ، قابل فهم و جدید است .
 
 
 
کلمات کلیدی:

داده کاوی

DATA MINING

استخراج اطلاعات

دسته بندی داده ها

فرآیند و مراحل داده کاوی

تفاوت داده کاوی و آنالیز های آماری

 
 
 
تاریخچه 
     با توجه به وجود اطلاعات ارزشمند در پایگاه های  داده ای در اواخر دهه 80 میلادی ، تلاش برای استخراج و استفاده از اطلاعات پایگاه های  داده ای شروع شد . داده کاوی فرایندی است که در آغاز دهه 90 پا به عرصه ظهور گذاشته و با نگرشی نو ، به مسئله استخراج اطلاعــات از پایگـــاه داده ها می پردازد . در سال 1989 و 1991 کارگاه های کشف دانش از پایگاه داده ها توسط پیاتتسکی و همکارانش  و در فاصله سال های 1991 تا 1994 کارگاه های فوق ، توسط فایاد و پیا تتسکی و دیگران برگزار شد .
 
به طور رسمی اصطلاح داده کاوی برای اولین بار توسط « فیاض »  در اولیـن کنفرانس بین المللی « کشف دانش و داده کاوی »  در سال 1995 مطرح شد . از سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد.و در سال 1996 ، اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد .امروزه کنفرانس های مختلفی دراین زمینه در سراسر دنیا برگزار می شود . داده کاوی حاصل تحول تدریجی در طول تاریخ بوده و از اوایل دهه 90 همزمان با همه گیر شدن استفاده از پایگاه های داده ای به عنوان یک علم مطرح شده است. 
 
 
 

دانلود مقاله رشته مهندسی نرم افزار با عنوان داده کاوه

متن کاوی و ارزیابی مهمترین متد های متن کاوی

چکیده
    رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین ، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و..... روش ها و ایده هایی را کاوش کرده اند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه داده های غیرمتنی بکار می بریم،

  ادامه مطلب ...