نرم افزار وکا
نرم افزار وکا را می توان یکی از قدرتمندترین ابزار های موجود جهت داده کاوی دانست که یک کتابخانه متن باز می باشد. وکا به کاربر این امکان را می دهد تا با استفاده از امکانات زبان جاوا، داده های خود را پردازش کند. WEKA توابع مختلف را برای داده کاوی در اختیار کاربر قرار میدهد. مزیت استفاده از این کتابخانه این می باشد که ابزار های متنوعی جهت پیاده سازی الگوریتم های داده کاوی را به صورت آماده دارد.
داده کاوی چیست؟
داده کاوی چیست؟ مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همینطور پایگاه های داده می باشد.
داده کاوی، بهره گیری از ابزارهای موجود جهت کسب دانش
-
داده کاوی، بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبر گفته میشود که استفاده از این ابزارها منجر به یافتن سریع مدلهای آماری مورداستفاده درداده، مدلهای آماری و الگوریتمهای ریاضی میشود که این کار این به صورت خودکار و یا بر اساس تجربهای که از طریق شبکههای عصبی عمیق یا درختهای تصمیم گیری به دست میآورند، انجام می دهند. داده کاوی علاوه بر گردآوری و مدیریت داده های انبوه، تجزیه، تحلیل اطلاعات و پیش بینی را نیز انجام میدهد که پارامتر های گوناگونی را در نظر می گیرد:
-
قواعد انجمنی یا Association که شامل الگو هایی می باشد که یک رویداد به رویدادی دیگر ارتباط پیدا می کند.
-
ترتیب یا Sequence: ترتیب اجرای رویداد ها را پیگیری می کند.
-
پیش بینی یا Prediction که پیش بینی یک متغیر پیوسته را انجام می دهد.
-
طبقه بندی یا Classification که رده های موجود در داده ها را تعریف می کند و نسبت به یکریگر متمایز می کند با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها ناشناخته میباشد، استفاده نمود.
-
خوشه بندی یا Clustering که مجموعه ای از رکورد ها که شباهت بیشتری را نسبت به یکدیگر دارد را در یک گروه قرار می دهد.
-
مصور سازی یا visualization که داده های به دست آمده را شبیه سازی می کند.
-
ابزار های داده کاوی
-
کلمنتاین Clementine
-
نرم افزار Rapid Miner
-
نرم افزار WEKA