خوشه بندی و دسته بندی
اگر برای بار اول باشه که اسم خوشه بندی و دسته بندی به گوشتون می خوره احتمالا راحت نمی تونید باحاش ارتباط برقرار کنید. و نمی تونید درکش کنید. بزارید راحتتر بگم. خوشه بندی و دسته بندی دو حوزه جدا از هم هستند. خوشه بندی می دونید مثل چی می مونه؟ یه مثال سادش اینه که شما بیایید افراد جامعه رو مثلا به سه دسته پردرآمد، درآمد متوسط و کم درآمد تقسیم کنید. پس شما الان اومدید مردم رو به سه دسته تقسیم کردید. حالا یک نفر دیگه وارد جامعمون میشه و میگه من ماهانه بیست میلیون تومان درآمد دارم و سرمایه هم یک صد میلیون تومان است. حالا شما با داشتن این اطلاعات میاید و میگید این فرد در خوشه افراد پردرآمد تقسیم میشه ما به این کار میگیم دسته بندی.
تصویر بالا رو ببینید. خوشه بندی این کار رو انجام میده. عکس یه سری میوه رو به الگوریتم می دیم و کامپیوتر با محاسباتی که انجام میده میاد و اونو به سه دسته سیب، گلابی و توت فرنگی تقسیم می کنه. حالا اگر الگوریتم ما تغییر کنه ممکنه بیاد و به دو گروه تقسیم کنه. میپرسید چرا؟ خب معلومه می تونه فقط بر اساس رنگشون تقسیم کنه و قرمز ها رو در یک دسته و زردها رو در دسته دیگه قرار بده.
یه نکته رو یادم رفت بگم. خوشه بندی به دو صورت انجام میشه یا ما از قبل می دونیم که میخوایم به چند خوشه تقسیم کنیم یا نمی دونیم و از کامپیوتر میخوایم که خودش برای ما تقسیم بندی کنه و حالا خودش برای ما تعداد خوشه هامون رو هم مشخص می کنه. کامپیوتر هم خودش حساب کتاب های خودش رو انجام میده و این خوشه بندی رو برای ما انجام میده ولی این وسط یه نکته است و اون اینکه کامپیوتر به ما نمیگه که این دسته پردرآمدن و این دسته کم درآمد، ما خودمون باید این اسم ها رو روش بزاریم.
برای خوشه بندی و دسته بندی الگوریتم ها و روش های متفاوتی وجود داره. برای خوشه بندی یکی از پرکاربردترین روش ها k-means هستش و برای دسته بندی روش های مثل درخت تصمیم یا همون decision tree محبوبیت زیادی داره البته روش ها و الگوریتم ها خیلی زیادن ما هم سعی می کنیم در مورد اکثرشون صحبت کنیم.
حالا اگر تمایل دارید خودتون در خصوص خوشه بندی تحقیق کنید باید لغت clustering رو سرچ کنید و برای دسته بندی باید لغت classification رو جستجو کنید.


