با مطالعه پست های قبلی ، تا به الان به این مطلب رسیده ایم که خوشهبندی نوعی سازماندهی دادههاست بر اساس ویژگی-های تعیین شده دادههایی که شباهت بیشتری با یکدیگر دارند درون یک خوشه قرار میگیرد.
در کاربردهای ارتباطی و فشردهسازی دادهها از روشهایی به نام چندیسازی برداری استفاده میشود که از بعضی جنبهها میتوان آنها را معادل خوشهبندی در نظر گرفت. در چندیسازی برداری نیز دادهها بر اساس میزان شباهتشان به دستههایی تقسیم می شوند و هر دسته بوسیله یک بردار که به آن کلمه کد (CodeWord) گفته میشود جایگزین میگردد. به مجموعة این کلماتِ کد اصطلاحأ کتابِ کد(CodeBook) گفته میشود.
دربعضی از بحثهای علمی بین خوشهبندی و چندیسازی برداری تفاوتهایی قائل میشوند. زیرا خوشهبندی را یک رهیافت بدون نظارت برای تحلیل دادهها در نظر میگیرند ولی چندیسازی برداری را روشی برای کشف خوشهها نمیشناسند بلکه آن را راهی برای نمایش دادهها با تعداد عناصر کمتر به گونهای که اطلاعات از دست رفته حداقل شود، میشناسند. علیرغم تفاوت بیان شده میتوان روشهای بکار رفته در هر یک آنها را در دیگر نیز بکار برد .
منابع :
دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)-مربوط به درس یادگیری ماشین-استاد مربوطه: دکتر شیری-
گرد آوری شده توسط: امیرحسین حاج احمدی-تاریخ تدوین: 30/2/1385