VQ: Vector Quantization

خوشه‌بندی در مقابل چندی‌سازی برداری

با مطالعه پست های قبلی ، تا به الان به این مطلب رسیده ایم که  خوشه‌بندی نوعی سازماندهی داده‌هاست بر اساس ویژگی-های تعیین شده داده‌هایی که شباهت بیشتری با یکدیگر دارند درون یک خوشه قرار می‌گیرد.

در کاربردهای ارتباطی و فشرده‌سازی داده‌ها از روشهایی به نام چندی‌سازی برداری استفاده می‌شود که از بعضی جنبه‌ها می‌توان آنها را معادل خوشه‌بندی در نظر گرفت. در چندی‌سازی برداری نیز داده‌ها بر اساس میزان شباهتشان به دسته‌هایی تقسیم می شوند و هر دسته بوسیله یک بردار که به آن کلمه کد (CodeWord) گفته می‌شود جایگزین می‌گردد. به مجموعة این کلماتِ کد اصطلاحأ کتابِ کد(CodeBook) گفته می‌شود.

دربعضی از بحث‌های علمی بین خوشه‌بندی و چندی‌سازی برداری تفاوتهایی قائل می‌شوند. زیرا خوشه‌بندی را یک رهیافت بدون نظارت برای تحلیل داده‌ها در نظر می‌گیرند ولی چندی‌سازی برداری را روشی برای کشف خوشه‌ها نمی‌شناسند بلکه آن را راهی برای نمایش داده‌ها با تعداد عناصر کمتر به گونه‌ای که اطلاعات از دست رفته حداقل شود، می‌شناسند. علی‌رغم تفاوت بیان شده می‌توان روشهای بکار رفته در هر یک آنها را در دیگر نیز بکار برد .


منابع :

دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)-مربوط به درس یادگیری ماشین-استاد مربوطه: دکتر شیری-

گرد آوری شده توسط: امیرحسین حاج احمدی-تاریخ تدوین: 30/2/1385

 

نظرات (0)
نام :
ایمیل : [پنهان میماند]
وب/وبلاگ :
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)