تحلیل VQ با k-means
خوشه بندی با الگوریتم k-means
الگوریتم k-means یکی از الگوریتمهای خوشه بندی به صورت غیر نظارت شده و بدون استفاده از برچسب، است که برای تولید کدبوک مورد استفاده قرار می گیرد که در نوع خود دارای معایب و محاسنی است.
k-means یک الگوریتم تکرار شونده است: از یک نقطه ای شروع میشود-یک بدنه تکرارشونده دارد – و با مشخص نمودن شرط توقف به پایان می رسد.
ادامه مطلب ...
با مطالعه پست های قبلی ، تا به الان به این مطلب رسیده ایم که خوشهبندی نوعی سازماندهی دادههاست بر اساس ویژگی-های تعیین شده دادههایی که شباهت بیشتری با یکدیگر دارند درون یک خوشه قرار میگیرد.
در کاربردهای ارتباطی و فشردهسازی دادهها از روشهایی به نام چندیسازی برداری استفاده میشود که از بعضی جنبهها میتوان آنها را معادل خوشهبندی در نظر گرفت. در چندیسازی برداری نیز دادهها بر اساس میزان شباهتشان به دستههایی تقسیم می شوند و هر دسته بوسیله یک بردار که به آن کلمه کد (CodeWord) گفته میشود جایگزین میگردد. به مجموعة این کلماتِ کد اصطلاحأ کتابِ کد(CodeBook) گفته میشود.
دربعضی از بحثهای علمی بین خوشهبندی و چندیسازی برداری تفاوتهایی قائل میشوند. زیرا خوشهبندی را یک رهیافت بدون نظارت برای تحلیل دادهها در نظر میگیرند ولی چندیسازی برداری را روشی برای کشف خوشهها نمیشناسند بلکه آن را راهی برای نمایش دادهها با تعداد عناصر کمتر به گونهای که اطلاعات از دست رفته حداقل شود، میشناسند. علیرغم تفاوت بیان شده میتوان روشهای بکار رفته در هر یک آنها را در دیگر نیز بکار برد .
منابع :
دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)-مربوط به درس یادگیری ماشین-استاد مربوطه: دکتر شیری-
گرد آوری شده توسط: امیرحسین حاج احمدی-تاریخ تدوین: 30/2/1385