جمعآوری داده از چندین منبع داده و انتقال آنها به ویژگیهای مستقل ازبرنامه کاربردی
تقسیم داده به دو مجموعه آموزشی و آزمایشی
آزمایش الگوریتم تشخیص الگوریتم روی مجموعه آموزشی
تست عملکرد طبقه بندی الگوریتم آزمایش شده روی مجموعه آزمایشی
اجرای الگوریم در زمینه تشخیص فعالیت
از جمله این الگوریتمها میتوان به Hidden Markov Model ,SVM ,K-NN ,Naïve bayes و… اشاره کرد. سیستم یادگیری غیرنظارت شده برای ساخت مدلهای تشخیص از داده غیربرچسبگذاری شده استفاده می کند. ایده اصلی تشخیص، اختصاص یک احتمال به هر فعالیت ممکن است و تعیین یک مدل اتفاقی[۱۶] که می تواند این احتمال را مطابق مشاهدات جدید و برای دانستن حالت سیستم بِروز کند.
روال عمومی برای یادگیری غیرنظارتی شامل:
برای دانلود متن کامل پایان نامه به سایت 40y.ir مراجعه نمایید.
بدست آوردن داده غیربرچسب حسگر
جمعآوری و انتقال داده حسگر به ویژگیها
مدلسازی داده با بهره گرفتن از تخمین کیفیت دیگر یا متدهای کلاسبندی.
مهمترین اختلاف میان روشهای نظارتی و غیرنظارتی این است که به جای استفاده از مدلهای اتفاقی از قبل منتشر شده برای بروزرسانی احتمال فعالیت، الگوریتمهای نظارتی از یک ماتریس تجربیات مشاهده شده قبلی شان برای یادگیری پویای پارامترهای مدلهای فعالیت اتفاقی استفاده می کند.
روش دیگر بر مدلسازی منطقی و استدلالی مبتنی است. این روش نمایش دانش منطقی برای فعالیت و مدلسازی دادهحسگر به کار میگیرد و برای استفاده از استدلال منطقی برای اجرای تشخیص فعالیت روال عمومی روش منطقی شامل:
استفاده از یک ظاهر منطقی برای تعیین و توصیف صریح یک کتابخانه از مدل های فعالیت برای همه فعالیتهای ممکن در یک دامنه
جمعآوری و انتقال داده به عبارات و فرمولهای منطقی
اجرای استدلال منطقی مانند استنتاج و…
از جمله الگوریتم های تشخیص فعالیت میتوان به موارد زیر اشاره نمود:
۲-۴-۴-۲-الگوریتم خوشه بندی K-nn[17]
با ویژگی دسته بندی k-nn یک فضای ویژگی چندبعدی ساخته می شود که هر بعد با یک ویژگی متفاوت مطابق است. فضای ویژگی ابتدا به همه نقاط داده آموزشی منتشر می شود که هر کدام با یک فعالیت خاص مطابق است. پنجرههای ناشناخته داده حسگر در فضای ویژگی نمایش داده و k نزدیکترین نقاط (همسایگان) داده آموزشی شناسایی می شود. سپس دستهبندی بوسیله اکثریت k نزدیکترین همسایگان تعیین می شود که با یک فعالیت داده شده مطابق است. مقدار k معمولا از ۱ تا کوچکترین درصد داده آموزشی متغیر است و بوسیله آزمون و خطا یا بطور ایدآل بوسیله روالهای
cross-validation انتخاب می شود.
۲-۴-۴-۳-الگوریتم خوشه بندیANN[18]
یک ANN می تواند شبیه یک تابع ریاضی انعطافپذیر باشد که برای نمایش پیچیدگی ارتباط میان ورودی ها و
خروجیهایش تنظیم شده است. ANN نمایش داده شده با یک مجموعه داده آموزشی و بعضی فرمهای پروسه
بهینهسازی بکار گرفته شود برای امکان اینکه خروجیهای شناخته شده برای یک مجموعه از ورودی ها پیش بینی شود.
۲-۴-۴-۴-الگوریتم خوشه بندیSVM[19]
SVM یک روش یادگیری ماشین معمولی تشکیل میدهد که مبتنی بر پیدا کردن تصمیمهای جداگانه بهینه میان کلاسها با حداکثر حاشیه میان الگوهای هر کدام از کلاسها است. بعلاوه با بهره گرفتن از توابع so-called kernel ، آنها میتوانند به داده از فضای اصلی ویژگی که انها در آن قرار دارند به دیگر فضای بعد بالاتر، وجود خارجی بدهند. در این روش جداسازی خطی در فضای جدید با یک دستهبندی غیرخطی در فضای اصلی معادل است. یک روش بهینهسازی برای پیدا کردن جداسازی بهینه مورد استفاده است که دسته بندیهای مورد نیاز را انجام میدهد.
۲-۴-۴-۵-الگوریتم خوشه بندی Baysian
بر تخمین احتمالات شرطی یا احتمال یا الگوی سیگنال قابل دسترس از هر کلاس فعالیت مبتنی است. با داشتن این احتمالات، امکان یک الگوی ناشناخته جدید خلق شده بوسیله یک فعالیت خاص می تواند به طور مستقیم تخمین زده شود.
۲-۴-۴-۶-الگوریتم خوشه بندی Naïve Bayes
با داشتن Naïve Bayes ویژگیهای ورودی به طور فرضی از یکدیگر مستقل هستند. با این فرض ممکن است تابع احتمال برای هر فعالیت به عنوان محصول n تابع چگالی احتمال ساده بیان شود که n تعداد ویژگیها میباشد. طبق قانون Bayes احتمال یک فعالیت a با یک بردار ویژگی می تواند به شکل زیر محاسبه شود:
در این معادله به احتمال اولویت فعالیت a اشاره دارد.
۲-۴-۴-۷-الگوریتم خوشهبندی Markov chain
برای مشکلات خاص دسته بندی بعضی احتمال انتقال میان فعالیتها نسبت به بقیه خیلی بیشتر میباشد. برای مثال ممکن است فرد پس از پایین آمدن از پله بنشیند ولی ممکن نیست شروع به دویدن کند. Markov chain
یک پروسه انتقالی زمان مجزا است که در آن هر فعالیت به عنوان یک حالت متفاوت نمایش داده شده است.
markov chain می تواند برای نمایش احتمال انتقال میان فعالیتهای مختلف مورد استفاده باشد.
۲-۴-۴-۸-الگوریتم خوشهبندی [۲۰] HMM
یک HMM مشابه markov chain است اما با این تفاوت که حالت مدل در هر زمان داده شده ناشناخته (مخفی) است و فقط می تواند از پارامترهای معلوم که مبتنی بر حالت هستند، مشخص شود. برخلاف markov chain این مدل می تواند مستقیما برای مشکلات دسته بندی فعالیت مورد استفاده باشد. پارامترهای معلوم ویژگیهای مشتق شده از داده حسگرهای پوشیدنی با حالتهای مربوطه به فعالیتهای متفاوت هستند و می تواند با بیش از یک فعالیت مطابق باشد. HMM بوسیله تشخیص انتقالهای حالت در طول احتمالاتی مجهز شده که هر مجموعه ممکن از معلومات (ویژگیها) برای هر حالت داده قابل مشاهده است.
۲-۴-۴-۹-الگوریتم خوشهبندی Fuzzy Logic
این روش بر تئوری فازی مبتنی است. تئوری استفاده استدلالی که تقریبی به جای تعیین خاص است. fuzzy logic روشی برای ویژگیسازی از یک مجموعه ورودی برای یک یا چند خروجی با بهره گرفتن از یک مجموعه ساده از تکرارهای
if-then که قواعد نامیده میشوند، ارائه می کند. خروجیها درستیهای فازی هستند که مطابق با هر کلاس فعالیتها
میباشند. جریان اطلاعات از میان سیستم فازی از طریق یک تعدادی گام اتفاق میافتد. ابتدا ورودی ها یا ویژگیها اختصاص مییابند. مجموعه فازی قوائد می تواند برای خلق یک خروجی مطابقی بکاربروند. خروجی یک مقدار عضو میباشد یا درستی فازی که رنجی از ۰ تا ۱ برای هر کلاس فعالیت دارد.
HMM یک مدل مولد احتمال است که برای تولید حالتهای مخفی برای داده معلوم مورد استفاده قرار میگیرد. خصوصا هدف اصلی این مدل تعیین توالی حالت مخفی (y1,y2,..,yt) است که مطابق است با توالی خروجی مشاهده شده(x1,x2,…,xt) و هدف مهم دیگر یادگیری پارامترهای مدل قابل اطمینان از تاریخچه توالیهای خروجی مشاهده شده میباشد.
X5
X4
X3
X2
X1
هنگامی که دریک تشخیص فعالیت HMM مورد استفاده است، فعالیتها همان حالتهای مخفی و داده حسگر، خروجی معلوم میباشند.
نوشیدن
برداشتن
غذا
داشتن سوپ
بریدن گوشت
فنجان
قاشق
چاقو
چنگال
۲-۴-۵-چالشها
تشخیص خودکار فعالیتهای فیزیکی روزانه با بهره گرفتن از داده حسگرهای پوشیدنی(مانند شتاب سنج) نقطه چالش برانگیز کار شده است. چندین محدودیت وجود دارد مانند تعداد، مکان و ماهیت حسگرهایی که افراد میبایست آنها را تحمل می کنند. فاکتورهایی که باعث پیچیدگی کار تشخیص شده اند می تواند به صورت زیر طبقه بندی شوند [۴۳].
۲-۴-۵-۱-پیچیدگی فعالیتها
پیچیدگی فعالیتها می تواند زیاد باشد و به فاکتورهای گوناگونی شامل تعداد فعالیتها، نوع فعالیتها و پیچیدگی داده آموزشی جمع شده برای این فعالیتها بستگی دارد.
۲-۴-۵-۲-تعداد فعالیتها
افراد تعداد زیادی از فعالیتهای گوناگون را در زندگی روزمره انجام می دهند بنابراین یک سیستم تشخیص فعالیت باید قادر به تشخیص مجموعه وسیعی از فعالیتها باشد.
۲-۴-۵-۳-نوع فعالیت
فعالیتهایی مانند دراز کشیدن و نشستن ایستا هستند و برای تشخیص ساده هستند. بعضی از فعالیتها ماهیت دورهای دارند مانند پیادهروی و دویدن با این حال وضعیتهایی مانند نشستن و ایستادن خیلی شبیهاند و مشخص کردن آنها هنگامی در محیط همپوشانی دارند خیلی سختاند. بعلاوه متمایز کردن فعالیتهای با شباهتهای بالای حرکتی مانند پیادهروی در راهرو، بالارفتن از پلهها و پایین رفتن از پله به خاطر الگوی حرکتی مشابه شان خیلی مشکل میباشد.
بعلاوه تشخیص تعداد زیادی از فعالیتهایی که هم خیلی متفاوتند و هم ویزگیهای مشابه دارند در زمان مشابه باعث می شود مشکل تشخیص سختتر شود. در این حالت شباهت زیاد میان فعالیتها درسراسر همه مجموعه فعالیتها یکچارچه نیست. به عبارت دیگر یک زیرمجموعه از فعالیتها با شباهت زیاد میان فعالیتهایی از دیگر زیر مجموعهها خیلی متفاوتند مشترکند. برای مثال نشستن و ایستادن خیلی شبیهاند اگرچه انها نسبت به پیادهروی خیلی متفاوتند.
برای انجام یک فعالیت استانداردی وجود ندارد برای مثال یک شخص ممکن است روی یک نیمکت به شکلی دراز بکشد که قابل طبقه بندی به نشستن یا دراز کشیدن نباشد. یک فرد ممکن است فعالیتهای پویا مانند پیادهروی در یک محیط متفاوت در زمانهای متفاوت انجام دهد به طور خلاصه فرد فعالیتهایی را به شیوه های مختلف انجام میدهد که طبقه بندی کردن آنها سخت هستند. بنابراین تشخیص فعالیتهایی که برای آنهای داده آزمایشی یا آموزشی در شرایط آزمایشگاهی جمعآوری میشوند نسبت به آنهایی که داده هایشان در شرایط واقعی جمعآوری میشوند راحترترند.
۲-۴-۵-۴-نیازمندیهای داده آموزشی
الگوریتمهای تشخیص می تواند براساس نوع و مقدار داده آموزشی که آنها نیاز دارند ارزیابی شوند. یک حالت ایدهآل الگوریتم تشخیص این است که عملکرد باید مستقل از فرد باشد و برای افراد جدید نیاز به داده آموزشی نداشته باشد. به دلیل تنوع بسیار در روشهایی که افراد فعالیتهایشان را انجام میدهند، تشخیص فعالیت مستقل از فرد در یک مجموعه گوناگون فعالیتها سخت است.
۲-۴-۵-۵-نیاز به دقت
مهمترین روش در تشخیص فعالیت بر ثبت داده های فعالیتها به منظور آموزش یک الگوریتم یادگیری به ماشین تکیه می کند. بدست آوردن چنین داده هایی به ویژه همراه با جزییاتی که به اندازه کافی دقیق باشد، خسته کننده، وقتگیر، اشتباهزا و حتی ممکن است در برخی موارد غیرممکن باشد در نتیجه طرح آن به یک مانع قابل توجه برای پیشرفت در این زمینه منتهی می شود.
۲-۴-۵-۶-فعالیت طولانی مدت و سطح بالا