جمع­آوری داده از چندین منبع داده و انتقال آنها به ویژگی­های مستقل ازبرنامه کاربردی

تقسیم داده به دو مجموعه آموزشی و آزمایشی

آزمایش الگوریتم تشخیص الگوریتم روی مجموعه آموزشی

تست عملکرد طبقه ­بندی الگوریتم آزمایش شده روی مجموعه آزمایشی

اجرای الگوریم در زمینه تشخیص فعالیت

از جمله این الگوریتم­ها می­توان به Hidden Markov Model ,SVM ,K-NN ,Naïve bayes و… اشاره کرد. سیستم یادگیری غیرنظارت شده برای ساخت مدل­های تشخیص از داده غیربرچسب­گذاری شده استفاده می­ کند. ایده اصلی تشخیص، اختصاص یک احتمال به هر فعالیت ممکن است و تعیین یک مدل اتفاقی[۱۶] که می ­تواند این احتمال را مطابق مشاهدات جدید و برای دانستن حالت سیستم بِروز کند.
روال عمومی برای یادگیری غیرنظارتی شامل:

 

برای دانلود متن کامل پایان نامه به سایت 40y.ir مراجعه نمایید.

 

بدست آوردن داده غیربرچسب حسگر

جمع­آوری و انتقال داده حسگر به ویژگی­ها

مدل­سازی داده با بهره گرفتن از تخمین کیفیت دیگر یا متدهای کلاس­بندی.

مهمترین اختلاف میان روش­های نظارتی و غیر­نظارتی این است که به جای استفاده از مدل­های اتفاقی از قبل منتشر شده برای بروزرسانی احتمال فعالیت، الگوریتم­های نظارتی از یک ماتریس تجربیات مشاهده شده قبلی شان برای یادگیری پویای پارامترهای مدل­های فعالیت اتفاقی استفاده می­ کند.
روش دیگر بر مدل­سازی منطقی و استدلالی مبتنی است. این روش نمایش دانش منطقی برای فعالیت و مدل­سازی دادهحسگر به کار می­گیرد و برای استفاده از استدلال منطقی برای اجرای تشخیص فعالیت روال عمومی روش منطقی شامل:

 

 

استفاده از یک ظاهر منطقی برای تعیین و توصیف صریح یک کتابخانه از مدل های فعالیت برای همه فعالیت­های ممکن در یک دامنه

جمع­آوری و انتقال داده به عبارات و فرمول­های منطقی

اجرای استدلال منطقی مانند استنتاج و…

از جمله الگوریتم های تشخیص فعالیت می­توان به موارد زیر اشاره نمود:

 

۲-۴-۴-۲-الگوریتم خوشه بندی K-nn[17]

با ویژگی دسته بندی k-nn یک فضای ویژگی چندبعدی ساخته می­ شود که هر بعد با یک ویژگی متفاوت مطابق است. فضای ویژگی ابتدا به همه نقاط داده آموزشی منتشر می­ شود که هر کدام با یک فعالیت خاص مطابق است. پنجره­های ناشناخته داده حسگر در فضای ویژگی نمایش داده و k نزدیکترین نقاط (همسایگان) داده آموزشی شناسایی می­ شود. سپس دسته­بندی بوسیله اکثریت k نزدیکترین همسایگان تعیین می­ شود که با یک فعالیت داده شده مطابق است. مقدار k معمولا از ۱ تا کوچکترین درصد داده آموزشی متغیر است و بوسیله آزمون و خطا یا بطور ایدآل بوسیله روال­های
cross-validation انتخاب می­ شود.

 

۲-۴-۴-۳-الگوریتم خوشه بندیANN[18]

یک ANN می ­تواند شبیه یک تابع ریاضی انعطاف­پذیر باشد که برای نمایش پیچیدگی ارتباط میان ورودی­ ها و
خروجی­هایش تنظیم شده است. ANN نمایش داده شده با یک مجموعه داده آموزشی و بعضی فرم­های پروسه
بهینه­سازی بکار گرفته شود برای امکان اینکه خروجی­های شناخته شده برای یک مجموعه از ورودی­ ها پیش ­بینی شود.

 

۲-۴-۴-۴-الگوریتم خوشه بندیSVM[19]

SVM یک روش یادگیری ماشین معمولی تشکیل می­دهد که مبتنی بر پیدا کردن تصمیم­های جداگانه بهینه میان کلاس­ها با حداکثر حاشیه میان الگوهای هر کدام از کلاس­ها است. بعلاوه با بهره گرفتن از توابع so-called kernel ، آنها می­توانند به داده از فضای اصلی ویژگی که انها در آن قرار دارند به دیگر فضای بعد بالاتر، وجود خارجی بدهند. در این روش جداسازی خطی در فضای جدید با یک دسته­بندی غیرخطی در فضای اصلی معادل است. یک روش بهینه­سازی برای پیدا کردن جداسازی بهینه مورد استفاده است که دسته بندی­های مورد نیاز را انجام می­دهد.

 

۲-۴-۴-۵-الگوریتم خوشه بندی Baysian

بر تخمین احتمالات شرطی یا احتمال یا الگوی سیگنال قابل دسترس از هر کلاس فعالیت مبتنی است. با داشتن این احتمالات، امکان یک الگوی ناشناخته جدید خلق شده بوسیله یک فعالیت خاص می تواند به طور مستقیم تخمین زده شود.

 

۲-۴-۴-۶-الگوریتم خوشه بندی Naïve Bayes

با داشتن Naïve Bayes ویژگی­های ورودی به طور فرضی از یکدیگر مستقل هستند. با این فرض ممکن است تابع احتمال برای هر فعالیت به عنوان محصول n تابع چگالی احتمال ساده بیان شود که n تعداد ویژگی­ها می­باشد. طبق قانون Bayes احتمال یک فعالیت a با یک بردار ویژگی می تواند به شکل زیر محاسبه شود:
در این معادله به احتمال اولویت فعالیت a اشاره دارد.

 

۲-۴-۴-۷-الگوریتم خوشه­بندی Markov chain

برای مشکلات خاص دسته بندی بعضی احتمال انتقال میان فعالیت­ها نسبت به بقیه خیلی بیشتر می­باشد. برای مثال ممکن است فرد پس از پایین آمدن از پله بنشیند ولی ممکن نیست شروع به دویدن کند. Markov chain
یک پروسه انتقالی زمان مجزا است که در آن هر فعالیت به عنوان یک حالت متفاوت نمایش داده شده است.
markov chain می ­تواند برای نمایش احتمال انتقال میان فعالیت­های مختلف مورد استفاده باشد.

 

۲-۴-۴-۸-الگوریتم خوشه­بندی [۲۰] HMM

یک HMM مشابه markov chain است اما با این تفاوت که حالت مدل در هر زمان داده شده ناشناخته (مخفی) است و فقط می ­تواند از پارامترهای معلوم که مبتنی بر حالت هستند، مشخص شود. بر­خلاف markov chain این مدل می ­تواند مستقیما برای مشکلات دسته بندی فعالیت مورد استفاده باشد. پارامترهای معلوم ویژگی­های مشتق شده از داده حسگرهای پوشیدنی با حالت­های مربوطه به فعالیت­های متفاوت هستند و می ­تواند با بیش از یک فعالیت مطابق باشد. HMM بوسیله تشخیص انتقال­های حالت در طول احتمالاتی مجهز شده که هر مجموعه ممکن از معلومات (ویژگی­ها) برای هر حالت داده قابل مشاهده است.

 

۲-۴-۴-۹-الگوریتم خوشه­بندی Fuzzy Logic

این روش بر تئوری فازی مبتنی است. تئوری استفاده استدلالی که تقریبی به جای تعیین خاص است. fuzzy logic روشی برای ویژگی­سازی از یک مجموعه ورودی برای یک یا چند خروجی با بهره گرفتن از یک مجموعه ساده از تکرارهای
if-then که قواعد نامیده می­شوند، ارائه می­ کند. خروجی­ها درستی­های فازی هستند که مطابق با هر کلاس فعالیت­ها
می­باشند. جریان اطلاعات از میان سیستم فازی از طریق یک تعدادی گام اتفاق می­افتد. ابتدا ورودی­ ها یا ویژگی­ها اختصاص می­یابند. مجموعه فازی قوائد می ­تواند برای خلق یک خروجی مطابقی بکاربروند. خروجی یک مقدار عضو می­باشد یا درستی فازی که رنجی از ۰ تا ۱ برای هر کلاس فعالیت دارد.
HMM یک مدل مولد احتمال است که برای تولید حالت­های مخفی برای داده معلوم مورد استفاده قرار می­گیرد. خصوصا هدف اصلی این مدل تعیین توالی حالت مخفی (y1,y2,..,yt) است که مطابق است با توالی خروجی مشاهده شده(x1,x2,…,xt) و هدف مهم دیگر یادگیری پارامترهای مدل قابل اطمینان از تاریخچه توالی­های خروجی مشاهده شده می­باشد.

X5
X4
X3
X2
X1
هنگامی که دریک تشخیص فعالیت HMM مورد استفاده است، فعالیت­ها همان حالت­های مخفی و داده حسگر، خروجی معلوم می­باشند.
نوشیدن
برداشتن
غذا
داشتن سوپ
بریدن گوشت
فنجان
قاشق
چاقو
چنگال

 

۲-۴-۵-چالش­ها

تشخیص خودکار فعالیت­های فیزیکی روزانه با بهره گرفتن از داده حسگرهای پوشیدنی(مانند شتاب سنج) نقطه چالش برانگیز کار شده است. چندین محدودیت وجود دارد مانند تعداد، مکان و ماهیت حسگرهایی که افراد می­بایست آنها را تحمل می­ کنند­. فاکتورهایی که باعث پیچیدگی کار تشخیص شده ­اند می ­تواند به صورت زیر طبقه ­بندی شوند [۴۳].

 

۲-۴-۵-۱-پیچیدگی فعالیت­ها

پیچیدگی فعالیت­ها می ­تواند زیاد باشد و به فاکتورهای گوناگونی شامل تعداد فعالیت­ها، نوع فعالیت­ها و پیچیدگی داده آموزشی جمع شده برای این فعالیت­ها بستگی دارد.

 

۲-۴-۵-۲-تعداد فعالیت­ها

افراد تعداد زیادی از فعالیت­های گوناگون را در زندگی روزمره انجام می­ دهند بنابراین یک سیستم تشخیص فعالیت باید قادر به تشخیص مجموعه وسیعی از فعالیت­ها باشد.

 

۲-۴-۵-۳-نوع فعالیت

فعالیت­هایی مانند دراز کشیدن و نشستن ایستا هستند و برای تشخیص ساده هستند. بعضی از فعالیت­ها ماهیت دوره­ای دارند مانند پیاده­روی و دویدن با این حال وضعیت­هایی مانند نشستن و ایستادن خیلی شبیه­اند و مشخص کردن آنها هنگامی در محیط هم­پوشانی دارند خیلی سخت­اند. بعلاوه متمایز کردن فعالیت­های با شباهت­های بالای حرکتی مانند پیاده­روی در راهرو، بالارفتن از پله­ها و پایین رفتن از پله به خاطر الگوی حرکتی مشابه شان خیلی مشکل می­باشد.
بعلاوه تشخیص تعداد زیادی از فعالیت­هایی که هم خیلی متفاوتند و هم ویزگی­های مشابه دارند در زمان مشابه باعث می­ شود مشکل تشخیص سخت­تر شود. در این حالت شباهت زیاد میان فعالیت­ها درسراسر همه مجموعه فعالیت­ها یکچارچه نیست. به عبارت دیگر یک زیرمجموعه از فعالیت­ها با شباهت زیاد میان فعالیت­هایی از دیگر زیر مجموعه­ها خیلی متفاوتند مشترکند. برای مثال نشستن و ایستادن خیلی شبیه­اند اگرچه انها نسبت به پیاده­روی خیلی متفاوتند.
برای انجام یک فعالیت استانداردی وجود ندارد برای مثال یک شخص ممکن است روی یک نیمکت به شکلی دراز بکشد که قابل طبقه ­بندی به نشستن یا دراز کشیدن نباشد. یک فرد ممکن است فعالیت­های پویا مانند پیاده­روی در یک محیط متفاوت در زمان­های متفاوت انجام دهد به طور خلاصه فرد فعالیت­هایی را به شیوه ­های مختلف انجام می­دهد که طبقه ­بندی کردن آنها سخت هستند. بنابراین تشخیص فعالیت­هایی که برای آنهای داده آزمایشی یا آموزشی در شرایط آزمایشگاهی جمع­آوری می­شوند نسبت به آنهایی که داده ­هایشان در شرایط واقعی جمع­آوری می­شوند راحترترند.

 

۲-۴-۵-۴-نیازمندیهای داده آموزشی

الگوریتم­های تشخیص می ­تواند براساس نوع و مقدار داده آموزشی که آنها نیاز دارند ارزیابی شوند. یک حالت ایده­آل الگوریتم تشخیص این است که عملکرد باید مستقل از فرد باشد و برای افراد جدید نیاز به داده آموزشی نداشته باشد. به دلیل تنوع بسیار در روش­هایی که افراد فعالیت­هایشان را انجام می­دهند، تشخیص فعالیت مستقل از فرد در یک مجموعه گوناگون فعالیت­ها سخت است.

 

۲-۴-۵-۵-نیاز به دقت

مهمترین روش در تشخیص فعالیت بر ثبت داده ­های فعالیت­ها به منظور آموزش یک الگوریتم یادگیری به ماشین تکیه می­ کند. بدست آوردن چنین داده ­هایی به ویژه همراه با جزییاتی که به اندازه کافی دقیق باشد، خسته کننده، وقت­گیر، اشتباه­زا و حتی ممکن است در برخی موارد غیر­ممکن باشد در نتیجه طرح آن به یک مانع قابل توجه برای پیشرفت در این زمینه منتهی می­ شود.

 

۲-۴-۵-۶-فعالیت طولانی مدت و سطح بالا

موضوعات: بدون موضوع
[چهارشنبه 1400-01-25] [ 01:58:00 ق.ظ ]