همه چیز در مورد کینکت ( نقد و بررسی فنی دوربین سه بعدی کینکت ) (( سایت ))

اما حالا نوبت به کینکت و مایکرو سافت رسیده تا به این تکنولوژِ جامعه عمل بپوشانند و بدون هیچ گونه واسطه ای و تنها با در اختیار داشتن دوربینی کوچک با دنیای مجازی تعامل داشته باشن . اما بد نیست بیشتر در مورد مشخصات فنی و چگونگی کار این سیستم توضیحاتی را بدهیم .


کینکت در حقیقت یک دوربین کوچک است که به صورت افقی روبروی شما قرار میگیرد و حرکات بازیباز را تحت نظر میگیرد و تمام فعالیت های او را شبیه سازی میکند .کینکت تنها یک شبیه ساز اندام نیست و به اجزای مختلفی تقسیم میشود . 3D motion capture اولین جزء کینکت است که به صورت کاملا سه بعدی اندام بازیباز را اسکن کرده و میتواند شبیه سازی نسبتا دقیقی از ان ایجاد کند .Facial recognition  یا شناسایی چهره به صورت ژئومتریکالی که با استفاده از داده های الگوریتمی میتواند حتی از چهره دو بعدی یک شبیه سازی سه بعدی را ایجاد کند از اجزای دیگر این دستگاه خواهد بود که بخش بسیار مهم و حساسی به حساب میادچون میزان شدت نور و یا ارایش صورت میتواند به راحتی معدلات را بر هم بزند. Voice recognition  و یا شناسایی صدا در کینکت هم مسئله مهمی بود که طراحان با ان روبرو بودند ، زیرا ما در این بخش با بی نهایت تن اوایی و صدایی رو برو هستیم و علاوه بر تشخیص صدا باید اصواتو دیگر صدا ها هم قابل پردازش باشندو به همین دلیل میکروفن های چند گانه ای در کینکت به کار رفته تا این تفکیک صدایی را انجام دهند. مسئله Acoustic source localozation  یا منابع اکوستیک محلی چالشی عظیم در در تشخیص صدا محسوب میشونکه در ابتدای کار پردازش ، کینکت قادر به تشخیص فاصله صدا از منبع را نداشت و همین مسوله مشکل بزرگی را ایجاد میکرد. علاوه بر این Active voice control مسئله جدی تری محسوب میشد زیرا زیرا استرس و فشار صدا ممکن است بر روی کلمه ای زیاد باشد و سنسورها به خوبی قادر به شناسایی صدا ها نشوند که با Active noise reduction مشکلات کمتر شد.

همانطور که اشاره شد کینکت با شبیه سلزی اندام و صدای شما بدون واسطه میتواند حرکات بازیباز را با تاخیری بسیار کم به پردازشگر منتقل کند و در نتیجه فعالیت های شما مقابلب دوربین کینکت دقیقا قابل مشاهده خواهد بود. اما مشکل اساسی عمق است که در ابتدا کینکت قادر به تشخیص ان نبود ، اما باید بدونید که سنسور عمق شامل پروژکتور مادون قرمز infared است که با یک سنسور CMOS  تک رنگی ترکیب شده و قادر به شناسایی رنگ های محیطی یا Ambient light است که منابع و شرایط نوری را کاملا پردازش و تفکیک میکند.همچنین دامنه سنجش از عمق کینکت کاملا تعدیل پذیر است و نرم افزار به طور خودکار قابلیت کالیبره کردن بر اساس گیم پلی و محیط فیزیکی بازیباز را دارد و به خوبی شرایط مجیطی را سنجیده و اجرا میکند . مثلا وقتی بر روی کاناپه مینشینید نرم افزار به خوبی تشخیص میدهد که در حال حاضر جسم فیزیکی در مقابل بازیباز قرار داردو پردازش های لازم سریعا انجام میشود. همانطور که اشاره شد کینکت بر پایه تکنولوژِ نرم افزاری و سخت افزاری که توسط مایکروسافت و شرکت Primesense توسعه پیدا کرده . اما کمپانی Primesense که در زمینه تکنولوژِ فعالیت میکند توانسته در جهت توسعه فناوری Range camera با مایکروسافت هم کاری کند . اما CR چیست ؟

دامنه دوربین یا دامنه تصویر برداری مجموعه تکنیک هایی است که برای نشان دادنو تولید تصاویر 2 بعدی استفاده میشود.نشان دادن فاصله تا نقطه منبع از یک صحنه در نقطه ای خاص به طور معمول توسط دامنه تصویر برداری اجرا میشود. حاصل تصویر ارزش پیکسلی است که دقیقا متناظر با با فاصله است . مثلا ارزشها   و اعداد بیشترو بزرگتر نشانه فاصله کمتر و بر عکس خواهد بود.

اما اگر این سنسور برای تولید دامنه طیفی باشد اینجاست که که به درستی کالیبره شده و ارزش پیکسل را میتوان به طور مستقیم در واحد های فیزیکی مثل متر استفاده کرد.در حال حاضر CR در طراحی کینکت اساسی ترین سوالی است که باید به ان پاسخ داد:

 محاسبه فاصله ، عمق ، رنگ ، تفکیک منابع نوری ، فاصله اجسام از یکدیگر و ... جزو اساسی ترین وظایف دوربین کینکت به شمار می اید که در عین سادگی بسیار پیچیده پردازش میشوند . اما بخش های اساسی این دوربین شامل چندین تکنیک طراحی هستند ، Stereo triangulation یا Stereo camera برای تعیین عمق در صحنه تا منبع به کار میرود . سیستم دوربین های استریو در یافتن فاصله ی کانونی به شدت از خود ضعف نشان میدادند و این چالشی بسیار بزرگ در طراحی کینکت محسوب میشد. اما بد نیست چگونگی رفع این مشکل را بدانید !

در ابتدای امر کینکت توانایی تشخیص نقطه تا فاصله را نداشت ، بدین معنی که برای یک تصویر چندین نقطه کانونی پیدا میکرد .و حتی بعضا به صورت اشتباه گوشه های تصویر را به عنوان نقطه کانونی انتخاب و پردازش میکرد. وقتی منطقه یا تصویر هم گن میشد کار سخت تر بود و شدت و نوع رنگها گاها دردسر ساز میشد. در نتیجه تصویر برداری طیف بر اساس تقسیم نواحی به مثلث های مجاور هم جهت برای ترسیم و مساحی نقاط قابل مشاهده ، تنها تخمین زده میشد.

به همین منظور طراحان از دوربین های چند گانه Pelenoptic camera یا Light - field camera استفاده کردند که در ان از میکرولنزهای زیادی تشکیل شده است که به صورت 4 بعدی میتوانند اطلاعات مربوط به یک صحنه و عمق را پردازش کنند. المان بعدی در طراحی دوربین کینکت Sheet of light triangulation  با ورق های نوری هستند که میزان انعکاس نور از منبع و شکست های نور را سنجش میکند و بسیار حائز اهمیت هستند ، چون ممکن است نور در جایی اشباح شده باشد و منابع نوری انعکاس و رفلکشن های متفاوتی را ایجاد کند. در نتیجه دوربین نتواند تصویر اصلی را به دلیل این تعداد منابع نوری شناسایی کند ، در نتیجه میکرولنزهای زیادی برای شناسایی ورقه های نوری در نظر گرفته شده و Structured light  وظیفه ی تشخیص ساختارهای رنگی را در کینکت به عهده دارد و باید نوع رنگ را پردازش کند. تکنولوژی بسیار جالبی که در طراحی این دوربین استفاده شده Time of flight  نام دارد که کار ان بسیار جالب است. در این تکنیک همانند رادار ، این بار به جای هواپیما رنگ و طیف های ان بررسی میشود ، بدین معنی که همانند رادار و لیدار LIDAR  کار انها شناسایی است ، اما نه شناسایی هواپیما ، بلکه شناسایی نور و توانایی پیش بینی قدرت و شدت و ضعف ان . بدین صورت که پیش بینی میکند نور در چه زمانی و در چه زاویه ای به میکرولنزها برخورد خواهد کرد  و سپس پردازش خواهد شد .Interfrometry یا تداخل ، دیگر اجزای دوربین را تشکیل میدهد که اجازه تداخل نور با فازهای مثبت و منفی را نخواهد داد و به کمک تکنیک فاز Unwrapping مختصات عمق شناسایی میشود و در نهایت Coded Aperture یا کد دیافراگم وظیفه دارد  تا بسته به فاصله جسم تا کینکت دیافراگم دوربین را به دقت تنظیم کند تا تاری Bluring  نکند و تصاویر دریافتی کیفیت یکنواختی در سراسر بازی یا محیط های دیگر داشته باشند . به سادگی ملاحضه کردید که دوربین کینکت بر خلاف گفتهای عموم  تنها یک جزء ندارد و از چندین بخش مختلف تشکیل شده است که هر کدام وظیفه ی اسکن و پردازش کارهای مختلفی را بر عهده دارند.


کینکت یا بهتر بگوییم تکنولوژِی Gesture recognition Advenced ( تشخیص حرکت پیشرفته )  علاوه بر توضیحات فنی که به ان اشاره کردیم ، مشخصات مختلف و بسیار مهمی دارد که باید در مورد انها هم توضیح دهیم.

خروجی ویدئویی کینکت به بازیباز اجازه میدهد که سرعت فریمی در حدود 30 با جریان ویدئویی RGB  به صورت 32 بیت همراه با وضوح تصویر 640 در 480 پیکسل و جریان ویدئویی تک رنگ ( Monochorom )  برای سنجش عمق به صورت 16-BIT QVGA  و وضوح 320در 240 پیکسل با 65،535 سطح حساسیت دارد . فاصله فرد تا دستگاه عامل مهمی است و کینکت رنج بین 1،2 تا 3،5 متر را تشخیص میدهد و زاویه دیدی در حدود 57 افقی و 43 درجه عمودی را دارد. همچنین حسگرهای دوربین توانایی چرخشی معدل 27 درجه را دارا هستند. هر کانال میکروفن کینکت صدای 16 بیت در ریت 16 کیاوهرتز را پردازش میکنند که مناسب به نظر میرسد. اما دائما از کلمه پردازش استفاده کردیم ، بد نیست بدانید کینکت اطلاعات را به چه وسیله ای مورد بررسی و تحلیل قرار میدهد؟


در ابتا قرار بود خود کینکت یک واحد پردازشی یا میکروپروسسور اختصاصی داشته باشد که بعد ها  نقشه ان تغییر پیدا کرد و عملیات تحلیل به پردازش گر Xenon کنسول X360  محول شد . بدین صورت که بین 10 تا 15 درصد  محاسبه اطلاعات را پردازشگر 360 انجام میدهد و کینکت تنها یک اسکنر با میکرولنزهای پیشرفته باقی میماند.


 

/ 0 نظر / 13 بازدید