تکنولوژی تشخیص چهره چگونه کار می‌کند؟

بیشتر افراد در حین استفاده از تکنولوژی تشخیص چهره در اپلیکیشن‌هایی مثل اینستاگرام و Face ID حس خوبی دارند. اما جالب است بدانید که این تکنولوژی نسبتا جدید می‌تواند تا حدی عجیب و غریب باشد.مانند هر تکنولوژی دیگر، فناوری تشخیص چهره هم نقاط ضعف خود را دارد و در بسیاری از مصارف نظامی و امنیتی راه‌های مختلفی برای دور زدنش به وجود آمده است. به همین دلیل حالا بیش از هر زمان دیگر مهم است که کاربران با روش کار تکنولوژی تشخیص چهره آشنا شوند.

به همین دلیل در این مطلب تصمیم گرفتیم با زبانی ساده در رابطه با چگونگی عملکرد تکنولوژی تشخیص چهره توضیح دهیم. در انتها چند اپلیکیشن معروف که در زمینه‌ی تشخیص چهره فعالیت می‌کنند را نیز معرفی کرده‌ایم. با ما همراه باشید.

تکنولوژی تشخیص چهره بسیار ساده است

پیش از آنکه وارد لایه‌های عمیق این تکنولوژی شویم مهم است که روند کار این فناوری را بفهمیم. در ادامه سه کاربرد مختلف برای تشخیص چهره را معرفی خواهیم کرد و توضیح مختصر و ساده‌ای از نحوه‌ی عملکردشان ارائه می‌دهیم:

  • تشخیص چهره‌های معمولی که در Animoji و فیلتر‌های اینستاگرام مورد استفاده قرار می‌گیرد. دوربین گوشی شما به دنبال حجمی شبیه به صورت انسان می‌گردد؛ حجمی که دو چشم، یک بینی و یک دهان داشته باشد. سپس با استفاده از الگوریتم‌هایی نسبتا پیچیده تلاش می‌کند جهت صورت را تشخیص دهد و حتی ببیند که آیا دهان فرد باز است یا نه. بد نیست به این موضوع هم اشاره کنیم که این گونه نرم افزار‌ها وظیفه‌ی تشخیص چهره را بر عهده ندارند و تنها به دنبال صورت انسان می‌گردند.
  • Face ID و نرم افزار‌های مشابه عکسی از صورتتان می‌گیرند و مشخص می‌کنند که فاصله‌ی هرکدام از بخش‌های صورت شما با هم چه قدر است. سپس هر زمان که بخواهید گوشی‌تان را باز کنید این اپلیکیشن بررسی می‌کند که آیا فاصله‌ی المان‌های صورتتان با عکس اولیه یکسان هست یا خیر. در صورت تطبیق قفل گوشی باز خواهد شد.
  • تشخیص چهره‌ی یک غریبه عموما در شرکت‌های بزرگ و امنیتی انجام می‌شود. در این سازمان‌ها -به منظور حفظ امنیت و یا حتی با هداف تبلیغاتی- تلاش می‌شود تا چهره‌ی هرکدام از افراد با تعداد زیادی از چهره‌های از پیش ذخیره شده در پایگاه داده‌ای غنی مقایسه شود. این فرآیند تا حد زیادی شبیه به Face ID اپل است اما در ابعادی گسترده‌تر انجام می‌گیرد. روی کاغذ هر پایگاه داده‌ای (پایگاه داده‌ی کارت ملی، حساب کاربری فیسبوک و …) می‌تواند برای این کار مورد استفاده قرار بگیرد اما ایده آل ترین گزینه استفاده از پایگاه داده‌ی تصاویری واضح از چهره‌ی افراد است.

حالا زمان آن رسیده که کمی بحث را پیچیده تر کنیم. تشخیص چهره‌ی مورد استفاده در فیلتر اینستاگرام بسیار ساده است و می‌توان گفت فرآیند آن عملا آسیبی به افراد نمی‌رساند. در این مطلب قصد داریم تمرکزمان روی تشخیص چهره و تکنولوژی‌هایی باشد که می‌توان از آن‌ها برای تشخیص هویت افراد استفاده کرد.

بیشتر تشخیص چهره‌ها از تصاویر دو بعدی استفاده می‌کنند

همانطور که احتمالا انتظار دارید بیشتر نرم افزار‌های تشخیص چهره روی تصاویر دو بعدی متمرکز هستند. البته این موضوع به دلیل دقیق‌تر بودن پردازش تصاویر دو بعدی نیست، بلکه به خاطر راحتی کار است. بیشتر دوربین‌های مورد استفاده تصاویر را بدون عمق ثبت می‌کنند و از طرفی تصاویر ذخیره شده در پایگاه داده‌های بزرگ عمدتا به صورت دو بعدی هستند.

شاید بپرسید که چرا تشخیص چهره با استفاده از تصاویر دو بعدی دقت صد در صدی ندارد؟ دلیل اصلی آن است که تصاویر کاملا صاف و دو بعدی از چهره برخی المان‌های مهم که باعث منحصر به فرد بودن صورت افراد می‌شود را از بین می‌برد. در تصویر دو بعدی کامپیوتر می‌تواند تنها فاصله‌ی مردمک چشم‌ها یا عرض لب و دهان را تشخیص دهد، در حالی که امکان بررسی طول بینی یا برجستگی پیشانی‌تان را ندارد.

علاوه بر این، تشخیص چهره با استفاده از تصاویر دو بعدی حساب زیادی روی وجود نور کافی باز می‌کند. این موضوع یعنی احتمالا شما برای باز کردن قفل گوشی خود در تاریکی دچار مشکل خواهید شد. این موضوع حتی زیر سایه هم ممکن است اتفاق بیفتد.

واضح است که برای حل این معضلات باید از تشخیص چهره با استفاده از تصاویر سه بعدی استفاده کرد. اما سوال اصلی اینجاست که برای تشخیص چهره‌ی سه بعدی باید چه کار کرد؟ آیا به ابزاری خاص احتیاج داریم؟

دوربین‌های IR به تصاویرتان عمق می‌بخشند

همانطور که گفتیم بیشتر دوربین‌ها برای تشخیص چهره از تصاویر دو بعدی استفاده می‌کنند اما برخی دیگر به سراغ تصاویر سه بعدی رفته‌اند. در واقع یقینا تجربه‌ی شما از تکنولوژی تشخیص چهره تا حدی به کمک تصویربرداری سه بعدی انجام شده است.

این کار با کمک تکنیکی به نام لیدار (Lidar) انجام می‌شود که شباهت زیادی به سونار دارد. سونار سیستم تشخیص اشیاء زیر سطح آب است. در این روش پالس‌های صوتی را به زیر آب ارسال می‌کنند تا به اشیاء برخورد کند و سپس به سمت ارسال کننده بازگردد. با توجه به مدت زمان رفت و آمد پالس صوتی می‌توان عمق اشیاء زیر آب را تشخیص داد.

لیدار هم شباهت زیادی به سونار دارد با این تفاوت که به جای ارسال پالس‌های صوتی از لیزر استفاده می‌کند. مثلا دستگاه‌هایی مثل آیفون یک ماتریس IR را به صورتتان می‌تاباند که البته آسیبی به شما نخواهد رساند. این ماتریس (که دیواری از لیزرهاست) به صورتتان برخورد می‌کند و سپس به سنسور‌های گوشی باز می‌گردد و توسط دوربین‌های IR دریافت می‌شود. این موضوع عمق المان‌های مختلف صورتتان را تشخیص خواهد داد.

در واقع دوربین IR مدت زمان بازگشت برخورد هرکدام از لیزر‌ها به صورتتان و بازگشتشان به گوشی را بررسی می‌کند. طبیعی است که نور بازگشت داده شده از نوک بینی‌تان با سرعت بیشتری نسبت به نوری که به گوشتان برخورد می‌کند باز می‌گردد. همین اطلاعات کمک می‌کند تا گوشی یک تصویر منحصر به فرد از چهره‌تان ایجاد کند. واضح است که این روش در مقایسه با تشخیص چهره به صورت دو بعدی دقت بسیار بیشتری دارد.

تصویربرداری حرارتی به تشخیص چهره در تاریکی کمک می‌کند

یکی از مشکلات تشخیص چهره به روش دو بعدی این است که در صورت عدم وجود نور کافی با مشکل مواجه می‌شود. اما این معضل می‌تواند با استفاده از تصویربرداری حرارتی یا Thermal حل شود.

شاید به این موضوع اشاره کنید که «تصویربرداری حرارتی از نور IR استفاده می‌کند». این موضوع کاملا صحیح است اما دوربین‌های مجهز به تصویربرداری حرارتی نور IR را ارسال نمی‌کنند؛ آن‌ها تنها نور IR ساطع شده از اشیاء را تشخیص می‌دهند.

اشیاء گرم حجم زیادی از نور IR را از خود ساطع می‌کنند در حالی این مقدار در اشیاء سرد بسیار ناچیز است. دوربین‌های گران قیمت حرارتی حتی می‌توانند تفاوت دمای بسیار ناچیز سطوح مختلف را هم تشخیص دهند. به همین دلیل است که این تکنولوژی می‌تواند برای تشخیص چهره مناسب باشد.

راه‌های متفاوت زیادی برای تشخیص چهره با استفاده از تصویربرداری حرارتی وجود دارد. البته همه‌ی این تکنیک‌ها پیچیده هستند اما شباهت‌های بنیادین قابل توجهی دارند. به همین دلیل تلاش می‌کنیم آن‌ها را به ساده‌ترین شکل ممکن توضیح دهیم:

  • برای تشخیص چهره‌ی دقیق نمی‌توان تنها به ثبت یک تصویر بسنده کرد. یک دوربین حرارتی چندین عکس از سطوح ثبت می‌کند. هرکدام از عکس‌ها روی مقدار خاصی از نور IR تمرکز می‌کند (موج‌های بلند، کوتاه و معمولی). طبیعتا موج‌های بلند بیشترین جزئیات صورت را مشخص خواهد کرد.
  • برای تشخیص چهره‌ی دقیق‌تر می‌توان از محل دقیق رگ‌های بدن استفاده کرد. این تصاویر IR می‌توانند ترکیب و محل دقیق رگ‌های درون صورت فرد را تشخیص دهند. این موضوع باعث می‌شود صورت هر فرد مثل اثر انگشت منحصر به فرد باشد. از این روش حتی می‌توان برای تشخیص زخم‌های روی صورت و فاصله‌ی بین اورگان‌های صورت استفاده کرد.
  • بعد از تصویربرداری‌های مختلف می‌توان سوژه را تشخیص داد. در واقع یک حجم از تصاویر مختلف دریافت شده ثبت می‌شود. سپس حجم یاد شده را می‌توان با پایگاه داده‌ای غنی از چهره‌ها مقایسه کرد. با این کار قادر به تشخیص سوژه خواهیم بود.

البته استفاده از دوربین‌های حرارتی تنها مصارف نظامی دارد و نمی‌توانید انتظار داشته باشید که در آینده‌ای نزدیک گوشی‌ها به آن مجهز شوند. از این گذشته این روش عمدتا در شب و بدون وجود نور مورد استفاده قرار می‌گیرد و روز‌ها استفاده از آن منطقی نیست. بنابراین می‌توان گفت هیچ کاربرد قابل توجهی به جز مصارف نظامی نخواهد داشت.

محدودیت‌های تشخیص چهره

در این مطلب موضوعات مختلفی در رابطه با نقاط ضعف تشخیص چهره گفته شد که با استفاده از روش‌های جدید تا حدی برطرف می‌شوند. اما برخی محدودیت‌ها وجود دارند که حداقل هنوز حل نشده‌اند:

  • موارد مزاحم: همانطور که احتمالا بدانید استفاده از وسایلی مانند عینک آفتابی می‌تواند تشخیص چهره را با مشکل مواجه کند.
  • ژست‌های مختلف: بهترین عملکرد تکنولوژی تشخیص چهره زمانی است که سوژه به صورت مستقیم و با چهره‌ای عادی به دوربین نگاه کند. انجام ژست‌های مختلف و حتی چرخاندن سر می‌تواند تا حدی برای نرم افزار‌هایی که از دوربین‌های IR استفاده می‌کنند هم مشکل‌ساز باشد. علاوه بر این، لبخند، گونه‌های پف کرده یا هر ژست خاص دیگر می‌تواند قوی‌ترین تشخیص دهنده‌های چهره را هم در اندازه گیری المان‌های صورتتان دچار مشکل کند.
  • نور: همه‌ی فرم‌های مختلف تشخیص چهره زیر نور انجام می‌شوند و در واقع بدون نور این تکنولوژی عملکرد مناسبی نخواهد داشت. البته این موضوع ممکن است به زودی تغییر کند چرا که محققان در تلاشند تا از تکنولوژی سونار برای تشخیص چهره استفاده کنند.
  • پایگاه داده: بدون یک پایگاه داده‌ی مناسب تشخیص چهره نمی‌تواند به خوبی انجام شود. در واقع اگر پایگاه داده‌ی غنی و کاملی از تصویر افراد همراه با اطلاعاتشان وجود نداشته باشد، تکنولوژی تشخیص چهره تنها صورت افراد جدید را تماشا خواهد کرد.
  • پردازش داده: با توجه به حجم و شکل پایگاه داده ممکن است کامپیوتر‌ها برای تشخیص چهره زمان زیادی را نیاز داشته باشند. بعضی اوقات -مثلا در موارد امنیتی- این محدودیت می‌تواند مشکل ساز باشد.

منبع: دیجیاتو

نظر خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

8 + 2 =

تگ های html مجاز به استفاده می باشند: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

ارسال پیام