تکنولوژی تشخیص چهره
تکنولوژی تشخیص چهره چگونه کار میکند؟
بیشتر افراد در حین استفاده از تکنولوژی تشخیص چهره در اپلیکیشنهایی مثل اینستاگرام و Face ID حس خوبی دارند. اما جالب است بدانید که این تکنولوژی نسبتا جدید میتواند تا حدی عجیب و غریب باشد.مانند هر تکنولوژی دیگر، فناوری تشخیص چهره هم نقاط ضعف خود را دارد و در بسیاری از مصارف نظامی و امنیتی راههای مختلفی برای دور زدنش به وجود آمده است. به همین دلیل حالا بیش از هر زمان دیگر مهم است که کاربران با روش کار تکنولوژی تشخیص چهره آشنا شوند.
به همین دلیل در این مطلب تصمیم گرفتیم با زبانی ساده در رابطه با چگونگی عملکرد تکنولوژی تشخیص چهره توضیح دهیم. در انتها چند اپلیکیشن معروف که در زمینهی تشخیص چهره فعالیت میکنند را نیز معرفی کردهایم. با ما همراه باشید.
تکنولوژی تشخیص چهره بسیار ساده است
پیش از آنکه وارد لایههای عمیق این تکنولوژی شویم مهم است که روند کار این فناوری را بفهمیم. در ادامه سه کاربرد مختلف برای تشخیص چهره را معرفی خواهیم کرد و توضیح مختصر و سادهای از نحوهی عملکردشان ارائه میدهیم:
- تشخیص چهرههای معمولی که در Animoji و فیلترهای اینستاگرام مورد استفاده قرار میگیرد. دوربین گوشی شما به دنبال حجمی شبیه به صورت انسان میگردد؛ حجمی که دو چشم، یک بینی و یک دهان داشته باشد. سپس با استفاده از الگوریتمهایی نسبتا پیچیده تلاش میکند جهت صورت را تشخیص دهد و حتی ببیند که آیا دهان فرد باز است یا نه. بد نیست به این موضوع هم اشاره کنیم که این گونه نرم افزارها وظیفهی تشخیص چهره را بر عهده ندارند و تنها به دنبال صورت انسان میگردند.
- Face ID و نرم افزارهای مشابه عکسی از صورتتان میگیرند و مشخص میکنند که فاصلهی هرکدام از بخشهای صورت شما با هم چه قدر است. سپس هر زمان که بخواهید گوشیتان را باز کنید این اپلیکیشن بررسی میکند که آیا فاصلهی المانهای صورتتان با عکس اولیه یکسان هست یا خیر. در صورت تطبیق قفل گوشی باز خواهد شد.
- تشخیص چهرهی یک غریبه عموما در شرکتهای بزرگ و امنیتی انجام میشود. در این سازمانها -به منظور حفظ امنیت و یا حتی با هداف تبلیغاتی- تلاش میشود تا چهرهی هرکدام از افراد با تعداد زیادی از چهرههای از پیش ذخیره شده در پایگاه دادهای غنی مقایسه شود. این فرآیند تا حد زیادی شبیه به Face ID اپل است اما در ابعادی گستردهتر انجام میگیرد. روی کاغذ هر پایگاه دادهای (پایگاه دادهی کارت ملی، حساب کاربری فیسبوک و …) میتواند برای این کار مورد استفاده قرار بگیرد اما ایده آل ترین گزینه استفاده از پایگاه دادهی تصاویری واضح از چهرهی افراد است.
حالا زمان آن رسیده که کمی بحث را پیچیده تر کنیم. تشخیص چهرهی مورد استفاده در فیلتر اینستاگرام بسیار ساده است و میتوان گفت فرآیند آن عملا آسیبی به افراد نمیرساند. در این مطلب قصد داریم تمرکزمان روی تشخیص چهره و تکنولوژیهایی باشد که میتوان از آنها برای تشخیص هویت افراد استفاده کرد.
بیشتر تشخیص چهرهها از تصاویر دو بعدی استفاده میکنند
همانطور که احتمالا انتظار دارید بیشتر نرم افزارهای تشخیص چهره روی تصاویر دو بعدی متمرکز هستند. البته این موضوع به دلیل دقیقتر بودن پردازش تصاویر دو بعدی نیست، بلکه به خاطر راحتی کار است. بیشتر دوربینهای مورد استفاده تصاویر را بدون عمق ثبت میکنند و از طرفی تصاویر ذخیره شده در پایگاه دادههای بزرگ عمدتا به صورت دو بعدی هستند.
شاید بپرسید که چرا تشخیص چهره با استفاده از تصاویر دو بعدی دقت صد در صدی ندارد؟ دلیل اصلی آن است که تصاویر کاملا صاف و دو بعدی از چهره برخی المانهای مهم که باعث منحصر به فرد بودن صورت افراد میشود را از بین میبرد. در تصویر دو بعدی کامپیوتر میتواند تنها فاصلهی مردمک چشمها یا عرض لب و دهان را تشخیص دهد، در حالی که امکان بررسی طول بینی یا برجستگی پیشانیتان را ندارد.
علاوه بر این، تشخیص چهره با استفاده از تصاویر دو بعدی حساب زیادی روی وجود نور کافی باز میکند. این موضوع یعنی احتمالا شما برای باز کردن قفل گوشی خود در تاریکی دچار مشکل خواهید شد. این موضوع حتی زیر سایه هم ممکن است اتفاق بیفتد.
واضح است که برای حل این معضلات باید از تشخیص چهره با استفاده از تصاویر سه بعدی استفاده کرد. اما سوال اصلی اینجاست که برای تشخیص چهرهی سه بعدی باید چه کار کرد؟ آیا به ابزاری خاص احتیاج داریم؟
دوربینهای IR به تصاویرتان عمق میبخشند
همانطور که گفتیم بیشتر دوربینها برای تشخیص چهره از تصاویر دو بعدی استفاده میکنند اما برخی دیگر به سراغ تصاویر سه بعدی رفتهاند. در واقع یقینا تجربهی شما از تکنولوژی تشخیص چهره تا حدی به کمک تصویربرداری سه بعدی انجام شده است.
این کار با کمک تکنیکی به نام لیدار (Lidar) انجام میشود که شباهت زیادی به سونار دارد. سونار سیستم تشخیص اشیاء زیر سطح آب است. در این روش پالسهای صوتی را به زیر آب ارسال میکنند تا به اشیاء برخورد کند و سپس به سمت ارسال کننده بازگردد. با توجه به مدت زمان رفت و آمد پالس صوتی میتوان عمق اشیاء زیر آب را تشخیص داد.
لیدار هم شباهت زیادی به سونار دارد با این تفاوت که به جای ارسال پالسهای صوتی از لیزر استفاده میکند. مثلا دستگاههایی مثل آیفون یک ماتریس IR را به صورتتان میتاباند که البته آسیبی به شما نخواهد رساند. این ماتریس (که دیواری از لیزرهاست) به صورتتان برخورد میکند و سپس به سنسورهای گوشی باز میگردد و توسط دوربینهای IR دریافت میشود. این موضوع عمق المانهای مختلف صورتتان را تشخیص خواهد داد.
در واقع دوربین IR مدت زمان بازگشت برخورد هرکدام از لیزرها به صورتتان و بازگشتشان به گوشی را بررسی میکند. طبیعی است که نور بازگشت داده شده از نوک بینیتان با سرعت بیشتری نسبت به نوری که به گوشتان برخورد میکند باز میگردد. همین اطلاعات کمک میکند تا گوشی یک تصویر منحصر به فرد از چهرهتان ایجاد کند. واضح است که این روش در مقایسه با تشخیص چهره به صورت دو بعدی دقت بسیار بیشتری دارد.
تصویربرداری حرارتی به تشخیص چهره در تاریکی کمک میکند
یکی از مشکلات تشخیص چهره به روش دو بعدی این است که در صورت عدم وجود نور کافی با مشکل مواجه میشود. اما این معضل میتواند با استفاده از تصویربرداری حرارتی یا Thermal حل شود.
شاید به این موضوع اشاره کنید که «تصویربرداری حرارتی از نور IR استفاده میکند». این موضوع کاملا صحیح است اما دوربینهای مجهز به تصویربرداری حرارتی نور IR را ارسال نمیکنند؛ آنها تنها نور IR ساطع شده از اشیاء را تشخیص میدهند.
اشیاء گرم حجم زیادی از نور IR را از خود ساطع میکنند در حالی این مقدار در اشیاء سرد بسیار ناچیز است. دوربینهای گران قیمت حرارتی حتی میتوانند تفاوت دمای بسیار ناچیز سطوح مختلف را هم تشخیص دهند. به همین دلیل است که این تکنولوژی میتواند برای تشخیص چهره مناسب باشد.
راههای متفاوت زیادی برای تشخیص چهره با استفاده از تصویربرداری حرارتی وجود دارد. البته همهی این تکنیکها پیچیده هستند اما شباهتهای بنیادین قابل توجهی دارند. به همین دلیل تلاش میکنیم آنها را به سادهترین شکل ممکن توضیح دهیم:
- برای تشخیص چهرهی دقیق نمیتوان تنها به ثبت یک تصویر بسنده کرد. یک دوربین حرارتی چندین عکس از سطوح ثبت میکند. هرکدام از عکسها روی مقدار خاصی از نور IR تمرکز میکند (موجهای بلند، کوتاه و معمولی). طبیعتا موجهای بلند بیشترین جزئیات صورت را مشخص خواهد کرد.
- برای تشخیص چهرهی دقیقتر میتوان از محل دقیق رگهای بدن استفاده کرد. این تصاویر IR میتوانند ترکیب و محل دقیق رگهای درون صورت فرد را تشخیص دهند. این موضوع باعث میشود صورت هر فرد مثل اثر انگشت منحصر به فرد باشد. از این روش حتی میتوان برای تشخیص زخمهای روی صورت و فاصلهی بین اورگانهای صورت استفاده کرد.
- بعد از تصویربرداریهای مختلف میتوان سوژه را تشخیص داد. در واقع یک حجم از تصاویر مختلف دریافت شده ثبت میشود. سپس حجم یاد شده را میتوان با پایگاه دادهای غنی از چهرهها مقایسه کرد. با این کار قادر به تشخیص سوژه خواهیم بود.
البته استفاده از دوربینهای حرارتی تنها مصارف نظامی دارد و نمیتوانید انتظار داشته باشید که در آیندهای نزدیک گوشیها به آن مجهز شوند. از این گذشته این روش عمدتا در شب و بدون وجود نور مورد استفاده قرار میگیرد و روزها استفاده از آن منطقی نیست. بنابراین میتوان گفت هیچ کاربرد قابل توجهی به جز مصارف نظامی نخواهد داشت.
محدودیتهای تشخیص چهره
در این مطلب موضوعات مختلفی در رابطه با نقاط ضعف تشخیص چهره گفته شد که با استفاده از روشهای جدید تا حدی برطرف میشوند. اما برخی محدودیتها وجود دارند که حداقل هنوز حل نشدهاند:
- موارد مزاحم: همانطور که احتمالا بدانید استفاده از وسایلی مانند عینک آفتابی میتواند تشخیص چهره را با مشکل مواجه کند.
- ژستهای مختلف: بهترین عملکرد تکنولوژی تشخیص چهره زمانی است که سوژه به صورت مستقیم و با چهرهای عادی به دوربین نگاه کند. انجام ژستهای مختلف و حتی چرخاندن سر میتواند تا حدی برای نرم افزارهایی که از دوربینهای IR استفاده میکنند هم مشکلساز باشد. علاوه بر این، لبخند، گونههای پف کرده یا هر ژست خاص دیگر میتواند قویترین تشخیص دهندههای چهره را هم در اندازه گیری المانهای صورتتان دچار مشکل کند.
- نور: همهی فرمهای مختلف تشخیص چهره زیر نور انجام میشوند و در واقع بدون نور این تکنولوژی عملکرد مناسبی نخواهد داشت. البته این موضوع ممکن است به زودی تغییر کند چرا که محققان در تلاشند تا از تکنولوژی سونار برای تشخیص چهره استفاده کنند.
- پایگاه داده: بدون یک پایگاه دادهی مناسب تشخیص چهره نمیتواند به خوبی انجام شود. در واقع اگر پایگاه دادهی غنی و کاملی از تصویر افراد همراه با اطلاعاتشان وجود نداشته باشد، تکنولوژی تشخیص چهره تنها صورت افراد جدید را تماشا خواهد کرد.
- پردازش داده: با توجه به حجم و شکل پایگاه داده ممکن است کامپیوترها برای تشخیص چهره زمان زیادی را نیاز داشته باشند. بعضی اوقات -مثلا در موارد امنیتی- این محدودیت میتواند مشکل ساز باشد.
منبع: دیجیاتو