مقدمه
فراداده (Metadata)، عنصری کلیدی در استخراج اطلاعات با ارزش از ویدیوها به شمار میرود. این دادهها با توصیف جزئیات مهم از صحنه، معنای دیجیتالی به محتوای ویدیویی میبخشند. با استفاده از فراداده، امکان جستجو، ارزیابی و واکنش سریع نسبت به اتفاقات مهم در حجم عظیمی از ویدیوها فراهم میشود. به همین دلیل، دوربین اکسیس مبتنی بر فناوری فراداده به تدریج به بخشی ضروری در سیستمهای امنیتی کارآمد، سیستمهای ایمنی و عملیات تجاری تبدیل شده است. در این مقاله، مفهوم فراداده را در زمینه نظارت تصویری و حوزه عملیاتی مورد بررسی قرار میدهیم. همچنین، مزایای دوربین اکسیس فرادیتا و نحوهی کاربرد آن در سیستمهای مدیریت ویدیو و سایر برنامهها را به تفصیل شرح خواهیم داد.
متادیتا یا فراداده چیست؟
متادیتا، یا فراداده، به دادهای اطلاق میشود که اطلاعاتی در مورد دادههای دیگر ارائه میدهد. در حوزه نظارت تصویری، دوربین اکسیس متادیتا شرحی متنی را به محتوای ویدیویی میافزاید. این شرح میتواند شامل ویژگیهای مرتبط با اشیاء یا صحنه باشند.
- اشیاء قابل مشاهده: در ویدیو چه اشیاء یا افرادی قابل مشاهده هستند.
- شرح صحنه: توصیف کلی از محیط ویدیو
- ویژگیهای اشیاء: رنگ، مدل، نوع، ابعاد و ... اشیاء موجود در تصویر
- اطلاعات مکانی: موقعیت دقیق اشیاء یا افراد در تصویر
- حرکت: جهت و سرعت حرکت اشیاء یا افراد در تصویر
متادیتا بهصورت بلادرنگ، یعنی در لحظه ضبط ویدیو، توسط دوربین یا سایر اجزای سیستم نظارت تصویری که قادر به تجزیه و تحلیل ویدیو هستند، تولید میشود. این ویژگی، اطلاعات ارزشمندی را برای اهداف مختلف مانند جستجو، بازیابی و تحلیل ویدیو فراهم میکند.
متادیتا توسط دوربین که توانایی تجزیه و تحلیل ویدیو را دارد، تولید میشود.
تولید فراداده با استفاده از دوربین اکسیس در لبه (edge)
در گذشته، تجزیه و تحلیل ویدیوهای با کارایی بالا، به دلیل نیاز به قدرت پردازش زیاد، تنها بر روی سرورها انجام میشد، اما با پیشرفت الگوریتمها و افزایش توان پردازش دستگاههای edge، حالا میتوان این تحلیلهای پیچیده را بهطور مستقیم بر روی این دستگاهها انجام داد. بنابراین دادههای ویدیویی در لحظه، تولید و پردازش میشوند و دیگر نیازی به ارسال ویدیوها به سرور برای تجزیه و تحلیل نیست. این مزیت موجب کاهش تاخیر و افزایش سرعت واکنش میشود. همچنین با دسترسی به ویدیوی غیر فشرده، میتوان اطلاعات بیشتری را از تصاویر استخراج کرد و تجزیه و تحلیل دقیقتری از محتوای ویدیو ارائه داد.
تجزیه و تحلیل دوربین اکسیس در لبه یا edge، به سختافزار و زیرساخت کمتری نیاز دارد که به معنای صرفهجویی در هزینه است. با انجام پردازش اولیه روی دستگاههای لبه، میتوان از ویدیوها برای کاربردهای مختلفی مانند نظارت تصویری، تشخیص چهره و تجزیه و تحلیل ترافیک استفاده کرد. در مجموع، قابلیت تجزیه و تحلیل تصویر دوربین اکسیس در لبه، تحولی بزرگ در نحوه پردازش و استفاده از اطلاعات ویدیویی است. این فناوری جدید، راه را برای برنامههای کاربردی هوشمندتر، کارآمدتر و مقرون به صرفهتر در زمینههای مختلف هموار میسازد.
موارد استفاده از دوربین اکسیس مبتنی بر متادیتا
متادیتا تنها به جزئیات مربوط به اشیاء در یک صحنه محدود نمیشود، بلکه زمینهای برای رویدادها نیز فراهم و به جستجو و دستهبندی سریع حجم زیادی از ویدیو کمک میکند. این قابلیت دوربین اکسیس، امکانات جدیدی را در سه حوزه کلی ایجاد میکند.
۱. کاربرد لحظهای برای اقدام فوری
از دوربین اکسیس فراداده (متادیتا) در زمان واقعی برای کمک به اپراتورها جهت عکسالعمل سریع در برابر تغییرات موقعیتی استفاده میشود. همچنین میتواند ورودی ارزشمندی برای پشتیبانی از تصمیمگیری یا فعال کردن اقدامات خودکار ارائه دهد. تحلیل لبه (edge analytics) لحظهای که با فراداده باکیفیت کار میکند، میتواند به تامین امنیت افراد، اماکن و ساختمانها و محافظت از آنها در برابر آسیبهای عمدی یا غیرعمدی کمک کند. از این رو قادر خواهید بود با استفاده از دوربین اکسیس تهدیدات را به سرعت شناسایی، تایید و ارزیابی نمایید تا بهطور موثر با آنها برخورد شود.
متادیتا تنها به جزئیات مربوط به اشیاء در یک صحنه محدود نمیشود.
۲. جستجوی پزشکی قانونی
دوربین اکسیس فراداده امکان جستجوی کارآمد و سریع برای اشیاء یا رویدادهای مورد نظر را فراهم میکند. این ویژگی میتواند ساعتها زمان تحقیق را، به ویژه در جستجوهای انجامشده بر روی حجم عظیمی از منابع ویدیویی مختلف، صرفهجویی کند. بر این اساس بیشتر تمرکز بر روی پارامترهای جستجوی مختلف برای اشیاء، مانند انسان، وسایل نقلیه و تعداد محدودی از موارد احتمالی قرار میگیرد. پارامترهای جستجو شامل مواردی چون حرکت، زمان و ویژگیهای شیء میشوند. برای یافتن نتایج مورد نیاز حتی دسترسی به یک دسته از فراداده، مانند زمان، حیاتی خواهد بود.
دوربین اکسیس جستجوها را با استفاده از دستهبندیهای مختلف فراداده، تسهیل میکند.
|
مثال |
موارد قابل شناسایی |
دستهبندی فراداده |
1 |
جهت، سرعت و سایر رفتارها |
چگونه یک شیء حرکت میکند؟ |
تحرک |
2 |
روز، ساعت و مدت زمان توقف |
چه زمانی شیء ظاهر میشود؟ |
زمان |
3 |
مکان و میدان دید دوربین |
شیء کجا قرار دارد؟ |
مکان یا موقعیت |
4 |
افراد، وسایل نقلیه(ماشین، اتوبوس، کامیون، دوچرخه، موتور) |
شئ مورد نظر از چه نوعی است؟ |
طبقهبندی شیء |
5 |
لباس، وسایل جانبی مانند کلاه و کیف، مشخصات ظاهری مانند رنگ لباس |
شئ مورد نظر چه ویژگیهایی دارد؟ |
ویژگیهای شیء |
دوربین اکسیس قادر است جستجوهایی را بر اساس سرعت نسبی شیء و جهت حرکت آن، امکانپذیر کند. همچنین دادههای طبقهبندی اشیاء، امکان جستجوهایی را که شامل جزئیات گستردهتری هستند را میسر میکند. دوربین اکسیس با واحدهای پردازش یادگیری عمیق (DLPU) میتواند فراداده غنیشده با طبقهبندی دقیقتر اشیاء را ارائه دهد. بهعنوان مثال قادر است یک کامیون سبز یا فردی با کت آبی را جستجو کند.
۳. شناسایی روندها و الگوها برای کسب بینش
سیستمهای اینترنت اشیاء (IoT) و بهرهوری عملیاتی، برای گزارشهای آماری خود مانند شمارش بازدیدکنندگان، اندازهگیری سرعت، دادههای ترافیک و سایر انواع جمعآوری خودکار دادهها، میتوانند به دوربین اکسیس فراداده تکیه کنند. این دادهها با هدف ایجاد بینشهای عملیاتی بیشتر تجزیه و تحلیل میشوند.
دوربین اکسیس
فراداده (متادیتا) در کجا استفاده میشود؟
فراداده (متادیتا) مزایای زیادی در درک ویژگیها و محتوای یک صحنه دارد. مصرفکنندگان اصلی فراداده را میتوان به دستههای زیر تقسیم کرد.
- برنامههای لبه (Edge applications): تحلیلهایی که بر روی دوربین اکسیس اجرا میشوند قادر هستند فیلترها و قوانین منطقی مختلفی را بر روی اطلاعات مربوط به اشیاء موجود در صحنه اعمال کنند. بدین ترتیب، تحلیلگر میتواند بر اساس آستانههای تعریفشده یا رفتارهای خاص، اقداماتی مانند کنترل دوربین PTZ بر اساس تشخیص و حرکت فرد در صحنه را انجام دهد.
- سیستمهای مدیریت ویدیو (VMS): در زمینه نظارت تصویری، فراداده بهطور معمول در VMS برای نمایش پوششهای بصری در اطراف اشیاء بالقوه مورد نظر در صحنه استفاده میشود. با توسعه الگوریتمهای پیشرفتهتر تشخیص و طبقهبندی اشیاء، اپراتورها میتوانند بر اساس ویژگیهای خاص، مانند رنگ لباس، اشیاء مورد علاقه را نیز مکانیابی کنند. با چنین قابلیتی دیگر نیازی به بررسی دستی حجم زیادی از فیلم نیست.
- پلتفرمهای اینترنت اشیاء (IoT): فراداده را میتوان در پلتفرمهای هوش تجاری برای جمعآوری بصری دادهها ارائه کرد تا با تجزیه و تحلیل روندهای لحظهای و تاریخی، بینشهای عملی بهدست آید. تجزیه و تحلیل آماری مبتنی بر تجربه مشتری، تصمیمگیری را برای بهبود عملیات امکانپذیر میکند.
- لایه دوم تحلیل: برخی از برنامهها برای انجام تحلیلهای پیشرفتهتر نیاز به ترکیبی از پردازش مبتنی بر لبه و سرور دارند. پیشپردازش میتواند بر روی دوربین اکسیس و پردازشهای بیشتر در سرور انجام گیرد. این سیستم ترکیبی تنها با استفاده از یک جریان ویدیو و فراداده مرتبط، فرایند تحلیل را تسهیل و مقرون به صرفهتر میکند.
فراداده مزایای زیادی در درک ویژگیها و محتوای یک صحنه دارد.
فراداده چگونه تحویل داده میشود؟
فراداده تولید شده با استفاده از دوربین اکسیس را میتوان با استفاده از رویکردهای مختلف بر اساس کاربرد مورد نظر ارائه کرد. در برنامههای بلادرنگ، فراداده باید بهصورت مداوم برای مصرفکننده بر اساس تقاضا ارسال شود. این امر برای اطمینان از پاسخ مناسب و آگاهی موقعیتی حیاتی است. این روش بهجای پردازش کل صحنه، فقط مسیر هر شیء خاص را در صحنه دنبال میکند و سپس آن را به مصرفکننده ارائه میدهد. این کار بهطور قابل توجهی حجم دادههای مورد نیاز برای ذخیرهسازی و پردازش را کاهش میدهد.
این تصویر نحوه ارسال جریان دادههای توصیفی (متادیتا) توسط دوربین اکسیس را نشان میدهد.
شرح تصویر بالا، جریان فراداده
دوربین بهطور مداوم فریمهای حاوی متادیتا را ارسال میکند که اطلاعات لحظهای صحنه را در اختیار ما قرار میدهد. هر فریم، صحنه را در یک لحظه خاص و مستقل از رویدادهای گذشته، ثبت میکند.
- فریم 1: این فریم دو شیء A و B را تشخیص میدهد و شیء A را به عنوان انسانی با لباس قرمز و شیء B را بهعنوان انسانی با لباس آبی طبقهبندی میکند.
- فریم 2: در فریم دوم، دوربین طبقهبندی خود را بهروزرسانی میکند و تشخیص میدهد که شیء A در واقع لباس آبی پوشیده است و شیء B لباس زرد به تن دارد. اگرچه خود اشیاء نسبت به فریم 1 تغییر نکردهاند، ویژگیهای رنگی آنها تغییر کرده است و این تغییر در دادههای توصیفی منعکس میشود.
- فریم 3: فریم 3 نشان میدهد که شیء B دیگر وجود ندارد و دوربین فقط شیء A را ردیابی میکند که همچنان بهعنوان یک انسان با لباس آبی طبقهبندی میشود.
این تصویر نحوه ارسال یکپارچهی دادههای توصیفی را نشان میدهد.
شرح تصویر بالا، تحویل دادههای تلفیقی فراداده
در این روش، دوربین اکسیس اطلاعات را در یک قالب واحد بر اساس مسیر تشخیص داده شدهی اشیاء در صحنه ارائه میدهد. فریمهای مربوط به هر شیء، شامل تمام جزئیات شناسایی شده در طول مسیر آن شیء است.
- فریم 1: در فریم اول، جزئیات مربوط به شیء B ارائه شده است. این جزئیات خلاصهای از مسیر حرکت و تمام ویژگیهایی میباشد که در طول مسیر تشخیص داده شده است. بر اساس این اطلاعات، احتمال پوشیدن لباس زرد برای شیء B، 50 درصد و احتمال پوشیدن لباس آبی نیز 50 درصد میباشد.
- فریم 2: فریم دوم، همین قالب را برای شیء A تکرار میکند و نشان میدهد که احتمال پوشیدن لباس قرمز برای آن 33 درصد و احتمال پوشیدن لباس آبی 67 درصد است.
مزیت روش یکپارچه این است که دوربین اکسیس با ارسال دادههای توصیفی فقط در زمانهایی که اشیاء در صحنه حضور دارند، میزان دادههای ارسالی به مصرفکننده را بهطرز قابل توجهی کاهش میدهد. در این حالت، دادهها خلاصه (یکپارچه) میشود تا تفسیر آنها برای مصرفکننده آسانتر باشد. در مقابل، روش جریان دادههای خام، در هر فریم توصیف کاملی از صحنه را ارائه میدهد، حتی زمانی که هیچ فعالیت یا شیئی وجود ندارد. در این روش، مصرفکننده باید بر اساس نیاز خاص خود از این دادهها سر در بیاورد. همانطور که گفته شد، روش جریان دادههای خام برای موارد استفادهی لحظهای مفید است، در حالی که روش یکپارچه برای پساپردازش، زمانی که مصرفکننده نیازی به اقدام فوری ندارد، ایدهآل خواهد بود.
درک نقاط قوت و ضعف هر رویکرد برای طراحی معماری سیستم دوربین اکسیس ضروری است. برای مثال، یک پلتفرم اینترنت اشیاء که بر اساس دادههای توصیف بینشی ایجاد میکند، از دریافت خلاصهای از اشیاء موجود در صحنه بعد از وقوع رویداد سود میبرد، زیرا این سرویسها معمولا با محدودیت پهنای باند و ذخیرهسازی مواجه هستند. علاوه بر این، دادههای توصیفی را میتوان بر اساس نیازها و ترجیحات خاص مصرفکننده موردنظر، از طریق پروتکلهای ارتباطی و فرمتهای فایلی مختلفی تحویل داد.
دوربین اکسیس اطلاعات را در یک قالب واحد بر اساس مسیر تشخیص داده شدهی اشیاء در صحنه ارائه میدهد.
قابلیت فراداده صوتی دوربین اکسیس
دوربین اکسیس قادر است صدای محیط را رمزگشایی و از آن دادههای توصیفی استخراج کند. تحلیل تشخیص صدا میتواند الگوهای صوتی را شناسایی کرده و صداهای مهم را در صوت زنده و ضبط شده برجسته کند. به این ترتیب، سیستمهای تشخیص صدا با ترکیب شدن با دستگاههای نظارت تصویری میتوانند اپراتورها را از حوادث احتمالی در حال وقوع مطلع سازند و آنها را به نمای مربوطه دوربین هدایت کنند. بهعنوان مثال، سیستم میتواند خشونت کلامی را شناسایی کند تا از تشدید و حمله جلوگیری نماید، شکستن شیشه را برای پیشگیری از سرقت تشخیص دهد یا هشدارهای اولیهای در مورد بیماران در معرض خطر ارائه دهد. سیستمهای تشخیص صدا با اجازه دادن به اپراتورها برای نه تنها دیدن بلکه شنیدن آنچه در یک صحنه رخ میدهد، امکان تشخیص زودهنگام، مداخله سریع و در بسیاری از موارد جلوگیری از تشدید بیشتر حوادث را فراهم میکنند. همچنین تشخیص صدا میتواند بهعنوان وسیلهای ثانویه برای تایید صحت ماجرا به کار رود.
تحلیلهایی که برای تشخیص الگوهای صوتی آموزش داده میشوند، بهطور معمول ترکیبی از ویژگیهایی چون میزان دسیبل و انرژی موجود در فرکانسهای مختلف در طول زمان را مورد بررسی قرار میدهند. الگوهای صوتی خاص را میتوان به روشی مشابه با تشخیص و تگ اشیاء در ویدیو، شناسایی و برچسبگذاری کرد.
ترکیب فراداده از منابع مختلف
پتانسیل واقعی دادههای توصیفی (متادیتا) دوربین اکسیس زمانی آشکار میشود که بر روی ورودیهای مختلفی مانند دادههای صوتی و تصویری، مرتبط با فعالیت و فرآیند اعمال شود. منابع دادهای مانند ردیابی RFID، مختصات GPS، هشدارهای دستکاری، قرائت کنتور (مانند دما یا سطح مواد شیمیایی)، تشخیص صدا و دادههای تراکنشهای فروشگاهی برای مدیریت هر سایتی ارزشمند هستند. دادههای این منابع را میتوان بر اساس زمان ثبت آنها (تمبرها) همگامسازی کرد. ترکیب دادههای توصیفی از منابع مختلف به معنای کسب بینش به مراتب بیشتر از آن چیزی است که میتوان تنها از یک منبع به دست آورد. پروتکلهای باز و استانداردهای صنعتی برای یکپارچهسازی بدون مشکل دادههای توصیفی ضروری هستند.
دوربین اکسیس قادر است صدای محیط را رمزگشایی و از آن دادههای توصیفی استخراج کند.
جمع بندی
در سیستمهای نظارت تصویری دوربین اکسیس، دادههای توصیفی (متادیتا) به صورت متنی توضیح میدهند که چه چیزی در ویدیو وجود دارد. این اطلاعات میتواند شامل نوع اشیاء قابل مشاهده، یا توصیفی کلی از خود صحنه باشند. همچنین ویژگیهای مرتبط با اشیاء یا صحنه را مانند رنگ خودروها و لباسها، مکان دقیق یا جهت حرکت آنها را شامل میشود. دادههای توصیفی بهصورت لحظهای، مستقیما در دوربین اکسیس یا توسط یک جزء دیگر از سیستم که قادر به تحلیل ویدیو است، ایجاد میگردد. این اطلاعات همچنین به رویدادها زمینه میدهند و امکان جستجو و مرتبسازی سریع حجم زیادی از فیلمها را فراهم میسازد. این قابلیت به سه عملکرد کلی منجر میشود.