بازدید: 1476

ژوهشگران دانشگاه علم و صنعت با همکاری محققانی از دانشگاه "لون" بلژیک سیستمی برای تحلیل محتوایی صوتی و تصویری ارائه کردند که قادر است در میان انبوهی از ویدئوها، ویدئوی مورد نظر را جستجو کند، ضمن آنکه امکان رصد اتوماتیک ویدئو نیز در آن دیده شده است.

محمدمهدی ارزانی از محققان طرح در گفت‌وگو با ایسنا،زمینه تحقیقات این تیم تحقیقاتی را پردازش صوت و تصویر عنوان کرد و گفت: محصولی که ما در این مطالعات عرضه کردیم، دستگاه تحلیل معنایی بینایی است؛ به این معنی که این سیستم هر معنای ویدئویی که به آن داده می‌شود آن را تحلیل می‌کند ضمن آنکه هر آنچه را که در ویدئو رخ دهد، آن را آنالیز خواهد کرد.

وی تعیین دسته‌بندی کلی ویدئو را از دیگر قابلیت‌های این سیستم نام برد و اظهار کرد: این سیستم با تحلیل ویدئو قادر است دسته‌بندی فیلم را در رده‌های ورزشی، حیات وحش و سایر دسته‌ها تعیین کند و حتی اتفاقات جدیدی را که در ویدئو رخ داده باشد نیز اعلام می‌کند.

ارزانی به بیان کاربردهای این سیستم اشاره کرد و یادآور شد: یکی از کاربردهای سیستم «تحلیل معنایی ویدئو» برای حوزه‌هایی چون صدا و سیما و یا سایت‌هایی مانند آپارات است که آرشیوهای صوتی و تصویری بزرگی را در اختیار دارند.

این محقق اضافه کرد: این حوزه‌ها دارای محتوای زیاد صوتی و تصویری هستند و در صورتی که ویدئوها برچسب مناسبی نخورده باشند، پیدا کردن محتوای مد نظر از میان حجم عظیم ویدئوها و فایل‌های صوتی غیر ممکن است.

وی با بیان اینکه موتورهای جستجو تنها بر مبنای جستجوی متن کار می‌کنند، خاطر نشان کرد: بر این اساس ما سیستم تحلیل معنایی را طراحی و پیاده‌سازی کردیم و این سیستم محتوای متنی کار جستجو را انجام می‌دهد.

ارزانی به بیان جزئیات این سیستم پرداخت و توضیح داد: این سیستم پس از دریافت ویدئو، همه مفاهیم را در آن می‌بیند و در قالب متن ارائه می‌کند و از این طریق جستجوی ویدئو از طریق متن میسر می‌شود.

وی پایش محتوا را از دیگر کاربردهای سیستم ذکر کرد و یادآور شد: در حال حاضر شبکه‌های مجازی و اجتماعی رو به ازدیاد است و موارد ممنوعه‌ای مانند خشونت، مواد مخدر و سایر محتوای غیر اخلاقی دیگر در حال رد و بدل شدن است، از این رو امکان رصد دستی این محتوا وجود ندارد.

این محقق با تاکید بر اینکه این سیستم می‌تواند به صورت اتوماتیک کار رصد را انجام دهد، گفت: این سیستم با استفاده از یک سرور قوی می‌تواند کاری که توسط چند نفر انجام گیرد، به تنهایی انجام دهد.

ارزانی همچنین به اجزای این سیستم تحلیل ویدئو اشاره و اظهار کرد: این سیستم شامل یک نرم‌افزار است که بر روی سخت‌افزار کارت گرافیکی نصب می‌شود و قادر است حجم زیادی از صوت و تصویر را پردازش کند.

وی با تاکید بر اینکه در حال حاضر 8 هزار مفهوم در آن بارگذاری شده است، اضافه کرد: امکان افزودن داده‌های جدید در این سیستم وجود دارد؛ به این صورت که برای کاربران امکانی فراهم شده تا بتوانند مفاهیم جدید را تعریف کنند.

ارزانی با بیان اینکه فناوری این سیستم در اختیار 4 شرکت بزرگ است، گفت: شرکت‌های IBM، گوگل و ماکروسافت این سیستم را پیاده سازی کردند و ایران نیز همزمان با این فعالیت‎ها در دنیا وارد این حوزه شده است.

وی در پایان با بیان اینکه از این طرح دو شرکت در ایران و بلژیک تاسیس شد، گفت: این پروژه با همکاری محمدحسن بهاری و علی دیبا از دانشگاه لون (KU Leuven) بلژیک اجرایی شده است.