باشگاه کاربران روماک

نسخه‌ی کامل: تشخیص اشخاص و اشیای داخل ویدئوها در گوشی های اندرویدی
شما در حال مشاهده‌ی نسخه‌ی متنی این صفحه می‌باشید. مشاهده‌ی نسخه‌ی کامل با قالب بندی مناسب.
گوشی های اندرویدی به قدری هوشمند می‌شوند که اشخاص و اشیای داخل ویدیوها را تشخیص دهند.

[تصویر:  do.php?img=2935]
به لطف الگوریتم های یادگیری ماشینی ، گوشی های هوشمند پیشرفت مناسبی برای هوشمندتر شدن داشته‌اند و قطعا مدل‌های جدیدی که در این عرصه عرضه می‌شوند، قابلیت های بسیار جذا‌ب‌تری از نسل های پیشین خود دارند و خواهند داشت. کمپانی گوگل نیز طی چند ماه گذشته، نشانه‌های جالبی از این که تلفن های همراه هوشمند در آینده قادر به انجام چه وظایف فوق‌العاده‌ای هستند، به رسانه‌ها نشان داده است.

به عنوان مثال شما در نرم افزار مدیریت تصاویر گوگل PHOTOS مشاهده کرده‌اید که چگونه این اپلیکیشن به طور هوشمند می‌تواند تصاویر را دسته‌بندی کرده و بدون نیاز به دخالت کاربر، آنها را در موضوعات خاص، طبقه‌بندی می‌کند. یا به طور مثال در دستیار صوتی هوشمند اندروید دیده‌اید که چگونه الگوریتم‌های این برنامه می‌توانند با تشخیص و زیر نظر گرفتن رفتار کاربر، الگوهای مصرف او را پیش‌بینی کرده و با انجام یک سری تنظیمات خودکار و بدون دخالت کاربر، روند انجام وظایف روزانه را تسریع ببخشد.
اینها همه به لطف فناوری یادگیری ماشینی و این که نرم افزارها و اپلیکیشن‌های هوشمند می‌توانند موارد جدیدی را بر مبنای اطلاعات دریافتی از سوی کاربر به بانک اطلاعاتی خود اضافه کنند، ممکن می‌شود. حالا طبق گزارشی که ساعاتی پیش منتشر شده است، گویا گوگل قصد دارد امکان بهره‌گیری از این هوش مصنوعی در دنیای ویدیوها را به توسعه‌دهندگان شخص ثالث اندروید نیز اهدا کند و احتمالا با عملی شدن این تصمیم، شاهد عرضه‌ی ابزارها و اپلیکیشن‌های بسیار جذابی در این زمینه خواهیم بود.

این تنها شروع عرضه‌ی یادگیری ماشینی در دنیای اسمارت فون‌هاست
این رابط توسعه‌ی جدید که از آن تحت عنوان Video Intelligence API یاد می‌شود، قادر است که اشیا و اشخاص داخل فایل‌های ویدیویی را شناسایی کند، آنها در دسته‌بندی‌های متفاوت قرار دهد و حتی قابلیت جست و جو در میان آنها را فراهم نماید. این قابلیت‌ها پیش از این برای تصاویر ثابت و عکس‌ها در دسترس بودند و انتظار میرفت که به زودی، گوگل امکان استفاده از آنها را در فایل‌های ویدیویی نیز امکان‌پذیر کند؛ جالب است بدانید که تغییرات صحنه در کلیپ ویدیویی نیز در این رابط نرم افزاری قابل تگ‌گذاری خواهند بود.

البته لازم به ذکر است که این تنها بخش کوچکی از قابلیت‌های فناوری یادگیری ماشینی در دنیای فایل‌های چند رسانه‌ای خواهد بود و مطمئنا با ارائه‌ی آن توسط گوگل، اسمارت فون های اندرویدی قادر خواهند بود با تشخیص اشیای مختلف در ویدیوها، امکانات جالب توجهی را در آینده در اختیار کاربران قرار دهند.