حوزه پژوهشی من در مرز میان هوش مصنوعی و دادههای دنیای واقعی قرار دارد و بهطور مشخص روی بینایی ماشین، مدلهای زبانی بزرگ (LLMs) و سیستمهای هوش مصنوعی چندوجهی (Multimodal) متمرکز است. علاقه اصلی من توسعه روشهای کاربردی هوشمندی است که بتوانند سیگنالها، تصاویر و متون را درک و تحلیل کنند.
برخی از موضوعات و پروژههای پژوهشی فعلی من عبارتاند از:
بینایی ماشین و پردازش سیگنال، تصویر و ویدئو
تحلیل زبان اشاره
تحلیل لحظهای ویدئوهای ورزشی
پردازش سیگنال/تصاویر پزشکی
مدلهای زبانی بزرگ و هوش مصنوعی چندوجهی
یادگیری چندوجهی مبتنی بر ترکیب متن و تصویر
سیستمهای بازیابی–افزوده (Retrieval-Augmented)