پژوهش

حوزه پژوهشی من در مرز میان هوش مصنوعی و داده‌های دنیای واقعی قرار دارد و به‌طور مشخص روی بینایی ماشین، مدل‌های زبانی بزرگ (LLMs) و سیستم‌های هوش مصنوعی چندوجهی (Multimodal) متمرکز است. علاقه اصلی من توسعه روش‌های کاربردی هوشمندی است که بتوانند سیگنال‌ها، تصاویر و متون را درک و تحلیل کنند.

برخی از موضوعات و پروژه‌های پژوهشی فعلی من عبارت‌اند از:

بینایی ماشین و پردازش سیگنال، تصویر و ویدئو

  • تحلیل زبان اشاره

  • تحلیل لحظه‌ای ویدئوهای ورزشی

  • پردازش سیگنال/تصاویر پزشکی

مدل‌های زبانی بزرگ و هوش مصنوعی چندوجهی

  • یادگیری چندوجهی مبتنی بر ترکیب متن و تصویر

  • سیستم‌های بازیابی‌–افزوده (Retrieval-Augmented)