Мухаммад Мааз сидел за своим столом и что-то писал, когда пришло электронное письмо. Профессор Иэн Рид, заведующий кафедрой компьютерного зрения Университета искусственного интеллекта имени Мохаммеда бен Зайда (MBZUAI), не смог сдержать волнения, сообщив новость о том, что Мааз был выбран кандидатом наук Google в области машинного восприятия в 2025 году, что сделало его первым исследователем из региона Персидского залива, получившим престижное признание.
“Я просто сидел там, ошеломленный”, – сказал Мааз в интервью Khaleej Times. “Это был один из тех редких моментов, когда понимаешь, что годы напряженной работы наконец-то приносят свои плоды”.
В рамках программы Google PhD Fellowship, которая проводится уже 16-й год, было отобрано 255 аспирантов по всему миру из тысяч кандидатов в 35 странах и 12 научных областях. Университеты могут номинировать только четырех студентов каждый, что делает отбор очень конкурентным. Стипендия предусматривает ежегодное финансирование в размере 85 000 долларов, наставничество в Google Research и подключение получателей к глобальному исследовательскому сообществу.
Достижения Мааза бросают вызов устоявшемуся представлению о региональной утечке мозгов, когда ведущие исследователи покидают Ближний Восток в поисках возможностей за границей. Вместо этого он представляет талант, который предпочел Абу-Даби отъезду.
“Пройдя стажировку в Кремниевой долине, я могу с уверенностью сказать, что разрыв между Абу-Даби и мировыми исследовательскими центрами быстро сокращается”, – сказал Мааз. “Учитывая возможности, которые у нас есть здесь, все зависит от того, насколько мы решим их использовать”.
Его исследования направлены на то, чтобы научить машины не просто видеть, но и понимать то, что они наблюдают, и обмениваться информацией о том, что они наблюдают. “Представьте себе чат, но только для видео”, – объяснил он. “Вы можете загрузить клип, задать вопросы о том, что происходит, или запросить резюме и информацию”.
Эти мультимодальные модели на больших языках могут трансформировать приложения от автоматизированного анализа видео и наблюдения до образовательных инструментов и функций обеспечения доступности для людей с нарушениями зрения. “Мир вокруг нас визуален — мы живем в движении и взаимодействии”, – сказал Мааз. “Моя цель – помочь машинам разобраться в динамичном визуальном мире”.
Что отличает MBZUAI от других
До прихода в MBZUAI в 2020 году Мааз работал в Confiz Limited и Hazen.ai, специализируясь на задачах компьютерного зрения, включая системы обнаружения лиц и нарушений правил дорожного движения. Пять лет спустя Абу-Даби чувствует себя как дома.
Мааз подчеркнул, что отличительной чертой MBZUAI является структура наставничества. Профессора руководят небольшими исследовательскими группами, обеспечивая прямое руководство, которое даже престижные лаборатории США и Европы с трудом могут предложить в таких масштабах. “Система поддержки здесь позволяет исследователям работать, не отвлекаясь”, – говорит он.
MBZUAI, основанный в 2019 году с 5%-ным уровнем приема, в этом году зарегистрировал 403 студента из более чем 8000 претендентов. Мааз – первый, кто получил стипендию Google PhD Fellow.
Это достижение имеет значение, выходящее за рамки личных достижений. “То, что я первым из МБЗУАИ и региона получил эту стипендию, означает, что моя работа теперь представляет все, что здесь возможно”, – сказал Мааз. “Это мотивирует меня устанавливать более высокую планку не только для себя, но и для тех, кто придет следующим”.
Отвечая на вопрос о том, что отличает Абу-Даби от других стран в плане привлечения и удержания научных кадров, Мааз сказал: “Это достижение было бы невозможно без видения руководства ОАЭ и той среды, которую создал MBZUAI”, – сказал он. “Лучший способ, которым я могу отплатить, – это максимально использовать эти возможности и стремиться проводить исследования, которыми может гордиться регион”.
