2025.12.05

先端情報学研究科の学生が、大規模視覚言語モデル(LVLM)の能力向上を競うグランドチャレンジで4位入賞!

2025年10月27日(月)~31日(金)にアイルランド・ダブリンで開催された、マルチメディア分野のトップ国際会議 ACM Multimedia 2025 (ACM MM 2025)において、山野瑞月さん(先端情報学研究科 博士前期課程1年次)、福岡啓人さん(同博士前期課程2年次)が参加し、同会議のグランドチャレンジ LAVA 2025(Grand Challenge on Large Vision-Language Model Learning and Applications)において4位入賞を果たしました。


LAVAは、データフロー図や建築設計図など、複雑な視覚データを正確に解釈・理解するための大規模視覚言語モデル(LVLM)の能力向上を目的とした国際ワークショップです。2025年のLAVAグランドチャレンジには 387種類の手法が提出され、高い競争率の中での入賞となりました。また ACM Multimedia 2025 には約2,000人の研究者が参加しており、世界的に注目度の高い国際会議です。

受賞を喜ぶ福岡啓人さん(左)、山野瑞月さん(右)

受賞内容

発表学会

ACM Multimedia 2025 (ACM MM 2025)

受賞内容

4th place in the ACM MM 2025 Grand Challenge on Large Vision-Language Model Learning and Applications

受賞チーム

char team
山野 瑞月(先端情報学研究科 博士前期課程・1年次)
福岡 啓人(先端情報学研究科 博士前期課程・2年次)
宮森 恒(情報法理工学部 教授)

関連リンク

ACM Multimedia 2025(ACM MM 2025)

LAVA 2025(ACM MM 2025 Workshop and Grand Challenge on Large Vision-Language Model Learning and Applications)