【ビジョンと自然言語処理】AlexNetから10年──深層学習によるビジョン&ランゲージ分野への展開──
Vol.105 No.5pp.418-423
発行日:2022/05/01
Online ISSN:2188-2355
Print ISSN:0913-5693
種別:特集 深層学習は情報・システムの研究をどう変えたか
専門分野:
キーワード:
マルチモーダル, クロスモーダル, Transformer, 表現学習,
本文:PDF(398.8KB)>>
あらまし:
2012年,物体認識の精度を競い合う国際ワークショップILSVRCにおいて,Hinton教授の率いるチームが開発したAlexNetが驚異的な性能を発揮して優勝した.これは深層学習の力を世界に知らしめる象徴的な事件として語られ,当時ILSVRCに継続的に参加していた筆者も衝撃を受けた.この頃,筆者はコンピュータビジョンと自然言語処理を融合させる研究を同時に開始していたが,このような計算機科学分野内での融合研究にも深層学習の影響は多大なものとなった.本稿では,筆者らの研究事例に触れつつ,深層学習普及の前後でのこうした融合分野の研究の変遷や,今後の展望について解説する.