ISBN 9784320125483
コンピュータビジョン最前線 Summer 2023
【最新動向サーベイ】 ・イマドキノ拡散モデル:拡散モデルに関する最近の研究動向を紹介。基本技術、条件付き生成への拡張、生成の高速化について述べ、拡散モデルを学ぶうえで役立つリソースを紹介。 【論文フカヨミ】 ・フカヨミCLIP:2020年にOpenAIの研究グループによって提案されて以降、さまざまなタスクで利用される基盤モデルとなっているCLIPについてフカヨミ。 ・フカヨミマテリアル画像キャプション生成:近年の代表的な画像キャプション生成手法の概要と課題、そしてその課題を解決するために筆者らがECCV2022で提案した高速かつ高精度な画像キャプション生成手法“GRIT”について解説。 ・フカヨミジェスチャー動画生成:これまでのジェスチャー動作生成手法に関する研究を分類しながら、主要技術と残された課題に触れ、その課題に取り組んだDisCoについての論文およびBEATについての論文の2本をフカヨミ。 【チュートリアル】 ・ニュウモン深層照度差ステレオ法:照度差ステレオ法の基本的な原理と、照度差ステレオ法の研究で現在主流となっているデータ駆動型の手法をわかりやすく解説。 その他、4コマ漫画「ふたり大学生」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。 巻頭言(日浦慎作) イマドキノ拡散モデルー画像生成の世界を変えた魔法の舞台裏ー(石井雅人) フカヨミCLIP-おおざっぱなCLIPを目利きに育てる!-(品川政太朗) フカヨミ画像キャプション生成ーCNNは不要? Transformerですべて解決!-(菅沼雅徳) フカヨミジェスチャー動作生成ー複雑かつ曖昧で不確実な対話の世界!-(岩本尚也) ニュウモン深層照度差ステレオ法ー照明を操り形状を復元!その最新研究に迫る!-(山藤浩明) ふたり大学生(鉄分@Tetuboooon) CVイベントカレンダー
この本がどの学習段階で役立つかは、 関連する ロードマップ から確認できます。