画像データの視覚情報に基づく因果推論のためのテキスト因果モデルの拡張と適用 【産総研AITeC「Generative AI Study Group第40回」】
こんな方におすすめ
- 因果推論に興味がある方
- 機械学習と因果推論の融合に関心がある方
- 画像認識や視覚情報処理を研究・業務で活用されている方
- マーケティングや広告分野でのデータに基づいた意思決定に関心がある方
- Vision Transformer (ViT) や最新の画像認識技術について関心がある方
本文
こんにちは!GASG(Generative AI Study Group)主催者の杉山です。
https://www.ai-tech-c.jp/generative-ai-study-group-gasg/
第40回となる今回は、画像データの視覚情報に基づく因果推論という研究に焦点を当てた研究会を開催いたします。
本研究は、慶應義塾大学の清水駿太氏によるご研究で "Causal Effects of Linguistic Properties" および "Adapting Text Embeddings for Causal Inference" の既研究より着想を得、画像分野に適用した因果推論研究です。
研究会では、清水氏のご研究の紹介とともに下記テーマについて論じていただきます。
因果推論の基礎:
処置(T)によるアウトカム(Y)の平均因果効果(ATE)の定義
共変量(C)の影響を考慮するためのバックドア調整公式の活用
視覚情報の因果関係への適用:
画像データの「高級感」が購買効果に与える影響を分析
代理ラベルを用いた撮影者の意図する特性の推定手法
提案手法:
T-boost: 代理ラベルの精度を向上させるための分類器の訓練
I-adjust: 事前学習済みのVision Transformer (ViT)を用いた視覚的特性の抽出とATEの計算
実験結果と考察:
共変量の影響が大きい場合に有効な手法であることを実証
データ拡張や再構成損失の導入によるモデルの汎化性能の向上
Vision Transformer (ViT) の紹介:
自然言語処理で成功を収めたTransformerを画像認識に応用したモデル
EVAとEfficientViTなど、最新のViTモデルの紹介
timmライブラリ:
事前学習済みのViTモデルを簡単に利用できるライブラリ
開催概要
日時: 2025年2月4日火曜日 19:00~
場所: オンライン開催(Zoom)
参加費: 無料
ご参加のメリット
画像データと因果推論の新しいアプローチを学ぶことができます。
最新の画像認識技術とその応用事例を知ることができます。
新しいアイデアやコラボレーションの機会を得ることができます。
どなたでもご参加いただけますので、ぜひお気軽にご参加ください。皆様のご参加を心よりお待ちしております。