データサイエンス学
Immersive Data Science
バーチャル空間における観測・介入・因果構造の学習
What is Data Science?
ノートテイキング
まず、次の3つについて考えてみよう
Q1 自分が実現したいことは、何か?
テーマ・アプリ・サービス・社会課題、なんでも。動詞で書ければベスト。
Q2 そのために、どんなデータが必要か?
「人の行動? 映像? センサ値? アンケート?」— 観測したいモノを具体的に
Q3 そのデータは、本当に取得可能か?
誰が持っている?/どうやって取る?/コスト・倫理・時間は?
機材:センサ・カメラ・マイク・VR/ARデバイス・脳波計・視線計測器・スマホ/IoT・API / そのデータは「測れる機材」が手元にあるか?
Nakamura学生時代 — 衛星通信の電波を測る
研究室との出会い
- 大学4年:衛星通信 × ゲリラ豪雨が電波に与える影響を分析する研究室へ
- コンピュータが嫌いだった(使いにくい、ユーザの気持ちを考えてくれない)
- プログラミング経験ゼロ
気付き:観測できるモノが 時系列データ
アンテナ → 受信電力・ノイズ・降雨減衰を 時刻ごとに記録
センサ・カメラ・マイクで 連続的に観測できるモノ が、時系列データになる
初プログラミング
- Excelで手作業の分析が大変すぎた → 「自動化したい」だけでコードを書いた
- 本来は 6ヶ月分 の時系列データ分析で十分だったが、自動化したことで 3年分 も解析できた(修士の学生を超えた)
DS基礎 時系列データとは?
時間とともに変化する値を、時刻つきで並べたデータ。
例:気温、株価、心拍、降雨量、受信電力、Web アクセス数 …
- 時刻順に並んでいるから、変化・トレンド・周期が見える
- DSの基礎:回帰=過去から未来の電波レベルを予測 / 分類=波形を減衰パターンに判別(無降雨/軽雨/豪雨)
Nakamura学生時代 — 生体情報を測る
領域:Human-Computer Interaction (HCI)
人とコンピュータの間の相互作用を研究する分野。
コンピュータをどう設計すれば、人が自然に・効率的に・気持ちよく使えるか を、人間側(認知・行動・身体)から考える。
- ヒューマンインタフェース — 画面・入力デバイス・音声 UI 等、人と機械の接点の設計
- グループウェア / CSCW(協調作業支援)— 複数人がコンピュータを介して共同作業する仕組み
生体情報の計測 — 内部状態を観測する
不快感で低下
+ 脳波(Brain waves)/ 身体動作
NUI — Natural User Interface
Nakamura学生時代 — 生体情報を測る
領域:Human-Computer Interaction (HCI)
人とコンピュータの間の相互作用を研究する分野。
コンピュータをどう設計すれば、人が自然に・効率的に・気持ちよく使えるか を、人間側(認知・行動・身体)から考える。
- ヒューマンインタフェース — 画面・入力デバイス・音声 UI 等、人と機械の接点の設計
- グループウェア / CSCW(協調作業支援)— 複数人がコンピュータを介して共同作業する仕組み
生体情報の計測 — 内部状態を観測する
不快感を感じると低下する
+ 脳波(Brain waves)/ 身体動作
応用:マルチメディア自動処理
テキスト・映像・音楽 × Focused / Excited など状態推定
→ ユーザの意図・気持ちを推定し、自動処理に反映
代表事例:Ghost-Tutor
視線・眼球運動に基づく自学習支援システム
個人の学習ペースを考慮した支援を実現
Nakamura研究例 — GhostTutor の仕組み(視線で 集中度 を測る)
上:眼球運動の時系列(60秒)/下:視線軌跡 — 左=非集中(疎で大きな動き) / 右=集中時(細かく密)
視線パターン × 集中度
- 集中しているとき:目から情報を得ようとして、視線を 絶えず細かく動かす(密で素早い動き = 固視微動)
- 集中していないとき:目の動きが 減り、動きも大きく なる(大きな サッケード)
- 瞬きの頻度・視線移動速度・軌跡 から 集中度を推定
GhostTutor の動作
左:学習用ビデオ / 右:視線・瞬き・速度・軌跡の計測結果
推定した集中度に応じて 映像を自動制御 / 集中していないと判定したら再生停止+アラーム
データ取得(視線の時系列) → 分析(固視微動/サッケードのパターン抽出) → 数式化(学習状況を識別するためのモデル化) → 実装(集中/非集中の自動判定 + 映像制御)
Nakamura研究例 — 脳波で「驚き」を捉える
EEG サンプル — 驚き刺激と脳波の同期変化
集中・驚き × 脳波
- 集中しているとき → 脳波の α 波領域が減衰 する(α 減衰)
- 驚いたとき → 脳波の β 波領域が突発的に上昇 する
Nakamura研究例 — MindStudio(リプレイ映像の自動生成)
カメラマンが簡易脳波計を装着して撮影中
システムのしくみ
- カメラマンが 簡易脳波計(EEG ヘッドセット) を装着
- カメラで撮影しながら、脳波を常時記録
- 「お!」と驚いた瞬間 → 脳波の β 波が突発上昇 → ハイライト候補としてタイムスタンプ
- 「決定的瞬間」を 言葉や手動操作なし で印付け
従来との違い
従来:撮影後に 人がレビュー してハイライトを切り出す(時間がかかる)
MindStudio:撮影しながら 脳波が自動でマーキング
Nakamura研究例 — MindStudio(自動生成された映像)
MindStudio が自動生成したリプレイ映像(脳波ハイライトのみを連結)
意義
カメラマンの 無意識の「お!」 がそのまま編集判断になる
時系列データ(EEG) × 分類(驚き/非驚き) × メディア処理 が 実用システム になった例
つまり…
「観測できる生体情報」を 時刻つきで束ねる と、
人間の主観的体験 までデータ化できる
データ取得(脳波の時系列) → 分析(α 減衰/β 突発上昇のパターン抽出) → 数式化(集中・驚きを識別するモデル化) → 実装(集中/驚きの自動判定)
Notion に画像として貼り付ける
Nakamura25年前から、すでに データサイエンス していた
科学者が当たり前にやっていることだ。
「データサイエンス」と聞いたとき、何を言っているんだろう?という気持ちになった。
① データ取得
世界を 観測可能 なものに変える
- カメラ(画像・映像 / 視線)
- センサ(脳波・心拍・温度・加速度・GPS)
- マイク(音声・環境音)
- ログ/API(Webアクセス・購買・SNS)
- 実験・アンケート(人手で集める)
→ 「測れる機材があるか」が出発点
② パターン発見
データの中に 規則性 を見いだす
- 可視化(散布図・時系列プロット・ヒストグラム)
- 統計(平均・分散・相関・分布)
- 主成分分析(PCA — たくさんの項目を、データの違いがよく見える少数の軸に要約)
- クラスタリング(似たものをグループ化)
→ 「データのどこに意味があるか」を見抜く
③ モデル化(数式)
パターンを 数式(モデル) に落とし込む
- 回帰 — 連続値を予測する数式
例:気温→電力需要、視線速度→集中度 - 分類 — カテゴリに割り当てる数式
例:脳波→驚き / 非驚き、顔→喜怒哀楽 - シミュレーション(再現・what-if)
→ 再現・説明・予測 ができる形にする
いまの DS の中心 は、③ モデル化 を 機械学習・深層学習 が担うこと。
→ 次のスライドで「モデル = 関数」とは何かを整理する
データ分析や機械学習プロジェクトの 標準プロセス — CRISP-DM
業界・分野を問わず使われる データ分析プロジェクトの標準サイクル。
6つの工程を 反復 しながらモデルを磨き上げる。
- Business Understanding — 何を解きたいか/成功基準を定義
- Data Understanding — 集めたデータを眺める/品質を確認
- Data Preparation — 欠損補完・正規化・特徴量設計(最も時間を使う)
- Modeling — 回帰・分類・クラスタリングなど数式に落とす
- Evaluation — 目的に対して妥当か検証する(精度だけでなく業務適合)
- Deployment — 実環境に組み込み・運用・継続改善
矢印が双方向なのがポイント — Modeling から Data Preparation に戻る、Evaluation から Business Understanding に戻る のは日常茶飯事。
一直線ではなく 行ったり来たり しながら問題理解と実装を同時に深める。
出典:CRISP-DM 1.0(Chapman et al., 2000) — 25年経っても基本構造はそのまま使われている。
13「何を入れて、何が出る」モデル? を Notion に
そもそも「モデル」って何?
実空間で データを取る のは、なぜ難しいか
これまでの私の研究 — 実空間データ
- カメラ・センサ等が必要
- 設置・校正コストが高い
- 照明変化や遮蔽など 制御不能な要因 が多い
- 安定したデータ品質の維持が困難
- 多人数・長時間・多拠点への展開がスケールしない
これまでの研究の流れ
実空間 データ取得・分析
→
仮想空間 データ取得・分析
→
仮想空間 因果推論・介入設計・AI開発
仮想環境・VR装置を データ取得の手段 へ
事例:ドラッグストアに 数百台のカメラ を設置して購買行動を分析
- 1店舗に 100〜300台 のカメラ+POS・棚センサを設置
- 視線・動線・滞在時間・手の動き・購買 を全てログ化
- 映像保存・伝送・処理に GPU クラスタ + 大容量ストレージ
- 同意・プライバシー対応・法務 が常時必要
- 1チェーン展開で 数千万〜億円規模 のシステム投資
● = カメラ(数百台)/ 視線・動線・滞在時間・手の動き・購買 をすべてログ化
実空間で「人がどう振る舞うか」を観測しようとすると、機材・運用・法務の全方位に大規模システム が要求される。
→ 個人・中小研究室では現実的に手が出せない。だから バーチャル空間 へ。
実空間 → バーチャル空間
最も興味があったものを Notion に記載
バーチャル空間でデータサイエンス事例 —VRチアダンス
バーチャル空間でデータサイエンス事例 —河川ゴミの可視化、ゴミ回収会議
バーチャル空間でデータサイエンス?事例 —VR エンタメ環境
バーチャル空間でデータサイエンス事例 —バーチャル旅行体験
バーチャル空間でデータサイエンス事例 —バーチャル展示会
バーチャル空間でデータサイエンス事例 —SpaceTimePlayer
バーチャル空間でデータサイエンス事例 —武蔵野大学100周年記念イベント
バーチャル空間でデータサイエンス事例 —プレゼンテーションルーム
バーチャル空間でデータサイエンス事例 —バーチャル空間と実空間の融合
バーチャル空間でデータサイエンス事例 —VR拍手サイバーフィジカルシステム (CPS)
バーチャル空間でデータサイエンス事例 —Mixed Reality 空間
バーチャル空間でデータサイエンス事例 —MR × ショート動画
バーチャル空間でデータサイエンス事例 —MR パーソナルカラー
解決方法を Notion に書く
バーチャル空間でデータサイエンスする際の 障壁
やりたいこと
仮想環境上での ユーザの言動データ(移動・視線・操作・発話・滞在)を取得し、DS 手法で分析・モデル化 したい。
壁
仮想環境を ゼロから構築 するのに膨大なコスト:
Unity / Unreal Engine / WebXR (HTML・JavaScript) /
3Dモデリング・テクスチャ・物理演算・ネットワーク同期・配信 …
技術・時間・人材・資金 のすべてが要求される
結果
データ取得以前に、環境構築だけで数ヶ月〜数年 かかり、
研究の本質であるデータ分析へ到達できない。
環境構築コストが大きく、研究の本質であるデータ分析に到達できない。
バーチャル空間でデータサイエンス事例 —既存のバーチャル空間プラットフォームを利用
バーチャル空間でデータサイエンス事例 —有明キャンパスのデジタルツイン
しゃべるだけ・書くだけ で 3D 空間が生まれる
従来:空間作りに数週間〜数ヶ月
- モデリング・テクスチャ・ライティング・スクリプティング
- GLB/glTF を手作業で配置・調整
- データ取得以前に研究が止まる
いま:音声・テキストで自動生成
- 「夜の図書館を作って」「商店街を再現して」と話すだけ
- LLM が意図を解釈 → 3D オブジェクト・空間を自動配置
- テキスト入力でも同様 — すぐ歩き回れる
- 構成:LLM × プロンプトエンジニアリング × WebXR
→ 仮想空間制作のコストが 崩壊。
ようやく データサイエンス側に時間を使える ようになった。
バイブコーディングで、アイディアが "動くカタチ" になる
かつて:作りたくても、作れなかった
- 言語の文法・環境構築・エラー対応を 何年もかけて習得
- アイディアがあっても 完成まで遠かった
いま:話す・指示するだけ
- 「こんなアプリが欲しい」と伝えると AI が一緒にコードを書く
- 動かす → 直す → また動かす を 圧倒的なスピードで
- 専門家でなくても アプリ・ゲーム・3D 空間 を作れる時代に
→ 情報工学とは、アイディアをカタチにする力。
想像したものを、自分の手で現実に動かせる。
AIコーディングで空間自動生成
Dimensio データ可視化
バーチャル空間でデータサイエンス事例 —VRバーチャル教室
バーチャル空間でデータサイエンス事例 —VRゼミ
バーチャル空間でデータサイエンス事例 —VRミュージックライブ
バーチャル空間でデータサイエンス事例 —1000アバター同時接続
バーチャル空間でデータサイエンス事例 —リアルタイム多言語翻訳
バーチャル空間 × AI は 相性がいい
- テキスト・音声・映像が すべてデジタル なので AI が即座に処理できる
- AI が 介入しやすい(翻訳・要約・サポート・案内)
- ユーザの行動や発話も 自動でログ化 → DS と直結
本事例:生成AI 連携
- 音声をリアルタイム文字化
- 生成AI で 多言語翻訳・要約
- VR空間内で 字幕として即時表示
最も興味のあった作品を Notion に記述
バーチャル空間でデータサイエンス事例 —VR 広告分析
これからの データサイエンス は …
これからの データサイエンス は AIドリブン
これまでの DS
- データを 集める
- データを 分析する
- 傾向・規則性を 見つける
- 未来を 予測する
→「データから 知識 を得る」ことが中心
これからの DS(AI 時代)
- AI が 学習しやすい環境 を作る
- AI が 世界を理解 できるようにする
- AI が 推論・行動 できるようにする
→「AI の知能そのものを設計する」学問へ
今の DS は 3 つの層 で考えると分かりやすい
AI を 使う DS
- AI 分析・AutoML
- LLM 活用・可視化支援
- 業務支援
AI を 道具として活用 する段階。
すでに多くの企業で普及
AI を 育てる DS
- 高品質データ / マルチモーダルデータ
- シミュレーション / Synthetic Data
- 評価設計 / 人間-AI 相互作用
AI が学習しやすい データ・環境・評価 を設計。
現在もっとも重要
AI そのものを 進化させる DS
- World Model / 因果推論
- Embodied AI / Agent
- 長期記憶 / 空間理解 / 時間理解
← 私の研究はここ寄り
(VR × 因果 × アバタ × 反実仮想 × 空間行動理解)
LLM に加えて、Physical AI / Spatial AI / World Model / Embodied AI へ研究が広がっている。
たとえ話で Notion に説明
既存 LLM の 限界 — 相関は分かる、因果は分からない
古典例:国民1人あたりの チョコレート消費量 と ノーベル賞受賞数
観測:チョコレートをよく食べる国ほど、ノーベル賞受賞者が多い (Messerli, NEJM 2012)
でも:チョコを食べても、ノーベル賞は取れない
→ 真の原因は 国の経済水準・教育投資。
豊かな国はチョコ消費も多く、研究にも投資できる ── 共通原因(交絡因子)。
これが「相関 ≠ 因果」の典型例
既存 LLM が学べる範囲
P(Y | X) — 観測データの同時分布から取れる 相関パターン。
「チョコレート消費とノーベル賞は相関する」とは 知っている。
だが なぜ・本当の原因は何か は分からない。
LLM に欠けているもの
- 介入(do(X))を実行できない
- 反実仮想を物理的に試せない
- 「もしチョコ消費だけ増やしたら」の世界を観測できない
- → 因果関係を本質的に区別できない
バーチャル空間 × AI は 本質的に相性がいい
バーチャル空間が 提供できる
- 完全な状態観測 — 位置・姿勢・視線・操作・発話 すべて
- 自由な介入 — 環境・条件・他者の振る舞いを任意に変えられる
- 無限の再現性 — 同一シナリオを何度でも、do(X) ごとに
- すべて デジタル なので AI が即座に処理できる
AI が 要求する もの
- 大量のデータ・反復実験
- do(X) 介入 による因果学習
- 連続的な観測 → 状態モデル 構築
- 安全に試せる失敗 の場
実空間では不可能なことが、バーチャル空間ではすべて成り立つ。
バーチャル空間で AI を育てる = Immersive Data Science
VR 内で完結する DS サイクル
実空間以上の精度 → 介入
do(X) → 反実仮想
counterfactual → モデル化
因果モデル / 世界モデル
ポスト LLM 時代のテーマ
それが Immersive Data Science。
IDS は LLM の次の層 — 世界を理解する AI へ
既存 LLM が得意な領域
P(next token | context)
- 次の単語予測 / テキスト生成
- 要約・知識検索・会話
- コード生成
本質:巨大化されたパターン補完。物理法則・身体運動・動的因果は 言葉として知っている だけで、本当には扱えない。
IDS が扱う領域
P(Y | do(X)) — Pearl 系の因果推論
- 状況理解(空間・運動・時系列)
- 因果推論 / 反実仮想(counterfactual)
- インタラクティブ介入(do(X))
- 身体・空間理解
- 人間同士の相互作用
例:「もしディフェンスを 30cm 寄せたら?」 — 単なる予測ではなく 介入推論。
AI 研究の進行方向
言語 → Multimodal
画像・音声 → Agent
行動 → World Model
世界理解 → Causal Model
因果理解 → Embodied AI
身体性
↑ IDS はこの領域 — World Model + Causal AI + Embodied AI + Simulation AI の統合
LLM × World Model × Causal Model × RL/Agent × VR の統合へ。
IDSの概念から、
具体的な実装 へ
IDS事例 — バスケットボール 1on1 因果シミュレーション
因果モデルで何ができるか
- 「もし ディフェンスがあと半歩寄っていたら」
- 「もし このタイミングでクロスオーバー していたら」
- などの 反実仮想 をその場で再生
仕組み
- 単眼映像から 姿勢・位置・速度 を推定
- 選手間の 因果関係(距離・角度・タイミング)を構造化
- VR空間で do(X) 介入を実行 → 結果を可視化
→ 「観測 → 介入 → 反実仮想」を VR内で完結。
コーチングや自律学習支援への応用が可能。