{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Fusion Model"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Data Example"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {
    "collapsed": false,
    "jupyter": {
     "outputs_hidden": false
    },
    "pycharm": {
     "name": "#%%\n"
    },
    "tags": [
     "hide-input"
    ]
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>data_image_1</th>\n",
       "      <th>data_image_2</th>\n",
       "      <th>age</th>\n",
       "      <th>gender</th>\n",
       "      <th>subset</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>[15.063944284167968, 7.682054964381019, 59.023...</td>\n",
       "      <td>[0.6938266507355754, 0.33012221842269274, 0.74...</td>\n",
       "      <td>63</td>\n",
       "      <td>F</td>\n",
       "      <td>TRAIN_VALIDATE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>[3.434402959993343, 3.538154489514688, 23.9200...</td>\n",
       "      <td>[0.5269370477097022, 0.5903021383156715, 0.517...</td>\n",
       "      <td>45</td>\n",
       "      <td>F</td>\n",
       "      <td>TRAIN_VALIDATE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>[2.81218605232154, 0.12835273944489112, 31.237...</td>\n",
       "      <td>[0.04859035434840109, 0.12056269747039472, 0.8...</td>\n",
       "      <td>34</td>\n",
       "      <td>M</td>\n",
       "      <td>TRAIN_VALIDATE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>[15.861637079166698, 7.165088327887514, 27.786...</td>\n",
       "      <td>[0.5628110412578916, 0.5864291501407077, 0.679...</td>\n",
       "      <td>40</td>\n",
       "      <td>F</td>\n",
       "      <td>TRAIN_VALIDATE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>[6.950717959847797, 15.698030827427083, 16.615...</td>\n",
       "      <td>[0.74255727915812, 0.5960530457020161, 0.25688...</td>\n",
       "      <td>55</td>\n",
       "      <td>M</td>\n",
       "      <td>TRAIN_VALIDATE</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>495</th>\n",
       "      <td>[70.61214057454309, 1.8685573666984343, 59.460...</td>\n",
       "      <td>[0.2039033864463896, 0.3145371848607098, 0.046...</td>\n",
       "      <td>71</td>\n",
       "      <td>M</td>\n",
       "      <td>TEST</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>496</th>\n",
       "      <td>[60.37547452707624, 37.95228651809741, 53.5548...</td>\n",
       "      <td>[0.18674565141973776, 0.6019158128829427, 0.18...</td>\n",
       "      <td>64</td>\n",
       "      <td>F</td>\n",
       "      <td>TEST</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>497</th>\n",
       "      <td>[32.1526225126884, 33.922010372801886, 24.8319...</td>\n",
       "      <td>[0.10718371637388646, 0.4830662921155866, 0.69...</td>\n",
       "      <td>40</td>\n",
       "      <td>F</td>\n",
       "      <td>TEST</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>498</th>\n",
       "      <td>[45.90474661033698, 66.17473294569139, 40.4195...</td>\n",
       "      <td>[0.002235769261409337, 0.6293545349958005, 0.1...</td>\n",
       "      <td>77</td>\n",
       "      <td>F</td>\n",
       "      <td>TEST</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>499</th>\n",
       "      <td>[18.881702811342475, 4.597565571065492, 21.388...</td>\n",
       "      <td>[0.9938089200338339, 0.14282083382245703, 0.17...</td>\n",
       "      <td>56</td>\n",
       "      <td>F</td>\n",
       "      <td>TEST</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>500 rows × 5 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "                                          data_image_1  \\\n",
       "0    [15.063944284167968, 7.682054964381019, 59.023...   \n",
       "1    [3.434402959993343, 3.538154489514688, 23.9200...   \n",
       "2    [2.81218605232154, 0.12835273944489112, 31.237...   \n",
       "3    [15.861637079166698, 7.165088327887514, 27.786...   \n",
       "4    [6.950717959847797, 15.698030827427083, 16.615...   \n",
       "..                                                 ...   \n",
       "495  [70.61214057454309, 1.8685573666984343, 59.460...   \n",
       "496  [60.37547452707624, 37.95228651809741, 53.5548...   \n",
       "497  [32.1526225126884, 33.922010372801886, 24.8319...   \n",
       "498  [45.90474661033698, 66.17473294569139, 40.4195...   \n",
       "499  [18.881702811342475, 4.597565571065492, 21.388...   \n",
       "\n",
       "                                          data_image_2  age gender  \\\n",
       "0    [0.6938266507355754, 0.33012221842269274, 0.74...   63      F   \n",
       "1    [0.5269370477097022, 0.5903021383156715, 0.517...   45      F   \n",
       "2    [0.04859035434840109, 0.12056269747039472, 0.8...   34      M   \n",
       "3    [0.5628110412578916, 0.5864291501407077, 0.679...   40      F   \n",
       "4    [0.74255727915812, 0.5960530457020161, 0.25688...   55      M   \n",
       "..                                                 ...  ...    ...   \n",
       "495  [0.2039033864463896, 0.3145371848607098, 0.046...   71      M   \n",
       "496  [0.18674565141973776, 0.6019158128829427, 0.18...   64      F   \n",
       "497  [0.10718371637388646, 0.4830662921155866, 0.69...   40      F   \n",
       "498  [0.002235769261409337, 0.6293545349958005, 0.1...   77      F   \n",
       "499  [0.9938089200338339, 0.14282083382245703, 0.17...   56      F   \n",
       "\n",
       "             subset  \n",
       "0    TRAIN_VALIDATE  \n",
       "1    TRAIN_VALIDATE  \n",
       "2    TRAIN_VALIDATE  \n",
       "3    TRAIN_VALIDATE  \n",
       "4    TRAIN_VALIDATE  \n",
       "..              ...  \n",
       "495            TEST  \n",
       "496            TEST  \n",
       "497            TEST  \n",
       "498            TEST  \n",
       "499            TEST  \n",
       "\n",
       "[500 rows x 5 columns]"
      ]
     },
     "execution_count": 1,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "from models import ModalityPredictorPCA, MODELTYPE\n",
    "from generate_random_input import generate_fusion_image_input\n",
    "\n",
    "\n",
    "df = generate_fusion_image_input()\n",
    "df[\"subset\"] = [\"TRAIN_VALIDATE\"]*int(df.shape[0]/2) + [\"TEST\"]*int(df.shape[0]/2)\n",
    "\n",
    "df"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Model"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {
    "collapsed": false,
    "jupyter": {
     "outputs_hidden": false
    },
    "pycharm": {
     "name": "#%%\n"
    },
    "tags": [
     "hide-input"
    ]
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style>#sk-1c4f22cc-44b0-424d-9e41-066065109da4 {color: black;background-color: white;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 pre{padding: 0;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-toggleable {background-color: white;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 label.sk-toggleable__label {cursor: pointer;display: block;width: 100%;margin-bottom: 0;padding: 0.3em;box-sizing: border-box;text-align: center;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 label.sk-toggleable__label-arrow:before {content: \"▸\";float: left;margin-right: 0.25em;color: #696969;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 label.sk-toggleable__label-arrow:hover:before {color: black;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-estimator:hover label.sk-toggleable__label-arrow:before {color: black;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-toggleable__content {max-height: 0;max-width: 0;overflow: hidden;text-align: left;background-color: #f0f8ff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-toggleable__content pre {margin: 0.2em;color: black;border-radius: 0.25em;background-color: #f0f8ff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 input.sk-toggleable__control:checked~div.sk-toggleable__content {max-height: 200px;max-width: 100%;overflow: auto;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 input.sk-toggleable__control:checked~label.sk-toggleable__label-arrow:before {content: \"▾\";}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-estimator input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: #d4ebff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-label input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: #d4ebff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 input.sk-hidden--visually {border: 0;clip: rect(1px 1px 1px 1px);clip: rect(1px, 1px, 1px, 1px);height: 1px;margin: -1px;overflow: hidden;padding: 0;position: absolute;width: 1px;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-estimator {font-family: monospace;background-color: #f0f8ff;border: 1px dotted black;border-radius: 0.25em;box-sizing: border-box;margin-bottom: 0.5em;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-estimator:hover {background-color: #d4ebff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel-item::after {content: \"\";width: 100%;border-bottom: 1px solid gray;flex-grow: 1;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-label:hover label.sk-toggleable__label {background-color: #d4ebff;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-serial::before {content: \"\";position: absolute;border-left: 1px solid gray;box-sizing: border-box;top: 2em;bottom: 0;left: 50%;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-serial {display: flex;flex-direction: column;align-items: center;background-color: white;padding-right: 0.2em;padding-left: 0.2em;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-item {z-index: 1;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel {display: flex;align-items: stretch;justify-content: center;background-color: white;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel::before {content: \"\";position: absolute;border-left: 1px solid gray;box-sizing: border-box;top: 2em;bottom: 0;left: 50%;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel-item {display: flex;flex-direction: column;position: relative;background-color: white;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel-item:first-child::after {align-self: flex-end;width: 50%;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel-item:last-child::after {align-self: flex-start;width: 50%;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-parallel-item:only-child::after {width: 0;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-dashed-wrapped {border: 1px dashed gray;margin: 0 0.4em 0.5em 0.4em;box-sizing: border-box;padding-bottom: 0.4em;background-color: white;position: relative;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-label label {font-family: monospace;font-weight: bold;background-color: white;display: inline-block;line-height: 1.2em;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-label-container {position: relative;z-index: 2;text-align: center;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-container {/* jupyter's `normalize.less` sets `[hidden] { display: none; }` but bootstrap.min.css set `[hidden] { display: none !important; }` so we also need the `!important` here to be able to override the default hidden behavior on the sphinx rendered scikit-learn.org. See: https://github.com/scikit-learn/scikit-learn/issues/21755 */display: inline-block !important;position: relative;}#sk-1c4f22cc-44b0-424d-9e41-066065109da4 div.sk-text-repr-fallback {display: none;}</style><div id=\"sk-1c4f22cc-44b0-424d-9e41-066065109da4\" class=\"sk-top-container\"><div class=\"sk-text-repr-fallback\"><pre>StackingRegressor(estimators=[(&#x27;regressor_data_image_1&#x27;,\n",
       "                               Pipeline(steps=[(&#x27;preprocessor&#x27;,\n",
       "                                                ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 &#x27;data_image_1&#x27;),\n",
       "                                                                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                                                                 OneHotEnc...\n",
       "                                                ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 &#x27;data_image_2&#x27;),\n",
       "                                                                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                                                                 OneHotEncoder(handle_unknown=&#x27;ignore&#x27;),\n",
       "                                                                                 [&#x27;gender&#x27;])])),\n",
       "                                               (&#x27;regressor&#x27;, EMRVR())]))],\n",
       "                  final_estimator=LinearRegression())</pre><b>Please rerun this cell to show the HTML repr or trust the notebook.</b></div><div class=\"sk-container\" hidden><div class=\"sk-item sk-dashed-wrapped\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"8057dca1-51f6-42e2-bd79-d789b3304fa7\" type=\"checkbox\" ><label for=\"8057dca1-51f6-42e2-bd79-d789b3304fa7\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">StackingRegressor</label><div class=\"sk-toggleable__content\"><pre>StackingRegressor(estimators=[(&#x27;regressor_data_image_1&#x27;,\n",
       "                               Pipeline(steps=[(&#x27;preprocessor&#x27;,\n",
       "                                                ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 &#x27;data_image_1&#x27;),\n",
       "                                                                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                                                                 OneHotEnc...\n",
       "                                                ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 &#x27;data_image_2&#x27;),\n",
       "                                                                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                                                                 OneHotEncoder(handle_unknown=&#x27;ignore&#x27;),\n",
       "                                                                                 [&#x27;gender&#x27;])])),\n",
       "                                               (&#x27;regressor&#x27;, EMRVR())]))],\n",
       "                  final_estimator=LinearRegression())</pre></div></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-parallel\"><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><label>regressor_data_image_1</label></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-serial\"><div class=\"sk-item sk-dashed-wrapped\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"ceb3ca7d-6a4f-48fe-b159-afac4f9096a6\" type=\"checkbox\" ><label for=\"ceb3ca7d-6a4f-48fe-b159-afac4f9096a6\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">preprocessor: ColumnTransformer</label><div class=\"sk-toggleable__content\"><pre>ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                  FlattenNestedArray()),\n",
       "                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                  PCA(n_components=2,\n",
       "                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                  StandardScaler())]),\n",
       "                                 &#x27;data_image_1&#x27;),\n",
       "                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                 OneHotEncoder(handle_unknown=&#x27;ignore&#x27;),\n",
       "                                 [&#x27;gender&#x27;])])</pre></div></div></div><div class=\"sk-parallel\"><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"d3927274-8465-4c3f-8fe0-4be4d42f0ef8\" type=\"checkbox\" ><label for=\"d3927274-8465-4c3f-8fe0-4be4d42f0ef8\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">dimensionality_reduction</label><div class=\"sk-toggleable__content\"><pre>data_image_1</pre></div></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"3b57c048-1985-4bc5-b222-21614500169d\" type=\"checkbox\" ><label for=\"3b57c048-1985-4bc5-b222-21614500169d\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">FlattenNestedArray</label><div class=\"sk-toggleable__content\"><pre>FlattenNestedArray()</pre></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"4deb6929-414f-4927-8b96-13eaed86751d\" type=\"checkbox\" ><label for=\"4deb6929-414f-4927-8b96-13eaed86751d\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">PCA</label><div class=\"sk-toggleable__content\"><pre>PCA(n_components=2, svd_solver=&#x27;full&#x27;)</pre></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"7a98e075-5876-46a0-88f3-18b9def0e280\" type=\"checkbox\" ><label for=\"7a98e075-5876-46a0-88f3-18b9def0e280\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">StandardScaler</label><div class=\"sk-toggleable__content\"><pre>StandardScaler()</pre></div></div></div></div></div></div></div></div><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"c103af9e-c13c-40ae-b00e-dd7a0751950c\" type=\"checkbox\" ><label for=\"c103af9e-c13c-40ae-b00e-dd7a0751950c\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">gender_and_site_encoded</label><div class=\"sk-toggleable__content\"><pre>[&#x27;gender&#x27;]</pre></div></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"a3a9968a-741c-4e42-8f38-323500fdddeb\" type=\"checkbox\" ><label for=\"a3a9968a-741c-4e42-8f38-323500fdddeb\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">OneHotEncoder</label><div class=\"sk-toggleable__content\"><pre>OneHotEncoder(handle_unknown=&#x27;ignore&#x27;)</pre></div></div></div></div></div></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"8bd52cb0-ca71-4835-8d65-901f3ed2ad4f\" type=\"checkbox\" ><label for=\"8bd52cb0-ca71-4835-8d65-901f3ed2ad4f\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">EMRVR</label><div class=\"sk-toggleable__content\"><pre>EMRVR()</pre></div></div></div></div></div></div></div></div><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><label>regressor_data_image_2</label></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-serial\"><div class=\"sk-item sk-dashed-wrapped\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"3b1c96dc-e99a-4af5-b60f-93bab1885f71\" type=\"checkbox\" ><label for=\"3b1c96dc-e99a-4af5-b60f-93bab1885f71\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">preprocessor: ColumnTransformer</label><div class=\"sk-toggleable__content\"><pre>ColumnTransformer(transformers=[(&#x27;dimensionality_reduction&#x27;,\n",
       "                                 Pipeline(steps=[(&#x27;flatten&#x27;,\n",
       "                                                  FlattenNestedArray()),\n",
       "                                                 (&#x27;dimensionality_reduction&#x27;,\n",
       "                                                  PCA(n_components=2,\n",
       "                                                      svd_solver=&#x27;full&#x27;)),\n",
       "                                                 (&#x27;scaler_pre&#x27;,\n",
       "                                                  StandardScaler())]),\n",
       "                                 &#x27;data_image_2&#x27;),\n",
       "                                (&#x27;gender_and_site_encoded&#x27;,\n",
       "                                 OneHotEncoder(handle_unknown=&#x27;ignore&#x27;),\n",
       "                                 [&#x27;gender&#x27;])])</pre></div></div></div><div class=\"sk-parallel\"><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"6613b72d-1eb7-42c2-b80b-304a0404814f\" type=\"checkbox\" ><label for=\"6613b72d-1eb7-42c2-b80b-304a0404814f\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">dimensionality_reduction</label><div class=\"sk-toggleable__content\"><pre>data_image_2</pre></div></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"e04db068-577b-4001-8dca-456ece5eb15c\" type=\"checkbox\" ><label for=\"e04db068-577b-4001-8dca-456ece5eb15c\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">FlattenNestedArray</label><div class=\"sk-toggleable__content\"><pre>FlattenNestedArray()</pre></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"8311f4f2-5df9-48d9-8394-967970b91fca\" type=\"checkbox\" ><label for=\"8311f4f2-5df9-48d9-8394-967970b91fca\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">PCA</label><div class=\"sk-toggleable__content\"><pre>PCA(n_components=2, svd_solver=&#x27;full&#x27;)</pre></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"a0adf927-e0fa-41b2-81fb-fc9c89ed0a44\" type=\"checkbox\" ><label for=\"a0adf927-e0fa-41b2-81fb-fc9c89ed0a44\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">StandardScaler</label><div class=\"sk-toggleable__content\"><pre>StandardScaler()</pre></div></div></div></div></div></div></div></div><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"513e02a9-2446-4e58-b1b6-15127f4d1022\" type=\"checkbox\" ><label for=\"513e02a9-2446-4e58-b1b6-15127f4d1022\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">gender_and_site_encoded</label><div class=\"sk-toggleable__content\"><pre>[&#x27;gender&#x27;]</pre></div></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"734eb9d0-0345-461e-aba9-00cfa406a1cf\" type=\"checkbox\" ><label for=\"734eb9d0-0345-461e-aba9-00cfa406a1cf\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">OneHotEncoder</label><div class=\"sk-toggleable__content\"><pre>OneHotEncoder(handle_unknown=&#x27;ignore&#x27;)</pre></div></div></div></div></div></div></div></div><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"2a7cb29d-cc43-410c-9625-3c8fe9fefc57\" type=\"checkbox\" ><label for=\"2a7cb29d-cc43-410c-9625-3c8fe9fefc57\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">EMRVR</label><div class=\"sk-toggleable__content\"><pre>EMRVR()</pre></div></div></div></div></div></div></div></div></div></div><div class=\"sk-item\"><div class=\"sk-parallel\"><div class=\"sk-parallel-item\"><div class=\"sk-item\"><div class=\"sk-label-container\"><div class=\"sk-label sk-toggleable\"><label>final_estimator</label></div></div><div class=\"sk-serial\"><div class=\"sk-item\"><div class=\"sk-estimator sk-toggleable\"><input class=\"sk-toggleable__control sk-hidden--visually\" id=\"923c016f-82dd-42e3-9ebb-852ebf83225e\" type=\"checkbox\" ><label for=\"923c016f-82dd-42e3-9ebb-852ebf83225e\" class=\"sk-toggleable__label sk-toggleable__label-arrow\">LinearRegression</label><div class=\"sk-toggleable__content\"><pre>LinearRegression()</pre></div></div></div></div></div></div></div></div></div></div></div></div>"
      ],
      "text/plain": [
       "StackingRegressor(estimators=[('regressor_data_image_1',\n",
       "                               Pipeline(steps=[('preprocessor',\n",
       "                                                ColumnTransformer(transformers=[('dimensionality_reduction',\n",
       "                                                                                 Pipeline(steps=[('flatten',\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 ('dimensionality_reduction',\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver='full')),\n",
       "                                                                                                 ('scaler_pre',\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 'data_image_1'),\n",
       "                                                                                ('gender_and_site_encoded',\n",
       "                                                                                 OneHotEnc...\n",
       "                                                ColumnTransformer(transformers=[('dimensionality_reduction',\n",
       "                                                                                 Pipeline(steps=[('flatten',\n",
       "                                                                                                  FlattenNestedArray()),\n",
       "                                                                                                 ('dimensionality_reduction',\n",
       "                                                                                                  PCA(n_components=2,\n",
       "                                                                                                      svd_solver='full')),\n",
       "                                                                                                 ('scaler_pre',\n",
       "                                                                                                  StandardScaler())]),\n",
       "                                                                                 'data_image_2'),\n",
       "                                                                                ('gender_and_site_encoded',\n",
       "                                                                                 OneHotEncoder(handle_unknown='ignore'),\n",
       "                                                                                 ['gender'])])),\n",
       "                                               ('regressor', EMRVR())]))],\n",
       "                  final_estimator=LinearRegression())"
      ]
     },
     "execution_count": 2,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "from sklearn import set_config\n",
    "set_config(display=\"diagram\")\n",
    "\n",
    "number_components = 2\n",
    "predictor = ModalityPredictorPCA(df, [\"data_image_1\", \"data_image_2\"], MODELTYPE.FUSION,  5)\n",
    "\n",
    "model = predictor.get_fusion_at_model_level(number_components)\n",
    "model"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.12"
  },
  "widgets": {
   "application/vnd.jupyter.widget-state+json": {
    "state": {},
    "version_major": 2,
    "version_minor": 0
   }
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}