超越大腦：AI能讀取你的思維－真的

Find AI Tools in second

Find AI Tools

No difficulty

No complicated process

Find ai tools

Home AI News TW 超越大腦：AI能讀取你的思維－真的

Updated on Mar 07,2024

超越大腦：AI能讀取你的思維－真的

概述

人工智慧的發展取得了令人驚嘆的成就，現在甚至能夠讀取我們的大腦活動並看到我們當下正在看的東西。最近，一篇名為「超越大腦的視覺」的論文引起廣泛討論。該論文提出了一種將腦部信號轉換為圖像的方法，並且已經有許多文本到圖像轉換器的存在，例如MidGenic，這些模型能夠根據提供的文本提示將其轉換為精美的圖像，甚至還有文本到影片轉換器，只需提供文本描述，模型就能生成對應的影片。但在這篇論文中，他們將這一技術提升到了新的水平，提出了一種名為Mind Video的新方法，能夠根據大腦活動來重建影片。

如何讀取大腦信號

在理解Mind Video之前，我們需要知道如何讀取大腦信號。這項技術使用功能性核磁共振成像（fMRI）來監測大腦的血氧含量變化，從而反映出大腦活動。透過將被試者暴露於視覺刺激或觀看影片，並同時透過fMRI掃描記錄腦部活動，研究人員能夠捕捉到特定刺激造成的大腦活動模式。

從腦部活動中重建圖像

在之前的研究中，已經有人成功將腦部活動轉換為圖像。這是通過使用擴散模型，將視覺刺激轉換為大腦活動的圖像表示，并生成相應的圖像。這些圖像重建結果非常出色，能夠準確地呈現原始圖像的特徵。然而，這些研究僅限於圖像的重建，還無法處理時間序列信息。

從腦部活動中重建影片

在這項新研究中，研究人員提出了一種名為Mind Video的方法，能夠從大腦活動中重建影片。這種方法使用了一種基於擴散的模型來還原影片的每一帧。與圖像重建相比，影片重建具有更大的挑戰，因為影片的每一帧不僅與前一帧有關，還與後一帧有關。為了解決這個問題，研究人員設計了一個兩段式的流程來橋接圖像和影片之間的差距。

在進行影片重建時，研究人員首先將大腦活動轉換為圖像序列，然後使用擴散模型將這些圖像序列還原為影片。研究人員已經取得了令人矚目的成果，他們展示了一些重建影片的結果。其中一些結果非常出色，能夠準確地重現原始影片中的場景和動作。然而，也有一些結果比較模糊，難以理解。

困難與挑戰

重建影片的過程中存在一些困難與挑戰。首先，影片有著特殊的時空信息依賴性，每一帧都受到前後帧的影響，這增加了重建的難度。其次，由於消耗大量內存，目前只能使用消費級GPU來運行這種模型，這導致了生成的影片的分辨率較低、幀率較慢的問題。

應用與結果展示

Mind Video的應用潛力非常廣泛。它可以用於重建各種物體、動物運動和場景，並且生成的視覺效果非常逼真和一致。在這項研究中，研究人員展示了一些重建影片的示例。有些示例的重建效果非常出色，能夠非常準確地還原原始影片的內容，例如人們奔跑的場景、流水的效果以及城市景觀的無人機鏡頭。然而，也有一些示例的重建效果比較差，難以辨識，例如吉他手奏琴的情景。

雖然Mind Video的重建結果還存在一些不足，但它已經取得了令人矚目的成果，為未來的研究和應用奠定了基礎。