70年代就有这方面的研究,但第一篇功能成像的论文在1998年才出现,1999年法国人发了一篇经典的erp研究论文Auditory-Visual Integration during Multimodal Object Recognition in Humans: A Behavioral and Electrophysiological Study(http://neuro.caltech.edu/cns286/giard_peronnet99.pdf)被其后的学者广为引用,JJ.Foxe也用高密度erp做了研究Multisensory auditory–visual interactions during early sensory processing in humans: a high-density electrical mapping study(我有论文全文,感兴趣的来mail索取),就是这个JJ.Foxe做过从v1到前头叶的视觉通路分析。Oxford的Gemma A. Calvert写了一篇近似综述的文章Crossmodal Processing in the Human Brain: Insights from Functional Neuroimaging Studies(我也有该论文全文,感兴趣的来mail索取),读过这3篇文章,基本会对截止至2002年的视听觉综合研究有大概的了解。