報(bào)告時(shí)間:2024年11月9日(星期六)8:00—17:00
報(bào)告地點(diǎn):翡翠科教樓A座二樓報(bào)告廳
舉辦單位:計(jì)算機(jī)與信息學(xué)院(人工智能學(xué)院)
學(xué)術(shù)報(bào)告信息(一)
報(bào)告題目:自動(dòng)駕駛大模型的具身實(shí)現(xiàn)
報(bào)告時(shí)間:2024年11月9日(星期六)08:40-09:10
報(bào) 告 人:高炳釗 教授
工作單位:同濟(jì)大學(xué)
報(bào)告簡(jiǎn)介:
隨著大語(yǔ)言模型(Large Language Model)智能涌現(xiàn)能力的產(chǎn)生,智能基礎(chǔ)模型(Foundation Model)技術(shù)被認(rèn)為有望解決汽車(chē)自動(dòng)駕駛安全長(zhǎng)尾問(wèn)題。基礎(chǔ)模型的海量數(shù)據(jù)預(yù)訓(xùn)練基于自監(jiān)督學(xué)習(xí),其泛化能力優(yōu)于需要標(biāo)注的監(jiān)督學(xué)習(xí)。本報(bào)告將從自動(dòng)駕駛面臨的挑戰(zhàn)出發(fā),講述自動(dòng)駕駛算法開(kāi)發(fā)的技術(shù)演進(jìn)過(guò)程,總結(jié)自監(jiān)督學(xué)習(xí)的最新進(jìn)展,最后給出基于自監(jiān)督學(xué)習(xí)的AI大模型垂直應(yīng)用于自動(dòng)駕駛場(chǎng)景可能的技術(shù)路線。
報(bào)告人簡(jiǎn)介:
高炳釗,同濟(jì)大學(xué)長(zhǎng)聘特聘教授,獲控制理論與控制工程專(zhuān)業(yè)以及機(jī)械工程專(zhuān)業(yè)雙博士學(xué)位。2015年度國(guó)家優(yōu)青、入選2022年度國(guó)家重大人才工程,自動(dòng)化學(xué)會(huì)車(chē)輛控制與智能化專(zhuān)業(yè)委員會(huì)秘書(shū)長(zhǎng)、IFAC T.C. Automotive Control委員。
研究方向?yàn)槠?chē)控制與智能化,發(fā)表IEEE匯刊、ASME匯刊、VSD等控制和車(chē)輛權(quán)威期刊論文60余篇,出版中英文專(zhuān)著2部,授權(quán)發(fā)明專(zhuān)利30余件,含美國(guó)發(fā)明專(zhuān)利2件。曾獲自動(dòng)化學(xué)會(huì)技術(shù)發(fā)明一等獎(jiǎng)2項(xiàng)、吉林省優(yōu)秀博士學(xué)位論文和多項(xiàng)學(xué)會(huì)優(yōu)秀論文獎(jiǎng)。
學(xué)術(shù)報(bào)告信息(二)
報(bào)告題目:端云協(xié)同的視覺(jué)定位與三維重建
報(bào)告時(shí)間:2024年11月9日(星期六)09:10-09:40
報(bào) 告 人:章國(guó)鋒 教授、杰青
工作單位:浙江大學(xué)
報(bào)告簡(jiǎn)介:
基于視覺(jué)的跟蹤定位和三維重建是計(jì)算機(jī)視覺(jué)領(lǐng)域的經(jīng)典問(wèn)題,在AR/VR、機(jī)器人、自動(dòng)駕駛等領(lǐng)域有著廣泛的應(yīng)用前景。由于真實(shí)環(huán)境的復(fù)雜性,跟蹤定位和三維重建技術(shù)在實(shí)際應(yīng)用中往往會(huì)面臨一些關(guān)鍵性的挑戰(zhàn)。例如,如何讓移動(dòng)設(shè)備在大尺度復(fù)雜場(chǎng)景下做到實(shí)時(shí)穩(wěn)定的跟蹤注冊(cè)和精準(zhǔn)可靠的重定位?如何基于三維高斯表達(dá)實(shí)現(xiàn)大尺度場(chǎng)景的高精度重建與渲染?本次報(bào)告主要匯報(bào)我們課題組近幾年為了解決這些關(guān)鍵問(wèn)題所做的研究工作以及研制的基于端云協(xié)同的視覺(jué)定位與三維重建系統(tǒng),并展示其相應(yīng)的應(yīng)用。
報(bào)告人簡(jiǎn)介:
章國(guó)鋒,浙江大學(xué)教授,博導(dǎo),國(guó)家杰出青年科學(xué)基金獲得者。主要從事SLAM、三維視覺(jué)與增強(qiáng)現(xiàn)實(shí)方面的研究,取得了一系列重要成果,開(kāi)源開(kāi)放了一系列相關(guān)系統(tǒng)和算法的源代碼以及數(shù)據(jù)集,是OpenXRLab擴(kuò)展現(xiàn)實(shí)開(kāi)源平臺(tái)的主要發(fā)起人。
曾獲2010年CCF優(yōu)秀博士學(xué)位論文獎(jiǎng)、2011年全國(guó)優(yōu)秀博士學(xué)位論文獎(jiǎng)、2021年浙江省自然科學(xué)獎(jiǎng)一等獎(jiǎng)(排名第2)以及國(guó)際頂級(jí)會(huì)議ISMAR 2020唯一最佳論文獎(jiǎng)。擔(dān)任國(guó)際頂級(jí)期刊IJCV編委,以及《Virtual Reality & Intelligent Hardware》、《計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)》和《中國(guó)圖象圖形學(xué)報(bào)》等期刊編委。
學(xué)術(shù)報(bào)告信息(三)
報(bào)告題目:多模態(tài)感知交互在智能座艙中的應(yīng)用現(xiàn)狀及科大訊飛相關(guān)案例介紹
報(bào)告時(shí)間:2024年11月9日(星期六)09:40-10:10
報(bào) 告 人:林垠 資深專(zhuān)家
工作單位:科大訊飛
報(bào)告簡(jiǎn)介:
本次報(bào)告以多模態(tài)感知交互在智能座艙中的應(yīng)用現(xiàn)狀及科大訊飛相關(guān)案例介紹為主題,將圍繞多模感知交互在智能座艙中的問(wèn)題提出、發(fā)展歷程、研究現(xiàn)狀和趨勢(shì)、應(yīng)用前景等多個(gè)方面展開(kāi),報(bào)告還將詳細(xì)介紹訊飛自主研發(fā)的多模態(tài)語(yǔ)音識(shí)別、手勢(shì)視線交互和情感健康監(jiān)測(cè)等算法,旨在通過(guò)分享和討論激發(fā)創(chuàng)新思維,促進(jìn)思想交流,共同學(xué)習(xí)進(jìn)步。
報(bào)告人簡(jiǎn)介:
林垠,中國(guó)科學(xué)技術(shù)大學(xué)博士。科大訊飛AI研究院高級(jí)核心技術(shù)研究員,長(zhǎng)期從事計(jì)算機(jī)視覺(jué)領(lǐng)域相關(guān)工作,研究方向涵蓋圖像理解、人臉識(shí)別、目標(biāo)檢測(cè)、語(yǔ)義分割、行為識(shí)別在內(nèi)的視覺(jué)感知交互算法,同時(shí)參與到訊飛多模態(tài)大模型的算法研究,主導(dǎo)訊飛多模感知和交互等多項(xiàng)能力在智能座艙場(chǎng)景下交互落地應(yīng)用。
學(xué)術(shù)報(bào)告信息(四)
報(bào)告題目:智能駕駛場(chǎng)景理解與重建
報(bào)告時(shí)間:2024年11月9日(星期六)14:00-14:30
報(bào) 告 人:馬超 教授、優(yōu)青
工作單位:上海交通大學(xué)
報(bào)告簡(jiǎn)介:
多模態(tài)場(chǎng)景理解與生成是自動(dòng)駕駛感知任務(wù)的核心與熱點(diǎn)問(wèn)題,本報(bào)告主要介紹多模態(tài)感知與生成任務(wù)的最新進(jìn)展,匯報(bào)如何利用生成模型提升視覺(jué)場(chǎng)景感知能力,以及如何利用預(yù)訓(xùn)練模型進(jìn)一步提升場(chǎng)景感知能力。
報(bào)告人簡(jiǎn)介:
馬超,上海交通大學(xué)人工智能研究院教授,博士生導(dǎo)師。國(guó)家優(yōu)青、上海市浦江人才、中國(guó)圖象圖形學(xué)學(xué)會(huì)優(yōu)博。上海交通大學(xué)與加州大學(xué)默塞德分校聯(lián)合培養(yǎng)博士。澳大利亞機(jī)器人視覺(jué)研究中心(阿德萊德大學(xué))博士后研究員。
主要研究計(jì)算機(jī)視覺(jué)問(wèn)題。谷歌學(xué)術(shù)引用1萬(wàn)2千余次,連續(xù)入選愛(ài)思唯爾中國(guó)高被引學(xué)者(2020-2023)。任中國(guó)圖象圖形學(xué)學(xué)會(huì)優(yōu)博俱樂(lè)部主席、青年工作委員會(huì)副秘書(shū)長(zhǎng)。擔(dān)任CVPR 2024/2025、ICLR 2025領(lǐng)域主席,IEEE Trans. on Multimedia (TMM)、Journal of Artificial Intelligence Research (JAIR)、Image and Vision Computing (IVC)副編輯。獲中國(guó)圖象圖形學(xué)學(xué)會(huì)青年科學(xué)家獎(jiǎng)、MMM 2024唯一最佳論文獎(jiǎng)、華為技術(shù)合作領(lǐng)域2021年度優(yōu)秀技術(shù)成果獎(jiǎng)。
學(xué)術(shù)報(bào)告信息(五)
報(bào)告題目:基于生成式物理智能的自動(dòng)駕駛閉環(huán)仿真系統(tǒng)研究
報(bào)告時(shí)間:2024年11月9日(星期六)14:30-15:00
報(bào) 告 人:張力 研究員
工作單位:復(fù)旦大學(xué)
報(bào)告簡(jiǎn)介:
盡管神經(jīng)輻射場(chǎng)(NeRF)在三維重建中取得了顯著進(jìn)展,但在處理更廣泛和復(fù)雜的動(dòng)態(tài)場(chǎng)景時(shí),NeRF仍然面臨著高昂的計(jì)算成本和重建質(zhì)量的挑戰(zhàn)。這些局限性使得NeRF難以應(yīng)對(duì)需要高精度和實(shí)時(shí)性的自動(dòng)駕駛閉環(huán)仿真場(chǎng)景。為了解決這些問(wèn)題,本報(bào)告提出了基于生成式物理AI的自動(dòng)駕駛閉環(huán)仿真系統(tǒng)。首先,針對(duì)靜態(tài)場(chǎng)景,四面體網(wǎng)格技術(shù)相比NeRF,不僅具有更快的收斂速度和更高的渲染效率,還能夠生成更精準(zhǔn)的表面細(xì)節(jié);其次,針對(duì)動(dòng)態(tài)場(chǎng)景,四維高斯表征能夠統(tǒng)一建模時(shí)間和空間,顯著提高了收斂速度和渲染效率,從而大幅提升實(shí)時(shí)仿真的效率和視覺(jué)質(zhì)量。這些技術(shù)的結(jié)合在高精度三維重建和場(chǎng)景生成中發(fā)揮了重要作用,尤其是在自動(dòng)駕駛領(lǐng)域,通過(guò)生成連續(xù)的時(shí)空?qǐng)鼍皵?shù)據(jù),這些方法能夠準(zhǔn)確捕捉和模擬對(duì)象的運(yùn)動(dòng)和環(huán)境變化,有效應(yīng)對(duì)數(shù)據(jù)多樣性不足和復(fù)雜光照條件的挑戰(zhàn),最終提升自動(dòng)駕駛系統(tǒng)在廣泛和多樣化場(chǎng)景下重建的效率和準(zhǔn)確性。
報(bào)告人簡(jiǎn)介:
張力,復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院研究員,博士畢業(yè)于倫敦瑪麗女王大學(xué)電子工程與計(jì)算機(jī)科學(xué)系,曾任職于牛津大學(xué)工程科學(xué)系博士后,劍橋三星人工智能中心研究科學(xué)家。
獲得國(guó)家級(jí)高層次青年人才計(jì)劃、 上海海外高層次人才計(jì)劃、上海科技青年 35 人引領(lǐng)計(jì)劃(35U35)、世界人工智能大會(huì)青年優(yōu)秀論文獎(jiǎng); 發(fā)表 IEEE TPAMI、IJCV、NeurIPS 等人工智能?chē)?guó)際期刊與會(huì)議論文 70 余篇,論文總被引 18000 余次。 擔(dān)任人工智能?chē)?guó)際會(huì)議 NeurIPS 2023、NeurIPS 2024、CVPR 2023、CVPR 2024 與 CVPR 2025 領(lǐng)域主席,國(guó)際期刊 Pattern Recognition 副編輯。
學(xué)術(shù)報(bào)告信息(六)
報(bào)告題目:可信賴的自動(dòng)駕駛感知與決策
報(bào)告時(shí)間:2024年11月9日(星期六)15:00-15:30
報(bào) 告 人:馬月昕 研究員
工作單位:上海科技大學(xué)
報(bào)告簡(jiǎn)介:
魯棒性和安全性是自動(dòng)駕駛走向落地、走向民用的關(guān)鍵因素,然而現(xiàn)有的研究工作缺乏對(duì)可信賴智駕的思考和評(píng)估標(biāo)準(zhǔn)。在大模型引爆的通用人工智能時(shí)代,如何增強(qiáng)智駕的通用智能、解決新域的泛化性?如何讓智駕模型擁有法律、法規(guī)的常識(shí)和優(yōu)秀的駕駛技巧,進(jìn)而保證駕駛行為安全高效?本報(bào)告將圍繞這兩個(gè)問(wèn)題,探討可信賴的自動(dòng)駕駛感知與決策。
報(bào)告人簡(jiǎn)介:
馬月昕,上海科技大學(xué)研究員、博導(dǎo)。博士畢業(yè)于香港大學(xué),曾到法國(guó)國(guó)家信息與自動(dòng)化研究所、美國(guó)北卡羅萊納大學(xué)教堂山分校、百度研究院進(jìn)行訪問(wèn)學(xué)習(xí)。
主要研究方向?yàn)槿S視覺(jué)、具身智能,尤其是三維場(chǎng)景理解、多模態(tài)感知、自動(dòng)駕駛等。共發(fā)表相關(guān)領(lǐng)域頂會(huì)或頂刊論文60余篇,其中一作與通訊論文30余篇,包括Science Robotics、TPAMI、CVPR、ICCV、SIGGRAPH等,谷歌學(xué)術(shù)引用3600余次。曾獲上海市海外高層次人才、上海市優(yōu)秀教學(xué)成果(高等教育類(lèi))一等獎(jiǎng)、國(guó)家自然科學(xué)基金青年基金項(xiàng)目等。
學(xué)術(shù)報(bào)告信息(七)
報(bào)告題目:面向智能駕駛的三維場(chǎng)景理解
報(bào)告時(shí)間:2024年11月9日(星期六)15:50-16:20
報(bào) 告 人:郭裕蘭 教授
工作單位:中山大學(xué)
報(bào)告簡(jiǎn)介:
激光雷達(dá)和雙目相機(jī)等傳感器為車(chē)輛和機(jī)器人等自主系統(tǒng)準(zhǔn)確感知其周?chē)h(huán)境提供了豐富的三維空間信息,是實(shí)現(xiàn)空間智能的重要手段。如何更高效、更準(zhǔn)確地理解三維場(chǎng)景及其動(dòng)態(tài)變化,是實(shí)現(xiàn)智能汽車(chē)與其周?chē)h(huán)境安全準(zhǔn)確可靠交互的基礎(chǔ)。在本報(bào)告中,將重點(diǎn)匯報(bào)團(tuán)隊(duì)在面向大規(guī)模場(chǎng)景的三維點(diǎn)云高效語(yǔ)義解析及基于世界模型的四維時(shí)序預(yù)測(cè)等方面的主要進(jìn)展。
報(bào)告人簡(jiǎn)介:
郭裕蘭,中山大學(xué)電子與通信工程學(xué)院教授,博士生導(dǎo)師。主要研究領(lǐng)域?yàn)槿S視覺(jué),包括三維重建、點(diǎn)云理解及機(jī)器人系統(tǒng)。在IEEE TPAMI和CVPR等期刊和會(huì)議發(fā)表學(xué)術(shù)論文200余篇,谷歌學(xué)術(shù)總被引1.7萬(wàn)余次,連續(xù)四年入選Elsevier中國(guó)高被引學(xué)者,獲中國(guó)計(jì)算機(jī)學(xué)會(huì)自然科學(xué)一等獎(jiǎng)、吳文俊人工智能優(yōu)秀青年獎(jiǎng)等獎(jiǎng)勵(lì)。
擔(dān)任中國(guó)圖象圖形學(xué)學(xué)會(huì)三維視覺(jué)專(zhuān)委會(huì)秘書(shū)長(zhǎng),IEEE Transactions on Image Processing高級(jí)領(lǐng)域編輯(SAE),CVPR 2025/2023/2021、ICCV 2021、ECCV 2024、NeurIPS 2024、ACM Multimedia 2021等國(guó)際會(huì)議領(lǐng)域主席。
學(xué)術(shù)報(bào)告信息(八)
報(bào)告題目:多模態(tài)智駕大模型助力自動(dòng)駕駛落地
報(bào)告時(shí)間:2024年11月9日(星期六)16:20-16:50
報(bào) 告 人:袁勝 創(chuàng)始人、CTO
工作單位:中科智馳
報(bào)告簡(jiǎn)介:
本報(bào)告將介紹中科智馳公司及自動(dòng)駕駛技術(shù)路線的發(fā)展歷程,介紹多模態(tài)大模型模型架構(gòu),以及中科智馳在模型構(gòu)建、云邊端融合訓(xùn)練、模型壓縮等關(guān)鍵技術(shù)領(lǐng)域的探索及研究。
報(bào)告人簡(jiǎn)介:
袁勝,中科智馳聯(lián)合創(chuàng)始人、董事、CTO,中科合肥創(chuàng)新院智能網(wǎng)聯(lián)汽車(chē)技術(shù)應(yīng)用中心副主任,合肥工業(yè)大學(xué)兼職教師、安徽農(nóng)業(yè)大學(xué)研究生實(shí)踐導(dǎo)師。碩士畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)控制工程專(zhuān)業(yè),曾就職于中科院合肥物質(zhì)科學(xué)研究院智能車(chē)輛技術(shù)研究中心,參與國(guó)家基金委、省部級(jí)、中科院科研項(xiàng)目十余項(xiàng),在智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域獲得二十余項(xiàng)知識(shí)產(chǎn)權(quán)授權(quán)。
曾主導(dǎo)首臺(tái)合肥首臺(tái)自動(dòng)駕駛公交項(xiàng)目研發(fā),參與軍方舉辦的“跨越險(xiǎn)阻無(wú)人系統(tǒng)挑戰(zhàn)賽”獲得全國(guó)第一名成績(jī)。目前主要從事智能駕駛車(chē)輛環(huán)境感知方面的技術(shù)開(kāi)發(fā)、BEV智駕大模型的開(kāi)發(fā)研究工作。