入坑容易,玩出彩難。
一直以來,關(guān)于純視覺自動(dòng)駕駛的爭(zhēng)議,始終挑撥著業(yè)內(nèi)的神經(jīng)。不斷引發(fā)專業(yè)人士的“友好討論”,甚至頭部車企的創(chuàng)始人直接下場(chǎng)對(duì)線。但正如沒有人能準(zhǔn)確預(yù)知未來一樣,在即分高下也決生死的緊張氛圍下,總有一方會(huì)被回旋鏢打到自己。
馬斯克的篤定,小鵬的“背刺”
當(dāng)FSD問題纏身,馬斯克卻篤定自動(dòng)駕駛純視覺就是先進(jìn)答案,說出融合激光雷達(dá)完全毫無意義,注定失敗的言論時(shí),已經(jīng)無需猜測(cè)在行業(yè)中所能引起的爭(zhēng)議有多大。
在2021年,特斯拉突然宣布FSD的V9.0beta測(cè)試版宣布采用純視覺方案,行業(yè)內(nèi)的質(zhì)疑聲隨之再起,但這些聲音絲毫沒有影響到馬斯克的計(jì)劃,隨后便上市了不再配備毫米波雷達(dá)的Model3和Model Y。
正如不管你是天才還是普通人都會(huì)栽跟頭一樣,這次輪到了馬斯克,當(dāng)年11月份便召回了1.1萬輛車,重要原因便是純視覺的表現(xiàn)沒有達(dá)到預(yù)期。一時(shí)間,純視覺不可靠的聲音甚至把特斯拉團(tuán)隊(duì)搞得“自我懷疑”。
然而時(shí)至今日,隨著V12版本的發(fā)布,純視覺方案的口碑似乎一夜得到了逆轉(zhuǎn),其表現(xiàn)出的智駕表現(xiàn)不僅獲得了大部分人的認(rèn)可, 還有融合方案忠實(shí)擁躉的“背刺”。
前段時(shí)間,何小鵬在美國(guó)親測(cè)FSD之后,宣布轉(zhuǎn)向純視覺。隨后業(yè)內(nèi)便曝光了小鵬新車P7+棄用激光雷達(dá)。小鵬是國(guó)內(nèi)智能駕駛的領(lǐng)頭羊,同時(shí)也是融合方案的技術(shù)代表,這一突然的轉(zhuǎn)變,不僅引發(fā)國(guó)內(nèi)的熱議,也讓馬斯克忍不住評(píng)論三點(diǎn)。
事實(shí)上,小鵬的轉(zhuǎn)向并非突然,在此之前,業(yè)內(nèi)人士便已曝出激光雷達(dá)在去年就沒有進(jìn)入小鵬的BEV網(wǎng)絡(luò)進(jìn)行訓(xùn)練,只是在XNet給出感知結(jié)果之后,進(jìn)行識(shí)別距離的二次確認(rèn)。同樣,有plan B的不只是小鵬,每家車企都不會(huì)固步自守地堅(jiān)持一個(gè)技術(shù)路線。諸如華為、蔚來、小米、極越等車企都已在嘗試及應(yīng)用純視覺方案。因此到今天,當(dāng)純視覺逐漸被接受,二者的爭(zhēng)議顯然已經(jīng)不再重要。
純視覺,適合機(jī)器人嗎?
機(jī)器人作為自動(dòng)駕駛汽車的孿生兄弟,在技術(shù)層面有著極大的相似性,均需要通過強(qiáng)大的感知模塊獲取環(huán)境信息,這意味著視覺方案對(duì)于機(jī)器人有著同樣的天然優(yōu)勢(shì)。然而優(yōu)勢(shì)歸優(yōu)勢(shì),雖是孿生子,差異性同樣很多。
一方面,視覺方案能獲取豐富的環(huán)境信息,卻也需要消耗極大的計(jì)算資源。與汽車搭載的車規(guī)級(jí)硬件相比,機(jī)器人顯然做不到。在無論家用機(jī)器人還是商用機(jī)器人都大打價(jià)格戰(zhàn)的今天,廠商們無不為了降本增效絞盡腦汁,如果僅是為了應(yīng)用視覺方案,從而提升整機(jī)成本,顯然并不現(xiàn)實(shí)。
另一方面,自動(dòng)駕駛面臨的真實(shí)環(huán)境,大多為標(biāo)準(zhǔn)性的,包含標(biāo)準(zhǔn)的交通信號(hào)、路面標(biāo)示、行駛準(zhǔn)則等等,而機(jī)器人面對(duì)的環(huán)境相對(duì)更加多樣,且具有非標(biāo)性,環(huán)境適應(yīng)能力需要更強(qiáng)。
因此,在保障整體性能的前提下,有效降低算力要求是機(jī)器人不同于汽車的首先步。
其次,隨著機(jī)器人發(fā)展趨勢(shì)回歸產(chǎn)品本身,智能化升級(jí)成為了核心競(jìng)爭(zhēng)力。機(jī)器人不僅需要具備更穩(wěn)健的適應(yīng)能力,還需要具備智能避障、AI識(shí)別、人機(jī)交互、智能作業(yè)、多機(jī)協(xié)作、智能梯控等等。此外,對(duì)于不同領(lǐng)域的機(jī)器人,還需要練就獨(dú)有的“絕活”,如清潔機(jī)器人的臟污檢測(cè)能力。
針對(duì)這些需求,視覺方案還需要給出自己的答案。
玩轉(zhuǎn)純視覺,INDEMIND的答案
作為視覺技術(shù)起家的機(jī)器人技術(shù)公司,從早期的視覺模組產(chǎn)品,到如今的機(jī)器人視覺解決方案,INDEMIND一直堅(jiān)信著視覺技術(shù)的潛力。
相較于行業(yè)內(nèi)對(duì)于視覺方案的剖析,作為入局者的INDEMIND有著更深刻的體會(huì)。面對(duì)層出不窮的技術(shù)難題,不斷投入,敢于創(chuàng)新是保持持續(xù)進(jìn)化的關(guān)鍵。隨著核心技術(shù)鏈不斷成熟,目前已實(shí)現(xiàn)純視覺方案家用機(jī)器人和商用機(jī)器人全適配。
在研發(fā)過程中,針對(duì)算力難題,INDEMIND為此研發(fā)了多種輕量化技術(shù),輕量化VSLAM(基于深度學(xué)習(xí)特征的SLAM架構(gòu))、輕量化Depth(基于深度學(xué)習(xí)特征匹配的Depth)、輕量化深度學(xué)習(xí)模型(底層算子自研、剪枝、量化),同時(shí)還在硬件上,對(duì)于視覺處理采用NEON加速、GPU加速、DSP加速等方式,提升計(jì)算性能。
目前,在掃地機(jī)器人方向,INDEMIND視覺方案搭載4核A53/A55級(jí)別芯片即可滿足需求,能夠適配如RK3566、VicoreTek6601/6801等(全解決方案情況下,雙目視覺多傳感器融合SLAM、雙目Depth、物體識(shí)別及整機(jī)完整SDK)。
在環(huán)境適應(yīng)方面,INDEMIND視覺方案可實(shí)時(shí)自主創(chuàng)建及更新全場(chǎng)景二維地圖、三維地圖及語義地圖,顯著提升機(jī)器人的場(chǎng)景適應(yīng)能力。同時(shí),INDEMIND擁有超過100個(gè)使用場(chǎng)景的海量數(shù)據(jù),對(duì)于清潔、配送、導(dǎo)覽、安防等多種工作場(chǎng)景有著深度理解,進(jìn)一步提升機(jī)器人的環(huán)境自適應(yīng)能力。
特別需要說到的是,搭載INDEMIND視覺方案的商用機(jī)器人可以做到無需預(yù)部署,開機(jī)即用,這與現(xiàn)有產(chǎn)品有著明顯區(qū)別。
INDEMIND還開發(fā)了一套系統(tǒng)化環(huán)境補(bǔ)光策略,包含主動(dòng)式環(huán)境補(bǔ)光配置和光照變化條件下的建圖策略,在實(shí)際表現(xiàn)中,面對(duì)強(qiáng)光直射、無光源、昏暗等特殊光照環(huán)境均能無差異工作,滿足全天候作業(yè)要求。
為了提升智能表現(xiàn),INDEMIND基于設(shè)備端、云端智能決策平臺(tái)、大數(shù)據(jù)平臺(tái)三端,建立了一套智能決策引擎,能夠在語義層次上理解環(huán)境信息,模仿人類大腦對(duì)環(huán)境理解的方式,并進(jìn)行策略處理,實(shí)現(xiàn)智能避障、人機(jī)交互、智能作業(yè)等多種業(yè)務(wù)邏輯。同時(shí),基于關(guān)鍵數(shù)據(jù)能夠不斷更新算法模型,持續(xù)提升場(chǎng)景處理和問題應(yīng)對(duì)能力。
值得一提的是,INDEMIND還研發(fā)了以視覺圖像算法配合融合攝像頭及主動(dòng)補(bǔ)光策略構(gòu)建而成的臟污識(shí)別技術(shù),在實(shí)際表現(xiàn)上,目前已能夠達(dá)到平均臟污檢出率99%以上(包含常見固體、液體臟污),支持任何地面材質(zhì)、花色、光線下的透明、半透明,不透明液體及干涸污漬識(shí)別、顆粒狀臟污識(shí)別、粉末狀臟污識(shí)別,是目前行業(yè)極少成熟且性能優(yōu)異的技術(shù)方案。
新技術(shù)的出現(xiàn),總會(huì)面臨著爭(zhēng)議,但與此同時(shí),我們也需要做好接受新事物的準(zhǔn)備。
(推廣)