技術(shù)文章
在ADAS(高級輔助駕駛)開發(fā)領(lǐng)域,高質(zhì)量的標注數(shù)據(jù)是算法迭代的核心基礎(chǔ)。然而,傳統(tǒng)依賴人工標注的模式通常成本高昂、周期漫長,每年投入可達數(shù)百萬美元,處理時間往往需要數(shù)月,嚴重制約了研發(fā)效率與項目推進速度。
這正是康謀為您帶來的 aiData Auto Annotator 解決方案的核心價值:由 aiMotive 打造的強大自動化工具,旨在大幅降低標注成本并縮短處理時間。當路測數(shù)據(jù)采集完成后,該工具即可確保標注數(shù)據(jù)集的快速、可靠交付,讓研究人員和工程師能夠零延時地持續(xù)優(yōu)化 ADAS 算法棧。
過去幾年中,Auto Annotator 已累計為客戶節(jié)省數(shù)千萬美元的標注開支。aiMotive 自身的ADAS算法棧已使用自動標注數(shù)據(jù)進行訓(xùn)練,在控制開發(fā)預(yù)算的同時,保持了軟件棧的性能競爭力。該工具的自動標注算法已在多項精度指標上穩(wěn)定超過人工標注基準。
本文將從以下幾個方面闡述aiData自動標注技術(shù)帶來的關(guān)鍵優(yōu)勢,此外文末增設(shè)“技術(shù)原理深度解析"章節(jié),為大家詳解工具鏈底層邏輯。
aiData Auto Annotator 超越了傳統(tǒng)解決方案,它能夠為動態(tài)交通參與者(如車輛、行人、騎行者、交通標志和紅綠燈)生成高精度的 3D 標注框,并自動標注車道線和路面標識等靜態(tài)元素。
當前市場上多數(shù)自動標注工具僅支持2D輸出,局限了數(shù)據(jù)在3D空間感知任務(wù)中的應(yīng)用價值。2D標注雖可滿足2D目標檢測器的訓(xùn)練需求,但在車輛距離、精確尺寸等空間屬性估計方面存在明顯短板。
相比之下,3D標注則能夠更全面、精準地還原駕駛環(huán)境,完整捕捉目標對象的尺寸、朝向與位置信息,其提供的深度信息是實現(xiàn)精準定位與可靠決策的關(guān)鍵前提。尤為重要的是,3D標注具備遮擋處理能力,可有效檢測并解析部分遮擋物體,這一特性是2D標注難以實現(xiàn)的,也是構(gòu)建適應(yīng)復(fù)雜真實路況的穩(wěn)健感知系統(tǒng)的核心基礎(chǔ)。

長期以來,人工標注被視為數(shù)據(jù)標注的基準標準,但人工標注存在固有局限:多數(shù)供應(yīng)商僅能保證約95%的標注準確率,若需提升精度,需投入大量資源開展多輪質(zhì)量核查,導(dǎo)致成本激增,難以適用于大規(guī)模數(shù)據(jù)集。
隨著 aiData Auto Annotator 的出現(xiàn),意味著我們可以全自動獲取到高精度的數(shù)據(jù)集。
該方案在全運行設(shè)計域(ODD)內(nèi),標注精度與召回率均達到并超越人工標注水平,推動數(shù)據(jù)處理流水線實現(xiàn)關(guān)鍵性轉(zhuǎn)變。目前aiMotive內(nèi)部AD算法棧的訓(xùn)練與驗證數(shù)據(jù)集,已基本依托該自動標注算法生成,可在不妥協(xié)精度的前提下,實現(xiàn)數(shù)據(jù)的快速交付、規(guī)?;瘮U展與質(zhì)量穩(wěn)定性保障。 (注:前提是考慮了遮擋處理、僅關(guān)注相關(guān) ROI 區(qū)域且假設(shè)非對抗性天氣條件下)

aiData Auto Annotator具備好的場景適配性,已在日本道路測試、卡車運輸專項適配等不同地域、不同類型的應(yīng)用場景中得到驗證,展現(xiàn)出穩(wěn)定的可靠性與靈活的擴展性。
這一特性源于其核心技術(shù)架構(gòu):依托強大的基礎(chǔ)模型,結(jié)合少樣本學(xué)習(FSL)與相似性搜索技術(shù),可通過極少量新增數(shù)據(jù)完成現(xiàn)有類別的微調(diào)與新圖像類別的發(fā)現(xiàn)。在多數(shù)場景下,僅需少量圖像數(shù)據(jù)即可完成流水線的跨領(lǐng)域適配。
這意味著 Auto Annotator 可以快速、輕松地適配您獨特的用例,而無需進行大量的重新訓(xùn)練或人工干預(yù)。
在ADAS/自動駕駛(AD)解決方案的開發(fā)周期中,人工標注是成本高、耗時最長的環(huán)節(jié)之一。企業(yè)每年需投入數(shù)百萬美元外包標注任務(wù),卻仍面臨成本超支與交付延遲的問題。
aiData Auto Annotator通過自動化技術(shù)實現(xiàn)了標注成本的大幅降低:處理30小時標注錄制數(shù)據(jù)即可實現(xiàn)投資回報(ROI);即便計入傳感器、GPU等硬件采購的額外成本,在處理500小時標注數(shù)據(jù)后,成本節(jié)省率可達到90%以上,年度節(jié)省預(yù)算可達八位數(shù)美元。對于典型路測數(shù)據(jù)采集所需的數(shù)萬小時數(shù)據(jù)處理而言,該方案將為整個開發(fā)流程帶來顯著的成本優(yōu)化。
因此讓我們一起思考一個問題:當我們可以投資于真正重要的事情——增強模型、賦能團隊和加速創(chuàng)新時,為何還要將預(yù)算浪費在低效的人力標注上?

在 ADAS/AD 開發(fā)中,時間就是一切。手動標注復(fù)雜場景可能需要數(shù)周甚至數(shù)月,從而推遲關(guān)鍵決策并減緩創(chuàng)新速度。
aiData Auto Annotator通過水平可擴展流水線架構(gòu),實現(xiàn)了數(shù)據(jù)標注的高效處理——支持在集群節(jié)點上并行處理數(shù)據(jù)序列,具備近乎實時的標注性能,可在數(shù)據(jù)采集完成后短時間內(nèi)交付可用數(shù)據(jù),讓研發(fā)團隊能夠立即開展模型訓(xùn)練、測試與迭代工作。
因此讓我們再一起思考一下這個問題:當我們可以在錄制結(jié)束后幾小時內(nèi)就開始使用數(shù)據(jù)時,為什么要等待數(shù)周? (性能參考:運行于單臺配備 8 GPU 的服務(wù)器上)

閱讀上面內(nèi)容之后,大家可能會有疑問,aiData Auto Annotator是如何做到的呢?本節(jié)將從技術(shù)架構(gòu)、核心流程、關(guān)鍵工程突破三個維度,為算法工程師詳解aiData Auto Annotator的運作機制。
aiData Auto Annotator整合攝像頭、激光雷達(LiDAR)、導(dǎo)航衛(wèi)星系統(tǒng)/慣性導(dǎo)航系統(tǒng)(GNSS/INS)及可選毫米波雷達數(shù)據(jù),在統(tǒng)一的4D(空間+時間)環(huán)境模型中完成多傳感器數(shù)據(jù)的同步標注。
與人工標注類似,傳感器的精確標定與同步是保障標注質(zhì)量的基礎(chǔ)前提(相關(guān)細節(jié)可參考往期技術(shù)博客)。在自動化標注流程中,自車運動(Egomotion)精度——即車輛自身空間移動軌跡的估計精度,是易被忽視卻至關(guān)重要的因素。由于該方案依賴聚合點云(Aggregated Point Cloud)進行標注,即便微小的自車運動估計誤差,也會導(dǎo)致3D包圍盒的尺寸與位置畸變,進而產(chǎn)生標注誤差。
aiData Auto Annotator采用神經(jīng)計算與傳統(tǒng)幾何、追蹤方法相結(jié)合的混合解決方案,確保標注結(jié)果的精確性與一致性,核心流程分為三步:
首先,一個多模態(tài)神經(jīng)網(wǎng)絡(luò)配合非因果追蹤器(Non-causal Tracker)處理傳感器數(shù)據(jù),生成初始的 3D 包圍盒。
接著,系統(tǒng)生成一個由傳感器數(shù)據(jù)和自車運動構(gòu)建的聚合點云,這構(gòu)成了標注流水線的空間基礎(chǔ)。
最后,Auto Annotator 通過結(jié)合多模態(tài) 3D 目標檢測網(wǎng)絡(luò)、圖像與點云分割網(wǎng)絡(luò)以及一套計算幾何和追蹤算法的輸出,基于聚合點云構(gòu)建一個時間上連貫(Temporally Coherent)的世界模型。
這些組件共同構(gòu)成了 Auto Annotator 流水線的骨架,最終輸出可直接用于模型訓(xùn)練或驗證的高質(zhì)量標注數(shù)據(jù)。
我們研發(fā)團隊在方案迭代過程中,針對真實駕駛場景的復(fù)雜工況,攻克了多項核心技術(shù)難題,典型案例如下:
高速場景下的畸變補償: 針對車輛130km/h高速行駛工況,解決旋轉(zhuǎn)式LiDAR分片掃描與卷簾快門攝像頭逐行曝光帶來的數(shù)據(jù)畸變問題。團隊通過自車運動補償技術(shù),結(jié)合精確的相機曝光時間校準,有效消除高速行駛下(含對向來車相對速度達260km/h場景)的傳感器數(shù)據(jù)碎片與圖像變形;
鬼影反射過濾: 針對車輛窗戶、店面玻璃、水坑等反射面在點云中形成的虛假目標(鬼影),我們團隊通過專項算法設(shè)計消除此類偽影,確保傳感器局限性導(dǎo)致的虛假檢測不進入最終標注結(jié)果。
aiData Auto Annotator作為多年技術(shù)打磨的復(fù)雜系統(tǒng),其核心優(yōu)勢在于將底層技術(shù)復(fù)雜性封裝,為客戶提供無縫銜接的標準化服務(wù),無需客戶關(guān)注技術(shù)細節(jié)即可實現(xiàn)高效應(yīng)用。
簡單來講,aiData Auto Annotator通過技術(shù)創(chuàng)新實現(xiàn)了ADAS標注數(shù)據(jù)生產(chǎn)的全鏈路優(yōu)化,核心價值可總結(jié)為以下三點:
(1)成本與效率優(yōu)化:: 相比人工標注,成本降低 90% 以上,僅需 30 小時數(shù)據(jù)即可收回成本。
(2)數(shù)據(jù)質(zhì)量保障: 提供帶遮擋處理的 3D 包圍盒,精度和召回率在 ODD 內(nèi)全面超越人工(Superhuman Accuracy)。
(3)技術(shù)閉環(huán)優(yōu)勢: 解決高速運動畸變與傳感器鬼影問題,支持從數(shù)據(jù)采集到模型訓(xùn)練的無縫銜接。
本文篇幅有限,若您想深入了解,歡迎聯(lián)系交流更多細節(jié)!
關(guān)注微信