Apple și-a păstrat secretul de cercetare auto-conducător timp de ani de zile, însă acum compania a făcut publice unele dintre tehnicile sale de conducere autonomă care îmbunătățesc detectarea obstacolelor.
Publicată pe 17 noiembrie în depozitul științific moderat de preimprimare arXiv de către experții de inteligență artificială și experți în învățarea mașinii Yin Zhou și Oncel Tuzel, lucrarea conturează detectarea unor obstacole mici folosind metoda de detectare a luminii și rambursarea (LiDAR)..
În loc să se bazeze pe reprezentări de caracteristici lucrate manual (de exemplu, proiecția de vedere a unei păsări), oamenii de știință Apple propun o nouă arhitectură profundă trainabilă de la capăt la capăt pentru detectarea 3D bazată pe cloud cloud. Numit VoxelNet, acesta poate funcționa direct pe puncte 3D rare și poate capta informații despre forma 3D în mod eficient.
Experimentarea timpurie cu tehnologia VoxelNet a arătat că depășește metodele de detectare 3D de ultimă generație bazate pe LiDAR cu o marjă mare. În ceea ce privește sarcini mai dificile, precum detectarea 3D a pietonilor și a bicicliștilor, abordarea VoxelNet a demonstrat rezultate încurajatoare, arătând că oferă o reprezentare și detectare 3D mai bune.
Casetele 3D verzi indică potențiale obstacole detectate cu ajutorul LiDAR
Abilitatea de a detecta cu exactitate obiectele din norii de puncte 3D este crucială în evitarea obstacolelor.
Din lucrare:
VoxelNet împarte un nor de puncte în voxele 3D la distanțe egale și transformă un grup de puncte din fiecare voxel într-o reprezentare de caracteristică unificată prin stratul de codare a funcțiilor voxel (VFE) recent introdus. În acest fel, norul de puncte este codat ca o reprezentare volumetrică descriptivă, care este apoi conectată la un RPN pentru a genera detectări.
Experimentele efectuate pe etalonul de detecție auto KITTI arată că VoxelNet depășește metodele de detectare 3D bazate pe LiDAR de ultimă generație cu o marjă mare. Mai mult, rețeaua noastră învață o reprezentare eficientă discriminatorie a obiectelor cu diferite geometrii, ceea ce duce la rezultate încurajatoare în detectarea 3D a pietonilor și bicicliștilor, pe baza doar LiDAR.
Arhitectura VoxelNet, partea de sus ilustrată, prezintă o rețea de învățare care ia ca intrare un nor de puncte brut, apoi repartizează spațiul în voxeli și transformă punctele din fiecare voxel într-o reprezentare vectorială care caracterizează informația formei..
Este minunat faptul că Apple începe să se deschidă atunci când vine vorba de cercetările sale cu privire la conducere autonomă, despre care se spune că este orientată către piața de călătorie de călătorie și serviciul de transfer al campusului companiei..
Aparent producătorul de iPhone a făcut o investiție mare în conducerea autonomă și are „un proiect mare” în acel spațiu, potrivit CEO-ului Tim Cook.