Tyrimų ataskaita: 3D erdvinių duomenų apdorojimo 
technologija ir jos taikymas  AI Research Institute 2025_01Youngho Hong
Santraukos:
Šie tyrimai apima 3D erdvinių duomenų apdorojimo technologijų
kūrimą ir taikymą, ypač taškų debesų duomenų gavimą ir 3D objektų
aptikimo technologijas naudojant LiDAR jutiklius. Daugiausia dėmesio 
skiriama 3D objektų aptikimo technologijoms "VoxelNet", "PointNet" ir 
"PointRCNN" ir aiškinama, kaip šios technologijos naudojamos įvairiose 
srityse, pavyzdžiui, autonominėse transporto priemonėse, sveikatos 
priežiūroje, pramonės automatizavime, saugos stebėjimo sistemose ir 
VR/AR. LiDAR jutikliais surinktais taškų debesies duomenimis labai 
tiksliai analizuojama 3D erdvė, o jais pagrįstos 3D objektų aptikimo 
technologijos svarbų vaidmenį realiuoju laiku informuojant apie 
aplinką, atliekant tikslią diagnostiką, optimizuojant gamybos procesus 
ir kt. Šiame tyrime analizuojamas 3D erdvinių duomenų apdorojimo 
technologijos poveikis šiuolaikinei pramonei ir technologinėms 
naujovėms bei aptariamos tolesnės plėtros galimybės.
Reikšminiai žodžiai:
 3D erdviniai duomenys, LiDAR jutikliai, taškų debesys, 3D 
objektų aptikimas, VoxelNet, PointNet, PointRCNN, autonominės 
transporto priemonės, sveikatos priežiūra, pramonės automatizavimas, 
saugos stebėjimo sistemos, VR/AR, gilusis mokymasis2- -
1. Įvadas
Ji apima duomenų rinkimo, saugojimo, analizės ir vizualizavimo 
procesą, o trimatės erdvinės informacijos apdorojimui naudojamos 
tokios technologijos kaip LiDAR, fotogrametrija ir 3D skenavimas. Šios 
technologijos naudojamos įvairiose programinės įrangos platformose, iš
kurių pagrindinės yra geografinės informacinės sistemos (GIS) ir 
kompiuterizuotas projektavimas (CAD). Tai atlikti sudėtingas erdvines 
analizes.
LiDAR naudoja lazerio impulsus atstumo duomenims rinkti, o 
fotogrametrija naudoja aerofotonuotraukas 3D modeliams kurti. Šie 
duomenys saugomi duomenų bazėje ir prireikus naudojami analizei ir 
vizualizacijai.1)
Tyrimai parodė, kad 3D CNN struktūros gali būti naudojamos 3D 
reprezentacijoms mokytis ir kad tai galima padaryti efektyviau nei 
taikant tradicinius visiškai 3D CNN pagrįstus metodus.2)
Naudojant GPU pagrįstus 3D vizualizavimo metodus galima sudėtingiau ir 
tiksliau nustatyti erdvines ribas.3)
3D modeliavimas naudojamas kaip esminis įrankis architektūrinio 
projektavimo ir modeliavimo procese. Jis leidžia įvertinti konstrukcijų
saugumą padidinti projektų tikslumą.
3D erdviniai duomenys naudojami atliekant ekosistemų pokyčių ir 
nelaimių valdymo tyrimus. Pavyzdžiui, 3D geologinis modeliavimas 
naudojamas požeminio vandens žvalgybai ir geologiniams tyrimams.4)
3D duomenys kuriant įtraukiančias aplinkas, kurios pagerina naudotojo 
patirtį. Tai įvairiose pramonės šakose, įskaitant švietimą, sveikatos 
priežiūrą ir pramogas.
3D erdvinių duomenų apdorojimo technologijos sparčiai tobulėja 
įvairiose srityse, ypač taškų debesų duomenų gavimo ir objektų aptikimo 
3D erdvėje naudojant LiDAR jutiklius. Šios technologijos esmės keičia 
autonominių transporto priemonių, medicinospramonės 
automatizavimo, saugos stebėjimo sistemų ir VR/AR aplinkas. Šioje 3- -
tyrimo ataskaitoje pateikiama pagrindinė informacija apie 3D erdvinių
duomenų apdorojimo technologijas ir paaiškinama, kaip jos taikomos 
įvairiose pramonės šakose.
1) Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų skaičiavimas ir 
vizualizavimas. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. ir Lee, K. M. (2020). 
Triplanar convolution with shared 2D kernels for 3D classification and 
shape retrieval (Triplanar konvoliucija su bendrais 2D branduoliais 3D 
klasifikavimui ir formos paieškai). Computer Vision and Image 
Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M. ir Cheng, K. (2024). A Novel Method for Regional 
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš Nasia subbaseino 
(Gana) 3D geologinio modelio, sukurto hidrogeologiniais tikslais ir pagrįsto 
pakartotinai apdorotais B lauko duomenimis, kurie iš pradžių buvo surinkti 
mineralų žvalgybos tikslais. Solid Earth, 11, 349-361.4- -
2. "Point CLoud" duomenų rinkimas naudojant LiDAR jutiklius
Taškinių debesų duomenų rinkimas naudojant LiDAR jutiklius atlieka 
svarbų vaidmenį įvairiose taikomosiose programose ir ypač tinka didelės 
skiriamosios gebos 3D duomenims rinkti. LiDAR technologija skleidžia 
lazerio impulsus, kad priimtų nuo objektų atsispindėjusius signalus ir 
pagal juos apskaičiuotų atstumo informaciją. Ši informacija saugoma 
taškų debesies formatu, kuriame kiekvienas taškas turi X, Y ir Z 
koordinates ir atspindžio intensyvumą.
LiDAR taškų debesys gali būti įvairiose srityse, įskaitant miestų , 
aplinkos ir išteklių valdymą. Pavyzdžiui, jie gali būti naudingi 
struktūrinei miškų analizei arba tiksliam pastatų geodeziniam 
matavimui. Po to taškų debesys paverčiami 3D arba GIS duomenimis, 
juos vėliau apdorojant, kad būtų galima denozuoti, išlyginti ir atkurti 
paviršių. Šiam procesui naudojama įvairi programinė įranga, ypač GPU 
pagrįsti 3D vizualizavimo metodai, leidžiantys sudėtingiau nustatyti 
erdvines ribas.5)
LiDAR duomenys taip pat atlieka svarbų vaidmenį autonominių
transporto priemonių suvokimo sistemose. LiDAR taškų debesų
apdorojimas ir mokymas autonominio vairavimo srityje prisidėjo prie 
tikslaus kelio aplinkos suvokimo ir objektų aptikimo.6) Šie duomenys yra 
labai svarbūs sudarant didelės skiriamosios gebos realaus laiko 3D 
žemėlapius, kurie autonominėms transporto priemonėms saugiai judėti 
sudėtingomis kelio sąlygomis.
LiDAR taškų taip pat gali būti Pavyzdžiui, iš lėktuvuose sumontuotų
LiDAR duomenų galima atkurti geologinių darinių 3D modelius, kurie 
padeda žvalgyti požeminį vandenį ar atlikti geologinius tyrimus7)3D 
geologinis modeliavimas leidžia atlikti naujas geologines interpretacijas 
ir padeda geriau suprasti vietovės geologines savybes.
LiDAR technologijos privalumai - greitas duomenų gavimas ir didelis 
tikslumas, tačiau ji turi ir trūkumų, palyginti didelę kainą ir veikimą
lietingu ar oru. Siekiant įveikti šiuos techninius trūkumus, nuolat 
atliekami moksliniai tyrimai ir taikomoji veikla, LiDAR gali būti 
naudojama įvairiose pramonės šakose.5- -
LiDAR (Light Detection and Ranging) jutiklis - tai technologija, kuri 
naudoja lazerius objekto paviršiui matuoti, o duomenis galima naudoti 
3D erdvinei informacijai gauti. LiDAR jutiklio generuojami taškų
debesies duomenys yra daugybės taškų, išsidėsčiusių 3D erdvėje, 
rinkinys, kurių kiekvieną galima aprašyti aukščiu, atstumu ir vieta.
5) Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų skaičiavimas ir 
vizualizavimas. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Lidar Point Cloud Compression, Processing and Learning for Autonomous 
Driving (Lidar taškų debesų suspaudimas, apdorojimas ir mokymasis 
autonominiam vairavimui). IEEE Transactions on Intelligent Transportation 
Systems, 24, 962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš Nasia subbaseino 
(Gana) 3D geologinio modelio, sukurto hidrogeologiniais tikslais ir pagrįsto 
pakartotinai apdorotais B lauko duomenimis, kurie iš pradžių buvo surinkti 
mineralų žvalgybos tikslais. Solid Earth, 11, 349-361.6- -
sijos. Šie duomenys svarbūs autonominių transporto priemonių
aplinkos suvokimui, architektūros ir civilinės inžinerijos modeliavimui 
bei 3D žemėlapių sudarymui.
3. 3D objektų aptikimo technologija
3D objektų aptikimas yra svarbi objektų atpažinimo ir vietos nustatymo 
3D erdvėje technologija, kuri labai svarbi įvairiose srityse, įskaitant 
autonomines transporto priemones, ir papildytąją realybę. Ji pirmiausia 
3D duomenimis, surinktais naudojant LiDAR, RGB-D kameras ir 
stereovizorines sistemas.
Naudojant LiDAR sukurtus taškų debesis atpažįstama objektų vieta ir 
forma. Šioje srityje plačiai naudojami gilaus mokymosi modeliai, tokie 
kaip PointNet, ir šie metodai yra labai svarbūs kuriant didelės 
skiriamosios gebos 3D žemėlapius realiuoju laiku.8)
Tai objektų aptikimo metodas, kai 2D vaizdai, gauti RGB kameromis, 
derinami su 3D informacija. Šis metodas pagerina aptikimo našumą, 
pridėdamas objekto spalvinę ir raštų informaciją. Naujausiuose 
tyrimuose siūlomi tokie metodai, kaip FusionRCNN, kuris sujungia 
LiDAR ir kameros vaizdus, kad pagerintų aptikimo tikslumą.9)
Giluminio struktūros, pavyzdžiui, konvoliuciniai neuroniniai tinklai 
(CNN) ir pasikartojantys neuroniniai tinklai (RNN), naudojamos 3D 
savybėms ir atpažinti. Šie modeliai pagerina objektų klasifikavimo ir 
vietos nustatymo pagal duomenų rinkinius tikslumą, o ypač svarbu 
atpažįstant kliūtis autonominėse transporto priemonėse10).
Jis naudojamas vairavimo saugumui didinti, nes aptinka kelyje esančias 
kliūtis ir pėsčiuosius. Šioje srityje aktyviai moksliniai tyrimai, siekiant 
sujungti LiDAR taškų debesis su regos duomenimis, kad būtų galima 
tiksliau aptikti kliūtis.11)
Jis padeda robotui suprasti aplinką ir sąveikauti su ja. Tai ypač nustatant 
tikslią objektų buvimo vietą, kad robotas galėtų planuoti savo kelią ir 
atlikti užduotis.
atpažinti objektus ir reaguoti į juos realiuoju laiku, kad naudotojo 7- -
patirtis būtų geresnė. Pavyzdžiui, papildytoje realybėje, siekiant 
pagerinti sąveiką su virtualiais objektais, tiksliai nustatyti objektų vietą
ir formą.
8) Qian, R., Lai, X. ir Li, X. (2021). 3D objektų aptikimas autonominiam 
vairavimui: Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. ir Li, J. (2023).
FusionRCNN: LiDAR ir kameros sintezė dviejų etapų 3D objektų aptikimui. 
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. ir Zhang, Z. (2023). Super Sparse 3D 
Objektų aptikimas. IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. ir Li, J. (2023).
FusionRCNN: LiDAR ir kameros sintezė dviejų etapų 3D objektų aptikimui. 
Remote Sensing, 15, 1839.8- -
Šios technologijos nuolat tobulinamos todėl siūlomi vis tikslesni ir 
efektyvesni 3D objektų aptikimo sprendimai. Mokslinių tyrimų ir 
technologijų pažanga gerokai pagerina atpažinimo tikslumą realioje 
aplinkoje.
3D objektų aptikimas - tai tikslus konkrečių objektų 3D erdvėje 
identifikavimas ir klasifikavimas, kurį padeda atlikti įvairūs 3D erdvinių
duomenų apdorojimo metodai. Pastaruoju metu 3D objektų aptikimui 
aktyviai giliuoju mokymusi pagrįsti metodai. Atstovaujamos šios 
technologijosVoxelNet, PointNet ir PointRCNN.
3.1 "VoxeLNet"
"VoxelNet" yra novatoriška gilaus mokymosi architektūra, specialiai 
sukurta 3D objektams aptikti naudojant taškų debesis, o tai labai svarbu 
autonominio vairavimo sistemose. Ši architektūra naudoja unikalų
požiūrį, nes neapdorotus taškų debesų duomenis konvertuoja į
struktūrizuotą 3D vokselinį tinklelį, kad būtų galima efektyviai apdoroti 
ir išgauti požymius. Konvertavimas į vokselinę reprezentaciją yra nes jis 
leidžia "VoxelNet" veiksmingai naudoti 3D konvoliuciją erdvinei 
informacijai užfiksuoti, kartu užtikrinant skaičiavimo efektyvumą. Šis 
efektyvumas yra labai svarbus realaus laiko programoms, reikalingoms 
autonominiam vairavimui.
"VoxelNet" stiprybė gebėjimas įtraukti naują požymių kodavimo sluoksnį, 
kuris labai padidina kiekvieno vokselio reprezentacinę galią. Tai 
pasiekiama atsižvelgiant į unikalias kiekviename vokselio taške esančių
taškų savybes, todėl pagerėja tinklo gebėjimas aptikti ir klasifikuoti 
objektus sudėtingoje aplinkoje.12) Šis požymių kodavimo etapas yra 
sprendžiant problemas, kylančias dėl netaisyklingo ir reto taškų
debesies duomenų pobūdžio, kurį sunku apdoroti naudojant tradicinius 
2D konvoliucinius neuroninius tinklus.
Tyrimai , kad "VoxelNet" įnešė didelį indėlį į 3D objektų aptikimo sritį. 
Pavyzdžiui, dėl savo architektūros gebėjimo užtikrinti aukštą tikslumą ir 
kartu išlaikyti skaičiavimo efektyvumą, ji yra tinkamiausias 
pasirinkimas tarpįgyvendinimo programoms autonominėse transporto 
priemonėse.13) Be to, VoxelNet reto atvaizdavimo integracija leidžia 9- -
efektyviai apdoroti didelius duomenų kiekius, kurie paprastai 
aptinkami autonominio vairavimo scenarijuose.
"VoxelNet" sukūrimas - tai didelė pažanga 3D duomenų apdorojimo 
srityje ir pagrindas būsimoms autonominio vairavimo technologijų
naujovėms. Jis sprendžia pagrindinius šios srities uždavinius, 
derindamas veiksmingą vokselizaciją su pažangiais požymių kodavimo 
metodais.14) Tai ne tik pagerina aptikimo tikslumą, bet ir leidžia 
sudėtingiau vykdyti
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep 
Learning for 3D Point Clouds: A Survey (Gilusis mokymasis 3D taškų
debesims: apžvalga). IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. ir Chang, Z. (2021). Adversarial 
point cloud perturbations against 3D object detection in autonomous 
driving systems (Priešingi taškų debesų trikdžiai prieš 3D objektų aptikimą
autonominio vairavimo sistemose). Neurocomputing, 466, 27-36.
14) Chen, W., Li, P. ir Zhao, H. (2022). MSL3D: 3D objektų aptikimas iš
monokulinio, stereo ir taškinio debesies autonominiam vairavimui. 
Neurocomputing, 494, 23-32.10- -
"VoxelNet" plečia 3D suvokimo sistemos kūrimo ribas. Galingomis 
galimybėmis ir novatorišku požiūriu "VoxelNet" ir toliau įtaką
vykdomiems 3D taškų debesų apdorojimo ir autonominių sistemų
moksliniams tyrimams ir plėtrai.15)
"VoxelNet" yra naujoviškas 3D objektų aptikimo modelis, kuris apdoroja 
taškų debesies duomenis, konvertuodamas juos į 3D tinklelius 
(vokselius). Kiekvienas vokselis yra taškų debesies taškas, todėl modelis 
gali efektyviau erdvinę informaciją. Šią vokselinę informaciją
"VoxelNet" naudoja objektams aptikti prognozėms atlikti. Šio metodo 
privalumas tas, kad juo efektyviai ir greitai apdorojami dideli taškų
debesies duomenų kiekiai.
3.2 PointNet
"PointNet" yra novatoriška gilaus mokymosi architektūra, kuri iš esmės 
keičia 3D taškų debesų duomenų apdorojimą, nes tiesiogiai naudoja 
netvarkingus taškų rinkinius. Skirtingai nuo tradicinių metodų, kuriems 
reikia struktūrizuotų įvesties duomenų, "PointNet" naudoja simetrijos 
funkcijas, kad užtikrintų permutacijos invariantiškumą ir erdvinius 
ryšius tarp taškų, kad išliktų nepriklausomai nuo įvesties taškų
Pagrindinė PointNet naujovė - perceptronų (MLPir maksimalaus 
telkimo naudojimas. Tokia architektūra veiksmingai sujungia atskirų
taškų požymius į bendrą atvaizdavimą, kuris ypač naudingas tokioms 
užduotims kaip klasifikavimas ir segmentavimas. Dėl gebėjimo ir 
tiksliai apdoroti didelius taškų tapo pagrindiniu šios srities modeliu ir 
įkvėpė daugybę vėlesnių jo principais paremtų architektūrų.
"PointNet" poveikis neapsiriboja vien akademiniais tyrimais, bet ir 
praktiniu įgyvendinimu tokiose srityse kaip autonominis vairavimas ir 
robotų atpažinimas. Pavyzdžiui, autonominėse sistemose PointNet buvo 
naudojamas LiDAR duomenims apdoroti, siekiant pagerinti objektų
aptikimą ir navigaciją, nustatant ir klasifikuojant objektus nuo vieno 
bandymo iki kito.16) PointNet konstrukcija leidžia efektyviai tvarkyti su 
3D duomenimis susijusius sudėtingus klausimus, tokius kaip užtemimai 
ir taškų tankio pokyčiai, todėl PointNet yra universali priemonė
kompiuterinės regos programose.11- -
Dėl PointNet pasiektos pažangos PointNet buvo pritaikytas įvairiose 
naujoviškose srityse. Pavyzdžiui, jis buvo pritaikytas klasifikuojant iš
oro gautus LiDAR duomenis, taip padidinant nuotolinio stebėjimo 
operacijų tikslumą ir efektyvumą.17) PointNet pritaikomumas taip pat 
paskatino jį integruoti su fizika pagrįstais neuroniniais tinklais, kad būtų
galima analizuoti plyšių plitimą
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y. ir Jing, X. (2020). Daugelio 
vaizdų semantinio mokymosi tinklas, skirtas taškų debesimis pagrįstam 3D 
objektų aptikimui. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep 
Learning for 3D Point Clouds: A Survey (Gilusis mokymasis 3D taškų
debesims: apžvalga). IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W. ir Liu, G. (2023). Airborne LiDAR point cloud 
classification using PointNet++ network with full neighbourhood features 
(Orlaivio LiDAR taškų debesų klasifikavimas naudojant PointNet++ tinklą su 
pilno kaimyninio ryšio požymiais). PLOS ONE, 18.12- -
ir skysčių dinamikos modeliavimus, ir įrodyta juo galima spręsti 
sudėtingas pramonės problemas.18)
"Pointnet" ir toliau išlieka 3D duomenų apdorojimo etalonu, gerokai 
išplėtodama gilaus mokymosi modelių galimybes apdoroti taškų debesų
duomenis. Jo poveikis akivaizdus tiek teorinės pažangos, tiek praktinio 
taikymo požiūriu, o tai rodo, kad jis ir toliau išlieka aktualus ir 
pritaikomas besikeičiančioje dirbtinio intelekto ir mašininio mokymosi 
srityje.19)
PointNet yra modelis, kuris tiesiogiai apdoroti taškų debesies duomenis 
ir atpažinti objektus 3D erdvėje, neatsižvelgiant į kiekvieno taško 
eiliškumą. PointNet išgauna taškų savybes ir pagal jas atlieka 
klasifikavimą bei segmentavimą. Šis modelis gali susidoroti su taškų
debesų nestruktūrizuotumu ir gali būti naudojamas įvairiose srityse, 
pavyzdžiui, autonominio vairavimo, robotikos ir medicininių vaizdų
analizės srityse.
3.3 PointRCNN
PointRCNN yra svarbi sistema 3D objektų aptikimo srityje, ypač tokiose 
srityse kaip autonominis vairavimas. Šioje sistemoje naudojamas dviejų
etapų aptikimo procesas, siekiant pagerinti objektų aptikimo 3D taškų
debesies duomenyse tikslumą ir efektyvumą. Pirmasis žingsnis - objektų
pasiūlymų generavimas naudojant taškais pagrįstą vietinį pasiūlymų
tinklą. Šis žingsnis yra nes jis veikia tiesiogiai su neapdorotais taškų
debesies duomenimis ir leidžia išsaugoti išsamią erdvinę informaciją, 
kuri gali būti prarasta taikant tradicinius metodus, grindžiamus vaizdo 
projekcijomis arba vokselizacija.
Antrajame etape PointRCNN patikslina pradinį pasiūlymą, atlikdamas 
3D ribojančio lauko Taip pakoreguojamas dydis ir orientacija, kad jis 
geriau atitiktų aptiktus taškų debesies duomenų objektus. Naudojant 
požymius, išgautus tiesiogiai iš neapdoroto taškų debesies, PointRCNN 
pasiekia didesnį aptikimo tikslumą ypač sudėtingoje aplinkoje su 
sudėtinga geometrija ir užtemdymu.
Vienas iš pagrindinių PointRCNN privalumų - mokytis ištisai. Tokia 13- -
architektūra palengvina sklandų tinklo etapų integravimą, todėl 
pagerėja ne tik modelio aptikimo našumas, bet ir jo skaičiavimo 
efektyvumas, todėl jis tinka realaus laiko taikymams, pavyzdžiui, 
reikalingiems autonominio vairavimo sistemoms.
Tyrimai parodė, kad taškų debesų duomenis naudojantys metodai gali 
gerokai pagerinti 3D scenų supratimą ir interpretavimą autonominio 
vairavimo situacijose. Pavyzdžiui, naudojant PointRCNN pagrįstus kelių
taikinių aptikimo algoritmus ir vokselinių taškų debesų sintezės 
metodus, dėl jų universalumo ir
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: A deep 
learning solver for steady-state incompressible flows and thermal fields on 
multiple sets of irregular geometries (Fizika paremtas PointNet: gilaus 
mokymosi sprendiklis, skirtas pastovios būsenos nesuspaustiems srautams 
ir šiluminiams laukams keliose netaisyklingos geometrijos rinkiniuose). 
Journal of Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi 
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo 
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Be to, 3D taškų debesų ir gilaus mokymosi metodų apžvalgos kad šios 
sistemos tampa vis svarbesnės scenos supratimui autonominio 
vairavimo srityje.20)
Apskritai PointRCNN yra reikšminga 3D objektų aptikimo technologijos 
pažanga. gebėjimo tiesiogiai neapdorotus taškų duomenis ir efektyvaus 
dviejų pakopų aptikimo proceso ji yra galinga priemonė autonominio 
vairavimo kurioje greitas ir tikslus objektų yra labai svarbus saugumui 
ir našumui.
PointRCNN - tai technologija, kurioje 3D objektų aptikimui naudojamas 
"PointNet" pagrindu sukurtas CNN (konvoliucinis neuroninis tinklas) ir 
veiksmingai apdorojami taškų debesų duomenys, tiksliai aptikti 
objektus. PointRCNN - tai technologija, kuria esamas 2D objektų
aptikimo metodas išplečiamas 3D aplinkai ir taikoma autonominių
transporto priemonių objektų atpažinimui ir robotų aplinkos 
atpažinimui.
4. Paraiškos
PointRCNN atlieka svarbų vaidmenį autonominio vairavimo sistemose ir 
yra naudojami tiksliai atpažinti ir sekti objektus supančioje aplinkoje. 
Objektų naudojant 3D taškų gali padėti transporto priemonėms labai 
tiksliai kliūčių kelyje net ir sudėtingose eismo situacijose22).
Robotas naudoja 3D objektų aptikimo technologiją, kad galėtų
sąveikauti su aplinka. PointRCNN leidžia robotui suprasti aplinką ir 
atlikti reikiamus veiksmus.24)
Norint sklandžiai įterpti virtualius objektus į realų pasaulį AR aplinkoje, 
reikia tiksliai aptikti objektus 3D erdvėje. Šioje užduotyje svarbus 
vaidmuo PointRCNN.
Dronai turi gebėti atpažinti ir išvengti įvairių kliūčių skrydžio metu. 
PointRCNN gali būti naudojamas objektams aptikti realiuoju laiku pagal 
dronų jutiklių duomenis ir nustatyti saugų skrydžio maršrutą.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022). 
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion 15- -
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
21) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi 
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo 
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. ir Li, X. (2021). 3D objektų aptikimas autonominiam 
vairavimui: Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X. ir Li, H. (2022). 3D objektų aptikimas 
autonominiam vairavimui: International Journal of Computer Vision, 131, 
1909-1963.
24) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi 
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo 
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019).16- -
PointRCNN taikomas 3D miestų aplinkos modeliavimui ir analizei, 
suteikiant svarbių įžvalgų miestų planavimui ir valdymui. Tai padėti 
pagerinti transporto efektyvumą ir padidinti saugumą miestuose.
Tokiose programose PointRCNN yra labai naudingi tais atvejais, kai 
reikia didelio tikslumo ir apdorojimo realiuoju laiku. Tyrimai rodo, 
tokie metodai, kaip PointRCNN pagrįsti kelių objektų aptikimo 
algoritmai, įrodo savo našumą ir efektyvumą šiose srityse.26) PointRCNN 
padeda padidinti 3D objektų aptikimo tikslumą ir efektyvumą, o tai 
kuriant autonomines transporto priemones ir kitas pažangias sistemas.
3D erdvinių duomenų apdorojimo technologija daugelyje skirtingų
pramonės šakų. Kai kurios iš pagrindinių taikomųjų programų
4.1 Autonominės transporto priemonės
transporto priemonės - tai transporto priemonės, kurios, naudodamos 
pažangias technologijas, vairuoja pačios, be žmogaus įsikišimo. Šios 
transporto priemonės naudoja įvairius jutiklius, kameras, radarus, 
LiDAR ir kt., kad tiksliai žinotų aplinką. Šios technologijos kartu su 
duomenų apdorojimu realiuoju laiku yra labai svarbios nustatant 
saugius važiavimo maršrutus.
Ypač svarbi autonominių transporto priemonių sudedamoji dalis yra 3D 
objektų aptikimo technologija, kuri atlieka svarbų vaidmenį tiksliai 
nustatant ir atpažįstant aplink transporto priemonę esančius objektus. 
Pavyzdžiui, PointRCNN naudoja taškų debesų duomenis, kad būtų
galima atlikti didelės skiriamosios gebos transporto priemonės aplinkos 
analizę. Tai autonominėms transporto priemonėms realiuoju laiku 
atpažinti pėsčiuosius, kitas transporto priemones, kelio ženklus ir kt., 
kad būtų užtikrintas saugus vairavimas27).
Autonominės transporto priemonės taip pat išmokti vairavimo modelių
ir prisitaikyti prie įvairių vairavimo situacijų, taikydamos mašininio 
mokymosi ir dirbtinio intelekto technologijas. Šios technologijos gerinti 
transporto priemonių saugumą, efektyvumą ir naudotojų patirtį. Visų
pirma kelių jutiklių sintezės technologija pagerina 3D objektų aptikimo 
tikslumą ir patikimai veikti įvairiose aplinkose28).17- -
3D objektų aptikimo metodų, skirtų autonominio vairavimo programoms, 
apžvalga. IEEE Transactions on Intelligent Transportation Systems, 20, 3782-
3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022). 
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion 
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022). 
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion 
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Daugelio jutiklių sintezės 
technologija, skirta 3D objektų aptikimui autonominio vairavimo metu: 
IEEE Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonominės transporto priemonės pagrindinė ateities transporto 
sistemų inovacijų sritis, kurioje susilieja sudėtingi algoritmai ir jutiklių
technologijos. Šios technologijos daro teigiamą poveikį visai 
visuomeneines mažina transporto spūstis, eismo įvykių skaičių keliuose 
ir leidžia užtikrinti efektyvesnį eismo srautą29).
Autonominės transporto priemonės naudoja LiDAR jutiklius ir 3D 
objektų aptikimo technologiją, kad realiuoju laiku pastebėtų ir 
analizuotų transporto priemonės aplinką. Tai leidžia išvengti kliūčių, 
atpažinti pėsčiuosius, analizuoti sankryžas ir transporto priemonės 
saugumas ir vairavimo efektyvumas būtų kuo didesnis.
4.2 Sveikatos priežiūra
3D objektų aptikimo metodai medicinos srityje, ypač tokie kaip 
PointRCNN, gali būti plačiai taikomi. Šios technologijos daugiausia 
naudojamos medicininių vaizdų gavimo, chirurginės robotikos, pacientų
stebėjimo sistemose ir kt.
3D objektų aptikimo technologija tiksliai aptikti pažeidimus 
kompiuterinės tomografijos, magnetinio rezonanso ir ultragarso 
vaizduose. Tai ypač svarbu tokiose srityse kaip radiologija, kur ją galima 
derinti su kompiuterinės diagnostikos sistemomis, naudojančiomis 
dirbtinį intelektą ir mašininį mokymąsi, siekiant pagerinti diagnostikos 
tikslumą.30)
Chirurginėse robotinėse sistemose 3D objektų aptikimo technologija 
leidžia tiksliai atpažinti aplinkinius audinius ir organus operacijos metu, 
taip padėdama užtikrinti saugią ir tikslią operaciją. Kartu su 
medicininio dirbtinio intelekto pažanga tai gali labai padidinti 
chirurgijos efektyvumą ir saugumą.31)
3D jutikliai ir objektų aptikimo technologija gali analizuoti paciento 
judesius ir gyvybinius požymius realiuoju laiku, kad būtų galima anksti 
aptikti sutrikimus. Šios technologijos derinamos su dirbtiniu intelektu 
pagrįstomis pacientų stebėjimo sistemomis, kad būtų galima nuolat 
stebėti ir valdyti paciento būklę.32)19- -
Kartu su virtualia realybe (VR) ji galėtų būti naudojama medicinos 
mokymui ir mokymui. 3D objektų aptikimo technologija
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for 
Autonomous Driving Applications (3D objektų aptikimo metodų apžvalga 
autonominio vairavimo programoms). IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). AAPM darbo grupės 273 ataskaita: 
Rekomendacijos dėl geriausios dirbtinio intelekto ir mašininio mokymosi 
praktikos kompiuterinės diagnostikos medicininių vaizdų srityje. Medicinos 
fizika.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial 
intelligence in healthcare: a mastery. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support 
systems on nursing workflows in critical care units (Dirbtinio intelekto 
sprendimų paramos sistemų poveikis slaugos darbo eigai intensyviosios 
terapijos skyriuose). International nursing review, Nėra.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y. ir Yuan, X. (2023). 
Dirbtinis intelektas onkologijos klinikinių sprendimų paramos sistemose. 
International Journal of Medical Sciences, 20, 79-86.20- -
 atlieka svarbų vaidmenį padėdamas gydytojams ir sveikatos priežiūros 
specialistams imituoti operacijas ir diagnozes, todėl galima mokytis 
tikroviškoje aplinkoje.33)
Šios taikomosios programos padeda didinti diagnozavimo ir gydymo 
tikslumą medicinos srityje ir gerinti bendrą saugumą. Ypač 3D objektų
aptikimo technologija kartu su dirbtiniu intelektu spartina inovacijas 
sveikatos priežiūros srityje tampa svarbia priemone pacientų sveikatai ir 
saugai gerinti. Šie tyrimai suteikia naujų perspektyvų dėl medicininio 
dirbtinio intelekto komercinio, reguliavimo ir visuomeninio poveikio.34)
Medicinos srityje 3D erdvinių duomenų apdorojimas tiksliam 
diagnozavimui ir chirurginiam planavimui. 3D medicininių vaizdų, 
pavyzdžiui, kompiuterinės tomografijos ar magnetinio rezonanso 
tyrimų rezultatų, taškų debesų duomenys naudojami siekiant 
vizualizuoti operacijos vietą ir išmatuoti tikslią jos vietą bei dydį, kad 
chirurgija būtų tikslesnė.
4.3 Pramonės automatizavimas ir robotika
3D objektų aptikimo technologijos, ypač tokie modeliai kaip PointRCNN, 
iš esmės keičia pramonės automatizavimo ir robotikos sritį. Šios 
technologijos gerokai padidina efektyvumą ir tikslumą įvairiose 
pramonės šakose ir atlieka svarbų vaidmenį šiose konkrečiose srityse
3D objektų aptikimo technologija yra labai svarbi robotų sistemoms, kad 
jos galėtų atpažinti ir rūšiuoti objektus sandėlyje. Ji leidžia robotams 
tiksliai atpažinti įvairių dydžių ir formų objektus, todėl jie gali efektyviai 
atlikti judėjimo ir rūšiavimo užduotis. Šios technologijos didina 
pramoninių procesų efektyvumą ir palengvina logistikos sistemų
automatizavimą.35)
Kai pramoniniai robotai automatiškai surenka dalis, 3D objektų
aptikimas padidina surinkimo efektyvumą, nes atpažįsta tikslią dalių
padėtį ir orientaciją. Tai labai padeda didinti gamybos spartą ir mažinti 
defektų skaičių, todėl svarbų vaidmenį išmaniosios gamybos aplinkoje.36)
Jie naudojami gaminių geometrijai ir matmenims tikrinti naudojant 3D 
skenavimo technologiją ir svarbų vaidmenį užtikrinant gaminių kokybę, 21- -
anksti nustatant defektus ir mažinant sąnaudas. Šios automatizuotos 
dalys
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. ir Li, Y. (2020). Artificial 
Intelligence- Based Prediction of Lung Cancer Risk Using Nonimaging 
Electronic Medical Records: Deep Learning Approach (Dirbtiniu intelektu 
grindžiamas plaučių vėžio rizikos prognozavimas naudojant nevaizdinius 
elektroninius medicininius įrašus: gilaus mokymosi metodas). Journal of 
Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial 
intelligence in healthcare: a mastery. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P. ir 
White, M. (2021). Sim2Real in Robotics and Automation: Applications and 
Challenges (Sim2Real robotų ir automatikos srityje: taikymas ir iššūkiai). 
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. ir Kim, H. (2021).
Mokymusi pagrįstas robotų surinkimo automatizavimas išmaniosios 
gamybos tikslais. IEEE leidinys, 109, 423-440.22- -
Kokybės tikrinimo sistemos didina produktų patikimumą.37)
Siekiant padidinti robotų ir automatizavimo sistemų saugumą, 
naudojama 3D objektų aptikimo technologija. Tai leidžia atpažinti 
netoliese esančius ar saugiai Šie saugos mechanizmai padeda sumažinti 
nelaimingų atsitikimų skaičių pramoninėje aplinkoje.38)
Autonominėms transporto priemonėms arba dronams labai svarbu 
aptikti objektus ir planuoti savo maršrutus. 3D objektų aptikimo 
technologija šioms sistemoms efektyviai veikti, išvengti kliūčių ir 
saugiai atlikti pristatymo užduotis.39)
Šiose srityse 3D objektų aptikimo technologijos inovacijas pramonės 
automatizavimo srityje, padeda didinti našumą, mažinti išlaidas ir 
gerinti saugą. Ateityje šios technologijos ir toliau bus neatsiejama 
robotikos ir automatizavimo sistemų raidos dalis. Tyrimai rodo, kad šių
technologijų taikymas labai prisideda prie pramonės procesų
efektyvumo didinimo automatizuotų sistemų sudėtingumo valdymo40).
Pramonės automatizavimo ir robotikos srityje 3D erdvinių duomenų
apdorojimas naudojamas siekiant padidinti gamybos procesų
efektyvumą ir automatizuoti kokybės patikrinimus. Robotai naudoja 
LiDAR jutiklius arba 3D kameras, atpažintų gaminius, aptiktų
anomalijas ir padėtų spręsti kokybės problemas.
4.4 Saugos stebėjimo sistemos
Saugos stebėjimo sistemose 3D objektų aptikimo technologija svarbų
vaidmenį užtikrinant veiksmingus stebėjimo ir saugumo sprendimus 
įvairiose aplinkose. Ši technologija ypač tokiose srityse kaip stebėjimas 
realiuoju laiku, įsilaužimo aptikimas, incidentų prevencija, duomenų
analizė ir ataskaitų teikimas bei dirbtinio intelekto integravimas.
3D objektų aptikimo sistemose, turinčiose stebėjimo realiuoju laiku 
galimybes, naudojamos kameros ir jutikliai, kad būtų galima realiuoju 
laiku analizuoti supančią aplinką. Ši analizė realiuoju laiku leidžia 
tiksliai atpažinti žmones, transporto priemones ir objektus, o susidarius 
pavojingai situacijai nedelsiant įspėti. Tai labai svarbu didinant 
saugumą, ypač sudėtingoje aplinkoje, pavyzdžiui, keliuose ir oro 23- -
uostuose.
Kai kalbama apie įsilaužimo aptikimą, 3D objektų aptikimo technologija 
veiksmingai aptinka neįprastą judėjimą ar elgesį tam tikroje saugumo 
zonoje. Tai gali padėti anksti aptikti įsibrovėlį ir suteikti apsaugos 
darbuotojams neatidėliotiną pagalbą.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Pramonės 
automatizavimas ir gaminių kokybė: robotų gamybos transformacijos 
vaidmuo. Taikomoji ekonomika.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing 
Dynamic and Collaborative Automation and Robotics Software Systems. 
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotika: nuo automatizavimo iki išmaniųjų sistemų. 
Inžinerija.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Pramoninis matymas ir automatizavimas. Measurement Science and 
Technology, 33.24- -
Užkirskite kelią neteisėtam patekimui į saugias zonas, pateikdami 
raudonus įspėjimus.
Kalbant apie nelaimingų atsitikimų prevenciją, šios sistemos padeda 
išvengti nelaimingų atsitikimų įvairiose aplinkose, įskaitant pramonės 
objektus, anksti aptikdamos pavojus ir pateikdamos įspėjimus. 
Pavyzdžiui, automatinė įspėjimo sistema suveikti, kai darbuotojas 
priartėja prie pavojingos zonos, kad būtų išvengta nelaimingo atsitikimo.
Duomenų analizės ir ataskaitų rengimo galimybės padeda įvertinti 
saugumo padėtį ir nustatyti problemas atliekant tolesnę analizę, 
naudojant surinktus 3D duomenis. Ši analizė suteikia svarbių įžvalgų
būsimai saugumo strategijai ir nuolat tobulinti saugumą.
Integravus dirbtinį intelektą, 3D objektų aptikimo technologiją galima 
sujungti su mašininio mokymosi algoritmais ir sukurti pažangesnę
stebėjimo sistemą. Tai sistemai išmokti modelius ir įdiegti 
sudėtingesnius įspėjimo ir reagavimo mechanizmus.
Tokiu būdu 3D objektų aptikimo technologija tampa neatsiejama saugos 
stebėjimo sistemų dalimi, padedančia tenkinti įvairius saugumo 
poreikius ir didinančia objektų saugumą. Tikimasi, kad ateityje šios 
technologijos toliau tobulės, todėl bus kuriami sudėtingesni ir 
veiksmingesni saugos stebėjimo sprendimai. Ši technologinė pažanga 
virs galingesnėmis saugumo sistemomisypač integruojant jas su 
dirbtiniu intelektu41).
3D objektų aptikimo technologija taip pat svarbų vaidmenį saugos 
stebėjimo sistemose. LiDAR jutikliai ir 3D objektų aptikimo technologija 
naudojami siekiant aptikti įsibrovėlius arba nustatyti, ar netoliese yra 
žmonių. Jos taip pat analizuoti elgesio modelius 3D erdvėje, kad būtų
galima sekti neteisėtą veiklą ir užkirsti jai kelią.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. ir Cao, E. (2023). 
Infraraudonųjų spindulių mažų taikinių aptikimo metodas, pagrįstas 
svertiniu žmogaus vizualinio palyginimo mechanizmu, skirtas saugos 
stebėsenai. Remote. Sens., 15, 2922.26- -
4.5 VR/AR
Virtualioje realybėje (VR) ir papildytoje realybėje (AR) 3D objektų
aptikimo technologija labai pagerina naudotojų patirtį įvairiose 
pramonės šakose. 3D objektų aptikimas leidžia naudotojams virtualioje 
aplinkoje sąveikauti su realaus pasaulio objektais, o tai labai svarbu AR 
taikomosioms programoms, kad jos galėtų realiuoju laiku atpažinti 
aplinką ir tiksliai išdėstyti virtualius elementus bei jais manipuliuoti. 
Dėl to naudotojo patirtis tampa labiau įtraukianti.
VR aplinkoje 3D objektų aptikimas naudojamas tikroviškiems 
modeliams kurti. Taip galima kurti įvairių sričių, įskaitant medicinos, ir 
aviacijos, mokymų scenarijus, dalyviams saugiai patirti ir praktiškai 
išbandyti realias situacijas. VR/AR taikymas, ypač statybų saugos srityje, 
didina darbuotojų sąmoningumą saugos srityje42).
Žaidimų pramonėje 3D objektų aptikimas užtikrina patirtį, nes tiksliai 
seka žaidėjo judėjimą ir padėtį. Tai leidžia sąveikauti su virtualiais 
veikėjais ir padidina žaidimo tikroviškumą.
Architektūroje ir inžinerijoje AR technologija gali būti naudojama 
dizaino modeliams vizualizuoti realiame pasaulyje. Tai padėti iš anksto 
aptikti projektavimo proceso klaidas ir palengvinti bendravimą su 
klientais. Šios taikomosios programos gali būti ypač naudingos statybos 
saugos srityje43).
AR technologija padeda vartotojams priimti pirkimo sprendimus, nes 
leidžia virtualiai išbandyti produktus. Pavyzdžiui, jie gali iš anksto 
pasimatuoti baldus savo namuose arba išbandyti kosmetikos spalvas. 
Tai pagerina vartotojo pirkimo patirtį ir sąveiką.44)
Tokiu būdu 3D objektų aptikimo technologija suteikia naujoviškų VR ir 
AR patirčių ir yra naudojama įvairiose pramonės šakose. Ateityje šios 
technologijos ir toliau tobulės, todėl ir virtualios aplinkos sąveika taps 
dar sklandesnė ir natūralesnė. Tai labiau išplės VR ir AR technologijų
naudojimą švietimo, pramogų, prekybos ir kitose srityse. Kartu šių
technologijų pažanga naujų galimybių turizmo ir svetingumo sektoriuose45).27- -
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė virtualios 
ir papildytosios realybės (VR/AR) taikymo statybų saugos srityje apžvalga. 
Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė virtualios 
ir papildytosios realybės (VR/AR) taikymo statybų saugos srityje apžvalga. 
Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
"Virtualios realybės (VR) ir papildytosios realybės (AR) vaizdo reklamų
įtikinimo poveikis: konceptuali apžvalga" (The persuasion effects of virtual 
reality (VR) and augmented reality (AR) video advertisements: A conceptual 
review). Journal of Business Research.
45) Wei, W. (2019). Virtualiosios realybės (VR) ir papildytosios realybės (AR) 
turizmo ir svetingumo srityje mokslinių tyrimų pažanga. Journal of 
Hospitality and Tourism Technology, 10, 539-570.28- -
Virtualioje realybėje (VR) ir papildytoje realybėje (AR) 3D erdviniai 
duomenys atlieka svarbų vaidmenį sąveikaujant realaus pasaulio 
objektais. 3D erdviniai duomenys virtualius objektus tinkamai 
patalpinti realiame pasaulyje ir naudotojams natūraliai su jais 
sąveikauti.
5. Išvada
3D erdvinių duomenų apdorojimo technologija daro daugelyje sričių, 
įskaitant autonominį vairavimą, sveikatos priežiūrą, pramonę, saugą ir 
VR/AR. Visų pirma LiDAR jutikliai ir 3D objektų aptikimo technologijos 
vaidina svarbų vaidmenį kiekvienoje iš šių sričiųprisidėdamos prie 
aplinkos analizės realiuoju laiku, tikslios diagnostikos ir gydymo bei 
veiksmingų automatizavimo sistemų. Šios technologijos toliau tobulės 
ir užtikrins turtingesnę naudotojų patirtį įvairiose srityse.29- -
Nuorodos
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Lidar Point Cloud Compression, Processing and Learning for 
Autonomous Driving (Lidar taškų debesų suspaudimas, apdorojimas ir 
mokymasis autonominiam vairavimui). IEEE Transactions on Intelligent 
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for 
Autonomous Driving Applications (3D objektų aptikimo metodų
apžvalga autonominio vairavimo programoms). IEEE Transactions on 
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų
skaičiavimas ir vizualizavimas. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Dirbtinis intelektas medicinoje. New England 
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Pramonės procesų tobulinimas 
taikant automatizavimą ir robotiką. Machines.
6. Cao, M. ir Wang, J. (2020). Autonominio vairavimo transporto 
priemonių kliūčių aptikimas naudojant kelių LiDAR jutiklių sintezę. 
Journal of Dynamic Systems Measurement and Control - Transactions 
of the ASME, 142.
7. Chen, W., Li, P. ir Zhao, H. (2022). MSL3D: 3D objektų aptikimas iš
monokulinio, stereo ir taškinio debesies autonominiam vairavimui. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. ir Cao, E. (2023). 
Infraraudonųjų spindulių mažų taikinių aptikimo metodas, pagrįstas 
svertiniu žmogaus vizualinio palyginimo mechanizmu, skirtas saugos 
stebėsenai. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš
Nasia subbaseino (Gana) 3D geologinio modelio, sukurto 
hidrogeologiniais tikslais ir pakartotinai apdorotais B lauko 
duomenimis, kurie iš pradžių buvo surinkti mineralų žvalgybos tikslais. 
Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotizuotų procesų automatizavimas: mokslinis ir 30- -
pramoninis sisteminis kartografinis tyrimas. IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. ir Zhang, Z. (2023). Super 
Sparse 3D Objektų aptikimas. IEEE Transactions on Pattern Analysis and 
Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Taškų debesimis pagrįsti 3D objektų aptikimo ir klasifikavimo 
metodai savivaldžio vairavimo programoms: apžvalga ir taksonomija. 
Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). 
Gilus31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43, 
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, 
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., 
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. 
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM darbo grupės 273 ataskaita: 
Rekomendacijos dėl geriausios dirbtinio intelekto ir mašininio 
mokymosi praktikos, skirtos kompiuterinei diagnostikai medicininių
vaizdų srityje. Medicinos fizika.
15. Huang, S. (2019). Papildyta realybė ir virtualioji realybė: AR ir VR 
galia verslui. Informacinės technologijos ir turizmas, 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. ir Kim, H. 
(2021).
Mokymusi pagrįstas robotų surinkimo automatizavimas išmaniosios 
gamybos tikslais. IEEE leidinys, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). "Virtualios realybės (VR) ir papildytosios realybės (AR) vaizdo 
reklamų įtikinimo poveikis: konceptuali apžvalga" (The persuasion 
effects of virtual reality (VR) and augmented reality (AR) video 
advertisements: A conceptual review). Journal of Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. ir Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and 
shape retrieval (Triplanar konvoliucija su bendrais 2D branduoliais 3D 
klasifikavimui ir formos paieškai). Computer Vision and Image 
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M. ir Yoo, J. (2022). Įtraukiančios 
interaktyvios technologijos ir virtuali apsipirkimo patirtis: Vartotojų
suvokimo skirtumai tarp papildytosios realybės (AR) ir virtualiosios 
realybės (VR). Telematika ir informatika, 77, 101936.
20. Kusiak, A. 2023). Hyper-automation in manufacturing industry. J. 
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė
virtualios ir papildytosios realybės (VR/AR) taikymo statybų saugos 
srityje . Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022). 
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion 
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 32- -
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X. ir Li, H. (2022). 3D objektų aptikimas 
autonominiam vairavimui: International Journal of Computer Vision, 
131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Pramoninis matymas ir automatizavimas. Measurement Science and 
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial 
intelligence in healthcare: a mastery. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). Robotika: nuo automatizavimo iki išmaniųjų sistemų. 
Inžinerija.
27. Ren, S., Pan, X., Zhao, W., Nie, B. ir Han, B. 
(2022).33- -
3D objektų aptikimo transformatorius. Žiniomis pagrįstos sistemos, 259, 
110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: giliuoju 
mokymusi pagrįstas 3D objektų aptikimas naudojant semantinį taškų
debesį. Visual Computer, , 1-15.
29. Wei, W. (2019). Virtualiosios realybės (VR) ir papildytosios realybės 
(AR) turizmo ir svetingumo srityje mokslinių tyrimų pažanga. Journal of 
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M. ir Cheng, K. (2024). A Novel Method for 
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. ir Li, Y. (2020). 
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using 
Nonimaging Electronic Medical Records: Deep Learning Approach 
(Dirbtiniu intelektu pagrįsta plaučių vėžio rizikos prognozė naudojant 
nevaizdinius elektroninius medicininius įrašus: gilaus mokymosi 
metodas). Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Kompiuterizuotas aptikimas ir diagnozavimas / 
radiologija / mašininis mokymasis / gilusis mokymasis medicininių
vaizdų srityje. Medicinos fizika.

Pētījuma ziņojums: 3D telpisko datu apstrādes tehnoloģija 
un tās pielietojums  AI Research Institute 2025_01Youngho Hong
Kopsavilkumi:
Šis pētījums aptver 3D telpisko datu apstrādes tehnoloģiju izstrādi un 
pielietojumu, jo īpaši punktu mākoņa datu iegūšanas un 3D objektu 
noteikšanas tehnoloģijas, izmantojot LiDAR sensorus. Tajā galvenā 
uzmanība pievērsta 3D objektu noteikšanas tehnoloģijām VoxelNet, 
PointNet un PointRCNN un izskaidrots, kā šīs tehnoloģijas tiek 
izmantotas dažādās jomās, piemēram, autonomo transportlīdzekļu, 
veselības aprūpes, rūpnieciskās automatizācijas, drošības 
uzraudzības sistēmu un VR/AR jomā. Ar LiDAR sensoru savāktie 
punktu mākoņa dati ar augstu precizitāti analizē 3D telpu, un uz tiem 
balstītai 3D objektu noteikšanas tehnoloģijai svarīga nozīme 
reāllaika vides apzināšanā, precīzā diagnostikā, ražošanas procesu 
optimizācijā utt. Šajā pētījumā analizēta 3D telpisko datu apstrādes 
tehnoloģijas ietekme uz mūsdienu rūpniecību un tehnoloģiskajām 
inovācijām, kā arī aplūkots nākotnes attīstības potenciāls.
Atslēgas vārdi:
 3D telpiskie dati, LiDAR sensori, punktu mākoņi, 3D 
objektu noteikšana, VoxelNet, PointNet, PointRCNN, autonomi 
transportlīdzekļi, veselības aprūpe, rūpnieciskā automatizācija, 
drošības uzraudzības sistēmas, VR/AR, dziļā mācīšanās2- -
1. Ievads
Tā ietver datu vākšanas, glabāšanas, analīzes un vizualizācijas 
procesu, un trīsdimensiju telpiskās informācijas apstrādei izmanto 
tādas tehnoloģijas kā LiDAR, fotogrammetrija un 3D skenēšana. Šīs 
tehnoloģijas tiek izmantotas dažādās programmatūras platformās, no 
kurām galvenie rīki ģeogrāfiskās informācijas sistēmas (GIS) un 
datorizētā projektēšana (CAD). Tas veikt sarežģītu telpisko analīzi.
LiDAR izmanto lāzera impulsus, lai apkopotu attāluma datus, 
savukārt fotogrammetrija izmanto aerofotogrāfijas, lai izveidotu 3D 
modeļus. Šie dati tiek glabāti datu bāzē un pēc vajadzības izmantoti 
analīzei un vizualizācijai.1)
Pētījumi liecina, ka 3D CNN struktūras var izmantot, lai apgūtu 3D 
reprezentācijas, un ka to var izdarīt efektīvāk nekā ar tradicionālajām 
pilnībā 3D CNN balstītajām metodēm.2)
Uz GPU balstītas 3D vizualizācijas metodes ļauj veikt sarežģītāku un 
precīzāku telpisko norobežošanu.3)
3D modelēšana tiek izmantota kā būtisks instruments arhitektūras 
projektēšanas un simulācijas procesā. Tas ļauj konstrukciju drošību 
un palielināt projektu precizitāti.
3D telpiskie dati tiek izmantoti ekosistēmu pārmaiņu un katastrofu 
pārvaldības pētījumos. Piemēram, 3D ģeoloģisko modelēšanu 
izmanto gruntsūdeņu izpētē un ģeoloģiskajos pētījumos.4)
3D dati tiek izmantoti, lai izstrādātu aizraujošas vides, kas uzlabo 
lietotāja pieredzi. Tas izmantots dažādās nozarēs, tostarp izglītībā, 
veselības aprūpē un izklaidē.
3D telpisko datu apstrādes tehnoloģijas strauji attīstās dažādās jomās, 
jo īpaši punktu mākoņu datu iegūšanā un objektu noteikšanā 3D 
telpā, izmantojot LiDAR sensorus. Šīs tehnoloģijas revolūciju 
autonomo transportlīdzekļu, medicīnas lietojumu, rūpnieciskās 3- -
automatizācijas, drošības uzraudzības sistēmu un VR/AR vides jomā. 
Šajā pētījuma ziņojumā sniegta pamatizpratne par 3D telpisko datu 
apstrādes tehnoloģijām un izskaidrots, kā tās tiek izmantotas dažādās 
nozarēs.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana un 
vizualizācija. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020). 
Triplānu konvolūcija ar koplietojamiem 2D kodoliem 3D klasifikācijai un 
formas iegūšanai. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Novel Method for Regional 
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia apakšbaseina (Gana) 
3D ģeoloģiskā modeļa, kas izstrādāts hidroģeoloģiskiem mērķiem un balstīts 
uz pārstrādātiem B lauku datiem, kuri sākotnēji iegūti minerālu izpētes 
vajadzībām. Solid Earth, 11, 349-361.4- -
2. Point CLoud datu vākšana ar LiDAR sensoriem
Punktu mākoņu datu iegūšanai, izmantojot LiDAR sensorus, ir 
svarīga nozīme dažādos lietojumos, un tā ir īpaši piemērota augstas 
izšķirtspējas 3D datu iegūšanai. LiDAR tehnoloģija izstaro lāzera 
impulsus, lai saņemtu no objektiem atstarotos signālus un, 
pamatojoties uz tiem, aprēķinātu attāluma informāciju. Šī 
informācija tiek saglabāta punktu mākoņa formātā, kur katrs punkts 
satur X, Y un Z koordinātas un atstarošanas intensitāti.
LiDAR punktu mākoņus var izmantot dažādās jomās, tostarp , vides 
un resursu pārvaldībā. Piemēram, tie var būt noderīgi mežu 
strukturālajā analīzē vai ēku precīzā uzmērīšanā. Pēc tam punktu 
mākoņus pārveido 3D vai GIS datos, veicot to pēcapstrādi, lai veiktu 
denozēšanu, izlīdzināšanu un virsmas rekonstrukciju. Šajā procesā 
izmanto dažādas programmatūras, jo īpaši uz GPU balstītas 3D 
vizualizācijas metodes, kas ļauj veikt sarežģītāku telpisko 
norobežošanu.5)
LiDAR datiem ir svarīga nozīme arī autonomo transportlīdzekļu 
uztveres sistēmās. LiDAR punktu mākoņu apstrāde un apmācība 
autonomās braukšanas jomā ir veicinājusi precīzu ceļa vides uztveri 
un objektu noteikšanu.6) Šie dati ir būtiski, lai konstruētu augstas 
izšķirtspējas reāllaika 3D kartes, kas autonomajiem 
transportlīdzekļiem droši orientēties sarežģītos ceļa apstākļos.
LiDAR punktu var arī Piemēram, datus, kas iegūti, izmantojot LiDAR, 
var izmantot, lai rekonstruētu ģeoloģisko veidojumu 3D modeļus, kas 
veicina gruntsūdeņu izpēti vai ģeoloģiskos pētījumus.7) Šī 3D 
ģeoloģiskā modelēšana ļauj veikt jaunas ģeoloģiskās interpretācijas 
un palīdz labāk izprast teritorijas ģeoloģiskās īpašības.
LiDAR tehnoloģijas priekšrocības ir liela datu iegūšanas ātrums un 
augsta precizitāte, taču tai ir arī ierobežojumi, salīdzinoši augstas 
izmaksas un veiktspēja lietainā vai laikā. Lai pārvarētu šos tehniskos 
ierobežojumus, tiek veikti nepārtraukti pētījumi un izstrādes darbi, 
kas LiDAR izmantot plašākā nozaru klāstā.5- -
LiDAR (Light Detection and Ranging) sensors ir tehnoloģija, kas 
izmanto lāzeru, lai izmērītu objekta virsmu, un iegūtos datus var 
izmantot, lai iegūtu 3D telpisko informāciju. LiDAR sensora ģenerētie 
punktu mākoņa dati ir daudzu 3D telpā izvietotu punktu kopums, no 
kuriem katru var aprakstīt ar augstumu, attālumu un atrašanās vietu.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana un 
vizualizācija. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Lidar punktu mākoņu saspiešana, apstrāde un mācīšanās autonomai 
braukšanai. IEEE Transactions on Intelligent Transportation Systems, 24, 
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia apakšbaseina (Gana) 
3D ģeoloģiskā modeļa, kas izstrādāts hidroģeoloģiskiem mērķiem un balstīts 
uz pārstrādātiem B lauka datiem, kuri sākotnēji iegūti minerālu izpētes 
vajadzībām. Solid Earth, 11, 349-361.6- -
sijas. Šiem datiem ir būtiska nozīme autonomo transportlīdzekļu 
apkārtējās vides uztverē, modelēšanā arhitektūrā un 
inženierbūvniecībā, kā arī 3D kartēšanā.
3. 3D objektu noteikšanas tehnoloģija
3D objektu noteikšana ir svarīga tehnoloģija objektu atpazīšanai un 
atrašanās vietas noteikšanai 3D telpā, un tā būtiska dažādās jomās, 
tostarp autonomo transportlīdzekļu, un paplašinātās realitātes jomā. 
Tās pamatā galvenokārt 3D dati, kas iegūti, izmantojot LiDAR, RGB-D 
kameras un stereovīzijas sistēmas.
Lai atpazītu objektu atrašanās vietu un formu, tā izmanto LiDAR 
ģenerētus punktu mākoņus. Šajā jomā tiek plaši izmantoti tādi dziļās 
mācīšanās modeļi kā PointNet, un šīs metodes ir būtiskas, lai 
ģenerētu augstas izšķirtspējas reāllaika 3D kartes.8)
Tā ir metode objektu noteikšanai, apvienojot 2D attēlus, kas iegūti ar 
RGB kamerām, ar 3D informāciju. Šī metode uzlabo atklāšanas 
veiktspēju, pievienojot objekta krāsu un rakstu informāciju. 
Jaunākajos pētījumos ir ierosinātas tādas metodes kā FusionRCNN, 
kas apvieno LiDAR un kameras attēlus, lai uzlabotu noteikšanas 
precizitāti.9)
Lai un atpazītu 3D iezīmes, tiek izmantotas dziļās struktūras, 
piemēram, konvolūcijas neironu tīkli (CNN) un rekurentie neironu 
tīkli (RNN). Šie modeļi uzlabo objektu klasifikācijas un atrašanās 
vietas noteikšanas precizitāti, pamatojoties uz datu kopām, kas īpaši 
svarīgi šķēršļu atpazīšanai autonomos transportlīdzekļos.10)
To izmanto, lai uzlabotu braukšanas drošību, uz ceļa pamanot 
šķēršļus un gājējus. Šajā jomā veikti aktīvi pētījumi, lai apvienotu 
LiDAR punktu mākoņus ar redzes datiem precīzākai noteikšanai.11)
Tas palīdz robotam saprast un mijiedarboties ar apkārtējo vidi. Tas 
īpaši svarīgi, lai noteiktu precīzu objektu atrašanās vietu un palīdzētu 
robotam plānot savu ceļu un veikt uzdevumus.7- -
Atpazīt un reaģēt uz objektiem reālajā laikā, lai uzlabotu lietotāja 
pieredzi. Piemēram, paplašinātajā realitātē precīzi jānosaka objektu 
atrašanās vieta un forma, lai uzlabotu mijiedarbību ar virtuālajiem 
objektiem.
8) Qian, R., Lai, X., & Li, X. (2021). 3D objektu noteikšana autonomai 
braukšanai: Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR un kameras apvienošana divpakāpju 3D objektu 
noteikšanai. Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. un Zhang, Z. (2023). Īpaši blīva 3D 
objektu noteikšana. IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR un kameras apvienošana divpakāpju 3D objektu 
noteikšanai. Remote Sensing, 15, 1839.8- -
Šīs tehnoloģijas nepārtraukti attīstās nodrošinot precīzākus un 
efektīvākus 3D objektu noteikšanas risinājumus. Pētniecības un 
tehnoloģiju attīstība ievērojami uzlabo atpazīšanas precizitāti reālās 
vides apstākļos.
3D objektu noteikšana ir konkrētu objektu precīza identificēšana un 
klasificēšana 3D telpāko nodrošina dažādas 3D telpisko datu 
apstrādes metodes. Pēdējā laikā 3D objektu noteikšanai aktīvi 
izmantotas uz dziļo mācīšanos balstītas metodes. tehnoloģijām 
VoxelNet, PointNet un PointRCNN.
3.1 VoxeLNet
VoxelNet ir inovatīva dziļās mācīšanās arhitektūra, kas īpaši 
izstrādāta 3D objektu noteikšanai, izmantojot punktu mākoņus, kas ir 
ļoti svarīgi autonomās braukšanas sistēmās. Arhitektūra izmanto 
unikālu pieeju, pārvēršot neapstrādātus punktu mākoņa datus 
strukturētā 3D vokseļu režģī, lai nodrošinātu efektīvu apstrādi un 
pazīmju iegūšanu. Konvertēšana uz vokselu attēlojumu ir jo tā ļauj 
VoxelNet efektīvi izmantot 3D konvolūciju, lai iegūtu telpisko 
informāciju, vienlaikus nodrošinot skaitļošanas efektivitāti. Šī 
efektivitāte ir būtiska reāllaika lietojumiem, kas nepieciešami 
autonomai braukšanai.
VoxelNet stiprā puse ir tā spēja iekļaut jaunu iezīmju kodēšanas slāni, 
kas ievērojami palielina katra vokseļa reprezentatīvo spēju. Tas tiek 
panākts, ņemot vērā katrā vokselī esošo punktu unikālās īpašības, 
kas uzlabo tīkla spēju atklāt un klasificēt objektus sarežģītā vidē.12) 
Šis pazīmju kodēšanas posms ir lai risinātu problēmas, ko rada 
punktu mākoņa datu neregularitāte un retums, ko ir grūti apstrādāt, 
izmantojot tradicionālos 2D konvolūcijas neironu tīklus.
Pētījumi liecina, ka VoxelNet ir devis ievērojamu ieguldījumu 3D 
objektu noteikšanas jomā. Piemēram, tā arhitektūras spēja 
nodrošināt augstu precizitāti, vienlaikus saglabājot skaitļošanas 
efektivitāti, padara to par vēlamo izvēli savstarpējās implementācijas 9- -
lietojumiem autonomajos transportlīdzekļos.13) Turklāt VoxelNet 
retās reprezentācijas integrācija ļauj tam efektīvi apstrādāt lielus 
datu apjomus, kas parasti sastopami autonomās braukšanas 
scenārijos.
VoxelNet izveide ir nozīmīgs sasniegums 3D datu apstrādē un pamatu 
nākotnes inovācijām autonomās braukšanas tehnoloģiju jomā. Tā 
risina galvenos uzdevumus šajā jomā, apvienojot efektīvu 
vokselizāciju ar progresīvām pazīmju kodēšanas metodēm.14) Tas ne 
tikai uzlabo noteikšanas precizitāti, bet arī ļauj veikt sarežģītākas 
izpildes
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep 
Learning for 3D Point Clouds: A Survey. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Adversarial 
point cloud perturbations against 3D object detection in autonomous 
driving systems. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D objektu noteikšana no 
monokulārā, stereo un punktu mākoņa autonomai braukšanai. 
Neurocomputing, 494, 23-32.10- -
VoxelNet paplašina 3D uztveres sistēmu izstrādes robežas. Pateicoties 
jaudīgajai veiktspējai un novatoriskajai pieejai, VoxelNet turpina 
notiekošos pētījumus un attīstību 3D punktu mākoņu apstrādes un 
autonomo sistēmu jomā.15)
VoxelNet ir inovatīvs 3D objektu noteikšanas modelis, kas apstrādā 
punktu mākoņa datus, pārveidojot tos 3D režģos (vokselos). Katrs 
vokselis ir punkts punktu mākonī, kas ļauj modelim efektīvāk 
telpisko informāciju. VoxelNet izmanto šo vokseļu informāciju, 
noteiktu objektus un veiktu prognozes. pieejas priekšrocība ir tā, ka 
tā ir efektīva un ātra, lai apstrādātu lielu daudzumu punktu mākoņa 
datu.
3.2 PointNet
PointNet ir revolucionāra dziļās mācīšanās arhitektūra, kas radikāli 
maina 3D punktu mākoņu datu apstrādi, tieši izmantojot 
nesakārtotas punktu kopas. Atšķirībā no tradicionālajām metodēm, 
kas prasa strukturētus ievades datus, PointNet izmanto simetrijas 
funkcijas, lai nodrošinātu permutācijas invarianci, telpiskās 
attiecības starp punktiem, lai būtuneatkarīgi no ievades punktu 
PointNet galvenais jauninājums ir perceptronu (MLPun maksimālās 
apvienošanas izmantošana. Šī arhitektūra efektīvi apvieno atsevišķu 
punktu iezīmes globālā attēlojumā, kas ir īpaši noderīgs tādiem 
uzdevumiem kā klasifikācija un segmentācija. Pateicoties tās spējai 
un precīzi lielus punktu , ir pamatmodeli šajā jomā, un tas ir 
iedvesmojis daudzas turpmākas uz tā principiem balstītas 
arhitektūras.
PointNet ietekme sniedzas tālāk par akadēmiskajiem pētījumiem un 
praktiski tiek īstenota tādās jomās kā autonoma braukšana un robotu 
atpazīšana. Piemēram, autonomās sistēmās PointNet ir izmantots 
LiDAR datu apstrādei, lai uzlabotu objektu noteikšanu un navigāciju, 
identificējot un klasificējot objektus no viena izmēģinājuma uz 
nākamo.16) PointNet konstrukcija ļauj tam efektīvi apstrādāt 
sarežģījumus, kas saistīti ar 3D datiem, piemēram, oklūzijas un 11- -
punktu blīvuma variācijas, padarot to par daudzpusīgu rīku 
datorredzes lietojumos.
PointNet sasniegumi ir veicinājuši PointNet pielāgošanu dažādos 
inovatīvos kontekstos. Piemēram, tas ir izmantots, lai klasificētu 
lidaparāta LiDAR datus, uzlabojot attālās izpētes precizitāti un 
efektivitāti.17) PointNet pielāgošanās spēja ir arī ļāvusi to integrēt ar 
fizikas neironu tīkliem, lai analizētu plaisu izplatīšanos.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Vairāku skatu 
semantiskās mācīšanās tīkls uz punktu mākoņa balstītai 3D objektu 
noteikšanai. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep 
Learning for 3D Point Clouds: A Survey. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR punktu mākoņu 
klasifikācija, izmantojot PointNet++ tīklu ar pilnas apkārtnes pazīmēm. 
PLOS ONE, 18.12- -
un šķidrumu dinamikas simulācijas, un ir pierādīts, ka ar to var 
atrisināt sarežģītas rūpnieciskas problēmas.18)
Pointnet turpina kalpot par etalonu 3D datu apstrādē, ievērojami 
uzlabojot dziļās mācīšanās modeļu spēju apstrādāt punktu mākoņa 
datus. Tās ietekme ir redzama gan teorētiskajos sasniegumos, gan 
praktiskajos lietojumos, kas liecina par tās pastāvīgo nozīmi un 
pielāgošanās spēju mākslīgā intelekta un mašīnmācīšanās jomā.19)
PointNet ir modelis, kas tieši apstrādāt punktu mākoņa datus un 
atpazīt objektus 3D telpā neatkarīgi no katra punkta secības. 
PointNet iegūst punktu pazīmes un, pamatojoties uz tām, veic 
klasifikāciju un segmentāciju. Šis modelis var apstrādāt punktu 
mākoņu nestrukturēto raksturu, un to var izmantot dažādās jomās, 
piemēram, autonomā braukšanā, robotikā un medicīnisko attēlu 
analīzē.
3.3 PointRCNN
PointRCNN ir svarīga sistēma 3D objektu noteikšanas jomā, jo īpaši 
tādās lietojumprogrammās kā autonoma braukšana. Sistēma izmanto 
divpakāpju noteikšanas procesu, lai uzlabotu objektu noteikšanas 
precizitāti un efektivitāti 3D punktu mākoņa datos. Pirmais solis ir 
objektu ierosinājumu ģenerēšana, izmantojot uz punktiem balstītu 
vietējo ierosinājumu tīklu. Šis solis ir jo tas darbojas tieši ar 
neapstrādātiem punktu mākoņa datiem, saglabājot detalizētu 
telpisko informāciju, kas var tikt zaudēta tradicionālajās metodēs, 
kuras balstās uz attēlu projekcijām vai vokselēšanu.
Otrajā posmā PointRCNN precizē sākotnējo priekšlikumu, veicot 3D 
ierobežojošo kastu Tādējādi tiek pielāgots izmērs un orientācija, lai tā 
labāk atbilstu punktu mākoņa datos atklātajiem objektiem. 
Izmantojot pazīmes, kas iegūtas tieši no neapstrādāta punktu 
mākoņa, PointRCNN sasniedz lielāku noteikšanas precizitāti, jo īpaši 
sarežģītās vidēs ar sarežģītu ģeometriju un oklūzijām.
Viena no PointRCNN galvenajām priekšrocībām ir tā mācīties no 13- -
gala līdz galam. Šī arhitektūra atvieglo tīkla posmu integrāciju, 
uzlabojot ne tikai modeļa noteikšanas veiktspēju, bet arī tā 
skaitļošanas efektivitāti, padarot to piemērotu reāllaika lietojumiem, 
piemēram, tādiem, kas nepieciešami autonomās braukšanas 
sistēmām.
Pētījumi liecina, ka metodes, kurās izmanto punktu mākoņa datus, 
var ievērojami uzlabot 3D ainu izpratni un interpretāciju autonomās 
braukšanas situācijās. Piemēram, uz PointRCNN un vokseļu punktu 
mākoņu saplūšanas metodēm balstītus vairāku mērķu noteikšanas 
algoritmus var izmantot dinamiskos scenārijos, jo tie ir daudzpusīgi 
un daudzveidīgi.
18) Kashefi, A., & Mukerji, T. (2022). Fizikāli informēts PointNet: dziļas 
mācīšanās risinātājs stabila stāvokļa nesaspiestām plūsmām un termiskiem 
laukiem uz vairākām neregulāru ģeometriju kopām. Journal of 
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo 
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Turklāt apsekojumi 3D punktu mākoņu un dziļās mācīšanās pieeju 
jomā ka šo sistēmu nozīme autonomas braukšanas ainu izpratnē 
arvien pieaug.20)
Kopumā PointRCNN ir nozīmīgs 3D objektu noteikšanas tehnoloģijas 
sasniegums. Tās spēja tieši apstrādāt neapstrādātus punktu datus un 
efektīvs divpakāpju noteikšanas process spēcīgu rīku autonomās 
braukšanas , kur ātra un precīza objektu ir būtiska drošībai un 
veiktspējai.
PointRCNN ir tehnoloģija, kas 3D objektu noteikšanai izmanto CNN 
(konvolūcijas neironu tīklu), kura pamatā ir PointNet, un efektīvi 
apstrādā punktu mākoņa datus, precīzi noteiktu objektus. 
PointRCNN ir tehnoloģija, kas paplašina esošo 2D objektu 
noteikšanas metodi uz 3D vidi un tiek izmantota autonomo 
transportlīdzekļu objektu atpazīšanai un robotu vides atpazīšanai.
4. Pieteikumi
PointRCNN ir būtiska nozīme autonomās braukšanas sistēmās, un 
tos izmanto, lai precīzi atpazītu un izsekotu objektus apkārtējā vidē. 
Objektu , izmantojot 3D punktu , var palīdzēt transportlīdzekļiem ar 
augstu precizitāti šķēršļiem uz ceļa pat sarežģītās satiksmes 
situācijās.22)
Robots izmanto 3D objektu noteikšanas tehnoloģiju, lai 
mijiedarbotos ar vidi. PointRCNN ļauj robotam izprast savu vidi no 
brauciena uz braucienu un veikt nepieciešamos uzdevumus.24)
Lai virtuālos objektus bez problēmām ievietotu reālajā pasaulē AR 
vidē, ir nepieciešama precīza objektu noteikšana 3D telpā. 
PointRCNN svarīga loma šajā uzdevumā.
Droniem ir nepieciešama spēja atpazīt un izvairīties no dažādiem 
šķēršļiem lidojuma laikā. PointRCNN var izmantot, lai reāllaikā 
atpazītu objektus no drona sensoru datiem un noteiktu drošu 
lidojuma trajektoriju.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN. 
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
21) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo 
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D objektu noteikšana autonomai 
braukšanai: Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D objektu noteikšana 
autonomai braukšanai: International Journal of Computer Vision, 131, 1909-
1963.
24) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo 
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019).16- -
PointRCNN tiek izmantots pilsētvides 3D modelēšanai un analīzei, 
sniedzot svarīgu ieskatu pilsētu plānošanā un pārvaldībā. Tas 
palīdzēt uzlabot transporta efektivitāti un uzlabot drošību pilsētās.
Šajos lietojumos PointRCNN ir ļoti noderīgi situācijās, kad 
nepieciešama augsta precizitāte un reāllaika apstrāde. Pētījumi 
liecina, ka tādas metodes kā uz PointRCNN balstīti vairāku mērķu 
noteikšanas algoritmi savu veiktspēju un efektivitāti šajos 
lietojumos.26) PointRCNN palīdz maksimāli palielināt 3D objektu 
noteikšanas precizitāti un efektivitāti, kas svarīgi autonomo 
transportlīdzekļu un citu progresīvu sistēmu attīstībai.
3D telpisko datu apstrādes tehnoloģija izmantota daudzās nozarēs. 
Daži no galvenajiem lietojumiem ir šādi.
4.1 Autonomie transportlīdzekļi
transportlīdzekļi ir transportlīdzekļi, kas izmanto modernas 
tehnoloģijas, lai vadītu sevi bez cilvēka iejaukšanās. Šie 
transportlīdzekļi izmanto dažādus sensorus, kameras, radarus, 
LiDAR un citus, lai precīzi pārzinātu apkārtējo vidi. Šīs tehnoloģijas 
apvienojumā ar reāllaika datu apstrādi ir būtiskas, lai noteiktu drošus 
braukšanas maršrutus.
Jo īpaši 3D objektu noteikšanas tehnoloģija ir autonomo 
transportlīdzekļu galvenā sastāvdaļa, kurai ir svarīga nozīme, lai 
precīzi noteiktu un atpazītu objektus ap transportlīdzekli. Piemēram, 
PointRCNN izmanto punktu mākoņa datus, lai varētu veikt 
transportlīdzekļa apkārtnes augstas izšķirtspējas analīzi. Tas 
autonomajiem transportlīdzekļiem reāllaikā atpazīt gājējus, citus 
transportlīdzekļus, ceļa zīmes un citus objektus, lai nodrošinātu 
drošu braukšanu.27)
Autonomajiem transportlīdzekļiem arī spēja apgūt braukšanas 
paradumus un pielāgoties dažādām braukšanas situācijām, 
izmantojot mašīnmācīšanās un mākslīgā intelekta tehnoloģijas. Šīs 17- -
tehnoloģijas uzlabot transportlīdzekļu drošību, efektivitāti un 
lietotāju pieredzi. Jo īpaši vairāku sensoru saplūšanas tehnoloģija 
uzlabo 3D objektu noteikšanas precizitāti, uzticamu darbību dažādās 
vidēs28).
Pārskats par 3D objektu noteikšanas metodēm autonomās braukšanas 
lietojumprogrammām. IEEE Transactions on Intelligent Transportation 
Systems, 20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN. 
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN. 
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-sensoru saplūšanas 
tehnoloģija 3D objektu noteikšanai autonomā braukšanā: IEEE Transactions 
on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonomie transportlīdzekļi viena no galvenajām inovāciju jomām 
nākotnes transporta sistēmās, jo tajās tiek apvienoti sarežģīti 
algoritmi un sensoru tehnoloģijas. Šīm tehnoloģijām ir pozitīva 
ietekme uz sabiedrību kopumā, jo tās samazina satiksmes 
sastrēgumus, samazina ceļu satiksmes negadījumu skaitu un 
nodrošina efektīvāku satiksmes plūsmu.29)
Autonomie transportlīdzekļi izmanto LiDAR sensorus un 3D objektu 
noteikšanas tehnoloģiju, lai reāllaikā uztvertu un analizētu 
transportlīdzekļa apkārtni. Tas ļauj izvairīties no šķēršļiem, atpazīt 
gājējus, analizēt krustojumus u. , lai maksimāli palielinātu 
transportlīdzekļa drošību un braukšanas efektivitāti.
4.2 Veselības aprūpe
3D objektu noteikšanas metodēm medicīnas jomā, jo īpaši tādām kā 
PointRCNN, plašs pielietojuma spektrs. Šīs tehnoloģijas galvenokārt 
izmanto medicīniskajā attēlveidošanā, ķirurģiskajā robotikā, 
pacientu uzraudzības sistēmās u. c.
3D objektu noteikšanas tehnoloģija palīdz noteikt bojājumus 
datortomogrāfijas, magnētiskās rezonanses un ultraskaņas attēlos. 
Tas ir īpaši svarīgi tādās jomās kā radioloģija, kur to var apvienot ar 
datorizētās diagnostikas sistēmām, kurās izmanto mākslīgo intelektu 
un mašīnmācīšanos, lai uzlabotu diagnostikas precizitāti.30)
Ķirurģiskajās robotizētajās sistēmās 3D objektu noteikšanas 
tehnoloģija ļauj operācijas laikā precīzi atpazīt apkārtējos audus un 
orgānus, palīdzot nodrošināt drošu un precīzu operāciju. Kopā ar 
medicīniskā mākslīgā intelekta sasniegumiem tas var ievērojami 
uzlabot operāciju efektivitāti un drošību.31)
3D sensori un objektu noteikšanas tehnoloģija var analizēt pacienta 
kustības reālajā laikā un dzīvības rādītājus, lai agrīnā stadijā atklātu 
novirzes. Šīs tehnoloģijas apvienot ar mākslīgā intelekta balstītām 
pacientu uzraudzības sistēmām, lai nepārtraukti sekotu līdzi 
pacienta stāvoklim un pārvaldītu to.32)19- -
Apvienojumā ar virtuālo realitāti (VR) to varētu izmantot medicīnas 
izglītībā un apmācībā. 3D objektu noteikšanas tehnoloģija
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). Pārskats par 3D objektu noteikšanas metodēm 
autonomās braukšanas lietojumiem. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). AAPM darba grupas 273. ziņojums: 
Ieteikumi par labāko praksi mākslīgā intelekta un mašīnmācīšanās jomā 
datorizētai diagnostikai medicīniskās attēlveidošanas jomā. Medicīnas fizika.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Mākslīgais 
intelekts veselības aprūpē: meistarība. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support 
systems on nursing workflows in critical care units [Mākslīgā intelekta 
lēmumu atbalsta sistēmu ietekme uz aprūpes darba plūsmu kritiskās 
aprūpes nodaļās]. International nursing review, Nav.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023). 
Mākslīgais intelekts klīnisko lēmumu atbalsta sistēmās onkoloģijā. 
International Journal of Medical Sciences, 20, 79-86.20- -
 ir liela nozīme, palīdzot ārstiem un veselības aprūpes speciālistiem 
simulēt operācijas un diagnozes, ļaujot mācīties reālā vidē.33)
Šie lietojumi palīdz palielināt diagnostikas un ārstēšanas precizitāti 
medicīnas jomā un uzlabot vispārējo drošību. Jo īpaši 3D objektu 
noteikšanas tehnoloģija apvienojumā ar mākslīgo intelektu paātrina 
inovācijas veselības aprūpē kļūst par svarīgu instrumentu pacientu 
veselības un drošības uzlabošanai. Šie pētījumi sniedz jaunas 
perspektīvas par mākslīgā intelekta komerciālo, regulatīvo un 
sabiedrisko ietekmi medicīnā.34)
Medicīnas jomā 3D telpisko datu apstrādi precīzai diagnostikai un 
ķirurģiskai plānošanai. Punktu mākoņa datus no 3D medicīniskās 
attēlveidošanas, piemēram, datortomogrāfijas vai magnētiskās 
rezonanses rezultātiem, izmanto, lai vizualizētu ķirurģiskās 
operācijas vietu un izmērītu tās precīzu atrašanās vietu un lielumu, 
tādējādi uzlabojot ķirurģisko precizitāti.
4.3 Rūpnieciskā automatizācija un robotika
3D objektu noteikšanas tehnoloģijas, jo īpaši tādi modeļi kā 
PointRCNN, revolucionizē rūpnieciskās automatizācijas un robotikas 
jomu. Šīs tehnoloģijas ievērojami uzlabo efektivitāti un precizitāti 
dažādās nozarēs, un tām ir svarīga nozīme šādās konkrētās jomās.
3D objektu noteikšanas tehnoloģija ir būtiska robotizētām sistēmām, 
lai atpazītu un šķirotu objektus noliktavā. Tā ļauj robotiem precīzi 
atpazīt dažāda izmēra un formas objektus, ļaujot tiem efektīvi veikt 
pārvietošanas un šķirošanas uzdevumus. Šīs tehnoloģijas palielina 
rūpniecisko procesu efektivitāti un atvieglo loģistikas sistēmu 
automatizāciju.35)
Kad rūpnieciskie roboti automātiski montē detaļas, 3D objektu 
noteikšana palielina montāžas efektivitāti, jo ļauj atpazīt precīzu 
detaļu pozīciju un orientāciju. Tas būtiski palielina ražošanas ātrumu 
un samazina defektu skaitu, un tam svarīga nozīme viedās ražošanas 
vidē.36)21- -
Tos izmanto, lai pārbaudītu izstrādājumu ģeometriju un izmērus, 
izmantojot 3D skenēšanas tehnoloģiju, un tiem svarīga loma 
izstrādājumu kvalitātes nodrošināšanā, defektu agrīnā atklāšanā un 
izmaksu samazināšanā. Šīs automatizētās detaļas
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Artificial Intelligence- Based Prediction of Lung Cancer Risk Using 
Nonimaging Electronic Medical Records: Deep Learning Approach (Ar 
mākslīgo intelektu balstīta plaušu vēža riska prognozēšana, izmantojot 
elektroniskos medicīniskos ierakstus bez attēliem: dziļās mācīšanās pieeja). 
Journal of Medical Internet Research, 23. lpp.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Mākslīgais 
intelekts veselības aprūpē: meistarība. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., & 
White, M. (2021). Sim2Real in Robotics and Automation: Applications and 
Challenges (Sim2Real robotikā un automatizācijā: lietojumi un izaicinājumi). 
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Uz mācīšanos balstīta robotizētas montāžas automatizācija viedai ražošanai. 
Proceedings of the IEEE, 109, 423-440.22- -
Kvalitātes pārbaudes sistēmas palielina produktu uzticamību.37)
Lai palielinātu robotu un automatizācijas sistēmu drošību, tiek 
izmantota 3D objektu noteikšanas tehnoloģija. Tā ļauj atpazīt tuvumā 
esošus vai droši. Šie drošības mehānismi palīdz samazināt nelaimes 
gadījumu skaitu rūpnieciskajā vidē.38)
Autonomiem transportlīdzekļiem vai droniem ir svarīgi noteikt 
objektus un plānot to maršrutus. 3D objektu noteikšanas tehnoloģija 
šīm sistēmām efektīvi darboties, izvairīties no šķēršļiem un droši 
veikt piegādes uzdevumus.39)
Šajās jomās 3D objektu noteikšanas tehnoloģijas inovāciju 
virzītājspēks rūpniecības automatizācijā, palīdzot palielināt 
produktivitāti, samazināt izmaksas un uzlabot drošību. Nākotnē šīs 
tehnoloģijas arī turpmāk būs neatņemama robotikas un 
automatizācijas sistēmu attīstības sastāvdaļa. Pētījumi liecina, ka šo 
tehnoloģiju izmantošana dod nozīmīgu ieguldījumu rūpniecisko 
procesu efektivitātes palielināšanā automatizēto sistēmu sarežģītības 
pārvaldībā.40)
Rūpnieciskajā automatizācijā un robotikā 3D telpisko datu apstrādi 
izmanto, lai palielinātu ražošanas procesu efektivitāti un 
automatizētu kvalitātes pārbaudes. Roboti izmanto LiDAR sensorus 
vai 3D kameras atpazītu produktus, atklātu anomālijas un palīdzētu 
risināt kvalitātes problēmas.
4.4 Drošības uzraudzības sistēmas
Drošības uzraudzības sistēmās 3D objektu noteikšanas tehnoloģijai 
svarīga nozīme, lai nodrošinātu efektīvus uzraudzības un drošības 
risinājumus dažādās vidēs. Šī tehnoloģija ir īpaši nozīmīga tādās 
jomās kā reāllaika uzraudzība, ielaušanās atklāšana, incidentu 
novēršana, datu analīze un ziņošana, kā arī mākslīgā intelekta 
integrācija.
3D objektu noteikšanas sistēmas ar reāllaika uzraudzības iespējām 23- -
izmanto kameras un sensorus, lai reāllaikā analizētu apkārtējo vidi. 
Šī reāllaika analīze ļauj precīzi atpazīt cilvēkus, transportlīdzekļus un 
objektus un sniedz tūlītējus brīdinājumus bīstamas situācijas 
gadījumā. Tas ir būtiski, lai palielinātu drošību, jo īpaši sarežģītā 
vidē, piemēram, uz ceļiem un lidostās.
Kad runa ir par ielaušanās atklāšanu, 3D objektu atklāšanas 
tehnoloģija ir efektīva, lai noteiktu neparastu kustību vai uzvedību 
konkrētā drošības zonā. Tas var ļaut agrīni atklāt iebrucēja tuvošanos 
un nodrošināt apsardzes darbiniekiem tūlītēju palīdzību.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Rūpnieciskā 
automatizācija un produktu kvalitāte: robotizētas ražošanas transformācijas 
nozīme. Lietišķā ekonomika.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Dynamic and 
Collaborative Automation and Robotics Software Systems Designing. IEEE 
Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotika: no automatizācijas līdz inteliģentām sistēmām. 
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Rūpnieciskā redze un automatizācija. Measurement Science and Technology, 
33.24- -
Novērst nesankcionētu iekļūšanu drošās zonās, sniedzot sarkanos 
brīdinājumus.
Attiecībā uz nelaimes gadījumu novēršanu šīs sistēmas novērš
nelaimes gadījumus dažādās vidēs, tostarp rūpniecības objektos, 
savlaicīgi atklājot apdraudējumus un sniedzot brīdinājumus. 
Piemēram, automātisko brīdināšanas sistēmu iedarbināt, kad 
darbinieks tuvojas bīstamai zonai, lai novērstu nelaimes gadījumu.
Datu analīzes un pārskatu sniegšanas iespējas palīdz novērtēt 
drošības situāciju un identificēt problēmas, veicot turpmāku analīzi, 
izmantojot savāktos 3D datus. Šīs analīzes sniedz svarīgu ieskatu 
turpmākajā drošības stratēģijā un nepārtraukti uzlabot drošību.
Integrējot mākslīgo intelektu, 3D objektu noteikšanas tehnoloģiju var 
apvienot ar mašīnmācīšanās algoritmiem, lai radītu inteliģentāku 
uzraudzības sistēmu. Tas sistēmai apgūt modeļus un ieviest 
sarežģītākus brīdināšanas un reaģēšanas mehānismus.
Tādējādi 3D objektu noteikšanas tehnoloģija kļūst par drošības 
uzraudzības sistēmu neatņemamu sastāvdaļu, palīdzot apmierināt 
dažādas drošības vajadzības un paaugstinot objektu drošību. 
Paredzams, ka nākotnē šīs tehnoloģijas turpinās attīstīties, radot vēl 
sarežģītākus un efektīvākus drošības uzraudzības risinājumus. Šie 
tehnoloģiskie sasniegumi pārtaps spēcīgākās drošības sistēmāsjo 
īpaši integrējot tās ar mākslīgo intelektu.41)
3D objektu noteikšanas tehnoloģijai svarīga loma arī drošības 
uzraudzības sistēmās. LiDAR sensorus un 3D objektu noteikšanas 
tehnoloģiju izmantot, lai atklātu iebrucējus vai noteiktu, vai tuvumā 
atrodas cilvēki. Tās arī analizēt uzvedības modeļus 3D telpā, lai 
izsekotu un novērstu nelikumīgas darbības.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). 
Infrasarkanā starojuma mazo mērķu noteikšanas metode, kas balstīta uz 
svērto cilvēka vizuālās salīdzināšanas mehānismu drošības uzraudzībai. 
Remote. Sens., 15, 2922.26- -
4.5 VR/AR
Virtuālajā realitātē (VR) un paplašinātajā realitātē (AR) 3D objektu 
noteikšanas tehnoloģija būtiski uzlabo lietotāju pieredzi dažādās 
nozarēs. 3D objektu noteikšana ļauj lietotājiem mijiedarboties ar 
reālās pasaules objektiem virtuālajā vidē, kas ir būtiski AR 
lietojumprogrammām, lai reāllaikā atpazītu apkārtējo vidi, lai precīzi 
izvietotu un manipulētu ar virtuālajiem elementiem. Tas padara 
lietotāja pieredzi aizraujošāku.
VR vidē 3D objektu noteikšana tiek izmantota, lai radītu reālistiskas 
simulācijas. Tas nodrošina mācību scenārijus dažādās jomās, tostarp 
medicīnā, un aviācijas jomāļaujot dalībniekiem droši piedzīvot un 
praktizēties reālās dzīves situācijās. VR/AR izmantošana, jo īpaši 
būvniecības drošības jomā, palielina darbinieku izpratni par 
drošību.42)
Spēļu nozarē 3D objektu noteikšana nodrošina pieredzi, precīzi 
izsekojot spēlētāja kustību un pozīciju. Tas nodrošina mijiedarbību 
ar virtuālajiem tēliem, palielinot spēles reālismu.
Arhitektūrā un inženierzinātnēs AR tehnoloģiju var izmantot, lai 
vizualizētu dizaina modeļus reālajā pasaulē. Tas palīdzēt iepriekš
atklāt kļūdas projektēšanas procesā un atvieglot saziņu ar klientiem. 
Šie lietojumi var būt īpaši sinerģiski ar būvniecības drošību.43)
AR tehnoloģija palīdz patērētājiem pieņemt lēmumus par pirkumu, 
ļaujot viņiem virtuāli izmēģināt produktus. Piemēramtā sniedz 
iespēju izvietot mēbeles savā mājoklī vai iepriekš izmēģināt 
kosmētikas krāsas. Tas uzlabo patērētāju iepirkšanās pieredzi un 
mijiedarbību.44)
Tādējādi 3D objektu noteikšanas tehnoloģija nodrošina inovatīvu 
pieredzi VR un AR un tiek izmantota dažādās nozarēs. Nākotnē šīs 
tehnoloģijas turpinās attīstīties, padarot lietotāja un virtuālās vides 
mijiedarbību vēl ērtāku un dabiskāku. Tas vairāk paplašinās VR/AR 
tehnoloģiju izmantošanu izglītībā, izklaidē, tirdzniecībā un citur. 27- -
Vienlaikus šo tehnoloģiju attīstība jaunas iespējas tūrisma un 
viesmīlības nozarē.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks pārskats 
par virtuālās un papildinātās realitātes (VR/AR) lietojumiem būvniecības 
drošībā. Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks pārskats 
par virtuālās un papildinātās realitātes (VR/AR) lietojumiem būvniecības 
drošībā. Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
"Virtuālās realitātes (VR) un papildinātās realitātes (AR) video reklāmu 
pārliecināšanas ietekme: konceptuāls pārskats". Journal of Business 
Research.
45) Wei, W. (2019). Virtuālās realitātes (VR) un papildinātās realitātes (AR) 
pētniecības progress tūrismā un viesmīlībā. Journal of Hospitality and 
Tourism Technology, 10, 539-570.28- -
Virtuālajā realitātē (VR) un paplašinātajā realitātē (AR) 3D 
telpiskajiem datiem ir svarīga loma mijiedarbībā ar reālās pasaules 
objektiem3D telpiskie dati virtuālos objektus pareizi novietot reālajā 
pasaulē un ļauj lietotājiem ar tiem mijiedarboties dabiskā veidā.
5. Secinājums
3D telpisko datu apstrādes tehnoloģija revolūciju daudzās jomās, 
tostarp autonomās braukšanas, veselības aprūpes, rūpniecības, 
drošības un VR/AR jomā. Jo īpaši LiDAR sensoriem un 3D objektu 
noteikšanas tehnoloģijām loma katrā no šīm jomām, veicinot vides 
analīzi reālajā laikā, precīzu diagnostiku un ārstēšanu, kā arī 
efektīvas automatizācijas sistēmas. Šīs tehnoloģijas turpinās 
attīstīties un nodrošinās bagātāku lietotāju pieredzi dažādās jomās.29- -
Atsauces
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Lidar punktu mākoņu saspiešana, apstrāde un mācīšanās 
autonomai braukšanai. IEEE Transactions on Intelligent 
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). Pārskats par 3D objektu noteikšanas metodēm 
autonomās braukšanas lietojumiem. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana 
un vizualizācija. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Mākslīgais intelekts medicīnā. New England 
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Rūpniecisko procesu 
uzlabošana ar automatizāciju un robotiku. Machines.
6. Cao, M., & Wang, J. (2020). Šķēršļu noteikšana autonomi 
braucošiem transportlīdzekļiem ar vairāku LiDAR sensoru 
apvienošanu. Journal of Dynamic Systems Measurement and Control 
- Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D objektu noteikšana 
no monokulārā, stereo un punktu mākoņa autonomai braukšanai. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). 
Infrasarkanā starojuma mazo mērķu noteikšanas metode, kas balstīta 
uz svērto cilvēka vizuālās salīdzināšanas mehānismu drošības 
uzraudzībai. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia 
apakšbaseina (Gana) 3D ģeoloģiskā modeļa, kas izstrādāts 
hidroģeoloģiskiem mērķiem un balstīts pārstrādātiem B lauka datiem, 
kuri sākotnēji iegūti minerālu izpētes vajadzībām. Solid Earth, 11, 
349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotizēta procesu automatizācija: zinātnisks un 
rūpniecisks sistemātisks kartēšanas pētījums. IEEE Access, 8, 39113-30- -
39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. un Zhang, Z. (2023). Īpaši 
blīva 3D objektu noteikšana. IEEE Transactions on Pattern Analysis 
and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Uz punktu mākoņiem balstītas 3D objektu noteikšanas un 
klasifikācijas metodes pašbraucošām lietojumprogrammām: 
Pārskats un taksonomija. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). 
Deep31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43, 
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., 
Näppi, J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, 
H., Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., 
Samala, R. K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM darba grupas 273. ziņojums: Ieteikumi 
par labāko praksi mākslīgā intelekta un mašīnmācīšanās jomā 
datorizētai diagnostikai medicīniskās attēlveidošanas jomā. 
Medicīnas fizika.
15. Huang, S. (2019). Paplašinātā realitāte un virtuālā realitāte: AR un 
VR iespējas uzņēmējdarbībā. Informācijas tehnoloģijas un tūrisms, 
21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. 
(2021).
Uz mācīšanos balstīta robotizētas montāžas automatizācija viedai 
ražošanai. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). "Virtuālās realitātes (VR) un papildinātās realitātes (AR) video 
reklāmu pārliecināšanas ietekme: konceptuāls pārskats". Journal of 
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. 
(2020).
Triplānu konvolūcija ar koplietojamiem 2D kodoliem 3D 
klasifikācijai un formas iegūšanai. Computer Vision and Image 
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Imersīvās interaktīvās 
tehnoloģijas un virtuālā iepirkšanās pieredze: J.: Atšķirības 
patērētāju uztverē starp papildināto realitāti (AR) un virtuālo realitāti 
(VR). Telemātika un informātika, 77, 101936.
20. Kusiak, A. 2023). Hiperautomatizācija apstrādes rūpniecībā. J. 
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks 
pārskats par virtuālās un papildinātās realitātes (VR/AR) lietojumiem 
būvniecības drošībā. Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz 32- -
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 
23, 20707-20720.
23.Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D objektu noteikšana 
autonomai braukšanai: International Journal of Computer Vision, 131, 
1909-1963.
24.Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. 
(2022). Rūpnieciskā redze un automatizācija. Measurement Science 
and Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). 
Mākslīgais intelekts veselības aprūpē: meistarība. Biotechnology and 
Genetic Engineering Reviews, None, 1-50.
26.Nebot, E. (2018). Robotika: no automatizācijas līdz inteliģentām 
sistēmām. Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. 
(2022). Dynamic graph.33- -
transformators 3D objektu noteikšanai. Uz zināšanām balstītas 
sistēmas, 259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: uz dziļu 
mācīšanos balstīta 3D objektu noteikšana, izmantojot semantisko 
punktu mākoni. Visual Computer, , 1-15.
29.Wei, W. (2019). Virtuālās realitātes (VR) un papildinātās realitātes 
(AR) pētniecības progress tūrismā un viesmīlībā. Journal of 
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Novel Method for 
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using 
Nonimaging Electronic Medical Records: Deep Learning Approach 
(Mākslīgā intelekta balstīta plaušu vēža riska prognozēšana, 
izmantojot elektroniskos medicīniskos ierakstus bez attēliem: dziļās 
mācīšanās pieeja). Journal of Medical Internet Research, 23. lpp.
32. Zhou, Q. (2022). Datorizēta atklāšana un 
diagnostika/radiomika/mašīnmācīšanās/dziļā mācīšanās 
medicīniskajā attēlveidošanā. Medical Physics.

Forskningsrapport: 3D-teknologi for romlig databehandling 
og dens bruksområder  AI Research Institute 
2025_01Youngho Hong
Sammendrag:
Denne forskningen tar for seg utvikling og bruk av teknologi for 
behandling av romlige 3D-data, spesielt datainnsamling av 
punktskyer og deteksjon av 3D-objekter ved hjelp av LiDAR-sensorer. 
Den fokuserer på 3D-objektdeteksjonsteknologiene VoxelNet, 
PointNet og PointRCNN, og forklarer hvordan disse teknologiene 
brukes på ulike områder som autonome kjøretøy, helsetjenester, 
industriell automatisering, sikkerhetsovervåkingssystemer og VR/AR. 
Punktskydata som samles inn av LiDAR-sensorer, analyserer 3D-rom 
med høy presisjon, og 3D-objektdeteksjonsteknologi basert på disse 
dataene en viktig rolle i sanntids miljøbevissthet, 
presisjonsdiagnostikk, optimalisering av produksjonsprosesser osv. I 
denne studien analyseres innvirkningen 3D-teknologi for romlig 
databehandling har på moderne industri og teknologisk innovasjon, 
og potensialet for fremtidig utvikling diskuteres.
Nøkkelord:
 3D-romdata, LiDAR-sensorer, punktsky, 3Dobjektdeteksjon,
VoxelNet, PointNet, PointRCNN, autonome kjøretøy, 
helsevesen, industriell automatisering, 
sikkerhetsovervåkningssystemer, VR/AR, dyp læring2- -
1. Innledning
Det innebærer datainnsamling, lagring, analyse og visualisering, og 
bruker teknologier som LiDAR, fotogrammetri og 3D-skanning for å 
behandle tredimensjonal romlig informasjon. Disse teknologiene 
brukes i en rekke ulike programvareplattformer, der geografiske 
informasjonssystemer (GIS) og dataassistert design (CAD) de viktigste 
verktøyene. Dette komplekse romlige analyser.
LiDAR bruker laserpulser til å samle inn avstandsdata, mens 
fotogrammetri bruker flyfotografier til å lage 3D-modeller. Disse 
dataene lagres i en database og brukes til analyse og visualisering ved 
behov.1)
Forskning har vist at 3D CNN-strukturer kan brukes til å lære 3Drepresentasjoner,
og at dette kan gjøres mer effektivt enn 
tradisjonelle CNN-baserte metoder.2)
GPU-baserte 3D-visualiseringsmetoder gir mulighet for mer 
sofistikerte og nøyaktige romlige avgrensninger.3)
3D-modellering er et viktig verktøy i arkitektonisk design og 
simuleringsprosessen. Det gjør det å vurdere sikkerheten til 
strukturer og øke nøyaktigheten i designene dine.
3D-romdata brukes i forskning på økosystemendringer og 
katastrofehåndtering. For eksempel brukes geologisk 3D-modellering 
til grunnvannsleting og geologisk forskning.4)
3D-data brukes til å utvikle oppslukende miljøer for å forbedre 
brukeropplevelsen. Dette brukes en rekke bransjer, blant annet 
innen utdanning, helse og underholdning.
Teknologien for behandling av romlige 3D-data er i rivende utvikling 
på en rekke områder, særlig når det gjelder innsamling av punktskydata
og deteksjon av objekter i 3D-rom ved hjelp av LiDAR-sensorer. 
teknologiene revolusjonerer autonome kjøretøy, medisinske 3- -
applikasjoner, industriell automatisering, 
sikkerhetsovervåkningssystemer og VR/AR-miljøer. Denne 
forskningsrapporten gir en grunnleggende forståelse av 3Dteknologier
for romlig databehandling og forklarer hvordan de 
brukes i ulike bransjer.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og visualisering av 
3D-data. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020). 
Triplanar konvolusjon med delte 2D-kjerner for 3D-klassifisering og 
gjenfinning av form. Computer Vision and Image Understanding, 193, 
102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). En ny metode for regional 
prospektering basert på moderne 3D-grafikk. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Ny regional stratigrafisk innsikt fra en geologisk 3D-modell av Nasiabassenget
i Ghana, utviklet for hydrogeologiske formål og basert på 
reprosesserte B-feltdata som opprinnelig ble samlet inn i forbindelse med . 
Solid Earth, 11, 349-361.4- -
2. Innsamling av Point CLoud-data med LiDAR-sensorer
Innsamling av punktsky-data ved hjelp av LiDAR-sensorer spiller en 
viktig rolle i en lang rekke bruksområder, og er spesielt godt egnet 
for innsamling av 3D-data med høy oppløsning. LiDAR-teknologien 
sender ut laserpulser for å motta signaler som reflekteres fra objekter, 
og beregner avstandsinformasjon basert på disse. Denne 
informasjonen lagres i et punktskyformat, der hvert punkt 
inneholder X-, Y- og Z-koordinater og refleksjonsintensitet.
LiDAR-punktskyer kan en rekke , blant annet innen , og 
ressursforvaltning. De kan for eksempel være nyttige for 
strukturanalyse av skog eller presisjonsmåling av bygninger. 
Punktskyer konverteres deretter til eller GIS-data ved hjelp av 
etterbehandling for denoising, justering og overflaterekonstruksjon. 
I denne prosessen brukes en rekke ulike programvarer, spesielt GPUbaserte
3D-visualiseringsmetoder, som gir mulighet for mer 
sofistikerte romlige avgrensninger.5)
LiDAR-data spiller også en viktig rolle i persepsjonssystemer for 
autonome kjøretøy. Behandling av LiDAR-punktskyer og opplæring 
innen autonom kjøring har bidratt til nøyaktig persepsjon av 
veimiljøet og gjenkjenning av objekter.6) Disse dataene er avgjørende 
for å lage høyoppløselige 3D-kart i sanntid, noe som autonome 
kjøretøy å navigere trygt under komplekse veiforhold.
kan også For eksempel kan data som samles inn med flymontert 
LiDAR, brukes til å rekonstruere 3D-modeller av geologiske 
formasjoner, noe som bidrar til grunnvannsleting eller geologisk 
forskning.7) Denne geologiske 3D-modelleringen muliggjør nye 
geologiske tolkninger og bidrar til å gi en bedre forståelse av de 
geologiske egenskapene i et område.
Fordelene med LiDAR-teknologien er annet høy datahastighet og 
stor nøyaktighet, men den har også begrensninger som relativt høye 
kostnader og ytelse i eller Det pågår kontinuerlig forskning og 
utvikling for å overvinne disse tekniske begrensningene, noe som 5- -
gjør LiDAR kan brukes i et bredere spekter av bransjer.
En LiDAR-sensor (Light Detection and Ranging) er en teknologi som 
bruker en laser til å måle overflaten på et objekt, og dataene kan 
brukes til å innhente romlig 3D-informasjon. Punktskydataene som 
genereres av en LiDAR-sensor, er en samling av mange punkter som 
er fordelt i 3D-rom, og hvert av dem kan beskrives med høyde, 
avstand og posisjon.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og visualisering av 
3D-data. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Lidar Point Cloud Compression, Processing and Learning for Autonomous 
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Ny regional stratigrafisk innsikt fra en geologisk 3D-modell av Nasiabassenget
i Ghana, utviklet for hydrogeologiske formål og basert på 
reprosesserte B-feltdata som opprinnelig ble samlet inn i forbindelse med . 
Solid Earth, 11, 349-361.6- -
bjelker. Disse dataene er avgjørende for autonome kjøretøyers 
oppfatning av omgivelsene, modellering arkitektur og 
anleggsteknikk samt 3D-kartlegging.
3. 3D-teknologi for gjenkjenning av objekter
3D-objektdeteksjon er en viktig teknologi for å gjenkjenne og 
lokalisere objekter i 3D-rommet, og er på en rekke områder, blant 
annet autonome kjøretøy, og utvidet virkelighet. Teknologien først 
og fremst basert på 3D-data som samles inn ved hjelp av LiDAR, RGBD-kameraer
og stereosynssystemer.
Den bruker punktskyer generert av LiDAR til å gjenkjenne 
plasseringen og formen til objekter. Deep learning-modeller som 
PointNet er mye brukt på dette feltet, og disse metodene er 
avgjørende for å generere høyoppløselige 3D-kart i sanntid.8)
Det er en teknikk for å detektere objekter ved å kombinere 2D-bilder 
tatt med RGB-kameraer med 3D-informasjon. Denne metoden 
forbedrer deteksjonsytelsen ved å legge til farge- og 
mønsterinformasjon om objektet. Nyere studier har foreslått 
metoder som FusionRCNN, som kombinerer LiDAR- og kamerabilder 
for å forbedre deteksjonsnøyaktigheten.9)
Dyplæringsstrukturer som CNN (Convolutional Neural Networks) og 
RNN (Recurrent Neural Networks) brukes til å og gjenkjenne 
egenskaper ved Disse modellene forbedrer nøyaktigheten ved 
objektklassifisering og stedsestimering basert på datasett, noe som 
spesielt viktig for hindergjenkjenning i autonome kjøretøy.10)
Det brukes til å øke kjøresikkerheten ved å oppdage hindringer og 
fotgjengere på veien. Det forskes aktivt dette området for å 
kombinere LiDAR-punktskyer med visjonsdata for mer presis 
deteksjon.11)
Det hjelper roboten med å forstå og samhandle med omgivelsene. 
Dette spesielt viktig for å bestemme den nøyaktige plasseringen av 7- -
objekter, slik at roboten kan planlegge banen sin og utføre oppgaver.
Gjenkjenne og reagere på objekter i sanntid for å forbedre 
brukeropplevelsen. I utvidet virkelighet må for eksempel 
plasseringen og formen objekter bestemmes nøyaktig for å forbedre 
interaksjonen med virtuelle objekter.
8) Qian, R., Lai, X. og Li, X. (2021). 3D-objektdeteksjon for autonom kjøring: 
Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-kamerafusjon for to-trinns 3D-objektdeteksjon. 
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. og Zhang, Z. (2023). Super Sparse 
3D-objektdeteksjon. IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-kamerafusjon for to-trinns 3D-objektdeteksjon. 
Remote Sensing, 15, 1839.8- -
Disse teknologiene i stadig utvikling, noe som gir mer presise og 
effektive løsninger for 3D-objektdeteksjon. Fremskritt innen 
forskning og teknologi forbedrer nøyaktigheten av gjenkjenningen i 
virkelige miljøer betydelig.
3D-objektdeteksjon er nøyaktig identifisering og klassifisering av 
spesifikke objekter i 3D-rom, noe som støttes av ulike teknikker for 
behandling av romlige 3D-data. I det siste har teknikker basert på 
dyp læring brukt aktivt til 3D-objektdeteksjon. Representative 
teknologier VoxelNet, PointNet og PointRCNN.
3.1 VoxeLNet
VoxelNet er en innovativ arkitektur for dyp læring som er spesielt 
utviklet for å oppdage 3D-objekter ved hjelp av punktskyer, noe som 
er avgjørende i autonome kjøresystemer. Arkitekturen har en unik 
tilnærming ved å konvertere rå punktskydata til et strukturert 3Dvoxelrutenett
for å muliggjøre effektiv prosessering og 
funksjonsutvinning. Konverteringen til en voxel-representasjon er 
fordi den gjør det mulig for VoxelNet å utnytte 3D-konvolusjon 
effektivt for å fange opp romlig informasjon og samtidig sikre 
beregningseffektivitet. Denne effektiviteten er avgjørende for 
sanntidsapplikasjoner, som for eksempel de som kreves for autonom 
kjøring.
Styrken til VoxelNet ligger i evnen til å inkorporere et nytt lag med 
funksjonskoding som i stor grad forbedrer representasjonskraften til 
hver enkelt voxel. Dette oppnås ved å ta hensyn til de unike 
egenskapene til punktene i hver voxel, noe som forbedrer nettverkets 
evne til å oppdage og klassifisere objekter i komplekse miljøer.12) 
Dette funksjonskodingstrinnet er for å løse problemer som skyldes at 
punktskydataene er uregelmessige og sparsomme, noe som er 
vanskelig å håndtere med tradisjonelle 2D-konvolusjonelle nevrale 
nettverk.
Forskning har vist at VoxelNet har gitt betydelige bidrag til 3D-9- -
objektdeteksjon. eksempel gjør arkitekturens evne til å levere høy 
nøyaktighet samtidig som beregningseffektiviteten opprettholdes, at 
den er et foretrukket valg for inter-implementeringsapplikasjoner i 
autonome kjøretøy.13) VoxelNets integrering av sparsom 
representasjon gjør det dessuten mulig å håndtere de store 
datamengdene som ofte forekommer i autonome kjørescenarier på 
en effektiv måte.
Utviklingen av VoxelNet representerer et betydelig fremskritt innen 
3D-databehandling og legger grunnlaget fremtidige innovasjoner 
innen autonom kjøreteknologi. Den løser viktige utfordringer på 
dette området ved å kombinere effektiv voxelisering med avanserte 
kodingsteknikker.14) Dette forbedrer ikke bare 
deteksjonsnøyaktigheten, men muliggjør også mer sofistikert 
håndheving av
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Dyp 
læring for 3D-punktskyer: En undersøkelse. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. og Chang, Z. (2021). Adversarial 
punktskyforstyrrelser mot 3D-objektdeteksjon i autonome kjøresystemer. 
Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objektdeteksjon fra 
monokulær, stereo og punktsky for autonom kjøring. Neurocomputing, 494, 
23-32.10- -
VoxelNet flytter grensene for utvikling 3D-persepsjonssystemer. Med 
sin kraftige ytelse og innovative tilnærming fortsetter VoxelNet å 
påvirke pågående forskning og utvikling innen behandling 3Dpunktskyer
og autonome systemer.15)
VoxelNet er en innovativ modell for 3D-objektdeteksjon som 
behandler punktskydata ved å konvertere dem til 3D-ruter (voxels). 
Hver voxel representerer et punkt i punktskyen, noe som at modellen 
behandle romlig informasjon mer effektivt. VoxelNet bruker denne 
voxel-informasjonen å oppdage objekter og komme med 
prediksjoner. Fordelen denne tilnærmingen er at den er effektiv og 
rask til å behandle store mengder punktsky-data.
3.2 PointNet
PointNet er en banebrytende arkitektur for dyp læring som 
revolusjonerer behandlingen av 3D-punktsky-data ved å bruke 
uordnede punktsett direkte. I motsetning til tradisjonelle metoder 
som krever strukturerte inndata, bruker PointNet 
symmetrifunksjoner for å sikre permutasjonsinvarians, slik at de 
romlige relasjonene mellom punktene og forblir på 
inndatapunktene.
Den viktigste nyvinningen i PointNet er bruken av perceptroner MLP) 
og Denne arkitekturen aggregerer effektivt egenskaper fra 
individuelle punkter til en global representasjon, noe som er spesielt 
nyttig for oppgaver som klassifisering og segmentering. Takket være 
sin evne til å store og nøyaktig har en grunnleggende modell på 
feltet, og den har inspirert en rekke senere arkitekturer basert på 
prinsippene i .
PointNets gjennomslagskraft strekker seg fra akademisk forskning til 
praktiske anvendelser på områder som autonom kjøring og 
robotgjenkjenning. I autonome systemer har PointNet for eksempel 
blitt brukt til å behandle LiDAR-data for å forbedre objektdeteksjon 
og navigasjon ved å identifisere og klassifisere objekter fra ett forsøk 
til det neste.16) PointNets design gjør det mulig å håndtere 11- -
kompleksiteten knyttet til 3D-data, for eksempel okklusjoner og 
variasjoner i punkttetthet, noe som gjør det til et allsidig verktøy i 
datasynapplikasjoner.
De fremskrittene PointNet har ført til, har ført til at PointNet har blitt 
tatt i bruk i en rekke innovative sammenhenger. Det har for 
eksempel blitt brukt til å klassifisere luftbårne LiDAR-data, noe som 
har forbedret nøyaktigheten og effektiviteten i 
fjernmålingsoperasjoner.17) PointNets tilpasningsevne har også ført 
til at det har blitt integrert med fysikkbaserte nevrale nettverk for å 
analysere sprekkutbredelse
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Semantisk 
læringsnettverk med flere visninger for punktskybasert 3D-objektdeteksjon. 
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Dyp 
læring for 3D-punktskyer: En undersøkelse. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Luftbåren LiDAR-punktskyklassifisering 
ved hjelp av PointNet ++ -nettverk med fulle nabolagsfunksjoner. PLOS ONE, 
18.12- -
og fluiddynamikksimuleringer, og har vist seg å kunne løse komplekse 
industrielle problemer.18)
Pointnet fortsetter å fungere som en målestokk for behandling av 3Ddata,
og har i betydelig grad bidratt til å forbedre 
dyplæringsmodellers evne til å behandle punktsky-data. Effekten er 
tydelig både i teoretiske fremskritt og praktiske anvendelser, noe 
som viser at Pointnet fortsatt er relevant og tilpasningsdyktig i det 
stadig skiftende landskapet innen kunstig intelligens og 
maskinlæring.19)
PointNet er en modell som behandle punktskydata direkte og 
gjenkjenne objekter i 3D-rom uavhengig av rekkefølgen på hvert 
punkt. PointNet trekker ut kjennetegnene ved punktene og utfører 
klassifisering og segmentering basert på dem. Modellen kan 
håndtere punktskyenes ustrukturerte natur og kan brukes på ulike 
områder som autonom kjøring, robotteknologi og medisinsk 
bildeanalyse.
3.3 PointRCNN
PointRCNN er et viktig rammeverk for deteksjon av 3D-objekter, 
spesielt for applikasjoner som autonom kjøring. Rammeverket 
bruker en totrinns deteksjonsprosess for å forbedre nøyaktigheten og 
effektiviteten ved gjenkjenning av objekter i 3D-punktskydata. Det 
første trinnet er å generere forslag til objekter gjennom et 
punktbasert lokalt forslagsnettverk. Dette trinnet er fordi det 
fungerer direkte på de rå punktskydataene og bevarer detaljert 
romlig informasjon som kan gå tapt i tradisjonelle metoder som 
baserer seg på bildeprojeksjoner eller voxelisering.
I det andre trinnet forbedrer PointRCNN det opprinnelige forslaget 
ved å utføre Dette justerer størrelsen og retningen på slik at den 
passer bedre til de detekterte objektene i punktskydataene. Ved å 
bruke funksjoner som er hentet direkte fra den rå punktskyen, 
oppnår PointRCNN høyere nøyaktighet i objektdeteksjonen, spesielt 
utfordrende miljøer med kompleks geometri og okklusjoner.13- -
En av de viktigste fordelene med PointRCNN er at den lære fra ende 
til ende. Denne arkitekturen gjør det mulig å integrere 
nettverksstadier sømløst, noe som ikke bare forbedrer modellens 
deteksjonsytelse, men også dens beregningseffektivitet, noe som gjør 
den egnet for sanntidsapplikasjoner, som for eksempel autonome 
kjøresystemer.
Forskning har vist at metoder som bruker punktskydata, kan 
forbedre forståelsen og tolkningen av 3D-scener i autonome 
kjøresituasjoner betraktelig. For eksempel kan bruk av algoritmer for 
deteksjon av flere mål basert på PointRCNN og voxelpunktskyfusjonsteknikker
brukes i dynamiske scenarier på grunn av 
deres allsidighet og
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: En dyp 
læringsløser for inkompressible strømmer og termiske felt i stabil tilstand 
på flere sett med uregelmessige geometrier. Journal of Computational 
Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep 
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.14- -
I tillegg undersøkelser innen 3D-punktskyer og 
dyplæringstilnærminger den økende betydningen av disse 
rammeverkene for sceneforståelse i autonom kjøring.20)
PointRCNN representerer et betydelig fremskritt innen 3Dobjektdeteksjonsteknologi.
Dens evne til å behandle rå punktskydata 
direkte og den effektive deteksjonsprosessen kraftig verktøy for 
autonom kjøring, der rask og nøyaktig er avgjørende for sikkerhet og 
ytelse.
PointRCNN er en teknologi som bruker et CNN (Convolutional Neural 
Network) basert på PointNet for 3D-objektgjenkjenning, og som 
effektivt behandler punktskydata for å gjenkjenne objekter med stor 
nøyaktighet. PointRCNN er en teknologi som utvider den 
eksisterende 2D-objektdeteksjonsmetoden til 3D-miljøer, og brukes 
til objektgjenkjenning av autonome kjøretøy og miljøgjenkjenning av 
roboter.
4. Bruksområder
PunktRCNN spiller en viktig rolle i autonome kjøresystemer, og 
brukes til å gjenkjenne og spore objekter i omgivelsene med stor 
nøyaktighet. ved hjelp av kan hjelpe kjøretøyer med hindringer i 
veien med stor nøyaktighet, selv i komplekse trafikksituasjoner.22)
Roboten bruker 3D-objektdeteksjonsteknologi for å samhandle med 
omgivelsene. PointRCNN gjør det mulig for roboten å forstå 
omgivelsene fra kjøring til kjøring og utføre de nødvendige 
handlingene.24)
For å kunne sette virtuelle objekter sømløst inn i den virkelige verden 
i et AR-miljø, er det nødvendig med nøyaktig objektdeteksjon i 3Drommet.
PointRCNN en viktig rolle i denne oppgaven.
Droner må kunne gjenkjenne og unngå ulike hindringer under 
flyging. PointRCNN kan brukes til å oppdage objekter i sanntid fra 
dronens sensordata og angi en trygg flyrute.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
21) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep 
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. og Li, X. (2021). 3D-objektdeteksjon for autonom kjøring: 
Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objektdeteksjon for 
autonom kjøring: A Comprehensive Survey, International Journal of 
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep 
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE 
Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019).16- -
PointRCNN brukes til 3D-modellering og analyse av bymiljøer, noe 
som gir viktig innsikt for byplanlegging og -forvaltning. Dette bidra 
til å forbedre transporteffektiviteten og øke sikkerheten i byene.
I disse bruksområdene er PointRCNN svært nyttige i situasjoner der 
det kreves høy nøyaktighet og sanntidsbehandling. Forskning viser at 
teknikker som flermålsdeteksjonsalgoritmer basert på PointRCNN 
har vist å være effektive i slike anvendelser.26) PointRCNN bidrar til å 
maksimere nøyaktigheten og effektiviteten ved 3D-objektdeteksjon, 
noe som viktig for utviklingen av autonome kjøretøy og andre 
avanserte systemer.
3D-teknologi for romlig databehandling brukes mange ulike bransjer. 
Noen av de viktigste bruksområdene inkluderer
4.1 Selvkjørende kjøretøy
kjøretøy er kjøretøy som bruker avansert teknologi til å kjøre seg selv 
uten menneskelig inngripen. Disse kjøretøyene bruker en rekke 
sensorer, kameraer, radar, LiDAR og mer for å få nøyaktig oversikt 
over omgivelsene sine. Disse teknologiene, kombinert med 
databehandling i sanntid, er avgjørende for å bestemme trygge 
kjøreruter.
3D-teknologi for gjenkjenning av objekter er en nøkkelkomponent i 
autonome kjøretøy, og spiller en viktig rolle når det gjelder å oppdage 
og gjenkjenne objekter rundt kjøretøyet på en nøyaktig måte. 
PointRCNN utnytter for eksempel punktskydata for å muliggjøre 
høyoppløselig analyse av kjøretøyets omgivelser. Dette det mulig for 
autonome kjøretøy å gjenkjenne fotgjengere, andre kjøretøy, veiskilt 
med mer i sanntid for å sikre trygg kjøring.27)
Autonome kjøretøy også evnen til å lære seg kjøremønstre og tilpasse 
seg ulike kjøresituasjoner ved hjelp av maskinlæring og kunstig 
intelligens. Disse teknologiene bidrar til forbedre kjøretøyets 
sikkerhet, effektivitet og brukeropplevelse. Spesielt forbedrer 17- -
multisensorfusjonsteknologien nøyaktigheten ved deteksjon av 3Dobjekter,
noe som pålitelig ytelse i en rekke ulike miljøer.28)
En undersøkelse om 3D-objektdeteksjonsmetoder for autonome 
kjøreapplikasjoner. IEEE Transactions on Intelligent Transportation Systems, 
20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for 
3D Object Detection in Autonomous Driving: IEEE Transactions on 
Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonome kjøretøy et viktig innovasjonsområde i fremtidens 
transportsystemer, der komplekse algoritmer og sensorteknologi 
smelter sammen. Disse teknologiene har en positiv innvirkning på 
samfunnet som helhet ved at de reduserer trafikkbelastningen, 
reduserer trafikkulykker og muliggjør en mer effektiv trafikkflyt.29)
Autonome kjøretøy bruker LiDAR-sensorer og 3D-teknologi for 
gjenkjenning av objekter for å oppfatte og analysere kjøretøyets 
omgivelser i sanntid. Dette gjør det mulig å unngå hindringer, 
gjenkjenne fotgjengere, analysere veikryss og for å maksimere 
kjøretøyets sikkerhet og kjøreeffektivitet.
4.2 Helsetjenester
Teknikker for deteksjon av 3D-objekter i det medisinske feltet, 
spesielt teknikker som PointRCNN, et bredt spekter av potensielle 
bruksområder. Disse teknologiene brukes hovedsakelig innen 
medisinsk bildebehandling, kirurgisk robotteknologi, 
pasientovervåkingssystemer osv.
3D-teknologi gjenkjenning av objekter bidrar til å oppdage lesjoner i 
CT-, MR- og ultralydbilder med stor nøyaktighet. Dette er spesielt 
viktig innen felt som radiologi, der det kan kombineres med 
datastøttede diagnosesystemer som bruker kunstig intelligens og 
maskinlæring for å forbedre den diagnostiske nøyaktigheten.30)
I kirurgiske robotsystemer gjør 3D-teknologi for gjenkjenning av 
objekter det mulig å gjenkjenne omkringliggende vev og organer 
nøyaktig under operasjonen, noe som bidrar til å sikre trygg og presis 
kirurgi. Sammen med fremskritt innen medisinsk kunstig intelligens 
kan dette i stor grad forbedre effektiviteten og sikkerheten ved 
operasjoner.31)
3D-sensorer og objektdeteksjonsteknologi kan analysere pasientens 
bevegelser og vitale tegn i sanntid for å oppdage avvik på et tidlig 
stadium. Disse teknologiene kombineres med kunstig intelligensbaserte
pasientovervåkingssystemer for kontinuerlig sporing og 19- -
håndtering av pasientens tilstand.32)
Kombinert med virtuell virkelighet (VR) kan den brukes i medisinsk 
utdanning og opplæring. 3D-teknologi for gjenkjenning av objekter
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). En undersøkelse om 3D-objektdeteksjonsmetoder for 
autonome kjøreapplikasjoner. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). AAPM-arbeidsgrupperapport 273: 
Anbefalinger om beste praksis for AI og maskinlæring for datastøttet 
diagnose innen medisinsk bildebehandling. Medisinsk fysikk.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig 
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske 
anmeldelser, Ingen, 1-50.
32) Almagharbeh, W. (2024). Effekten av AI-baserte 
beslutningsstøttesystemer på arbeidsflyten i intensivavdelinger, 
International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023). 
Artificial intelligence in clinical decision support systems for oncology, 
International Journal of Medical Sciences, 20, 79-86.20- -
 spiller en viktig rolle i å hjelpe leger og helsepersonell med å 
simulere operasjoner og diagnoser, noe som muliggjør læring i et 
realistisk miljø.33)
Disse bruksområdene bidrar til å øke nøyaktigheten i diagnostisering 
og behandling på det medisinske området og forbedre den generelle 
sikkerheten. Spesielt 3D-teknologi for gjenkjenning av objekter 
kombinert med kunstig intelligens setter fart på innovasjonen i 
helsevesenet og er i ferd med å bli et viktig verktøy for å forbedre 
pasientenes helse og sikkerhet. Disse studiene gir nye perspektiver 
på de kommersielle, regulatoriske og samfunnsmessige 
implikasjonene av medisinsk AI.34)
Innenfor medisin brukes 3D-databehandling å stille nøyaktige 
diagnoser og planlegge kirurgiske inngrep. Punktskydata fra 
medisinsk 3D-avbildning, for eksempel CT- eller MR-bilder, brukes 
til å visualisere operasjonsstedet og måle dets nøyaktige plassering og 
størrelse for å forbedre den kirurgiske nøyaktigheten.
4.3 Industriell automatisering og robotteknologi
3D-teknologier for gjenkjenning av objekter, spesielt modeller som 
PointRCNN, er i ferd med å revolusjonere feltet industriell 
automasjon og robotikk. Disse teknologiene forbedrer effektiviteten 
og nøyaktigheten betydelig i en lang rekke bransjer, og spiller en 
viktig rolle på følgende spesifikke områder
3D-teknologi for gjenkjenning av objekter er avgjørende for at 
robotsystemer skal kunne gjenkjenne og sortere objekter på et lager. 
Den gjør det mulig for roboter å gjenkjenne gjenstander av ulik 
størrelse og form, slik at de kan utføre effektive forflytnings- og 
sorteringsoppgaver. Disse teknologiene øker effektiviteten i 
industrielle prosesser og gjør det lettere å automatisere 
logistikksystemer.35)
Når industriroboter automatisk monterer deler, øker 3Dobjektdeteksjon
monteringseffektiviteten ved å gjenkjenne den 21- -
nøyaktige posisjonen og retningen til delene. Dette bidrar i betydelig 
grad til å øke produksjonshastigheten og redusere antall feil, en 
viktig rolle i smarte produksjonsmiljøer.36)
De brukes til å inspisere geometri og dimensjoner på produkter ved 
hjelp av 3D-skanningsteknologi, og en viktig rolle når det gjelder å 
sikre produktkvalitet, oppdage feil tidlig og redusere kostnader. 
Disse automatiserte delene
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). Kunstig 
intelligensbasert prediksjon av lungekreftrisiko ved bruk av elektroniske 
medisinske journaler uten bildebehandling: Deep Learning Approach. 
Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig 
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske 
anmeldelser, Ingen, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P. 
og White, M. (2021). Sim2Real i robotikk og automatisering: applikasjoner og 
utfordringer. IEEE Transactions on Automation Science and Engineering, 18, 
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Læringsbasert automatisering av robotmontering for smart produksjon. 
Proceedings of the IEEE, 109, 423-440.22- -
Systemer for kvalitetskontroll øker produktenes pålitelighet.37)
For å øke sikkerheten til roboter og automasjonssystemer brukes 3Dteknologi
for objektdeteksjon. Dette gjør det mulig for å gjenkjenne 
eller i nærheten en trygg måte. Disse sikkerhetsmekanismene bidrar 
til å redusere ulykker i industrielle miljøer.38)
Det er avgjørende for autonome kjøretøy eller droner å kunne 
oppdage objekter og planlegge rutene sine. 3D-teknologi for 
gjenkjenning av objekter disse systemene å operere effektivt, unngå 
hindringer og utføre leveringsoppgaver på en trygg måte.39)
 disse områdene driver 3D-teknologier for objektdeteksjon 
innovasjonen innen industriell automasjon, og bidrar til å øke 
produktiviteten, redusere kostnadene og forbedre sikkerheten. I 
fremtiden vil disse teknologiene fortsette å være en integrert del av 
utviklingen av robotikk og automatiseringssystemer. Forskning har 
vist at anvendelsen av disse teknologiene bidrar betydelig til øke 
effektiviteten i industrielle prosesser og håndtere kompleksiteten i 
automatiserte systemer.40)
Innen industriell automasjon og robotteknologi brukes behandling 
av romlige 3D-data til å produksjonsprosesser og automatisere 
kvalitetsinspeksjoner. Roboter bruker LiDAR-sensorer eller 3Dkameraer
til gjenkjenne produkter, oppdage avvik og bidra til å løse 
kvalitetsproblemer.
4.4 Systemer for sikkerhetsovervåking
I sikkerhetsovervåkingssystemer 3D-teknologi for gjenkjenning av 
objekter en viktig rolle når det gjelder å tilby effektive overvåkingsog
sikkerhetsløsninger i en rekke ulike miljøer. Teknologien har vært 
spesielt fremtredende på områder som sanntidsovervåking, 
innbruddsdeteksjon, forebygging av hendelser, dataanalyse og 
rapportering samt integrering av kunstig intelligens.
3D-objektdeteksjonssystemer med sanntidsovervåking bruker 23- -
kameraer og sensorer til å analysere omgivelsene i sanntid. Denne 
sanntidsanalysen muliggjør nøyaktig gjenkjenning av personer, 
kjøretøy og objekter, og gir umiddelbare advarsler i tilfelle en farlig 
situasjon skulle oppstå. Dette er avgjørende for å øke sikkerheten, 
spesielt i komplekse miljøer som veier og flyplasser.
Når det gjelder innbruddsdeteksjon, er 3D-teknologi for 
objektdeteksjon effektiv når det gjelder å oppdage uvanlig bevegelse 
eller atferd innenfor et bestemt sikkerhetsområde. Dette kan føre til 
tidlig oppdagelse av en inntrenger og gi sikkerhetspersonell 
umiddelbar
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industriell 
automatisering og produktkvalitet: rollen som transformasjon av 
robotproduksjon. Anvendt økonomi.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing 
Dynamic and Collaborative Automation and Robotics Software Systems, 
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotikk: Fra automatisering til intelligente systemer, 
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Industrielt syn og automatisering. Measurement Science and Technology, 33.24- -
Forhindre uautorisert adgang til sikrede områder ved å gi røde varsler.
Når det gjelder ulykkesforebygging, forebygger disse systemene 
ulykker i en rekke ulike miljøer, inkludert industriområder, ved å 
oppdage farer tidlig og gi advarsler. For eksempel et automatisk 
varslingssystem utløses når en arbeider nærmer seg et farlig område, 
slik at en ulykke forhindres.
Dataanalyse- og rapporteringsfunksjonene hjelper deg med å vurdere 
sikkerhetssituasjonen og identifisere problemer ved hjelp av 
påfølgende analyser av innsamlede 3D-data. Disse analysene gir 
viktig innsikt for fremtidig sikkerhetsstrategi og kontinuerlig 
forbedring av sikkerheten.
Ved å integrere kunstig intelligens kan 3D-teknologi for 
objektdeteksjon kombineres med maskinlæringsalgoritmer for å 
skape et mer intelligent overvåkingssystem. Dette gjør det for 
systemet å lære seg mønstre og implementere mer sofistikerte 
varslings- og responsmekanismer.
På denne måten er 3D-teknologi for gjenkjenning av objekter i ferd 
med å bli en integrert del av sikkerhetsovervåkingssystemer, noe som 
oppfyller en rekke sikkerhetsbehov og bidrar til sikkerheten på 
anlegg. Denne teknologien forventes å utvikle seg videre i fremtiden, 
noe som vil føre til mer sofistikerte og effektive løsninger for 
sikkerhetsovervåking. Disse teknologiske fremskrittene vil utvikle 
seg til mer robuste sikkerhetssystemer, særlig gjennom integrering 
med kunstig intelligens.41)
3D-teknologi for gjenkjenning av objekter også en viktig rolle i 
sikkerhetsovervåkingssystemer. LiDAR-sensorer og 3Dobjektdeteksjonsteknologi
brukes til å oppdage inntrengere eller 
avgjøre om det befinner seg mennesker i nærheten. De også 
analysere atferdsmønstre i 3D-rom for å spore og forhindre ulovlig 
aktivitet.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. og Cao, E. (2023). En 
infrarød metode for deteksjon av små mål basert på en vektet menneskelig 
visuell sammenligningsmekanisme for sikkerhetsovervåking. Remote Sens. 
15, 2922.26- -
4.5 VR/AR
I virtuell virkelighet (VR) og utvidet (AR) bidrar 3D-teknologi for 
gjenkjenning av objekter til å forbedre brukeropplevelsen i en rekke 
ulike bransjer. 3D-objektdeteksjon gjør det mulig for brukerne å 
samhandle med virkelige objekter i virtuelle miljøer, noe som er 
avgjørende for at AR-applikasjoner skal kunne gjenkjenne 
omgivelsene i sanntid og plassere og manipulere virtuelle elementer 
nøyaktig. Dette gjør brukeropplevelsen mer oppslukende.
I VR-miljøer brukes 3D-objektdeteksjon til å skape realistiske 
simuleringer. Dette gir opplæringsscenarioer på en rekke områder, 
blant annet innen medisin, og luftfart, slik at deltakerne trygt kan 
oppleve og øve på virkelige situasjoner. Bruken av VR/AR, spesielt 
innen bygg- og anleggssikkerhet, øker arbeidernes 
sikkerhetsbevissthet.42)
I spillindustrien gir 3D-objektdeteksjon en opplevelse ved å spore 
spillerens bevegelse og posisjon nøyaktig. Dette muliggjør 
interaksjon med virtuelle figurer, noe som øker spillets realisme.
Innen arkitektur og ingeniørfag kan AR-teknologi brukes til å 
visualisere designmodeller i den virkelige verden. Dette bidra til å 
oppdage feil i designprosessen på forhånd og lette kommunikasjonen 
med kundene. Disse bruksområdene kan være spesielt synergistiske 
med konstruksjonssikkerhet.43)
AR-teknologi hjelper forbrukerne med å ta kjøpsbeslutninger ved å la 
dem oppleve produkter virtuelt. De kan for eksempel plassere 
møbler i hjemmet sitt eller prøve kosmetikkfarger på forhånd. Dette 
forbedrer forbrukerens kjøpsopplevelse og interaksjon.44)
På denne måten gir 3D-teknologi for gjenkjenning av objekter 
innovative opplevelser i VR og AR, og teknologien brukes i en rekke 
ulike bransjer. I fremtiden vil disse teknologiene fortsette å utvikle 
seg, slik at interaksjonen mellom brukeren og det virtuelle miljøet 
blir enda mer sømløs og naturlig. Dette vil ytterligere utvide bruken 27- -
av VR/AR-teknologi innen utdanning, underholdning, handel og mye 
mer. Samtidig vil fremskritt innen disse teknologiene skape nye 
muligheter i reiselivs- og hotellbransjen.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk 
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR) i 
bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk 
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR) i 
bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
'Overtalelseseffektene av virtual reality (VR) og augmented reality (AR) 
videoannonser: En konseptuell gjennomgang'. Journal of Business Research.
45) Wei, W. (2019). Fremskritt i forskningen på virtuell virkelighet (VR) og 
utvidet virkelighet (AR) innen turisme og gjestfrihet, Journal of Hospitality 
and Tourism Technology, 10, 539-570.28- -
I virtuell virkelighet (VR) og utvidet virkelighet (AR) spiller 3Dromdata
en viktig rolle man skal samhandle med objekter i den 
virkelige verden. 3D-romdata det å plassere virtuelle objekter riktig i 
den virkelige verden, slik at brukerne kan samhandle med dem på en 
naturlig måte.
5. Konklusjon
3D-teknologi for romlig databehandling revolusjonere mange felt, 
deriblant autonom kjøring, helsevesen, industri, sikkerhet og VR/AR. 
LiDAR-sensorer og 3D-teknologi for gjenkjenning av objekter spiller 
en viktig rolle alle disse feltene, og bidrar til miljøanalyser i sanntid, 
nøyaktig diagnose og behandling samt effektive 
automatiseringssystemer. Disse teknologiene vil fortsette å utvikle 
seg og gi rikere brukeropplevelser på ulike områder.29- -
Referanser
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Lidar Point Cloud Compression, Processing and Learning for 
Autonomous Driving. IEEE Transactions on Intelligent 
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). En undersøkelse om 3Dobjektdeteksjonsmetoder
for autonome kjøreapplikasjoner. IEEE 
Transactions on Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og 
visualisering av 3D-data. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Kunstig intelligens i medisin. New England 
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Forbedring av industrielle 
prosesser ved hjelp av automatisering og robotteknologi. Maskiner.
6. Cao, M. og Wang, J. (2020). Hindringsdeteksjon for autonome 
kjøretøy med multi-LiDAR-sensorfusjon. Journal of Dynamic Systems 
Measurement and Control - Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objektdeteksjon fra 
monokulær, stereo og punktsky for autonom kjøring. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. og Cao, E. (2023). En 
infrarød metode for deteksjon av små mål basert på en vektet 
menneskelig visuell sammenligningsmekanisme for 
sikkerhetsovervåking. Remote Sens. 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Ny regional stratigrafisk innsikt fra en geologisk 
3D-modell av Nasia-bassenget i Ghana, utviklet for hydrogeologiske 
formål og basert på reprosesserte B-feltdata som opprinnelig ble 
samlet inn i forbindelse med . Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and 
Industrial Systematic Mapping Study, IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. og Zhang, Z. (2023). Super 
Sparse 3D-objektdeteksjon. IEEE Transactions on Pattern Analysis 30- -
and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Punktskybaserte 3D-objektdeteksjons- og 
klassifiseringsmetoder for selvkjørende applikasjoner: En 
undersøkelse og taksonomi. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). 
Dype31- -
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., 
Näppi, J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, 
H., Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., 
Samala, R. K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM-arbeidsgrupperapport 273: 
Anbefalinger om beste praksis for AI og maskinlæring for datastøttet 
diagnose innen medisinsk bildebehandling. Medisinsk fysikk.
15. Huang, S. (2019). Utvidet virkelighet og virtuell : kraften i AR VR 
for næringslivet, Information Technology and Tourism, 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. 
(2021).
Læringsbasert automatisering av robotmontering for smart 
produksjon. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). 'Overtalelseseffektene av virtual reality (VR) og augmented 
reality (AR) videoannonser: En konseptuell gjennomgang'. Journal of 
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. 
(2020).
Triplanar konvolusjon med delte 2D-kjerner for 3D-klassifisering og 
gjenfinning av form, Computer Vision and Image Understanding, 193, 
102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Oppslukende 
interaktive teknologier og virtuelle shoppingopplevelser: Forskjeller i 
forbrukernes oppfatninger mellom utvidet virkelighet (AR) og 
virtuell virkelighet (VR). Telematikk og informatikk, 77, 10-1936.
20. Kusiak, A. (2023). Hyperautomatisering i produksjonsindustrien, 
J. Intell. Manuf. 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk 
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR) 
i bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud 
Fusion Based on PointRCNN. IEEE Transactions on Intelligent 
Transportation Systems, 23, 20707-20720.32- -
23.Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objektdeteksjon for 
autonom kjøring: A Comprehensive Survey, International Journal of 
Computer Vision, 131, 1909-1963.
24.Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. 
(2022). Industrielt syn og automatisering. Measurement Science and 
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig 
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske 
anmeldelser, Ingen, 1-50.
26.Nebot, E. (2018). Robotikk: Fra automatisering til intelligente 
systemer, Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. 
(2022). Dynamisk graf33- -
transformator for deteksjon av 3D-objekter. Knowledge-Based Systems, 
259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: dyp 
læringsbasert 3D-objektdeteksjon ved hjelp av semantisk punktsky. 
Visual Computer, , 1-15.
29.Wei, W. (2019). Fremskritt i forskningen på virtuell virkelighet 
(VR) og utvidet virkelighet (AR) innen turisme og gjestfrihet, Journal 
of Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). En ny metode for 
regional prospektering basert på moderne 3D-grafikk. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Kunstig intelligensbasert prediksjon av lungekreftrisiko ved bruk av 
elektroniske medisinske journaler uten bildebehandling: Deep 
Learning Approach. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Datastøttet deteksjon og 
diagnose/radiomikk/maskinlæring/dyb læring innen medisinsk 
avbildning. Medisinsk fysikk.

Onderzoeksrapport: 3D verwerking van ruimtelijke gegevens 
en toepassingen  AI onderzoeksinstituut 2025_01Youngho 
Hong
Samenvattingen:
Dit onderzoek behandelt de ontwikkeling en toepassing van 3D 
ruimtelijke gegevensverwerkingstechnologieën, met name 
puntwolkgegevensverwerving en 3D objectdetectietechnologieën met 
LiDAR-sensoren. Het richt zich op 3D-objectdetectietechnologieën 
VoxelNet, PointNet en PointRCNN en legt uit hoe deze technologieën 
worden gebruikt op verschillende gebieden zoals autonome voertuigen, 
gezondheidszorg, industriële automatisering, 
veiligheidssurveillancesystemen en VR/AR. Puntwolkgegevens 
verzameld door LiDAR-sensoren analyseren de 3D-ruimte met hoge 
precisie, en 3D-objectdetectietechnologie op basis hiervan een 
belangrijke rol in real-time omgevingsbewustzijn, precisiediagnose, 
optimalisatie van productieprocessen, enz. Deze studie analyseert de 
impact van 3D-technologie voor de verwerking van ruimtelijke gegevens 
op de moderne industrie en technologische innovatie, en bespreekt het 
potentieel voor toekomstige ontwikkeling.
Trefwoorden:
 3D ruimtelijke gegevens, LiDAR-sensoren, puntenwolk, 3D 
objectdetectie, VoxelNet, PointNet, PointRCNN, autonome voertuigen, 
gezondheidszorg, industriële automatisering, 
veiligheidssurveillancesystemen, VR/AR, diep leren2- -
1. Inleiding
Het omvat het proces van gegevensverzameling, opslag, analyse en 
visualisatie en maakt gebruik van technologieën zoals LiDAR, 
fotogrammetrie en 3D scanning om driedimensionale ruimtelijke 
informatie te verwerken. Deze technologieën worden gebruikt in 
verschillende softwareplatforms, waarbij geografische 
informatiesystemen (GIS) en computerondersteund ontwerp (CAD) de 
belangrijkste hulpmiddelen . Dit complexe ruimtelijke analyses .
LiDAR gebruikt laserpulsen om afstandsgegevens te verzamelen, terwijl 
fotogrammetrie luchtfoto's gebruikt om 3D-modellen te maken. Deze 
gegevens worden opgeslagen in een database en indien nodig gebruikt 
voor analyse en visualisatie.1)
Onderzoek heeft aangetoond dat 3D CNN structuren gebruikt kunnen 
worden om 3D representaties te leren, en dat dit efficiënter kan dan 
traditionele volledig 3D CNN-gebaseerde methodes.2)
GPU-gebaseerde 3D-visualisatiemethoden maken een verfijndere en 
nauwkeurigere ruimtelijke afbakening mogelijk.3)
3D-modellering wordt gebruikt als een essentieel hulpmiddel in het 
architectonische ontwerp- en simulatieproces. Hiermee u de veiligheid 
van constructies beoordelen en de nauwkeurigheid van uw ontwerpen 
vergroten.
Ruimtelijke 3D-gegevens worden gebruikt voor onderzoek naar 
ecosysteemveranderingen en rampenbeheer. 3D-geologische 
modellering wordt bijvoorbeeld gebruikt voor grondwaterexploratie en 
geologisch onderzoek.4)
3D-gegevens gebruikt om meeslepende omgevingen te ontwikkelen om 
de gebruikerservaring te verbeteren. Dit toegepast in verschillende 
sectoren, waaronder onderwijs, gezondheidszorg en entertainment.
3D-technologieën voor de verwerking van ruimtelijke gegevens maken 
een snelle ontwikkeling door op verschillende gebieden, met name bij 
de verwerving van puntenwolkgegevens en de detectie van objecten in 3- -
de 3D-ruimte met behulp van LiDAR-sensoren. Deze technologieën voor 
een revolutie in autonome voertuigen, medische toepassingen, 
industriële automatisering, veiligheidssystemen en VR/AR-omgevingen. 
Dit onderzoeksrapport een basisinzicht in 3D-technologieën voor de 
verwerking van ruimtelijke gegevens en legt uit hoe ze worden 
toegepast in verschillende industrieën.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en visualisatie van 
3D-gegevens. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020). 
Triplanaire convolutie met gedeelde 2D kernels voor 3D classificatie en 
vormherwinning. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). A Novel Method for Regional 
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). New regional stratigraphic insights from a 3D geological model of the 
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based 
on reprocessed B-field data originally collected for mineral exploration. 
Solid Earth, 11, 349-361.4- -
2. Point CLoud-gegevens verzamelen met LiDAR-sensoren
Puntwolkgegevensverzameling met LiDAR-sensoren speelt een 
belangrijke rol in een groot aantal toepassingen en is bijzonder geschikt 
voor het verzamelen van 3D-gegevens met hoge resolutie. LiDARtechnologie
zendt laserpulsen uit om signalen te ontvangen die door 
objecten worden gereflecteerd en berekent op basis daarvan 
afstandsinformatie. Deze informatie wordt opgeslagen in een 
puntenwolkformaat, waarbij elk punt X-, Y- en Z-coördinaten en de 
reflectie-intensiteit bevat.
LiDAR-puntwolken kunnen op verschillende gebieden , zoals , en 
grondstoffenbeheer. Puntwolken worden vervolgens omgezet in of GISgegevens
door nabewerking voor denoising, uitlijning en 
oppervlaktereconstructie. In dit proces wordt een verscheidenheid aan 
software gebruikt, vooral GPU-gebaseerde 3D-visualisatiemethoden, die 
een meer verfijnde ruimtelijke afbakening mogelijk maken.5)
LiDAR-gegevens spelen ook een belangrijke rol in 
waarnemingssystemen voor autonome voertuigen. LiDARpuntenwolkverwerking
en -training op het gebied van autonoom rijden 
hebben bijgedragen aan een nauwkeurige waarneming van de 
wegomgeving en objectdetectie.6) Deze gegevens zijn essentieel voor het 
maken van realtime 3D-kaarten met een hoge resolutieautonome 
voertuigen veilig kunnen navigeren in complexe wegomstandigheden.
kunnen ook voor Gegevens verzameld door LiDAR op vliegtuigen 
kunnen bijvoorbeeld worden gebruikt om 3D-modellen van geologische 
formaties te reconstrueren, die bijdragen aan grondwaterexploratie of 
geologisch onderzoek.7) Deze 3D-geologische modellering maakt nieuwe 
geologische interpretaties mogelijk en helpt om de geologische 
kenmerken van een gebied beter te begrijpen.
De voordelen van LiDAR technologie zijn onder andere snelle 
gegevensverwerving en hoge nauwkeurigheid, maar het heeft 
beperkingen relatief hoge kosten en prestaties in regenachtig of Er 
wordt voortdurend onderzoek en ontwikkeling gedaan om deze 
technische beperkingen te overwinnen, LiDAR in een groter aantal 5- -
industrieën kan worden gebruikt.
Een LiDAR-sensor (Light Detection and Ranging) is een technologie die 
een laser gebruikt om het oppervlak van een object te meten en de 
gegevens kunnen worden gebruikt om ruimtelijke informatie in 3D te 
verkrijgen. De puntenwolkgegevens die door een LiDAR-sensor worden 
gegenereerd, zijn een verzameling van vele punten verspreid in de 3Druimte,
die elk kunnen worden beschreven door hoogte, afstand en 
positionering.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en visualisatie van 
3D-gegevens. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Lidar Point Cloud Compression, Processing and Learning for Autonomous 
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). New regional stratigraphic insights from a 3D geological model of the 
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based 
on reprocessed B-field data originally collected for mineral exploration. 
Solid Earth, 11, 349-361.6- -
balken. Deze gegevens zijn cruciaal voor de perceptie van de omgeving 
door autonome voertuigen, modellering de architectuur en civiele 
techniek en 3D-kartering.
3. 3D-objectdetectietechnologie
3D-objectdetectie is een belangrijke technologie voor het herkennen en 
lokaliseren van objecten in de 3D-ruimte en essentieel op verschillende 
gebieden, waaronder autonome voertuigen, en augmented reality. Het 
voornamelijk gebaseerd op 3D-gegevens die zijn verzameld met LiDAR, 
RGB-D-camera's en stereovisiesystemen.
Het maakt gebruik van puntenwolken gegenereerd door LiDAR om de 
locatie en vorm van objecten te herkennen. Deep learning-modellen 
zoals PointNet worden veel gebruikt op dit gebied, en deze methoden 
zijn essentieel voor het genereren van 3D-kaarten met een hoge 
resolutie en in realtime.8)
Het is een techniek om objecten te detecteren door 2D-beelden 
verkregen door RGB-camera's te combineren met 3D-informatie. Deze 
methode verbetert de detectieprestaties door kleur- en 
patrooninformatie van het object toe te voegen. Recent onderzoek heeft 
methoden voorgesteld zoals FusionRCNN, dat LiDAR- en camerabeelden 
combineert om de nauwkeurigheid van de detectie te verbeteren.9)
Deep learning-structuren zoals Convolutionele Neurale Netwerken 
(CNN's) en Recurrente Neurale Netwerken (RNN's) worden gebruikt om 
kenmerken van en te herkennen. Deze modellen verbeteren de 
nauwkeurigheid van objectclassificatie en locatie-inschatting op basis 
van datasets, wat vooral belangrijk voor obstakelherkenning in 
autonome voertuigen.10)
Het wordt gebruikt om de rijveiligheid te verhogen door obstakels en 
voetgangers op de weg te detecteren. Er op dit gebied actief onderzoek 
gedaan naar het samenvoegen van LiDAR-puntenwolken met 
visiongegevens voor nauwkeurigere detectie.11)
Het helpt de robot om zijn omgeving te begrijpen en ermee te 
interageren. Dit vooral belangrijk voor het bepalen van de exacte 7- -
locatie van objecten om de robot te helpen zijn pad te plannen en taken 
uit te voeren.
Objecten in realtime herkennen en erop reageren om de 
gebruikerservaring te verbeteren. In augmented reality bijvoorbeeld de 
locatie en vorm van objecten nauwkeurig worden bepaald om de 
interactie met virtuele objecten te verbeteren.
8) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving: 
Een overzicht. Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-Camera fusie voor tweefasige 3D objectdetectie. 
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super Sparse 
3D Object Detection. IEEE Transactions on Pattern Analysis and Machine 
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-Camera fusie voor tweefasige 3D objectdetectie. 
Remote Sensing, 15, 1839.8- -
Deze technologieën evolueren en bieden preciezere en efficiëntere 
oplossingen voor de detectie van 3D-objecten. Vooruitgang in onderzoek 
en technologie verbetert de nauwkeurigheid van herkenning in echte 
omgevingen aanzienlijk.
3D-objectdetectie is nauwkeurige identificatie en classificatie van 
specifieke objecten in de 3D-ruimte, die wordt ondersteund door 
verschillende technieken voor de verwerking van 3D-ruimtelijke 
gegevens. Recentelijk deep learning-gebaseerde technieken actief 
toegepast op 3D-objectdetectie. Representatieve technologieën VoxelNet, 
PointNet en PointRCNN.
3.1 VoxeLNet
VoxelNet is een innovatieve deep learning-architectuur die speciaal is 
ontworpen om 3D-objecten te detecteren met behulp van puntenwolken, 
wat essentieel is voor autonome besturingssystemen. De architectuur 
hanteert een unieke aanpak door ruwe puntenwolkgegevens te 
converteren naar een gestructureerd 3D voxelraster om efficiënte 
verwerking en extractie van kenmerken mogelijk te maken. De 
conversie naar een voxelrepresentatie is omdat VoxelNet hierdoor 
effectief gebruik kan maken van 3D-convolutie om ruimtelijke 
informatie vast te leggen en tegelijkertijd computerefficiëntie te 
garanderen. Deze efficiëntie is essentieel voor real-time toepassingen 
zoals die voor autonoom rijden.
De kracht van VoxelNet ligt in de mogelijkheid om een nieuwe feature 
coderingslaag in te bouwen die de representatieve kracht van elke voxel 
sterk verbetert. Dit wordt bereikt door rekening te houden met de 
unieke kenmerken van de punten in elke voxel, waardoor het netwerk 
objecten in complexe omgevingen beter kan detecteren en 
classificeren.12) Deze kenmerkcoderingsstap is voor het oplossen van 
problemen die worden veroorzaakt door de onregelmatige en schaarse 
aard van puntenwolkgegevens, die moeilijk te verwerken zijn met 
traditionele 2D convolutionele neurale netwerken.
Onderzoek heeft aangetoond dat VoxelNet belangrijke bijdragen heeft 
geleverd op het gebied van 3D-objectdetectie. Het vermogen van de 9- -
architectuur om een hoge nauwkeurigheid te bieden met behoud van 
computerefficiëntie maakt bijvoorbeeld een voorkeursoptie voor interimplementatietoepassingen
in autonome voertuigen.13) Bovendien kan 
VoxelNet dankzij de integratie van de schaarse representatie de grote 
hoeveelheden gegevens die vaak voorkomen in autonome rijscenario's 
effectief verwerken.
De ontwikkeling van VoxelNet betekent een belangrijke vooruitgang in 
de verwerking van 3D-gegevens en legt de basis voor toekomstige 
innovaties in autonome rijtechnologie. Het pakt de belangrijkste 
uitdagingen op dit gebied aan door efficiënte voxelisatie te combineren 
met geavanceerde kenmerkcoderingstechnieken.14) Dit verbetert niet 
alleen de detectienauwkeurigheid, maar maakt ook geavanceerdere 
handhaving mogelijk.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep 
Learning voor 3D Point Clouds: een overzicht. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Adversarial 
point cloud perturbations against 3D object detection in autonomous 
driving systems. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objectdetectie uit 
monoculaire, stereo- en puntenwolk voor autonoom rijden. 
Neurocomputing, 494, 23-32.10- -
VoxelNet verlegt de grenzen van de ontwikkeling van 3D 
perceptiesystemen. Met zijn krachtige prestaties en innovatieve aanpak 
blijft VoxelNet lopende onderzoek en de ontwikkeling van 3D 
puntenwolkverwerking en autonome systemen beïnvloeden.15)
VoxelNet is een innovatief model voor 3D objectdetectie dat 
puntenwolkgegevens verwerkt door deze om te zetten in 3D-rasters 
(voxels). Elke voxel vertegenwoordigt een punt in de puntenwolk, 
waardoor het model ruimtelijke informatie effectiever verwerken. 
VoxelNet gebruikt deze voxelinformatie objecten te detecteren en 
voorspellingen te doen. Het voordeel deze benadering is dat het efficiënt 
en snel is om grote hoeveelheden puntenwolkgegevens te verwerken.
3.2 PointNet
PointNet is een baanbrekende deep learning-architectuur die een 
revolutie teweegbrengt in de verwerking van 3D-puntwolkgegevens 
door ongeordende puntensets direct te verwerken. In tegenstelling tot 
traditionele methoden die gestructureerde invoer vereisen, gebruikt 
PointNet symmetriefuncties om permutatie-invariantie te garanderen, 
waardoor de ruimtelijke relaties tussen punten zodat de blijft de van de 
invoerpunten.
De belangrijkste innovatie van PointNet is het gebruik van MLP's 
(perceptronsen max-pooling Deze architectuur voegt kenmerken van 
individuele punten efficiënt samen tot een globale representatie, wat 
bijzonder nuttig is voor taken zoals classificatie en segmentatie. Dankzij 
het vermogen om grote en nauwkeurig , is een baanbrekend model op 
dit gebied en heeft het talrijke latere architecturen geïnspireerd die op 
zijn principes zijn gebaseerd.
De impact van PointNet reikt verder dan academisch onderzoek naar 
praktische implementaties op gebieden zoals autonoom rijden en 
robotherkenning. In autonome systemen is PointNet bijvoorbeeld 
gebruikt om LiDAR-gegevens te verwerken om objectdetectie en 
navigatie te verbeteren door objecten van de ene proef naar de volgende 
te identificeren en te classificeren.16) PointNet's ontwerp maakt het 
mogelijk om effectief om te gaan met de complexiteiten die 11- -
geassocieerd worden met 3D-gegevens, zoals occlusies en variaties in 
puntdichtheid, waardoor het een veelzijdig hulpmiddel is in 
computervisietoepassingen.
De vooruitgang die PointNet heeft gebracht heeft geleid tot de 
aanpassing van PointNet in verschillende innovatieve contexten. Het is 
bijvoorbeeld toegepast om LiDAR-gegevens vanuit de lucht te 
classificeren, waardoor de nauwkeurigheid en efficiëntie van 
teledetectieoperaties is verbeterd.17) Het aanpassingsvermogen van 
PointNet heeft ook geleid tot de integratie met op fysica gebaseerde 
neurale netwerken om de verspreiding van scheuren te analyseren.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Multi-view 
semantisch leernetwerk voor 3D objectdetectie op basis van puntenwolken. 
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep 
Learning voor 3D Point Clouds: een overzicht. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR point cloud 
classification using PointNet++ network with full neighbourhood features. 
PLOS ONE, 18.12- -
en vloeistofdynamische simulaties, en heeft bewezen complexe 
industriële problemen op te lossen.18)
Pointnet blijft dienen als een benchmark in 3D gegevensverwerking en 
heeft de mogelijkheden van deep learning modellen om 
puntenwolkgegevens te verwerken aanzienlijk verbeterd. De impact van 
Pointnet is duidelijk zichtbaar in zowel theoretische vooruitgang als 
praktische toepassingen, wat de voortdurende relevantie en 
aanpasbaarheid aantoont in het zich ontwikkelende landschap van 
kunstmatige intelligentie en machinaal leren.19)
PointNet is een model dat direct puntenwolkgegevens verwerken en 
objecten in de 3D-ruimte kan herkennen, ongeacht de volgorde van elk 
punt. PointNet extraheert de kenmerken van de punten en voert op 
basis daarvan classificatie en segmentatie uit. Dit model kan omgaan 
met de ongestructureerde aard van puntenwolken en kan op 
verschillende gebieden worden gebruikt, zoals autonoom rijden, 
robotica en medische beeldanalyse.
3.3 PuntRCNN
PointRCNN is een belangrijk raamwerk op het gebied van 3D 
objectdetectie, vooral voor toepassingen zoals autonoom rijden. Het 
raamwerk gebruikt een detectieproces in twee stappen om de 
nauwkeurigheid en efficiëntie van het detecteren van objecten in 3Dpuntenwolkgegevens
te verbeteren. De eerste stap is het genereren van 
objectsuggesties via een puntgebaseerd lokaal suggestienetwerk. Deze 
stap is omdat het direct werkt op de ruwe puntenwolkgegevens, waarbij 
gedetailleerde ruimtelijke informatie behouden blijft die verloren kan 
gaan bij traditionele methoden die vertrouwen op beeldprojecties of 
voxelisatie.
In de tweede stap verfijnt PointRCNN het initiële voorstel door 3D 
bounding box uit te voeren. Hierdoor worden de grootte en oriëntatie 
van de aangepast zodat deze beter past bij de gedetecteerde objecten in 
de puntenwolkgegevens. Door gebruik te maken van kenmerken die 
rechtstreeks uit de ruwe puntenwolk worden gehaald, bereikt 
PointRCNN een hogere nauwkeurigheid in objectdetectie vooral in 13- -
uitdagende omgevingen met complexe geometrie en occlusies.
Een van de belangrijkste voordelen van PointRCNN is de om end-to-end 
te leren. Deze architectuur vergemakkelijkt de naadloze integratie van 
netwerkfasen, waardoor niet alleen de detectieprestaties van het model 
verbeteren, maar ook de rekenefficiëntie, waardoor het geschikt is voor 
real-time toepassingen, zoals die nodig zijn voor autonome 
besturingssystemen.
Onderzoek heeft aangetoond dat methoden die gebruik maken van 
puntenwolkgegevens het begrip en de interpretatie van 3D-scènes in 
autonome rijsituaties aanzienlijk kunnen verbeteren. Zo kan het 
gebruik van multi-target detectiealgoritmen op basis van PointRCNN en 
voxel puntwolk fusie technieken worden gebruikt in dynamische 
scenario's vanwege hun veelzijdigheid en
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: A deep 
learning solver for steady-state incompressible flows and thermal fields on 
multiple sets of irregular geometries. Tijdschrift voor Computerfysica, 468, 
111510.
19) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Daarnaast tonen onderzoeken op het gebied van 3D-puntenwolken en 
deep learning-benaderingen het toenemende belang van deze kaders 
voor het begrijpen van scènes in autonoom rijden.20)
In het algemeen betekent PointRCNN een aanzienlijke vooruitgang in 
3D objectdetectietechnologie. Het vermogen om ruwe 
puntenwolkgegevens direct te verwerken en het efficiënte 
detectieproces in twee fasen een krachtig hulpmiddel voor de 
autonome , waar snelle en nauwkeurige cruciaal is voor de veiligheid en 
prestaties.
PointRCNN is een technologie die gebruik maakt van een CNN 
(Convolutional Neural Network) op basis van PointNet voor 3Dobjectdetectie,
en op effectieve wijze puntenwolkgegevens verwerkt 
objecten nauwkeurig te detecteren. PointRCNN is een technologie die 
de bestaande 2D-objectdetectiemethode uitbreidt naar 3D-omgevingen 
en wordt toegepast op objectherkenning van autonome voertuigen en 
omgevingsherkenning van robots.
4. Toepassingen
PuntRCNN's spelen een essentiële rol in autonome besturingssystemen 
en worden gebruikt om objecten in de omgeving nauwkeurig te 
herkennen en te volgen. met behulp van kan voertuigen helpen 
wegobstakels met een hoge mate van nauwkeurigheid , zelfs in 
complexe verkeerssituaties.22)
De robot gebruikt 3D-objectdetectietechnologie voor interactie met de 
omgeving. PointRCNN stelt de robot in staat om zijn omgeving van run 
tot run te begrijpen en de noodzakelijke taken uit te voeren.24)
Om virtuele objecten naadloos in te voegen in de echte wereld in een 
AR-omgeving, is nauwkeurige objectdetectie in 3D-ruimte vereist. 
PointRCNN een belangrijke rol in deze taak.
Drones moeten tijdens de vlucht verschillende obstakels kunnen 
herkennen en vermijden. PointRCNN kan worden gebruikt om objecten 
in real-time te detecteren uit de sensorgegevens van de drone en een 
veilig vluchtpad in te stellen.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
21) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-Based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous 
Driving: Een overzicht. Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objectdetectie voor 
autonoom rijden: Een uitgebreid overzicht. International Journal of 
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-Based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019).16- -
PointRCNN wordt toegepast op 3D-modellering en analyse van 
stedelijke omgevingen, wat belangrijke inzichten oplevert voor 
stedelijke planning en beheer. Dit helpen om de transportefficiëntie te 
verbeteren en de veiligheid in steden te vergroten.
In deze toepassingen zijn PointRCNNs zeer nuttig in situaties waar een 
hoge nauwkeurigheid en real-time verwerking vereist zijn. Onderzoek 
toont aan technieken zoals multi-target detectiealgoritmen op basis van 
PointRCNN hun prestaties en efficiëntie in deze toepassingen 
bewijzen.26) PointRCNN draagt bij aan het maximaliseren van de 
nauwkeurigheid en efficiëntie van 3D objectdetectie, wat belangrijk 
voor de vooruitgang van autonome voertuigen en andere geavanceerde 
systemen.
3D-technologie voor de verwerking van ruimtelijke gegevens in veel 
verschillende industrieën gebruikt. Enkele van de belangrijkste 
toepassingen zijn
4.1 Autonome voertuigen
voertuigen zijn voertuigen die geavanceerde technologie gebruiken om 
zichzelf te besturen zonder menselijke tussenkomst. Deze voertuigen 
maken gebruik van een verscheidenheid aan sensoren, camera's, radar, 
LiDAR en meer om zich nauwkeurig bewust te worden van hun 
omgeving. Deze technologieën, gecombineerd met real-time 
gegevensverwerking, zijn essentieel voor het bepalen van veilige 
rijroutes.
Met name 3D-objectdetectietechnologie is een belangrijk onderdeel van 
autonome voertuigen en speelt een belangrijke rol bij het nauwkeurig 
detecteren en herkennen van objecten rondom het voertuig. PointRCNN 
maakt bijvoorbeeld gebruik van puntenwolkgegevens om een hogeresolutie
analyse van de omgeving van een voertuig mogelijk te maken. 
autonome voertuigen voetgangers, andere voertuigen, verkeersborden 
en meer in realtime herkennen om veilig te kunnen rijden.27)
Autonome voertuigen ook het vermogen om rijpatronen te leren en zich 
aan te passen aan verschillende rijsituaties door het toepassen van 17- -
technologieën voor machinaal leren en kunstmatige intelligentie. Deze 
technologieën bij aan de verbetering van de veiligheid, efficiëntie en 
gebruikerservaring van voertuigen. Met name multi-sensor 
fusietechnologie verbetert de nauwkeurigheid van 3D objectdetectie, 
betrouwbare prestaties in verschillende omgevingen .28)
Een overzicht van 3D-objectdetectiemethoden voor toepassingen in 
autonoom rijden. IEEE Transactions on Intelligent Transportation Systems, 
20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for 
3D Object Detection in Autonomous Driving: A Review. IEEE Transactions 
on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonome voertuigen een belangrijk gebied van innovatie in 
toekomstige vervoerssystemen door de convergentie van complexe 
algoritmen en sensortechnologieën. Deze technologieën hebben een 
positief effect op de maatschappij als geheel doordat ze 
verkeersopstoppingen verminderen, het aantal verkeersongevallen 
terugdringen en een efficiëntere verkeersstroom mogelijk maken.29)
Autonome voertuigen gebruiken LiDAR-sensoren en 3Dobjectdetectietechnologie
om de omgeving van het voertuig in realtime 
waar te nemen en te analyseren. Hierdoor kunnen obstakels worden 
vermeden, voetgangers worden herkend, kruispunten worden 
geanalyseerd en om de veiligheid en rijefficiëntie van het voertuig te 
maximaliseren.
4.2 Gezondheidszorg
3D objectdetectietechnieken op medisch gebied, met name die zoals 
PointRCNN, een breed scala aan potentiële toepassingen. Deze 
technologieën worden voornamelijk gebruikt in medische beeldvorming, 
chirurgische robotica, patiëntbewakingssystemen, enz.
3D-objectdetectietechnologie helpt bij nauwkeurig detecteren van 
laesies in CT-, MRI- en echografiebeelden. Dit is vooral belangrijk op 
gebieden zoals radiologie, waar het kan worden gecombineerd met 
computerondersteunde diagnostische systemen die gebruik maken van 
kunstmatige intelligentie en machinaal leren om de diagnostische 
nauwkeurigheid te verbeteren.30)
In chirurgische robotsystemen maakt 3D-objectdetectietechnologie 
nauwkeurige herkenning mogelijk van omliggende weefsels en organen 
tijdens de operatie, wat bijdraagt aan een veilige en nauwkeurige 
operatie. Samen met de vooruitgang in medische kunstmatige 
intelligentie dit de efficiëntie en veiligheid van chirurgie aanzienlijk 
verbeteren.31)
3D-sensoren en objectdetectietechnologie kunnen de real-time 
bewegingen en vitale functies van een patiënt analyseren om 
afwijkingen in een vroeg stadium op te sporen. Deze technologieën 19- -
worden gecombineerd met patiëntmonitoringsystemen op basis van 
kunstmatige intelligentie om de toestand van een patiënt continu te 
volgen en te beheren.32)
In combinatie met virtual reality (VR) zou het gebruikt kunnen worden in 
medische opleidingen en trainingen. 3D-objectdetectietechnologie
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for 
Autonomous Driving Applications. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). AAPM task group report 273: 
Recommendations on best practices for AI and machine learning for 
computer-aided diagnosis in medical imaging. Medische fysica.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstmatige 
intelligentie in de gezondheidszorg: een meesterschap. Biotechnology and 
Genetic Engineering Reviews, Geen, 1-50.
32) Almagharbeh, W. (2024). De impact van AI-gebaseerde 
beslissingsondersteunende systemen op verpleegkundige workflows in 
kritieke zorgafdelingen. International nursing review, Geen.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023). 
Artificial intelligence in clinical decision support systems for oncology. 
International Journal of Medical Sciences, 20, 79-86.20- -
 speelt een belangrijke rol bij het helpen van artsen en zorgverleners bij 
het simuleren van operaties en diagnoses, waardoor ze kunnen leren in 
een realistische omgeving.33)
Deze toepassingen dragen bij aan het verhogen van de nauwkeurigheid 
van diagnoses en behandelingen op medisch gebied en het verbeteren 
van de algemene veiligheid. Met name 3D-objectdetectietechnologie in 
combinatie met AI versnelt de innovatie in de gezondheidszorg en een 
belangrijk hulpmiddel voor het verbeteren van de gezondheid en 
veiligheid van patiënten. Deze studies bieden nieuwe perspectieven op 
de commerciële, regelgevende en maatschappelijke implicaties van 
medische AI.34)
Op medisch gebied 3D-verwerking van ruimtelijke gegevens gebruikt 
voor nauwkeurige diagnose en chirurgische planning. 
Puntwolkgegevens van 3D medische beeldvorming, zoals CT-scans of 
MRI-resultaten, worden gebruikt om de operatieplaats te visualiseren 
en de exacte locatie en grootte te meten om de chirurgische 
nauwkeurigheid te verbeteren.
4.3 Industriële automatisering en robotica
3D-objectdetectietechnologieën, met name modellen zoals PointRCNN, 
zorgen voor een revolutie op het gebied van industriële automatisering 
en robotica. Deze technologieën verbeteren de efficiëntie en 
nauwkeurigheid in een groot aantal industrieën aanzienlijk en spelen 
een belangrijke rol in de volgende specifieke gebieden
3D-objectdetectietechnologie is essentieel voor robotsystemen om 
objecten in een magazijn te herkennen en sorteren. Hierdoor kunnen 
robots objecten van verschillende afmetingen en vormen nauwkeurig 
herkennen, waardoor ze efficiënte verplaatsings- en sorteertaken 
kunnen uitvoeren. Deze technologieën verhogen de efficiëntie van 
industriële processen en vergemakkelijken de automatisering van 
logistieke systemen.35)
Wanneer industriële robots automatisch onderdelen assembleren, 
verhoogt 3D objectdetectie de assemblage-efficiëntie door de exacte 
positie en oriëntatie van onderdelen te herkennen. Dit draagt 21- -
aanzienlijk bij tot hogere productiesnelheden en minder defecten, en 
een belangrijke rol in slimme productieomgevingen.36)
Ze worden gebruikt om de geometrie en afmetingen van producten te 
inspecteren met behulp van 3D-scantechnologie en een belangrijke rol 
bij het waarborgen van de productkwaliteit, het vroegtijdig opsporen 
van defecten en het verlagen van de kosten. Deze geautomatiseerde 
onderdelen
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Artificial Intelligence Based Prediction of Lung Cancer Risk Using 
Nonimaging Electronic Medical Records: Deep Learning Approach. Journal 
of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstmatige 
intelligentie in de gezondheidszorg: een meesterschap. Biotechnology and 
Genetic Engineering Reviews, Geen, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., & 
White, M. (2021). Sim2Real in Robotica en Automatisering: Toepassingen en 
Uitdagingen. IEEE Transactions on Automation Science and Engineering, 18, 
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Op leren gebaseerde automatisering van robotassemblage voor slimme 
productie. Proceedings van de IEEE, 109, 423-440.22- -
Kwaliteitsinspectiesystemen verhogen de betrouwbaarheid van 
producten.37)
Om de veiligheid van robots en automatiseringssystemen te vergroten, 
wordt 3D-objectdetectietechnologie gebruikt. Hierdoor kunnen of in de 
buurt herkennen veilig Deze veiligheidsmechanismen dragen bij aan 
het verminderen van ongevallen in industriële omgevingen.38)
Het is essentieel voor autonome voertuigen of drones om objecten te 
detecteren en hun routes te plannen. 3D-objectdetectietechnologie deze 
systemen om efficiënt te werken, obstakels te vermijden en levertaken 
veilig uit te voeren.39)
Op deze gebieden 3D-objectdetectietechnologieën de drijvende kracht 
achter innovatie in industriële automatisering en helpen ze de 
productiviteit te verhogen, de kosten te verlagen en de veiligheid te 
verbeteren. In de toekomst zullen deze technologieën een integraal 
onderdeel blijven uitmaken van de evolutie van robotica en 
automatiseringssystemen. Onderzoek heeft aangetoond dat de 
toepassing van deze technologieën een belangrijke bijdrage aan het 
verhogen van de efficiëntie van industriële processen en het beheren 
van de complexiteit van geautomatiseerde systemen.40)
In industriële automatisering en robotica wordt 3D-verwerking van 
ruimtelijke gegevens gebruikt om de efficiëntie van productieprocessen 
te verhogen en kwaliteitsinspecties te automatiseren. Robots gebruiken 
LiDAR-sensoren of 3D-camera's producten te herkennen, afwijkingen te 
detecteren en kwaliteitsproblemen op te lossen.
4.4 Systemen voor veiligheidstoezicht
In veiligheidssurveillancesystemen 3D-objectdetectietechnologie een 
belangrijke rol bij het bieden van effectieve monitoring- en 
beveiligingsoplossingen in uiteenlopende omgevingen. De technologie 
is vooral prominent aanwezig op gebieden zoals realtime bewaking, 
inbraakdetectie, incidentpreventie, gegevensanalyse en rapportage, en 
integratie van kunstmatige intelligentie.23- -
3D-objectdetectiesystemen met realtime bewakingsmogelijkheden 
maken gebruik van camera's en sensoren om de omgeving in realtime te 
analyseren. Deze realtime analyse maakt nauwkeurige herkenning van 
mensen, voertuigen en objecten mogelijk en biedt onmiddellijke 
waarschuwingen in het geval van een gevaarlijke situatie. Dit is 
essentieel voor het verhogen van de veiligheid, vooral in complexe 
omgevingen zoals wegen en luchthavens.
Op het gebied van inbraakdetectie is 3D-objectdetectietechnologie 
effectief in het detecteren van ongewone bewegingen of gedrag binnen 
een specifiek beveiligingsgebied. Dit kan leiden tot vroegtijdige detectie 
van een indringer en het beveiligingspersoneel onmiddellijk voorzien 
van
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industriële 
automatisering en productkwaliteit: de rol van robotische 
productietransformatie. Toegepaste economie.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing 
Dynamic and Collaborative Automation and Robotics Software Systems. 
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotica: van automatisering tot intelligente systemen. 
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Industriële visie en automatisering. Measurement Science and Technology, 
33.24- -
Voorkom onbevoegde toegang tot beveiligde gebieden door rode 
waarschuwingen te geven.
Op het gebied van ongevallenpreventie voorkomen deze systemen 
ongevallen in verschillende omgevingen, waaronder industriële locaties, 
door gevaren vroegtijdig te detecteren en te waarschuwen. Een 
automatisch waarschuwingssysteem bijvoorbeeld worden geactiveerd 
wanneer een werknemer een gevaarlijk gebied nadert om een ongeval te 
voorkomen.
Met de mogelijkheden voor gegevensanalyse en rapportage kunt u de 
beveiligingssituatie beoordelen en problemen identificeren door middel 
van analyses op basis van de verzamelde 3D-gegevens. Deze analyses 
bieden belangrijke inzichten voor de toekomstige beveiligingsstrategie 
en continue verbetering van de beveiliging .
Met de integratie van kunstmatige intelligentie kan 3Dobjectdetectietechnologie
worden gecombineerd met algoritmen voor 
machinaal leren om een intelligenter bewakingssysteem te creëren. het 
systeem patronen leren en geavanceerdere waarschuwings- en 
responsmechanismen implementeren.
Op deze manier wordt 3D-objectdetectietechnologie een integraal 
onderdeel van veiligheidssurveillancesystemen, waarmee wordt 
voldaan aan verschillende beveiligingsbehoeften en de veiligheid van 
faciliteiten wordt vergroot. Er wordt verwacht dat deze technologieën 
zich in de toekomst verder zullen ontwikkelen, wat zal leiden tot 
geavanceerdere en efficiëntere oplossingen voor veiligheidstoezicht. 
Deze technologische vooruitgang uitmonden in robuustere 
beveiligingssystemen, vooral door integratie met kunstmatige 
intelligentie.41)
3D-objectdetectietechnologie ook een belangrijke rol in 
veiligheidsbewakingssystemen. LiDAR-sensoren en 3Dobjectdetectietechnologie
worden gebruikt om indringers te detecteren 
of om te bepalen of er mensen in de buurt zijn. Ze ook gedragspatronen 
in de 3D-ruimte analyseren om illegale activiteiten op te sporen en te 
voorkomen.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). An 
Infrared Small Target Detection Method Based on a Weighted Human Visual 
Comparison Mechanism for Safety Monitoring. Remote. Sens, 15, 2922.26- -
4.5 VR/AR
In virtual reality (VR) en augmented reality (AR) verbetert 3Dobjectdetectietechnologie
de gebruikerservaring aanzienlijk in 
verschillende sectoren. Dankzij 3D-objectdetectie kunnen gebruikers 
interageren met echte objecten in virtuele omgevingen. Dit is essentieel 
voor AR-toepassingen om hun omgeving in realtime te herkennen en 
virtuele elementen nauwkeurig te kunnen plaatsen en manipuleren. Dit 
maakt de gebruikerservaring meeslepender.
In VR-omgevingen wordt 3D objectdetectie gebruikt om realistische 
simulaties te creëren. Dit biedt trainingsscenario's op verschillende 
gebieden, waaronder medisch, en luchtvaartwaardoor deelnemers op 
een veilige manier levensechte situaties kunnen ervaren en oefenen. De 
toepassing van VR/AR, vooral op het gebied van veiligheid in de bouw, 
verhoogt het veiligheidsbewustzijn van werknemers.42)
In de game-industrie zorgt 3D objectdetectie voor een ervaring door de 
beweging en positie van de speler nauwkeurig te volgen. Dit maakt 
interactie met virtuele personages mogelijk, wat het realisme van het 
spel verhoogt.
In de architectuur en techniek kan AR-technologie worden gebruikt om 
ontwerpmodellen in de echte wereld te visualiseren. Dit helpen om 
fouten in het ontwerpproces van tevoren op te sporen en de 
communicatie met klanten te vergemakkelijken. Deze toepassingen 
kunnen bijzonder synergetisch zijn met veiligheid in de bouw.43)
AR-technologie helpt consumenten bij het nemen van 
aankoopbeslissingen doordat ze producten virtueel kunnen ervaren. 
Het geeft ze bijvoorbeeld de mogelijkheid om meubels in hun huis te 
plaatsen of cosmeticakleuren van tevoren uit te proberen. Dit verbetert 
de koopervaring en interactie van de consument.44)
Op deze manier zorgt de 3D-objectdetectietechnologie voor innovatieve 
ervaringen in VR en AR, en wordt ze gebruikt in verschillende 
industrieën. In de toekomst zullen deze technologieën zich blijven 
ontwikkelen, waardoor de interactie tussen de gebruiker en de virtuele 
omgeving nog naadlozer en natuurlijker wordt. Dit zal het gebruik van 27- -
VR/AR-technologie in het onderwijs, entertainment, handel en nog veel 
meer verder uitbreiden. Tegelijkertijd de vooruitgang in deze 
technologieën nieuwe mogelijkheden creëren in de toerisme- en horecaindustrie.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch 
overzicht van virtuele en augmented reality (VR/AR) toepassingen in 
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch 
overzicht van virtuele en augmented reality (VR/AR) toepassingen in 
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
'The persuasion effects of virtual reality (VR) and augmented reality (AR) 
video advertisements: A conceptual review'. Journal of Business Research.
45) Wei, W. (2019). Onderzoeksvoortgang naar virtual reality (VR) en 
augmented reality (AR) in toerisme en gastvrijheid. Journal of Hospitality 
and Tourism Technology, 10, 539-570.28- -
In virtual reality (VR) en augmented reality (AR) spelen ruimtelijke 3Dgegevens
een belangrijke rol interactie met objecten in de echte wereld. 
ruimtelijke gegevens in 3D kunnen virtuele objecten op de juiste manier 
in de echte wereld worden geplaatst en kunnen gebruikers er op een 
natuurlijke manier mee interageren.
5. Conclusie
3D-technologie voor de verwerking van ruimtelijke gegevens voor een 
revolutie op veel gebieden, waaronder autonoom rijden, 
gezondheidszorg, industrie, veiligheid en VR/AR. Met name LiDARsensoren
en 3D-objectdetectietechnologieën een belangrijke rol op elk 
van deze gebieden en dragen bij aan realtime omgevingsanalyse, 
nauwkeurige diagnose en behandeling en efficiënte 
automatiseringssystemen. Deze technologieën zich blijven ontwikkelen 
en zorgen voor rijkere gebruikerservaringen op verschillende gebieden.29- -
Referenties
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Lidar Point Cloud Compression, Processing and Learning for 
Autonomous Driving. IEEE Transactions on Intelligent Transportation 
Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for 
Autonomous Driving Applications. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en 
visualisatie van 3D-gegevens. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Kunstmatige intelligentie in de geneeskunde. New 
England Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Verbetering van industriële 
processen door automatisering en robotica. Machines.
6. Cao, M., & Wang, J. (2020). Obstacle Detection for Autonomous 
Driving Vehicles With Multi-LiDAR Sensor Fusion. Journal of Dynamic 
Systems Measurement and Control - Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objectdetectie uit 
monoculaire, stereo- en puntenwolk voor autonoom rijden. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). An 
Infrared Small Target Detection Method Based on a Weighted Human 
Visual Comparison Mechanism for Safety Monitoring. Remote. Sens, 15, 
2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). New regional stratigraphic insights from a 3D 
geological model of the Nasia sub-basin, Ghana, developed for 
hydrogeological purposes and based on reprocessed B-field data 
originally collected for mineral exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and 
Industrial Systematic Mapping Study. IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super 
Sparse 3D Object Detection. IEEE Transactions on Pattern Analysis and 
Machine Intelligence, 45, 12490-12505.30- -
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Point-cloud based 3D object detection and classification methods 
for self-driving applications: A survey and taxonomy. Information 
Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Diep31- -
Leren voor 3D-puntwolken: een overzicht. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, 
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., 
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. 
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM task group report 273: Recommendations 
on best practices for AI and machine learning for computer-aided 
diagnosis in medical imaging. Medische fysica.
15. Huang, S. (2019). Augmented reality en virtual reality: de kracht van 
AR en VR voor het bedrijfsleven. Information Technology and Tourism, 
21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. 
(2021).
Op leren gebaseerde automatisering van robotassemblage voor slimme 
productie. Proceedings van de IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). 'The persuasion effects of virtual reality (VR) and augmented 
reality (AR) video advertisements: A conceptual review'. Journal of 
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplanaire convolutie met gedeelde 2D kernels voor 3D classificatie en 
vormherwinning. Computer Vision and Image Understanding, 193, 
102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Immersieve interactieve 
technologieën en virtuele winkelervaringen: Verschillen in 
consumentenpercepties tussen augmented reality (AR) en virtual reality 
(VR). Telematica en Informatica, 77, 101936.
20. Kusiak, A. (2023). Hyperautomatisering in de maakindustrie. J. 
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch 
overzicht van virtuele en augmented reality (VR/AR) toepassingen in 
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion 
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objectdetectie voor 32- -
autonoom rijden: Een uitgebreid overzicht. International Journal of 
Computer Vision, 131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Industriële visie en automatisering. Measurement Science and 
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). 
Kunstmatige intelligentie in de gezondheidszorg: een meesterschap. 
Biotechnology and Genetic Engineering Reviews, Geen, 1-50.
26. Nebot, E. (2018). Robotica: van automatisering tot intelligente 
systemen. Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. 
(2022). Dynamic graph33- -
transformator voor 3D objectdetectie. Kennisgebaseerde systemen, 259, 
110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: op deep 
learning gebaseerde 3D-objectdetectie met behulp van semantische 
puntenwolk. Visual Computer, , 1-15.
29. Wei, W. (2019). Onderzoeksvoortgang naar virtual reality (VR) en 
augmented reality (AR) in toerisme en gastvrijheid. Journal of 
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). A Novel Method for 
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using 
Nonimaging Electronic Medical Records: Deep Learning Approach. 
Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Computerondersteunde detectie en 
diagnose/radiomics/machine learning/deep learning in medische 
beeldvorming. Medische Fysica.

Raport z badań: Technologia przetwarzania danych 
przestrzennych 3D i jej zastosowania  AI 
Research Institute 2025_01Youngho Hong
Abstrakty:
Badania te obejmują rozwój i zastosowanie technologii przetwarzania 
danych przestrzennych 3D, w szczególności pozyskiwania danych z 
chmury punktów i technologii wykrywania obiektów 3D za pomocą
czujników LiDAR. Koncentruje się na technologiach wykrywania 
obiektów 3D VoxelNet, PointNet i PointRCNN i wyjaśnia, w jaki sposób 
technologie te są wykorzystywane w różnych dziedzinach, takich jak 
pojazdy autonomiczne, opieka zdrowotna, automatyka przemysłowa, 
systemy nadzoru bezpieczeństwa i VR / AR. Dane chmury punktów 
zebrane przez czujniki LiDAR analizują przestrzeń 3D z dużą precyzją, a 
oparta na nich technologia wykrywania obiektów 3D ważną rolę w 
świadomości środowiskowej w czasie rzeczywistym, precyzyjnej 
diagnostyce, optymalizacji procesów produkcyjnych itp. Niniejsze 
badanie analizuje wpływ technologii przetwarzania danych 
przestrzennych 3D na nowoczesny przemysł i innowacje technologiczne 
oraz omawia potencjał przyszłego rozwoju.
Słowa kluczowe:
 Dane przestrzenne 3D, czujniki LiDAR, chmura punktów, 
wykrywanie obiektów 3D, VoxelNet, PointNet, PointRCNN, pojazdy 
autonomiczne, opieka zdrowotna, automatyka przemysłowa, systemy 
nadzoru bezpieczeństwa, VR/AR, uczenie głębokie2- -
1. Wprowadzenie
Obejmuje proces gromadzenia, przechowywania, analizy i wizualizacji 
danych oraz wykorzystuje technologie takie jak LiDAR, fotogrametria i 
skanowanie 3D do przetwarzania trójwymiarowych informacji 
przestrzennych. Technologie te są wykorzystywane w różnych 
platformach oprogramowania, przy czym głównymi narzędziami są
systemy informacji geograficznej (GIS) i projektowanie wspomagane 
komputerowo (CAD). Pozwala na przeprowadzanie złożonych analiz 
przestrzennych.
LiDAR wykorzystuje impulsy laserowe do zbierania danych o odległości, 
podczas gdy fotogrametria wykorzystuje zdjęcia lotnicze do tworzenia 
modeli 3D. Dane te są przechowywane w bazie danych i w razie 
potrzeby wykorzystywane do analizy i wizualizacji.1)
Badania wykazały, że struktury 3D CNN mogą być wykorzystywane do 
uczenia się reprezentacji 3D i że można to zrobić bardziej efektywnie niż
tradycyjne metody oparte w pełni na 3D CNN.2)
Metody wizualizacji 3D oparte na GPU pozwalają na bardziej 
wyrafinowane i dokładne wyznaczanie granic przestrzennych.3)
Modelowanie 3D jest wykorzystywane jako podstawowe narzędzie w 
procesie projektowania architektonicznego i symulacji. Pozwala ono 
bezpieczeństwo konstrukcji i zwiększyć dokładność projektów.
Dane przestrzenne 3D są wykorzystywane w badaniach nad zmianami 
ekosystemów i zarządzaniem katastrofami. Na przykład modelowanie 
geologiczne 3D jest wykorzystywane do eksploracji wód gruntowych i 
badań geologicznych.4)
Dane 3D wykorzystywane do tworzenia immersyjnych środowisk w celu 
poprawy wrażeń użytkownika. Jest stosowane w różnych branżach, w 
tym w edukacji, opiece zdrowotnej i rozrywce.
Technologie przetwarzania danych przestrzennych 3D szybko rozwijają
się w różnych dziedzinach, w szczególności w pozyskiwaniu danych z 
chmury punktów i wykrywaniu obiektów w przestrzeni 3D za pomocą3- -
czujników LiDAR. Technologie te pojazdy autonomiczne, zastosowania 
medyczne, automatykę przemysłową, systemy nadzoru bezpieczeństwa i 
środowiska VR/AR. Niniejszy raport badawczy zapewnia podstawową
wiedzę na temat technologii przetwarzania danych przestrzennych 3D i 
wyjaśnia, w jaki sposób są one stosowane w różnych branżach.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i wizualizacja 
danych 3D. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020). 
Triplanar convolution with shared 2D kernels for 3D classification and 
shape retrieval, Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Nowa metoda poszukiwania 
regionalnego oparta na nowoczesnej grafice 3D. Minerały.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Nowe regionalne spostrzeżenia stratygraficzne z trójwymiarowego 
modelu geologicznego subbasenu Nasia w Ghanie, opracowanego do celów 
hydrogeologicznych i opartego na ponownie przetworzonych danych pola B 
pierwotnie zebranych w celu poszukiwania minerałów. Solid Earth, 11, 349-
361.4- -
2. Zbieranie danych Point CLoud za pomocą czujników LiDAR
Pozyskiwanie danych z chmury punktów za pomocą czujników LiDAR 
odgrywa ważną rolę w szerokim zakresie zastosowań i jest szczególnie 
odpowiednie do pozyskiwania danych 3D o wysokiej rozdzielczości. 
Technologia LiDAR emituje impulsy laserowe w celu odbierania 
sygnałów odbitych od obiektów i oblicza na ich podstawie informacje o 
odległości. Informacje te są przechowywane w formacie chmury 
punktów, gdzie każdy punkt zawiera współrzędne X, Y i Z oraz 
intensywność odbicia.
Chmury punktów LiDAR mogą być w różnych dziedzinach, w tym w 
istycznym, środowiska i zarządzaniu zasobami. Chmury punktów są
następnie przekształcane w 3D lub dane GIS poprzez przetwarzanie 
końcowe w celu odszumienia, wyrównania i rekonstrukcji powierzchni. 
W procesie tym wykorzystywane jest różnorodne oprogramowanie, w 
szczególności oparte na GPU metody wizualizacji 3D, które na bardziej 
wyrafinowaną demarkację przestrzenną.5)
Dane LiDAR odgrywają również ważną rolę w systemach percepcji 
pojazdów autonomicznych. Przetwarzanie chmur punktów LiDAR i 
szkolenia w dziedzinie autonomicznej jazdy przyczyniły się do 
dokładnego postrzegania środowiska drogowego i wykrywania 
obiektów.6) Dane te są niezbędne do tworzenia map 3D o wysokiej 
rozdzielczości w czasie rzeczywistym, które autonomicznym pojazdom 
bezpieczną nawigację w złożonych warunkach drogowych.
punktów LiDAR mogą być również w Na przykład dane zebrane przez 
LiDAR zamontowany na samolocie mogą być wykorzystane do 
rekonstrukcji modeli 3D formacji geologicznych, które przyczyniają się
do poszukiwania wód gruntowych lub badań geologicznych.7) To 
trójwymiarowe modelowanie geologiczne umożliwia nowe interpretacje 
geologiczne i pomaga lepiej zrozumieć charakterystykę geologiczną
danego obszaru.
Zalety technologii LiDAR obejmują szybkie pozyskiwanie danych i 
wysoką dokładność, ale ma ona ograniczenia stosunkowo wysoki koszt i 
wydajność w deszczową lub Trwają prace badawczo-rozwojowe mające 5- -
na celu przezwyciężenie tych ograniczeń technicznych, co na 
wykorzystanie LiDAR w szerszym zakresie branż.
Czujnik LiDAR (Light Detection and Ranging) to technologia 
wykorzystująca laser do pomiaru powierzchni obiektu, a dane mogą być
wykorzystane do uzyskania informacji przestrzennych 3D. Chmura 
punktów wygenerowana przez czujnik LiDAR to zbiór wielu punktów 
rozmieszczonych w przestrzeni 3D, z których każdy można opisać za 
pomocą wysokości, odległości i położenia.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i wizualizacja 
danych 3D. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Lidar Point Cloud Compression, Processing and Learning for Autonomous 
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). Nowe regionalne spostrzeżenia stratygraficzne z trójwymiarowego 
modelu geologicznego subbasenu Nasia w Ghanie, opracowanego do celów 
hydrogeologicznych i opartego na ponownie przetworzonych danych pola B 
pierwotnie zebranych w celu poszukiwania minerałów. Solid Earth, 11, 349-
361.6- -
belki. Dane te kluczowe znaczenie dla postrzegania otoczenia przez 
pojazdy autonomiczne, modelowania architekturze i inżynierii lądowej 
oraz mapowania 3D.
3. Technologia wykrywania obiektów 3D
Wykrywanie obiektów 3D jest ważną technologią rozpoznawania i 
lokalizowania obiektów w przestrzeni 3D i niezbędne w różnych 
dziedzinach, w tym w pojazdach autonomicznych, i rzeczywistości 
rozszerzonej. się ona głównie na danych 3D zebranych za pomocą
LiDAR, kamer RGB-D i systemów stereowizyjnych.
Wykorzystuje ona chmury punktów generowane przez LiDAR do 
rozpoznawania położenia i kształtu obiektów. Modele głębokiego 
uczenia, takie jak PointNet, są szeroko stosowane w tej dziedzinie, a 
metody te są niezbędne do generowania map 3D o wysokiej 
rozdzielczości w czasie rzeczywistym.8)
Jest to technika wykrywania obiektów poprzez łączenie obrazów 2D 
uzyskanych przez kamery RGB z informacjami 3D. Metoda ta poprawia 
skuteczność wykrywania poprzez dodanie informacji o kolorze i wzorze 
obiektu. W ostatnich badaniach zaproponowano metody takie jak 
FusionRCNN, która łączy obrazy LiDAR i kamery w celu poprawy 
dokładności wykrywania.9)
Struktury głębokiego , takie jak konwolucyjne sieci neuronowe (CNN) i 
rekurencyjne sieci neuronowe (RNN), są i rozpoznawania cech 3D. 
Modele te poprawiają dokładność klasyfikacji obiektów i szacowania 
lokalizacji na podstawie zbiorów danych, co szczególnie ważne w 
przypadku rozpoznawania przeszkód w pojazdach autonomicznych.10)
Jest on wykorzystywany do zwiększenia bezpieczeństwa jazdy poprzez 
wykrywanie przeszkód i pieszych na drodze. W tym obszarze są
aktywne badania nad połączeniem chmur punktów LiDAR z danymi 
wizyjnymi w celu bardziej precyzyjnego wykrywania.11)
Pomaga robotowi zrozumieć środowisko i wchodzić z nim w interakcje. 
Jest szczególnie ważne przy określaniu dokładnej lokalizacji obiektów, 
aby pomóc robotowi zaplanować ścieżkę i wykonać zadania.7- -
Rozpoznawanie obiektów i reagowanie na nie w czasie rzeczywistym w 
celu poprawy wrażeń użytkownika. Na przykład w rzeczywistości 
rozszerzonej lokalizacja i kształt obiektów muszą być dokładnie 
określone aby poprawić interakcję z obiektami wirtualnymi.
8) Qian, R., Lai, X., & Li, X. (2021). Wykrywanie obiektów 3D dla autonomicznej 
jazdy: A Survey. Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. i Li, J. (2023).
FusionRCNN: Fuzja LiDAR-kamera do dwuetapowego wykrywania obiektów 
3D. Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. i Zhang, Z. (2023). Super rzadkie 
wykrywanie obiektów 3D. IEEE Transactions on Pattern Analysis and 
Machine Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. i Li, J. (2023).
FusionRCNN: Fuzja LiDAR-kamera do dwuetapowego wykrywania obiektów 
3D. Remote Sensing, 15, 1839.8- -
Technologie te stale , zapewniając bardziej precyzyjne i wydajne 
rozwiązania do wykrywania obiektów 3D. Postępy w badaniach i 
technologii znacznie poprawiają dokładność rozpoznawania w 
rzeczywistych środowiskach.
Wykrywanie obiektów 3D to dokładna identyfikacja i klasyfikacja 
określonych obiektów w przestrzeni 3D, która jest wspierana przez 
różne techniki przetwarzania danych przestrzennych 3D. Ostatnio 
techniki oparte na głębokim uczeniu się aktywnie zastosowane do 
wykrywania obiektów 3D. Reprezentatywne technologie VoxelNet, 
PointNet i PointRCNN.
3.1 VoxeLNet
VoxelNet to innowacyjna architektura głębokiego uczenia 
zaprojektowana specjalnie do wykrywania obiektów 3D za pomocą
chmur punktów, co ma kluczowe znaczenie w systemach autonomicznej 
jazdy. Architektura ta przyjmuje unikalne podejście, konwertując 
surowe dane chmury punktów na ustrukturyzowaną siatkę wokseli 3D, 
aby umożliwić wydajne przetwarzanie i ekstrakcję cech. Konwersja do 
reprezentacji wokseli , ponieważ pozwala VoxelNet skutecznie 
wykorzystywać splot 3D do przechwytywania informacji przestrzennych 
przy jednoczesnym zapewnieniu wydajności obliczeniowej. Wydajność
ta jest niezbędna dla aplikacji działających w czasie rzeczywistym, 
takich jak te wymagane do autonomicznej jazdy.
Siła VoxelNet polega na jego zdolności do włączenia nowej warstwy 
kodowania funkcji, która znacznie zwiększa moc reprezentacyjną
każdego woksela. Osiąga się to poprzez uwzględnienie unikalnych cech 
punktów zawartych w każdym wokselu, co poprawia zdolność sieci do 
wykrywania i klasyfikowania obiektów w złożonych środowiskach.12) 
Ten etap kodowania cech ma znaczenie dla rozwiązywania problemów 
spowodowanych nieregularnym i rzadkim charakterem danych chmury 
punktów, z którymi trudno jest sobie poradzić przy użyciu tradycyjnych 
konwolucyjnych sieci neuronowych 2D.
Badania , że VoxelNet wniósł znaczący wkład w dziedzinę wykrywania 
obiektów 3D. Na przykładzdolność jego architektury do zapewnienia 9- -
wysokiej dokładności przy jednoczesnym zachowaniu wydajności 
obliczeniowej sprawia, że jest on preferowanym wyborem dla aplikacji 
międzywdrożeniowych w pojazdach autonomicznych.13) Co więcej, 
integracja rzadkiej reprezentacji VoxelNet pozwala mu skutecznie 
obsługiwać duże ilości danych, które są powszechne w scenariuszach 
autonomicznej jazdy.
Rozwój VoxelNet stanowi znaczący postęp w przetwarzaniu danych 3D i 
kładzie podwaliny pod przyszłe innowacje w technologii autonomicznej 
jazdy. Rozwiązuje kluczowe wyzwania w tym obszarze, łącząc wydajną
wokselizację z zaawansowanymi technikami kodowania cech.14) Nie 
tylko poprawia to dokładność wykrywania, ale także umożliwia bardziej 
wyrafinowane egzekwowanie przepisów.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep 
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Przeciwstawne 
perturbacje chmury punktów przeciwko wykrywaniu obiektów 3D w 
autonomicznych systemach jazdy. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: wykrywanie obiektów 3D z 
chmury monokularowej, stereo i punktowej do autonomicznej jazdy. 
Neurocomputing, 494, 23-32.10- -
VoxelNet przesuwa granice rozwoju systemów percepcji 3D. potężnej 
wydajności i innowacyjnemu podejściu, VoxelNet nadal wpływa bieżące 
badania i rozwój w zakresie przetwarzania chmur punktów 3D i 
systemów autonomicznych.15)
VoxelNet to innowacyjny model wykrywania obiektów 3D, który 
przetwarza dane chmury punktów, przekształcając je w siatki 3D 
(woksele). Każdy woksel reprezentuje punkt w chmurze punktów, co 
pozwala modelowi bardziej efektywne przetwarzanie informacji 
przestrzennych. VoxelNet wykorzystuje informacje o wokselach 
wykrywania obiektów i tworzenia prognoz. tego podejścia jest to, że jest 
ono wydajne i szybkie w przetwarzaniu dużych ilości danych z chmury 
punktów.
3.2 PointNet
PointNet to przełomowa architektura głębokiego uczenia, która 
rewolucjonizuje przetwarzanie danych chmury punktów 3D poprzez 
bezpośrednie wykorzystanie nieuporządkowanych zestawów punktów. 
W przeciwieństwie do tradycyjnych metod, które wymagają
ustrukturyzowanych danych wejściowych, PointNet wykorzystuje 
funkcje symetrii, aby zapewnić niezmienność permutacji, relacje 
przestrzenne między punktami, dzięki czemu pozostaje niezależnie od 
punktów wejściowych.
Kluczową innowacją PointNet jest wykorzystanie perceptronów (MLPi 
max-pooling. Architektura ta skutecznie agreguje cechy z 
poszczególnych punktów w globalną reprezentację, co jest szczególnie 
przydatne w zadaniach takich jak klasyfikacja i segmentacja. Dzięki 
swojej zdolności do i dokładnego dużych punktów, stał się
podstawowym modelem w tej dziedzinie i zainspirował wiele kolejnych 
architektur opartych na jego zasadach.
Wpływ PointNet wykracza poza badania akademickie i obejmuje 
praktyczne wdrożenia w obszarach takich jak autonomiczna jazda i 
rozpoznawanie robotów. Na przykład, w systemach autonomicznych, 
PointNet został wykorzystany do przetwarzania danych LiDAR w celu 
poprawy wykrywania obiektów i nawigacji poprzez identyfikację i 11- -
klasyfikację obiektów z jednej próby do następnej.16) Konstrukcja 
PointNet pozwala mu skutecznie radzić sobie ze złożonością związaną z 
danymi 3D, takimi jak okluzje i różnice w gęstości punktów, co czyni go 
wszechstronnym narzędziem w zastosowaniach wizji komputerowej.
Postępy poczynione przez PointNet doprowadziły do jego adaptacji w 
różnych innowacyjnych kontekstach. Na przykład, został on 
zastosowany do klasyfikacji danych LiDAR z powietrza, poprawiając 
dokładność i wydajność operacji teledetekcji.17) Zdolność adaptacyjna 
PointNet doprowadziła również do jego integracji z sieciami 
neuronowymi opartymi na fizyce w celu analizy propagacji pęknięć.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). 
Wieloprzeglądowa semantyczna sieć ucząca się do wykrywania obiektów 3D 
w oparciu o chmurę punktów. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep 
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR point cloud 
classification using PointNet++ network with full neighbourhood features. 
PLOS ONE, 18.12- -
i symulacje dynamiki płynów, i udowodniono, że rozwiązuje złożone 
problemy przemysłowe.18)
Pointnet nadal służy jako punkt odniesienia w przetwarzaniu danych 3D, 
znacznie zwiększając zdolność modeli głębokiego uczenia się do 
przetwarzania danych chmury punktów. Jego wpływ jest widoczny 
zarówno w postępach teoretycznych, jak i praktycznych zastosowaniach, 
demonstrując jego ciągłe znaczenie i zdolność adaptacji w ewoluującym 
krajobrazie sztucznej inteligencji i uczenia maszynowego.19)
PointNet to model, który bezpośrednio przetwarzać dane chmury 
punktów i rozpoznawać obiekty w przestrzeni 3D niezależnie od 
kolejności każdego punktu. PointNet wyodrębnia cechy punktów i 
przeprowadza na ich podstawie klasyfikację i segmentację. Model ten 
radzi sobie z nieustrukturyzowaną naturą chmur punktów i może być
stosowany w różnych dziedzinach, takich jak autonomiczna jazda, 
robotyka i analiza obrazów medycznych.
3.3 PointRCNN
PointRCNN jest ważnym frameworkiem w dziedzinie wykrywania 
obiektów 3D, szczególnie w zastosowaniach takich jak autonomiczna 
jazda. Struktura ta wykorzystuje dwuetapowy proces wykrywania w celu 
poprawy dokładności i wydajności wykrywania obiektów w danych 
chmury punktów 3D. Pierwszym krokiem jest generowanie sugestii 
obiektów za pośrednictwem lokalnej sieci sugestii opartej na punktach. 
Krok ten , ponieważ działa bezpośrednio na surowych danych chmury 
punktów, zachowując szczegółowe informacje przestrzenne, które mogą
zostać utracone w tradycyjnych metodach opartych na projekcji obrazu 
lub wokselizacji.
W drugim kroku PointRCNN udoskonala początkową propozycję, 
wykonując ramki ograniczającej 3D. Dostosowuje to rozmiar i 
orientację , aby lepiej dopasować wykryte obiekty do danych chmury 
punktów. Wykorzystując cechy wyodrębnione bezpośrednio z surowej 
chmury punktów, PointRCNN osiąga wyższą dokładność wykrywania 
szczególnie w trudnych środowiskach o złożonej geometrii i okluzji.13- -
Jedną z głównych zalet PointRCNN jest jego do uczenia się od początku 
do końca. Architektura ta ułatwia płynną integrację etapów sieci, 
poprawiając nie tylko wydajność wykrywania modelu, ale także jego 
wydajność obliczeniową, dzięki czemu nadaje się zastosowań w czasie 
rzeczywistym, takich jak te wymagane w systemach autonomicznej 
jazdy.
Badania wykazały, że metody wykorzystujące dane z chmury punktów 
mogą znacznie poprawić zrozumienie i interpretację scen 3D w 
sytuacjach autonomicznej jazdy. Na przykład wykorzystanie algorytmów 
wykrywania wielu celów opartych na PointRCNN i technikach fuzji 
chmur punktów wokseli może być stosowane w dynamicznych 
scenariuszach ze względu na ich wszechstronność i
18) Kashefi, A., & Mukerji, T. (2022). PointNet oparty na fizyce: solver 
głębokiego uczenia dla nieściśliwych przepływów w stanie ustalonym i pól 
termicznych na wielu zestawach nieregularnych geometrii. Journal of 
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-Based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Ponadto badania w dziedzinie chmur punktów 3D i głębokiego uczenia 
się rosnące znaczenie tych ram dla zrozumienia sceny w autonomicznej 
jeździe.20)
Ogólnie rzecz biorąc, PointRCNN stanowi znaczący postęp w technologii 
wykrywania obiektów 3D. Jego zdolność do bezpośredniego 
przetwarzania surowych danych punktów i wydajny dwuetapowy proces 
wykrywania potężne narzędzie dla autonomicznej jazdy, gdzie szybkie i 
dokładne obiektów ma kluczowe znaczenie dla bezpieczeństwa i 
wydajności.
PointRCNN to technologia, która wykorzystuje CNN (Convolutional 
Neural Network) opartą na PointNet do wykrywania obiektów 3D i 
skutecznie przetwarza dane chmury punktów dokładnego wykrywania 
obiektów. PointRCNN to technologia, która rozszerza istniejącą metodę
wykrywania obiektów 2D na środowiska 3D i jest stosowana do 
rozpoznawania obiektów pojazdów autonomicznych i rozpoznawania 
środowiska robotów.
4. Zastosowania
Sieci PointRCNN odgrywają kluczową rolę w systemach autonomicznej 
jazdy i są wykorzystywane do dokładnego rozpoznawania i śledzenia 
obiektów w otaczającym środowisku. obiektów przy użyciu punktów 3D 
może pomóc pojazdom przeszkód drogowych z dużą dokładnością, 
nawet w złożonych sytuacjach drogowych.22)
Robot wykorzystuje technologię wykrywania obiektów 3D do interakcji 
z otoczeniem. PointRCNN umożliwia robotowi zrozumienie jego 
środowiska od uruchomienia do uruchomienia i wykonanie 
niezbędnych działań.24)
Aby płynnie wstawiać wirtualne obiekty do świata rzeczywistego w 
środowisku AR, jest dokładne wykrywanie obiektów w przestrzeni 3D. 
PointRCNN ważną rolę w tym zadaniu.
Drony potrzebują zdolności do rozpoznawania i unikania różnych 
przeszkód podczas lotu. PointRCNN może być wykorzystywany do 
wykrywania obiektów w czasie rzeczywistym na podstawie danych z 15- -
czujników drona i ustawiania bezpiecznej ścieżki lotu.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
21) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-Based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). Wykrywanie obiektów 3D dla 
autonomicznej jazdy: A Survey. Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). Wykrywanie obiektów 3D dla 
autonomicznej jazdy: A Comprehensive Survey. International Journal of 
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep 
Learning-Based Approaches for Scene Understanding in Autonomous 
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019).16- -
PointRCNN jest stosowany do modelowania 3D i analizy środowisk 
miejskich, zapewniając ważny wgląd w planowanie i zarządzanie 
miastem. pomóc poprawić wydajność transportu i zwiększyć
bezpieczeństwo w miastach.
W tych zastosowaniach PointRCNN są bardzo przydatne w sytuacjach, w 
których wymagana jest wysoka dokładność i przetwarzanie w czasie 
rzeczywistym. Badania pokazują, że techniki takie jak algorytmy 
wykrywania wielu celów oparte na PointRCNN swoją wydajność i 
skuteczność w tych zastosowaniach.26) PointRCNN przyczynia się do 
maksymalizacji dokładności i wydajności wykrywania obiektów 3D, co 
ważne dla rozwoju autonomicznych pojazdów i innych 
zaawansowanych systemów.
Technologia przetwarzania danych przestrzennych 3D wykorzystywana 
w wielu różnych branżach. Niektóre z głównych zastosowań obejmują
4.1 Pojazdy autonomiczne
Pojazdy to pojazdy wykorzystujące zaawansowaną technologię do 
samodzielnego prowadzenia bez interwencji człowieka. Pojazdy te 
wykorzystują różnorodne czujniki, kamery, radary, LiDAR i inne, aby 
uzyskać precyzyjną świadomość otoczenia. Technologie te, w połączeniu 
z przetwarzaniem danych w czasie rzeczywistym, są niezbędne do 
określania bezpiecznych tras jazdy.
W szczególności technologia wykrywania obiektów 3D jest kluczowym 
elementem pojazdów autonomicznych, odgrywając ważną rolę w 
dokładnym wykrywaniu i rozpoznawaniu obiektów wokół pojazdu. 
PointRCNN, na przykład, wykorzystuje dane chmury punktów, aby 
umożliwić analizę otoczenia pojazdu w wysokiej rozdzielczości. to 
pojazdom autonomicznym rozpoznawanie pieszych, innych pojazdów, 
znaków drogowych i innych obiektów w czasie rzeczywistym w celu 
zapewnienia bezpiecznej jazdy.27)
Pojazdy autonomiczne również zdolność uczenia się wzorców jazdy i 
dostosowywania się do różnych sytuacji na drodze poprzez zastosowanie 
technologii uczenia maszynowego i sztucznej inteligencji. Technologie 17- -
te przyczyniają do poprawy bezpieczeństwa pojazdów, wydajności i 
komfortu użytkowania. W szczególności technologia fuzji wielu 
czujników poprawia dokładność wykrywania obiektów 3D, niezawodne 
działanie w różnych środowiskach.28)
Przegląd metod wykrywania obiektów 3D w zastosowaniach autonomicznej 
jazdy. IEEE Transactions on Intelligent Transportation Systems, 20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Technologia fuzji wielu czujników 
do wykrywania obiektów 3D w jeździe autonomicznej: A Review. IEEE 
Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Pojazdy autonomiczne kluczowym obszarem innowacji w przyszłych 
systemach transportowych dzięki konwergencji złożonych algorytmów i 
technologii czujników. Technologie te pozytywny wpływ na 
społeczeństwo jako całość, zmniejszając zatory komunikacyjne, 
ograniczając liczbę wypadków drogowych i umożliwiając bardziej 
efektywny przepływ ruchu.29)
Pojazdy autonomiczne wykorzystują czujniki LiDAR i technologię
wykrywania obiektów 3D do postrzegania i analizowania otoczenia 
pojazdu czasie rzeczywistym. Umożliwia to omijanie przeszkód, 
rozpoznawanie pieszych, analizę skrzyżowań i , aby zmaksymalizować
bezpieczeństwo pojazdu i wydajność jazdy.
4.2 Opieka zdrowotna
Techniki wykrywania obiektów 3D w medycynie, zwłaszcza takie jak 
PointRCNN, szeroki zakres potencjalnych zastosowań. Technologie te 
są wykorzystywane głównie w obrazowaniu medycznym, robotyce 
chirurgicznej, systemach monitorowania pacjentów itp.
Technologia wykrywania obiektów 3D pomaga dokładnym wykrywaniu 
zmian w obrazach TK, MRI i USG. Jest to szczególnie ważne w 
dziedzinach takich jak radiologia, gdzie można ją połączyć z 
komputerowymi systemami diagnostycznymi wykorzystującymi 
sztuczną inteligencję i uczenie maszynowe w celu poprawy dokładności 
diagnostycznej.30)
W systemach robotów chirurgicznych technologia wykrywania 
obiektów 3D umożliwia dokładne rozpoznawanie otaczających tkanek i 
narządów podczas operacji, pomagając zapewnić bezpieczną i 
precyzyjną operację. W połączeniu z postępami w dziedzinie sztucznej 
inteligencji medycznej może to znacznie poprawić wydajność i 
bezpieczeństwo operacji.31)
Czujniki 3D i technologia wykrywania obiektów mogą analizować ruchy 
i parametry życiowe pacjenta w czasie rzeczywistym, aby wykrywać
nieprawidłowości na wczesnym etapie. Technologie te łączyć z opartymi 
na sztucznej inteligencji systemami monitorowania pacjentów w celu 19- -
ciągłego śledzenia stanu pacjenta i zarządzania nim.32)
W połączeniu z rzeczywistością wirtualną (VR) może być wykorzystywana 
w edukacji i szkoleniach medycznych. Technologia wykrywania obiektów 
3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). Przegląd metod wykrywania obiektów 3D dla aplikacji 
autonomicznej jazdy. IEEE Transactions on Intelligent Transportation 
Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). Raport grupy zadaniowej AAPM 273: 
Zalecenia dotyczące najlepszych praktyk w zakresie sztucznej inteligencji i 
uczenia maszynowego w diagnostyce wspomaganej komputerowo w 
obrazowaniu medycznym. Fizyka medyczna.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna 
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). Wpływ systemów wspomagania decyzji 
opartych na sztucznej inteligencji na przepływ pracy pielęgniarskiej na 
oddziałach intensywnej opieki medycznej. Międzynarodowy przegląd 
pielęgniarski, Brak.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023). 
Sztuczna inteligencja w systemach wspomagania decyzji klinicznych w 
onkologii. International Journal of Medical Sciences, 20, 79-86.20- -
 ważną rolę w pomaganiu lekarzom i pracownikom służby zdrowia w 
symulowaniu operacji i diagnoz, umożliwiając naukę w realistycznym 
środowisku.33)
Aplikacje te przyczyniają się do zwiększenia dokładności diagnostyki i 
leczenia w dziedzinie medycyny oraz poprawy ogólnego bezpieczeństwa. 
W szczególności technologia wykrywania obiektów 3D w połączeniu ze 
sztuczną inteligencją przyspiesza innowacje w opiece zdrowotnej i staje 
ważnym narzędziem poprawy zdrowia i bezpieczeństwa pacjentów. 
Badania te dostarczają nowych perspektyw na komercyjne, regulacyjne i 
społeczne implikacje sztucznej inteligencji w medycynie.34)
W medycynie przetwarzanie danych przestrzennych 3D 
wykorzystywane do precyzyjnej diagnostyki i planowania 
chirurgicznego. Dane chmury punktów z obrazowania medycznego 3D, 
takie jak wyniki tomografii komputerowej lub rezonansu 
magnetycznego, są wykorzystywane do wizualizacji miejsca operacji 
oraz pomiaru jego dokładnej lokalizacji i rozmiaru w celu poprawy 
dokładności chirurgicznej.
4.3 Automatyka przemysłowa i robotyka
Technologie wykrywania obiektów 3D, w szczególności modele takie jak 
PointRCNN, rewolucjonizują dziedzinę automatyki przemysłowej i 
robotyki. Technologie te znacznie poprawiają wydajność i dokładność w 
wielu różnych branżach i odgrywają ważną rolę w następujących 
konkretnych obszarach
Technologia wykrywania obiektów 3D jest niezbędna dla systemów 
zrobotyzowanych do rozpoznawania i sortowania obiektów w 
magazynie. Umożliwia ona robotom dokładne rozpoznawanie obiektów 
o różnych rozmiarach i kształtach, pozwalając im na wykonywanie 
wydajnych zadań związanych z przemieszczaniem i sortowaniem. 
Technologie te zwiększają wydajność procesów przemysłowych i 
ułatwiają automatyzację systemów logistycznych.35)
Gdy roboty przemysłowe automatycznie montują części, wykrywanie 
obiektów 3D zwiększa wydajność montażu poprzez rozpoznawanie 
dokładnej pozycji i orientacji części. Przyczynia się to znacząco do 21- -
zwiększenia tempa produkcji i zmniejszenia liczby defektów, a ważną
rolę w inteligentnych środowiskach produkcyjnych.36)
Są one wykorzystywane do kontroli geometrii i wymiarów produktów 
przy użyciu technologii skanowania 3D i ważną rolę w zapewnianiu 
jakości produktów, wczesnym wykrywaniu wad i obniżaniu kosztów. Te 
zautomatyzowane części
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). Oparte 
na sztucznej inteligencji przewidywanie ryzyka raka płuc przy użyciu 
nieobrazowej elektronicznej dokumentacji medycznej: podejście głębokiego 
uczenia się. Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna 
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and Genetic 
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., & 
White, M. (2021). Sim2Real w robotyce i automatyce: zastosowania i 
wyzwania. IEEE Transactions on Automation Science and Engineering, 18, 
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. i Kim, H. (2021).
Oparta na uczeniu się automatyzacja zrobotyzowanego montażu dla 
inteligentnej produkcji. Proceedings of the IEEE, 109, 423-440.22- -
Systemy kontroli jakości zwiększają niezawodność produktów.37)
Aby zwiększyć bezpieczeństwo robotów i systemów automatyki, 
wykorzystywana jest technologia wykrywania obiektów 3D. Umożliwia 
to rozpoznawanie pobliskich lub bezpieczne Te mechanizmy 
bezpieczeństwa przyczyniają się do zmniejszenia liczby wypadków w 
warunkach przemysłowych.38)
Dla autonomicznych pojazdów lub dronów kluczowe znaczenie ma 
wykrywanie obiektów i planowanie tras. Technologia wykrywania 
obiektów 3D tym systemom wydajne działanie, omijanie przeszkód i 
bezpieczne wykonywanie zadań związanych z dostawą.39)
W tych obszarach technologie wykrywania obiektów 3D innowacje w 
automatyce przemysłowej, pomagając zwiększyć produktywność, 
obniżyć koszty i poprawić bezpieczeństwo. W przyszłości technologie te 
będą nadal integralną częścią ewolucji robotyki i systemów automatyki. 
Badania wykazały, że zastosowanie tych technologii w znacznym stopniu 
przyczynia do zwiększenia wydajności procesów przemysłowych i 
zarządzania złożonością zautomatyzowanych systemów.40)
W automatyce przemysłowej i robotyce przetwarzanie danych 
przestrzennych 3D jest wykorzystywane do zwiększania wydajności 
procesów produkcyjnych i automatyzacji kontroli jakości. Roboty 
wykorzystują czujniki LiDAR lub kamery 3D rozpoznawania produktów, 
wykrywania anomalii i rozwiązywania problemów jakościowych.
4.4 Systemy nadzoru bezpieczeństwa
W systemach nadzoru bezpieczeństwa technologia wykrywania 
obiektów 3D ważną rolę w zapewnianiu skutecznych rozwiązań w 
zakresie monitorowania i bezpieczeństwa w różnych środowiskach. 
Technologia ta szczególnie widoczna w takich obszarach, jak 
monitorowanie w czasie rzeczywistym, wykrywanie włamań, 
zapobieganie incydentom, analiza danych i raportowanie oraz 
integracja sztucznej inteligencji.
Dzięki możliwości monitorowania w czasie rzeczywistym, systemy 
wykrywania obiektów 3D wykorzystują kamery i czujniki do analizy 23- -
otaczającego środowiska w czasie rzeczywistym. Ta analiza w czasie 
rzeczywistym umożliwia dokładne rozpoznawanie ludzi, pojazdów i 
obiektów oraz zapewnia natychmiastowe ostrzeżenia w przypadku 
niebezpiecznej sytuacji. Ma to zasadnicze znaczenie dla zwiększenia 
bezpieczeństwa, zwłaszcza w złożonych środowiskach, takich jak drogi i 
lotniska.
Jeśli chodzi o wykrywanie włamań, technologia wykrywania obiektów 
3D jest skuteczna w wykrywaniu nietypowego ruchu lub zachowania w 
określonym obszarze bezpieczeństwa. Może to prowadzić do wczesnego 
wykrycia zbliżania się intruza i zapewnić personelowi ochrony 
natychmiastową pomoc.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Automatyzacja 
przemysłowa i jakość produktu: rola zrobotyzowanej transformacji 
produkcji. Ekonomia stosowana.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). 
Projektowanie dynamicznych i współpracujących systemów automatyki i 
robotyki. IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotyka: od automatyzacji do inteligentnych systemów. 
Inżynieria.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Widzenie przemysłowe i automatyzacja. Measurement Science and 
Technology, 33.24- -
Zapobieganie nieautoryzowanemu wejściu do zabezpieczonych obszarów 
poprzez dostarczanie czerwonych alertów.
Jeśli chodzi o zapobieganie wypadkom, systemy te zapobiegają
wypadkom w różnych środowiskach, w tym w zakładach przemysłowych, 
poprzez wczesne wykrywanie zagrożeń i dostarczanie ostrzeżeń. Na 
przykład automatyczny system ostrzegawczy uruchomiony, gdy 
pracownik zbliża się do niebezpiecznego obszaru, aby zapobiec 
wypadkowi.
Funkcje analizy danych i raportowania pomagają ocenić sytuację w 
zakresie bezpieczeństwa i zidentyfikować problemy poprzez późniejszą
analizę przy użyciu zebranych danych 3D. Analizy te zapewniają ważny 
wgląd w przyszłą strategię bezpieczeństwa i ciągłe doskonalenie 
bezpieczeństwa.
Dzięki integracji sztucznej inteligencji, technologia wykrywania 
obiektów 3D może być połączona z algorytmami uczenia maszynowego 
w celu stworzenia bardziej inteligentnego systemu nadzoru. to 
systemowi uczenie się wzorców i wdrażanie bardziej zaawansowanych 
mechanizmów ostrzegania i reagowania.
W ten sposób technologia wykrywania obiektów 3D staje się integralną
częścią systemów nadzoru bezpieczeństwa, spełniając różne potrzeby w 
zakresie bezpieczeństwa i przyczyniając się do bezpieczeństwa obiektów. 
Oczekuje się, że technologie te będą dalej ewoluować w przyszłości, 
prowadząc do bardziej wyrafinowanych i wydajnych rozwiązań w 
zakresie nadzoru bezpieczeństwa. Te postępy technologiczne 
przekształcą się w bardziej niezawodne systemy bezpieczeństwa, 
zwłaszcza dzięki integracji ze sztuczną inteligencją.41)
Technologia wykrywania obiektów 3D również ważną rolę w systemach 
nadzoru bezpieczeństwa. Czujniki LiDAR i technologia wykrywania 
obiektów 3D wykorzystywane do wykrywania intruzów lub określania, 
czy w pobliżu znajdują się ludzie. również analizować wzorce zachowań 
w przestrzeni 3D w celu śledzenia i zapobiegania nielegalnej działalności.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Metoda 
wykrywania małych celów w podczerwieni oparta na mechanizmie 
ważonego porównania wzrokowego człowieka do monitorowania 
bezpieczeństwa. Remote. Sens., 15, 2922.26- -
4.5 VR/AR
W wirtualnej (VR) i rozszerzonej (AR) technologia wykrywania obiektów 
3D znacząco poprawia wrażenia użytkownika w różnych branżach. 
Wykrywanie obiektów 3D umożliwia użytkownikom interakcję z 
rzeczywistymi obiektami w środowiskach wirtualnych, co jest 
niezbędne dla aplikacji AR do rozpoznawania otoczenia w czasie 
rzeczywistym w celu dokładnego umieszczania i manipulowania 
wirtualnymi elementami. Sprawia to, że doświadczenie użytkownika jest 
bardziej wciągające.
W środowiskach VR wykrywanie obiektów 3D wykorzystywane do 
tworzenia realistycznych symulacji. Zapewnia to scenariusze 
szkoleniowe w różnych dziedzinach, w tym w medycynie, i lotnictwie, 
umożliwiając uczestnikom bezpieczne doświadczanie i ćwiczenie 
rzeczywistych sytuacji. Zastosowanie VR/AR, zwłaszcza w dziedzinie 
bezpieczeństwa budowlanego, zwiększa świadomość bezpieczeństwa 
pracowników.42)
W branży gier wykrywanie obiektów 3D zapewnia wrażenia dzięki 
dokładnemu śledzeniu ruchu i pozycji gracza. Umożliwia to interakcję z 
wirtualnymi postaciami, zwiększając realizm gry.
W architekturze i inżynierii technologia AR może być wykorzystywana 
do wizualizacji modeli projektowych w świecie rzeczywistym. pomóc w 
wykrywaniu błędów w procesie projektowania z wyprzedzeniem i 
ułatwić komunikację z klientami. Aplikacje te mogą być szczególnie 
synergiczne z bezpieczeństwem konstrukcji.43)
Technologia AR pomaga konsumentom podejmować decyzje zakupowe, 
umożliwiając im wirtualne doświadczanie produktów. Na przykład daje 
im możliwość umieszczenia mebli w domu lub wypróbowania kolorów 
kosmetyków z wyprzedzeniem. Zwiększa to doświadczenie zakupowe i 
interakcję konsumenta.44)
W ten sposób technologia wykrywania obiektów 3D zapewnia 
innowacyjne doświadczenia w VR i AR i jest wykorzystywana w różnych 
branżach. W przyszłości technologie te będą nadal ewoluować, dzięki 
czemu interakcja między użytkownikiem a środowiskiem wirtualnym 27- -
będzie jeszcze bardziej płynna i naturalna. Spowoduje to dalsze 
rozszerzenie zastosowania technologii VR/AR w edukacji, rozrywce, 
handlu i nie tylko. Jednocześnie postępy w tych stworzą nowe 
możliwości w branży turystycznej i hotelarskiej.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny 
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w 
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny 
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w 
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
"Efekty perswazji reklam wideo w rzeczywistości wirtualnej (VR) i 
rzeczywistości rozszerzonej (AR): przegląd koncepcyjny". Journal of 
Business Research.
45) Wei, W. (2019). Postęp badań nad rzeczywistością wirtualną (VR) i 
rzeczywistością rozszerzoną (AR) w turystyce i hotelarstwie. Journal of 
Hospitality and Tourism Technology, 10, 539-570.28- -
W rzeczywistości wirtualnej (VR) i rozszerzonej (AR) dane przestrzenne 
3D odgrywają ważną rolę interakcji z obiektami w świecie rzeczywistym. 
Dane przestrzenne 3D prawidłowe umieszczenie wirtualnych obiektów 
w świecie rzeczywistym i pozwalają użytkownikom na interakcję z nimi 
w naturalny sposób.
5. Wnioski
Technologia przetwarzania danych przestrzennych 3D wiele dziedzin, w 
tym autonomiczną jazdę, opiekę zdrowotną, przemysł, bezpieczeństwo i 
VR/AR. W szczególności czujniki LiDAR i technologie wykrywania 
obiektów 3D ważną rolę w każdej z tych dziedzin, przyczyniając się do 
analizy środowiska w czasie rzeczywistym, dokładnej diagnostyki i 
leczenia oraz wydajnych systemów automatyzacji. Technologie te nadal 
ewoluować i zapewniać bogatsze doświadczenia użytkowników w 
różnych dziedzinach.29- -
Referencje
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Lidar Point Cloud Compression, Processing and Learning for 
Autonomous Driving. IEEE Transactions on Intelligent Transportation 
Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). Przegląd metod wykrywania obiektów 3D dla 
aplikacji autonomicznej jazdy. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i 
wizualizacja danych 3D. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Sztuczna inteligencja w medycynie. New England 
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Usprawnianie procesów 
przemysłowych poprzez automatyzację i robotyzację. Maszyny.
6. Cao, M., & Wang, J. (2020). Wykrywanie przeszkód w pojazdach 
autonomicznych za pomocą fuzji czujników Multi-LiDAR. Journal of 
Dynamic Systems Measurement and Control - Transactions of the ASME, 
142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: wykrywanie obiektów 3D 
z chmury monokularowej, stereo i punktowej do autonomicznej jazdy. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). 
Metoda wykrywania małych celów w podczerwieni oparta na 
mechanizmie ważonego porównania wzrokowego człowieka do 
monitorowania bezpieczeństwa. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Nowe regionalne spostrzeżenia stratygraficzne z 
trójwymiarowego modelu geologicznego subbasenu Nasia w Ghanie, 
opracowanego do celów hydrogeologicznych i opartego na ponownie 
przetworzonych danych pola B pierwotnie zebranych w celu 
poszukiwania minerałów. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and 
Industrial Systematic Mapping Study, IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. i Zhang, Z. (2023). Super 30- -
rzadkie wykrywanie obiektów 3D. IEEE Transactions on Pattern 
Analysis and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Metody wykrywania i klasyfikacji obiektów 3D oparte na 
chmurze punktów dla aplikacji autonomicznej jazdy: przegląd i 
taksonomia. Fuzja informacji, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. i Bennamoun (2019). 
Głęboki31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43, 
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, 
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T, Greenspan, H., 
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. 
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). Raport grupy zadaniowej AAPM 273: Zalecenia 
dotyczące najlepszych praktyk w zakresie sztucznej inteligencji i 
uczenia maszynowego w diagnostyce wspomaganej komputerowo w 
obrazowaniu medycznym. Fizyka medyczna.
15. Huang, S. (2019). Rzeczywistość rozszerzona i rzeczywistość
wirtualna: siła AR i VR dla . Information Technology and Tourism, 21, 
457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. i Kim, H. (2021).
Oparta na uczeniu się automatyzacja zrobotyzowanego montażu dla 
inteligentnej produkcji. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). "Efekty perswazji reklam wideo w rzeczywistości wirtualnej (VR) 
i rzeczywistości rozszerzonej (AR): przegląd koncepcyjny". Journal of 
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. i Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and 
shape retrieval, Computer Vision and Image Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Wciągające technologie 
interaktywne i wirtualne doświadczenia zakupowe: Różnice w 
postrzeganiu przez konsumentów rzeczywistości rozszerzonej (AR) i 
wirtualnej (VR). Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hiper-automatyzacja w przemyśle wytwórczym. J. 
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny 
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w 
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion 
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). Wykrywanie obiektów 3D 
dla autonomicznej jazdy: A Comprehensive Survey. International 32- -
Journal of Computer Vision, 131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Widzenie przemysłowe i automatyzacja. Measurement Science and 
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna 
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and 
Genetic Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). Robotyka: od automatyzacji do inteligentnych 
systemów. Inżynieria.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. 
(2022). Dynamiczny graf33- -
transformator do wykrywania obiektów 3D. Knowledge-Based Systems, 
259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: oparte na 
głębokim uczeniu wykrywanie obiektów 3D przy użyciu semantycznej 
chmury punktów. Visual Computer, , 1-15.
29. Wei, W. (2019). Postęp badań nad rzeczywistością wirtualną (VR) i 
rzeczywistością rozszerzoną (AR) w turystyce i hotelarstwie. Journal of 
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Nowa metoda 
poszukiwania regionalnego oparta na nowoczesnej grafice 3D. Minerały.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). 
Oparte na sztucznej inteligencji przewidywanie ryzyka raka płuc przy 
użyciu nieobrazowej elektronicznej medycznej: podejście głębokiego 
uczenia się. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Wspomagane komputerowo wykrywanie i 
diagnostyka/radiomatyka/uczenie maszynowe/głębokie uczenie się w 
obrazowaniu medycznym. Fizyka medyczna.

Relatório de pesquisa: Tecnologia de processamento de dados 
espaciais 3D e suas aplicações Instituto de Pesquisa de IA do 
Condado de  2025_01Youngho Hong
Resumos:
Esta pesquisa abrange o desenvolvimento e a aplicação de tecnologias 
de processamento de dados espaciais 3D, especialmente a aquisição de 
dados de nuvem de pontos e tecnologias de detecção de objetos 3D 
usando sensores LiDAR. Ela se concentra nas tecnologias de detecção de 
objetos 3D VoxelNet, PointNet e PointRCNN e explica como essas 
tecnologias estão sendo usadas em vários campos, como veículos 
autônomos, saúde, automação industrial, sistemas de vigilância de 
segurança e VR/AR. Os dados da nuvem de pontos coletados pelos 
sensores LiDAR analisam o espaço 3D com alta precisão, e a tecnologia 
de detecção de objetos 3D baseada neles um papel importante na 
conscientização ambiental em tempo real, no diagnóstico de precisão, 
na otimização do processo de fabricação etc. Este estudo analisa o 
impacto da tecnologia de processamento de dados espaciais em 3D no 
setor moderno e na inovação tecnológica, e discute o potencial de 
desenvolvimento futuro.
Palavras-chave:
 Dados espaciais 3D, sensores LiDAR, nuvem de pontos, 
detecção de objetos 3D, VoxelNet, PointNet, PointRCNN, veículos 
autônomos, saúde, automação industrial, sistemas de vigilância de 
segurança, VR/AR, aprendizagem profunda2- -
1. Introdução
Envolve o processo de coleta, armazenamento, análise e visualização de 
dados e usa tecnologias como LiDAR, fotogrametria e digitalização em 
3D para processar informações espaciais tridimensionais. Essas 
tecnologias são usadas em uma variedade de plataformas de software, 
os sistemas de informações geográficas (GIS) e o design auxiliado por 
computador (CAD) as principais ferramentas. Isso análises espaciais 
complexas.
O LiDAR usa pulsos de laser para coletar dados de distância, enquanto a 
fotogrametria usa fotografias aéreas para criar modelos 3D. Esses dados 
são armazenados em um banco de dados e usados para análise e 
visualização quando necessário.1)
A pesquisa mostrou que as estruturas de CNN 3D podem ser usadas para 
aprender representações 3D e que isso pode ser feito de forma mais 
eficiente do que os métodos tradicionais baseados em CNN totalmente 
3D.2)
Os métodos de visualização 3D baseados em GPU permitem uma 
demarcação espacial mais sofisticada e precisa.3)
A modelagem 3D é usada como uma ferramenta essencial no processo 
de simulação e projeto arquitetônico. Ela permite que você a segurança 
das estruturas e aumente a precisão de seus projetos.
Os dados espaciais em 3D são usados em pesquisas sobre mudanças no 
ecossistema e gerenciamento de desastres. Por exemplo, a modelagem 
geológica em 3D é usada para exploração de águas subterrâneas e 
pesquisa geológica.4)
Os dados 3D estão sendo usados para desenvolver ambientes imersivos 
para aprimorar a experiência do usuário. Isso sendo aplicado em uma 
variedade de setores, incluindo educação, saúde e entretenimento.
As tecnologias de processamento de dados espaciais em 3D estão 
avançando rapidamente em vários campos, principalmente na aquisição 
de dados de nuvens de pontos e na detecção de objetos no espaço 3D 3- -
usando sensores LiDAR. Essas tecnologias revolucionando veículos 
autônomos, aplicações médicas, automação industrial, sistemas de 
vigilância de segurança e ambientes de VR/AR. Este relatório de 
pesquisa fornece uma compreensão básica das tecnologias de 
processamento de dados espaciais em 3D e explica como elas estão 
sendo aplicadas em vários setores.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e visualização de 
dados 3D. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020). 
Convolução triplanar com kernels 2D compartilhados para classificação 3D e 
recuperação de formas. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Um novo método para prospecção 
regional baseado em gráficos 3D modernos. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). New regional stratigraphic insights from a 3D geological model of the 
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based on 
reprocessed B-field data originally collected for mineral exploration. Solid Earth, 
11, 349-361.4- -
2. Coleta de dados do Point CLoud com sensores LiDAR
A aquisição de dados de nuvem de pontos usando sensores LiDAR 
desempenha um papel importante em uma ampla gama de aplicações e 
é particularmente adequada para a aquisição de dados 3D de alta 
resolução. A tecnologia LiDAR emite pulsos de laser para receber sinais 
refletidos de objetos e calcula informações de distância com base neles. 
Essas informações são armazenadas em um formato de nuvem de 
pontos, em que cada ponto contém coordenadas X, Y e Z e intensidade 
de reflexão.
As nuvens de pontos LiDAR podem ser em diversos campos, incluindo 
urbano, ambiental e gerenciamento de recursos. Por exemplo, elas 
podem ser úteis para a análise estrutural de florestas ou para o 
levantamento de precisão de edifícios. As nuvens de pontos são então 
convertidas em 3D ou dados de GIS por meio de pós-processamento 
para redução de ruído, alinhamento e reconstrução de superfície. Uma 
variedade de softwares é usada nesse processo, especialmente métodos 
de visualização 3D baseados em GPU, que permitem uma demarcação 
espacial mais sofisticada.5)
Os dados LiDAR também desempenham uma função importante nos 
sistemas de percepção para veículos autônomos. O processamento e o 
treinamento da nuvem de pontos LiDAR no campo da direção autônoma 
contribuíram para a percepção precisa do ambiente rodoviário e para a 
detecção de objetos.6) Esses dados são essenciais para a construção de 
mapas 3D de alta resolução e em tempo real, que os veículos autônomos 
naveguem com segurança em condições rodoviárias complexas.
de pontos LiDAR também podem ser na Por exemplo, os dados 
coletados pelo LiDAR montado em aeronaves podem ser usados para 
reconstruir modelos 3D de formações geológicas, que contribuem para a 
exploração de águas subterrâneas ou para a pesquisa geológica.7) Essa 
modelagem geológica 3D permite novas interpretações geológicas e 
ajuda a entender melhor as características geológicas de uma área.
As vantagens da tecnologia LiDAR incluem a aquisição de dados em alta 
velocidade e a alta precisão, mas ela tem limitações o custo 5- -
relativamente alto e o desempenho em chuvoso ou Pesquisas e 
desenvolvimentos contínuos estão sendo feitos para superar essas 
limitações técnicas, o que está permitindo que o LiDAR seja usado em 
uma variedade maior de setores.
Um sensor LiDAR (Light Detection and Ranging) é uma tecnologia que 
usa um laser para medir a superfície de um objeto, e os dados podem 
ser usados para obter informações espaciais em 3D. Os dados da nuvem 
de pontos gerados por um sensor LiDAR são uma coleção de muitos 
pontos distribuídos no espaço 3D, cada um dos quais pode ser descrito 
por elevação, distância e posicionamento.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e visualização de 
dados 3D. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023). 
Compressão, processamento e aprendizado da nuvem de pontos Lidar para 
direção autônoma. IEEE Transactions on Intelligent Transportation Systems, 24, 
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B. 
(2020). New regional stratigraphic insights from a 3D geological model of the 
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based on 
reprocessed B-field data originally collected for mineral exploration. Solid Earth, 
11, 349-361.6- -
vigas. Esses dados são cruciais para a percepção dos veículos autônomos 
de seus arredores, modelagem arquitetura e engenharia civil e 
mapeamento em 3D.
3. Tecnologia de detecção de objetos 3D
A detecção de objetos em 3D é uma tecnologia importante para 
reconhecer e localizar objetos no espaço 3D e essencial em vários 
campos, incluindo veículos autônomos, e realidade aumentada. Ela 
principalmente em dados 3D coletados por meio de LiDAR, câmeras 
RGB-D e sistemas de visão estéreo.
Ele utiliza nuvens de pontos geradas pelo LiDAR para reconhecer a 
localização e a forma dos objetos. Modelos de aprendizagem profunda, 
como o PointNet, são amplamente usados nesse campo, e esses métodos 
são essenciais para gerar mapas 3D de alta resolução e em tempo real.8)
É uma técnica para detectar objetos combinando imagens 2D obtidas 
por câmeras RGB com informações 3D. Esse método melhora o 
desempenho da detecção ao adicionar informações de cor e padrão do 
objeto. Estudos recentes propuseram métodos como o FusionRCNN, que 
combina imagens LiDAR e de câmeras para melhorar a precisão da 
detecção.9)
Estruturas profunda, como as redes neurais convolucionais (CNNs) e as 
redes neurais recorrentes (RNNs), são usadas para e reconhecer 
recursos de 3D. Esses modelos melhoram a precisão da classificação de 
objetos e da estimativa de localização com base em conjuntos de dados, 
o que especialmente importante para o reconhecimento de obstáculos 
em veículos autônomos.10)
Ele é usado para aumentar a segurança ao dirigir, detectando obstáculos 
e pedestres na estrada. uma pesquisa ativa nessa área para fundir 
nuvens de pontos LiDAR com dados de visão para uma detecção mais 
precisa.11)
Ele ajuda o robô a entender e interagir com seu ambiente. Isso 
especialmente importante para determinar a localização exata dos 
objetos para ajudar o robô a planejar seu caminho e executar tarefas.7- -
Reconhecer e reagir a objetos em tempo real para aprimorar a 
experiência do usuário. Por exemplo, na realidade aumentada o local e a 
forma dos objetos devem ser determinados com precisão para 
aprimorar a interação com os objetos virtuais.
8) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving 
(Detecção de objetos 3D para direção autônoma): Pattern Recognition, 130, 
108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: fusão LiDAR-câmera para detecção de objetos 3D em dois estágios. 
Sensoriamento Remoto, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super Sparse 3D 
Object Detection (Detecção de objetos 3D superesparsos). IEEE Transactions on 
Pattern Analysis and Machine Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: fusão LiDAR-câmera para detecção de objetos 3D em dois estágios. 
Sensoriamento Remoto, 15, 1839.8- -
Essas tecnologias constante evolução, oferecendo soluções de detecção 
de objetos 3D mais precisas e eficientes. Os avanços em pesquisa e 
tecnologia estão melhorando significativamente a precisão do 
reconhecimento em ambientes do mundo real.
A detecção de objetos em 3D é identificação e a classificação precisas de 
objetos específicos no espaço em 3D, que é apoiada por várias técnicas 
de processamento de dados espaciais em 3D. Recentemente, técnicas 
baseadas em aprendizagem profunda ativamente aplicadas à detecção 
de objetos em 3D. As tecnologias representativas VoxelNet, PointNet e 
PointRCNN.
3.1 VoxeLNet
A VoxelNet é uma arquitetura inovadora de aprendizagem profunda 
projetada especificamente para detectar objetos 3D usando nuvens de 
pontos, o que é fundamental em sistemas de direção autônoma. A 
arquitetura adota uma abordagem exclusiva, convertendo dados brutos 
de nuvens de pontos em uma grade de voxels 3D estruturada para 
permitir o processamento eficiente e a extração de recursos. A 
conversão para uma representação de voxel é fundamental porque 
permite que a VoxelNet utilize efetivamente a convolução 3D para 
capturar informações espaciais e, ao mesmo tempo, garantir a 
eficiência computacional. Essa eficiência é essencial para os aplicativos 
em tempo real necessários para a direção autônoma.
A força da VoxelNet está em sua capacidade de incorporar uma nova 
camada de codificação de recursos que aumenta muito o poder de 
representação de cada voxel. Isso é obtido levando-se em conta as 
características exclusivas dos pontos contidos em cada voxel, o que 
melhora a capacidade da rede de detectar e classificar objetos em 
ambientes complexos.12) Essa etapa de codificação de recursos é para 
resolver problemas causados pela natureza irregular e esparsa dos 
dados da nuvem de pontos, que é difícil de lidar usando redes neurais 
convolucionais 2D tradicionais.
A pesquisa que o VoxelNet fez contribuições significativas para o campo 
da detecção de objetos em 3D. Por exemploa capacidade de sua 9- -
arquitetura de fornecer alta precisão e, ao mesmo tempo, manter a 
eficiência computacional faz com que ela seja a escolha preferida para 
aplicações de interimplementação em veículos autônomos.13) Além 
disso, a integração de representação esparsa da VoxelNet permite que 
ela lide de forma eficaz com as grandes quantidades de dados 
normalmente encontradas em cenários de direção autônoma.
O desenvolvimento da VoxelNet representa um avanço significativo no 
processamento de dados 3D e estabelece a base para futuras inovações 
na tecnologia de direção autônoma. Ele aborda os principais desafios 
nessa área combinando a voxelização eficiente com técnicas avançadas 
de codificação de recursos.14) Isso não só melhora a precisão da 
detecção, mas também permite uma fiscalização mais sofisticada
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Aprendizagem 
profunda para nuvens de pontos 3D: uma pesquisa. IEEE Transactions on 
Pattern Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Perturbações 
adversárias da nuvem de pontos contra a detecção de objetos 3D em sistemas de 
direção autônoma. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: detecção de objetos 3D a partir de 
nuvem monocular, estéreo e de pontos para direção autônoma. 
Neurocomputing, 494, 23-32.10- -
O VoxelNet está ampliando os limites do desenvolvimento de sistemas 
de percepção 3D. Com seu desempenho poderoso e abordagem 
inovadora, o VoxelNet continua influenciar a pesquisa e o 
desenvolvimento em andamento no processamento de nuvens de pontos 
3D e sistemas autônomos.15)
O VoxelNet é um modelo inovador para detecção de objetos 3D que 
processa dados de nuvem de pontos convertendo-os em grades 3D 
(voxels). Cada voxel representa um ponto na nuvem de pontos, o que 
permite que o modelo informações espaciais com mais eficiência. O 
VoxelNet usa essas informações de voxel detectar objetos e fazer 
previsões. A vantagem abordagem é que ela é eficiente e rápida para 
processar grandes quantidades de dados de nuvem de pontos.
3.2 PointNet
O PointNet é uma arquitetura inovadora de aprendizagem profunda que 
revoluciona o processamento de dados de nuvem de pontos 3D ao 
consumir diretamente conjuntos de pontos não ordenados. Ao contrário 
dos métodos tradicionais que exigem entradas estruturadas, o PointNet 
usa funções de simetria para garantir a invariância de permutação, as 
relações espaciais entre os pontos para que a permaneça , 
independentemente da dos pontos de entrada.
A principal inovação do PointNet é o uso de perceptrons (MLPse de 
pooling máximo. Essa arquitetura agrega com eficiência os recursos de 
pontos individuais em uma representação global, o que é 
particularmente útil para tarefas como classificação e segmentação. 
Graças à sua capacidade de grandes de pontos com eficiência e precisão, 
tornou um modelo fundamental no campo e inspirou várias 
arquiteturas subsequentes baseadas em seus princípios.
O impacto da PointNet vai além da pesquisa acadêmica para 
implementações práticas em áreas como direção autônoma e 
reconhecimento de robôs. Por exemplo, em sistemas autônomos, a 
PointNet tem sido usada para processar dados LiDAR para melhorar a 
detecção de objetos e a navegação, identificando e classificando objetos 
de um teste para o outro.16) O design da PointNet permite que ela lide 11- -
com eficácia com as complexidades associadas aos dados 3D, como 
oclusões e variações na densidade de pontos, tornando-a uma 
ferramenta versátil em aplicações de visão computacional.
Os avanços trazidos pela PointNet levaram à adaptação da PointNet em 
uma variedade de contextos inovadores. Por exemplo, ela foi aplicada 
para classificar dados LiDAR aéreos, melhorando a precisão e a 
eficiência das operações de sensoriamento remoto.17) A adaptabilidade 
da PointNet também levou à sua integração com redes neurais baseadas 
em física para analisar a propagação de rachaduras
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Rede de 
aprendizado semântico de múltiplas visualizações para detecção de objetos 3D 
com base em nuvem de pontos. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Aprendizagem 
profunda para nuvens de pontos 3D: uma pesquisa. IEEE Transactions on 
Pattern Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Classificação de nuvem de pontos LiDAR 
aerotransportada usando a rede PointNet++ com recursos de vizinhança 
completa. PLOS ONE, 18.12- -
e simulações de dinâmica de fluidos, e foi comprovado que resolve 
problemas industriais complexos.18)
O Pointnet continua a servir como referência no processamento de 
dados 3D, aumentando significativamente a capacidade dos modelos de 
aprendizagem profunda de processar dados de nuvem de pontos. Seu 
impacto é evidente tanto nos avanços teóricos quanto nas aplicações 
práticas, demonstrando sua contínua relevância e adaptabilidade no 
cenário em evolução da inteligência artificial e da aprendizagem 
automática.19)
O PointNet é um modelo que processar diretamente dados de nuvem de 
pontos e reconhecer objetos no espaço 3D, independentemente da 
ordem de cada ponto. O PointNet extrai os recursos dos pontos e 
executa a classificação e a segmentação com base neles. Esse modelo 
pode lidar com a natureza não estruturada das nuvens de pontos e pode 
ser usado em vários campos, como direção autônoma, robótica e análise 
de imagens médicas.
3.3 PontoRCNN
O PointRCNN é uma estrutura importante no campo da detecção de 
objetos em 3D, especialmente para aplicações como a direção autônoma. 
A estrutura usa um processo de detecção em duas etapas para melhorar 
a precisão e a eficiência da detecção de objetos em dados de nuvem de 
pontos em 3D. A primeira etapa é gerar sugestões de objetos por meio de 
uma rede de sugestões locais baseada em pontos. Essa etapa é porque 
trabalha diretamente nos dados brutos da nuvem de pontos, 
preservando informações espaciais detalhadas que podem ser perdidas 
nos métodos tradicionais que dependem de projeções de imagens ou 
voxelização.
Na segunda etapa, o PointRCNN refina a proposta inicial executando da 
caixa delimitadora 3D. Isso ajusta o tamanho e a orientação da para 
melhor ajustar os objetos detectados nos dados da nuvem de pontos. Ao 
utilizar recursos extraídos diretamente da nuvem de pontos bruta, o 
PointRCNN alcança maior precisão na detecção de especialmente em 
ambientes desafiadores com geometria complexa e oclusões.13- -
Uma das principais vantagens do PointRCNN é sua de aprender de 
ponta a ponta. Essa arquitetura facilita a integração perfeita dos estágios 
da rede, melhorando não apenas o desempenho de detecção do modelo, 
mas também sua eficiência computacional, tornando-o adequado para 
aplicações em tempo real, como as necessárias para sistemas de direção 
autônoma.
Pesquisas demonstraram que os métodos que utilizam dados de nuvem 
de pontos podem melhorar significativamente a compreensão e a 
interpretação de cenas em 3D em situações de direção autônoma. Por 
exemplo, o uso de algoritmos de detecção de vários alvos baseados em 
PointRCNN e técnicas de fusão de nuvens de pontos de voxel pode ser 
usado em cenários dinâmicos devido à sua versatilidade e
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: um solucionador 
de aprendizagem profunda para fluxos incompressíveis em estado estacionário 
e campos térmicos em vários conjuntos de geometrias irregulares. Journal of 
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e 
abordagens baseadas em aprendizagem profunda para compreensão de cenas 
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.14- -
Além disso, pesquisas no campo de nuvens de pontos 3D e abordagens 
de aprendizagem profunda a importância crescente dessas estruturas 
para a compreensão da cena na direção autônoma.20)
De modo geral, o PointRCNN representa um avanço significativo na 
tecnologia de detecção de objetos em 3D. Sua capacidade de processar 
diretamente os dados brutos pontos e o eficiente processo de detecção 
em dois estágios uma ferramenta poderosa para o direção autônoma, 
em que rápida e precisa de objetos é fundamental para a segurança e o 
desempenho.
A PointRCNN é uma tecnologia que usa uma CNN (Rede Neural 
Convolucional) baseada na PointNet para detecção de objetos em 3D e 
processa com eficácia os dados da nuvem de pontos detectar objetos 
com precisão. A PointRCNN é uma tecnologia que amplia o método de 
detecção de objetos 2D existente para ambientes 3D e é aplicada ao 
reconhecimento de objetos de veículos autônomos e ao reconhecimento 
de ambientes de robôs.
4. Aplicativos
As PointRCNNs desempenham uma função essencial nos sistemas de 
direção autônoma e são usadas para reconhecer e rastrear com precisão 
os objetos no ambiente ao redor. objetos usando de pontos 3D pode 
ajudar os veículos obstáculos na estrada com um alto grau de precisão, 
mesmo em situações de tráfego complexas.22)
O robô utiliza a tecnologia de detecção de objetos 3D para interagir com 
o ambiente. O PointRCNN permite que o robô compreenda seu 
ambiente de uma execução para outra e execute as tarefas necessárias.24)
Para inserir perfeitamente objetos virtuais no mundo real em um 
ambiente de AR, é necessária a detecção precisa de objetos no espaço 3D. 
O PointRCNN um papel importante nessa tarefa.
Os drones precisam ter a capacidade de reconhecer e evitar vários 
obstáculos durante o voo. O PointRCNN pode ser usado para detectar 
objetos em tempo real a partir dos dados do sensor do drone e definir 
uma trajetória de voo segura.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
21) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e 
abordagens baseadas em aprendizagem profunda para compreensão de cenas 
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving 
(Detecção de objetos 3D para direção autônoma): Pattern Recognition, 130, 
108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D Object Detection for 
Autonomous Driving (Detecção de objetos 3D para direção autônoma): A 
Comprehensive Survey, International Journal of Computer Vision, 131, 1909-
1963.
24) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e 
abordagens baseadas em aprendizagem profunda para compreensão de cenas 
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A. 
(2019).16- -
O PointRCNN é aplicado à modelagem 3D e à análise de ambientes 
urbanos, fornecendo informações importantes para o planejamento e a 
gestão urbanos. Isso ajudar a melhorar a eficiência do transporte e 
aumentar a segurança nas cidades.
Nessas aplicações, as PointRCNNs são muito úteis em situações em que 
são necessários alta precisão e processamento em tempo real. Pesquisas 
mostram que técnicas como algoritmos de detecção de vários alvos 
baseados em PointRCNN demonstrando seu desempenho e eficiência 
nessas aplicações.26) A PointRCNN contribui para maximizar a precisão 
e a eficiência da detecção de objetos em 3D, o que importante para o 
avanço dos veículos autônomos e de outros sistemas avançados.
A tecnologia de processamento de dados espaciais 3D usada em muitos 
setores diferentes. Alguns dos principais aplicativos incluem
4.1 Veículos autônomos
Os veículos são veículos que usam tecnologia avançada para dirigir 
sozinhos sem intervenção humana. Esses veículos utilizam uma 
variedade de sensores, câmeras, radares, LiDAR e outros para obter uma 
percepção precisa do ambiente ao seu redor. Essas tecnologias, 
combinadas com o processamento de dados em tempo real, são 
essenciais para determinar rotas de direção seguras.
Em particular, a tecnologia de detecção de objetos em 3D é um 
componente essencial dos veículos autônomos, desempenhando uma 
função importante na detecção e no reconhecimento precisos de objetos 
ao redor do veículo. O PointRCNN, por exemplo, aproveita os dados da 
nuvem de pontos para permitir a análise de alta resolução dos arredores 
de um veículo. Isso os veículos autônomos reconheçam pedestres, 
outros veículos, sinais de trânsito e muito mais em tempo real para 
garantir uma direção segura.27)
Os veículos autônomos também a capacidade de aprender padrões de 
direção e se adaptar a diferentes situações de direção aplicando 
tecnologias de aprendizado de máquina e inteligência artificial. Essas 
tecnologias contribuindo para melhorar a segurança do veículo, a 17- -
eficiência e a experiência do usuário. Em particular, a tecnologia de 
fusão de multissensores melhora a precisão da detecção de objetos em 
3D, um desempenho confiável em uma variedade de ambientes.28)
Uma pesquisa sobre métodos de detecção de objetos 3D para aplicações de 
direção autônoma. IEEE Transactions on Intelligent Transportation Systems, 20, 
3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic 
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on 
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23, 
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for 3D 
Object Detection in Autonomous Driving (Tecnologia de fusão de vários 
sensores para detecção de objetos 3D em direção autônoma): A Review, IEEE 
Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Os veículos autônomos uma área fundamental de inovação nos futuros 
sistemas de transporte por meio da convergência de algoritmos 
complexos e tecnologias de sensores. Essas tecnologias têm um impacto 
positivo na sociedade como um todo, reduzindo o congestionamento do 
tráfego, os acidentes rodoviários e permitindo um fluxo de tráfego mais 
eficiente.29)
Os veículos autônomos usam sensores LiDAR e tecnologia de detecção 
de objetos 3D para perceber e analisar os arredores do veículo em tempo 
real. Isso permite obstáculos, reconhecer pedestres, analisar 
cruzamentos e para maximizar a segurança do veículo e a eficiência da 
direção.
4.2 Assistência médica
As técnicas de detecção de objetos 3D na área médica, especialmente 
aquelas como a PointRCNN, uma ampla gama de aplicações potenciais. 
Essas tecnologias são usadas principalmente em imagens médicas, 
robótica cirúrgica, sistemas de monitoramento de pacientes, etc.
A tecnologia de detecção de objetos em 3D ajuda detectar com precisão 
lesões em imagens de TC, RM e ultrassom. Isso é especialmente 
importante em áreas como a radiologia, onde pode ser combinada com 
sistemas de diagnóstico auxiliados por computador usando inteligência 
artificial e aprendizado de máquina para melhorar a precisão do 
diagnóstico.30)
Nos sistemas robóticos cirúrgicos, a tecnologia de detecção de objetos 
3D permite o reconhecimento preciso dos tecidos e órgãos circundantes 
durante a cirurgia, ajudando a garantir uma cirurgia segura e precisa. 
Juntamente com os avanços na inteligência artificial médica, isso pode 
melhorar muito a eficiência e a segurança da cirurgia.31)
Os sensores 3D e a tecnologia de detecção de objetos podem analisar os 
movimentos e os sinais vitais de um paciente em tempo real para 
detectar anormalidades em um estágio inicial. Essas tecnologias ser 
combinadas com sistemas de monitoramento de pacientes baseados em 
inteligência artificial para rastrear e gerenciar continuamente a 19- -
condição do paciente.32)
Combinada com a realidade virtual (VR), ela poderia ser usada na 
educação e no treinamento médico. Tecnologia de detecção de objetos 3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, 
A. (2019). Uma pesquisa sobre métodos de detecção de objetos 3D para 
aplicativos de direção autônoma. IEEE Transactions on Intelligent 
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., 
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., 
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., 
Suzuki, K., ... & Armato, S. (2022). Relatório do grupo de trabalho 273 da AAPM: 
Recomendações sobre práticas recomendadas para IA e aprendizado de 
máquina para diagnóstico auxiliado por computador em imagens médicas. 
Física médica.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial intelligence 
in healthcare: a mastery (Inteligência artificial na área da saúde: um domínio), 
Biotechnology and Genetic Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support systems 
on nursing workflows in critical care units (O impacto dos sistemas de apoio à 
decisão baseados em IA nos fluxos de trabalho de enfermagem em unidades de 
cuidados intensivos). International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023). 
Artificial intelligence in clinical decision support systems for oncology 
(Inteligência artificial em sistemas de suporte a decisões clínicas para 
oncologia), International Journal of Medical Sciences, 20, 79-86.20- -
 desempenha um papel importante ao ajudar médicos e profissionais de 
saúde a simular cirurgias e diagnósticos, possibilitando o aprendizado 
em um ambiente realista.33)
Esses aplicativos contribuem para aumentar a precisão do diagnóstico e 
do tratamento na área médica e melhorar a segurança geral. Em 
particular, a tecnologia de detecção de objetos 3D combinada com a IA 
está acelerando a inovação na área da saúde e tornando uma 
ferramenta importante para melhorar a saúde e a segurança dos 
pacientes. Esses estudos oferecem novas perspectivas sobre as 
implicações comerciais, regulatórias e sociais da IA médica.34)
Na área médica, o processamento de dados espaciais em 3D usado para 
diagnóstico preciso e planejamento cirúrgico. Os dados de nuvem de 
pontos de imagens médicas em 3D, como tomografias 
computadorizadas ou resultados de ressonância magnética, são usados 
para visualizar o local da cirurgia e medir sua localização e tamanho 
exatos para melhorar a precisão cirúrgica.
4.3 Automação industrial e robótica
As tecnologias de detecção de objetos em 3D, especialmente modelos 
como o PointRCNN, estão revolucionando o campo da automação 
industrial e da robótica. Essas tecnologias melhoram significativamente 
a eficiência e a precisão em uma ampla gama de setores e 
desempenham um papel importante nas seguintes áreas específicas
A tecnologia de detecção de objetos em 3D é essencial para que os 
sistemas robóticos reconheçam e classifiquem os objetos em um 
depósito. Ela permite que os robôs reconheçam com precisão objetos de 
diferentes tamanhos e formas, permitindo que eles executem tarefas 
eficientes de movimentação e classificação. Essas tecnologias 
aumentam a eficiência dos processos industriais e facilitam a 
automação dos sistemas de logística.35)
Quando os robôs industriais montam peças automaticamente, a 
detecção de objetos 3D aumenta a eficiência da montagem ao 
reconhecer a posição e a orientação exatas das peças. Isso contribui 
significativamente para aumentar as taxas de produção e reduzir as 21- -
taxas de defeitos, além de uma função importante em ambientes de 
manufatura inteligente.36)
Eles são usados para inspecionar a geometria e as dimensões dos 
produtos usando a tecnologia de digitalização 3D e um papel 
importante na garantia da qualidade do produto, na detecção precoce 
de defeitos e na redução de custos. Essas peças automatizadas
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. e Li, Y. (2020). Previsão 
baseada em inteligência artificial do risco de câncer de pulmão usando registros 
médicos eletrônicos sem imagem: abordagem de aprendizagem profunda. 
Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial 
intelligence in healthcare: a mastery (Inteligência artificial na área da saúde: 
um domínio). Biotechnology and Genetic Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., 
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., & 
White, M. (2021). Sim2Real in Robotics and Automation: Applications and 
Challenges (Sim2Real em robótica e automação: aplicativos e desafios). IEEE 
Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Automação baseada em aprendizado de montagem robótica para manufatura 
inteligente. Anais do IEEE, 109, 423-440.22- -
Os sistemas de inspeção de qualidade aumentam a confiabilidade dos 
produtos.37)
Para aumentar a segurança dos robôs e dos sistemas de automação, é 
utilizada a tecnologia de detecção de objetos 3D. Isso permite que 
reconheçam ou próximos com segurança. Esses mecanismos de 
segurança para a redução de acidentes em ambientes industriais.38)
É essencial que os veículos autônomos ou drones detectem objetos e 
planejem suas rotas. A tecnologia de detecção de objetos em 3D esses 
sistemas operem com eficiência, evitem obstáculos e realizem tarefas de 
entrega com segurança.39)
Nessas áreas, as tecnologias de detecção de objetos 3D impulsionando a 
inovação na automação industrial, ajudando a aumentar a 
produtividade, reduzir custos e melhorar a segurança. No futuro, essas 
tecnologias continuarão a ser parte integrante da evolução dos sistemas 
de robótica e automação. Pesquisas demonstraram que a aplicação 
dessas tecnologias está contribuindo significativamente para aumentar 
a eficiência dos processos industriais e gerenciar a complexidade dos 
sistemas automatizados.40)
Na automação industrial e na robótica, o processamento de dados 
espaciais em 3D é usado para aumentar a eficiência dos processos de 
fabricação e automatizar as inspeções de qualidade. Os robôs usam 
sensores LiDAR ou câmeras 3D reconhecer produtos, detectar 
anomalias e ajudar a resolver problemas de qualidade.
4.4 Sistemas de vigilância de segurança
Nos sistemas de vigilância de segurança, a tecnologia de detecção de 
objetos 3D um papel importante no fornecimento de soluções eficazes 
de monitoramento e segurança em uma variedade de ambientes. A 
tecnologia tem sido particularmente proeminente em áreas como 
monitoramento em tempo real, detecção de intrusão, prevenção de 
incidentes, análise de dados e relatórios e integração de inteligência 
artificial.23- -
Com recursos de monitoramento em tempo real, os sistemas de 
detecção de objetos 3D utilizam câmeras e sensores para analisar o 
ambiente ao redor em tempo real. Essa análise em tempo real permite o 
reconhecimento preciso de pessoas, veículos e objetos e fornece avisos 
imediatos no caso de uma situação perigosa. Isso é essencial para 
aumentar a segurança, especialmente em ambientes complexos, como 
estradas e aeroportos.
Quando se trata de detecção de intrusão, a tecnologia de detecção de 
objetos 3D é eficaz na detecção de movimentos ou comportamentos 
incomuns em uma área de segurança específica. Isso pode levar à 
detecção antecipada da aproximação de um intruso e fornecer à equipe 
de segurança
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industrial automation and 
product quality: the role of robotic production transformation (Automação 
industrial e qualidade do produto: a função da transformação da produção 
robótica). Applied Economics.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing 
Dynamic and Collaborative Automation and Robotics Software Systems 
(Projetando sistemas de software de automação e robótica dinâmicos e 
colaborativos), IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robótica: da automação aos sistemas inteligentes. Engenharia.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Industrial vision and automation (Visão e automação industrial). Measurement 
Science and Technology, 33.24- -
Evite a entrada não autorizada em áreas seguras, fornecendo alertas 
vermelhos.
Em termos de prevenção de acidentes, esses sistemas evitam acidentes 
em uma variedade de ambientes, incluindo instalações industriais, 
detectando perigos antecipadamente e fornecendo avisos. Por exemplo, 
um sistema de aviso automático ser acionado quando um trabalhador 
se aproxima de uma área perigosa para evitar um acidente.
Os recursos de análise de dados e geração de relatórios ajudam a avaliar 
a situação da segurança e a identificar problemas por meio de análises 
subsequentes usando os dados 3D coletados. Essas análises fornecem 
percepções importantes para a estratégia de segurança futura e o 
aprimoramento contínuo da segurança.
Com a integração da inteligência artificial, a tecnologia de detecção de 
objetos 3D pode ser combinada com algoritmos de aprendizado de 
máquina para criar um sistema de vigilância mais inteligente. Isso o 
sistema aprenda padrões e implemente mecanismos de alerta e resposta 
mais sofisticados.
Dessa forma, a tecnologia de detecção de objetos 3D está se tornando 
parte integrante dos sistemas de vigilância de segurança, ajudando a 
atender a uma variedade de necessidades de segurança e aumentando a 
segurança das instalações. Espera-se que essas tecnologias evoluam 
ainda mais no futuro, levando a soluções de vigilância de segurança 
mais sofisticadas e eficientes. Esses avanços tecnológicos evoluirão para 
sistemas de segurança mais poderosos, especialmente por meio da 
integração com a inteligência artificial.41)
A tecnologia de detecção de objetos 3D também um papel importante 
nos sistemas de vigilância de segurança. Os sensores LiDAR e a 
tecnologia de detecção de objetos 3D ser usados para detectar intrusos 
ou determinar se há pessoas nas proximidades. Eles também analisar 
padrões de comportamento no espaço 3D para rastrear e evitar 
atividades ilegais.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Um método de 
detecção de alvos pequenos por infravermelho baseado em um mecanismo de 
comparação visual humana ponderada para monitoramento de segurança. 
Sensoriamento Remoto, 15, 2922.26- -
4.5 VR/AR
Na realidade virtual (VR) e na realidade aumentada (AR), a tecnologia de 
detecção de objetos em 3D está aprimorando significativamente a 
experiência do usuário em diversos setores. A detecção de objetos em 
3D permite que os usuários interajam com objetos do mundo real em 
ambientes virtuais, o que é essencial para que os aplicativos de AR 
reconheçam o ambiente em tempo real para posicionar e manipular 
elementos virtuais com precisão. Isso torna a experiência do usuário 
mais imersiva.
Em ambientes de RV, a detecção de objetos 3D é usada para criar 
simulações realistas. Isso proporciona cenários de treinamento em 
diversos campos, inclusive médico, e de aviação, permitindo que os 
participantes vivenciem e pratiquem com segurança situações da vida 
real. A aplicação da RV/RA, especialmente no campo da segurança da 
construção, aumenta a conscientização sobre a segurança do 
trabalhador.42)
No setor de jogos, a detecção de objetos 3D proporciona uma 
experiência ao rastrear com precisão o movimento e a posição do 
jogador. Isso permite a interação com personagens virtuais, 
aumentando o realismo do jogo.
Na arquitetura e na engenharia, a tecnologia de AR pode ser usada para 
visualizar modelos de design no mundo real. Isso ajudar a detectar 
erros no processo de projeto com antecedência e facilitar a 
comunicação com os clientes. Esses aplicativos podem ser 
particularmente sinérgicos com a segurança da construção.43)
A tecnologia de AR ajuda os consumidores a tomar decisões de compra, 
permitindo que eles experimentem virtualmente os produtos. Por 
exemplo, ela permite que eles coloquem móveis em suas casas ou 
experimentem cores de cosméticos com antecedência. Isso aprimora a 
experiência de compra e a interação do consumidor.44)
Dessa forma, a tecnologia de detecção de objetos 3D está 
proporcionando experiências inovadoras em RV e RA e está sendo 
utilizada em diversos setores. No futuro, essas tecnologias continuarão a 27- -
evoluir, tornando a interação entre o usuário e o ambiente virtual ainda 
mais perfeita e natural. Isso expandirá ainda mais o uso da tecnologia 
de RV/RA em educação, entretenimento, comércio e muito mais. Ao 
mesmo tempo, os avanços nessas tecnologias criarão novas 
oportunidades nos setores de turismo e hospitalidade.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão crítica 
dos aplicativos de realidade virtual e aumentada (VR/AR) na segurança da 
construção. Automação na construção, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão crítica 
dos aplicativos de realidade virtual e aumentada (VR/AR) na segurança da 
construção. Automação na construção, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023). 
'The persuasion effects of virtual reality (VR) and augmented reality (AR) video 
advertisements: A conceptual review'. Journal of Business Research.
45) Wei, W. (2019). Research progress on virtual reality (VR) and augmented 
reality (AR) in tourism and hospitality (Progresso da pesquisa sobre realidade 
virtual (VR) e realidade aumentada (AR) em turismo e hospitalidade) Journal of 
Hospitality and Tourism Technology, 10, 539-570.28- -
Na realidade virtual (VR) e na realidade aumentada (AR), os dados 
espaciais em 3D desempenham uma função importante interação com 
objetos do mundo real. Os dados espaciais em 3D os objetos virtuais 
sejam posicionados corretamente no mundo real e que os usuários 
interajam com eles de forma natural.
5. Conclusão
A tecnologia de processamento de dados espaciais em 3D 
revolucionando muitos campos, incluindo direção autônoma, saúde, 
indústria, segurança e VR/AR. Em particular, os sensores LiDAR e as 
tecnologias de detecção de objetos em 3D desempenhando um papel 
importante em cada um desses campos, contribuindo para a análise 
ambiental em tempo real, diagnóstico e tratamento precisos e sistemas 
de automação eficientes. Essas tecnologias continuarão a evoluir e a 
proporcionar experiências de usuário mais ricas em vários campos.29- -
Referências
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. 
(2023). Compressão, processamento e aprendizado da nuvem de pontos 
Lidar para direção autônoma. IEEE Transactions on Intelligent 
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & 
Mouzakitis, A. (2019). Uma pesquisa sobre métodos de detecção de 
objetos 3D para aplicativos de direção autônoma. IEEE Transactions on 
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e 
visualização de dados 3D. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., & 
Rubin, E. J. (2023). Artificial Intelligence in Medicine (Inteligência 
artificial na medicina). New England Journal of Medicine, 388(13), 1220-
1221.
5. Campilho, R., & Silva, F. J. G. (2023). Melhoria de Processos 
Industriais por Automação e Robótica. Máquinas.
6. Cao, M., & Wang, J. (2020). Detecção de obstáculos para veículos de 
condução autônoma com fusão de sensores multi-LiDAR. Journal of 
Dynamic Systems Measurement and Control - Transactions of the ASME, 
142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: detecção de objetos 3D a 
partir de nuvem monocular, estéreo e de pontos para direção autônoma. 
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Um 
método de detecção de alvos pequenos por infravermelho baseado em 
um mecanismo de comparação visual humana ponderada para 
monitoramento de segurança. Sensoriamento Remoto, 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). New regional stratigraphic insights from a 3D 
geological model of the Nasia sub-basin, Ghana, developed for 
hydrogeological purposes and based on reprocessed B-field data 
originally collected for mineral exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and 
Industrial Systematic Mapping Study (Automação de processos 
robóticos: um estudo de mapeamento sistemático científico e industrial) 30- -
IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super 
Sparse 3D Object Detection (Detecção de objetos 3D superesparsos). 
IEEE Transactions on Pattern Analysis and Machine Intelligence, 45, 
12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., 
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P. 
(2021). Métodos de detecção e classificação de objetos 3D baseados em 
nuvens de pontos para aplicações de condução autônoma: uma pesquisa 
e taxonomia. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Deep31- -
Aprendizagem para nuvens de pontos 3D: uma pesquisa. IEEE 
Transactions on Pattern Analysis and Machine Intelligence, 43, 4338-
4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, 
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., 
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. 
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). Relatório do grupo de trabalho 273 da AAPM: 
Recomendações sobre práticas recomendadas para IA e aprendizado de 
máquina para diagnóstico auxiliado por computador em imagens 
médicas. Física médica.
15. Huang, S. (2019). Augmented reality and virtual reality: the power of 
AR and VR for business (Realidade aumentada e realidade virtual: o 
poder da AR e da RV para os negócios) Information Technology and 
Tourism (Tecnologia da informação e turismo), 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. 
(2021).
Automação baseada em aprendizado de montagem robótica para 
manufatura inteligente. Anais do IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. 
(2023). 'The persuasion effects of virtual reality (VR) and augmented 
reality (AR) video advertisements: A conceptual review'. Journal of 
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Convolução triplanar com kernels 2D compartilhados para classificação 
3D e recuperação de formas. Computer Vision and Image 
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Tecnologias interativas 
imersivas e experiências de compras virtuais: Differences in consumer 
perceptions between augmented reality (AR) and virtual reality (VR). 
Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hyper-automation in manufacturing industry 
(Hiperautomação no setor de manufatura), J. Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão 
crítica dos aplicativos de realidade virtual e aumentada (VR/AR) na 
segurança da construção. Automação na construção, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). 
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion 32- -
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D Object Detection for 
Autonomous Driving (Detecção de objetos 3D para direção autônoma): A 
Comprehensive Survey, International Journal of Computer Vision, 131, 
1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022). 
Industrial vision and automation (Visão e automação industrial). 
Measurement Science and Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial 
intelligence in healthcare: a mastery (Inteligência artificial na área da 
saúde: um domínio). Biotechnology and Genetic Engineering Reviews, 
None, 1-50.
26. Nebot, E. (2018). Robótica: da automação aos sistemas inteligentes. 
Engenharia.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. 
(2022). gráfico dinâmico33- -
para detecção de objetos 3D. Knowledge-Based Systems, 259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: detecção de 
objetos 3D baseada em aprendizado profundo usando nuvem de pontos 
semânticos. Visual Computer, , 1-15.
29. Wei, W. (2019). Research progress on virtual reality (VR) and 
augmented reality (AR) in tourism and hospitality (Progresso da 
pesquisa sobre realidade virtual (VR) e realidade aumentada (AR) em 
turismo e hospitalidade) Journal of Hospitality and Tourism Technology, 
10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Um novo método para 
prospecção regional baseado em gráficos 3D modernos. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. e Li, Y. (2020). 
Previsão baseada em inteligência artificial do risco de câncer de pulmão 
usando registros médicos eletrônicos sem imagem: abordagem de 
aprendizagem profunda. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Detecção e diagnóstico auxiliados por 
computador/radiômica/aprendizagem de máquina/aprendizagem 
profunda em imagens médicas. Física Médica.

Rapport de recherche : Technologie de traitement des données
spatiales en 3D et ses applications Institut de recherche en IA du
comté de  2025_01Youngho Hong

 

Résumés :
Cette recherche couvre le développement et l'application des technologies
de traitement des données spatiales en 3D, en particulier l'acquisition de
données de nuages de points et les technologies de détection d'objets en 3D
à l'aide de capteurs LiDAR. Elle se concentre sur les technologies de
détection d'objets en 3D VoxelNet, PointNet et PointRCNN et explique
comment ces technologies sont utilisées dans divers domaines tels que les
véhicules autonomes, les soins de santé, l'automatisation industrielle, les
systèmes de surveillance de la sécurité et la RV/AR. Les données des nuages
de points collectées par les capteurs LiDAR analysent l'espace 3D avec une
grande précision, et la technologie de détection d'objets 3D basée sur ces
données un rôle important dans la sensibilisation à l'environnement en
temps réel, les diagnostics de précision, l'optimisation des processus de
fabrication, etc. Cette étude analyse l'impact de la technologie de
traitement des données spatiales 3D sur l'industrie moderne et l'innovation
technologique, et examine le potentiel de développement futur.
Mots-clés :
Données spatiales 3D, capteurs LiDAR, nuages de points,
détection d'objets 3D, VoxelNet, PointNet, PointRCNN, véhicules
autonomes, soins de santé, automatisation industrielle, systèmes de
surveillance de la sécurité, RV/AR, apprentissage profond (Deep Learning)
2- -
1. Introduction
Elle implique le processus de collecte, de stockage, d'analyse et de
visualisation des données et utilise des technologies telles que le LiDAR, la
photogrammétrie et la numérisation 3D pour traiter les informations
spatiales tridimensionnelles. Ces technologies sont utilisées dans une
variété de plateformes logicielles, les systèmes d'information géographique
(SIG) et la conception assistée par ordinateur (CAO) principaux outils. Cela
réaliser des analyses spatiales complexes.
Le LiDAR utilise des impulsions laser pour collecter des données de
distance, tandis que la photogrammétrie utilise des photographies
aériennes pour créer des modèles 3D. Ces données sont stockées dans une
base de données et utilisées pour l'analyse et la visualisation en cas de
besoin.1)
Des recherches ont montré que les structures CNN 3D peuvent être
utilisées pour apprendre des représentations 3D, et que cela peut être fait
plus efficacement que les méthodes traditionnelles basées sur des CNN
entièrement 3D.2)
Les méthodes de visualisation 3D basées sur le GPU permettent une
délimitation spatiale plus sophistiquée et plus précise.3)
La modélisation 3D un outil essentiel dans le processus de conception et de
simulation architecturales. Elle vous permet dévaluer la sécurité des
structures et d'accroître la précision de vos conceptions.
Les données spatiales en 3D sont utilisées dans la recherche sur le
changement des écosystèmes et la gestion des catastrophes. Par exemple,
la modélisation géologique en 3D est utilisée pour l'exploration des eaux
souterraines et la recherche géologique.4)
Les données 3D utilisées pour développer des environnements immersifs
afin d'améliorer l'expérience de l'utilisateur. Cette méthode appliquée dans
divers secteurs, notamment l'éducation, les soins de santé et les
divertissements.
Les technologies de traitement des données spatiales en 3D progressent
rapidement dans divers domaines, notamment l'acquisition de données de
3- -
nuages de points et la détection d'objets dans l'espace 3D à l'aide de
capteurs LiDAR. technologies révolutionnent les véhicules autonomes, les
applications médicales, l'automatisation industrielle, les systèmes de
surveillance de la sécurité et les environnements VR/AR. Ce rapport de
recherche fournit une compréhension de base des technologies de
traitement des données spatiales en 3D et explique comment elles sont
appliquées dans diverses industries.
1) Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and visualisation.
Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. et Lee, K. M. (2020). Triplanar
convolution with shared 2D kernels for 3D classification and shape retrieval ",
Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M. et Cheng, K. (2024). A Novel Method for Regional Prospecting
Based on Modern 3D Graphics (Nouvelle méthode de prospection régionale basée
sur des graphiques 3D modernes) Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo, B. (2020).
New regional stratigraphic insights from a 3D geological model of the Nasia subbasin,
Ghana, developed for hydrogeological purposes and based on reprocessed Bfield
data originally collected for mineral exploration. Solid Earth, 11, 349-361.
4- -
2. Collecte de données Point CLoud avec des capteurs LiDAR
L'acquisition de nuages de points à l'aide de capteurs LiDAR joue un rôle
important dans un large éventail d'applications et est particulièrement
adaptée à l'acquisition de données 3D à haute résolution. La technologie
LiDAR émet des impulsions laser pour recevoir les signaux réfléchis par les
objets et calcule les informations de distance sur la base de ces signaux.
Ces informations sont stockées dans un nuage de points, où chaque point
contient les coordonnées X, Y et Z et l'intensité de la réflexion.
Les nuages de points LiDAR peuvent être dans domaines, notamment l', la
'environnement et la gestion des ressources. Ils peuvent par exemple être
utiles pour l'analyse structurelle des forêts ou le levé de précision des
bâtiments. Les nuages de points sont ensuite convertis en 3D ou en
données SIG par un post-traitement de débruitage, d'alignement et de
reconstruction de surface. Divers logiciels sont utilisés dans ce processus,
en particulier des méthodes de visualisation 3D basées sur le GPU, qui
permettent une délimitation spatiale plus sophistiquée.5)
Les données LiDAR jouent également un rôle important dans les systèmes
de perception des véhicules autonomes. Le traitement des nuages de points
LiDAR et la formation dans le domaine de la conduite autonome ont
contribué à une perception précise de l'environnement routier et à la
détection d'objets.6) Ces données sont essentielles pour construire des
cartes 3D en temps réel et à haute résolution, qui véhicules autonomes de
naviguer en toute sécurité dans des conditions routières complexes.
points LiDAR peuvent également pour la Par exemple, les données
collectées par le LiDAR monté sur avion peuvent être utilisées pour
reconstruire des modèles 3D de formations géologiques, qui contribuent à
l'exploration des eaux souterraines ou à la recherche géologique.7) Cette
modélisation géologique en 3D permet de nouvelles interprétations
géologiques et aide à mieux comprendre les caractéristiques géologiques
d'une zone.
Les avantages de la technologie LiDAR comprennent l'acquisition de
données à grande vitesse et une grande précision, mais elle présente des
limites un coût relativement élevé et des performances par temps de pluie
ou de Des travaux de recherche et de développement sont en cours pour
surmonter ces limites techniques, ce qui permet dutiliser la technologie
5- -
LiDAR dans un plus grand nombre d'industries.
Un capteur LiDAR (Light Detection and Ranging) est une technologie qui
utilise des lasers pour mesurer la surface d'un objet, et les données peuvent
être utilisées pour obtenir des informations spatiales en 3D. Le nuage de
points généré par un capteur LiDAR est une collection de nombreux points
répartis dans l'espace 3D, chacun d'entre eux pouvant être décrit par une
élévation, une distance et un positionnement.
5) Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and visualisation.
Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J. et Chen, J. (2023). Lidar
Point Cloud Compression, Processing and Learning for Autonomous Driving
(Compression, traitement et apprentissage de nuages de points Lidar pour la
conduite autonome). IEEE Transactions on Intelligent Transportation Systems, 24,
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo, B. (2020).
New regional stratigraphic insights from a 3D geological model of the Nasia subbasin,
Ghana, developed for hydrogeological purposes and based on reprocessed Bfield
data originally collected for mineral exploration. Solid Earth, 11, 349-361.
6- -
poutres. Ces données sont essentielles pour la perception de
l'environnement par les véhicules autonomes, la modélisation architecture
et en génie civil, et la cartographie en 3D.
3. Technologie de détection d'objets en 3D
La détection d'objets en 3D est une technologie importante pour la
reconnaissance et la localisation d'objets dans l'espace 3D. Elle essentielle
dans de nombreux domaines, notamment les véhicules autonomes, la et la
réalité augmentée. Elle sappuie principalement sur des données 3D
collectées par LiDAR, des caméras RVB-D et des systèmes de vision stéréo.
Il utilise les nuages de points générés par LiDAR pour reconnaître
l'emplacement et la forme des objets. Les modèles d'apprentissage profond
tels que PointNet sont largement utilisés dans ce domaine, et ces méthodes
sont essentielles pour générer des cartes 3D haute résolution en temps
réel.8)
Il s'agit d'une technique permettant de détecter des objets en combinant
des images 2D obtenues par des caméras RVB avec des informations 3D.
Cette méthode améliore les performances de détection en ajoutant des
informations sur les couleurs et les motifs de l'objet. Des études récentes
ont proposé des méthodes telles que FusionRCNN, qui combine les images
LiDAR et les images des caméras pour améliorer la précision de la
détection.9)
Les structures d' profond telles que les réseaux neuronaux convolutifs
(CNN) et les réseaux neuronaux récurrents (RNN) sont utilisées pour et
reconnaître les caractéristiques des en 3D. Ces modèles améliorent la
précision de la classification des objets et de l'estimation de l'emplacement
sur la base d'ensembles de données, ce qui particulièrement important
pour la reconnaissance des obstacles dans les véhicules autonomes.10)
Il est utilisé pour améliorer la sécurité de la conduite en détectant les
obstacles et les piétons sur la route. Des recherches actives menées dans ce
domaine pour fusionner les nuages de points LiDAR avec les données de
vision afin d'obtenir une détection plus précise.11)
Elle aide le robot à comprendre son environnement et à interagir avec lui.
Elle particulièrement importante pour déterminer l'emplacement exact
7- -
des objets afin d'aider le robot à planifier sa trajectoire et à effectuer des
tâches.
Reconnaître les objets et y réagir en temps réel pour améliorer l'expérience
de l'utilisateur. Par exemple, dans la réalité augmentéeemplacement et la
forme des objets doivent être déterminés avec précision pour améliorer
l'interaction avec les objets virtuels.
8) Qian, R., Lai, X. et Li, X. (2021). 3D Object Detection for Autonomous Driving :
Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. et Li, J. (2023).
FusionRCNN : LiDAR-Camera Fusion for Two-Stage 3D Object Detection (Fusion
LiDAR-Caméra pour la détection d'objets en 3D en deux étapes). Remote Sensing, 15,
1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. et Zhang, Z. (2023). Super Sparse 3D Object
Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45,
12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. et Li, J. (2023).
FusionRCNN : LiDAR-Camera Fusion for Two-Stage 3D Object Detection (Fusion
LiDAR-Caméra pour la détection d'objets en 3D en deux étapes). Remote Sensing, 15,
1839.
8- -
Ces technologies évoluent , offrant des solutions de détection d'objets en 3D
plus précises et plus efficaces. Les progrès de la recherche et de la
technologie améliorent considérablement la précision de la reconnaissance
dans les environnements réels.
détection d'objets en 3D est l'identification et la classification précises
d'objets spécifiques dans l'espace 3D, qui s'appuient sur diverses
techniques de traitement des données spatiales en 3D. Récemment, des
techniques basées sur l'apprentissage profond ont activement appliquées à
la détection d'objets en 3D. technologies représentatives VoxelNet,
PointNet et PointRCNN.
3.1 VoxeLNet
VoxelNet est une architecture innovante d'apprentissage profond
spécialement conçue pour détecter des objets en 3D à l'aide de nuages de
points, ce qui est essentiel dans les systèmes de conduite autonome.
L'architecture adopte une approche unique en convertissant les données
brutes des nuages de points en une grille structurée de voxels 3D afin de
permettre un traitement et une extraction efficaces des caractéristiques. La
conversion en une représentation voxel est car elle permet à VoxelNet
d'utiliser efficacement la convolution 3D pour capturer les informations
spatiales tout en garantissant l'efficacité du calcul. Cette efficacité est
essentielle pour les applications en temps réel nécessaires à la conduite
autonome.
La force de VoxelNet réside dans sa capacité à intégrer une nouvelle couche
d'encodage des caractéristiques qui améliore considérablement le pouvoir
de représentation de chaque voxel. Ce résultat est obtenu en tenant compte
des caractéristiques uniques des points contenus dans chaque voxel, ce qui
améliore la capacité du réseau à détecter et à classer des objets dans des
environnements complexes.12) Cette étape d'encodage des caractéristiques
est pour résoudre les problèmes causés par la nature irrégulière et éparse
des données des nuages de points, qui sont difficiles à traiter à l'aide des
réseaux neuronaux convolutifs 2D traditionnels.
La recherche a montré que VoxelNet a apporté des contributions
significatives au domaine de la détection d'objets en 3D. Par exemplela
capacité de son architecture à fournir une grande précision tout en
9- -
conservant une efficacité de calcul en fait un choix privilégié pour les
applications entre implémentations dans les véhicules autonomes.13) En
outre, l'intégration de la représentation éparse de VoxelNet lui permet de
traiter efficacement les grandes quantités de données que l'on trouve
couramment dans les scénarios de conduite autonome.
Le développement de VoxelNet représente une avancée significative dans le
traitement des données 3D et jette les bases des futures innovations en
matière de technologie de conduite autonome. Il permet de relever des
défis majeurs dans ce domaine en combinant une voxélisation efficace avec
des techniques avancées de codage des caractéristiques.14) Cela permet non
seulement d'améliorer la précision de la détection, mais aussi de mettre en
oeuvre des mesures d'application plus sophistiquées.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Deep Learning for
3D Point Clouds : A Survey, IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. et Chang, Z. (2021). Adversarial point cloud
perturbations against 3D object detection in autonomous driving systems ",
Neurocomputing, 466, 27-36.
14) Chen, W., Li, P. et Zhao, H. (2022). MSL3D : 3D object detection from monocular,
stereo and point cloud for autonomous driving (détection d'objets en 3D à partir de
nuages monoculaires, stéréoscopiques et de points pour la conduite autonome).
Neurocomputing, 494, 23-32.
10- -
VoxelNet repousse les limites du développement des systèmes de
perception 3D. Grâce à ses puissantes performances et à son approche
innovante, VoxelNet continue d' la recherche et le développement en cours
dans le domaine du traitement des nuages de points 3D et des systèmes
autonomes.15)
VoxelNet est un modèle innovant de détection d'objets en 3D qui traite les
données des nuages de points en les convertissant en grilles 3D (voxels).
Chaque voxel représente un point dans le nuage de points, ce qui permet
au modèle traiter plus efficacement les informations spatiales. VoxelNet
utilise ces informations détecter des objets et faire des prédictions.
'avantage de cette approche est qu'elle est efficace et rapide pour traiter de
grandes quantités de données de nuages de points.
3.2 PointNet
PointNet est une architecture révolutionnaire d'apprentissage en
profondeur qui révolutionne le traitement des données de nuages de points
3D en consommant directement des ensembles de points non ordonnés.
Contrairement aux méthodes traditionnelles qui nécessitent des entrées
structurées, PointNet utilise des fonctions de symétrie pour assurer
l'invariance de la permutation, en les relations spatiales entre les points de
sorte que la reste soit l' points d'entrée.
La principale innovation de PointNet est l'utilisation de perceptrons (MLPet
d' mise en commun maximale. Cette architecture permet d'agréger
efficacement les caractéristiques de chaque point dans une représentation
globale, ce qui est particulièrement utile pour des tâches telles que la
classification et la segmentation. Grâce à sa capacité à et avec précision de
grands points, est un modèle fondamental dans ce domaine et a inspiré de
nombreuses architectures ultérieures basées sur ses principes.
L'impact de PointNet va au-delà de la recherche universitaire et s'étend à
des applications pratiques dans des domaines tels que la conduite
autonome et la reconnaissance des robots. Par exemple, dans les systèmes
autonomes, PointNet a été utilisé pour traiter les données LiDAR afin
d'améliorer la détection d'objets et la navigation en identifiant et en
classant les objets d'un essai à l'autre.16) La conception de PointNet lui
permet de traiter efficacement les complexités associées aux données 3D,
telles que les occlusions et les variations dans la densité des points, ce qui
11- -
en fait un outil polyvalent dans les applications de vision par ordinateur.
Les progrès réalisés par PointNet ont conduit à l'adaptation de PointNet
dans une variété de contextes innovants. Par exemple, il a été appliqué à la
classification des données LiDAR aéroportées, améliorant ainsi la précision
et l'efficacité des opérations de télédétection.17) La capacité d'adaptation de
PointNet a également conduit à son intégration avec des réseaux
neuronaux basés sur la physique pour analyser la propagation des fissures.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y. et Jing, X. (2020). Réseau d'apprentissage
sémantique multi-vues pour la détection d'objets 3D à partir de nuages de points.
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Deep Learning for
3D Point Clouds : A Survey, IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W. et Liu, G. (2023). Airborne LiDAR point cloud classification using
PointNet++ network with full neighbourhood features. PLOS ONE, 18.
12- -
et des simulations de la dynamique des fluides, et il a été prouvé qu'il
permettait de résoudre des problèmes industriels complexes.18)
Pointnet continue de servir de référence dans le traitement des données 3D,
en faisant progresser de manière significative la capacité des modèles
d'apprentissage profond à traiter les données des nuages de points. Son
impact est évident tant dans les avancées théoriques que dans les
applications pratiques, ce qui démontre sa pertinence et son adaptabilité
continues dans le paysage évolutif de l'intelligence artificielle et de
l'apprentissage automatique.19)
PointNet est un modèle qui traiter directement des données de nuages de
points et reconnaître des objets dans l'espace 3D, quel que soit l'ordre de
chaque point. PointNet extrait les caractéristiques des points et effectue
une classification et une segmentation sur la base de ces caractéristiques.
Ce modèle peut gérer la nature non structurée des nuages de points et peut
être utilisé dans divers domaines tels que la conduite autonome, la
robotique et l'analyse d'images médicales.
3.3 PointRCNN
PointRCNN est un cadre important dans le domaine de la détection d'objets
en 3D, en particulier pour des applications telles que la conduite autonome.
Ce cadre utilise un processus de détection en deux étapes pour améliorer la
précision et l'efficacité de la détection d'objets dans les nuages de points 3D.
La première étape consiste à générer des suggestions d'objets par le biais
d'un réseau de suggestions locales basé sur des points. Cette étape est car
elle travaille directement sur les données brutes du nuage de points,
préservant ainsi les informations spatiales détaillées qui peuvent être
perdues dans les méthodes traditionnelles qui reposent sur les projections
d'images ou la voxélisation.
Dans la deuxième étape, PointRCNN affine la proposition initiale en
effectuant une boîte englobante 3D. Cette opération permet d'ajuster la
taille et l'orientation de la afin qu'elle corresponde mieux aux objets
détectés dans les données du nuage de points. En utilisant des
caractéristiques extraites directement du nuage de points brut, PointRCNN
atteint une plus grande précision dans la détection d' en particulier dans
des environnements difficiles avec une géométrie complexe et des
occlusions.
13- -
L'un des principaux avantages de PointRCNN est sa apprendre de bout en
bout. Cette architecture facilite l'intégration transparente des étapes du
réseau, améliorant non seulement les performances de détection du
modèle mais aussi son efficacité de calcul, ce qui le rend adapté aux
applications en temps réel, telles que celles requises pour les systèmes de
conduite autonome.
La recherche a montré que les méthodes utilisant des données de nuages
de points peuvent améliorer de manière significative la compréhension et
l'interprétation des scènes 3D dans les situations de conduite autonome.
Par exemple, l'utilisation d'algorithmes de détection multi-cibles basés sur
PointRCNN et les techniques de fusion de nuages de points voxels peuvent
être utilisés dans des scénarios dynamiques en raison de leur polyvalence et
de leur capacité à s'adapter à des situations particulières.
18) Kashefi, A. et Mukerji, T. (2022). Physics-informed PointNet : A deep learning
solver for steady-state incompressible flows and thermal fields on multiple sets of
irregular geometries. Journal of Computational Physics, 468, 111510.
19) Wang, L. et Huang, Y. (2022). Une étude des nuages de points 3D et des approches
basées sur l'apprentissage profond pour la compréhension de la scène dans la
conduite autonome. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
14- -
En outre, des études dans le domaine des nuages de points 3D et des
approches d'apprentissage profond l'importance croissante de ces cadres
pour la compréhension de la scène dans la conduite autonome.20)
Dans l'ensemble, PointRCNN représente une avancée significative dans la
technologie de détection d'objets en 3D. Sa capacité à traiter directement
les données brutes des points et son processus de détection efficace en
deux étapes en font un outil puissant pour l' conduite autonome, où la
rapide et précise objets est essentielle pour la sécurité et les performances.
PointRCNN est une technologie qui utilise un réseau neuronal convolutif
(CNN) basé sur PointNet pour la détection d'objets en 3D, et qui traite
efficacement les données des nuages de points détecter les objets avec
précision. PointRCNN est une technologie qui étend la méthode existante
de détection d'objets en 2D aux environnements en 3D, et qui est appliquée
à la reconnaissance d'objets de véhicules autonomes et à la reconnaissance
de l'environnement de robots.
4. Applications
Les PointRCNN jouent un rôle essentiel dans les systèmes de conduite
autonome et sont utilisés pour reconnaître et suivre avec précision les
objets dans l'environnement. objets à l'aide de points 3D peut aider les
véhicules à obstacles routiers avec une grande précision, même dans des
situations de trafic complexes.22)
Le robot utilise la technologie de détection d'objets en 3D pour interagir
avec l'environnement. PointRCNN permet au robot de comprendre son
environnement d'une course à l'autre et d'effectuer les actions
nécessaires.24)
Afin d'insérer de manière transparente des objets virtuels dans le monde
réel dans un environnement AR, une détection précise des objets dans
l'espace 3D est nécessaire. PointRCNN un rôle important dans cette tâche.
Les drones doivent être capables de reconnaître et d'éviter divers obstacles
pendant le vol. PointRCNN peut être utilisé pour détecter des objets en
temps réel à partir des données des capteurs du drone et définir une
trajectoire de vol sûre.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
15- -
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
21) Wang, L. et Huang, Y. (2022). A Survey of 3D Point Cloud and Deep Learning-Based
Approaches for Scene Understanding in Autonomous Driving (Étude des nuages de
points 3D et des approches basées sur l'apprentissage profond pour la
compréhension de la scène dans la conduite autonome). IEEE Intelligent
Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. et Li, X. (2021). 3D Object Detection for Autonomous Driving :
Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X. et Li, H. (2022). 3D Object Detection for Autonomous
Driving : A Comprehensive Survey, International Journal of Computer Vision, 131,
1909-1963.
24) Wang, L. et Huang, Y. (2022). A Survey of 3D Point Cloud and Deep Learning-Based
Approaches for Scene Understanding in Autonomous Driving (Étude des nuages de
points 3D et des approches basées sur l'apprentissage profond pour la
compréhension de la scène dans la conduite autonome). IEEE Intelligent
Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A.
(2019).
16- -
PointRCNN est appliqué à la modélisation 3D et à l'analyse des
environnements urbains, fournissant des informations importantes pour la
planification et la gestion urbaines. Cela contribuer à améliorer l'efficacité
des transports et à renforcer la sécurité dans les villes.
Dans ces applications, les PointRCNN sont très utiles dans les situations où
une grande précision et un traitement en temps réel sont nécessaires. La
recherche montre que techniques telles que les algorithmes de détection
multicibles basés sur les PointRCNN démontrent leurs performances et
leur efficacité dans ces applications.26) Les PointRCNN contribuent à
maximiser la précision et l'efficacité de la détection d'objets en 3D, ce qui
important pour l'avancement des véhicules autonomes et d'autres systèmes
avancés.
La technologie de traitement des données spatiales en 3D utilisée dans de
nombreux secteurs d'activité. Parmi les principales applications, citons
4.1 Véhicules autonomes
Les véhicules sont des véhicules qui utilisent une technologie avancée pour
se conduire sans intervention humaine. Ces véhicules utilisent une variété
de capteurs, de caméras, de radars, de LiDAR, etc. pour obtenir une
connaissance précise de leur environnement. Ces technologies, associées
au traitement des données en temps réel, sont essentielles pour déterminer
des itinéraires de conduite sûrs.
En particulier, la technologie de détection d'objets en 3D est un élément clé
des véhicules autonomes, jouant un rôle important dans la détection et la
reconnaissance précises d'objets autour du véhicule. PointRCNN, par
exemple, exploite les données des nuages de points pour permettre une
analyse à haute résolution de l'environnement d'un véhicule. Les véhicules
autonomes ainsi reconnaître en temps réel les piétons, les autres véhicules,
les panneaux de signalisation, etc. afin de garantir une conduite sûre.27)
Les véhicules autonomes également la capacité d'apprendre des modèles
de conduite et de s'adapter à différentes situations de conduite en
appliquant des technologies d'apprentissage automatique et d'intelligence
artificielle. Ces technologies contribuent améliorer la sécurité des
véhicules, leur efficacité et l'expérience des utilisateurs. En particulier, la
17- -
technologie de fusion multi-capteurs améliore la précision de la détection
d'objets en 3D, ce qui des performances fiables dans divers
environnements.28)
Enquête sur les méthodes de détection d'objets en 3D pour les applications de
conduite autonome. IEEE Transactions on Intelligent Transportation Systems, 20,
3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
28) Wang, X., Li, K. et Chehri, A. (2024). Multi-Sensor Fusion Technology for 3D Object
Detection in Autonomous Driving : A Review, IEEE Transactions on Intelligent
Transportation Systems, 25, 1148-1165.
18- -
Les véhicules autonomes un domaine clé de l'innovation dans les futurs
systèmes de transport grâce à la convergence d'algorithmes complexes et
de technologies de capteurs. Ces technologies un impact positif sur la
société dans son ensemble en réduisant embouteillages et les accidents de
la route, et en permettant une circulation plus efficace.29)
Les véhicules autonomes utilisent des capteurs LiDAR et une technologie
de détection d'objets en 3D pour percevoir et analyser l'environnement du
véhicule en temps réel. Cela permet d'éviter les obstacles, de reconnaître
les piétons, d'analyser les intersections, etcafin de maximiser la sécurité et
l'efficacité de la conduite du véhicule.
4.2 Soins de santé
Les techniques de détection d'objets en 3D dans le domaine médical, en
particulier celles telles que PointRCNN, large éventail d'applications
potentielles. Ces technologies sont principalement utilisées dans l'imagerie
médicale, la robotique chirurgicale, les systèmes de surveillance des
patients, etc.
La technologie de détection d'objets en 3D permet détecter avec précision
les lésions dans les images de tomodensitométrie, d'IRM et d'échographie.
Elle est particulièrement importante dans des domaines tels que la
radiologie, où elle peut être associée à des systèmes de diagnostic assistés
par ordinateur utilisant l'intelligence artificielle et l'apprentissage
automatique pour améliorer la précision du diagnostic.30)
Dans les systèmes de robotique chirurgicale, la technologie de détection
d'objets en 3D permet de reconnaître avec précision les tissus et organes
environnants pendant l'opération, ce qui contribue à garantir une chirurgie
sûre et précise. Associée aux progrès de l'intelligence artificielle médicale,
cette technologie peut grandement améliorer l'efficacité et la sécurité de la
chirurgie.31)
Les capteurs 3D et la technologie de détection d'objets peuvent analyser les
mouvements et les signes vitaux d'un patient en temps réel afin de détecter
les anomalies à un stade précoce. Ces technologies associées à des systèmes
de surveillance des patients basés sur l'intelligence artificielle pour suivre
et gérer en permanence l'état d'un patient.32)
19- -
Combinée à la réalité virtuelle (VR), elle pourrait être utilisée dans
l'enseignement et la formation médicale. Technologie de détection d'objets
en 3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A.
(2019). Une enquête sur les méthodes de détection d'objets 3D pour les applications
de conduite autonome. IEEE Transactions on Intelligent Transportation Systems, 20,
3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., Sahiner, B.,
Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., Huo, Z.,
Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., Suzuki, K., ... &
Armato, S. (2022). Rapport 273 du groupe de travail de l'AAPM : Recommandations
sur les meilleures pratiques en matière d'IA et d'apprentissage automatique pour le
diagnostic assisté par ordinateur en imagerie médicale. Medical physics.
31) Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial intelligence in
healthcare : a mastery", Biotechnology and Genetic Engineering Reviews, None, 1-
50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support systems on
nursing workflows in critical care units ", International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y. et Yuan, X. (2023). Artificial
intelligence in clinical decision support systems for oncology ", International
Journal of Medical Sciences, 20, 79-86.
20- -
joue un rôle important en aidant les médecins et les professionnels de la
santé à simuler des opérations chirurgicales et des diagnostics, ce qui
permet d'apprendre dans un environnement réaliste.33)
Ces applications contribuent à précision des diagnostics et des traitements
dans le domaine médical et à améliorer la sécurité générale. En particulier
la technologie de détection d'objets en 3D combinée à l'IA accélère
l'innovation dans les soins de santé et devient un outil important pour
améliorer la santé et la sécurité des patients. Ces études offrent de
nouvelles perspectives sur les implications commerciales, réglementaires
et sociétales de l'IA médicale.34)
Dans le domaine médical, le traitement des données spatiales en 3D utilisé
pour établir des diagnostics précis et planifier des interventions
chirurgicales. Les nuages de points issus de l'imagerie médicale 3D, tels
que les résultats de tomographies ou d'IRM, sont utilisés pour visualiser le
site chirurgical et mesurer son emplacement et sa taille exacts afin
d'améliorer la précision de l'opération.
4.3 Automatisation industrielle et robotique
Les technologies de détection d'objets en 3D, en particulier les modèles tels
que PointRCNN, révolutionnent le domaine de l'automatisation industrielle
et de la robotique. Ces technologies améliorent considérablement
l'efficacité et la précision dans un large éventail d'industries et jouent un
rôle important dans les domaines spécifiques suivants
La technologie de détection d'objets en 3D est essentielle pour que les
systèmes robotiques puissent reconnaître et trier les objets dans un
entrepôt. Elle permet aux robots de reconnaître avec précision des objets
de tailles et de formes différentes, ce qui leur permet d'effectuer des tâches
de déplacement et de tri efficaces. Ces technologies augmentent l'efficacité
des processus industriels et facilitent l'automatisation des systèmes
logistiques.35)
Lorsque des robots industriels assemblent automatiquement des pièces, la
détection d'objets en 3D augmente l'efficacité de l'assemblage en
reconnaissant la position et l'orientation exactes des pièces. Cela contribue
de manière significative à l'augmentation des taux de production et à la
réduction des taux de défauts, et un rôle important dans les
21- -
environnements de fabrication intelligents.36)
Ils sont utilisés pour inspecter la géométrie et les dimensions des produits à
l'aide de la technologie de numérisation 3D et un rôle important dans la
garantie de la qualité des produits, la détection précoce des défauts et la
réduction des coûts. Ces pièces automatisées
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. et Li, Y. (2020). Artificial
Intelligence- Based Prediction of Lung Cancer Risk Using Nonimaging Electronic
Medical Records : Deep Learning Approach ", Journal of Medical Internet Research,
23.
34) Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial intelligence in
healthcare : a mastery", Biotechnology and Genetic Engineering Reviews, None, 1-
50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., Atkeson,
C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P. et White,
M. (2021). Sim2Real in Robotics and Automation : Applications and Challenges.
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. et Kim, H. (2021).
Learning-Based Automation of Robotic Assembly for Smart Manufacturing
(Automatisation basée sur l'apprentissage de l'assemblage robotisé pour une
fabrication intelligente). Proceedings of the IEEE, 109, 423-440.
22- -
Les systèmes d'inspection de la qualité augmentent la fiabilité des produits.37)
La technologie de détection d'objets en 3D est utilisée pour accroître la
sécurité des robots et des systèmes d'automatisation. Elle permet aux de
reconnaître les ou les proximité toute sécurité. Ces mécanismes de
sécurité contribuent à réduire les accidents dans les environnements
industriels.38)
Il est essentiel pour les véhicules autonomes ou les drones de détecter les
objets et de planifier leurs itinéraires. La technologie de détection d'objets
en 3D ces systèmes de fonctionner efficacement, d'éviter les obstacles et
d'effectuer des tâches de livraison en toute sécurité.39)
Dans ces domaines les technologies de détection d'objets en 3D stimulent
l'innovation dans l'automatisation industrielle, contribuant à accroître la
productivité, à réduire les coûts et à améliorer la sécurité. À l'avenir, ces
technologies continueront à faire partie intégrante de l'évolution de la
robotique et des systèmes d'automatisation. La recherche a montré que
l'application de ces technologies contribue de significative à
l'augmentation de l'efficacité des processus industriels et à la gestion de la
complexité des systèmes automatisés.40)
Dans le domaine de l'automatisation industrielle et de la robotique, le
traitement des données spatiales en 3D est utilisé pour accroître l'efficacité
des processus de fabrication et automatiser les contrôles de qualité. Les
robots utilisent des capteurs LiDAR ou des caméras 3D reconnaître les
produits, détecter les anomalies et aider à résoudre les problèmes de
qualité.
4.4 Systèmes de surveillance de la sécurité
Dans les systèmes de surveillance de la sécurité, la technologie de détection
d'objets en 3D un rôle important en fournissant des solutions de
surveillance et de sécurité efficaces dans divers environnements. Cette
technologie particulièrement importante dans des domaines tels que la
surveillance en temps réel, la détection des intrusions, la prévention des
incidents, l'analyse des données et l'établissement de rapports, ainsi que
l'intégration de l'intelligence artificielle.
Dotés de capacités de surveillance en temps réel, les systèmes de détection
23- -
d'objets en 3D utilisent des caméras et des capteurs pour analyser
l'environnement en temps réel. Cette analyse en temps réel permet une
reconnaissance précise des personnes, des véhicules et des objets, et
fournit des avertissements immédiats en cas de situation dangereuse. Cette
fonction est essentielle pour accroître la sécurité, en particulier dans les
environnements complexes tels que les routes et les aéroports.
En matière de détection d'intrusion, la technologie de détection d'objets en
3D est efficace pour détecter des mouvements ou des comportements
inhabituels dans une zone de sécurité spécifique. Elle permet de détecter
rapidement l'approche d'un intrus et de fournir au personnel de sécurité
des informations immédiates.
37) Wang, K., Zhou, J., Li, G., Hu, Y. et Hu, F. (2024). Automatisation industrielle et
qualité des produits : le rôle de la transformation robotique de la production.
Applied Economics.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A. et Wang, K. (2019). Designing Dynamic
and Collaborative Automation and Robotics Software Systems, IEEE Transactions on
Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). La robotique : de l'automatisation aux systèmes intelligents,
ingénierie.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R. et Vavilov, V. (2022). Industrial
vision and automation. Science et technologie des mesures, 33.
24- -
Empêcher l'entrée non autorisée dans les zones sécurisées en émettant des
alertes rouges.
En termes de prévention des accidents, ces systèmes préviennent les
accidents dans divers environnements, y compris les sites industriels, en
détectant les dangers à un stade précoce et en émettant des avertissements.
Par exemple, un système d'alerte automatique déclenché lorsqu'un
travailleur s'approche d'une zone dangereuse afin d'éviter un accident.
Les capacités d'analyse des données et de création de rapports vous aident
à évaluer votre situation en matière de sécurité et à identifier les problèmes
grâce à des analyses ultérieures utilisant les données 3D collectées. Ces
analyses fournissent des informations importantes pour la stratégie de
sécurité future et amélioration continue de la sécurité.
Grâce à l'intégration de l'intelligence artificielle, la technologie de détection
d'objets en 3D peut être combinée à des algorithmes d'apprentissage
automatique pour créer un système de surveillance plus intelligent. Cela
système d'apprendre des modèles et de mettre en oeuvre des mécanismes
d'alerte et de réponse plus sophistiqués.
Ainsi, la technologie de détection d'objets en 3D devient partie intégrante
des systèmes de surveillance de la sécurité, contribuant à répondre à divers
besoins en matière de sécurité et à renforcer la sécurité des installations.
Ces technologies devraient encore évoluer à l'avenir, pour aboutir à des
solutions de surveillance de la sécurité plus sophistiquées et plus efficaces.
Ces avancées technologiques traduiront par des systèmes de sécurité plus
robustes, notamment grâce à l'intégration de l'intelligence artificielle.41)
La technologie de détection d'objets en 3D également un rôle important
dans les systèmes de surveillance de la sécurité. Les capteurs LiDAR et la
technologie de détection d'objets en 3D utilisés pour détecter les intrus ou
déterminer si des personnes se trouvent à proximité. Ils également
analyser des modèles de comportement dans l'espace 3D afin de suivre et
de prévenir les activités illégales.
25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. et Cao, E. (2023). An Infrared Small
Target Detection Method Based on a Weighted Human Visual Comparison
Mechanism for Safety Monitoring (Méthode de détection de petites cibles
infrarouges basée sur un mécanisme de comparaison visuelle humaine pondérée
pour la surveillance de la sécurité). Remote Sens, 15, 2922.
26- -
4.5 RV/AR
Dans la réalité virtuelle (RV) et la réalité augmentée (RA), la technologie de
détection d'objets en 3D améliore considérablement l'expérience de
l'utilisateur dans une variété d'industries. La détection d'objets en 3D
permet aux utilisateurs d'interagir avec des objets du monde réel dans des
environnements virtuels, ce qui est essentiel pour que les applications de
RA reconnaissent leur environnement en temps réel afin de placer et de
manipuler avec précision les éléments virtuels. L'expérience de l'utilisateur
est ainsi plus immersive.
Dans les environnements VR, la détection d'objets en 3D est utilisée pour
créer des simulations réalistes. Cela permet de créer des scénarios de
formation dans divers domaines, notamment médical, et aéronautique,
permettant aux participants d'expérimenter et de s'exercer en toute
sécurité à des situations de la vie réelle. L'application de la RV/RA, en
particulier dans le domaine de la sécurité de la construction, sensibilise les
travailleurs à la sécurité.42)
Dans l'industrie du jeu, la détection d'objets en 3D offre une expérience en
suivant avec précision les mouvements et la position du joueur. Cela
permet d'interagir avec des personnages virtuels, ce qui accroît le réalisme
du jeu.
Dans les domaines de l'architecture et de l'ingénierie, la technologie AR
peut être utilisée pour visualiser les modèles de conception dans le monde
réel. Cela de détecter à l'avance les erreurs dans le processus de
conception et de faciliter la communication avec les clients. Ces
applications peuvent être particulièrement synergiques avec la sécurité de
la construction.43)
La technologie AR aide les consommateurs à prendre des décisions d'achat
en leur permettant d'expérimenter virtuellement les produits. Par
exempleelle leur donne la possibilité de placer des meubles dans leur
maison ou d'essayer des couleurs de cosmétiques à l'avance. L'expérience
d'achat et l'interaction avec le consommateur s'en trouvent améliorées.44)
Ainsi, la technologie de détection d'objets en 3D offre des expériences
innovantes dans la RV et la RA, et est utilisée dans une variété d'industries.
À l'avenir, ces technologies continueront d'évoluer, rendant l'interaction
27- -
entre 'utilisateur et l'environnement virtuel encore plus transparente et
naturelle. L'utilisation de la technologie VR/AR dans l'éducation, le
divertissement, le commerce et bien d'autres domaines s'en encore élargie.
Dans le même tempsles progrès de ces technologies créeront de nouvelles
opportunités dans les secteurs du tourisme et de l'hôtellerie.45)
42) Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review of virtual
and augmented reality (VR/AR) applications in construction safety, Automation in
Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review of virtual
and augmented reality (VR/AR) applications in construction safety, Automation in
Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A. et Behl, A. (2023). The
persuasion effects of virtual reality (VR) and augmented reality (AR) video
advertisements : A conceptual review". Journal of Business Research.
45) Wei, W. (2019). Research progress on virtual reality (VR) and augmented reality
(AR) in tourism and hospitality ", Journal of Hospitality and Tourism Technology, 10,
539-570.
28- -
Dans la virtuelle (RV) et la réalité augmentée (RA), les données spatiales 3D
jouent un rôle important interaction avec les objets du monde réel. Les
données spatiales 3D placer correctement les objets virtuels dans le monde
réel et permettent aux utilisateurs d'interagir avec eux de manière naturelle.
5. Conclusion
technologie de traitement des données spatiales en 3D révolutionne de
nombreux domaines, notamment la conduite autonome, les soins de santé,
l'industrie, la sécurité et la RV/AR. En particulier les capteurs LiDAR et les
technologies de détection d'objets en 3D jouent un rôle important dans
chacun de ces domaines, contribuant à l'analyse environnementale en
temps réel, à la précision des diagnostics et des traitements, et à l'efficacité
des systèmes d'automatisation. Ces technologies d'évoluer et d'enrichir
l'expérience des utilisateurs dans divers domaines.
29- -
Références
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J. et Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving (Compression, traitement et apprentissage de nuages de points
Lidar pour la conduite autonome). IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Une enquête sur les méthodes de détection d'objets
3D pour les applications de conduite autonome. IEEE Transactions on
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and
visualisation. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A. et Rubin,
E. J. (2023). Artificial Intelligence in Medicine. New England Journal of
Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Amélioration des processus
industriels par l'automatisation et la robotique, Machines.
6. Cao, M. et Wang, J. (2020). Obstacle Detection for Autonomous Driving
Vehicles With Multi-LiDAR Sensor Fusion (Détection d'obstacles pour les
véhicules à conduite autonome avec fusion de capteurs multi-LiDAR).
Journal of Dynamic Systems Measurement and Control - Transactions of
the ASME, 142.
7. Chen, W., Li, P. et Zhao, H. (2022). MSL3D : 3D object detection from
monocular, stereo and point cloud for autonomous driving (détection
d'objets en 3D à partir de nuages monoculaires, stéréoscopiques et de
points pour la conduite autonome). Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. et Cao, E. (2023). An
Infrared Small Target Detection Method Based on a Weighted Human
Visual Comparison Mechanism for Safety Monitoring (Méthode de
détection de petites cibles infrarouges basée sur un mécanisme de
comparaison visuelle humaine pondérée pour la surveillance de la
sécurité). Remote Sens, 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo,
B. (2020). New regional stratigraphic insights from a 3D geological model of
the Nasia sub-basin, Ghana, developed for hydrogeological purposes and
based on reprocessed B-field data originally collected for mineral
exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J. et García-García,
J. A. (2020). Robotic Process Automation : A Scientific and Industrial
30- -
Systematic Mapping Study ", IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. et Zhang, Z. (2023). Super Sparse
3D Object Detection. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., Guevara,
M., Novais, P., Monteiro, J., Melo-Pinto, P. et Melo-Pinto, P. (2021). Pointcloud
based 3D object detection and classification methods for self-driving
applications : A survey and taxonomy", Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Profond
31- -
Learning for 3D Point Clouds : A Survey ", IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman,
H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers,
R., Suzuki, K.,
... & Armato, S. (2022). Rapport 273 du groupe de travail de l'AAPM :
Recommandations sur les meilleures pratiques pour l'IA et l'apprentissage
automatique pour le diagnostic assisté par ordinateur en imagerie médicale.
Medical physics.
15. Huang, S. (2019). Augmented reality and virtual reality : the power of
AR and VR for business ", Information Technology and Tourism, 21, 457-
459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. et Kim, H. (2021).
Learning-Based Automation of Robotic Assembly for Smart Manufacturing
(Automatisation basée sur l'apprentissage de l'assemblage robotisé pour
une fabrication intelligente). Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A. et Behl, A.
(2023). The persuasion effects of virtual reality (VR) and augmented reality
(AR) video advertisements : A conceptual review". Journal of Business
Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. et Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval ", Computer Vision and Image Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M. et Yoo, J. (2022). Technologies interactives
immersives et expériences d'achat virtuelles : Differences in consumer
perceptions between augmented reality (AR) and virtual reality (VR).
Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hyper-automation in manufacturing industry, J.
Intell. Manuf. 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review
of virtual and augmented reality (VR/AR) applications in construction
safety, Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion
Based on PointRCNN, IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X. et Li, H. (2022). 3D Object Detection for
Autonomous Driving : A Comprehensive Survey, International Journal of
Computer Vision, 131, 1909-1963.
32- -
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R. et Vavilov, V. (2022).
Industrial vision and automation. Science et technologie des mesures, 33.
25. Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial
intelligence in healthcare : a mastery", Biotechnology and Genetic
Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). La robotique : de l'automatisation aux systèmes
intelligents, ingénierie.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. (2022),
Dynamic graph
33- -
pour la détection d'objets en 3D. Knowledge-Based Systems, 259, 110085.
28. Song, S., Huang, T., Zhu, Q. et Hu, H. (2023). ODSPC : deep learningbased
3D object detection using semantic point cloud", Visual Computer, ,
1-15.
29. Wei, W. (2019). Research progress on virtual reality (VR) and
augmented reality (AR) in tourism and hospitality ", Journal of Hospitality
and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M. et Cheng, K. (2024). A Novel Method for Regional
Prospecting Based on Modern 3D Graphics (Nouvelle méthode de
prospection régionale basée sur des graphiques 3D modernes) Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. et Li, Y. (2020).
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records : Deep Learning Approach ",
Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Détection et diagnostic assistés par
ordinateur/radiomique/apprentissage machine/apprentissage profond en
imagerie médicale. Medical Physics.

+ Recent posts