Tyrimų ataskaita: 3D erdvinių duomenų apdorojimo
technologija ir jos taikymas AI Research Institute 2025_01Youngho Hong
Santraukos:
Šie tyrimai apima 3D erdvinių duomenų apdorojimo technologijų
kūrimą ir taikymą, ypač taškų debesų duomenų gavimą ir 3D objektų
aptikimo technologijas naudojant LiDAR jutiklius. Daugiausia dėmesio
skiriama 3D objektų aptikimo technologijoms "VoxelNet", "PointNet" ir
"PointRCNN" ir aiškinama, kaip šios technologijos naudojamos įvairiose
srityse, pavyzdžiui, autonominėse transporto priemonėse, sveikatos
priežiūroje, pramonės automatizavime, saugos stebėjimo sistemose ir
VR/AR. LiDAR jutikliais surinktais taškų debesies duomenimis labai
tiksliai analizuojama 3D erdvė, o jais pagrįstos 3D objektų aptikimo
technologijos svarbų vaidmenį realiuoju laiku informuojant apie
aplinką, atliekant tikslią diagnostiką, optimizuojant gamybos procesus
ir kt. Šiame tyrime analizuojamas 3D erdvinių duomenų apdorojimo
technologijos poveikis šiuolaikinei pramonei ir technologinėms
naujovėms bei aptariamos tolesnės plėtros galimybės.
Reikšminiai žodžiai:
3D erdviniai duomenys, LiDAR jutikliai, taškų debesys, 3D
objektų aptikimas, VoxelNet, PointNet, PointRCNN, autonominės
transporto priemonės, sveikatos priežiūra, pramonės automatizavimas,
saugos stebėjimo sistemos, VR/AR, gilusis mokymasis2- -
1. Įvadas
Ji apima duomenų rinkimo, saugojimo, analizės ir vizualizavimo
procesą, o trimatės erdvinės informacijos apdorojimui naudojamos
tokios technologijos kaip LiDAR, fotogrametrija ir 3D skenavimas. Šios
technologijos naudojamos įvairiose programinės įrangos platformose, iš
kurių pagrindinės yra geografinės informacinės sistemos (GIS) ir
kompiuterizuotas projektavimas (CAD). Tai atlikti sudėtingas erdvines
analizes.
LiDAR naudoja lazerio impulsus atstumo duomenims rinkti, o
fotogrametrija naudoja aerofotonuotraukas 3D modeliams kurti. Šie
duomenys saugomi duomenų bazėje ir prireikus naudojami analizei ir
vizualizacijai.1)
Tyrimai parodė, kad 3D CNN struktūros gali būti naudojamos 3D
reprezentacijoms mokytis ir kad tai galima padaryti efektyviau nei
taikant tradicinius visiškai 3D CNN pagrįstus metodus.2)
Naudojant GPU pagrįstus 3D vizualizavimo metodus galima sudėtingiau ir
tiksliau nustatyti erdvines ribas.3)
3D modeliavimas naudojamas kaip esminis įrankis architektūrinio
projektavimo ir modeliavimo procese. Jis leidžia įvertinti konstrukcijų
saugumą padidinti projektų tikslumą.
3D erdviniai duomenys naudojami atliekant ekosistemų pokyčių ir
nelaimių valdymo tyrimus. Pavyzdžiui, 3D geologinis modeliavimas
naudojamas požeminio vandens žvalgybai ir geologiniams tyrimams.4)
3D duomenys kuriant įtraukiančias aplinkas, kurios pagerina naudotojo
patirtį. Tai įvairiose pramonės šakose, įskaitant švietimą, sveikatos
priežiūrą ir pramogas.
3D erdvinių duomenų apdorojimo technologijos sparčiai tobulėja
įvairiose srityse, ypač taškų debesų duomenų gavimo ir objektų aptikimo
3D erdvėje naudojant LiDAR jutiklius. Šios technologijos esmės keičia
autonominių transporto priemonių, medicinospramonės
automatizavimo, saugos stebėjimo sistemų ir VR/AR aplinkas. Šioje 3- -
tyrimo ataskaitoje pateikiama pagrindinė informacija apie 3D erdvinių
duomenų apdorojimo technologijas ir paaiškinama, kaip jos taikomos
įvairiose pramonės šakose.
1) Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų skaičiavimas ir
vizualizavimas. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. ir Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval (Triplanar konvoliucija su bendrais 2D branduoliais 3D
klasifikavimui ir formos paieškai). Computer Vision and Image
Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M. ir Cheng, K. (2024). A Novel Method for Regional
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš Nasia subbaseino
(Gana) 3D geologinio modelio, sukurto hidrogeologiniais tikslais ir pagrįsto
pakartotinai apdorotais B lauko duomenimis, kurie iš pradžių buvo surinkti
mineralų žvalgybos tikslais. Solid Earth, 11, 349-361.4- -
2. "Point CLoud" duomenų rinkimas naudojant LiDAR jutiklius
Taškinių debesų duomenų rinkimas naudojant LiDAR jutiklius atlieka
svarbų vaidmenį įvairiose taikomosiose programose ir ypač tinka didelės
skiriamosios gebos 3D duomenims rinkti. LiDAR technologija skleidžia
lazerio impulsus, kad priimtų nuo objektų atsispindėjusius signalus ir
pagal juos apskaičiuotų atstumo informaciją. Ši informacija saugoma
taškų debesies formatu, kuriame kiekvienas taškas turi X, Y ir Z
koordinates ir atspindžio intensyvumą.
LiDAR taškų debesys gali būti įvairiose srityse, įskaitant miestų ,
aplinkos ir išteklių valdymą. Pavyzdžiui, jie gali būti naudingi
struktūrinei miškų analizei arba tiksliam pastatų geodeziniam
matavimui. Po to taškų debesys paverčiami 3D arba GIS duomenimis,
juos vėliau apdorojant, kad būtų galima denozuoti, išlyginti ir atkurti
paviršių. Šiam procesui naudojama įvairi programinė įranga, ypač GPU
pagrįsti 3D vizualizavimo metodai, leidžiantys sudėtingiau nustatyti
erdvines ribas.5)
LiDAR duomenys taip pat atlieka svarbų vaidmenį autonominių
transporto priemonių suvokimo sistemose. LiDAR taškų debesų
apdorojimas ir mokymas autonominio vairavimo srityje prisidėjo prie
tikslaus kelio aplinkos suvokimo ir objektų aptikimo.6) Šie duomenys yra
labai svarbūs sudarant didelės skiriamosios gebos realaus laiko 3D
žemėlapius, kurie autonominėms transporto priemonėms saugiai judėti
sudėtingomis kelio sąlygomis.
LiDAR taškų taip pat gali būti Pavyzdžiui, iš lėktuvuose sumontuotų
LiDAR duomenų galima atkurti geologinių darinių 3D modelius, kurie
padeda žvalgyti požeminį vandenį ar atlikti geologinius tyrimus7)3D
geologinis modeliavimas leidžia atlikti naujas geologines interpretacijas
ir padeda geriau suprasti vietovės geologines savybes.
LiDAR technologijos privalumai - greitas duomenų gavimas ir didelis
tikslumas, tačiau ji turi ir trūkumų, palyginti didelę kainą ir veikimą
lietingu ar oru. Siekiant įveikti šiuos techninius trūkumus, nuolat
atliekami moksliniai tyrimai ir taikomoji veikla, LiDAR gali būti
naudojama įvairiose pramonės šakose.5- -
LiDAR (Light Detection and Ranging) jutiklis - tai technologija, kuri
naudoja lazerius objekto paviršiui matuoti, o duomenis galima naudoti
3D erdvinei informacijai gauti. LiDAR jutiklio generuojami taškų
debesies duomenys yra daugybės taškų, išsidėsčiusių 3D erdvėje,
rinkinys, kurių kiekvieną galima aprašyti aukščiu, atstumu ir vieta.
5) Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų skaičiavimas ir
vizualizavimas. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving (Lidar taškų debesų suspaudimas, apdorojimas ir mokymasis
autonominiam vairavimui). IEEE Transactions on Intelligent Transportation
Systems, 24, 962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš Nasia subbaseino
(Gana) 3D geologinio modelio, sukurto hidrogeologiniais tikslais ir pagrįsto
pakartotinai apdorotais B lauko duomenimis, kurie iš pradžių buvo surinkti
mineralų žvalgybos tikslais. Solid Earth, 11, 349-361.6- -
sijos. Šie duomenys svarbūs autonominių transporto priemonių
aplinkos suvokimui, architektūros ir civilinės inžinerijos modeliavimui
bei 3D žemėlapių sudarymui.
3. 3D objektų aptikimo technologija
3D objektų aptikimas yra svarbi objektų atpažinimo ir vietos nustatymo
3D erdvėje technologija, kuri labai svarbi įvairiose srityse, įskaitant
autonomines transporto priemones, ir papildytąją realybę. Ji pirmiausia
3D duomenimis, surinktais naudojant LiDAR, RGB-D kameras ir
stereovizorines sistemas.
Naudojant LiDAR sukurtus taškų debesis atpažįstama objektų vieta ir
forma. Šioje srityje plačiai naudojami gilaus mokymosi modeliai, tokie
kaip PointNet, ir šie metodai yra labai svarbūs kuriant didelės
skiriamosios gebos 3D žemėlapius realiuoju laiku.8)
Tai objektų aptikimo metodas, kai 2D vaizdai, gauti RGB kameromis,
derinami su 3D informacija. Šis metodas pagerina aptikimo našumą,
pridėdamas objekto spalvinę ir raštų informaciją. Naujausiuose
tyrimuose siūlomi tokie metodai, kaip FusionRCNN, kuris sujungia
LiDAR ir kameros vaizdus, kad pagerintų aptikimo tikslumą.9)
Giluminio struktūros, pavyzdžiui, konvoliuciniai neuroniniai tinklai
(CNN) ir pasikartojantys neuroniniai tinklai (RNN), naudojamos 3D
savybėms ir atpažinti. Šie modeliai pagerina objektų klasifikavimo ir
vietos nustatymo pagal duomenų rinkinius tikslumą, o ypač svarbu
atpažįstant kliūtis autonominėse transporto priemonėse10).
Jis naudojamas vairavimo saugumui didinti, nes aptinka kelyje esančias
kliūtis ir pėsčiuosius. Šioje srityje aktyviai moksliniai tyrimai, siekiant
sujungti LiDAR taškų debesis su regos duomenimis, kad būtų galima
tiksliau aptikti kliūtis.11)
Jis padeda robotui suprasti aplinką ir sąveikauti su ja. Tai ypač nustatant
tikslią objektų buvimo vietą, kad robotas galėtų planuoti savo kelią ir
atlikti užduotis.
atpažinti objektus ir reaguoti į juos realiuoju laiku, kad naudotojo 7- -
patirtis būtų geresnė. Pavyzdžiui, papildytoje realybėje, siekiant
pagerinti sąveiką su virtualiais objektais, tiksliai nustatyti objektų vietą
ir formą.
8) Qian, R., Lai, X. ir Li, X. (2021). 3D objektų aptikimas autonominiam
vairavimui: Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. ir Li, J. (2023).
FusionRCNN: LiDAR ir kameros sintezė dviejų etapų 3D objektų aptikimui.
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. ir Zhang, Z. (2023). Super Sparse 3D
Objektų aptikimas. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. ir Li, J. (2023).
FusionRCNN: LiDAR ir kameros sintezė dviejų etapų 3D objektų aptikimui.
Remote Sensing, 15, 1839.8- -
Šios technologijos nuolat tobulinamos todėl siūlomi vis tikslesni ir
efektyvesni 3D objektų aptikimo sprendimai. Mokslinių tyrimų ir
technologijų pažanga gerokai pagerina atpažinimo tikslumą realioje
aplinkoje.
3D objektų aptikimas - tai tikslus konkrečių objektų 3D erdvėje
identifikavimas ir klasifikavimas, kurį padeda atlikti įvairūs 3D erdvinių
duomenų apdorojimo metodai. Pastaruoju metu 3D objektų aptikimui
aktyviai giliuoju mokymusi pagrįsti metodai. Atstovaujamos šios
technologijosVoxelNet, PointNet ir PointRCNN.
3.1 "VoxeLNet"
"VoxelNet" yra novatoriška gilaus mokymosi architektūra, specialiai
sukurta 3D objektams aptikti naudojant taškų debesis, o tai labai svarbu
autonominio vairavimo sistemose. Ši architektūra naudoja unikalų
požiūrį, nes neapdorotus taškų debesų duomenis konvertuoja į
struktūrizuotą 3D vokselinį tinklelį, kad būtų galima efektyviai apdoroti
ir išgauti požymius. Konvertavimas į vokselinę reprezentaciją yra nes jis
leidžia "VoxelNet" veiksmingai naudoti 3D konvoliuciją erdvinei
informacijai užfiksuoti, kartu užtikrinant skaičiavimo efektyvumą. Šis
efektyvumas yra labai svarbus realaus laiko programoms, reikalingoms
autonominiam vairavimui.
"VoxelNet" stiprybė gebėjimas įtraukti naują požymių kodavimo sluoksnį,
kuris labai padidina kiekvieno vokselio reprezentacinę galią. Tai
pasiekiama atsižvelgiant į unikalias kiekviename vokselio taške esančių
taškų savybes, todėl pagerėja tinklo gebėjimas aptikti ir klasifikuoti
objektus sudėtingoje aplinkoje.12) Šis požymių kodavimo etapas yra
sprendžiant problemas, kylančias dėl netaisyklingo ir reto taškų
debesies duomenų pobūdžio, kurį sunku apdoroti naudojant tradicinius
2D konvoliucinius neuroninius tinklus.
Tyrimai , kad "VoxelNet" įnešė didelį indėlį į 3D objektų aptikimo sritį.
Pavyzdžiui, dėl savo architektūros gebėjimo užtikrinti aukštą tikslumą ir
kartu išlaikyti skaičiavimo efektyvumą, ji yra tinkamiausias
pasirinkimas tarpįgyvendinimo programoms autonominėse transporto
priemonėse.13) Be to, VoxelNet reto atvaizdavimo integracija leidžia 9- -
efektyviai apdoroti didelius duomenų kiekius, kurie paprastai
aptinkami autonominio vairavimo scenarijuose.
"VoxelNet" sukūrimas - tai didelė pažanga 3D duomenų apdorojimo
srityje ir pagrindas būsimoms autonominio vairavimo technologijų
naujovėms. Jis sprendžia pagrindinius šios srities uždavinius,
derindamas veiksmingą vokselizaciją su pažangiais požymių kodavimo
metodais.14) Tai ne tik pagerina aptikimo tikslumą, bet ir leidžia
sudėtingiau vykdyti
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep
Learning for 3D Point Clouds: A Survey (Gilusis mokymasis 3D taškų
debesims: apžvalga). IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. ir Chang, Z. (2021). Adversarial
point cloud perturbations against 3D object detection in autonomous
driving systems (Priešingi taškų debesų trikdžiai prieš 3D objektų aptikimą
autonominio vairavimo sistemose). Neurocomputing, 466, 27-36.
14) Chen, W., Li, P. ir Zhao, H. (2022). MSL3D: 3D objektų aptikimas iš
monokulinio, stereo ir taškinio debesies autonominiam vairavimui.
Neurocomputing, 494, 23-32.10- -
"VoxelNet" plečia 3D suvokimo sistemos kūrimo ribas. Galingomis
galimybėmis ir novatorišku požiūriu "VoxelNet" ir toliau įtaką
vykdomiems 3D taškų debesų apdorojimo ir autonominių sistemų
moksliniams tyrimams ir plėtrai.15)
"VoxelNet" yra naujoviškas 3D objektų aptikimo modelis, kuris apdoroja
taškų debesies duomenis, konvertuodamas juos į 3D tinklelius
(vokselius). Kiekvienas vokselis yra taškų debesies taškas, todėl modelis
gali efektyviau erdvinę informaciją. Šią vokselinę informaciją
"VoxelNet" naudoja objektams aptikti prognozėms atlikti. Šio metodo
privalumas tas, kad juo efektyviai ir greitai apdorojami dideli taškų
debesies duomenų kiekiai.
3.2 PointNet
"PointNet" yra novatoriška gilaus mokymosi architektūra, kuri iš esmės
keičia 3D taškų debesų duomenų apdorojimą, nes tiesiogiai naudoja
netvarkingus taškų rinkinius. Skirtingai nuo tradicinių metodų, kuriems
reikia struktūrizuotų įvesties duomenų, "PointNet" naudoja simetrijos
funkcijas, kad užtikrintų permutacijos invariantiškumą ir erdvinius
ryšius tarp taškų, kad išliktų nepriklausomai nuo įvesties taškų
Pagrindinė PointNet naujovė - perceptronų (MLPir maksimalaus
telkimo naudojimas. Tokia architektūra veiksmingai sujungia atskirų
taškų požymius į bendrą atvaizdavimą, kuris ypač naudingas tokioms
užduotims kaip klasifikavimas ir segmentavimas. Dėl gebėjimo ir
tiksliai apdoroti didelius taškų tapo pagrindiniu šios srities modeliu ir
įkvėpė daugybę vėlesnių jo principais paremtų architektūrų.
"PointNet" poveikis neapsiriboja vien akademiniais tyrimais, bet ir
praktiniu įgyvendinimu tokiose srityse kaip autonominis vairavimas ir
robotų atpažinimas. Pavyzdžiui, autonominėse sistemose PointNet buvo
naudojamas LiDAR duomenims apdoroti, siekiant pagerinti objektų
aptikimą ir navigaciją, nustatant ir klasifikuojant objektus nuo vieno
bandymo iki kito.16) PointNet konstrukcija leidžia efektyviai tvarkyti su
3D duomenimis susijusius sudėtingus klausimus, tokius kaip užtemimai
ir taškų tankio pokyčiai, todėl PointNet yra universali priemonė
kompiuterinės regos programose.11- -
Dėl PointNet pasiektos pažangos PointNet buvo pritaikytas įvairiose
naujoviškose srityse. Pavyzdžiui, jis buvo pritaikytas klasifikuojant iš
oro gautus LiDAR duomenis, taip padidinant nuotolinio stebėjimo
operacijų tikslumą ir efektyvumą.17) PointNet pritaikomumas taip pat
paskatino jį integruoti su fizika pagrįstais neuroniniais tinklais, kad būtų
galima analizuoti plyšių plitimą
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y. ir Jing, X. (2020). Daugelio
vaizdų semantinio mokymosi tinklas, skirtas taškų debesimis pagrįstam 3D
objektų aptikimui. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep
Learning for 3D Point Clouds: A Survey (Gilusis mokymasis 3D taškų
debesims: apžvalga). IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W. ir Liu, G. (2023). Airborne LiDAR point cloud
classification using PointNet++ network with full neighbourhood features
(Orlaivio LiDAR taškų debesų klasifikavimas naudojant PointNet++ tinklą su
pilno kaimyninio ryšio požymiais). PLOS ONE, 18.12- -
ir skysčių dinamikos modeliavimus, ir įrodyta juo galima spręsti
sudėtingas pramonės problemas.18)
"Pointnet" ir toliau išlieka 3D duomenų apdorojimo etalonu, gerokai
išplėtodama gilaus mokymosi modelių galimybes apdoroti taškų debesų
duomenis. Jo poveikis akivaizdus tiek teorinės pažangos, tiek praktinio
taikymo požiūriu, o tai rodo, kad jis ir toliau išlieka aktualus ir
pritaikomas besikeičiančioje dirbtinio intelekto ir mašininio mokymosi
srityje.19)
PointNet yra modelis, kuris tiesiogiai apdoroti taškų debesies duomenis
ir atpažinti objektus 3D erdvėje, neatsižvelgiant į kiekvieno taško
eiliškumą. PointNet išgauna taškų savybes ir pagal jas atlieka
klasifikavimą bei segmentavimą. Šis modelis gali susidoroti su taškų
debesų nestruktūrizuotumu ir gali būti naudojamas įvairiose srityse,
pavyzdžiui, autonominio vairavimo, robotikos ir medicininių vaizdų
analizės srityse.
3.3 PointRCNN
PointRCNN yra svarbi sistema 3D objektų aptikimo srityje, ypač tokiose
srityse kaip autonominis vairavimas. Šioje sistemoje naudojamas dviejų
etapų aptikimo procesas, siekiant pagerinti objektų aptikimo 3D taškų
debesies duomenyse tikslumą ir efektyvumą. Pirmasis žingsnis - objektų
pasiūlymų generavimas naudojant taškais pagrįstą vietinį pasiūlymų
tinklą. Šis žingsnis yra nes jis veikia tiesiogiai su neapdorotais taškų
debesies duomenimis ir leidžia išsaugoti išsamią erdvinę informaciją,
kuri gali būti prarasta taikant tradicinius metodus, grindžiamus vaizdo
projekcijomis arba vokselizacija.
Antrajame etape PointRCNN patikslina pradinį pasiūlymą, atlikdamas
3D ribojančio lauko Taip pakoreguojamas dydis ir orientacija, kad jis
geriau atitiktų aptiktus taškų debesies duomenų objektus. Naudojant
požymius, išgautus tiesiogiai iš neapdoroto taškų debesies, PointRCNN
pasiekia didesnį aptikimo tikslumą ypač sudėtingoje aplinkoje su
sudėtinga geometrija ir užtemdymu.
Vienas iš pagrindinių PointRCNN privalumų - mokytis ištisai. Tokia 13- -
architektūra palengvina sklandų tinklo etapų integravimą, todėl
pagerėja ne tik modelio aptikimo našumas, bet ir jo skaičiavimo
efektyvumas, todėl jis tinka realaus laiko taikymams, pavyzdžiui,
reikalingiems autonominio vairavimo sistemoms.
Tyrimai parodė, kad taškų debesų duomenis naudojantys metodai gali
gerokai pagerinti 3D scenų supratimą ir interpretavimą autonominio
vairavimo situacijose. Pavyzdžiui, naudojant PointRCNN pagrįstus kelių
taikinių aptikimo algoritmus ir vokselinių taškų debesų sintezės
metodus, dėl jų universalumo ir
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: A deep
learning solver for steady-state incompressible flows and thermal fields on
multiple sets of irregular geometries (Fizika paremtas PointNet: gilaus
mokymosi sprendiklis, skirtas pastovios būsenos nesuspaustiems srautams
ir šiluminiams laukams keliose netaisyklingos geometrijos rinkiniuose).
Journal of Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Be to, 3D taškų debesų ir gilaus mokymosi metodų apžvalgos kad šios
sistemos tampa vis svarbesnės scenos supratimui autonominio
vairavimo srityje.20)
Apskritai PointRCNN yra reikšminga 3D objektų aptikimo technologijos
pažanga. gebėjimo tiesiogiai neapdorotus taškų duomenis ir efektyvaus
dviejų pakopų aptikimo proceso ji yra galinga priemonė autonominio
vairavimo kurioje greitas ir tikslus objektų yra labai svarbus saugumui
ir našumui.
PointRCNN - tai technologija, kurioje 3D objektų aptikimui naudojamas
"PointNet" pagrindu sukurtas CNN (konvoliucinis neuroninis tinklas) ir
veiksmingai apdorojami taškų debesų duomenys, tiksliai aptikti
objektus. PointRCNN - tai technologija, kuria esamas 2D objektų
aptikimo metodas išplečiamas 3D aplinkai ir taikoma autonominių
transporto priemonių objektų atpažinimui ir robotų aplinkos
atpažinimui.
4. Paraiškos
PointRCNN atlieka svarbų vaidmenį autonominio vairavimo sistemose ir
yra naudojami tiksliai atpažinti ir sekti objektus supančioje aplinkoje.
Objektų naudojant 3D taškų gali padėti transporto priemonėms labai
tiksliai kliūčių kelyje net ir sudėtingose eismo situacijose22).
Robotas naudoja 3D objektų aptikimo technologiją, kad galėtų
sąveikauti su aplinka. PointRCNN leidžia robotui suprasti aplinką ir
atlikti reikiamus veiksmus.24)
Norint sklandžiai įterpti virtualius objektus į realų pasaulį AR aplinkoje,
reikia tiksliai aptikti objektus 3D erdvėje. Šioje užduotyje svarbus
vaidmuo PointRCNN.
Dronai turi gebėti atpažinti ir išvengti įvairių kliūčių skrydžio metu.
PointRCNN gali būti naudojamas objektams aptikti realiuoju laiku pagal
dronų jutiklių duomenis ir nustatyti saugų skrydžio maršrutą.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022).
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion 15- -
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
21) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. ir Li, X. (2021). 3D objektų aptikimas autonominiam
vairavimui: Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X. ir Li, H. (2022). 3D objektų aptikimas
autonominiam vairavimui: International Journal of Computer Vision, 131,
1909-1963.
24) Wang, L., & Huang, Y. (2022). 3D taškų debesų ir giliuoju mokymusi
grindžiamų scenos supratimo metodų apžvalga autonominio vairavimo
srityje. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019).16- -
PointRCNN taikomas 3D miestų aplinkos modeliavimui ir analizei,
suteikiant svarbių įžvalgų miestų planavimui ir valdymui. Tai padėti
pagerinti transporto efektyvumą ir padidinti saugumą miestuose.
Tokiose programose PointRCNN yra labai naudingi tais atvejais, kai
reikia didelio tikslumo ir apdorojimo realiuoju laiku. Tyrimai rodo,
tokie metodai, kaip PointRCNN pagrįsti kelių objektų aptikimo
algoritmai, įrodo savo našumą ir efektyvumą šiose srityse.26) PointRCNN
padeda padidinti 3D objektų aptikimo tikslumą ir efektyvumą, o tai
kuriant autonomines transporto priemones ir kitas pažangias sistemas.
3D erdvinių duomenų apdorojimo technologija daugelyje skirtingų
pramonės šakų. Kai kurios iš pagrindinių taikomųjų programų
4.1 Autonominės transporto priemonės
transporto priemonės - tai transporto priemonės, kurios, naudodamos
pažangias technologijas, vairuoja pačios, be žmogaus įsikišimo. Šios
transporto priemonės naudoja įvairius jutiklius, kameras, radarus,
LiDAR ir kt., kad tiksliai žinotų aplinką. Šios technologijos kartu su
duomenų apdorojimu realiuoju laiku yra labai svarbios nustatant
saugius važiavimo maršrutus.
Ypač svarbi autonominių transporto priemonių sudedamoji dalis yra 3D
objektų aptikimo technologija, kuri atlieka svarbų vaidmenį tiksliai
nustatant ir atpažįstant aplink transporto priemonę esančius objektus.
Pavyzdžiui, PointRCNN naudoja taškų debesų duomenis, kad būtų
galima atlikti didelės skiriamosios gebos transporto priemonės aplinkos
analizę. Tai autonominėms transporto priemonėms realiuoju laiku
atpažinti pėsčiuosius, kitas transporto priemones, kelio ženklus ir kt.,
kad būtų užtikrintas saugus vairavimas27).
Autonominės transporto priemonės taip pat išmokti vairavimo modelių
ir prisitaikyti prie įvairių vairavimo situacijų, taikydamos mašininio
mokymosi ir dirbtinio intelekto technologijas. Šios technologijos gerinti
transporto priemonių saugumą, efektyvumą ir naudotojų patirtį. Visų
pirma kelių jutiklių sintezės technologija pagerina 3D objektų aptikimo
tikslumą ir patikimai veikti įvairiose aplinkose28).17- -
3D objektų aptikimo metodų, skirtų autonominio vairavimo programoms,
apžvalga. IEEE Transactions on Intelligent Transportation Systems, 20, 3782-
3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022).
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022).
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Daugelio jutiklių sintezės
technologija, skirta 3D objektų aptikimui autonominio vairavimo metu:
IEEE Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonominės transporto priemonės pagrindinė ateities transporto
sistemų inovacijų sritis, kurioje susilieja sudėtingi algoritmai ir jutiklių
technologijos. Šios technologijos daro teigiamą poveikį visai
visuomeneines mažina transporto spūstis, eismo įvykių skaičių keliuose
ir leidžia užtikrinti efektyvesnį eismo srautą29).
Autonominės transporto priemonės naudoja LiDAR jutiklius ir 3D
objektų aptikimo technologiją, kad realiuoju laiku pastebėtų ir
analizuotų transporto priemonės aplinką. Tai leidžia išvengti kliūčių,
atpažinti pėsčiuosius, analizuoti sankryžas ir transporto priemonės
saugumas ir vairavimo efektyvumas būtų kuo didesnis.
4.2 Sveikatos priežiūra
3D objektų aptikimo metodai medicinos srityje, ypač tokie kaip
PointRCNN, gali būti plačiai taikomi. Šios technologijos daugiausia
naudojamos medicininių vaizdų gavimo, chirurginės robotikos, pacientų
stebėjimo sistemose ir kt.
3D objektų aptikimo technologija tiksliai aptikti pažeidimus
kompiuterinės tomografijos, magnetinio rezonanso ir ultragarso
vaizduose. Tai ypač svarbu tokiose srityse kaip radiologija, kur ją galima
derinti su kompiuterinės diagnostikos sistemomis, naudojančiomis
dirbtinį intelektą ir mašininį mokymąsi, siekiant pagerinti diagnostikos
tikslumą.30)
Chirurginėse robotinėse sistemose 3D objektų aptikimo technologija
leidžia tiksliai atpažinti aplinkinius audinius ir organus operacijos metu,
taip padėdama užtikrinti saugią ir tikslią operaciją. Kartu su
medicininio dirbtinio intelekto pažanga tai gali labai padidinti
chirurgijos efektyvumą ir saugumą.31)
3D jutikliai ir objektų aptikimo technologija gali analizuoti paciento
judesius ir gyvybinius požymius realiuoju laiku, kad būtų galima anksti
aptikti sutrikimus. Šios technologijos derinamos su dirbtiniu intelektu
pagrįstomis pacientų stebėjimo sistemomis, kad būtų galima nuolat
stebėti ir valdyti paciento būklę.32)19- -
Kartu su virtualia realybe (VR) ji galėtų būti naudojama medicinos
mokymui ir mokymui. 3D objektų aptikimo technologija
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for
Autonomous Driving Applications (3D objektų aptikimo metodų apžvalga
autonominio vairavimo programoms). IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). AAPM darbo grupės 273 ataskaita:
Rekomendacijos dėl geriausios dirbtinio intelekto ir mašininio mokymosi
praktikos kompiuterinės diagnostikos medicininių vaizdų srityje. Medicinos
fizika.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial
intelligence in healthcare: a mastery. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support
systems on nursing workflows in critical care units (Dirbtinio intelekto
sprendimų paramos sistemų poveikis slaugos darbo eigai intensyviosios
terapijos skyriuose). International nursing review, Nėra.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y. ir Yuan, X. (2023).
Dirbtinis intelektas onkologijos klinikinių sprendimų paramos sistemose.
International Journal of Medical Sciences, 20, 79-86.20- -
atlieka svarbų vaidmenį padėdamas gydytojams ir sveikatos priežiūros
specialistams imituoti operacijas ir diagnozes, todėl galima mokytis
tikroviškoje aplinkoje.33)
Šios taikomosios programos padeda didinti diagnozavimo ir gydymo
tikslumą medicinos srityje ir gerinti bendrą saugumą. Ypač 3D objektų
aptikimo technologija kartu su dirbtiniu intelektu spartina inovacijas
sveikatos priežiūros srityje tampa svarbia priemone pacientų sveikatai ir
saugai gerinti. Šie tyrimai suteikia naujų perspektyvų dėl medicininio
dirbtinio intelekto komercinio, reguliavimo ir visuomeninio poveikio.34)
Medicinos srityje 3D erdvinių duomenų apdorojimas tiksliam
diagnozavimui ir chirurginiam planavimui. 3D medicininių vaizdų,
pavyzdžiui, kompiuterinės tomografijos ar magnetinio rezonanso
tyrimų rezultatų, taškų debesų duomenys naudojami siekiant
vizualizuoti operacijos vietą ir išmatuoti tikslią jos vietą bei dydį, kad
chirurgija būtų tikslesnė.
4.3 Pramonės automatizavimas ir robotika
3D objektų aptikimo technologijos, ypač tokie modeliai kaip PointRCNN,
iš esmės keičia pramonės automatizavimo ir robotikos sritį. Šios
technologijos gerokai padidina efektyvumą ir tikslumą įvairiose
pramonės šakose ir atlieka svarbų vaidmenį šiose konkrečiose srityse
3D objektų aptikimo technologija yra labai svarbi robotų sistemoms, kad
jos galėtų atpažinti ir rūšiuoti objektus sandėlyje. Ji leidžia robotams
tiksliai atpažinti įvairių dydžių ir formų objektus, todėl jie gali efektyviai
atlikti judėjimo ir rūšiavimo užduotis. Šios technologijos didina
pramoninių procesų efektyvumą ir palengvina logistikos sistemų
automatizavimą.35)
Kai pramoniniai robotai automatiškai surenka dalis, 3D objektų
aptikimas padidina surinkimo efektyvumą, nes atpažįsta tikslią dalių
padėtį ir orientaciją. Tai labai padeda didinti gamybos spartą ir mažinti
defektų skaičių, todėl svarbų vaidmenį išmaniosios gamybos aplinkoje.36)
Jie naudojami gaminių geometrijai ir matmenims tikrinti naudojant 3D
skenavimo technologiją ir svarbų vaidmenį užtikrinant gaminių kokybę, 21- -
anksti nustatant defektus ir mažinant sąnaudas. Šios automatizuotos
dalys
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. ir Li, Y. (2020). Artificial
Intelligence- Based Prediction of Lung Cancer Risk Using Nonimaging
Electronic Medical Records: Deep Learning Approach (Dirbtiniu intelektu
grindžiamas plaučių vėžio rizikos prognozavimas naudojant nevaizdinius
elektroninius medicininius įrašus: gilaus mokymosi metodas). Journal of
Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial
intelligence in healthcare: a mastery. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P. ir
White, M. (2021). Sim2Real in Robotics and Automation: Applications and
Challenges (Sim2Real robotų ir automatikos srityje: taikymas ir iššūkiai).
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. ir Kim, H. (2021).
Mokymusi pagrįstas robotų surinkimo automatizavimas išmaniosios
gamybos tikslais. IEEE leidinys, 109, 423-440.22- -
Kokybės tikrinimo sistemos didina produktų patikimumą.37)
Siekiant padidinti robotų ir automatizavimo sistemų saugumą,
naudojama 3D objektų aptikimo technologija. Tai leidžia atpažinti
netoliese esančius ar saugiai Šie saugos mechanizmai padeda sumažinti
nelaimingų atsitikimų skaičių pramoninėje aplinkoje.38)
Autonominėms transporto priemonėms arba dronams labai svarbu
aptikti objektus ir planuoti savo maršrutus. 3D objektų aptikimo
technologija šioms sistemoms efektyviai veikti, išvengti kliūčių ir
saugiai atlikti pristatymo užduotis.39)
Šiose srityse 3D objektų aptikimo technologijos inovacijas pramonės
automatizavimo srityje, padeda didinti našumą, mažinti išlaidas ir
gerinti saugą. Ateityje šios technologijos ir toliau bus neatsiejama
robotikos ir automatizavimo sistemų raidos dalis. Tyrimai rodo, kad šių
technologijų taikymas labai prisideda prie pramonės procesų
efektyvumo didinimo automatizuotų sistemų sudėtingumo valdymo40).
Pramonės automatizavimo ir robotikos srityje 3D erdvinių duomenų
apdorojimas naudojamas siekiant padidinti gamybos procesų
efektyvumą ir automatizuoti kokybės patikrinimus. Robotai naudoja
LiDAR jutiklius arba 3D kameras, atpažintų gaminius, aptiktų
anomalijas ir padėtų spręsti kokybės problemas.
4.4 Saugos stebėjimo sistemos
Saugos stebėjimo sistemose 3D objektų aptikimo technologija svarbų
vaidmenį užtikrinant veiksmingus stebėjimo ir saugumo sprendimus
įvairiose aplinkose. Ši technologija ypač tokiose srityse kaip stebėjimas
realiuoju laiku, įsilaužimo aptikimas, incidentų prevencija, duomenų
analizė ir ataskaitų teikimas bei dirbtinio intelekto integravimas.
3D objektų aptikimo sistemose, turinčiose stebėjimo realiuoju laiku
galimybes, naudojamos kameros ir jutikliai, kad būtų galima realiuoju
laiku analizuoti supančią aplinką. Ši analizė realiuoju laiku leidžia
tiksliai atpažinti žmones, transporto priemones ir objektus, o susidarius
pavojingai situacijai nedelsiant įspėti. Tai labai svarbu didinant
saugumą, ypač sudėtingoje aplinkoje, pavyzdžiui, keliuose ir oro 23- -
uostuose.
Kai kalbama apie įsilaužimo aptikimą, 3D objektų aptikimo technologija
veiksmingai aptinka neįprastą judėjimą ar elgesį tam tikroje saugumo
zonoje. Tai gali padėti anksti aptikti įsibrovėlį ir suteikti apsaugos
darbuotojams neatidėliotiną pagalbą.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Pramonės
automatizavimas ir gaminių kokybė: robotų gamybos transformacijos
vaidmuo. Taikomoji ekonomika.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing
Dynamic and Collaborative Automation and Robotics Software Systems.
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotika: nuo automatizavimo iki išmaniųjų sistemų.
Inžinerija.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Pramoninis matymas ir automatizavimas. Measurement Science and
Technology, 33.24- -
Užkirskite kelią neteisėtam patekimui į saugias zonas, pateikdami
raudonus įspėjimus.
Kalbant apie nelaimingų atsitikimų prevenciją, šios sistemos padeda
išvengti nelaimingų atsitikimų įvairiose aplinkose, įskaitant pramonės
objektus, anksti aptikdamos pavojus ir pateikdamos įspėjimus.
Pavyzdžiui, automatinė įspėjimo sistema suveikti, kai darbuotojas
priartėja prie pavojingos zonos, kad būtų išvengta nelaimingo atsitikimo.
Duomenų analizės ir ataskaitų rengimo galimybės padeda įvertinti
saugumo padėtį ir nustatyti problemas atliekant tolesnę analizę,
naudojant surinktus 3D duomenis. Ši analizė suteikia svarbių įžvalgų
būsimai saugumo strategijai ir nuolat tobulinti saugumą.
Integravus dirbtinį intelektą, 3D objektų aptikimo technologiją galima
sujungti su mašininio mokymosi algoritmais ir sukurti pažangesnę
stebėjimo sistemą. Tai sistemai išmokti modelius ir įdiegti
sudėtingesnius įspėjimo ir reagavimo mechanizmus.
Tokiu būdu 3D objektų aptikimo technologija tampa neatsiejama saugos
stebėjimo sistemų dalimi, padedančia tenkinti įvairius saugumo
poreikius ir didinančia objektų saugumą. Tikimasi, kad ateityje šios
technologijos toliau tobulės, todėl bus kuriami sudėtingesni ir
veiksmingesni saugos stebėjimo sprendimai. Ši technologinė pažanga
virs galingesnėmis saugumo sistemomisypač integruojant jas su
dirbtiniu intelektu41).
3D objektų aptikimo technologija taip pat svarbų vaidmenį saugos
stebėjimo sistemose. LiDAR jutikliai ir 3D objektų aptikimo technologija
naudojami siekiant aptikti įsibrovėlius arba nustatyti, ar netoliese yra
žmonių. Jos taip pat analizuoti elgesio modelius 3D erdvėje, kad būtų
galima sekti neteisėtą veiklą ir užkirsti jai kelią.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. ir Cao, E. (2023).
Infraraudonųjų spindulių mažų taikinių aptikimo metodas, pagrįstas
svertiniu žmogaus vizualinio palyginimo mechanizmu, skirtas saugos
stebėsenai. Remote. Sens., 15, 2922.26- -
4.5 VR/AR
Virtualioje realybėje (VR) ir papildytoje realybėje (AR) 3D objektų
aptikimo technologija labai pagerina naudotojų patirtį įvairiose
pramonės šakose. 3D objektų aptikimas leidžia naudotojams virtualioje
aplinkoje sąveikauti su realaus pasaulio objektais, o tai labai svarbu AR
taikomosioms programoms, kad jos galėtų realiuoju laiku atpažinti
aplinką ir tiksliai išdėstyti virtualius elementus bei jais manipuliuoti.
Dėl to naudotojo patirtis tampa labiau įtraukianti.
VR aplinkoje 3D objektų aptikimas naudojamas tikroviškiems
modeliams kurti. Taip galima kurti įvairių sričių, įskaitant medicinos, ir
aviacijos, mokymų scenarijus, dalyviams saugiai patirti ir praktiškai
išbandyti realias situacijas. VR/AR taikymas, ypač statybų saugos srityje,
didina darbuotojų sąmoningumą saugos srityje42).
Žaidimų pramonėje 3D objektų aptikimas užtikrina patirtį, nes tiksliai
seka žaidėjo judėjimą ir padėtį. Tai leidžia sąveikauti su virtualiais
veikėjais ir padidina žaidimo tikroviškumą.
Architektūroje ir inžinerijoje AR technologija gali būti naudojama
dizaino modeliams vizualizuoti realiame pasaulyje. Tai padėti iš anksto
aptikti projektavimo proceso klaidas ir palengvinti bendravimą su
klientais. Šios taikomosios programos gali būti ypač naudingos statybos
saugos srityje43).
AR technologija padeda vartotojams priimti pirkimo sprendimus, nes
leidžia virtualiai išbandyti produktus. Pavyzdžiui, jie gali iš anksto
pasimatuoti baldus savo namuose arba išbandyti kosmetikos spalvas.
Tai pagerina vartotojo pirkimo patirtį ir sąveiką.44)
Tokiu būdu 3D objektų aptikimo technologija suteikia naujoviškų VR ir
AR patirčių ir yra naudojama įvairiose pramonės šakose. Ateityje šios
technologijos ir toliau tobulės, todėl ir virtualios aplinkos sąveika taps
dar sklandesnė ir natūralesnė. Tai labiau išplės VR ir AR technologijų
naudojimą švietimo, pramogų, prekybos ir kitose srityse. Kartu šių
technologijų pažanga naujų galimybių turizmo ir svetingumo sektoriuose45).27- -
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė virtualios
ir papildytosios realybės (VR/AR) taikymo statybų saugos srityje apžvalga.
Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė virtualios
ir papildytosios realybės (VR/AR) taikymo statybų saugos srityje apžvalga.
Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
"Virtualios realybės (VR) ir papildytosios realybės (AR) vaizdo reklamų
įtikinimo poveikis: konceptuali apžvalga" (The persuasion effects of virtual
reality (VR) and augmented reality (AR) video advertisements: A conceptual
review). Journal of Business Research.
45) Wei, W. (2019). Virtualiosios realybės (VR) ir papildytosios realybės (AR)
turizmo ir svetingumo srityje mokslinių tyrimų pažanga. Journal of
Hospitality and Tourism Technology, 10, 539-570.28- -
Virtualioje realybėje (VR) ir papildytoje realybėje (AR) 3D erdviniai
duomenys atlieka svarbų vaidmenį sąveikaujant realaus pasaulio
objektais. 3D erdviniai duomenys virtualius objektus tinkamai
patalpinti realiame pasaulyje ir naudotojams natūraliai su jais
sąveikauti.
5. Išvada
3D erdvinių duomenų apdorojimo technologija daro daugelyje sričių,
įskaitant autonominį vairavimą, sveikatos priežiūrą, pramonę, saugą ir
VR/AR. Visų pirma LiDAR jutikliai ir 3D objektų aptikimo technologijos
vaidina svarbų vaidmenį kiekvienoje iš šių sričiųprisidėdamos prie
aplinkos analizės realiuoju laiku, tikslios diagnostikos ir gydymo bei
veiksmingų automatizavimo sistemų. Šios technologijos toliau tobulės
ir užtikrins turtingesnę naudotojų patirtį įvairiose srityse.29- -
Nuorodos
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Lidar Point Cloud Compression, Processing and Learning for
Autonomous Driving (Lidar taškų debesų suspaudimas, apdorojimas ir
mokymasis autonominiam vairavimui). IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for
Autonomous Driving Applications (3D objektų aptikimo metodų
apžvalga autonominio vairavimo programoms). IEEE Transactions on
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X. ir Wang, C. (2022). 3D duomenų
skaičiavimas ir vizualizavimas. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Dirbtinis intelektas medicinoje. New England
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Pramonės procesų tobulinimas
taikant automatizavimą ir robotiką. Machines.
6. Cao, M. ir Wang, J. (2020). Autonominio vairavimo transporto
priemonių kliūčių aptikimas naudojant kelių LiDAR jutiklių sintezę.
Journal of Dynamic Systems Measurement and Control - Transactions
of the ASME, 142.
7. Chen, W., Li, P. ir Zhao, H. (2022). MSL3D: 3D objektų aptikimas iš
monokulinio, stereo ir taškinio debesies autonominiam vairavimui.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. ir Cao, E. (2023).
Infraraudonųjų spindulių mažų taikinių aptikimo metodas, pagrįstas
svertiniu žmogaus vizualinio palyginimo mechanizmu, skirtas saugos
stebėsenai. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Naujos regioninės stratigrafinės įžvalgos, gautos iš
Nasia subbaseino (Gana) 3D geologinio modelio, sukurto
hidrogeologiniais tikslais ir pakartotinai apdorotais B lauko
duomenimis, kurie iš pradžių buvo surinkti mineralų žvalgybos tikslais.
Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotizuotų procesų automatizavimas: mokslinis ir 30- -
pramoninis sisteminis kartografinis tyrimas. IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. ir Zhang, Z. (2023). Super
Sparse 3D Objektų aptikimas. IEEE Transactions on Pattern Analysis and
Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Taškų debesimis pagrįsti 3D objektų aptikimo ir klasifikavimo
metodai savivaldžio vairavimo programoms: apžvalga ir taksonomija.
Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019).
Gilus31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43,
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi,
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H.,
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R.
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM darbo grupės 273 ataskaita:
Rekomendacijos dėl geriausios dirbtinio intelekto ir mašininio
mokymosi praktikos, skirtos kompiuterinei diagnostikai medicininių
vaizdų srityje. Medicinos fizika.
15. Huang, S. (2019). Papildyta realybė ir virtualioji realybė: AR ir VR
galia verslui. Informacinės technologijos ir turizmas, 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. ir Kim, H.
(2021).
Mokymusi pagrįstas robotų surinkimo automatizavimas išmaniosios
gamybos tikslais. IEEE leidinys, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). "Virtualios realybės (VR) ir papildytosios realybės (AR) vaizdo
reklamų įtikinimo poveikis: konceptuali apžvalga" (The persuasion
effects of virtual reality (VR) and augmented reality (AR) video
advertisements: A conceptual review). Journal of Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. ir Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval (Triplanar konvoliucija su bendrais 2D branduoliais 3D
klasifikavimui ir formos paieškai). Computer Vision and Image
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M. ir Yoo, J. (2022). Įtraukiančios
interaktyvios technologijos ir virtuali apsipirkimo patirtis: Vartotojų
suvokimo skirtumai tarp papildytosios realybės (AR) ir virtualiosios
realybės (VR). Telematika ir informatika, 77, 101936.
20. Kusiak, A. 2023). Hyper-automation in manufacturing industry. J.
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritinė
virtualios ir papildytosios realybės (VR/AR) taikymo statybų saugos
srityje . Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. ir Chen, Y. (2022).
Dinaminis daugiatikslio aptikimo algoritmas Voxel Point Cloud Fusion
Based on PointRCNN. IEEE Transactions on Intelligent Transportation 32- -
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X. ir Li, H. (2022). 3D objektų aptikimas
autonominiam vairavimui: International Journal of Computer Vision,
131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Pramoninis matymas ir automatizavimas. Measurement Science and
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial
intelligence in healthcare: a mastery. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). Robotika: nuo automatizavimo iki išmaniųjų sistemų.
Inžinerija.
27. Ren, S., Pan, X., Zhao, W., Nie, B. ir Han, B.
(2022).33- -
3D objektų aptikimo transformatorius. Žiniomis pagrįstos sistemos, 259,
110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: giliuoju
mokymusi pagrįstas 3D objektų aptikimas naudojant semantinį taškų
debesį. Visual Computer, , 1-15.
29. Wei, W. (2019). Virtualiosios realybės (VR) ir papildytosios realybės
(AR) turizmo ir svetingumo srityje mokslinių tyrimų pažanga. Journal of
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M. ir Cheng, K. (2024). A Novel Method for
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. ir Li, Y. (2020).
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records: Deep Learning Approach
(Dirbtiniu intelektu pagrįsta plaučių vėžio rizikos prognozė naudojant
nevaizdinius elektroninius medicininius įrašus: gilaus mokymosi
metodas). Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Kompiuterizuotas aptikimas ir diagnozavimas /
radiologija / mašininis mokymasis / gilusis mokymasis medicininių
vaizdų srityje. Medicinos fizika.
세미나 자료
- 3D erdvinių duomenų apdorojimo technologija ir jos taikymas 2025.01.16
- Pētījuma ziņojums: 3D telpisko datu apstrādes tehnoloģija un tās pielietojums 2025.01.16
- Forskningsrapport: 3D-teknologi for romlig databehandling og dens bruksområder 2025.01.16
- Onderzoeksrapport: 3D verwerking van ruimtelijke gegevens en toepassingen 2025.01.16
- Raport z badań: Technologia przetwarzania danych przestrzennych 3D i jej zastosowania 2025.01.16
- Tecnologia de processamento de dados espaciais 3D e suas aplicações 2025.01.16
- echnologie de traitement des donnéesspatiales en 3D et ses applications Institut de recherche en IA ducomté de 2025.01.14
3D erdvinių duomenų apdorojimo technologija ir jos taikymas
Pētījuma ziņojums: 3D telpisko datu apstrādes tehnoloģija
un tās pielietojums AI Research Institute 2025_01Youngho Hong
Kopsavilkumi:
Šis pētījums aptver 3D telpisko datu apstrādes tehnoloģiju izstrādi un
pielietojumu, jo īpaši punktu mākoņa datu iegūšanas un 3D objektu
noteikšanas tehnoloģijas, izmantojot LiDAR sensorus. Tajā galvenā
uzmanība pievērsta 3D objektu noteikšanas tehnoloģijām VoxelNet,
PointNet un PointRCNN un izskaidrots, kā šīs tehnoloģijas tiek
izmantotas dažādās jomās, piemēram, autonomo transportlīdzekļu,
veselības aprūpes, rūpnieciskās automatizācijas, drošības
uzraudzības sistēmu un VR/AR jomā. Ar LiDAR sensoru savāktie
punktu mākoņa dati ar augstu precizitāti analizē 3D telpu, un uz tiem
balstītai 3D objektu noteikšanas tehnoloģijai svarīga nozīme
reāllaika vides apzināšanā, precīzā diagnostikā, ražošanas procesu
optimizācijā utt. Šajā pētījumā analizēta 3D telpisko datu apstrādes
tehnoloģijas ietekme uz mūsdienu rūpniecību un tehnoloģiskajām
inovācijām, kā arī aplūkots nākotnes attīstības potenciāls.
Atslēgas vārdi:
3D telpiskie dati, LiDAR sensori, punktu mākoņi, 3D
objektu noteikšana, VoxelNet, PointNet, PointRCNN, autonomi
transportlīdzekļi, veselības aprūpe, rūpnieciskā automatizācija,
drošības uzraudzības sistēmas, VR/AR, dziļā mācīšanās2- -
1. Ievads
Tā ietver datu vākšanas, glabāšanas, analīzes un vizualizācijas
procesu, un trīsdimensiju telpiskās informācijas apstrādei izmanto
tādas tehnoloģijas kā LiDAR, fotogrammetrija un 3D skenēšana. Šīs
tehnoloģijas tiek izmantotas dažādās programmatūras platformās, no
kurām galvenie rīki ģeogrāfiskās informācijas sistēmas (GIS) un
datorizētā projektēšana (CAD). Tas veikt sarežģītu telpisko analīzi.
LiDAR izmanto lāzera impulsus, lai apkopotu attāluma datus,
savukārt fotogrammetrija izmanto aerofotogrāfijas, lai izveidotu 3D
modeļus. Šie dati tiek glabāti datu bāzē un pēc vajadzības izmantoti
analīzei un vizualizācijai.1)
Pētījumi liecina, ka 3D CNN struktūras var izmantot, lai apgūtu 3D
reprezentācijas, un ka to var izdarīt efektīvāk nekā ar tradicionālajām
pilnībā 3D CNN balstītajām metodēm.2)
Uz GPU balstītas 3D vizualizācijas metodes ļauj veikt sarežģītāku un
precīzāku telpisko norobežošanu.3)
3D modelēšana tiek izmantota kā būtisks instruments arhitektūras
projektēšanas un simulācijas procesā. Tas ļauj konstrukciju drošību
un palielināt projektu precizitāti.
3D telpiskie dati tiek izmantoti ekosistēmu pārmaiņu un katastrofu
pārvaldības pētījumos. Piemēram, 3D ģeoloģisko modelēšanu
izmanto gruntsūdeņu izpētē un ģeoloģiskajos pētījumos.4)
3D dati tiek izmantoti, lai izstrādātu aizraujošas vides, kas uzlabo
lietotāja pieredzi. Tas izmantots dažādās nozarēs, tostarp izglītībā,
veselības aprūpē un izklaidē.
3D telpisko datu apstrādes tehnoloģijas strauji attīstās dažādās jomās,
jo īpaši punktu mākoņu datu iegūšanā un objektu noteikšanā 3D
telpā, izmantojot LiDAR sensorus. Šīs tehnoloģijas revolūciju
autonomo transportlīdzekļu, medicīnas lietojumu, rūpnieciskās 3- -
automatizācijas, drošības uzraudzības sistēmu un VR/AR vides jomā.
Šajā pētījuma ziņojumā sniegta pamatizpratne par 3D telpisko datu
apstrādes tehnoloģijām un izskaidrots, kā tās tiek izmantotas dažādās
nozarēs.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana un
vizualizācija. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplānu konvolūcija ar koplietojamiem 2D kodoliem 3D klasifikācijai un
formas iegūšanai. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Novel Method for Regional
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia apakšbaseina (Gana)
3D ģeoloģiskā modeļa, kas izstrādāts hidroģeoloģiskiem mērķiem un balstīts
uz pārstrādātiem B lauku datiem, kuri sākotnēji iegūti minerālu izpētes
vajadzībām. Solid Earth, 11, 349-361.4- -
2. Point CLoud datu vākšana ar LiDAR sensoriem
Punktu mākoņu datu iegūšanai, izmantojot LiDAR sensorus, ir
svarīga nozīme dažādos lietojumos, un tā ir īpaši piemērota augstas
izšķirtspējas 3D datu iegūšanai. LiDAR tehnoloģija izstaro lāzera
impulsus, lai saņemtu no objektiem atstarotos signālus un,
pamatojoties uz tiem, aprēķinātu attāluma informāciju. Šī
informācija tiek saglabāta punktu mākoņa formātā, kur katrs punkts
satur X, Y un Z koordinātas un atstarošanas intensitāti.
LiDAR punktu mākoņus var izmantot dažādās jomās, tostarp , vides
un resursu pārvaldībā. Piemēram, tie var būt noderīgi mežu
strukturālajā analīzē vai ēku precīzā uzmērīšanā. Pēc tam punktu
mākoņus pārveido 3D vai GIS datos, veicot to pēcapstrādi, lai veiktu
denozēšanu, izlīdzināšanu un virsmas rekonstrukciju. Šajā procesā
izmanto dažādas programmatūras, jo īpaši uz GPU balstītas 3D
vizualizācijas metodes, kas ļauj veikt sarežģītāku telpisko
norobežošanu.5)
LiDAR datiem ir svarīga nozīme arī autonomo transportlīdzekļu
uztveres sistēmās. LiDAR punktu mākoņu apstrāde un apmācība
autonomās braukšanas jomā ir veicinājusi precīzu ceļa vides uztveri
un objektu noteikšanu.6) Šie dati ir būtiski, lai konstruētu augstas
izšķirtspējas reāllaika 3D kartes, kas autonomajiem
transportlīdzekļiem droši orientēties sarežģītos ceļa apstākļos.
LiDAR punktu var arī Piemēram, datus, kas iegūti, izmantojot LiDAR,
var izmantot, lai rekonstruētu ģeoloģisko veidojumu 3D modeļus, kas
veicina gruntsūdeņu izpēti vai ģeoloģiskos pētījumus.7) Šī 3D
ģeoloģiskā modelēšana ļauj veikt jaunas ģeoloģiskās interpretācijas
un palīdz labāk izprast teritorijas ģeoloģiskās īpašības.
LiDAR tehnoloģijas priekšrocības ir liela datu iegūšanas ātrums un
augsta precizitāte, taču tai ir arī ierobežojumi, salīdzinoši augstas
izmaksas un veiktspēja lietainā vai laikā. Lai pārvarētu šos tehniskos
ierobežojumus, tiek veikti nepārtraukti pētījumi un izstrādes darbi,
kas LiDAR izmantot plašākā nozaru klāstā.5- -
LiDAR (Light Detection and Ranging) sensors ir tehnoloģija, kas
izmanto lāzeru, lai izmērītu objekta virsmu, un iegūtos datus var
izmantot, lai iegūtu 3D telpisko informāciju. LiDAR sensora ģenerētie
punktu mākoņa dati ir daudzu 3D telpā izvietotu punktu kopums, no
kuriem katru var aprakstīt ar augstumu, attālumu un atrašanās vietu.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana un
vizualizācija. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Lidar punktu mākoņu saspiešana, apstrāde un mācīšanās autonomai
braukšanai. IEEE Transactions on Intelligent Transportation Systems, 24,
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia apakšbaseina (Gana)
3D ģeoloģiskā modeļa, kas izstrādāts hidroģeoloģiskiem mērķiem un balstīts
uz pārstrādātiem B lauka datiem, kuri sākotnēji iegūti minerālu izpētes
vajadzībām. Solid Earth, 11, 349-361.6- -
sijas. Šiem datiem ir būtiska nozīme autonomo transportlīdzekļu
apkārtējās vides uztverē, modelēšanā arhitektūrā un
inženierbūvniecībā, kā arī 3D kartēšanā.
3. 3D objektu noteikšanas tehnoloģija
3D objektu noteikšana ir svarīga tehnoloģija objektu atpazīšanai un
atrašanās vietas noteikšanai 3D telpā, un tā būtiska dažādās jomās,
tostarp autonomo transportlīdzekļu, un paplašinātās realitātes jomā.
Tās pamatā galvenokārt 3D dati, kas iegūti, izmantojot LiDAR, RGB-D
kameras un stereovīzijas sistēmas.
Lai atpazītu objektu atrašanās vietu un formu, tā izmanto LiDAR
ģenerētus punktu mākoņus. Šajā jomā tiek plaši izmantoti tādi dziļās
mācīšanās modeļi kā PointNet, un šīs metodes ir būtiskas, lai
ģenerētu augstas izšķirtspējas reāllaika 3D kartes.8)
Tā ir metode objektu noteikšanai, apvienojot 2D attēlus, kas iegūti ar
RGB kamerām, ar 3D informāciju. Šī metode uzlabo atklāšanas
veiktspēju, pievienojot objekta krāsu un rakstu informāciju.
Jaunākajos pētījumos ir ierosinātas tādas metodes kā FusionRCNN,
kas apvieno LiDAR un kameras attēlus, lai uzlabotu noteikšanas
precizitāti.9)
Lai un atpazītu 3D iezīmes, tiek izmantotas dziļās struktūras,
piemēram, konvolūcijas neironu tīkli (CNN) un rekurentie neironu
tīkli (RNN). Šie modeļi uzlabo objektu klasifikācijas un atrašanās
vietas noteikšanas precizitāti, pamatojoties uz datu kopām, kas īpaši
svarīgi šķēršļu atpazīšanai autonomos transportlīdzekļos.10)
To izmanto, lai uzlabotu braukšanas drošību, uz ceļa pamanot
šķēršļus un gājējus. Šajā jomā veikti aktīvi pētījumi, lai apvienotu
LiDAR punktu mākoņus ar redzes datiem precīzākai noteikšanai.11)
Tas palīdz robotam saprast un mijiedarboties ar apkārtējo vidi. Tas
īpaši svarīgi, lai noteiktu precīzu objektu atrašanās vietu un palīdzētu
robotam plānot savu ceļu un veikt uzdevumus.7- -
Atpazīt un reaģēt uz objektiem reālajā laikā, lai uzlabotu lietotāja
pieredzi. Piemēram, paplašinātajā realitātē precīzi jānosaka objektu
atrašanās vieta un forma, lai uzlabotu mijiedarbību ar virtuālajiem
objektiem.
8) Qian, R., Lai, X., & Li, X. (2021). 3D objektu noteikšana autonomai
braukšanai: Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR un kameras apvienošana divpakāpju 3D objektu
noteikšanai. Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. un Zhang, Z. (2023). Īpaši blīva 3D
objektu noteikšana. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR un kameras apvienošana divpakāpju 3D objektu
noteikšanai. Remote Sensing, 15, 1839.8- -
Šīs tehnoloģijas nepārtraukti attīstās nodrošinot precīzākus un
efektīvākus 3D objektu noteikšanas risinājumus. Pētniecības un
tehnoloģiju attīstība ievērojami uzlabo atpazīšanas precizitāti reālās
vides apstākļos.
3D objektu noteikšana ir konkrētu objektu precīza identificēšana un
klasificēšana 3D telpāko nodrošina dažādas 3D telpisko datu
apstrādes metodes. Pēdējā laikā 3D objektu noteikšanai aktīvi
izmantotas uz dziļo mācīšanos balstītas metodes. tehnoloģijām
VoxelNet, PointNet un PointRCNN.
3.1 VoxeLNet
VoxelNet ir inovatīva dziļās mācīšanās arhitektūra, kas īpaši
izstrādāta 3D objektu noteikšanai, izmantojot punktu mākoņus, kas ir
ļoti svarīgi autonomās braukšanas sistēmās. Arhitektūra izmanto
unikālu pieeju, pārvēršot neapstrādātus punktu mākoņa datus
strukturētā 3D vokseļu režģī, lai nodrošinātu efektīvu apstrādi un
pazīmju iegūšanu. Konvertēšana uz vokselu attēlojumu ir jo tā ļauj
VoxelNet efektīvi izmantot 3D konvolūciju, lai iegūtu telpisko
informāciju, vienlaikus nodrošinot skaitļošanas efektivitāti. Šī
efektivitāte ir būtiska reāllaika lietojumiem, kas nepieciešami
autonomai braukšanai.
VoxelNet stiprā puse ir tā spēja iekļaut jaunu iezīmju kodēšanas slāni,
kas ievērojami palielina katra vokseļa reprezentatīvo spēju. Tas tiek
panākts, ņemot vērā katrā vokselī esošo punktu unikālās īpašības,
kas uzlabo tīkla spēju atklāt un klasificēt objektus sarežģītā vidē.12)
Šis pazīmju kodēšanas posms ir lai risinātu problēmas, ko rada
punktu mākoņa datu neregularitāte un retums, ko ir grūti apstrādāt,
izmantojot tradicionālos 2D konvolūcijas neironu tīklus.
Pētījumi liecina, ka VoxelNet ir devis ievērojamu ieguldījumu 3D
objektu noteikšanas jomā. Piemēram, tā arhitektūras spēja
nodrošināt augstu precizitāti, vienlaikus saglabājot skaitļošanas
efektivitāti, padara to par vēlamo izvēli savstarpējās implementācijas 9- -
lietojumiem autonomajos transportlīdzekļos.13) Turklāt VoxelNet
retās reprezentācijas integrācija ļauj tam efektīvi apstrādāt lielus
datu apjomus, kas parasti sastopami autonomās braukšanas
scenārijos.
VoxelNet izveide ir nozīmīgs sasniegums 3D datu apstrādē un pamatu
nākotnes inovācijām autonomās braukšanas tehnoloģiju jomā. Tā
risina galvenos uzdevumus šajā jomā, apvienojot efektīvu
vokselizāciju ar progresīvām pazīmju kodēšanas metodēm.14) Tas ne
tikai uzlabo noteikšanas precizitāti, bet arī ļauj veikt sarežģītākas
izpildes
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep
Learning for 3D Point Clouds: A Survey. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Adversarial
point cloud perturbations against 3D object detection in autonomous
driving systems. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D objektu noteikšana no
monokulārā, stereo un punktu mākoņa autonomai braukšanai.
Neurocomputing, 494, 23-32.10- -
VoxelNet paplašina 3D uztveres sistēmu izstrādes robežas. Pateicoties
jaudīgajai veiktspējai un novatoriskajai pieejai, VoxelNet turpina
notiekošos pētījumus un attīstību 3D punktu mākoņu apstrādes un
autonomo sistēmu jomā.15)
VoxelNet ir inovatīvs 3D objektu noteikšanas modelis, kas apstrādā
punktu mākoņa datus, pārveidojot tos 3D režģos (vokselos). Katrs
vokselis ir punkts punktu mākonī, kas ļauj modelim efektīvāk
telpisko informāciju. VoxelNet izmanto šo vokseļu informāciju,
noteiktu objektus un veiktu prognozes. pieejas priekšrocība ir tā, ka
tā ir efektīva un ātra, lai apstrādātu lielu daudzumu punktu mākoņa
datu.
3.2 PointNet
PointNet ir revolucionāra dziļās mācīšanās arhitektūra, kas radikāli
maina 3D punktu mākoņu datu apstrādi, tieši izmantojot
nesakārtotas punktu kopas. Atšķirībā no tradicionālajām metodēm,
kas prasa strukturētus ievades datus, PointNet izmanto simetrijas
funkcijas, lai nodrošinātu permutācijas invarianci, telpiskās
attiecības starp punktiem, lai būtuneatkarīgi no ievades punktu
PointNet galvenais jauninājums ir perceptronu (MLPun maksimālās
apvienošanas izmantošana. Šī arhitektūra efektīvi apvieno atsevišķu
punktu iezīmes globālā attēlojumā, kas ir īpaši noderīgs tādiem
uzdevumiem kā klasifikācija un segmentācija. Pateicoties tās spējai
un precīzi lielus punktu , ir pamatmodeli šajā jomā, un tas ir
iedvesmojis daudzas turpmākas uz tā principiem balstītas
arhitektūras.
PointNet ietekme sniedzas tālāk par akadēmiskajiem pētījumiem un
praktiski tiek īstenota tādās jomās kā autonoma braukšana un robotu
atpazīšana. Piemēram, autonomās sistēmās PointNet ir izmantots
LiDAR datu apstrādei, lai uzlabotu objektu noteikšanu un navigāciju,
identificējot un klasificējot objektus no viena izmēģinājuma uz
nākamo.16) PointNet konstrukcija ļauj tam efektīvi apstrādāt
sarežģījumus, kas saistīti ar 3D datiem, piemēram, oklūzijas un 11- -
punktu blīvuma variācijas, padarot to par daudzpusīgu rīku
datorredzes lietojumos.
PointNet sasniegumi ir veicinājuši PointNet pielāgošanu dažādos
inovatīvos kontekstos. Piemēram, tas ir izmantots, lai klasificētu
lidaparāta LiDAR datus, uzlabojot attālās izpētes precizitāti un
efektivitāti.17) PointNet pielāgošanās spēja ir arī ļāvusi to integrēt ar
fizikas neironu tīkliem, lai analizētu plaisu izplatīšanos.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Vairāku skatu
semantiskās mācīšanās tīkls uz punktu mākoņa balstītai 3D objektu
noteikšanai. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019). Deep
Learning for 3D Point Clouds: A Survey. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR punktu mākoņu
klasifikācija, izmantojot PointNet++ tīklu ar pilnas apkārtnes pazīmēm.
PLOS ONE, 18.12- -
un šķidrumu dinamikas simulācijas, un ir pierādīts, ka ar to var
atrisināt sarežģītas rūpnieciskas problēmas.18)
Pointnet turpina kalpot par etalonu 3D datu apstrādē, ievērojami
uzlabojot dziļās mācīšanās modeļu spēju apstrādāt punktu mākoņa
datus. Tās ietekme ir redzama gan teorētiskajos sasniegumos, gan
praktiskajos lietojumos, kas liecina par tās pastāvīgo nozīmi un
pielāgošanās spēju mākslīgā intelekta un mašīnmācīšanās jomā.19)
PointNet ir modelis, kas tieši apstrādāt punktu mākoņa datus un
atpazīt objektus 3D telpā neatkarīgi no katra punkta secības.
PointNet iegūst punktu pazīmes un, pamatojoties uz tām, veic
klasifikāciju un segmentāciju. Šis modelis var apstrādāt punktu
mākoņu nestrukturēto raksturu, un to var izmantot dažādās jomās,
piemēram, autonomā braukšanā, robotikā un medicīnisko attēlu
analīzē.
3.3 PointRCNN
PointRCNN ir svarīga sistēma 3D objektu noteikšanas jomā, jo īpaši
tādās lietojumprogrammās kā autonoma braukšana. Sistēma izmanto
divpakāpju noteikšanas procesu, lai uzlabotu objektu noteikšanas
precizitāti un efektivitāti 3D punktu mākoņa datos. Pirmais solis ir
objektu ierosinājumu ģenerēšana, izmantojot uz punktiem balstītu
vietējo ierosinājumu tīklu. Šis solis ir jo tas darbojas tieši ar
neapstrādātiem punktu mākoņa datiem, saglabājot detalizētu
telpisko informāciju, kas var tikt zaudēta tradicionālajās metodēs,
kuras balstās uz attēlu projekcijām vai vokselēšanu.
Otrajā posmā PointRCNN precizē sākotnējo priekšlikumu, veicot 3D
ierobežojošo kastu Tādējādi tiek pielāgots izmērs un orientācija, lai tā
labāk atbilstu punktu mākoņa datos atklātajiem objektiem.
Izmantojot pazīmes, kas iegūtas tieši no neapstrādāta punktu
mākoņa, PointRCNN sasniedz lielāku noteikšanas precizitāti, jo īpaši
sarežģītās vidēs ar sarežģītu ģeometriju un oklūzijām.
Viena no PointRCNN galvenajām priekšrocībām ir tā mācīties no 13- -
gala līdz galam. Šī arhitektūra atvieglo tīkla posmu integrāciju,
uzlabojot ne tikai modeļa noteikšanas veiktspēju, bet arī tā
skaitļošanas efektivitāti, padarot to piemērotu reāllaika lietojumiem,
piemēram, tādiem, kas nepieciešami autonomās braukšanas
sistēmām.
Pētījumi liecina, ka metodes, kurās izmanto punktu mākoņa datus,
var ievērojami uzlabot 3D ainu izpratni un interpretāciju autonomās
braukšanas situācijās. Piemēram, uz PointRCNN un vokseļu punktu
mākoņu saplūšanas metodēm balstītus vairāku mērķu noteikšanas
algoritmus var izmantot dinamiskos scenārijos, jo tie ir daudzpusīgi
un daudzveidīgi.
18) Kashefi, A., & Mukerji, T. (2022). Fizikāli informēts PointNet: dziļas
mācīšanās risinātājs stabila stāvokļa nesaspiestām plūsmām un termiskiem
laukiem uz vairākām neregulāru ģeometriju kopām. Journal of
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Turklāt apsekojumi 3D punktu mākoņu un dziļās mācīšanās pieeju
jomā ka šo sistēmu nozīme autonomas braukšanas ainu izpratnē
arvien pieaug.20)
Kopumā PointRCNN ir nozīmīgs 3D objektu noteikšanas tehnoloģijas
sasniegums. Tās spēja tieši apstrādāt neapstrādātus punktu datus un
efektīvs divpakāpju noteikšanas process spēcīgu rīku autonomās
braukšanas , kur ātra un precīza objektu ir būtiska drošībai un
veiktspējai.
PointRCNN ir tehnoloģija, kas 3D objektu noteikšanai izmanto CNN
(konvolūcijas neironu tīklu), kura pamatā ir PointNet, un efektīvi
apstrādā punktu mākoņa datus, precīzi noteiktu objektus.
PointRCNN ir tehnoloģija, kas paplašina esošo 2D objektu
noteikšanas metodi uz 3D vidi un tiek izmantota autonomo
transportlīdzekļu objektu atpazīšanai un robotu vides atpazīšanai.
4. Pieteikumi
PointRCNN ir būtiska nozīme autonomās braukšanas sistēmās, un
tos izmanto, lai precīzi atpazītu un izsekotu objektus apkārtējā vidē.
Objektu , izmantojot 3D punktu , var palīdzēt transportlīdzekļiem ar
augstu precizitāti šķēršļiem uz ceļa pat sarežģītās satiksmes
situācijās.22)
Robots izmanto 3D objektu noteikšanas tehnoloģiju, lai
mijiedarbotos ar vidi. PointRCNN ļauj robotam izprast savu vidi no
brauciena uz braucienu un veikt nepieciešamos uzdevumus.24)
Lai virtuālos objektus bez problēmām ievietotu reālajā pasaulē AR
vidē, ir nepieciešama precīza objektu noteikšana 3D telpā.
PointRCNN svarīga loma šajā uzdevumā.
Droniem ir nepieciešama spēja atpazīt un izvairīties no dažādiem
šķēršļiem lidojuma laikā. PointRCNN var izmantot, lai reāllaikā
atpazītu objektus no drona sensoru datiem un noteiktu drošu
lidojuma trajektoriju.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN.
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
21) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D objektu noteikšana autonomai
braukšanai: Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D objektu noteikšana
autonomai braukšanai: International Journal of Computer Vision, 131, 1909-
1963.
24) Wang, L., & Huang, Y. (2022). Pārskats par 3D punktu mākoņa un uz dziļo
mācīšanos balstītām pieejām ainas izpratnei autonomā braukšanā. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019).16- -
PointRCNN tiek izmantots pilsētvides 3D modelēšanai un analīzei,
sniedzot svarīgu ieskatu pilsētu plānošanā un pārvaldībā. Tas
palīdzēt uzlabot transporta efektivitāti un uzlabot drošību pilsētās.
Šajos lietojumos PointRCNN ir ļoti noderīgi situācijās, kad
nepieciešama augsta precizitāte un reāllaika apstrāde. Pētījumi
liecina, ka tādas metodes kā uz PointRCNN balstīti vairāku mērķu
noteikšanas algoritmi savu veiktspēju un efektivitāti šajos
lietojumos.26) PointRCNN palīdz maksimāli palielināt 3D objektu
noteikšanas precizitāti un efektivitāti, kas svarīgi autonomo
transportlīdzekļu un citu progresīvu sistēmu attīstībai.
3D telpisko datu apstrādes tehnoloģija izmantota daudzās nozarēs.
Daži no galvenajiem lietojumiem ir šādi.
4.1 Autonomie transportlīdzekļi
transportlīdzekļi ir transportlīdzekļi, kas izmanto modernas
tehnoloģijas, lai vadītu sevi bez cilvēka iejaukšanās. Šie
transportlīdzekļi izmanto dažādus sensorus, kameras, radarus,
LiDAR un citus, lai precīzi pārzinātu apkārtējo vidi. Šīs tehnoloģijas
apvienojumā ar reāllaika datu apstrādi ir būtiskas, lai noteiktu drošus
braukšanas maršrutus.
Jo īpaši 3D objektu noteikšanas tehnoloģija ir autonomo
transportlīdzekļu galvenā sastāvdaļa, kurai ir svarīga nozīme, lai
precīzi noteiktu un atpazītu objektus ap transportlīdzekli. Piemēram,
PointRCNN izmanto punktu mākoņa datus, lai varētu veikt
transportlīdzekļa apkārtnes augstas izšķirtspējas analīzi. Tas
autonomajiem transportlīdzekļiem reāllaikā atpazīt gājējus, citus
transportlīdzekļus, ceļa zīmes un citus objektus, lai nodrošinātu
drošu braukšanu.27)
Autonomajiem transportlīdzekļiem arī spēja apgūt braukšanas
paradumus un pielāgoties dažādām braukšanas situācijām,
izmantojot mašīnmācīšanās un mākslīgā intelekta tehnoloģijas. Šīs 17- -
tehnoloģijas uzlabot transportlīdzekļu drošību, efektivitāti un
lietotāju pieredzi. Jo īpaši vairāku sensoru saplūšanas tehnoloģija
uzlabo 3D objektu noteikšanas precizitāti, uzticamu darbību dažādās
vidēs28).
Pārskats par 3D objektu noteikšanas metodēm autonomās braukšanas
lietojumprogrammām. IEEE Transactions on Intelligent Transportation
Systems, 20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN.
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz PointRCNN.
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-sensoru saplūšanas
tehnoloģija 3D objektu noteikšanai autonomā braukšanā: IEEE Transactions
on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonomie transportlīdzekļi viena no galvenajām inovāciju jomām
nākotnes transporta sistēmās, jo tajās tiek apvienoti sarežģīti
algoritmi un sensoru tehnoloģijas. Šīm tehnoloģijām ir pozitīva
ietekme uz sabiedrību kopumā, jo tās samazina satiksmes
sastrēgumus, samazina ceļu satiksmes negadījumu skaitu un
nodrošina efektīvāku satiksmes plūsmu.29)
Autonomie transportlīdzekļi izmanto LiDAR sensorus un 3D objektu
noteikšanas tehnoloģiju, lai reāllaikā uztvertu un analizētu
transportlīdzekļa apkārtni. Tas ļauj izvairīties no šķēršļiem, atpazīt
gājējus, analizēt krustojumus u. , lai maksimāli palielinātu
transportlīdzekļa drošību un braukšanas efektivitāti.
4.2 Veselības aprūpe
3D objektu noteikšanas metodēm medicīnas jomā, jo īpaši tādām kā
PointRCNN, plašs pielietojuma spektrs. Šīs tehnoloģijas galvenokārt
izmanto medicīniskajā attēlveidošanā, ķirurģiskajā robotikā,
pacientu uzraudzības sistēmās u. c.
3D objektu noteikšanas tehnoloģija palīdz noteikt bojājumus
datortomogrāfijas, magnētiskās rezonanses un ultraskaņas attēlos.
Tas ir īpaši svarīgi tādās jomās kā radioloģija, kur to var apvienot ar
datorizētās diagnostikas sistēmām, kurās izmanto mākslīgo intelektu
un mašīnmācīšanos, lai uzlabotu diagnostikas precizitāti.30)
Ķirurģiskajās robotizētajās sistēmās 3D objektu noteikšanas
tehnoloģija ļauj operācijas laikā precīzi atpazīt apkārtējos audus un
orgānus, palīdzot nodrošināt drošu un precīzu operāciju. Kopā ar
medicīniskā mākslīgā intelekta sasniegumiem tas var ievērojami
uzlabot operāciju efektivitāti un drošību.31)
3D sensori un objektu noteikšanas tehnoloģija var analizēt pacienta
kustības reālajā laikā un dzīvības rādītājus, lai agrīnā stadijā atklātu
novirzes. Šīs tehnoloģijas apvienot ar mākslīgā intelekta balstītām
pacientu uzraudzības sistēmām, lai nepārtraukti sekotu līdzi
pacienta stāvoklim un pārvaldītu to.32)19- -
Apvienojumā ar virtuālo realitāti (VR) to varētu izmantot medicīnas
izglītībā un apmācībā. 3D objektu noteikšanas tehnoloģija
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Pārskats par 3D objektu noteikšanas metodēm
autonomās braukšanas lietojumiem. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). AAPM darba grupas 273. ziņojums:
Ieteikumi par labāko praksi mākslīgā intelekta un mašīnmācīšanās jomā
datorizētai diagnostikai medicīniskās attēlveidošanas jomā. Medicīnas fizika.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Mākslīgais
intelekts veselības aprūpē: meistarība. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support
systems on nursing workflows in critical care units [Mākslīgā intelekta
lēmumu atbalsta sistēmu ietekme uz aprūpes darba plūsmu kritiskās
aprūpes nodaļās]. International nursing review, Nav.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023).
Mākslīgais intelekts klīnisko lēmumu atbalsta sistēmās onkoloģijā.
International Journal of Medical Sciences, 20, 79-86.20- -
ir liela nozīme, palīdzot ārstiem un veselības aprūpes speciālistiem
simulēt operācijas un diagnozes, ļaujot mācīties reālā vidē.33)
Šie lietojumi palīdz palielināt diagnostikas un ārstēšanas precizitāti
medicīnas jomā un uzlabot vispārējo drošību. Jo īpaši 3D objektu
noteikšanas tehnoloģija apvienojumā ar mākslīgo intelektu paātrina
inovācijas veselības aprūpē kļūst par svarīgu instrumentu pacientu
veselības un drošības uzlabošanai. Šie pētījumi sniedz jaunas
perspektīvas par mākslīgā intelekta komerciālo, regulatīvo un
sabiedrisko ietekmi medicīnā.34)
Medicīnas jomā 3D telpisko datu apstrādi precīzai diagnostikai un
ķirurģiskai plānošanai. Punktu mākoņa datus no 3D medicīniskās
attēlveidošanas, piemēram, datortomogrāfijas vai magnētiskās
rezonanses rezultātiem, izmanto, lai vizualizētu ķirurģiskās
operācijas vietu un izmērītu tās precīzu atrašanās vietu un lielumu,
tādējādi uzlabojot ķirurģisko precizitāti.
4.3 Rūpnieciskā automatizācija un robotika
3D objektu noteikšanas tehnoloģijas, jo īpaši tādi modeļi kā
PointRCNN, revolucionizē rūpnieciskās automatizācijas un robotikas
jomu. Šīs tehnoloģijas ievērojami uzlabo efektivitāti un precizitāti
dažādās nozarēs, un tām ir svarīga nozīme šādās konkrētās jomās.
3D objektu noteikšanas tehnoloģija ir būtiska robotizētām sistēmām,
lai atpazītu un šķirotu objektus noliktavā. Tā ļauj robotiem precīzi
atpazīt dažāda izmēra un formas objektus, ļaujot tiem efektīvi veikt
pārvietošanas un šķirošanas uzdevumus. Šīs tehnoloģijas palielina
rūpniecisko procesu efektivitāti un atvieglo loģistikas sistēmu
automatizāciju.35)
Kad rūpnieciskie roboti automātiski montē detaļas, 3D objektu
noteikšana palielina montāžas efektivitāti, jo ļauj atpazīt precīzu
detaļu pozīciju un orientāciju. Tas būtiski palielina ražošanas ātrumu
un samazina defektu skaitu, un tam svarīga nozīme viedās ražošanas
vidē.36)21- -
Tos izmanto, lai pārbaudītu izstrādājumu ģeometriju un izmērus,
izmantojot 3D skenēšanas tehnoloģiju, un tiem svarīga loma
izstrādājumu kvalitātes nodrošināšanā, defektu agrīnā atklāšanā un
izmaksu samazināšanā. Šīs automatizētās detaļas
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Artificial Intelligence- Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records: Deep Learning Approach (Ar
mākslīgo intelektu balstīta plaušu vēža riska prognozēšana, izmantojot
elektroniskos medicīniskos ierakstus bez attēliem: dziļās mācīšanās pieeja).
Journal of Medical Internet Research, 23. lpp.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Mākslīgais
intelekts veselības aprūpē: meistarība. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., &
White, M. (2021). Sim2Real in Robotics and Automation: Applications and
Challenges (Sim2Real robotikā un automatizācijā: lietojumi un izaicinājumi).
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Uz mācīšanos balstīta robotizētas montāžas automatizācija viedai ražošanai.
Proceedings of the IEEE, 109, 423-440.22- -
Kvalitātes pārbaudes sistēmas palielina produktu uzticamību.37)
Lai palielinātu robotu un automatizācijas sistēmu drošību, tiek
izmantota 3D objektu noteikšanas tehnoloģija. Tā ļauj atpazīt tuvumā
esošus vai droši. Šie drošības mehānismi palīdz samazināt nelaimes
gadījumu skaitu rūpnieciskajā vidē.38)
Autonomiem transportlīdzekļiem vai droniem ir svarīgi noteikt
objektus un plānot to maršrutus. 3D objektu noteikšanas tehnoloģija
šīm sistēmām efektīvi darboties, izvairīties no šķēršļiem un droši
veikt piegādes uzdevumus.39)
Šajās jomās 3D objektu noteikšanas tehnoloģijas inovāciju
virzītājspēks rūpniecības automatizācijā, palīdzot palielināt
produktivitāti, samazināt izmaksas un uzlabot drošību. Nākotnē šīs
tehnoloģijas arī turpmāk būs neatņemama robotikas un
automatizācijas sistēmu attīstības sastāvdaļa. Pētījumi liecina, ka šo
tehnoloģiju izmantošana dod nozīmīgu ieguldījumu rūpniecisko
procesu efektivitātes palielināšanā automatizēto sistēmu sarežģītības
pārvaldībā.40)
Rūpnieciskajā automatizācijā un robotikā 3D telpisko datu apstrādi
izmanto, lai palielinātu ražošanas procesu efektivitāti un
automatizētu kvalitātes pārbaudes. Roboti izmanto LiDAR sensorus
vai 3D kameras atpazītu produktus, atklātu anomālijas un palīdzētu
risināt kvalitātes problēmas.
4.4 Drošības uzraudzības sistēmas
Drošības uzraudzības sistēmās 3D objektu noteikšanas tehnoloģijai
svarīga nozīme, lai nodrošinātu efektīvus uzraudzības un drošības
risinājumus dažādās vidēs. Šī tehnoloģija ir īpaši nozīmīga tādās
jomās kā reāllaika uzraudzība, ielaušanās atklāšana, incidentu
novēršana, datu analīze un ziņošana, kā arī mākslīgā intelekta
integrācija.
3D objektu noteikšanas sistēmas ar reāllaika uzraudzības iespējām 23- -
izmanto kameras un sensorus, lai reāllaikā analizētu apkārtējo vidi.
Šī reāllaika analīze ļauj precīzi atpazīt cilvēkus, transportlīdzekļus un
objektus un sniedz tūlītējus brīdinājumus bīstamas situācijas
gadījumā. Tas ir būtiski, lai palielinātu drošību, jo īpaši sarežģītā
vidē, piemēram, uz ceļiem un lidostās.
Kad runa ir par ielaušanās atklāšanu, 3D objektu atklāšanas
tehnoloģija ir efektīva, lai noteiktu neparastu kustību vai uzvedību
konkrētā drošības zonā. Tas var ļaut agrīni atklāt iebrucēja tuvošanos
un nodrošināt apsardzes darbiniekiem tūlītēju palīdzību.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Rūpnieciskā
automatizācija un produktu kvalitāte: robotizētas ražošanas transformācijas
nozīme. Lietišķā ekonomika.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Dynamic and
Collaborative Automation and Robotics Software Systems Designing. IEEE
Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotika: no automatizācijas līdz inteliģentām sistēmām.
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Rūpnieciskā redze un automatizācija. Measurement Science and Technology,
33.24- -
Novērst nesankcionētu iekļūšanu drošās zonās, sniedzot sarkanos
brīdinājumus.
Attiecībā uz nelaimes gadījumu novēršanu šīs sistēmas novērš
nelaimes gadījumus dažādās vidēs, tostarp rūpniecības objektos,
savlaicīgi atklājot apdraudējumus un sniedzot brīdinājumus.
Piemēram, automātisko brīdināšanas sistēmu iedarbināt, kad
darbinieks tuvojas bīstamai zonai, lai novērstu nelaimes gadījumu.
Datu analīzes un pārskatu sniegšanas iespējas palīdz novērtēt
drošības situāciju un identificēt problēmas, veicot turpmāku analīzi,
izmantojot savāktos 3D datus. Šīs analīzes sniedz svarīgu ieskatu
turpmākajā drošības stratēģijā un nepārtraukti uzlabot drošību.
Integrējot mākslīgo intelektu, 3D objektu noteikšanas tehnoloģiju var
apvienot ar mašīnmācīšanās algoritmiem, lai radītu inteliģentāku
uzraudzības sistēmu. Tas sistēmai apgūt modeļus un ieviest
sarežģītākus brīdināšanas un reaģēšanas mehānismus.
Tādējādi 3D objektu noteikšanas tehnoloģija kļūst par drošības
uzraudzības sistēmu neatņemamu sastāvdaļu, palīdzot apmierināt
dažādas drošības vajadzības un paaugstinot objektu drošību.
Paredzams, ka nākotnē šīs tehnoloģijas turpinās attīstīties, radot vēl
sarežģītākus un efektīvākus drošības uzraudzības risinājumus. Šie
tehnoloģiskie sasniegumi pārtaps spēcīgākās drošības sistēmāsjo
īpaši integrējot tās ar mākslīgo intelektu.41)
3D objektu noteikšanas tehnoloģijai svarīga loma arī drošības
uzraudzības sistēmās. LiDAR sensorus un 3D objektu noteikšanas
tehnoloģiju izmantot, lai atklātu iebrucējus vai noteiktu, vai tuvumā
atrodas cilvēki. Tās arī analizēt uzvedības modeļus 3D telpā, lai
izsekotu un novērstu nelikumīgas darbības.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023).
Infrasarkanā starojuma mazo mērķu noteikšanas metode, kas balstīta uz
svērto cilvēka vizuālās salīdzināšanas mehānismu drošības uzraudzībai.
Remote. Sens., 15, 2922.26- -
4.5 VR/AR
Virtuālajā realitātē (VR) un paplašinātajā realitātē (AR) 3D objektu
noteikšanas tehnoloģija būtiski uzlabo lietotāju pieredzi dažādās
nozarēs. 3D objektu noteikšana ļauj lietotājiem mijiedarboties ar
reālās pasaules objektiem virtuālajā vidē, kas ir būtiski AR
lietojumprogrammām, lai reāllaikā atpazītu apkārtējo vidi, lai precīzi
izvietotu un manipulētu ar virtuālajiem elementiem. Tas padara
lietotāja pieredzi aizraujošāku.
VR vidē 3D objektu noteikšana tiek izmantota, lai radītu reālistiskas
simulācijas. Tas nodrošina mācību scenārijus dažādās jomās, tostarp
medicīnā, un aviācijas jomāļaujot dalībniekiem droši piedzīvot un
praktizēties reālās dzīves situācijās. VR/AR izmantošana, jo īpaši
būvniecības drošības jomā, palielina darbinieku izpratni par
drošību.42)
Spēļu nozarē 3D objektu noteikšana nodrošina pieredzi, precīzi
izsekojot spēlētāja kustību un pozīciju. Tas nodrošina mijiedarbību
ar virtuālajiem tēliem, palielinot spēles reālismu.
Arhitektūrā un inženierzinātnēs AR tehnoloģiju var izmantot, lai
vizualizētu dizaina modeļus reālajā pasaulē. Tas palīdzēt iepriekš
atklāt kļūdas projektēšanas procesā un atvieglot saziņu ar klientiem.
Šie lietojumi var būt īpaši sinerģiski ar būvniecības drošību.43)
AR tehnoloģija palīdz patērētājiem pieņemt lēmumus par pirkumu,
ļaujot viņiem virtuāli izmēģināt produktus. Piemēramtā sniedz
iespēju izvietot mēbeles savā mājoklī vai iepriekš izmēģināt
kosmētikas krāsas. Tas uzlabo patērētāju iepirkšanās pieredzi un
mijiedarbību.44)
Tādējādi 3D objektu noteikšanas tehnoloģija nodrošina inovatīvu
pieredzi VR un AR un tiek izmantota dažādās nozarēs. Nākotnē šīs
tehnoloģijas turpinās attīstīties, padarot lietotāja un virtuālās vides
mijiedarbību vēl ērtāku un dabiskāku. Tas vairāk paplašinās VR/AR
tehnoloģiju izmantošanu izglītībā, izklaidē, tirdzniecībā un citur. 27- -
Vienlaikus šo tehnoloģiju attīstība jaunas iespējas tūrisma un
viesmīlības nozarē.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks pārskats
par virtuālās un papildinātās realitātes (VR/AR) lietojumiem būvniecības
drošībā. Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks pārskats
par virtuālās un papildinātās realitātes (VR/AR) lietojumiem būvniecības
drošībā. Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
"Virtuālās realitātes (VR) un papildinātās realitātes (AR) video reklāmu
pārliecināšanas ietekme: konceptuāls pārskats". Journal of Business
Research.
45) Wei, W. (2019). Virtuālās realitātes (VR) un papildinātās realitātes (AR)
pētniecības progress tūrismā un viesmīlībā. Journal of Hospitality and
Tourism Technology, 10, 539-570.28- -
Virtuālajā realitātē (VR) un paplašinātajā realitātē (AR) 3D
telpiskajiem datiem ir svarīga loma mijiedarbībā ar reālās pasaules
objektiem3D telpiskie dati virtuālos objektus pareizi novietot reālajā
pasaulē un ļauj lietotājiem ar tiem mijiedarboties dabiskā veidā.
5. Secinājums
3D telpisko datu apstrādes tehnoloģija revolūciju daudzās jomās,
tostarp autonomās braukšanas, veselības aprūpes, rūpniecības,
drošības un VR/AR jomā. Jo īpaši LiDAR sensoriem un 3D objektu
noteikšanas tehnoloģijām loma katrā no šīm jomām, veicinot vides
analīzi reālajā laikā, precīzu diagnostiku un ārstēšanu, kā arī
efektīvas automatizācijas sistēmas. Šīs tehnoloģijas turpinās
attīstīties un nodrošinās bagātāku lietotāju pieredzi dažādās jomās.29- -
Atsauces
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Lidar punktu mākoņu saspiešana, apstrāde un mācīšanās
autonomai braukšanai. IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Pārskats par 3D objektu noteikšanas metodēm
autonomās braukšanas lietojumiem. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). 3D datu aprēķināšana
un vizualizācija. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Mākslīgais intelekts medicīnā. New England
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Rūpniecisko procesu
uzlabošana ar automatizāciju un robotiku. Machines.
6. Cao, M., & Wang, J. (2020). Šķēršļu noteikšana autonomi
braucošiem transportlīdzekļiem ar vairāku LiDAR sensoru
apvienošanu. Journal of Dynamic Systems Measurement and Control
- Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D objektu noteikšana
no monokulārā, stereo un punktu mākoņa autonomai braukšanai.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023).
Infrasarkanā starojuma mazo mērķu noteikšanas metode, kas balstīta
uz svērto cilvēka vizuālās salīdzināšanas mehānismu drošības
uzraudzībai. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Jaunas reģionālās stratigrāfijas atziņas no Nasia
apakšbaseina (Gana) 3D ģeoloģiskā modeļa, kas izstrādāts
hidroģeoloģiskiem mērķiem un balstīts pārstrādātiem B lauka datiem,
kuri sākotnēji iegūti minerālu izpētes vajadzībām. Solid Earth, 11,
349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotizēta procesu automatizācija: zinātnisks un
rūpniecisks sistemātisks kartēšanas pētījums. IEEE Access, 8, 39113-30- -
39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. un Zhang, Z. (2023). Īpaši
blīva 3D objektu noteikšana. IEEE Transactions on Pattern Analysis
and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Uz punktu mākoņiem balstītas 3D objektu noteikšanas un
klasifikācijas metodes pašbraucošām lietojumprogrammām:
Pārskats un taksonomija. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun. (2019).
Deep31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43,
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L.,
Näppi, J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan,
H., Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D.,
Samala, R. K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM darba grupas 273. ziņojums: Ieteikumi
par labāko praksi mākslīgā intelekta un mašīnmācīšanās jomā
datorizētai diagnostikai medicīniskās attēlveidošanas jomā.
Medicīnas fizika.
15. Huang, S. (2019). Paplašinātā realitāte un virtuālā realitāte: AR un
VR iespējas uzņēmējdarbībā. Informācijas tehnoloģijas un tūrisms,
21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H.
(2021).
Uz mācīšanos balstīta robotizētas montāžas automatizācija viedai
ražošanai. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). "Virtuālās realitātes (VR) un papildinātās realitātes (AR) video
reklāmu pārliecināšanas ietekme: konceptuāls pārskats". Journal of
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M.
(2020).
Triplānu konvolūcija ar koplietojamiem 2D kodoliem 3D
klasifikācijai un formas iegūšanai. Computer Vision and Image
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Imersīvās interaktīvās
tehnoloģijas un virtuālā iepirkšanās pieredze: J.: Atšķirības
patērētāju uztverē starp papildināto realitāti (AR) un virtuālo realitāti
(VR). Telemātika un informātika, 77, 101936.
20. Kusiak, A. 2023). Hiperautomatizācija apstrādes rūpniecībā. J.
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Kritisks
pārskats par virtuālās un papildinātās realitātes (VR/AR) lietojumiem
būvniecības drošībā. Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dinamisks vairāku mērķu noteikšanas algoritms, kas balstīts uz 32- -
PointRCNN. IEEE Transactions on Intelligent Transportation Systems,
23, 20707-20720.
23.Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D objektu noteikšana
autonomai braukšanai: International Journal of Computer Vision, 131,
1909-1963.
24.Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V.
(2022). Rūpnieciskā redze un automatizācija. Measurement Science
and Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023).
Mākslīgais intelekts veselības aprūpē: meistarība. Biotechnology and
Genetic Engineering Reviews, None, 1-50.
26.Nebot, E. (2018). Robotika: no automatizācijas līdz inteliģentām
sistēmām. Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B.
(2022). Dynamic graph.33- -
transformators 3D objektu noteikšanai. Uz zināšanām balstītas
sistēmas, 259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: uz dziļu
mācīšanos balstīta 3D objektu noteikšana, izmantojot semantisko
punktu mākoni. Visual Computer, , 1-15.
29.Wei, W. (2019). Virtuālās realitātes (VR) un papildinātās realitātes
(AR) pētniecības progress tūrismā un viesmīlībā. Journal of
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Novel Method for
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records: Deep Learning Approach
(Mākslīgā intelekta balstīta plaušu vēža riska prognozēšana,
izmantojot elektroniskos medicīniskos ierakstus bez attēliem: dziļās
mācīšanās pieeja). Journal of Medical Internet Research, 23. lpp.
32. Zhou, Q. (2022). Datorizēta atklāšana un
diagnostika/radiomika/mašīnmācīšanās/dziļā mācīšanās
medicīniskajā attēlveidošanā. Medical Physics.
'세미나 자료' 카테고리의 다른 글
Forskningsrapport: 3D-teknologi for romlig databehandling
og dens bruksområder AI Research Institute
2025_01Youngho Hong
Sammendrag:
Denne forskningen tar for seg utvikling og bruk av teknologi for
behandling av romlige 3D-data, spesielt datainnsamling av
punktskyer og deteksjon av 3D-objekter ved hjelp av LiDAR-sensorer.
Den fokuserer på 3D-objektdeteksjonsteknologiene VoxelNet,
PointNet og PointRCNN, og forklarer hvordan disse teknologiene
brukes på ulike områder som autonome kjøretøy, helsetjenester,
industriell automatisering, sikkerhetsovervåkingssystemer og VR/AR.
Punktskydata som samles inn av LiDAR-sensorer, analyserer 3D-rom
med høy presisjon, og 3D-objektdeteksjonsteknologi basert på disse
dataene en viktig rolle i sanntids miljøbevissthet,
presisjonsdiagnostikk, optimalisering av produksjonsprosesser osv. I
denne studien analyseres innvirkningen 3D-teknologi for romlig
databehandling har på moderne industri og teknologisk innovasjon,
og potensialet for fremtidig utvikling diskuteres.
Nøkkelord:
3D-romdata, LiDAR-sensorer, punktsky, 3Dobjektdeteksjon,
VoxelNet, PointNet, PointRCNN, autonome kjøretøy,
helsevesen, industriell automatisering,
sikkerhetsovervåkningssystemer, VR/AR, dyp læring2- -
1. Innledning
Det innebærer datainnsamling, lagring, analyse og visualisering, og
bruker teknologier som LiDAR, fotogrammetri og 3D-skanning for å
behandle tredimensjonal romlig informasjon. Disse teknologiene
brukes i en rekke ulike programvareplattformer, der geografiske
informasjonssystemer (GIS) og dataassistert design (CAD) de viktigste
verktøyene. Dette komplekse romlige analyser.
LiDAR bruker laserpulser til å samle inn avstandsdata, mens
fotogrammetri bruker flyfotografier til å lage 3D-modeller. Disse
dataene lagres i en database og brukes til analyse og visualisering ved
behov.1)
Forskning har vist at 3D CNN-strukturer kan brukes til å lære 3Drepresentasjoner,
og at dette kan gjøres mer effektivt enn
tradisjonelle CNN-baserte metoder.2)
GPU-baserte 3D-visualiseringsmetoder gir mulighet for mer
sofistikerte og nøyaktige romlige avgrensninger.3)
3D-modellering er et viktig verktøy i arkitektonisk design og
simuleringsprosessen. Det gjør det å vurdere sikkerheten til
strukturer og øke nøyaktigheten i designene dine.
3D-romdata brukes i forskning på økosystemendringer og
katastrofehåndtering. For eksempel brukes geologisk 3D-modellering
til grunnvannsleting og geologisk forskning.4)
3D-data brukes til å utvikle oppslukende miljøer for å forbedre
brukeropplevelsen. Dette brukes en rekke bransjer, blant annet
innen utdanning, helse og underholdning.
Teknologien for behandling av romlige 3D-data er i rivende utvikling
på en rekke områder, særlig når det gjelder innsamling av punktskydata
og deteksjon av objekter i 3D-rom ved hjelp av LiDAR-sensorer.
teknologiene revolusjonerer autonome kjøretøy, medisinske 3- -
applikasjoner, industriell automatisering,
sikkerhetsovervåkningssystemer og VR/AR-miljøer. Denne
forskningsrapporten gir en grunnleggende forståelse av 3Dteknologier
for romlig databehandling og forklarer hvordan de
brukes i ulike bransjer.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og visualisering av
3D-data. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplanar konvolusjon med delte 2D-kjerner for 3D-klassifisering og
gjenfinning av form. Computer Vision and Image Understanding, 193,
102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). En ny metode for regional
prospektering basert på moderne 3D-grafikk. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Ny regional stratigrafisk innsikt fra en geologisk 3D-modell av Nasiabassenget
i Ghana, utviklet for hydrogeologiske formål og basert på
reprosesserte B-feltdata som opprinnelig ble samlet inn i forbindelse med .
Solid Earth, 11, 349-361.4- -
2. Innsamling av Point CLoud-data med LiDAR-sensorer
Innsamling av punktsky-data ved hjelp av LiDAR-sensorer spiller en
viktig rolle i en lang rekke bruksområder, og er spesielt godt egnet
for innsamling av 3D-data med høy oppløsning. LiDAR-teknologien
sender ut laserpulser for å motta signaler som reflekteres fra objekter,
og beregner avstandsinformasjon basert på disse. Denne
informasjonen lagres i et punktskyformat, der hvert punkt
inneholder X-, Y- og Z-koordinater og refleksjonsintensitet.
LiDAR-punktskyer kan en rekke , blant annet innen , og
ressursforvaltning. De kan for eksempel være nyttige for
strukturanalyse av skog eller presisjonsmåling av bygninger.
Punktskyer konverteres deretter til eller GIS-data ved hjelp av
etterbehandling for denoising, justering og overflaterekonstruksjon.
I denne prosessen brukes en rekke ulike programvarer, spesielt GPUbaserte
3D-visualiseringsmetoder, som gir mulighet for mer
sofistikerte romlige avgrensninger.5)
LiDAR-data spiller også en viktig rolle i persepsjonssystemer for
autonome kjøretøy. Behandling av LiDAR-punktskyer og opplæring
innen autonom kjøring har bidratt til nøyaktig persepsjon av
veimiljøet og gjenkjenning av objekter.6) Disse dataene er avgjørende
for å lage høyoppløselige 3D-kart i sanntid, noe som autonome
kjøretøy å navigere trygt under komplekse veiforhold.
kan også For eksempel kan data som samles inn med flymontert
LiDAR, brukes til å rekonstruere 3D-modeller av geologiske
formasjoner, noe som bidrar til grunnvannsleting eller geologisk
forskning.7) Denne geologiske 3D-modelleringen muliggjør nye
geologiske tolkninger og bidrar til å gi en bedre forståelse av de
geologiske egenskapene i et område.
Fordelene med LiDAR-teknologien er annet høy datahastighet og
stor nøyaktighet, men den har også begrensninger som relativt høye
kostnader og ytelse i eller Det pågår kontinuerlig forskning og
utvikling for å overvinne disse tekniske begrensningene, noe som 5- -
gjør LiDAR kan brukes i et bredere spekter av bransjer.
En LiDAR-sensor (Light Detection and Ranging) er en teknologi som
bruker en laser til å måle overflaten på et objekt, og dataene kan
brukes til å innhente romlig 3D-informasjon. Punktskydataene som
genereres av en LiDAR-sensor, er en samling av mange punkter som
er fordelt i 3D-rom, og hvert av dem kan beskrives med høyde,
avstand og posisjon.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og visualisering av
3D-data. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Ny regional stratigrafisk innsikt fra en geologisk 3D-modell av Nasiabassenget
i Ghana, utviklet for hydrogeologiske formål og basert på
reprosesserte B-feltdata som opprinnelig ble samlet inn i forbindelse med .
Solid Earth, 11, 349-361.6- -
bjelker. Disse dataene er avgjørende for autonome kjøretøyers
oppfatning av omgivelsene, modellering arkitektur og
anleggsteknikk samt 3D-kartlegging.
3. 3D-teknologi for gjenkjenning av objekter
3D-objektdeteksjon er en viktig teknologi for å gjenkjenne og
lokalisere objekter i 3D-rommet, og er på en rekke områder, blant
annet autonome kjøretøy, og utvidet virkelighet. Teknologien først
og fremst basert på 3D-data som samles inn ved hjelp av LiDAR, RGBD-kameraer
og stereosynssystemer.
Den bruker punktskyer generert av LiDAR til å gjenkjenne
plasseringen og formen til objekter. Deep learning-modeller som
PointNet er mye brukt på dette feltet, og disse metodene er
avgjørende for å generere høyoppløselige 3D-kart i sanntid.8)
Det er en teknikk for å detektere objekter ved å kombinere 2D-bilder
tatt med RGB-kameraer med 3D-informasjon. Denne metoden
forbedrer deteksjonsytelsen ved å legge til farge- og
mønsterinformasjon om objektet. Nyere studier har foreslått
metoder som FusionRCNN, som kombinerer LiDAR- og kamerabilder
for å forbedre deteksjonsnøyaktigheten.9)
Dyplæringsstrukturer som CNN (Convolutional Neural Networks) og
RNN (Recurrent Neural Networks) brukes til å og gjenkjenne
egenskaper ved Disse modellene forbedrer nøyaktigheten ved
objektklassifisering og stedsestimering basert på datasett, noe som
spesielt viktig for hindergjenkjenning i autonome kjøretøy.10)
Det brukes til å øke kjøresikkerheten ved å oppdage hindringer og
fotgjengere på veien. Det forskes aktivt dette området for å
kombinere LiDAR-punktskyer med visjonsdata for mer presis
deteksjon.11)
Det hjelper roboten med å forstå og samhandle med omgivelsene.
Dette spesielt viktig for å bestemme den nøyaktige plasseringen av 7- -
objekter, slik at roboten kan planlegge banen sin og utføre oppgaver.
Gjenkjenne og reagere på objekter i sanntid for å forbedre
brukeropplevelsen. I utvidet virkelighet må for eksempel
plasseringen og formen objekter bestemmes nøyaktig for å forbedre
interaksjonen med virtuelle objekter.
8) Qian, R., Lai, X. og Li, X. (2021). 3D-objektdeteksjon for autonom kjøring:
Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-kamerafusjon for to-trinns 3D-objektdeteksjon.
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. og Zhang, Z. (2023). Super Sparse
3D-objektdeteksjon. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-kamerafusjon for to-trinns 3D-objektdeteksjon.
Remote Sensing, 15, 1839.8- -
Disse teknologiene i stadig utvikling, noe som gir mer presise og
effektive løsninger for 3D-objektdeteksjon. Fremskritt innen
forskning og teknologi forbedrer nøyaktigheten av gjenkjenningen i
virkelige miljøer betydelig.
3D-objektdeteksjon er nøyaktig identifisering og klassifisering av
spesifikke objekter i 3D-rom, noe som støttes av ulike teknikker for
behandling av romlige 3D-data. I det siste har teknikker basert på
dyp læring brukt aktivt til 3D-objektdeteksjon. Representative
teknologier VoxelNet, PointNet og PointRCNN.
3.1 VoxeLNet
VoxelNet er en innovativ arkitektur for dyp læring som er spesielt
utviklet for å oppdage 3D-objekter ved hjelp av punktskyer, noe som
er avgjørende i autonome kjøresystemer. Arkitekturen har en unik
tilnærming ved å konvertere rå punktskydata til et strukturert 3Dvoxelrutenett
for å muliggjøre effektiv prosessering og
funksjonsutvinning. Konverteringen til en voxel-representasjon er
fordi den gjør det mulig for VoxelNet å utnytte 3D-konvolusjon
effektivt for å fange opp romlig informasjon og samtidig sikre
beregningseffektivitet. Denne effektiviteten er avgjørende for
sanntidsapplikasjoner, som for eksempel de som kreves for autonom
kjøring.
Styrken til VoxelNet ligger i evnen til å inkorporere et nytt lag med
funksjonskoding som i stor grad forbedrer representasjonskraften til
hver enkelt voxel. Dette oppnås ved å ta hensyn til de unike
egenskapene til punktene i hver voxel, noe som forbedrer nettverkets
evne til å oppdage og klassifisere objekter i komplekse miljøer.12)
Dette funksjonskodingstrinnet er for å løse problemer som skyldes at
punktskydataene er uregelmessige og sparsomme, noe som er
vanskelig å håndtere med tradisjonelle 2D-konvolusjonelle nevrale
nettverk.
Forskning har vist at VoxelNet har gitt betydelige bidrag til 3D-9- -
objektdeteksjon. eksempel gjør arkitekturens evne til å levere høy
nøyaktighet samtidig som beregningseffektiviteten opprettholdes, at
den er et foretrukket valg for inter-implementeringsapplikasjoner i
autonome kjøretøy.13) VoxelNets integrering av sparsom
representasjon gjør det dessuten mulig å håndtere de store
datamengdene som ofte forekommer i autonome kjørescenarier på
en effektiv måte.
Utviklingen av VoxelNet representerer et betydelig fremskritt innen
3D-databehandling og legger grunnlaget fremtidige innovasjoner
innen autonom kjøreteknologi. Den løser viktige utfordringer på
dette området ved å kombinere effektiv voxelisering med avanserte
kodingsteknikker.14) Dette forbedrer ikke bare
deteksjonsnøyaktigheten, men muliggjør også mer sofistikert
håndheving av
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Dyp
læring for 3D-punktskyer: En undersøkelse. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. og Chang, Z. (2021). Adversarial
punktskyforstyrrelser mot 3D-objektdeteksjon i autonome kjøresystemer.
Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objektdeteksjon fra
monokulær, stereo og punktsky for autonom kjøring. Neurocomputing, 494,
23-32.10- -
VoxelNet flytter grensene for utvikling 3D-persepsjonssystemer. Med
sin kraftige ytelse og innovative tilnærming fortsetter VoxelNet å
påvirke pågående forskning og utvikling innen behandling 3Dpunktskyer
og autonome systemer.15)
VoxelNet er en innovativ modell for 3D-objektdeteksjon som
behandler punktskydata ved å konvertere dem til 3D-ruter (voxels).
Hver voxel representerer et punkt i punktskyen, noe som at modellen
behandle romlig informasjon mer effektivt. VoxelNet bruker denne
voxel-informasjonen å oppdage objekter og komme med
prediksjoner. Fordelen denne tilnærmingen er at den er effektiv og
rask til å behandle store mengder punktsky-data.
3.2 PointNet
PointNet er en banebrytende arkitektur for dyp læring som
revolusjonerer behandlingen av 3D-punktsky-data ved å bruke
uordnede punktsett direkte. I motsetning til tradisjonelle metoder
som krever strukturerte inndata, bruker PointNet
symmetrifunksjoner for å sikre permutasjonsinvarians, slik at de
romlige relasjonene mellom punktene og forblir på
inndatapunktene.
Den viktigste nyvinningen i PointNet er bruken av perceptroner MLP)
og Denne arkitekturen aggregerer effektivt egenskaper fra
individuelle punkter til en global representasjon, noe som er spesielt
nyttig for oppgaver som klassifisering og segmentering. Takket være
sin evne til å store og nøyaktig har en grunnleggende modell på
feltet, og den har inspirert en rekke senere arkitekturer basert på
prinsippene i .
PointNets gjennomslagskraft strekker seg fra akademisk forskning til
praktiske anvendelser på områder som autonom kjøring og
robotgjenkjenning. I autonome systemer har PointNet for eksempel
blitt brukt til å behandle LiDAR-data for å forbedre objektdeteksjon
og navigasjon ved å identifisere og klassifisere objekter fra ett forsøk
til det neste.16) PointNets design gjør det mulig å håndtere 11- -
kompleksiteten knyttet til 3D-data, for eksempel okklusjoner og
variasjoner i punkttetthet, noe som gjør det til et allsidig verktøy i
datasynapplikasjoner.
De fremskrittene PointNet har ført til, har ført til at PointNet har blitt
tatt i bruk i en rekke innovative sammenhenger. Det har for
eksempel blitt brukt til å klassifisere luftbårne LiDAR-data, noe som
har forbedret nøyaktigheten og effektiviteten i
fjernmålingsoperasjoner.17) PointNets tilpasningsevne har også ført
til at det har blitt integrert med fysikkbaserte nevrale nettverk for å
analysere sprekkutbredelse
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Semantisk
læringsnettverk med flere visninger for punktskybasert 3D-objektdeteksjon.
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Dyp
læring for 3D-punktskyer: En undersøkelse. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Luftbåren LiDAR-punktskyklassifisering
ved hjelp av PointNet ++ -nettverk med fulle nabolagsfunksjoner. PLOS ONE,
18.12- -
og fluiddynamikksimuleringer, og har vist seg å kunne løse komplekse
industrielle problemer.18)
Pointnet fortsetter å fungere som en målestokk for behandling av 3Ddata,
og har i betydelig grad bidratt til å forbedre
dyplæringsmodellers evne til å behandle punktsky-data. Effekten er
tydelig både i teoretiske fremskritt og praktiske anvendelser, noe
som viser at Pointnet fortsatt er relevant og tilpasningsdyktig i det
stadig skiftende landskapet innen kunstig intelligens og
maskinlæring.19)
PointNet er en modell som behandle punktskydata direkte og
gjenkjenne objekter i 3D-rom uavhengig av rekkefølgen på hvert
punkt. PointNet trekker ut kjennetegnene ved punktene og utfører
klassifisering og segmentering basert på dem. Modellen kan
håndtere punktskyenes ustrukturerte natur og kan brukes på ulike
områder som autonom kjøring, robotteknologi og medisinsk
bildeanalyse.
3.3 PointRCNN
PointRCNN er et viktig rammeverk for deteksjon av 3D-objekter,
spesielt for applikasjoner som autonom kjøring. Rammeverket
bruker en totrinns deteksjonsprosess for å forbedre nøyaktigheten og
effektiviteten ved gjenkjenning av objekter i 3D-punktskydata. Det
første trinnet er å generere forslag til objekter gjennom et
punktbasert lokalt forslagsnettverk. Dette trinnet er fordi det
fungerer direkte på de rå punktskydataene og bevarer detaljert
romlig informasjon som kan gå tapt i tradisjonelle metoder som
baserer seg på bildeprojeksjoner eller voxelisering.
I det andre trinnet forbedrer PointRCNN det opprinnelige forslaget
ved å utføre Dette justerer størrelsen og retningen på slik at den
passer bedre til de detekterte objektene i punktskydataene. Ved å
bruke funksjoner som er hentet direkte fra den rå punktskyen,
oppnår PointRCNN høyere nøyaktighet i objektdeteksjonen, spesielt
utfordrende miljøer med kompleks geometri og okklusjoner.13- -
En av de viktigste fordelene med PointRCNN er at den lære fra ende
til ende. Denne arkitekturen gjør det mulig å integrere
nettverksstadier sømløst, noe som ikke bare forbedrer modellens
deteksjonsytelse, men også dens beregningseffektivitet, noe som gjør
den egnet for sanntidsapplikasjoner, som for eksempel autonome
kjøresystemer.
Forskning har vist at metoder som bruker punktskydata, kan
forbedre forståelsen og tolkningen av 3D-scener i autonome
kjøresituasjoner betraktelig. For eksempel kan bruk av algoritmer for
deteksjon av flere mål basert på PointRCNN og voxelpunktskyfusjonsteknikker
brukes i dynamiske scenarier på grunn av
deres allsidighet og
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: En dyp
læringsløser for inkompressible strømmer og termiske felt i stabil tilstand
på flere sett med uregelmessige geometrier. Journal of Computational
Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.14- -
I tillegg undersøkelser innen 3D-punktskyer og
dyplæringstilnærminger den økende betydningen av disse
rammeverkene for sceneforståelse i autonom kjøring.20)
PointRCNN representerer et betydelig fremskritt innen 3Dobjektdeteksjonsteknologi.
Dens evne til å behandle rå punktskydata
direkte og den effektive deteksjonsprosessen kraftig verktøy for
autonom kjøring, der rask og nøyaktig er avgjørende for sikkerhet og
ytelse.
PointRCNN er en teknologi som bruker et CNN (Convolutional Neural
Network) basert på PointNet for 3D-objektgjenkjenning, og som
effektivt behandler punktskydata for å gjenkjenne objekter med stor
nøyaktighet. PointRCNN er en teknologi som utvider den
eksisterende 2D-objektdeteksjonsmetoden til 3D-miljøer, og brukes
til objektgjenkjenning av autonome kjøretøy og miljøgjenkjenning av
roboter.
4. Bruksområder
PunktRCNN spiller en viktig rolle i autonome kjøresystemer, og
brukes til å gjenkjenne og spore objekter i omgivelsene med stor
nøyaktighet. ved hjelp av kan hjelpe kjøretøyer med hindringer i
veien med stor nøyaktighet, selv i komplekse trafikksituasjoner.22)
Roboten bruker 3D-objektdeteksjonsteknologi for å samhandle med
omgivelsene. PointRCNN gjør det mulig for roboten å forstå
omgivelsene fra kjøring til kjøring og utføre de nødvendige
handlingene.24)
For å kunne sette virtuelle objekter sømløst inn i den virkelige verden
i et AR-miljø, er det nødvendig med nøyaktig objektdeteksjon i 3Drommet.
PointRCNN en viktig rolle i denne oppgaven.
Droner må kunne gjenkjenne og unngå ulike hindringer under
flyging. PointRCNN kan brukes til å oppdage objekter i sanntid fra
dronens sensordata og angi en trygg flyrute.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
21) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. og Li, X. (2021). 3D-objektdeteksjon for autonom kjøring:
Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objektdeteksjon for
autonom kjøring: A Comprehensive Survey, International Journal of
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). En undersøkelse av 3D Point Cloud og Deep
Learning-baserte tilnærminger for sceneforståelse i autonom kjøring. IEEE
Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019).16- -
PointRCNN brukes til 3D-modellering og analyse av bymiljøer, noe
som gir viktig innsikt for byplanlegging og -forvaltning. Dette bidra
til å forbedre transporteffektiviteten og øke sikkerheten i byene.
I disse bruksområdene er PointRCNN svært nyttige i situasjoner der
det kreves høy nøyaktighet og sanntidsbehandling. Forskning viser at
teknikker som flermålsdeteksjonsalgoritmer basert på PointRCNN
har vist å være effektive i slike anvendelser.26) PointRCNN bidrar til å
maksimere nøyaktigheten og effektiviteten ved 3D-objektdeteksjon,
noe som viktig for utviklingen av autonome kjøretøy og andre
avanserte systemer.
3D-teknologi for romlig databehandling brukes mange ulike bransjer.
Noen av de viktigste bruksområdene inkluderer
4.1 Selvkjørende kjøretøy
kjøretøy er kjøretøy som bruker avansert teknologi til å kjøre seg selv
uten menneskelig inngripen. Disse kjøretøyene bruker en rekke
sensorer, kameraer, radar, LiDAR og mer for å få nøyaktig oversikt
over omgivelsene sine. Disse teknologiene, kombinert med
databehandling i sanntid, er avgjørende for å bestemme trygge
kjøreruter.
3D-teknologi for gjenkjenning av objekter er en nøkkelkomponent i
autonome kjøretøy, og spiller en viktig rolle når det gjelder å oppdage
og gjenkjenne objekter rundt kjøretøyet på en nøyaktig måte.
PointRCNN utnytter for eksempel punktskydata for å muliggjøre
høyoppløselig analyse av kjøretøyets omgivelser. Dette det mulig for
autonome kjøretøy å gjenkjenne fotgjengere, andre kjøretøy, veiskilt
med mer i sanntid for å sikre trygg kjøring.27)
Autonome kjøretøy også evnen til å lære seg kjøremønstre og tilpasse
seg ulike kjøresituasjoner ved hjelp av maskinlæring og kunstig
intelligens. Disse teknologiene bidrar til forbedre kjøretøyets
sikkerhet, effektivitet og brukeropplevelse. Spesielt forbedrer 17- -
multisensorfusjonsteknologien nøyaktigheten ved deteksjon av 3Dobjekter,
noe som pålitelig ytelse i en rekke ulike miljøer.28)
En undersøkelse om 3D-objektdeteksjonsmetoder for autonome
kjøreapplikasjoner. IEEE Transactions on Intelligent Transportation Systems,
20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for
3D Object Detection in Autonomous Driving: IEEE Transactions on
Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonome kjøretøy et viktig innovasjonsområde i fremtidens
transportsystemer, der komplekse algoritmer og sensorteknologi
smelter sammen. Disse teknologiene har en positiv innvirkning på
samfunnet som helhet ved at de reduserer trafikkbelastningen,
reduserer trafikkulykker og muliggjør en mer effektiv trafikkflyt.29)
Autonome kjøretøy bruker LiDAR-sensorer og 3D-teknologi for
gjenkjenning av objekter for å oppfatte og analysere kjøretøyets
omgivelser i sanntid. Dette gjør det mulig å unngå hindringer,
gjenkjenne fotgjengere, analysere veikryss og for å maksimere
kjøretøyets sikkerhet og kjøreeffektivitet.
4.2 Helsetjenester
Teknikker for deteksjon av 3D-objekter i det medisinske feltet,
spesielt teknikker som PointRCNN, et bredt spekter av potensielle
bruksområder. Disse teknologiene brukes hovedsakelig innen
medisinsk bildebehandling, kirurgisk robotteknologi,
pasientovervåkingssystemer osv.
3D-teknologi gjenkjenning av objekter bidrar til å oppdage lesjoner i
CT-, MR- og ultralydbilder med stor nøyaktighet. Dette er spesielt
viktig innen felt som radiologi, der det kan kombineres med
datastøttede diagnosesystemer som bruker kunstig intelligens og
maskinlæring for å forbedre den diagnostiske nøyaktigheten.30)
I kirurgiske robotsystemer gjør 3D-teknologi for gjenkjenning av
objekter det mulig å gjenkjenne omkringliggende vev og organer
nøyaktig under operasjonen, noe som bidrar til å sikre trygg og presis
kirurgi. Sammen med fremskritt innen medisinsk kunstig intelligens
kan dette i stor grad forbedre effektiviteten og sikkerheten ved
operasjoner.31)
3D-sensorer og objektdeteksjonsteknologi kan analysere pasientens
bevegelser og vitale tegn i sanntid for å oppdage avvik på et tidlig
stadium. Disse teknologiene kombineres med kunstig intelligensbaserte
pasientovervåkingssystemer for kontinuerlig sporing og 19- -
håndtering av pasientens tilstand.32)
Kombinert med virtuell virkelighet (VR) kan den brukes i medisinsk
utdanning og opplæring. 3D-teknologi for gjenkjenning av objekter
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). En undersøkelse om 3D-objektdeteksjonsmetoder for
autonome kjøreapplikasjoner. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). AAPM-arbeidsgrupperapport 273:
Anbefalinger om beste praksis for AI og maskinlæring for datastøttet
diagnose innen medisinsk bildebehandling. Medisinsk fysikk.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske
anmeldelser, Ingen, 1-50.
32) Almagharbeh, W. (2024). Effekten av AI-baserte
beslutningsstøttesystemer på arbeidsflyten i intensivavdelinger,
International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023).
Artificial intelligence in clinical decision support systems for oncology,
International Journal of Medical Sciences, 20, 79-86.20- -
spiller en viktig rolle i å hjelpe leger og helsepersonell med å
simulere operasjoner og diagnoser, noe som muliggjør læring i et
realistisk miljø.33)
Disse bruksområdene bidrar til å øke nøyaktigheten i diagnostisering
og behandling på det medisinske området og forbedre den generelle
sikkerheten. Spesielt 3D-teknologi for gjenkjenning av objekter
kombinert med kunstig intelligens setter fart på innovasjonen i
helsevesenet og er i ferd med å bli et viktig verktøy for å forbedre
pasientenes helse og sikkerhet. Disse studiene gir nye perspektiver
på de kommersielle, regulatoriske og samfunnsmessige
implikasjonene av medisinsk AI.34)
Innenfor medisin brukes 3D-databehandling å stille nøyaktige
diagnoser og planlegge kirurgiske inngrep. Punktskydata fra
medisinsk 3D-avbildning, for eksempel CT- eller MR-bilder, brukes
til å visualisere operasjonsstedet og måle dets nøyaktige plassering og
størrelse for å forbedre den kirurgiske nøyaktigheten.
4.3 Industriell automatisering og robotteknologi
3D-teknologier for gjenkjenning av objekter, spesielt modeller som
PointRCNN, er i ferd med å revolusjonere feltet industriell
automasjon og robotikk. Disse teknologiene forbedrer effektiviteten
og nøyaktigheten betydelig i en lang rekke bransjer, og spiller en
viktig rolle på følgende spesifikke områder
3D-teknologi for gjenkjenning av objekter er avgjørende for at
robotsystemer skal kunne gjenkjenne og sortere objekter på et lager.
Den gjør det mulig for roboter å gjenkjenne gjenstander av ulik
størrelse og form, slik at de kan utføre effektive forflytnings- og
sorteringsoppgaver. Disse teknologiene øker effektiviteten i
industrielle prosesser og gjør det lettere å automatisere
logistikksystemer.35)
Når industriroboter automatisk monterer deler, øker 3Dobjektdeteksjon
monteringseffektiviteten ved å gjenkjenne den 21- -
nøyaktige posisjonen og retningen til delene. Dette bidrar i betydelig
grad til å øke produksjonshastigheten og redusere antall feil, en
viktig rolle i smarte produksjonsmiljøer.36)
De brukes til å inspisere geometri og dimensjoner på produkter ved
hjelp av 3D-skanningsteknologi, og en viktig rolle når det gjelder å
sikre produktkvalitet, oppdage feil tidlig og redusere kostnader.
Disse automatiserte delene
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). Kunstig
intelligensbasert prediksjon av lungekreftrisiko ved bruk av elektroniske
medisinske journaler uten bildebehandling: Deep Learning Approach.
Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske
anmeldelser, Ingen, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P.
og White, M. (2021). Sim2Real i robotikk og automatisering: applikasjoner og
utfordringer. IEEE Transactions on Automation Science and Engineering, 18,
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Læringsbasert automatisering av robotmontering for smart produksjon.
Proceedings of the IEEE, 109, 423-440.22- -
Systemer for kvalitetskontroll øker produktenes pålitelighet.37)
For å øke sikkerheten til roboter og automasjonssystemer brukes 3Dteknologi
for objektdeteksjon. Dette gjør det mulig for å gjenkjenne
eller i nærheten en trygg måte. Disse sikkerhetsmekanismene bidrar
til å redusere ulykker i industrielle miljøer.38)
Det er avgjørende for autonome kjøretøy eller droner å kunne
oppdage objekter og planlegge rutene sine. 3D-teknologi for
gjenkjenning av objekter disse systemene å operere effektivt, unngå
hindringer og utføre leveringsoppgaver på en trygg måte.39)
disse områdene driver 3D-teknologier for objektdeteksjon
innovasjonen innen industriell automasjon, og bidrar til å øke
produktiviteten, redusere kostnadene og forbedre sikkerheten. I
fremtiden vil disse teknologiene fortsette å være en integrert del av
utviklingen av robotikk og automatiseringssystemer. Forskning har
vist at anvendelsen av disse teknologiene bidrar betydelig til øke
effektiviteten i industrielle prosesser og håndtere kompleksiteten i
automatiserte systemer.40)
Innen industriell automasjon og robotteknologi brukes behandling
av romlige 3D-data til å produksjonsprosesser og automatisere
kvalitetsinspeksjoner. Roboter bruker LiDAR-sensorer eller 3Dkameraer
til gjenkjenne produkter, oppdage avvik og bidra til å løse
kvalitetsproblemer.
4.4 Systemer for sikkerhetsovervåking
I sikkerhetsovervåkingssystemer 3D-teknologi for gjenkjenning av
objekter en viktig rolle når det gjelder å tilby effektive overvåkingsog
sikkerhetsløsninger i en rekke ulike miljøer. Teknologien har vært
spesielt fremtredende på områder som sanntidsovervåking,
innbruddsdeteksjon, forebygging av hendelser, dataanalyse og
rapportering samt integrering av kunstig intelligens.
3D-objektdeteksjonssystemer med sanntidsovervåking bruker 23- -
kameraer og sensorer til å analysere omgivelsene i sanntid. Denne
sanntidsanalysen muliggjør nøyaktig gjenkjenning av personer,
kjøretøy og objekter, og gir umiddelbare advarsler i tilfelle en farlig
situasjon skulle oppstå. Dette er avgjørende for å øke sikkerheten,
spesielt i komplekse miljøer som veier og flyplasser.
Når det gjelder innbruddsdeteksjon, er 3D-teknologi for
objektdeteksjon effektiv når det gjelder å oppdage uvanlig bevegelse
eller atferd innenfor et bestemt sikkerhetsområde. Dette kan føre til
tidlig oppdagelse av en inntrenger og gi sikkerhetspersonell
umiddelbar
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industriell
automatisering og produktkvalitet: rollen som transformasjon av
robotproduksjon. Anvendt økonomi.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing
Dynamic and Collaborative Automation and Robotics Software Systems,
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotikk: Fra automatisering til intelligente systemer,
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Industrielt syn og automatisering. Measurement Science and Technology, 33.24- -
Forhindre uautorisert adgang til sikrede områder ved å gi røde varsler.
Når det gjelder ulykkesforebygging, forebygger disse systemene
ulykker i en rekke ulike miljøer, inkludert industriområder, ved å
oppdage farer tidlig og gi advarsler. For eksempel et automatisk
varslingssystem utløses når en arbeider nærmer seg et farlig område,
slik at en ulykke forhindres.
Dataanalyse- og rapporteringsfunksjonene hjelper deg med å vurdere
sikkerhetssituasjonen og identifisere problemer ved hjelp av
påfølgende analyser av innsamlede 3D-data. Disse analysene gir
viktig innsikt for fremtidig sikkerhetsstrategi og kontinuerlig
forbedring av sikkerheten.
Ved å integrere kunstig intelligens kan 3D-teknologi for
objektdeteksjon kombineres med maskinlæringsalgoritmer for å
skape et mer intelligent overvåkingssystem. Dette gjør det for
systemet å lære seg mønstre og implementere mer sofistikerte
varslings- og responsmekanismer.
På denne måten er 3D-teknologi for gjenkjenning av objekter i ferd
med å bli en integrert del av sikkerhetsovervåkingssystemer, noe som
oppfyller en rekke sikkerhetsbehov og bidrar til sikkerheten på
anlegg. Denne teknologien forventes å utvikle seg videre i fremtiden,
noe som vil føre til mer sofistikerte og effektive løsninger for
sikkerhetsovervåking. Disse teknologiske fremskrittene vil utvikle
seg til mer robuste sikkerhetssystemer, særlig gjennom integrering
med kunstig intelligens.41)
3D-teknologi for gjenkjenning av objekter også en viktig rolle i
sikkerhetsovervåkingssystemer. LiDAR-sensorer og 3Dobjektdeteksjonsteknologi
brukes til å oppdage inntrengere eller
avgjøre om det befinner seg mennesker i nærheten. De også
analysere atferdsmønstre i 3D-rom for å spore og forhindre ulovlig
aktivitet.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. og Cao, E. (2023). En
infrarød metode for deteksjon av små mål basert på en vektet menneskelig
visuell sammenligningsmekanisme for sikkerhetsovervåking. Remote Sens.
15, 2922.26- -
4.5 VR/AR
I virtuell virkelighet (VR) og utvidet (AR) bidrar 3D-teknologi for
gjenkjenning av objekter til å forbedre brukeropplevelsen i en rekke
ulike bransjer. 3D-objektdeteksjon gjør det mulig for brukerne å
samhandle med virkelige objekter i virtuelle miljøer, noe som er
avgjørende for at AR-applikasjoner skal kunne gjenkjenne
omgivelsene i sanntid og plassere og manipulere virtuelle elementer
nøyaktig. Dette gjør brukeropplevelsen mer oppslukende.
I VR-miljøer brukes 3D-objektdeteksjon til å skape realistiske
simuleringer. Dette gir opplæringsscenarioer på en rekke områder,
blant annet innen medisin, og luftfart, slik at deltakerne trygt kan
oppleve og øve på virkelige situasjoner. Bruken av VR/AR, spesielt
innen bygg- og anleggssikkerhet, øker arbeidernes
sikkerhetsbevissthet.42)
I spillindustrien gir 3D-objektdeteksjon en opplevelse ved å spore
spillerens bevegelse og posisjon nøyaktig. Dette muliggjør
interaksjon med virtuelle figurer, noe som øker spillets realisme.
Innen arkitektur og ingeniørfag kan AR-teknologi brukes til å
visualisere designmodeller i den virkelige verden. Dette bidra til å
oppdage feil i designprosessen på forhånd og lette kommunikasjonen
med kundene. Disse bruksområdene kan være spesielt synergistiske
med konstruksjonssikkerhet.43)
AR-teknologi hjelper forbrukerne med å ta kjøpsbeslutninger ved å la
dem oppleve produkter virtuelt. De kan for eksempel plassere
møbler i hjemmet sitt eller prøve kosmetikkfarger på forhånd. Dette
forbedrer forbrukerens kjøpsopplevelse og interaksjon.44)
På denne måten gir 3D-teknologi for gjenkjenning av objekter
innovative opplevelser i VR og AR, og teknologien brukes i en rekke
ulike bransjer. I fremtiden vil disse teknologiene fortsette å utvikle
seg, slik at interaksjonen mellom brukeren og det virtuelle miljøet
blir enda mer sømløs og naturlig. Dette vil ytterligere utvide bruken 27- -
av VR/AR-teknologi innen utdanning, underholdning, handel og mye
mer. Samtidig vil fremskritt innen disse teknologiene skape nye
muligheter i reiselivs- og hotellbransjen.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR) i
bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR) i
bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
'Overtalelseseffektene av virtual reality (VR) og augmented reality (AR)
videoannonser: En konseptuell gjennomgang'. Journal of Business Research.
45) Wei, W. (2019). Fremskritt i forskningen på virtuell virkelighet (VR) og
utvidet virkelighet (AR) innen turisme og gjestfrihet, Journal of Hospitality
and Tourism Technology, 10, 539-570.28- -
I virtuell virkelighet (VR) og utvidet virkelighet (AR) spiller 3Dromdata
en viktig rolle man skal samhandle med objekter i den
virkelige verden. 3D-romdata det å plassere virtuelle objekter riktig i
den virkelige verden, slik at brukerne kan samhandle med dem på en
naturlig måte.
5. Konklusjon
3D-teknologi for romlig databehandling revolusjonere mange felt,
deriblant autonom kjøring, helsevesen, industri, sikkerhet og VR/AR.
LiDAR-sensorer og 3D-teknologi for gjenkjenning av objekter spiller
en viktig rolle alle disse feltene, og bidrar til miljøanalyser i sanntid,
nøyaktig diagnose og behandling samt effektive
automatiseringssystemer. Disse teknologiene vil fortsette å utvikle
seg og gi rikere brukeropplevelser på ulike områder.29- -
Referanser
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Lidar Point Cloud Compression, Processing and Learning for
Autonomous Driving. IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). En undersøkelse om 3Dobjektdeteksjonsmetoder
for autonome kjøreapplikasjoner. IEEE
Transactions on Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Beregning og
visualisering av 3D-data. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Kunstig intelligens i medisin. New England
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Forbedring av industrielle
prosesser ved hjelp av automatisering og robotteknologi. Maskiner.
6. Cao, M. og Wang, J. (2020). Hindringsdeteksjon for autonome
kjøretøy med multi-LiDAR-sensorfusjon. Journal of Dynamic Systems
Measurement and Control - Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objektdeteksjon fra
monokulær, stereo og punktsky for autonom kjøring.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. og Cao, E. (2023). En
infrarød metode for deteksjon av små mål basert på en vektet
menneskelig visuell sammenligningsmekanisme for
sikkerhetsovervåking. Remote Sens. 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Ny regional stratigrafisk innsikt fra en geologisk
3D-modell av Nasia-bassenget i Ghana, utviklet for hydrogeologiske
formål og basert på reprosesserte B-feltdata som opprinnelig ble
samlet inn i forbindelse med . Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and
Industrial Systematic Mapping Study, IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. og Zhang, Z. (2023). Super
Sparse 3D-objektdeteksjon. IEEE Transactions on Pattern Analysis 30- -
and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Punktskybaserte 3D-objektdeteksjons- og
klassifiseringsmetoder for selvkjørende applikasjoner: En
undersøkelse og taksonomi. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019).
Dype31- -
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L.,
Näppi, J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan,
H., Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D.,
Samala, R. K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM-arbeidsgrupperapport 273:
Anbefalinger om beste praksis for AI og maskinlæring for datastøttet
diagnose innen medisinsk bildebehandling. Medisinsk fysikk.
15. Huang, S. (2019). Utvidet virkelighet og virtuell : kraften i AR VR
for næringslivet, Information Technology and Tourism, 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H.
(2021).
Læringsbasert automatisering av robotmontering for smart
produksjon. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). 'Overtalelseseffektene av virtual reality (VR) og augmented
reality (AR) videoannonser: En konseptuell gjennomgang'. Journal of
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M.
(2020).
Triplanar konvolusjon med delte 2D-kjerner for 3D-klassifisering og
gjenfinning av form, Computer Vision and Image Understanding, 193,
102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Oppslukende
interaktive teknologier og virtuelle shoppingopplevelser: Forskjeller i
forbrukernes oppfatninger mellom utvidet virkelighet (AR) og
virtuell virkelighet (VR). Telematikk og informatikk, 77, 10-1936.
20. Kusiak, A. (2023). Hyperautomatisering i produksjonsindustrien,
J. Intell. Manuf. 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). En kritisk
gjennomgang av anvendelser av virtuell og utvidet virkelighet (VR/AR)
i bygg- og anleggssikkerhet, Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud
Fusion Based on PointRCNN. IEEE Transactions on Intelligent
Transportation Systems, 23, 20707-20720.32- -
23.Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objektdeteksjon for
autonom kjøring: A Comprehensive Survey, International Journal of
Computer Vision, 131, 1909-1963.
24.Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V.
(2022). Industrielt syn og automatisering. Measurement Science and
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstig
intelligens i helsevesenet: en mestring. Bioteknologi og gentekniske
anmeldelser, Ingen, 1-50.
26.Nebot, E. (2018). Robotikk: Fra automatisering til intelligente
systemer, Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B.
(2022). Dynamisk graf33- -
transformator for deteksjon av 3D-objekter. Knowledge-Based Systems,
259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: dyp
læringsbasert 3D-objektdeteksjon ved hjelp av semantisk punktsky.
Visual Computer, , 1-15.
29.Wei, W. (2019). Fremskritt i forskningen på virtuell virkelighet
(VR) og utvidet virkelighet (AR) innen turisme og gjestfrihet, Journal
of Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). En ny metode for
regional prospektering basert på moderne 3D-grafikk. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Kunstig intelligensbasert prediksjon av lungekreftrisiko ved bruk av
elektroniske medisinske journaler uten bildebehandling: Deep
Learning Approach. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Datastøttet deteksjon og
diagnose/radiomikk/maskinlæring/dyb læring innen medisinsk
avbildning. Medisinsk fysikk.
'세미나 자료' 카테고리의 다른 글
Onderzoeksrapport: 3D verwerking van ruimtelijke gegevens en toepassingen
Onderzoeksrapport: 3D verwerking van ruimtelijke gegevens
en toepassingen AI onderzoeksinstituut 2025_01Youngho
Hong
Samenvattingen:
Dit onderzoek behandelt de ontwikkeling en toepassing van 3D
ruimtelijke gegevensverwerkingstechnologieën, met name
puntwolkgegevensverwerving en 3D objectdetectietechnologieën met
LiDAR-sensoren. Het richt zich op 3D-objectdetectietechnologieën
VoxelNet, PointNet en PointRCNN en legt uit hoe deze technologieën
worden gebruikt op verschillende gebieden zoals autonome voertuigen,
gezondheidszorg, industriële automatisering,
veiligheidssurveillancesystemen en VR/AR. Puntwolkgegevens
verzameld door LiDAR-sensoren analyseren de 3D-ruimte met hoge
precisie, en 3D-objectdetectietechnologie op basis hiervan een
belangrijke rol in real-time omgevingsbewustzijn, precisiediagnose,
optimalisatie van productieprocessen, enz. Deze studie analyseert de
impact van 3D-technologie voor de verwerking van ruimtelijke gegevens
op de moderne industrie en technologische innovatie, en bespreekt het
potentieel voor toekomstige ontwikkeling.
Trefwoorden:
3D ruimtelijke gegevens, LiDAR-sensoren, puntenwolk, 3D
objectdetectie, VoxelNet, PointNet, PointRCNN, autonome voertuigen,
gezondheidszorg, industriële automatisering,
veiligheidssurveillancesystemen, VR/AR, diep leren2- -
1. Inleiding
Het omvat het proces van gegevensverzameling, opslag, analyse en
visualisatie en maakt gebruik van technologieën zoals LiDAR,
fotogrammetrie en 3D scanning om driedimensionale ruimtelijke
informatie te verwerken. Deze technologieën worden gebruikt in
verschillende softwareplatforms, waarbij geografische
informatiesystemen (GIS) en computerondersteund ontwerp (CAD) de
belangrijkste hulpmiddelen . Dit complexe ruimtelijke analyses .
LiDAR gebruikt laserpulsen om afstandsgegevens te verzamelen, terwijl
fotogrammetrie luchtfoto's gebruikt om 3D-modellen te maken. Deze
gegevens worden opgeslagen in een database en indien nodig gebruikt
voor analyse en visualisatie.1)
Onderzoek heeft aangetoond dat 3D CNN structuren gebruikt kunnen
worden om 3D representaties te leren, en dat dit efficiënter kan dan
traditionele volledig 3D CNN-gebaseerde methodes.2)
GPU-gebaseerde 3D-visualisatiemethoden maken een verfijndere en
nauwkeurigere ruimtelijke afbakening mogelijk.3)
3D-modellering wordt gebruikt als een essentieel hulpmiddel in het
architectonische ontwerp- en simulatieproces. Hiermee u de veiligheid
van constructies beoordelen en de nauwkeurigheid van uw ontwerpen
vergroten.
Ruimtelijke 3D-gegevens worden gebruikt voor onderzoek naar
ecosysteemveranderingen en rampenbeheer. 3D-geologische
modellering wordt bijvoorbeeld gebruikt voor grondwaterexploratie en
geologisch onderzoek.4)
3D-gegevens gebruikt om meeslepende omgevingen te ontwikkelen om
de gebruikerservaring te verbeteren. Dit toegepast in verschillende
sectoren, waaronder onderwijs, gezondheidszorg en entertainment.
3D-technologieën voor de verwerking van ruimtelijke gegevens maken
een snelle ontwikkeling door op verschillende gebieden, met name bij
de verwerving van puntenwolkgegevens en de detectie van objecten in 3- -
de 3D-ruimte met behulp van LiDAR-sensoren. Deze technologieën voor
een revolutie in autonome voertuigen, medische toepassingen,
industriële automatisering, veiligheidssystemen en VR/AR-omgevingen.
Dit onderzoeksrapport een basisinzicht in 3D-technologieën voor de
verwerking van ruimtelijke gegevens en legt uit hoe ze worden
toegepast in verschillende industrieën.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en visualisatie van
3D-gegevens. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplanaire convolutie met gedeelde 2D kernels voor 3D classificatie en
vormherwinning. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). A Novel Method for Regional
Prospecting Based on Modern 3D Graphics. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). New regional stratigraphic insights from a 3D geological model of the
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based
on reprocessed B-field data originally collected for mineral exploration.
Solid Earth, 11, 349-361.4- -
2. Point CLoud-gegevens verzamelen met LiDAR-sensoren
Puntwolkgegevensverzameling met LiDAR-sensoren speelt een
belangrijke rol in een groot aantal toepassingen en is bijzonder geschikt
voor het verzamelen van 3D-gegevens met hoge resolutie. LiDARtechnologie
zendt laserpulsen uit om signalen te ontvangen die door
objecten worden gereflecteerd en berekent op basis daarvan
afstandsinformatie. Deze informatie wordt opgeslagen in een
puntenwolkformaat, waarbij elk punt X-, Y- en Z-coördinaten en de
reflectie-intensiteit bevat.
LiDAR-puntwolken kunnen op verschillende gebieden , zoals , en
grondstoffenbeheer. Puntwolken worden vervolgens omgezet in of GISgegevens
door nabewerking voor denoising, uitlijning en
oppervlaktereconstructie. In dit proces wordt een verscheidenheid aan
software gebruikt, vooral GPU-gebaseerde 3D-visualisatiemethoden, die
een meer verfijnde ruimtelijke afbakening mogelijk maken.5)
LiDAR-gegevens spelen ook een belangrijke rol in
waarnemingssystemen voor autonome voertuigen. LiDARpuntenwolkverwerking
en -training op het gebied van autonoom rijden
hebben bijgedragen aan een nauwkeurige waarneming van de
wegomgeving en objectdetectie.6) Deze gegevens zijn essentieel voor het
maken van realtime 3D-kaarten met een hoge resolutieautonome
voertuigen veilig kunnen navigeren in complexe wegomstandigheden.
kunnen ook voor Gegevens verzameld door LiDAR op vliegtuigen
kunnen bijvoorbeeld worden gebruikt om 3D-modellen van geologische
formaties te reconstrueren, die bijdragen aan grondwaterexploratie of
geologisch onderzoek.7) Deze 3D-geologische modellering maakt nieuwe
geologische interpretaties mogelijk en helpt om de geologische
kenmerken van een gebied beter te begrijpen.
De voordelen van LiDAR technologie zijn onder andere snelle
gegevensverwerving en hoge nauwkeurigheid, maar het heeft
beperkingen relatief hoge kosten en prestaties in regenachtig of Er
wordt voortdurend onderzoek en ontwikkeling gedaan om deze
technische beperkingen te overwinnen, LiDAR in een groter aantal 5- -
industrieën kan worden gebruikt.
Een LiDAR-sensor (Light Detection and Ranging) is een technologie die
een laser gebruikt om het oppervlak van een object te meten en de
gegevens kunnen worden gebruikt om ruimtelijke informatie in 3D te
verkrijgen. De puntenwolkgegevens die door een LiDAR-sensor worden
gegenereerd, zijn een verzameling van vele punten verspreid in de 3Druimte,
die elk kunnen worden beschreven door hoogte, afstand en
positionering.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en visualisatie van
3D-gegevens. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). New regional stratigraphic insights from a 3D geological model of the
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based
on reprocessed B-field data originally collected for mineral exploration.
Solid Earth, 11, 349-361.6- -
balken. Deze gegevens zijn cruciaal voor de perceptie van de omgeving
door autonome voertuigen, modellering de architectuur en civiele
techniek en 3D-kartering.
3. 3D-objectdetectietechnologie
3D-objectdetectie is een belangrijke technologie voor het herkennen en
lokaliseren van objecten in de 3D-ruimte en essentieel op verschillende
gebieden, waaronder autonome voertuigen, en augmented reality. Het
voornamelijk gebaseerd op 3D-gegevens die zijn verzameld met LiDAR,
RGB-D-camera's en stereovisiesystemen.
Het maakt gebruik van puntenwolken gegenereerd door LiDAR om de
locatie en vorm van objecten te herkennen. Deep learning-modellen
zoals PointNet worden veel gebruikt op dit gebied, en deze methoden
zijn essentieel voor het genereren van 3D-kaarten met een hoge
resolutie en in realtime.8)
Het is een techniek om objecten te detecteren door 2D-beelden
verkregen door RGB-camera's te combineren met 3D-informatie. Deze
methode verbetert de detectieprestaties door kleur- en
patrooninformatie van het object toe te voegen. Recent onderzoek heeft
methoden voorgesteld zoals FusionRCNN, dat LiDAR- en camerabeelden
combineert om de nauwkeurigheid van de detectie te verbeteren.9)
Deep learning-structuren zoals Convolutionele Neurale Netwerken
(CNN's) en Recurrente Neurale Netwerken (RNN's) worden gebruikt om
kenmerken van en te herkennen. Deze modellen verbeteren de
nauwkeurigheid van objectclassificatie en locatie-inschatting op basis
van datasets, wat vooral belangrijk voor obstakelherkenning in
autonome voertuigen.10)
Het wordt gebruikt om de rijveiligheid te verhogen door obstakels en
voetgangers op de weg te detecteren. Er op dit gebied actief onderzoek
gedaan naar het samenvoegen van LiDAR-puntenwolken met
visiongegevens voor nauwkeurigere detectie.11)
Het helpt de robot om zijn omgeving te begrijpen en ermee te
interageren. Dit vooral belangrijk voor het bepalen van de exacte 7- -
locatie van objecten om de robot te helpen zijn pad te plannen en taken
uit te voeren.
Objecten in realtime herkennen en erop reageren om de
gebruikerservaring te verbeteren. In augmented reality bijvoorbeeld de
locatie en vorm van objecten nauwkeurig worden bepaald om de
interactie met virtuele objecten te verbeteren.
8) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving:
Een overzicht. Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-Camera fusie voor tweefasige 3D objectdetectie.
Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super Sparse
3D Object Detection. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: LiDAR-Camera fusie voor tweefasige 3D objectdetectie.
Remote Sensing, 15, 1839.8- -
Deze technologieën evolueren en bieden preciezere en efficiëntere
oplossingen voor de detectie van 3D-objecten. Vooruitgang in onderzoek
en technologie verbetert de nauwkeurigheid van herkenning in echte
omgevingen aanzienlijk.
3D-objectdetectie is nauwkeurige identificatie en classificatie van
specifieke objecten in de 3D-ruimte, die wordt ondersteund door
verschillende technieken voor de verwerking van 3D-ruimtelijke
gegevens. Recentelijk deep learning-gebaseerde technieken actief
toegepast op 3D-objectdetectie. Representatieve technologieën VoxelNet,
PointNet en PointRCNN.
3.1 VoxeLNet
VoxelNet is een innovatieve deep learning-architectuur die speciaal is
ontworpen om 3D-objecten te detecteren met behulp van puntenwolken,
wat essentieel is voor autonome besturingssystemen. De architectuur
hanteert een unieke aanpak door ruwe puntenwolkgegevens te
converteren naar een gestructureerd 3D voxelraster om efficiënte
verwerking en extractie van kenmerken mogelijk te maken. De
conversie naar een voxelrepresentatie is omdat VoxelNet hierdoor
effectief gebruik kan maken van 3D-convolutie om ruimtelijke
informatie vast te leggen en tegelijkertijd computerefficiëntie te
garanderen. Deze efficiëntie is essentieel voor real-time toepassingen
zoals die voor autonoom rijden.
De kracht van VoxelNet ligt in de mogelijkheid om een nieuwe feature
coderingslaag in te bouwen die de representatieve kracht van elke voxel
sterk verbetert. Dit wordt bereikt door rekening te houden met de
unieke kenmerken van de punten in elke voxel, waardoor het netwerk
objecten in complexe omgevingen beter kan detecteren en
classificeren.12) Deze kenmerkcoderingsstap is voor het oplossen van
problemen die worden veroorzaakt door de onregelmatige en schaarse
aard van puntenwolkgegevens, die moeilijk te verwerken zijn met
traditionele 2D convolutionele neurale netwerken.
Onderzoek heeft aangetoond dat VoxelNet belangrijke bijdragen heeft
geleverd op het gebied van 3D-objectdetectie. Het vermogen van de 9- -
architectuur om een hoge nauwkeurigheid te bieden met behoud van
computerefficiëntie maakt bijvoorbeeld een voorkeursoptie voor interimplementatietoepassingen
in autonome voertuigen.13) Bovendien kan
VoxelNet dankzij de integratie van de schaarse representatie de grote
hoeveelheden gegevens die vaak voorkomen in autonome rijscenario's
effectief verwerken.
De ontwikkeling van VoxelNet betekent een belangrijke vooruitgang in
de verwerking van 3D-gegevens en legt de basis voor toekomstige
innovaties in autonome rijtechnologie. Het pakt de belangrijkste
uitdagingen op dit gebied aan door efficiënte voxelisatie te combineren
met geavanceerde kenmerkcoderingstechnieken.14) Dit verbetert niet
alleen de detectienauwkeurigheid, maar maakt ook geavanceerdere
handhaving mogelijk.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep
Learning voor 3D Point Clouds: een overzicht. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Adversarial
point cloud perturbations against 3D object detection in autonomous
driving systems. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objectdetectie uit
monoculaire, stereo- en puntenwolk voor autonoom rijden.
Neurocomputing, 494, 23-32.10- -
VoxelNet verlegt de grenzen van de ontwikkeling van 3D
perceptiesystemen. Met zijn krachtige prestaties en innovatieve aanpak
blijft VoxelNet lopende onderzoek en de ontwikkeling van 3D
puntenwolkverwerking en autonome systemen beïnvloeden.15)
VoxelNet is een innovatief model voor 3D objectdetectie dat
puntenwolkgegevens verwerkt door deze om te zetten in 3D-rasters
(voxels). Elke voxel vertegenwoordigt een punt in de puntenwolk,
waardoor het model ruimtelijke informatie effectiever verwerken.
VoxelNet gebruikt deze voxelinformatie objecten te detecteren en
voorspellingen te doen. Het voordeel deze benadering is dat het efficiënt
en snel is om grote hoeveelheden puntenwolkgegevens te verwerken.
3.2 PointNet
PointNet is een baanbrekende deep learning-architectuur die een
revolutie teweegbrengt in de verwerking van 3D-puntwolkgegevens
door ongeordende puntensets direct te verwerken. In tegenstelling tot
traditionele methoden die gestructureerde invoer vereisen, gebruikt
PointNet symmetriefuncties om permutatie-invariantie te garanderen,
waardoor de ruimtelijke relaties tussen punten zodat de blijft de van de
invoerpunten.
De belangrijkste innovatie van PointNet is het gebruik van MLP's
(perceptronsen max-pooling Deze architectuur voegt kenmerken van
individuele punten efficiënt samen tot een globale representatie, wat
bijzonder nuttig is voor taken zoals classificatie en segmentatie. Dankzij
het vermogen om grote en nauwkeurig , is een baanbrekend model op
dit gebied en heeft het talrijke latere architecturen geïnspireerd die op
zijn principes zijn gebaseerd.
De impact van PointNet reikt verder dan academisch onderzoek naar
praktische implementaties op gebieden zoals autonoom rijden en
robotherkenning. In autonome systemen is PointNet bijvoorbeeld
gebruikt om LiDAR-gegevens te verwerken om objectdetectie en
navigatie te verbeteren door objecten van de ene proef naar de volgende
te identificeren en te classificeren.16) PointNet's ontwerp maakt het
mogelijk om effectief om te gaan met de complexiteiten die 11- -
geassocieerd worden met 3D-gegevens, zoals occlusies en variaties in
puntdichtheid, waardoor het een veelzijdig hulpmiddel is in
computervisietoepassingen.
De vooruitgang die PointNet heeft gebracht heeft geleid tot de
aanpassing van PointNet in verschillende innovatieve contexten. Het is
bijvoorbeeld toegepast om LiDAR-gegevens vanuit de lucht te
classificeren, waardoor de nauwkeurigheid en efficiëntie van
teledetectieoperaties is verbeterd.17) Het aanpassingsvermogen van
PointNet heeft ook geleid tot de integratie met op fysica gebaseerde
neurale netwerken om de verspreiding van scheuren te analyseren.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Multi-view
semantisch leernetwerk voor 3D objectdetectie op basis van puntenwolken.
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep
Learning voor 3D Point Clouds: een overzicht. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR point cloud
classification using PointNet++ network with full neighbourhood features.
PLOS ONE, 18.12- -
en vloeistofdynamische simulaties, en heeft bewezen complexe
industriële problemen op te lossen.18)
Pointnet blijft dienen als een benchmark in 3D gegevensverwerking en
heeft de mogelijkheden van deep learning modellen om
puntenwolkgegevens te verwerken aanzienlijk verbeterd. De impact van
Pointnet is duidelijk zichtbaar in zowel theoretische vooruitgang als
praktische toepassingen, wat de voortdurende relevantie en
aanpasbaarheid aantoont in het zich ontwikkelende landschap van
kunstmatige intelligentie en machinaal leren.19)
PointNet is een model dat direct puntenwolkgegevens verwerken en
objecten in de 3D-ruimte kan herkennen, ongeacht de volgorde van elk
punt. PointNet extraheert de kenmerken van de punten en voert op
basis daarvan classificatie en segmentatie uit. Dit model kan omgaan
met de ongestructureerde aard van puntenwolken en kan op
verschillende gebieden worden gebruikt, zoals autonoom rijden,
robotica en medische beeldanalyse.
3.3 PuntRCNN
PointRCNN is een belangrijk raamwerk op het gebied van 3D
objectdetectie, vooral voor toepassingen zoals autonoom rijden. Het
raamwerk gebruikt een detectieproces in twee stappen om de
nauwkeurigheid en efficiëntie van het detecteren van objecten in 3Dpuntenwolkgegevens
te verbeteren. De eerste stap is het genereren van
objectsuggesties via een puntgebaseerd lokaal suggestienetwerk. Deze
stap is omdat het direct werkt op de ruwe puntenwolkgegevens, waarbij
gedetailleerde ruimtelijke informatie behouden blijft die verloren kan
gaan bij traditionele methoden die vertrouwen op beeldprojecties of
voxelisatie.
In de tweede stap verfijnt PointRCNN het initiële voorstel door 3D
bounding box uit te voeren. Hierdoor worden de grootte en oriëntatie
van de aangepast zodat deze beter past bij de gedetecteerde objecten in
de puntenwolkgegevens. Door gebruik te maken van kenmerken die
rechtstreeks uit de ruwe puntenwolk worden gehaald, bereikt
PointRCNN een hogere nauwkeurigheid in objectdetectie vooral in 13- -
uitdagende omgevingen met complexe geometrie en occlusies.
Een van de belangrijkste voordelen van PointRCNN is de om end-to-end
te leren. Deze architectuur vergemakkelijkt de naadloze integratie van
netwerkfasen, waardoor niet alleen de detectieprestaties van het model
verbeteren, maar ook de rekenefficiëntie, waardoor het geschikt is voor
real-time toepassingen, zoals die nodig zijn voor autonome
besturingssystemen.
Onderzoek heeft aangetoond dat methoden die gebruik maken van
puntenwolkgegevens het begrip en de interpretatie van 3D-scènes in
autonome rijsituaties aanzienlijk kunnen verbeteren. Zo kan het
gebruik van multi-target detectiealgoritmen op basis van PointRCNN en
voxel puntwolk fusie technieken worden gebruikt in dynamische
scenario's vanwege hun veelzijdigheid en
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: A deep
learning solver for steady-state incompressible flows and thermal fields on
multiple sets of irregular geometries. Tijdschrift voor Computerfysica, 468,
111510.
19) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Daarnaast tonen onderzoeken op het gebied van 3D-puntenwolken en
deep learning-benaderingen het toenemende belang van deze kaders
voor het begrijpen van scènes in autonoom rijden.20)
In het algemeen betekent PointRCNN een aanzienlijke vooruitgang in
3D objectdetectietechnologie. Het vermogen om ruwe
puntenwolkgegevens direct te verwerken en het efficiënte
detectieproces in twee fasen een krachtig hulpmiddel voor de
autonome , waar snelle en nauwkeurige cruciaal is voor de veiligheid en
prestaties.
PointRCNN is een technologie die gebruik maakt van een CNN
(Convolutional Neural Network) op basis van PointNet voor 3Dobjectdetectie,
en op effectieve wijze puntenwolkgegevens verwerkt
objecten nauwkeurig te detecteren. PointRCNN is een technologie die
de bestaande 2D-objectdetectiemethode uitbreidt naar 3D-omgevingen
en wordt toegepast op objectherkenning van autonome voertuigen en
omgevingsherkenning van robots.
4. Toepassingen
PuntRCNN's spelen een essentiële rol in autonome besturingssystemen
en worden gebruikt om objecten in de omgeving nauwkeurig te
herkennen en te volgen. met behulp van kan voertuigen helpen
wegobstakels met een hoge mate van nauwkeurigheid , zelfs in
complexe verkeerssituaties.22)
De robot gebruikt 3D-objectdetectietechnologie voor interactie met de
omgeving. PointRCNN stelt de robot in staat om zijn omgeving van run
tot run te begrijpen en de noodzakelijke taken uit te voeren.24)
Om virtuele objecten naadloos in te voegen in de echte wereld in een
AR-omgeving, is nauwkeurige objectdetectie in 3D-ruimte vereist.
PointRCNN een belangrijke rol in deze taak.
Drones moeten tijdens de vlucht verschillende obstakels kunnen
herkennen en vermijden. PointRCNN kan worden gebruikt om objecten
in real-time te detecteren uit de sensorgegevens van de drone en een
veilig vluchtpad in te stellen.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
21) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-Based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous
Driving: Een overzicht. Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objectdetectie voor
autonoom rijden: Een uitgebreid overzicht. International Journal of
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-Based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019).16- -
PointRCNN wordt toegepast op 3D-modellering en analyse van
stedelijke omgevingen, wat belangrijke inzichten oplevert voor
stedelijke planning en beheer. Dit helpen om de transportefficiëntie te
verbeteren en de veiligheid in steden te vergroten.
In deze toepassingen zijn PointRCNNs zeer nuttig in situaties waar een
hoge nauwkeurigheid en real-time verwerking vereist zijn. Onderzoek
toont aan technieken zoals multi-target detectiealgoritmen op basis van
PointRCNN hun prestaties en efficiëntie in deze toepassingen
bewijzen.26) PointRCNN draagt bij aan het maximaliseren van de
nauwkeurigheid en efficiëntie van 3D objectdetectie, wat belangrijk
voor de vooruitgang van autonome voertuigen en andere geavanceerde
systemen.
3D-technologie voor de verwerking van ruimtelijke gegevens in veel
verschillende industrieën gebruikt. Enkele van de belangrijkste
toepassingen zijn
4.1 Autonome voertuigen
voertuigen zijn voertuigen die geavanceerde technologie gebruiken om
zichzelf te besturen zonder menselijke tussenkomst. Deze voertuigen
maken gebruik van een verscheidenheid aan sensoren, camera's, radar,
LiDAR en meer om zich nauwkeurig bewust te worden van hun
omgeving. Deze technologieën, gecombineerd met real-time
gegevensverwerking, zijn essentieel voor het bepalen van veilige
rijroutes.
Met name 3D-objectdetectietechnologie is een belangrijk onderdeel van
autonome voertuigen en speelt een belangrijke rol bij het nauwkeurig
detecteren en herkennen van objecten rondom het voertuig. PointRCNN
maakt bijvoorbeeld gebruik van puntenwolkgegevens om een hogeresolutie
analyse van de omgeving van een voertuig mogelijk te maken.
autonome voertuigen voetgangers, andere voertuigen, verkeersborden
en meer in realtime herkennen om veilig te kunnen rijden.27)
Autonome voertuigen ook het vermogen om rijpatronen te leren en zich
aan te passen aan verschillende rijsituaties door het toepassen van 17- -
technologieën voor machinaal leren en kunstmatige intelligentie. Deze
technologieën bij aan de verbetering van de veiligheid, efficiëntie en
gebruikerservaring van voertuigen. Met name multi-sensor
fusietechnologie verbetert de nauwkeurigheid van 3D objectdetectie,
betrouwbare prestaties in verschillende omgevingen .28)
Een overzicht van 3D-objectdetectiemethoden voor toepassingen in
autonoom rijden. IEEE Transactions on Intelligent Transportation Systems,
20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for
3D Object Detection in Autonomous Driving: A Review. IEEE Transactions
on Intelligent Transportation Systems, 25, 1148-1165.18- -
Autonome voertuigen een belangrijk gebied van innovatie in
toekomstige vervoerssystemen door de convergentie van complexe
algoritmen en sensortechnologieën. Deze technologieën hebben een
positief effect op de maatschappij als geheel doordat ze
verkeersopstoppingen verminderen, het aantal verkeersongevallen
terugdringen en een efficiëntere verkeersstroom mogelijk maken.29)
Autonome voertuigen gebruiken LiDAR-sensoren en 3Dobjectdetectietechnologie
om de omgeving van het voertuig in realtime
waar te nemen en te analyseren. Hierdoor kunnen obstakels worden
vermeden, voetgangers worden herkend, kruispunten worden
geanalyseerd en om de veiligheid en rijefficiëntie van het voertuig te
maximaliseren.
4.2 Gezondheidszorg
3D objectdetectietechnieken op medisch gebied, met name die zoals
PointRCNN, een breed scala aan potentiële toepassingen. Deze
technologieën worden voornamelijk gebruikt in medische beeldvorming,
chirurgische robotica, patiëntbewakingssystemen, enz.
3D-objectdetectietechnologie helpt bij nauwkeurig detecteren van
laesies in CT-, MRI- en echografiebeelden. Dit is vooral belangrijk op
gebieden zoals radiologie, waar het kan worden gecombineerd met
computerondersteunde diagnostische systemen die gebruik maken van
kunstmatige intelligentie en machinaal leren om de diagnostische
nauwkeurigheid te verbeteren.30)
In chirurgische robotsystemen maakt 3D-objectdetectietechnologie
nauwkeurige herkenning mogelijk van omliggende weefsels en organen
tijdens de operatie, wat bijdraagt aan een veilige en nauwkeurige
operatie. Samen met de vooruitgang in medische kunstmatige
intelligentie dit de efficiëntie en veiligheid van chirurgie aanzienlijk
verbeteren.31)
3D-sensoren en objectdetectietechnologie kunnen de real-time
bewegingen en vitale functies van een patiënt analyseren om
afwijkingen in een vroeg stadium op te sporen. Deze technologieën 19- -
worden gecombineerd met patiëntmonitoringsystemen op basis van
kunstmatige intelligentie om de toestand van een patiënt continu te
volgen en te beheren.32)
In combinatie met virtual reality (VR) zou het gebruikt kunnen worden in
medische opleidingen en trainingen. 3D-objectdetectietechnologie
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for
Autonomous Driving Applications. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). AAPM task group report 273:
Recommendations on best practices for AI and machine learning for
computer-aided diagnosis in medical imaging. Medische fysica.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstmatige
intelligentie in de gezondheidszorg: een meesterschap. Biotechnology and
Genetic Engineering Reviews, Geen, 1-50.
32) Almagharbeh, W. (2024). De impact van AI-gebaseerde
beslissingsondersteunende systemen op verpleegkundige workflows in
kritieke zorgafdelingen. International nursing review, Geen.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023).
Artificial intelligence in clinical decision support systems for oncology.
International Journal of Medical Sciences, 20, 79-86.20- -
speelt een belangrijke rol bij het helpen van artsen en zorgverleners bij
het simuleren van operaties en diagnoses, waardoor ze kunnen leren in
een realistische omgeving.33)
Deze toepassingen dragen bij aan het verhogen van de nauwkeurigheid
van diagnoses en behandelingen op medisch gebied en het verbeteren
van de algemene veiligheid. Met name 3D-objectdetectietechnologie in
combinatie met AI versnelt de innovatie in de gezondheidszorg en een
belangrijk hulpmiddel voor het verbeteren van de gezondheid en
veiligheid van patiënten. Deze studies bieden nieuwe perspectieven op
de commerciële, regelgevende en maatschappelijke implicaties van
medische AI.34)
Op medisch gebied 3D-verwerking van ruimtelijke gegevens gebruikt
voor nauwkeurige diagnose en chirurgische planning.
Puntwolkgegevens van 3D medische beeldvorming, zoals CT-scans of
MRI-resultaten, worden gebruikt om de operatieplaats te visualiseren
en de exacte locatie en grootte te meten om de chirurgische
nauwkeurigheid te verbeteren.
4.3 Industriële automatisering en robotica
3D-objectdetectietechnologieën, met name modellen zoals PointRCNN,
zorgen voor een revolutie op het gebied van industriële automatisering
en robotica. Deze technologieën verbeteren de efficiëntie en
nauwkeurigheid in een groot aantal industrieën aanzienlijk en spelen
een belangrijke rol in de volgende specifieke gebieden
3D-objectdetectietechnologie is essentieel voor robotsystemen om
objecten in een magazijn te herkennen en sorteren. Hierdoor kunnen
robots objecten van verschillende afmetingen en vormen nauwkeurig
herkennen, waardoor ze efficiënte verplaatsings- en sorteertaken
kunnen uitvoeren. Deze technologieën verhogen de efficiëntie van
industriële processen en vergemakkelijken de automatisering van
logistieke systemen.35)
Wanneer industriële robots automatisch onderdelen assembleren,
verhoogt 3D objectdetectie de assemblage-efficiëntie door de exacte
positie en oriëntatie van onderdelen te herkennen. Dit draagt 21- -
aanzienlijk bij tot hogere productiesnelheden en minder defecten, en
een belangrijke rol in slimme productieomgevingen.36)
Ze worden gebruikt om de geometrie en afmetingen van producten te
inspecteren met behulp van 3D-scantechnologie en een belangrijke rol
bij het waarborgen van de productkwaliteit, het vroegtijdig opsporen
van defecten en het verlagen van de kosten. Deze geautomatiseerde
onderdelen
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Artificial Intelligence Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records: Deep Learning Approach. Journal
of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Kunstmatige
intelligentie in de gezondheidszorg: een meesterschap. Biotechnology and
Genetic Engineering Reviews, Geen, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., &
White, M. (2021). Sim2Real in Robotica en Automatisering: Toepassingen en
Uitdagingen. IEEE Transactions on Automation Science and Engineering, 18,
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Op leren gebaseerde automatisering van robotassemblage voor slimme
productie. Proceedings van de IEEE, 109, 423-440.22- -
Kwaliteitsinspectiesystemen verhogen de betrouwbaarheid van
producten.37)
Om de veiligheid van robots en automatiseringssystemen te vergroten,
wordt 3D-objectdetectietechnologie gebruikt. Hierdoor kunnen of in de
buurt herkennen veilig Deze veiligheidsmechanismen dragen bij aan
het verminderen van ongevallen in industriële omgevingen.38)
Het is essentieel voor autonome voertuigen of drones om objecten te
detecteren en hun routes te plannen. 3D-objectdetectietechnologie deze
systemen om efficiënt te werken, obstakels te vermijden en levertaken
veilig uit te voeren.39)
Op deze gebieden 3D-objectdetectietechnologieën de drijvende kracht
achter innovatie in industriële automatisering en helpen ze de
productiviteit te verhogen, de kosten te verlagen en de veiligheid te
verbeteren. In de toekomst zullen deze technologieën een integraal
onderdeel blijven uitmaken van de evolutie van robotica en
automatiseringssystemen. Onderzoek heeft aangetoond dat de
toepassing van deze technologieën een belangrijke bijdrage aan het
verhogen van de efficiëntie van industriële processen en het beheren
van de complexiteit van geautomatiseerde systemen.40)
In industriële automatisering en robotica wordt 3D-verwerking van
ruimtelijke gegevens gebruikt om de efficiëntie van productieprocessen
te verhogen en kwaliteitsinspecties te automatiseren. Robots gebruiken
LiDAR-sensoren of 3D-camera's producten te herkennen, afwijkingen te
detecteren en kwaliteitsproblemen op te lossen.
4.4 Systemen voor veiligheidstoezicht
In veiligheidssurveillancesystemen 3D-objectdetectietechnologie een
belangrijke rol bij het bieden van effectieve monitoring- en
beveiligingsoplossingen in uiteenlopende omgevingen. De technologie
is vooral prominent aanwezig op gebieden zoals realtime bewaking,
inbraakdetectie, incidentpreventie, gegevensanalyse en rapportage, en
integratie van kunstmatige intelligentie.23- -
3D-objectdetectiesystemen met realtime bewakingsmogelijkheden
maken gebruik van camera's en sensoren om de omgeving in realtime te
analyseren. Deze realtime analyse maakt nauwkeurige herkenning van
mensen, voertuigen en objecten mogelijk en biedt onmiddellijke
waarschuwingen in het geval van een gevaarlijke situatie. Dit is
essentieel voor het verhogen van de veiligheid, vooral in complexe
omgevingen zoals wegen en luchthavens.
Op het gebied van inbraakdetectie is 3D-objectdetectietechnologie
effectief in het detecteren van ongewone bewegingen of gedrag binnen
een specifiek beveiligingsgebied. Dit kan leiden tot vroegtijdige detectie
van een indringer en het beveiligingspersoneel onmiddellijk voorzien
van
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industriële
automatisering en productkwaliteit: de rol van robotische
productietransformatie. Toegepaste economie.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing
Dynamic and Collaborative Automation and Robotics Software Systems.
IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotica: van automatisering tot intelligente systemen.
Engineering.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Industriële visie en automatisering. Measurement Science and Technology,
33.24- -
Voorkom onbevoegde toegang tot beveiligde gebieden door rode
waarschuwingen te geven.
Op het gebied van ongevallenpreventie voorkomen deze systemen
ongevallen in verschillende omgevingen, waaronder industriële locaties,
door gevaren vroegtijdig te detecteren en te waarschuwen. Een
automatisch waarschuwingssysteem bijvoorbeeld worden geactiveerd
wanneer een werknemer een gevaarlijk gebied nadert om een ongeval te
voorkomen.
Met de mogelijkheden voor gegevensanalyse en rapportage kunt u de
beveiligingssituatie beoordelen en problemen identificeren door middel
van analyses op basis van de verzamelde 3D-gegevens. Deze analyses
bieden belangrijke inzichten voor de toekomstige beveiligingsstrategie
en continue verbetering van de beveiliging .
Met de integratie van kunstmatige intelligentie kan 3Dobjectdetectietechnologie
worden gecombineerd met algoritmen voor
machinaal leren om een intelligenter bewakingssysteem te creëren. het
systeem patronen leren en geavanceerdere waarschuwings- en
responsmechanismen implementeren.
Op deze manier wordt 3D-objectdetectietechnologie een integraal
onderdeel van veiligheidssurveillancesystemen, waarmee wordt
voldaan aan verschillende beveiligingsbehoeften en de veiligheid van
faciliteiten wordt vergroot. Er wordt verwacht dat deze technologieën
zich in de toekomst verder zullen ontwikkelen, wat zal leiden tot
geavanceerdere en efficiëntere oplossingen voor veiligheidstoezicht.
Deze technologische vooruitgang uitmonden in robuustere
beveiligingssystemen, vooral door integratie met kunstmatige
intelligentie.41)
3D-objectdetectietechnologie ook een belangrijke rol in
veiligheidsbewakingssystemen. LiDAR-sensoren en 3Dobjectdetectietechnologie
worden gebruikt om indringers te detecteren
of om te bepalen of er mensen in de buurt zijn. Ze ook gedragspatronen
in de 3D-ruimte analyseren om illegale activiteiten op te sporen en te
voorkomen.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). An
Infrared Small Target Detection Method Based on a Weighted Human Visual
Comparison Mechanism for Safety Monitoring. Remote. Sens, 15, 2922.26- -
4.5 VR/AR
In virtual reality (VR) en augmented reality (AR) verbetert 3Dobjectdetectietechnologie
de gebruikerservaring aanzienlijk in
verschillende sectoren. Dankzij 3D-objectdetectie kunnen gebruikers
interageren met echte objecten in virtuele omgevingen. Dit is essentieel
voor AR-toepassingen om hun omgeving in realtime te herkennen en
virtuele elementen nauwkeurig te kunnen plaatsen en manipuleren. Dit
maakt de gebruikerservaring meeslepender.
In VR-omgevingen wordt 3D objectdetectie gebruikt om realistische
simulaties te creëren. Dit biedt trainingsscenario's op verschillende
gebieden, waaronder medisch, en luchtvaartwaardoor deelnemers op
een veilige manier levensechte situaties kunnen ervaren en oefenen. De
toepassing van VR/AR, vooral op het gebied van veiligheid in de bouw,
verhoogt het veiligheidsbewustzijn van werknemers.42)
In de game-industrie zorgt 3D objectdetectie voor een ervaring door de
beweging en positie van de speler nauwkeurig te volgen. Dit maakt
interactie met virtuele personages mogelijk, wat het realisme van het
spel verhoogt.
In de architectuur en techniek kan AR-technologie worden gebruikt om
ontwerpmodellen in de echte wereld te visualiseren. Dit helpen om
fouten in het ontwerpproces van tevoren op te sporen en de
communicatie met klanten te vergemakkelijken. Deze toepassingen
kunnen bijzonder synergetisch zijn met veiligheid in de bouw.43)
AR-technologie helpt consumenten bij het nemen van
aankoopbeslissingen doordat ze producten virtueel kunnen ervaren.
Het geeft ze bijvoorbeeld de mogelijkheid om meubels in hun huis te
plaatsen of cosmeticakleuren van tevoren uit te proberen. Dit verbetert
de koopervaring en interactie van de consument.44)
Op deze manier zorgt de 3D-objectdetectietechnologie voor innovatieve
ervaringen in VR en AR, en wordt ze gebruikt in verschillende
industrieën. In de toekomst zullen deze technologieën zich blijven
ontwikkelen, waardoor de interactie tussen de gebruiker en de virtuele
omgeving nog naadlozer en natuurlijker wordt. Dit zal het gebruik van 27- -
VR/AR-technologie in het onderwijs, entertainment, handel en nog veel
meer verder uitbreiden. Tegelijkertijd de vooruitgang in deze
technologieën nieuwe mogelijkheden creëren in de toerisme- en horecaindustrie.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch
overzicht van virtuele en augmented reality (VR/AR) toepassingen in
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch
overzicht van virtuele en augmented reality (VR/AR) toepassingen in
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
'The persuasion effects of virtual reality (VR) and augmented reality (AR)
video advertisements: A conceptual review'. Journal of Business Research.
45) Wei, W. (2019). Onderzoeksvoortgang naar virtual reality (VR) en
augmented reality (AR) in toerisme en gastvrijheid. Journal of Hospitality
and Tourism Technology, 10, 539-570.28- -
In virtual reality (VR) en augmented reality (AR) spelen ruimtelijke 3Dgegevens
een belangrijke rol interactie met objecten in de echte wereld.
ruimtelijke gegevens in 3D kunnen virtuele objecten op de juiste manier
in de echte wereld worden geplaatst en kunnen gebruikers er op een
natuurlijke manier mee interageren.
5. Conclusie
3D-technologie voor de verwerking van ruimtelijke gegevens voor een
revolutie op veel gebieden, waaronder autonoom rijden,
gezondheidszorg, industrie, veiligheid en VR/AR. Met name LiDARsensoren
en 3D-objectdetectietechnologieën een belangrijke rol op elk
van deze gebieden en dragen bij aan realtime omgevingsanalyse,
nauwkeurige diagnose en behandeling en efficiënte
automatiseringssystemen. Deze technologieën zich blijven ontwikkelen
en zorgen voor rijkere gebruikerservaringen op verschillende gebieden.29- -
Referenties
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Lidar Point Cloud Compression, Processing and Learning for
Autonomous Driving. IEEE Transactions on Intelligent Transportation
Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). A Survey on 3D Object Detection Methods for
Autonomous Driving Applications. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Berekening en
visualisatie van 3D-gegevens. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Kunstmatige intelligentie in de geneeskunde. New
England Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Verbetering van industriële
processen door automatisering en robotica. Machines.
6. Cao, M., & Wang, J. (2020). Obstacle Detection for Autonomous
Driving Vehicles With Multi-LiDAR Sensor Fusion. Journal of Dynamic
Systems Measurement and Control - Transactions of the ASME, 142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: 3D-objectdetectie uit
monoculaire, stereo- en puntenwolk voor autonoom rijden.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). An
Infrared Small Target Detection Method Based on a Weighted Human
Visual Comparison Mechanism for Safety Monitoring. Remote. Sens, 15,
2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). New regional stratigraphic insights from a 3D
geological model of the Nasia sub-basin, Ghana, developed for
hydrogeological purposes and based on reprocessed B-field data
originally collected for mineral exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and
Industrial Systematic Mapping Study. IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super
Sparse 3D Object Detection. IEEE Transactions on Pattern Analysis and
Machine Intelligence, 45, 12490-12505.30- -
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Point-cloud based 3D object detection and classification methods
for self-driving applications: A survey and taxonomy. Information
Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Diep31- -
Leren voor 3D-puntwolken: een overzicht. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi,
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H.,
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R.
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). AAPM task group report 273: Recommendations
on best practices for AI and machine learning for computer-aided
diagnosis in medical imaging. Medische fysica.
15. Huang, S. (2019). Augmented reality en virtual reality: de kracht van
AR en VR voor het bedrijfsleven. Information Technology and Tourism,
21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H.
(2021).
Op leren gebaseerde automatisering van robotassemblage voor slimme
productie. Proceedings van de IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). 'The persuasion effects of virtual reality (VR) and augmented
reality (AR) video advertisements: A conceptual review'. Journal of
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplanaire convolutie met gedeelde 2D kernels voor 3D classificatie en
vormherwinning. Computer Vision and Image Understanding, 193,
102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Immersieve interactieve
technologieën en virtuele winkelervaringen: Verschillen in
consumentenpercepties tussen augmented reality (AR) en virtual reality
(VR). Telematica en Informatica, 77, 101936.
20. Kusiak, A. (2023). Hyperautomatisering in de maakindustrie. J.
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Een kritisch
overzicht van virtuele en augmented reality (VR/AR) toepassingen in
bouwveiligheid. Automatisering in de bouw, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D-objectdetectie voor 32- -
autonoom rijden: Een uitgebreid overzicht. International Journal of
Computer Vision, 131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Industriële visie en automatisering. Measurement Science and
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023).
Kunstmatige intelligentie in de gezondheidszorg: een meesterschap.
Biotechnology and Genetic Engineering Reviews, Geen, 1-50.
26. Nebot, E. (2018). Robotica: van automatisering tot intelligente
systemen. Engineering.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B.
(2022). Dynamic graph33- -
transformator voor 3D objectdetectie. Kennisgebaseerde systemen, 259,
110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: op deep
learning gebaseerde 3D-objectdetectie met behulp van semantische
puntenwolk. Visual Computer, , 1-15.
29. Wei, W. (2019). Onderzoeksvoortgang naar virtual reality (VR) en
augmented reality (AR) in toerisme en gastvrijheid. Journal of
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). A Novel Method for
Regional Prospecting Based on Modern 3D Graphics. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records: Deep Learning Approach.
Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Computerondersteunde detectie en
diagnose/radiomics/machine learning/deep learning in medische
beeldvorming. Medische Fysica.
'세미나 자료' 카테고리의 다른 글
Raport z badań: Technologia przetwarzania danych przestrzennych 3D i jej zastosowania
Raport z badań: Technologia przetwarzania danych
przestrzennych 3D i jej zastosowania AI
Research Institute 2025_01Youngho Hong
Abstrakty:
Badania te obejmują rozwój i zastosowanie technologii przetwarzania
danych przestrzennych 3D, w szczególności pozyskiwania danych z
chmury punktów i technologii wykrywania obiektów 3D za pomocą
czujników LiDAR. Koncentruje się na technologiach wykrywania
obiektów 3D VoxelNet, PointNet i PointRCNN i wyjaśnia, w jaki sposób
technologie te są wykorzystywane w różnych dziedzinach, takich jak
pojazdy autonomiczne, opieka zdrowotna, automatyka przemysłowa,
systemy nadzoru bezpieczeństwa i VR / AR. Dane chmury punktów
zebrane przez czujniki LiDAR analizują przestrzeń 3D z dużą precyzją, a
oparta na nich technologia wykrywania obiektów 3D ważną rolę w
świadomości środowiskowej w czasie rzeczywistym, precyzyjnej
diagnostyce, optymalizacji procesów produkcyjnych itp. Niniejsze
badanie analizuje wpływ technologii przetwarzania danych
przestrzennych 3D na nowoczesny przemysł i innowacje technologiczne
oraz omawia potencjał przyszłego rozwoju.
Słowa kluczowe:
Dane przestrzenne 3D, czujniki LiDAR, chmura punktów,
wykrywanie obiektów 3D, VoxelNet, PointNet, PointRCNN, pojazdy
autonomiczne, opieka zdrowotna, automatyka przemysłowa, systemy
nadzoru bezpieczeństwa, VR/AR, uczenie głębokie2- -
1. Wprowadzenie
Obejmuje proces gromadzenia, przechowywania, analizy i wizualizacji
danych oraz wykorzystuje technologie takie jak LiDAR, fotogrametria i
skanowanie 3D do przetwarzania trójwymiarowych informacji
przestrzennych. Technologie te są wykorzystywane w różnych
platformach oprogramowania, przy czym głównymi narzędziami są
systemy informacji geograficznej (GIS) i projektowanie wspomagane
komputerowo (CAD). Pozwala na przeprowadzanie złożonych analiz
przestrzennych.
LiDAR wykorzystuje impulsy laserowe do zbierania danych o odległości,
podczas gdy fotogrametria wykorzystuje zdjęcia lotnicze do tworzenia
modeli 3D. Dane te są przechowywane w bazie danych i w razie
potrzeby wykorzystywane do analizy i wizualizacji.1)
Badania wykazały, że struktury 3D CNN mogą być wykorzystywane do
uczenia się reprezentacji 3D i że można to zrobić bardziej efektywnie niż
tradycyjne metody oparte w pełni na 3D CNN.2)
Metody wizualizacji 3D oparte na GPU pozwalają na bardziej
wyrafinowane i dokładne wyznaczanie granic przestrzennych.3)
Modelowanie 3D jest wykorzystywane jako podstawowe narzędzie w
procesie projektowania architektonicznego i symulacji. Pozwala ono
bezpieczeństwo konstrukcji i zwiększyć dokładność projektów.
Dane przestrzenne 3D są wykorzystywane w badaniach nad zmianami
ekosystemów i zarządzaniem katastrofami. Na przykład modelowanie
geologiczne 3D jest wykorzystywane do eksploracji wód gruntowych i
badań geologicznych.4)
Dane 3D wykorzystywane do tworzenia immersyjnych środowisk w celu
poprawy wrażeń użytkownika. Jest stosowane w różnych branżach, w
tym w edukacji, opiece zdrowotnej i rozrywce.
Technologie przetwarzania danych przestrzennych 3D szybko rozwijają
się w różnych dziedzinach, w szczególności w pozyskiwaniu danych z
chmury punktów i wykrywaniu obiektów w przestrzeni 3D za pomocą3- -
czujników LiDAR. Technologie te pojazdy autonomiczne, zastosowania
medyczne, automatykę przemysłową, systemy nadzoru bezpieczeństwa i
środowiska VR/AR. Niniejszy raport badawczy zapewnia podstawową
wiedzę na temat technologii przetwarzania danych przestrzennych 3D i
wyjaśnia, w jaki sposób są one stosowane w różnych branżach.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i wizualizacja
danych 3D. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval, Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Nowa metoda poszukiwania
regionalnego oparta na nowoczesnej grafice 3D. Minerały.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Nowe regionalne spostrzeżenia stratygraficzne z trójwymiarowego
modelu geologicznego subbasenu Nasia w Ghanie, opracowanego do celów
hydrogeologicznych i opartego na ponownie przetworzonych danych pola B
pierwotnie zebranych w celu poszukiwania minerałów. Solid Earth, 11, 349-
361.4- -
2. Zbieranie danych Point CLoud za pomocą czujników LiDAR
Pozyskiwanie danych z chmury punktów za pomocą czujników LiDAR
odgrywa ważną rolę w szerokim zakresie zastosowań i jest szczególnie
odpowiednie do pozyskiwania danych 3D o wysokiej rozdzielczości.
Technologia LiDAR emituje impulsy laserowe w celu odbierania
sygnałów odbitych od obiektów i oblicza na ich podstawie informacje o
odległości. Informacje te są przechowywane w formacie chmury
punktów, gdzie każdy punkt zawiera współrzędne X, Y i Z oraz
intensywność odbicia.
Chmury punktów LiDAR mogą być w różnych dziedzinach, w tym w
istycznym, środowiska i zarządzaniu zasobami. Chmury punktów są
następnie przekształcane w 3D lub dane GIS poprzez przetwarzanie
końcowe w celu odszumienia, wyrównania i rekonstrukcji powierzchni.
W procesie tym wykorzystywane jest różnorodne oprogramowanie, w
szczególności oparte na GPU metody wizualizacji 3D, które na bardziej
wyrafinowaną demarkację przestrzenną.5)
Dane LiDAR odgrywają również ważną rolę w systemach percepcji
pojazdów autonomicznych. Przetwarzanie chmur punktów LiDAR i
szkolenia w dziedzinie autonomicznej jazdy przyczyniły się do
dokładnego postrzegania środowiska drogowego i wykrywania
obiektów.6) Dane te są niezbędne do tworzenia map 3D o wysokiej
rozdzielczości w czasie rzeczywistym, które autonomicznym pojazdom
bezpieczną nawigację w złożonych warunkach drogowych.
punktów LiDAR mogą być również w Na przykład dane zebrane przez
LiDAR zamontowany na samolocie mogą być wykorzystane do
rekonstrukcji modeli 3D formacji geologicznych, które przyczyniają się
do poszukiwania wód gruntowych lub badań geologicznych.7) To
trójwymiarowe modelowanie geologiczne umożliwia nowe interpretacje
geologiczne i pomaga lepiej zrozumieć charakterystykę geologiczną
danego obszaru.
Zalety technologii LiDAR obejmują szybkie pozyskiwanie danych i
wysoką dokładność, ale ma ona ograniczenia stosunkowo wysoki koszt i
wydajność w deszczową lub Trwają prace badawczo-rozwojowe mające 5- -
na celu przezwyciężenie tych ograniczeń technicznych, co na
wykorzystanie LiDAR w szerszym zakresie branż.
Czujnik LiDAR (Light Detection and Ranging) to technologia
wykorzystująca laser do pomiaru powierzchni obiektu, a dane mogą być
wykorzystane do uzyskania informacji przestrzennych 3D. Chmura
punktów wygenerowana przez czujnik LiDAR to zbiór wielu punktów
rozmieszczonych w przestrzeni 3D, z których każdy można opisać za
pomocą wysokości, odległości i położenia.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i wizualizacja
danych 3D. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving. IEEE Transactions on Intelligent Transportation Systems, 24, 962-
979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). Nowe regionalne spostrzeżenia stratygraficzne z trójwymiarowego
modelu geologicznego subbasenu Nasia w Ghanie, opracowanego do celów
hydrogeologicznych i opartego na ponownie przetworzonych danych pola B
pierwotnie zebranych w celu poszukiwania minerałów. Solid Earth, 11, 349-
361.6- -
belki. Dane te kluczowe znaczenie dla postrzegania otoczenia przez
pojazdy autonomiczne, modelowania architekturze i inżynierii lądowej
oraz mapowania 3D.
3. Technologia wykrywania obiektów 3D
Wykrywanie obiektów 3D jest ważną technologią rozpoznawania i
lokalizowania obiektów w przestrzeni 3D i niezbędne w różnych
dziedzinach, w tym w pojazdach autonomicznych, i rzeczywistości
rozszerzonej. się ona głównie na danych 3D zebranych za pomocą
LiDAR, kamer RGB-D i systemów stereowizyjnych.
Wykorzystuje ona chmury punktów generowane przez LiDAR do
rozpoznawania położenia i kształtu obiektów. Modele głębokiego
uczenia, takie jak PointNet, są szeroko stosowane w tej dziedzinie, a
metody te są niezbędne do generowania map 3D o wysokiej
rozdzielczości w czasie rzeczywistym.8)
Jest to technika wykrywania obiektów poprzez łączenie obrazów 2D
uzyskanych przez kamery RGB z informacjami 3D. Metoda ta poprawia
skuteczność wykrywania poprzez dodanie informacji o kolorze i wzorze
obiektu. W ostatnich badaniach zaproponowano metody takie jak
FusionRCNN, która łączy obrazy LiDAR i kamery w celu poprawy
dokładności wykrywania.9)
Struktury głębokiego , takie jak konwolucyjne sieci neuronowe (CNN) i
rekurencyjne sieci neuronowe (RNN), są i rozpoznawania cech 3D.
Modele te poprawiają dokładność klasyfikacji obiektów i szacowania
lokalizacji na podstawie zbiorów danych, co szczególnie ważne w
przypadku rozpoznawania przeszkód w pojazdach autonomicznych.10)
Jest on wykorzystywany do zwiększenia bezpieczeństwa jazdy poprzez
wykrywanie przeszkód i pieszych na drodze. W tym obszarze są
aktywne badania nad połączeniem chmur punktów LiDAR z danymi
wizyjnymi w celu bardziej precyzyjnego wykrywania.11)
Pomaga robotowi zrozumieć środowisko i wchodzić z nim w interakcje.
Jest szczególnie ważne przy określaniu dokładnej lokalizacji obiektów,
aby pomóc robotowi zaplanować ścieżkę i wykonać zadania.7- -
Rozpoznawanie obiektów i reagowanie na nie w czasie rzeczywistym w
celu poprawy wrażeń użytkownika. Na przykład w rzeczywistości
rozszerzonej lokalizacja i kształt obiektów muszą być dokładnie
określone aby poprawić interakcję z obiektami wirtualnymi.
8) Qian, R., Lai, X., & Li, X. (2021). Wykrywanie obiektów 3D dla autonomicznej
jazdy: A Survey. Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. i Li, J. (2023).
FusionRCNN: Fuzja LiDAR-kamera do dwuetapowego wykrywania obiektów
3D. Remote Sensing, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. i Zhang, Z. (2023). Super rzadkie
wykrywanie obiektów 3D. IEEE Transactions on Pattern Analysis and
Machine Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. i Li, J. (2023).
FusionRCNN: Fuzja LiDAR-kamera do dwuetapowego wykrywania obiektów
3D. Remote Sensing, 15, 1839.8- -
Technologie te stale , zapewniając bardziej precyzyjne i wydajne
rozwiązania do wykrywania obiektów 3D. Postępy w badaniach i
technologii znacznie poprawiają dokładność rozpoznawania w
rzeczywistych środowiskach.
Wykrywanie obiektów 3D to dokładna identyfikacja i klasyfikacja
określonych obiektów w przestrzeni 3D, która jest wspierana przez
różne techniki przetwarzania danych przestrzennych 3D. Ostatnio
techniki oparte na głębokim uczeniu się aktywnie zastosowane do
wykrywania obiektów 3D. Reprezentatywne technologie VoxelNet,
PointNet i PointRCNN.
3.1 VoxeLNet
VoxelNet to innowacyjna architektura głębokiego uczenia
zaprojektowana specjalnie do wykrywania obiektów 3D za pomocą
chmur punktów, co ma kluczowe znaczenie w systemach autonomicznej
jazdy. Architektura ta przyjmuje unikalne podejście, konwertując
surowe dane chmury punktów na ustrukturyzowaną siatkę wokseli 3D,
aby umożliwić wydajne przetwarzanie i ekstrakcję cech. Konwersja do
reprezentacji wokseli , ponieważ pozwala VoxelNet skutecznie
wykorzystywać splot 3D do przechwytywania informacji przestrzennych
przy jednoczesnym zapewnieniu wydajności obliczeniowej. Wydajność
ta jest niezbędna dla aplikacji działających w czasie rzeczywistym,
takich jak te wymagane do autonomicznej jazdy.
Siła VoxelNet polega na jego zdolności do włączenia nowej warstwy
kodowania funkcji, która znacznie zwiększa moc reprezentacyjną
każdego woksela. Osiąga się to poprzez uwzględnienie unikalnych cech
punktów zawartych w każdym wokselu, co poprawia zdolność sieci do
wykrywania i klasyfikowania obiektów w złożonych środowiskach.12)
Ten etap kodowania cech ma znaczenie dla rozwiązywania problemów
spowodowanych nieregularnym i rzadkim charakterem danych chmury
punktów, z którymi trudno jest sobie poradzić przy użyciu tradycyjnych
konwolucyjnych sieci neuronowych 2D.
Badania , że VoxelNet wniósł znaczący wkład w dziedzinę wykrywania
obiektów 3D. Na przykładzdolność jego architektury do zapewnienia 9- -
wysokiej dokładności przy jednoczesnym zachowaniu wydajności
obliczeniowej sprawia, że jest on preferowanym wyborem dla aplikacji
międzywdrożeniowych w pojazdach autonomicznych.13) Co więcej,
integracja rzadkiej reprezentacji VoxelNet pozwala mu skutecznie
obsługiwać duże ilości danych, które są powszechne w scenariuszach
autonomicznej jazdy.
Rozwój VoxelNet stanowi znaczący postęp w przetwarzaniu danych 3D i
kładzie podwaliny pod przyszłe innowacje w technologii autonomicznej
jazdy. Rozwiązuje kluczowe wyzwania w tym obszarze, łącząc wydajną
wokselizację z zaawansowanymi technikami kodowania cech.14) Nie
tylko poprawia to dokładność wykrywania, ale także umożliwia bardziej
wyrafinowane egzekwowanie przepisów.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Przeciwstawne
perturbacje chmury punktów przeciwko wykrywaniu obiektów 3D w
autonomicznych systemach jazdy. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: wykrywanie obiektów 3D z
chmury monokularowej, stereo i punktowej do autonomicznej jazdy.
Neurocomputing, 494, 23-32.10- -
VoxelNet przesuwa granice rozwoju systemów percepcji 3D. potężnej
wydajności i innowacyjnemu podejściu, VoxelNet nadal wpływa bieżące
badania i rozwój w zakresie przetwarzania chmur punktów 3D i
systemów autonomicznych.15)
VoxelNet to innowacyjny model wykrywania obiektów 3D, który
przetwarza dane chmury punktów, przekształcając je w siatki 3D
(woksele). Każdy woksel reprezentuje punkt w chmurze punktów, co
pozwala modelowi bardziej efektywne przetwarzanie informacji
przestrzennych. VoxelNet wykorzystuje informacje o wokselach
wykrywania obiektów i tworzenia prognoz. tego podejścia jest to, że jest
ono wydajne i szybkie w przetwarzaniu dużych ilości danych z chmury
punktów.
3.2 PointNet
PointNet to przełomowa architektura głębokiego uczenia, która
rewolucjonizuje przetwarzanie danych chmury punktów 3D poprzez
bezpośrednie wykorzystanie nieuporządkowanych zestawów punktów.
W przeciwieństwie do tradycyjnych metod, które wymagają
ustrukturyzowanych danych wejściowych, PointNet wykorzystuje
funkcje symetrii, aby zapewnić niezmienność permutacji, relacje
przestrzenne między punktami, dzięki czemu pozostaje niezależnie od
punktów wejściowych.
Kluczową innowacją PointNet jest wykorzystanie perceptronów (MLPi
max-pooling. Architektura ta skutecznie agreguje cechy z
poszczególnych punktów w globalną reprezentację, co jest szczególnie
przydatne w zadaniach takich jak klasyfikacja i segmentacja. Dzięki
swojej zdolności do i dokładnego dużych punktów, stał się
podstawowym modelem w tej dziedzinie i zainspirował wiele kolejnych
architektur opartych na jego zasadach.
Wpływ PointNet wykracza poza badania akademickie i obejmuje
praktyczne wdrożenia w obszarach takich jak autonomiczna jazda i
rozpoznawanie robotów. Na przykład, w systemach autonomicznych,
PointNet został wykorzystany do przetwarzania danych LiDAR w celu
poprawy wykrywania obiektów i nawigacji poprzez identyfikację i 11- -
klasyfikację obiektów z jednej próby do następnej.16) Konstrukcja
PointNet pozwala mu skutecznie radzić sobie ze złożonością związaną z
danymi 3D, takimi jak okluzje i różnice w gęstości punktów, co czyni go
wszechstronnym narzędziem w zastosowaniach wizji komputerowej.
Postępy poczynione przez PointNet doprowadziły do jego adaptacji w
różnych innowacyjnych kontekstach. Na przykład, został on
zastosowany do klasyfikacji danych LiDAR z powietrza, poprawiając
dokładność i wydajność operacji teledetekcji.17) Zdolność adaptacyjna
PointNet doprowadziła również do jego integracji z sieciami
neuronowymi opartymi na fizyce w celu analizy propagacji pęknięć.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020).
Wieloprzeglądowa semantyczna sieć ucząca się do wykrywania obiektów 3D
w oparciu o chmurę punktów. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L., & Bennamoun (2019). Deep
Learning for 3D Point Clouds: A Survey, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Airborne LiDAR point cloud
classification using PointNet++ network with full neighbourhood features.
PLOS ONE, 18.12- -
i symulacje dynamiki płynów, i udowodniono, że rozwiązuje złożone
problemy przemysłowe.18)
Pointnet nadal służy jako punkt odniesienia w przetwarzaniu danych 3D,
znacznie zwiększając zdolność modeli głębokiego uczenia się do
przetwarzania danych chmury punktów. Jego wpływ jest widoczny
zarówno w postępach teoretycznych, jak i praktycznych zastosowaniach,
demonstrując jego ciągłe znaczenie i zdolność adaptacji w ewoluującym
krajobrazie sztucznej inteligencji i uczenia maszynowego.19)
PointNet to model, który bezpośrednio przetwarzać dane chmury
punktów i rozpoznawać obiekty w przestrzeni 3D niezależnie od
kolejności każdego punktu. PointNet wyodrębnia cechy punktów i
przeprowadza na ich podstawie klasyfikację i segmentację. Model ten
radzi sobie z nieustrukturyzowaną naturą chmur punktów i może być
stosowany w różnych dziedzinach, takich jak autonomiczna jazda,
robotyka i analiza obrazów medycznych.
3.3 PointRCNN
PointRCNN jest ważnym frameworkiem w dziedzinie wykrywania
obiektów 3D, szczególnie w zastosowaniach takich jak autonomiczna
jazda. Struktura ta wykorzystuje dwuetapowy proces wykrywania w celu
poprawy dokładności i wydajności wykrywania obiektów w danych
chmury punktów 3D. Pierwszym krokiem jest generowanie sugestii
obiektów za pośrednictwem lokalnej sieci sugestii opartej na punktach.
Krok ten , ponieważ działa bezpośrednio na surowych danych chmury
punktów, zachowując szczegółowe informacje przestrzenne, które mogą
zostać utracone w tradycyjnych metodach opartych na projekcji obrazu
lub wokselizacji.
W drugim kroku PointRCNN udoskonala początkową propozycję,
wykonując ramki ograniczającej 3D. Dostosowuje to rozmiar i
orientację , aby lepiej dopasować wykryte obiekty do danych chmury
punktów. Wykorzystując cechy wyodrębnione bezpośrednio z surowej
chmury punktów, PointRCNN osiąga wyższą dokładność wykrywania
szczególnie w trudnych środowiskach o złożonej geometrii i okluzji.13- -
Jedną z głównych zalet PointRCNN jest jego do uczenia się od początku
do końca. Architektura ta ułatwia płynną integrację etapów sieci,
poprawiając nie tylko wydajność wykrywania modelu, ale także jego
wydajność obliczeniową, dzięki czemu nadaje się zastosowań w czasie
rzeczywistym, takich jak te wymagane w systemach autonomicznej
jazdy.
Badania wykazały, że metody wykorzystujące dane z chmury punktów
mogą znacznie poprawić zrozumienie i interpretację scen 3D w
sytuacjach autonomicznej jazdy. Na przykład wykorzystanie algorytmów
wykrywania wielu celów opartych na PointRCNN i technikach fuzji
chmur punktów wokseli może być stosowane w dynamicznych
scenariuszach ze względu na ich wszechstronność i
18) Kashefi, A., & Mukerji, T. (2022). PointNet oparty na fizyce: solver
głębokiego uczenia dla nieściśliwych przepływów w stanie ustalonym i pól
termicznych na wielu zestawach nieregularnych geometrii. Journal of
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-Based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.14- -
Ponadto badania w dziedzinie chmur punktów 3D i głębokiego uczenia
się rosnące znaczenie tych ram dla zrozumienia sceny w autonomicznej
jeździe.20)
Ogólnie rzecz biorąc, PointRCNN stanowi znaczący postęp w technologii
wykrywania obiektów 3D. Jego zdolność do bezpośredniego
przetwarzania surowych danych punktów i wydajny dwuetapowy proces
wykrywania potężne narzędzie dla autonomicznej jazdy, gdzie szybkie i
dokładne obiektów ma kluczowe znaczenie dla bezpieczeństwa i
wydajności.
PointRCNN to technologia, która wykorzystuje CNN (Convolutional
Neural Network) opartą na PointNet do wykrywania obiektów 3D i
skutecznie przetwarza dane chmury punktów dokładnego wykrywania
obiektów. PointRCNN to technologia, która rozszerza istniejącą metodę
wykrywania obiektów 2D na środowiska 3D i jest stosowana do
rozpoznawania obiektów pojazdów autonomicznych i rozpoznawania
środowiska robotów.
4. Zastosowania
Sieci PointRCNN odgrywają kluczową rolę w systemach autonomicznej
jazdy i są wykorzystywane do dokładnego rozpoznawania i śledzenia
obiektów w otaczającym środowisku. obiektów przy użyciu punktów 3D
może pomóc pojazdom przeszkód drogowych z dużą dokładnością,
nawet w złożonych sytuacjach drogowych.22)
Robot wykorzystuje technologię wykrywania obiektów 3D do interakcji
z otoczeniem. PointRCNN umożliwia robotowi zrozumienie jego
środowiska od uruchomienia do uruchomienia i wykonanie
niezbędnych działań.24)
Aby płynnie wstawiać wirtualne obiekty do świata rzeczywistego w
środowisku AR, jest dokładne wykrywanie obiektów w przestrzeni 3D.
PointRCNN ważną rolę w tym zadaniu.
Drony potrzebują zdolności do rozpoznawania i unikania różnych
przeszkód podczas lotu. PointRCNN może być wykorzystywany do
wykrywania obiektów w czasie rzeczywistym na podstawie danych z 15- -
czujników drona i ustawiania bezpiecznej ścieżki lotu.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
21) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-Based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X., & Li, X. (2021). Wykrywanie obiektów 3D dla
autonomicznej jazdy: A Survey. Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). Wykrywanie obiektów 3D dla
autonomicznej jazdy: A Comprehensive Survey. International Journal of
Computer Vision, 131, 1909-1963.
24) Wang, L., & Huang, Y. (2022). A Survey of 3D Point Cloud and Deep
Learning-Based Approaches for Scene Understanding in Autonomous
Driving. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019).16- -
PointRCNN jest stosowany do modelowania 3D i analizy środowisk
miejskich, zapewniając ważny wgląd w planowanie i zarządzanie
miastem. pomóc poprawić wydajność transportu i zwiększyć
bezpieczeństwo w miastach.
W tych zastosowaniach PointRCNN są bardzo przydatne w sytuacjach, w
których wymagana jest wysoka dokładność i przetwarzanie w czasie
rzeczywistym. Badania pokazują, że techniki takie jak algorytmy
wykrywania wielu celów oparte na PointRCNN swoją wydajność i
skuteczność w tych zastosowaniach.26) PointRCNN przyczynia się do
maksymalizacji dokładności i wydajności wykrywania obiektów 3D, co
ważne dla rozwoju autonomicznych pojazdów i innych
zaawansowanych systemów.
Technologia przetwarzania danych przestrzennych 3D wykorzystywana
w wielu różnych branżach. Niektóre z głównych zastosowań obejmują
4.1 Pojazdy autonomiczne
Pojazdy to pojazdy wykorzystujące zaawansowaną technologię do
samodzielnego prowadzenia bez interwencji człowieka. Pojazdy te
wykorzystują różnorodne czujniki, kamery, radary, LiDAR i inne, aby
uzyskać precyzyjną świadomość otoczenia. Technologie te, w połączeniu
z przetwarzaniem danych w czasie rzeczywistym, są niezbędne do
określania bezpiecznych tras jazdy.
W szczególności technologia wykrywania obiektów 3D jest kluczowym
elementem pojazdów autonomicznych, odgrywając ważną rolę w
dokładnym wykrywaniu i rozpoznawaniu obiektów wokół pojazdu.
PointRCNN, na przykład, wykorzystuje dane chmury punktów, aby
umożliwić analizę otoczenia pojazdu w wysokiej rozdzielczości. to
pojazdom autonomicznym rozpoznawanie pieszych, innych pojazdów,
znaków drogowych i innych obiektów w czasie rzeczywistym w celu
zapewnienia bezpiecznej jazdy.27)
Pojazdy autonomiczne również zdolność uczenia się wzorców jazdy i
dostosowywania się do różnych sytuacji na drodze poprzez zastosowanie
technologii uczenia maszynowego i sztucznej inteligencji. Technologie 17- -
te przyczyniają do poprawy bezpieczeństwa pojazdów, wydajności i
komfortu użytkowania. W szczególności technologia fuzji wielu
czujników poprawia dokładność wykrywania obiektów 3D, niezawodne
działanie w różnych środowiskach.28)
Przegląd metod wykrywania obiektów 3D w zastosowaniach autonomicznej
jazdy. IEEE Transactions on Intelligent Transportation Systems, 20, 3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Technologia fuzji wielu czujników
do wykrywania obiektów 3D w jeździe autonomicznej: A Review. IEEE
Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Pojazdy autonomiczne kluczowym obszarem innowacji w przyszłych
systemach transportowych dzięki konwergencji złożonych algorytmów i
technologii czujników. Technologie te pozytywny wpływ na
społeczeństwo jako całość, zmniejszając zatory komunikacyjne,
ograniczając liczbę wypadków drogowych i umożliwiając bardziej
efektywny przepływ ruchu.29)
Pojazdy autonomiczne wykorzystują czujniki LiDAR i technologię
wykrywania obiektów 3D do postrzegania i analizowania otoczenia
pojazdu czasie rzeczywistym. Umożliwia to omijanie przeszkód,
rozpoznawanie pieszych, analizę skrzyżowań i , aby zmaksymalizować
bezpieczeństwo pojazdu i wydajność jazdy.
4.2 Opieka zdrowotna
Techniki wykrywania obiektów 3D w medycynie, zwłaszcza takie jak
PointRCNN, szeroki zakres potencjalnych zastosowań. Technologie te
są wykorzystywane głównie w obrazowaniu medycznym, robotyce
chirurgicznej, systemach monitorowania pacjentów itp.
Technologia wykrywania obiektów 3D pomaga dokładnym wykrywaniu
zmian w obrazach TK, MRI i USG. Jest to szczególnie ważne w
dziedzinach takich jak radiologia, gdzie można ją połączyć z
komputerowymi systemami diagnostycznymi wykorzystującymi
sztuczną inteligencję i uczenie maszynowe w celu poprawy dokładności
diagnostycznej.30)
W systemach robotów chirurgicznych technologia wykrywania
obiektów 3D umożliwia dokładne rozpoznawanie otaczających tkanek i
narządów podczas operacji, pomagając zapewnić bezpieczną i
precyzyjną operację. W połączeniu z postępami w dziedzinie sztucznej
inteligencji medycznej może to znacznie poprawić wydajność i
bezpieczeństwo operacji.31)
Czujniki 3D i technologia wykrywania obiektów mogą analizować ruchy
i parametry życiowe pacjenta w czasie rzeczywistym, aby wykrywać
nieprawidłowości na wczesnym etapie. Technologie te łączyć z opartymi
na sztucznej inteligencji systemami monitorowania pacjentów w celu 19- -
ciągłego śledzenia stanu pacjenta i zarządzania nim.32)
W połączeniu z rzeczywistością wirtualną (VR) może być wykorzystywana
w edukacji i szkoleniach medycznych. Technologia wykrywania obiektów
3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Przegląd metod wykrywania obiektów 3D dla aplikacji
autonomicznej jazdy. IEEE Transactions on Intelligent Transportation
Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). Raport grupy zadaniowej AAPM 273:
Zalecenia dotyczące najlepszych praktyk w zakresie sztucznej inteligencji i
uczenia maszynowego w diagnostyce wspomaganej komputerowo w
obrazowaniu medycznym. Fizyka medyczna.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). Wpływ systemów wspomagania decyzji
opartych na sztucznej inteligencji na przepływ pracy pielęgniarskiej na
oddziałach intensywnej opieki medycznej. Międzynarodowy przegląd
pielęgniarski, Brak.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023).
Sztuczna inteligencja w systemach wspomagania decyzji klinicznych w
onkologii. International Journal of Medical Sciences, 20, 79-86.20- -
ważną rolę w pomaganiu lekarzom i pracownikom służby zdrowia w
symulowaniu operacji i diagnoz, umożliwiając naukę w realistycznym
środowisku.33)
Aplikacje te przyczyniają się do zwiększenia dokładności diagnostyki i
leczenia w dziedzinie medycyny oraz poprawy ogólnego bezpieczeństwa.
W szczególności technologia wykrywania obiektów 3D w połączeniu ze
sztuczną inteligencją przyspiesza innowacje w opiece zdrowotnej i staje
ważnym narzędziem poprawy zdrowia i bezpieczeństwa pacjentów.
Badania te dostarczają nowych perspektyw na komercyjne, regulacyjne i
społeczne implikacje sztucznej inteligencji w medycynie.34)
W medycynie przetwarzanie danych przestrzennych 3D
wykorzystywane do precyzyjnej diagnostyki i planowania
chirurgicznego. Dane chmury punktów z obrazowania medycznego 3D,
takie jak wyniki tomografii komputerowej lub rezonansu
magnetycznego, są wykorzystywane do wizualizacji miejsca operacji
oraz pomiaru jego dokładnej lokalizacji i rozmiaru w celu poprawy
dokładności chirurgicznej.
4.3 Automatyka przemysłowa i robotyka
Technologie wykrywania obiektów 3D, w szczególności modele takie jak
PointRCNN, rewolucjonizują dziedzinę automatyki przemysłowej i
robotyki. Technologie te znacznie poprawiają wydajność i dokładność w
wielu różnych branżach i odgrywają ważną rolę w następujących
konkretnych obszarach
Technologia wykrywania obiektów 3D jest niezbędna dla systemów
zrobotyzowanych do rozpoznawania i sortowania obiektów w
magazynie. Umożliwia ona robotom dokładne rozpoznawanie obiektów
o różnych rozmiarach i kształtach, pozwalając im na wykonywanie
wydajnych zadań związanych z przemieszczaniem i sortowaniem.
Technologie te zwiększają wydajność procesów przemysłowych i
ułatwiają automatyzację systemów logistycznych.35)
Gdy roboty przemysłowe automatycznie montują części, wykrywanie
obiektów 3D zwiększa wydajność montażu poprzez rozpoznawanie
dokładnej pozycji i orientacji części. Przyczynia się to znacząco do 21- -
zwiększenia tempa produkcji i zmniejszenia liczby defektów, a ważną
rolę w inteligentnych środowiskach produkcyjnych.36)
Są one wykorzystywane do kontroli geometrii i wymiarów produktów
przy użyciu technologii skanowania 3D i ważną rolę w zapewnianiu
jakości produktów, wczesnym wykrywaniu wad i obniżaniu kosztów. Te
zautomatyzowane części
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020). Oparte
na sztucznej inteligencji przewidywanie ryzyka raka płuc przy użyciu
nieobrazowej elektronicznej dokumentacji medycznej: podejście głębokiego
uczenia się. Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and Genetic
Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., &
White, M. (2021). Sim2Real w robotyce i automatyce: zastosowania i
wyzwania. IEEE Transactions on Automation Science and Engineering, 18,
398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. i Kim, H. (2021).
Oparta na uczeniu się automatyzacja zrobotyzowanego montażu dla
inteligentnej produkcji. Proceedings of the IEEE, 109, 423-440.22- -
Systemy kontroli jakości zwiększają niezawodność produktów.37)
Aby zwiększyć bezpieczeństwo robotów i systemów automatyki,
wykorzystywana jest technologia wykrywania obiektów 3D. Umożliwia
to rozpoznawanie pobliskich lub bezpieczne Te mechanizmy
bezpieczeństwa przyczyniają się do zmniejszenia liczby wypadków w
warunkach przemysłowych.38)
Dla autonomicznych pojazdów lub dronów kluczowe znaczenie ma
wykrywanie obiektów i planowanie tras. Technologia wykrywania
obiektów 3D tym systemom wydajne działanie, omijanie przeszkód i
bezpieczne wykonywanie zadań związanych z dostawą.39)
W tych obszarach technologie wykrywania obiektów 3D innowacje w
automatyce przemysłowej, pomagając zwiększyć produktywność,
obniżyć koszty i poprawić bezpieczeństwo. W przyszłości technologie te
będą nadal integralną częścią ewolucji robotyki i systemów automatyki.
Badania wykazały, że zastosowanie tych technologii w znacznym stopniu
przyczynia do zwiększenia wydajności procesów przemysłowych i
zarządzania złożonością zautomatyzowanych systemów.40)
W automatyce przemysłowej i robotyce przetwarzanie danych
przestrzennych 3D jest wykorzystywane do zwiększania wydajności
procesów produkcyjnych i automatyzacji kontroli jakości. Roboty
wykorzystują czujniki LiDAR lub kamery 3D rozpoznawania produktów,
wykrywania anomalii i rozwiązywania problemów jakościowych.
4.4 Systemy nadzoru bezpieczeństwa
W systemach nadzoru bezpieczeństwa technologia wykrywania
obiektów 3D ważną rolę w zapewnianiu skutecznych rozwiązań w
zakresie monitorowania i bezpieczeństwa w różnych środowiskach.
Technologia ta szczególnie widoczna w takich obszarach, jak
monitorowanie w czasie rzeczywistym, wykrywanie włamań,
zapobieganie incydentom, analiza danych i raportowanie oraz
integracja sztucznej inteligencji.
Dzięki możliwości monitorowania w czasie rzeczywistym, systemy
wykrywania obiektów 3D wykorzystują kamery i czujniki do analizy 23- -
otaczającego środowiska w czasie rzeczywistym. Ta analiza w czasie
rzeczywistym umożliwia dokładne rozpoznawanie ludzi, pojazdów i
obiektów oraz zapewnia natychmiastowe ostrzeżenia w przypadku
niebezpiecznej sytuacji. Ma to zasadnicze znaczenie dla zwiększenia
bezpieczeństwa, zwłaszcza w złożonych środowiskach, takich jak drogi i
lotniska.
Jeśli chodzi o wykrywanie włamań, technologia wykrywania obiektów
3D jest skuteczna w wykrywaniu nietypowego ruchu lub zachowania w
określonym obszarze bezpieczeństwa. Może to prowadzić do wczesnego
wykrycia zbliżania się intruza i zapewnić personelowi ochrony
natychmiastową pomoc.
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Automatyzacja
przemysłowa i jakość produktu: rola zrobotyzowanej transformacji
produkcji. Ekonomia stosowana.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019).
Projektowanie dynamicznych i współpracujących systemów automatyki i
robotyki. IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robotyka: od automatyzacji do inteligentnych systemów.
Inżynieria.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Widzenie przemysłowe i automatyzacja. Measurement Science and
Technology, 33.24- -
Zapobieganie nieautoryzowanemu wejściu do zabezpieczonych obszarów
poprzez dostarczanie czerwonych alertów.
Jeśli chodzi o zapobieganie wypadkom, systemy te zapobiegają
wypadkom w różnych środowiskach, w tym w zakładach przemysłowych,
poprzez wczesne wykrywanie zagrożeń i dostarczanie ostrzeżeń. Na
przykład automatyczny system ostrzegawczy uruchomiony, gdy
pracownik zbliża się do niebezpiecznego obszaru, aby zapobiec
wypadkowi.
Funkcje analizy danych i raportowania pomagają ocenić sytuację w
zakresie bezpieczeństwa i zidentyfikować problemy poprzez późniejszą
analizę przy użyciu zebranych danych 3D. Analizy te zapewniają ważny
wgląd w przyszłą strategię bezpieczeństwa i ciągłe doskonalenie
bezpieczeństwa.
Dzięki integracji sztucznej inteligencji, technologia wykrywania
obiektów 3D może być połączona z algorytmami uczenia maszynowego
w celu stworzenia bardziej inteligentnego systemu nadzoru. to
systemowi uczenie się wzorców i wdrażanie bardziej zaawansowanych
mechanizmów ostrzegania i reagowania.
W ten sposób technologia wykrywania obiektów 3D staje się integralną
częścią systemów nadzoru bezpieczeństwa, spełniając różne potrzeby w
zakresie bezpieczeństwa i przyczyniając się do bezpieczeństwa obiektów.
Oczekuje się, że technologie te będą dalej ewoluować w przyszłości,
prowadząc do bardziej wyrafinowanych i wydajnych rozwiązań w
zakresie nadzoru bezpieczeństwa. Te postępy technologiczne
przekształcą się w bardziej niezawodne systemy bezpieczeństwa,
zwłaszcza dzięki integracji ze sztuczną inteligencją.41)
Technologia wykrywania obiektów 3D również ważną rolę w systemach
nadzoru bezpieczeństwa. Czujniki LiDAR i technologia wykrywania
obiektów 3D wykorzystywane do wykrywania intruzów lub określania,
czy w pobliżu znajdują się ludzie. również analizować wzorce zachowań
w przestrzeni 3D w celu śledzenia i zapobiegania nielegalnej działalności.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Metoda
wykrywania małych celów w podczerwieni oparta na mechanizmie
ważonego porównania wzrokowego człowieka do monitorowania
bezpieczeństwa. Remote. Sens., 15, 2922.26- -
4.5 VR/AR
W wirtualnej (VR) i rozszerzonej (AR) technologia wykrywania obiektów
3D znacząco poprawia wrażenia użytkownika w różnych branżach.
Wykrywanie obiektów 3D umożliwia użytkownikom interakcję z
rzeczywistymi obiektami w środowiskach wirtualnych, co jest
niezbędne dla aplikacji AR do rozpoznawania otoczenia w czasie
rzeczywistym w celu dokładnego umieszczania i manipulowania
wirtualnymi elementami. Sprawia to, że doświadczenie użytkownika jest
bardziej wciągające.
W środowiskach VR wykrywanie obiektów 3D wykorzystywane do
tworzenia realistycznych symulacji. Zapewnia to scenariusze
szkoleniowe w różnych dziedzinach, w tym w medycynie, i lotnictwie,
umożliwiając uczestnikom bezpieczne doświadczanie i ćwiczenie
rzeczywistych sytuacji. Zastosowanie VR/AR, zwłaszcza w dziedzinie
bezpieczeństwa budowlanego, zwiększa świadomość bezpieczeństwa
pracowników.42)
W branży gier wykrywanie obiektów 3D zapewnia wrażenia dzięki
dokładnemu śledzeniu ruchu i pozycji gracza. Umożliwia to interakcję z
wirtualnymi postaciami, zwiększając realizm gry.
W architekturze i inżynierii technologia AR może być wykorzystywana
do wizualizacji modeli projektowych w świecie rzeczywistym. pomóc w
wykrywaniu błędów w procesie projektowania z wyprzedzeniem i
ułatwić komunikację z klientami. Aplikacje te mogą być szczególnie
synergiczne z bezpieczeństwem konstrukcji.43)
Technologia AR pomaga konsumentom podejmować decyzje zakupowe,
umożliwiając im wirtualne doświadczanie produktów. Na przykład daje
im możliwość umieszczenia mebli w domu lub wypróbowania kolorów
kosmetyków z wyprzedzeniem. Zwiększa to doświadczenie zakupowe i
interakcję konsumenta.44)
W ten sposób technologia wykrywania obiektów 3D zapewnia
innowacyjne doświadczenia w VR i AR i jest wykorzystywana w różnych
branżach. W przyszłości technologie te będą nadal ewoluować, dzięki
czemu interakcja między użytkownikiem a środowiskiem wirtualnym 27- -
będzie jeszcze bardziej płynna i naturalna. Spowoduje to dalsze
rozszerzenie zastosowania technologii VR/AR w edukacji, rozrywce,
handlu i nie tylko. Jednocześnie postępy w tych stworzą nowe
możliwości w branży turystycznej i hotelarskiej.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
"Efekty perswazji reklam wideo w rzeczywistości wirtualnej (VR) i
rzeczywistości rozszerzonej (AR): przegląd koncepcyjny". Journal of
Business Research.
45) Wei, W. (2019). Postęp badań nad rzeczywistością wirtualną (VR) i
rzeczywistością rozszerzoną (AR) w turystyce i hotelarstwie. Journal of
Hospitality and Tourism Technology, 10, 539-570.28- -
W rzeczywistości wirtualnej (VR) i rozszerzonej (AR) dane przestrzenne
3D odgrywają ważną rolę interakcji z obiektami w świecie rzeczywistym.
Dane przestrzenne 3D prawidłowe umieszczenie wirtualnych obiektów
w świecie rzeczywistym i pozwalają użytkownikom na interakcję z nimi
w naturalny sposób.
5. Wnioski
Technologia przetwarzania danych przestrzennych 3D wiele dziedzin, w
tym autonomiczną jazdę, opiekę zdrowotną, przemysł, bezpieczeństwo i
VR/AR. W szczególności czujniki LiDAR i technologie wykrywania
obiektów 3D ważną rolę w każdej z tych dziedzin, przyczyniając się do
analizy środowiska w czasie rzeczywistym, dokładnej diagnostyki i
leczenia oraz wydajnych systemów automatyzacji. Technologie te nadal
ewoluować i zapewniać bogatsze doświadczenia użytkowników w
różnych dziedzinach.29- -
Referencje
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Lidar Point Cloud Compression, Processing and Learning for
Autonomous Driving. IEEE Transactions on Intelligent Transportation
Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Przegląd metod wykrywania obiektów 3D dla
aplikacji autonomicznej jazdy. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Obliczanie i
wizualizacja danych 3D. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Sztuczna inteligencja w medycynie. New England
Journal of Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Usprawnianie procesów
przemysłowych poprzez automatyzację i robotyzację. Maszyny.
6. Cao, M., & Wang, J. (2020). Wykrywanie przeszkód w pojazdach
autonomicznych za pomocą fuzji czujników Multi-LiDAR. Journal of
Dynamic Systems Measurement and Control - Transactions of the ASME,
142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: wykrywanie obiektów 3D
z chmury monokularowej, stereo i punktowej do autonomicznej jazdy.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023).
Metoda wykrywania małych celów w podczerwieni oparta na
mechanizmie ważonego porównania wzrokowego człowieka do
monitorowania bezpieczeństwa. Remote. Sens., 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). Nowe regionalne spostrzeżenia stratygraficzne z
trójwymiarowego modelu geologicznego subbasenu Nasia w Ghanie,
opracowanego do celów hydrogeologicznych i opartego na ponownie
przetworzonych danych pola B pierwotnie zebranych w celu
poszukiwania minerałów. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and
Industrial Systematic Mapping Study, IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. i Zhang, Z. (2023). Super 30- -
rzadkie wykrywanie obiektów 3D. IEEE Transactions on Pattern
Analysis and Machine Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Metody wykrywania i klasyfikacji obiektów 3D oparte na
chmurze punktów dla aplikacji autonomicznej jazdy: przegląd i
taksonomia. Fuzja informacji, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. i Bennamoun (2019).
Głęboki31- -
IEEE Transactions on Pattern Analysis and Machine Intelligence, 43,
4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi,
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T, Greenspan, H.,
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R.
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). Raport grupy zadaniowej AAPM 273: Zalecenia
dotyczące najlepszych praktyk w zakresie sztucznej inteligencji i
uczenia maszynowego w diagnostyce wspomaganej komputerowo w
obrazowaniu medycznym. Fizyka medyczna.
15. Huang, S. (2019). Rzeczywistość rozszerzona i rzeczywistość
wirtualna: siła AR i VR dla . Information Technology and Tourism, 21,
457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. i Kim, H. (2021).
Oparta na uczeniu się automatyzacja zrobotyzowanego montażu dla
inteligentnej produkcji. Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). "Efekty perswazji reklam wideo w rzeczywistości wirtualnej (VR)
i rzeczywistości rozszerzonej (AR): przegląd koncepcyjny". Journal of
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. i Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval, Computer Vision and Image Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Wciągające technologie
interaktywne i wirtualne doświadczenia zakupowe: Różnice w
postrzeganiu przez konsumentów rzeczywistości rozszerzonej (AR) i
wirtualnej (VR). Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hiper-automatyzacja w przemyśle wytwórczym. J.
Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Krytyczny
przegląd zastosowań rzeczywistości wirtualnej i rozszerzonej (VR/AR) w
bezpieczeństwie budowlanym. Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). Wykrywanie obiektów 3D
dla autonomicznej jazdy: A Comprehensive Survey. International 32- -
Journal of Computer Vision, 131, 1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Widzenie przemysłowe i automatyzacja. Measurement Science and
Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Sztuczna
inteligencja w opiece zdrowotnej: mistrzostwo. Biotechnology and
Genetic Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). Robotyka: od automatyzacji do inteligentnych
systemów. Inżynieria.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B.
(2022). Dynamiczny graf33- -
transformator do wykrywania obiektów 3D. Knowledge-Based Systems,
259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: oparte na
głębokim uczeniu wykrywanie obiektów 3D przy użyciu semantycznej
chmury punktów. Visual Computer, , 1-15.
29. Wei, W. (2019). Postęp badań nad rzeczywistością wirtualną (VR) i
rzeczywistością rozszerzoną (AR) w turystyce i hotelarstwie. Journal of
Hospitality and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Nowa metoda
poszukiwania regionalnego oparta na nowoczesnej grafice 3D. Minerały.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H., & Li, Y. (2020).
Oparte na sztucznej inteligencji przewidywanie ryzyka raka płuc przy
użyciu nieobrazowej elektronicznej medycznej: podejście głębokiego
uczenia się. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Wspomagane komputerowo wykrywanie i
diagnostyka/radiomatyka/uczenie maszynowe/głębokie uczenie się w
obrazowaniu medycznym. Fizyka medyczna.
'세미나 자료' 카테고리의 다른 글
Tecnologia de processamento de dados espaciais 3D e suas aplicações
Relatório de pesquisa: Tecnologia de processamento de dados
espaciais 3D e suas aplicações Instituto de Pesquisa de IA do
Condado de 2025_01Youngho Hong
Resumos:
Esta pesquisa abrange o desenvolvimento e a aplicação de tecnologias
de processamento de dados espaciais 3D, especialmente a aquisição de
dados de nuvem de pontos e tecnologias de detecção de objetos 3D
usando sensores LiDAR. Ela se concentra nas tecnologias de detecção de
objetos 3D VoxelNet, PointNet e PointRCNN e explica como essas
tecnologias estão sendo usadas em vários campos, como veículos
autônomos, saúde, automação industrial, sistemas de vigilância de
segurança e VR/AR. Os dados da nuvem de pontos coletados pelos
sensores LiDAR analisam o espaço 3D com alta precisão, e a tecnologia
de detecção de objetos 3D baseada neles um papel importante na
conscientização ambiental em tempo real, no diagnóstico de precisão,
na otimização do processo de fabricação etc. Este estudo analisa o
impacto da tecnologia de processamento de dados espaciais em 3D no
setor moderno e na inovação tecnológica, e discute o potencial de
desenvolvimento futuro.
Palavras-chave:
Dados espaciais 3D, sensores LiDAR, nuvem de pontos,
detecção de objetos 3D, VoxelNet, PointNet, PointRCNN, veículos
autônomos, saúde, automação industrial, sistemas de vigilância de
segurança, VR/AR, aprendizagem profunda2- -
1. Introdução
Envolve o processo de coleta, armazenamento, análise e visualização de
dados e usa tecnologias como LiDAR, fotogrametria e digitalização em
3D para processar informações espaciais tridimensionais. Essas
tecnologias são usadas em uma variedade de plataformas de software,
os sistemas de informações geográficas (GIS) e o design auxiliado por
computador (CAD) as principais ferramentas. Isso análises espaciais
complexas.
O LiDAR usa pulsos de laser para coletar dados de distância, enquanto a
fotogrametria usa fotografias aéreas para criar modelos 3D. Esses dados
são armazenados em um banco de dados e usados para análise e
visualização quando necessário.1)
A pesquisa mostrou que as estruturas de CNN 3D podem ser usadas para
aprender representações 3D e que isso pode ser feito de forma mais
eficiente do que os métodos tradicionais baseados em CNN totalmente
3D.2)
Os métodos de visualização 3D baseados em GPU permitem uma
demarcação espacial mais sofisticada e precisa.3)
A modelagem 3D é usada como uma ferramenta essencial no processo
de simulação e projeto arquitetônico. Ela permite que você a segurança
das estruturas e aumente a precisão de seus projetos.
Os dados espaciais em 3D são usados em pesquisas sobre mudanças no
ecossistema e gerenciamento de desastres. Por exemplo, a modelagem
geológica em 3D é usada para exploração de águas subterrâneas e
pesquisa geológica.4)
Os dados 3D estão sendo usados para desenvolver ambientes imersivos
para aprimorar a experiência do usuário. Isso sendo aplicado em uma
variedade de setores, incluindo educação, saúde e entretenimento.
As tecnologias de processamento de dados espaciais em 3D estão
avançando rapidamente em vários campos, principalmente na aquisição
de dados de nuvens de pontos e na detecção de objetos no espaço 3D 3- -
usando sensores LiDAR. Essas tecnologias revolucionando veículos
autônomos, aplicações médicas, automação industrial, sistemas de
vigilância de segurança e ambientes de VR/AR. Este relatório de
pesquisa fornece uma compreensão básica das tecnologias de
processamento de dados espaciais em 3D e explica como elas estão
sendo aplicadas em vários setores.
1) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e visualização de
dados 3D. Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Convolução triplanar com kernels 2D compartilhados para classificação 3D e
recuperação de formas. Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Um novo método para prospecção
regional baseado em gráficos 3D modernos. Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). New regional stratigraphic insights from a 3D geological model of the
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based on
reprocessed B-field data originally collected for mineral exploration. Solid Earth,
11, 349-361.4- -
2. Coleta de dados do Point CLoud com sensores LiDAR
A aquisição de dados de nuvem de pontos usando sensores LiDAR
desempenha um papel importante em uma ampla gama de aplicações e
é particularmente adequada para a aquisição de dados 3D de alta
resolução. A tecnologia LiDAR emite pulsos de laser para receber sinais
refletidos de objetos e calcula informações de distância com base neles.
Essas informações são armazenadas em um formato de nuvem de
pontos, em que cada ponto contém coordenadas X, Y e Z e intensidade
de reflexão.
As nuvens de pontos LiDAR podem ser em diversos campos, incluindo
urbano, ambiental e gerenciamento de recursos. Por exemplo, elas
podem ser úteis para a análise estrutural de florestas ou para o
levantamento de precisão de edifícios. As nuvens de pontos são então
convertidas em 3D ou dados de GIS por meio de pós-processamento
para redução de ruído, alinhamento e reconstrução de superfície. Uma
variedade de softwares é usada nesse processo, especialmente métodos
de visualização 3D baseados em GPU, que permitem uma demarcação
espacial mais sofisticada.5)
Os dados LiDAR também desempenham uma função importante nos
sistemas de percepção para veículos autônomos. O processamento e o
treinamento da nuvem de pontos LiDAR no campo da direção autônoma
contribuíram para a percepção precisa do ambiente rodoviário e para a
detecção de objetos.6) Esses dados são essenciais para a construção de
mapas 3D de alta resolução e em tempo real, que os veículos autônomos
naveguem com segurança em condições rodoviárias complexas.
de pontos LiDAR também podem ser na Por exemplo, os dados
coletados pelo LiDAR montado em aeronaves podem ser usados para
reconstruir modelos 3D de formações geológicas, que contribuem para a
exploração de águas subterrâneas ou para a pesquisa geológica.7) Essa
modelagem geológica 3D permite novas interpretações geológicas e
ajuda a entender melhor as características geológicas de uma área.
As vantagens da tecnologia LiDAR incluem a aquisição de dados em alta
velocidade e a alta precisão, mas ela tem limitações o custo 5- -
relativamente alto e o desempenho em chuvoso ou Pesquisas e
desenvolvimentos contínuos estão sendo feitos para superar essas
limitações técnicas, o que está permitindo que o LiDAR seja usado em
uma variedade maior de setores.
Um sensor LiDAR (Light Detection and Ranging) é uma tecnologia que
usa um laser para medir a superfície de um objeto, e os dados podem
ser usados para obter informações espaciais em 3D. Os dados da nuvem
de pontos gerados por um sensor LiDAR são uma coleção de muitos
pontos distribuídos no espaço 3D, cada um dos quais pode ser descrito
por elevação, distância e posicionamento.
5) Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e visualização de
dados 3D. Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J. (2023).
Compressão, processamento e aprendizado da nuvem de pontos Lidar para
direção autônoma. IEEE Transactions on Intelligent Transportation Systems, 24,
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & Banoeng-Yakubo, B.
(2020). New regional stratigraphic insights from a 3D geological model of the
Nasia sub-basin, Ghana, developed for hydrogeological purposes and based on
reprocessed B-field data originally collected for mineral exploration. Solid Earth,
11, 349-361.6- -
vigas. Esses dados são cruciais para a percepção dos veículos autônomos
de seus arredores, modelagem arquitetura e engenharia civil e
mapeamento em 3D.
3. Tecnologia de detecção de objetos 3D
A detecção de objetos em 3D é uma tecnologia importante para
reconhecer e localizar objetos no espaço 3D e essencial em vários
campos, incluindo veículos autônomos, e realidade aumentada. Ela
principalmente em dados 3D coletados por meio de LiDAR, câmeras
RGB-D e sistemas de visão estéreo.
Ele utiliza nuvens de pontos geradas pelo LiDAR para reconhecer a
localização e a forma dos objetos. Modelos de aprendizagem profunda,
como o PointNet, são amplamente usados nesse campo, e esses métodos
são essenciais para gerar mapas 3D de alta resolução e em tempo real.8)
É uma técnica para detectar objetos combinando imagens 2D obtidas
por câmeras RGB com informações 3D. Esse método melhora o
desempenho da detecção ao adicionar informações de cor e padrão do
objeto. Estudos recentes propuseram métodos como o FusionRCNN, que
combina imagens LiDAR e de câmeras para melhorar a precisão da
detecção.9)
Estruturas profunda, como as redes neurais convolucionais (CNNs) e as
redes neurais recorrentes (RNNs), são usadas para e reconhecer
recursos de 3D. Esses modelos melhoram a precisão da classificação de
objetos e da estimativa de localização com base em conjuntos de dados,
o que especialmente importante para o reconhecimento de obstáculos
em veículos autônomos.10)
Ele é usado para aumentar a segurança ao dirigir, detectando obstáculos
e pedestres na estrada. uma pesquisa ativa nessa área para fundir
nuvens de pontos LiDAR com dados de visão para uma detecção mais
precisa.11)
Ele ajuda o robô a entender e interagir com seu ambiente. Isso
especialmente importante para determinar a localização exata dos
objetos para ajudar o robô a planejar seu caminho e executar tarefas.7- -
Reconhecer e reagir a objetos em tempo real para aprimorar a
experiência do usuário. Por exemplo, na realidade aumentada o local e a
forma dos objetos devem ser determinados com precisão para
aprimorar a interação com os objetos virtuais.
8) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving
(Detecção de objetos 3D para direção autônoma): Pattern Recognition, 130,
108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: fusão LiDAR-câmera para detecção de objetos 3D em dois estágios.
Sensoriamento Remoto, 15, 1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super Sparse 3D
Object Detection (Detecção de objetos 3D superesparsos). IEEE Transactions on
Pattern Analysis and Machine Intelligence, 45, 12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L., & Li, J. (2023).
FusionRCNN: fusão LiDAR-câmera para detecção de objetos 3D em dois estágios.
Sensoriamento Remoto, 15, 1839.8- -
Essas tecnologias constante evolução, oferecendo soluções de detecção
de objetos 3D mais precisas e eficientes. Os avanços em pesquisa e
tecnologia estão melhorando significativamente a precisão do
reconhecimento em ambientes do mundo real.
A detecção de objetos em 3D é identificação e a classificação precisas de
objetos específicos no espaço em 3D, que é apoiada por várias técnicas
de processamento de dados espaciais em 3D. Recentemente, técnicas
baseadas em aprendizagem profunda ativamente aplicadas à detecção
de objetos em 3D. As tecnologias representativas VoxelNet, PointNet e
PointRCNN.
3.1 VoxeLNet
A VoxelNet é uma arquitetura inovadora de aprendizagem profunda
projetada especificamente para detectar objetos 3D usando nuvens de
pontos, o que é fundamental em sistemas de direção autônoma. A
arquitetura adota uma abordagem exclusiva, convertendo dados brutos
de nuvens de pontos em uma grade de voxels 3D estruturada para
permitir o processamento eficiente e a extração de recursos. A
conversão para uma representação de voxel é fundamental porque
permite que a VoxelNet utilize efetivamente a convolução 3D para
capturar informações espaciais e, ao mesmo tempo, garantir a
eficiência computacional. Essa eficiência é essencial para os aplicativos
em tempo real necessários para a direção autônoma.
A força da VoxelNet está em sua capacidade de incorporar uma nova
camada de codificação de recursos que aumenta muito o poder de
representação de cada voxel. Isso é obtido levando-se em conta as
características exclusivas dos pontos contidos em cada voxel, o que
melhora a capacidade da rede de detectar e classificar objetos em
ambientes complexos.12) Essa etapa de codificação de recursos é para
resolver problemas causados pela natureza irregular e esparsa dos
dados da nuvem de pontos, que é difícil de lidar usando redes neurais
convolucionais 2D tradicionais.
A pesquisa que o VoxelNet fez contribuições significativas para o campo
da detecção de objetos em 3D. Por exemploa capacidade de sua 9- -
arquitetura de fornecer alta precisão e, ao mesmo tempo, manter a
eficiência computacional faz com que ela seja a escolha preferida para
aplicações de interimplementação em veículos autônomos.13) Além
disso, a integração de representação esparsa da VoxelNet permite que
ela lide de forma eficaz com as grandes quantidades de dados
normalmente encontradas em cenários de direção autônoma.
O desenvolvimento da VoxelNet representa um avanço significativo no
processamento de dados 3D e estabelece a base para futuras inovações
na tecnologia de direção autônoma. Ele aborda os principais desafios
nessa área combinando a voxelização eficiente com técnicas avançadas
de codificação de recursos.14) Isso não só melhora a precisão da
detecção, mas também permite uma fiscalização mais sofisticada
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Aprendizagem
profunda para nuvens de pontos 3D: uma pesquisa. IEEE Transactions on
Pattern Analysis and Machine Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N., & Chang, Z. (2021). Perturbações
adversárias da nuvem de pontos contra a detecção de objetos 3D em sistemas de
direção autônoma. Neurocomputing, 466, 27-36.
14) Chen, W., Li, P., & Zhao, H. (2022). MSL3D: detecção de objetos 3D a partir de
nuvem monocular, estéreo e de pontos para direção autônoma.
Neurocomputing, 494, 23-32.10- -
O VoxelNet está ampliando os limites do desenvolvimento de sistemas
de percepção 3D. Com seu desempenho poderoso e abordagem
inovadora, o VoxelNet continua influenciar a pesquisa e o
desenvolvimento em andamento no processamento de nuvens de pontos
3D e sistemas autônomos.15)
O VoxelNet é um modelo inovador para detecção de objetos 3D que
processa dados de nuvem de pontos convertendo-os em grades 3D
(voxels). Cada voxel representa um ponto na nuvem de pontos, o que
permite que o modelo informações espaciais com mais eficiência. O
VoxelNet usa essas informações de voxel detectar objetos e fazer
previsões. A vantagem abordagem é que ela é eficiente e rápida para
processar grandes quantidades de dados de nuvem de pontos.
3.2 PointNet
O PointNet é uma arquitetura inovadora de aprendizagem profunda que
revoluciona o processamento de dados de nuvem de pontos 3D ao
consumir diretamente conjuntos de pontos não ordenados. Ao contrário
dos métodos tradicionais que exigem entradas estruturadas, o PointNet
usa funções de simetria para garantir a invariância de permutação, as
relações espaciais entre os pontos para que a permaneça ,
independentemente da dos pontos de entrada.
A principal inovação do PointNet é o uso de perceptrons (MLPse de
pooling máximo. Essa arquitetura agrega com eficiência os recursos de
pontos individuais em uma representação global, o que é
particularmente útil para tarefas como classificação e segmentação.
Graças à sua capacidade de grandes de pontos com eficiência e precisão,
tornou um modelo fundamental no campo e inspirou várias
arquiteturas subsequentes baseadas em seus princípios.
O impacto da PointNet vai além da pesquisa acadêmica para
implementações práticas em áreas como direção autônoma e
reconhecimento de robôs. Por exemplo, em sistemas autônomos, a
PointNet tem sido usada para processar dados LiDAR para melhorar a
detecção de objetos e a navegação, identificando e classificando objetos
de um teste para o outro.16) O design da PointNet permite que ela lide 11- -
com eficácia com as complexidades associadas aos dados 3D, como
oclusões e variações na densidade de pontos, tornando-a uma
ferramenta versátil em aplicações de visão computacional.
Os avanços trazidos pela PointNet levaram à adaptação da PointNet em
uma variedade de contextos inovadores. Por exemplo, ela foi aplicada
para classificar dados LiDAR aéreos, melhorando a precisão e a
eficiência das operações de sensoriamento remoto.17) A adaptabilidade
da PointNet também levou à sua integração com redes neurais baseadas
em física para analisar a propagação de rachaduras
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y., & Jing, X. (2020). Rede de
aprendizado semântico de múltiplas visualizações para detecção de objetos 3D
com base em nuvem de pontos. Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Aprendizagem
profunda para nuvens de pontos 3D: uma pesquisa. IEEE Transactions on
Pattern Analysis and Machine Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W., & Liu, G. (2023). Classificação de nuvem de pontos LiDAR
aerotransportada usando a rede PointNet++ com recursos de vizinhança
completa. PLOS ONE, 18.12- -
e simulações de dinâmica de fluidos, e foi comprovado que resolve
problemas industriais complexos.18)
O Pointnet continua a servir como referência no processamento de
dados 3D, aumentando significativamente a capacidade dos modelos de
aprendizagem profunda de processar dados de nuvem de pontos. Seu
impacto é evidente tanto nos avanços teóricos quanto nas aplicações
práticas, demonstrando sua contínua relevância e adaptabilidade no
cenário em evolução da inteligência artificial e da aprendizagem
automática.19)
O PointNet é um modelo que processar diretamente dados de nuvem de
pontos e reconhecer objetos no espaço 3D, independentemente da
ordem de cada ponto. O PointNet extrai os recursos dos pontos e
executa a classificação e a segmentação com base neles. Esse modelo
pode lidar com a natureza não estruturada das nuvens de pontos e pode
ser usado em vários campos, como direção autônoma, robótica e análise
de imagens médicas.
3.3 PontoRCNN
O PointRCNN é uma estrutura importante no campo da detecção de
objetos em 3D, especialmente para aplicações como a direção autônoma.
A estrutura usa um processo de detecção em duas etapas para melhorar
a precisão e a eficiência da detecção de objetos em dados de nuvem de
pontos em 3D. A primeira etapa é gerar sugestões de objetos por meio de
uma rede de sugestões locais baseada em pontos. Essa etapa é porque
trabalha diretamente nos dados brutos da nuvem de pontos,
preservando informações espaciais detalhadas que podem ser perdidas
nos métodos tradicionais que dependem de projeções de imagens ou
voxelização.
Na segunda etapa, o PointRCNN refina a proposta inicial executando da
caixa delimitadora 3D. Isso ajusta o tamanho e a orientação da para
melhor ajustar os objetos detectados nos dados da nuvem de pontos. Ao
utilizar recursos extraídos diretamente da nuvem de pontos bruta, o
PointRCNN alcança maior precisão na detecção de especialmente em
ambientes desafiadores com geometria complexa e oclusões.13- -
Uma das principais vantagens do PointRCNN é sua de aprender de
ponta a ponta. Essa arquitetura facilita a integração perfeita dos estágios
da rede, melhorando não apenas o desempenho de detecção do modelo,
mas também sua eficiência computacional, tornando-o adequado para
aplicações em tempo real, como as necessárias para sistemas de direção
autônoma.
Pesquisas demonstraram que os métodos que utilizam dados de nuvem
de pontos podem melhorar significativamente a compreensão e a
interpretação de cenas em 3D em situações de direção autônoma. Por
exemplo, o uso de algoritmos de detecção de vários alvos baseados em
PointRCNN e técnicas de fusão de nuvens de pontos de voxel pode ser
usado em cenários dinâmicos devido à sua versatilidade e
18) Kashefi, A., & Mukerji, T. (2022). Physics-informed PointNet: um solucionador
de aprendizagem profunda para fluxos incompressíveis em estado estacionário
e campos térmicos em vários conjuntos de geometrias irregulares. Journal of
Computational Physics, 468, 111510.
19) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e
abordagens baseadas em aprendizagem profunda para compreensão de cenas
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.14- -
Além disso, pesquisas no campo de nuvens de pontos 3D e abordagens
de aprendizagem profunda a importância crescente dessas estruturas
para a compreensão da cena na direção autônoma.20)
De modo geral, o PointRCNN representa um avanço significativo na
tecnologia de detecção de objetos em 3D. Sua capacidade de processar
diretamente os dados brutos pontos e o eficiente processo de detecção
em dois estágios uma ferramenta poderosa para o direção autônoma,
em que rápida e precisa de objetos é fundamental para a segurança e o
desempenho.
A PointRCNN é uma tecnologia que usa uma CNN (Rede Neural
Convolucional) baseada na PointNet para detecção de objetos em 3D e
processa com eficácia os dados da nuvem de pontos detectar objetos
com precisão. A PointRCNN é uma tecnologia que amplia o método de
detecção de objetos 2D existente para ambientes 3D e é aplicada ao
reconhecimento de objetos de veículos autônomos e ao reconhecimento
de ambientes de robôs.
4. Aplicativos
As PointRCNNs desempenham uma função essencial nos sistemas de
direção autônoma e são usadas para reconhecer e rastrear com precisão
os objetos no ambiente ao redor. objetos usando de pontos 3D pode
ajudar os veículos obstáculos na estrada com um alto grau de precisão,
mesmo em situações de tráfego complexas.22)
O robô utiliza a tecnologia de detecção de objetos 3D para interagir com
o ambiente. O PointRCNN permite que o robô compreenda seu
ambiente de uma execução para outra e execute as tarefas necessárias.24)
Para inserir perfeitamente objetos virtuais no mundo real em um
ambiente de AR, é necessária a detecção precisa de objetos no espaço 3D.
O PointRCNN um papel importante nessa tarefa.
Os drones precisam ter a capacidade de reconhecer e evitar vários
obstáculos durante o voo. O PointRCNN pode ser usado para detectar
objetos em tempo real a partir dos dados do sensor do drone e definir
uma trajetória de voo segura.25)15- -
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
21) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e
abordagens baseadas em aprendizagem profunda para compreensão de cenas
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.
22) Qian, R., Lai, X., & Li, X. (2021). 3D Object Detection for Autonomous Driving
(Detecção de objetos 3D para direção autônoma): Pattern Recognition, 130,
108796.
23) Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D Object Detection for
Autonomous Driving (Detecção de objetos 3D para direção autônoma): A
Comprehensive Survey, International Journal of Computer Vision, 131, 1909-
1963.
24) Wang, L., & Huang, Y. (2022). Uma pesquisa de nuvem de pontos 3D e
abordagens baseadas em aprendizagem profunda para compreensão de cenas
em direção autônoma. Revista IEEE Intelligent Transportation Systems, 14, 135-
154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A.
(2019).16- -
O PointRCNN é aplicado à modelagem 3D e à análise de ambientes
urbanos, fornecendo informações importantes para o planejamento e a
gestão urbanos. Isso ajudar a melhorar a eficiência do transporte e
aumentar a segurança nas cidades.
Nessas aplicações, as PointRCNNs são muito úteis em situações em que
são necessários alta precisão e processamento em tempo real. Pesquisas
mostram que técnicas como algoritmos de detecção de vários alvos
baseados em PointRCNN demonstrando seu desempenho e eficiência
nessas aplicações.26) A PointRCNN contribui para maximizar a precisão
e a eficiência da detecção de objetos em 3D, o que importante para o
avanço dos veículos autônomos e de outros sistemas avançados.
A tecnologia de processamento de dados espaciais 3D usada em muitos
setores diferentes. Alguns dos principais aplicativos incluem
4.1 Veículos autônomos
Os veículos são veículos que usam tecnologia avançada para dirigir
sozinhos sem intervenção humana. Esses veículos utilizam uma
variedade de sensores, câmeras, radares, LiDAR e outros para obter uma
percepção precisa do ambiente ao seu redor. Essas tecnologias,
combinadas com o processamento de dados em tempo real, são
essenciais para determinar rotas de direção seguras.
Em particular, a tecnologia de detecção de objetos em 3D é um
componente essencial dos veículos autônomos, desempenhando uma
função importante na detecção e no reconhecimento precisos de objetos
ao redor do veículo. O PointRCNN, por exemplo, aproveita os dados da
nuvem de pontos para permitir a análise de alta resolução dos arredores
de um veículo. Isso os veículos autônomos reconheçam pedestres,
outros veículos, sinais de trânsito e muito mais em tempo real para
garantir uma direção segura.27)
Os veículos autônomos também a capacidade de aprender padrões de
direção e se adaptar a diferentes situações de direção aplicando
tecnologias de aprendizado de máquina e inteligência artificial. Essas
tecnologias contribuindo para melhorar a segurança do veículo, a 17- -
eficiência e a experiência do usuário. Em particular, a tecnologia de
fusão de multissensores melhora a precisão da detecção de objetos em
3D, um desempenho confiável em uma variedade de ambientes.28)
Uma pesquisa sobre métodos de detecção de objetos 3D para aplicações de
direção autônoma. IEEE Transactions on Intelligent Transportation Systems, 20,
3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on
PointRCNN. IEEE Transactions on Intelligent Transportation Systems, 23,
20707-20720.
28) Wang, X., Li, K., & Chehri, A. (2024). Multi-Sensor Fusion Technology for 3D
Object Detection in Autonomous Driving (Tecnologia de fusão de vários
sensores para detecção de objetos 3D em direção autônoma): A Review, IEEE
Transactions on Intelligent Transportation Systems, 25, 1148-1165.18- -
Os veículos autônomos uma área fundamental de inovação nos futuros
sistemas de transporte por meio da convergência de algoritmos
complexos e tecnologias de sensores. Essas tecnologias têm um impacto
positivo na sociedade como um todo, reduzindo o congestionamento do
tráfego, os acidentes rodoviários e permitindo um fluxo de tráfego mais
eficiente.29)
Os veículos autônomos usam sensores LiDAR e tecnologia de detecção
de objetos 3D para perceber e analisar os arredores do veículo em tempo
real. Isso permite obstáculos, reconhecer pedestres, analisar
cruzamentos e para maximizar a segurança do veículo e a eficiência da
direção.
4.2 Assistência médica
As técnicas de detecção de objetos 3D na área médica, especialmente
aquelas como a PointRCNN, uma ampla gama de aplicações potenciais.
Essas tecnologias são usadas principalmente em imagens médicas,
robótica cirúrgica, sistemas de monitoramento de pacientes, etc.
A tecnologia de detecção de objetos em 3D ajuda detectar com precisão
lesões em imagens de TC, RM e ultrassom. Isso é especialmente
importante em áreas como a radiologia, onde pode ser combinada com
sistemas de diagnóstico auxiliados por computador usando inteligência
artificial e aprendizado de máquina para melhorar a precisão do
diagnóstico.30)
Nos sistemas robóticos cirúrgicos, a tecnologia de detecção de objetos
3D permite o reconhecimento preciso dos tecidos e órgãos circundantes
durante a cirurgia, ajudando a garantir uma cirurgia segura e precisa.
Juntamente com os avanços na inteligência artificial médica, isso pode
melhorar muito a eficiência e a segurança da cirurgia.31)
Os sensores 3D e a tecnologia de detecção de objetos podem analisar os
movimentos e os sinais vitais de um paciente em tempo real para
detectar anormalidades em um estágio inicial. Essas tecnologias ser
combinadas com sistemas de monitoramento de pacientes baseados em
inteligência artificial para rastrear e gerenciar continuamente a 19- -
condição do paciente.32)
Combinada com a realidade virtual (VR), ela poderia ser usada na
educação e no treinamento médico. Tecnologia de detecção de objetos 3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis,
A. (2019). Uma pesquisa sobre métodos de detecção de objetos 3D para
aplicativos de direção autônoma. IEEE Transactions on Intelligent
Transportation Systems, 20, 3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H.,
Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R.,
Suzuki, K., ... & Armato, S. (2022). Relatório do grupo de trabalho 273 da AAPM:
Recomendações sobre práticas recomendadas para IA e aprendizado de
máquina para diagnóstico auxiliado por computador em imagens médicas.
Física médica.
31) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial intelligence
in healthcare: a mastery (Inteligência artificial na área da saúde: um domínio),
Biotechnology and Genetic Engineering Reviews, None, 1-50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support systems
on nursing workflows in critical care units (O impacto dos sistemas de apoio à
decisão baseados em IA nos fluxos de trabalho de enfermagem em unidades de
cuidados intensivos). International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y., & Yuan, X. (2023).
Artificial intelligence in clinical decision support systems for oncology
(Inteligência artificial em sistemas de suporte a decisões clínicas para
oncologia), International Journal of Medical Sciences, 20, 79-86.20- -
desempenha um papel importante ao ajudar médicos e profissionais de
saúde a simular cirurgias e diagnósticos, possibilitando o aprendizado
em um ambiente realista.33)
Esses aplicativos contribuem para aumentar a precisão do diagnóstico e
do tratamento na área médica e melhorar a segurança geral. Em
particular, a tecnologia de detecção de objetos 3D combinada com a IA
está acelerando a inovação na área da saúde e tornando uma
ferramenta importante para melhorar a saúde e a segurança dos
pacientes. Esses estudos oferecem novas perspectivas sobre as
implicações comerciais, regulatórias e sociais da IA médica.34)
Na área médica, o processamento de dados espaciais em 3D usado para
diagnóstico preciso e planejamento cirúrgico. Os dados de nuvem de
pontos de imagens médicas em 3D, como tomografias
computadorizadas ou resultados de ressonância magnética, são usados
para visualizar o local da cirurgia e medir sua localização e tamanho
exatos para melhorar a precisão cirúrgica.
4.3 Automação industrial e robótica
As tecnologias de detecção de objetos em 3D, especialmente modelos
como o PointRCNN, estão revolucionando o campo da automação
industrial e da robótica. Essas tecnologias melhoram significativamente
a eficiência e a precisão em uma ampla gama de setores e
desempenham um papel importante nas seguintes áreas específicas
A tecnologia de detecção de objetos em 3D é essencial para que os
sistemas robóticos reconheçam e classifiquem os objetos em um
depósito. Ela permite que os robôs reconheçam com precisão objetos de
diferentes tamanhos e formas, permitindo que eles executem tarefas
eficientes de movimentação e classificação. Essas tecnologias
aumentam a eficiência dos processos industriais e facilitam a
automação dos sistemas de logística.35)
Quando os robôs industriais montam peças automaticamente, a
detecção de objetos 3D aumenta a eficiência da montagem ao
reconhecer a posição e a orientação exatas das peças. Isso contribui
significativamente para aumentar as taxas de produção e reduzir as 21- -
taxas de defeitos, além de uma função importante em ambientes de
manufatura inteligente.36)
Eles são usados para inspecionar a geometria e as dimensões dos
produtos usando a tecnologia de digitalização 3D e um papel
importante na garantia da qualidade do produto, na detecção precoce
de defeitos e na redução de custos. Essas peças automatizadas
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. e Li, Y. (2020). Previsão
baseada em inteligência artificial do risco de câncer de pulmão usando registros
médicos eletrônicos sem imagem: abordagem de aprendizagem profunda.
Journal of Medical Internet Research, 23.
34) Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial
intelligence in healthcare: a mastery (Inteligência artificial na área da saúde:
um domínio). Biotechnology and Genetic Engineering Reviews, None, 1-50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F.,
Atkeson, C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P., &
White, M. (2021). Sim2Real in Robotics and Automation: Applications and
Challenges (Sim2Real em robótica e automação: aplicativos e desafios). IEEE
Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H. (2021).
Automação baseada em aprendizado de montagem robótica para manufatura
inteligente. Anais do IEEE, 109, 423-440.22- -
Os sistemas de inspeção de qualidade aumentam a confiabilidade dos
produtos.37)
Para aumentar a segurança dos robôs e dos sistemas de automação, é
utilizada a tecnologia de detecção de objetos 3D. Isso permite que
reconheçam ou próximos com segurança. Esses mecanismos de
segurança para a redução de acidentes em ambientes industriais.38)
É essencial que os veículos autônomos ou drones detectem objetos e
planejem suas rotas. A tecnologia de detecção de objetos em 3D esses
sistemas operem com eficiência, evitem obstáculos e realizem tarefas de
entrega com segurança.39)
Nessas áreas, as tecnologias de detecção de objetos 3D impulsionando a
inovação na automação industrial, ajudando a aumentar a
produtividade, reduzir custos e melhorar a segurança. No futuro, essas
tecnologias continuarão a ser parte integrante da evolução dos sistemas
de robótica e automação. Pesquisas demonstraram que a aplicação
dessas tecnologias está contribuindo significativamente para aumentar
a eficiência dos processos industriais e gerenciar a complexidade dos
sistemas automatizados.40)
Na automação industrial e na robótica, o processamento de dados
espaciais em 3D é usado para aumentar a eficiência dos processos de
fabricação e automatizar as inspeções de qualidade. Os robôs usam
sensores LiDAR ou câmeras 3D reconhecer produtos, detectar
anomalias e ajudar a resolver problemas de qualidade.
4.4 Sistemas de vigilância de segurança
Nos sistemas de vigilância de segurança, a tecnologia de detecção de
objetos 3D um papel importante no fornecimento de soluções eficazes
de monitoramento e segurança em uma variedade de ambientes. A
tecnologia tem sido particularmente proeminente em áreas como
monitoramento em tempo real, detecção de intrusão, prevenção de
incidentes, análise de dados e relatórios e integração de inteligência
artificial.23- -
Com recursos de monitoramento em tempo real, os sistemas de
detecção de objetos 3D utilizam câmeras e sensores para analisar o
ambiente ao redor em tempo real. Essa análise em tempo real permite o
reconhecimento preciso de pessoas, veículos e objetos e fornece avisos
imediatos no caso de uma situação perigosa. Isso é essencial para
aumentar a segurança, especialmente em ambientes complexos, como
estradas e aeroportos.
Quando se trata de detecção de intrusão, a tecnologia de detecção de
objetos 3D é eficaz na detecção de movimentos ou comportamentos
incomuns em uma área de segurança específica. Isso pode levar à
detecção antecipada da aproximação de um intruso e fornecer à equipe
de segurança
37) Wang, K., Zhou, J., Li, G., Hu, Y., & Hu, F. (2024). Industrial automation and
product quality: the role of robotic production transformation (Automação
industrial e qualidade do produto: a função da transformação da produção
robótica). Applied Economics.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A., & Wang, K. (2019). Designing
Dynamic and Collaborative Automation and Robotics Software Systems
(Projetando sistemas de software de automação e robótica dinâmicos e
colaborativos), IEEE Transactions on Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). Robótica: da automação aos sistemas inteligentes. Engenharia.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Industrial vision and automation (Visão e automação industrial). Measurement
Science and Technology, 33.24- -
Evite a entrada não autorizada em áreas seguras, fornecendo alertas
vermelhos.
Em termos de prevenção de acidentes, esses sistemas evitam acidentes
em uma variedade de ambientes, incluindo instalações industriais,
detectando perigos antecipadamente e fornecendo avisos. Por exemplo,
um sistema de aviso automático ser acionado quando um trabalhador
se aproxima de uma área perigosa para evitar um acidente.
Os recursos de análise de dados e geração de relatórios ajudam a avaliar
a situação da segurança e a identificar problemas por meio de análises
subsequentes usando os dados 3D coletados. Essas análises fornecem
percepções importantes para a estratégia de segurança futura e o
aprimoramento contínuo da segurança.
Com a integração da inteligência artificial, a tecnologia de detecção de
objetos 3D pode ser combinada com algoritmos de aprendizado de
máquina para criar um sistema de vigilância mais inteligente. Isso o
sistema aprenda padrões e implemente mecanismos de alerta e resposta
mais sofisticados.
Dessa forma, a tecnologia de detecção de objetos 3D está se tornando
parte integrante dos sistemas de vigilância de segurança, ajudando a
atender a uma variedade de necessidades de segurança e aumentando a
segurança das instalações. Espera-se que essas tecnologias evoluam
ainda mais no futuro, levando a soluções de vigilância de segurança
mais sofisticadas e eficientes. Esses avanços tecnológicos evoluirão para
sistemas de segurança mais poderosos, especialmente por meio da
integração com a inteligência artificial.41)
A tecnologia de detecção de objetos 3D também um papel importante
nos sistemas de vigilância de segurança. Os sensores LiDAR e a
tecnologia de detecção de objetos 3D ser usados para detectar intrusos
ou determinar se há pessoas nas proximidades. Eles também analisar
padrões de comportamento no espaço 3D para rastrear e evitar
atividades ilegais.25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Um método de
detecção de alvos pequenos por infravermelho baseado em um mecanismo de
comparação visual humana ponderada para monitoramento de segurança.
Sensoriamento Remoto, 15, 2922.26- -
4.5 VR/AR
Na realidade virtual (VR) e na realidade aumentada (AR), a tecnologia de
detecção de objetos em 3D está aprimorando significativamente a
experiência do usuário em diversos setores. A detecção de objetos em
3D permite que os usuários interajam com objetos do mundo real em
ambientes virtuais, o que é essencial para que os aplicativos de AR
reconheçam o ambiente em tempo real para posicionar e manipular
elementos virtuais com precisão. Isso torna a experiência do usuário
mais imersiva.
Em ambientes de RV, a detecção de objetos 3D é usada para criar
simulações realistas. Isso proporciona cenários de treinamento em
diversos campos, inclusive médico, e de aviação, permitindo que os
participantes vivenciem e pratiquem com segurança situações da vida
real. A aplicação da RV/RA, especialmente no campo da segurança da
construção, aumenta a conscientização sobre a segurança do
trabalhador.42)
No setor de jogos, a detecção de objetos 3D proporciona uma
experiência ao rastrear com precisão o movimento e a posição do
jogador. Isso permite a interação com personagens virtuais,
aumentando o realismo do jogo.
Na arquitetura e na engenharia, a tecnologia de AR pode ser usada para
visualizar modelos de design no mundo real. Isso ajudar a detectar
erros no processo de projeto com antecedência e facilitar a
comunicação com os clientes. Esses aplicativos podem ser
particularmente sinérgicos com a segurança da construção.43)
A tecnologia de AR ajuda os consumidores a tomar decisões de compra,
permitindo que eles experimentem virtualmente os produtos. Por
exemplo, ela permite que eles coloquem móveis em suas casas ou
experimentem cores de cosméticos com antecedência. Isso aprimora a
experiência de compra e a interação do consumidor.44)
Dessa forma, a tecnologia de detecção de objetos 3D está
proporcionando experiências inovadoras em RV e RA e está sendo
utilizada em diversos setores. No futuro, essas tecnologias continuarão a 27- -
evoluir, tornando a interação entre o usuário e o ambiente virtual ainda
mais perfeita e natural. Isso expandirá ainda mais o uso da tecnologia
de RV/RA em educação, entretenimento, comércio e muito mais. Ao
mesmo tempo, os avanços nessas tecnologias criarão novas
oportunidades nos setores de turismo e hospitalidade.45)
42) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão crítica
dos aplicativos de realidade virtual e aumentada (VR/AR) na segurança da
construção. Automação na construção, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão crítica
dos aplicativos de realidade virtual e aumentada (VR/AR) na segurança da
construção. Automação na construção, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A. (2023).
'The persuasion effects of virtual reality (VR) and augmented reality (AR) video
advertisements: A conceptual review'. Journal of Business Research.
45) Wei, W. (2019). Research progress on virtual reality (VR) and augmented
reality (AR) in tourism and hospitality (Progresso da pesquisa sobre realidade
virtual (VR) e realidade aumentada (AR) em turismo e hospitalidade) Journal of
Hospitality and Tourism Technology, 10, 539-570.28- -
Na realidade virtual (VR) e na realidade aumentada (AR), os dados
espaciais em 3D desempenham uma função importante interação com
objetos do mundo real. Os dados espaciais em 3D os objetos virtuais
sejam posicionados corretamente no mundo real e que os usuários
interajam com eles de forma natural.
5. Conclusão
A tecnologia de processamento de dados espaciais em 3D
revolucionando muitos campos, incluindo direção autônoma, saúde,
indústria, segurança e VR/AR. Em particular, os sensores LiDAR e as
tecnologias de detecção de objetos em 3D desempenhando um papel
importante em cada um desses campos, contribuindo para a análise
ambiental em tempo real, diagnóstico e tratamento precisos e sistemas
de automação eficientes. Essas tecnologias continuarão a evoluir e a
proporcionar experiências de usuário mais ricas em vários campos.29- -
Referências
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J., & Chen, J.
(2023). Compressão, processamento e aprendizado da nuvem de pontos
Lidar para direção autônoma. IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Uma pesquisa sobre métodos de detecção de
objetos 3D para aplicativos de direção autônoma. IEEE Transactions on
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X., & Wang, C. (2022). Computação e
visualização de dados 3D. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A., &
Rubin, E. J. (2023). Artificial Intelligence in Medicine (Inteligência
artificial na medicina). New England Journal of Medicine, 388(13), 1220-
1221.
5. Campilho, R., & Silva, F. J. G. (2023). Melhoria de Processos
Industriais por Automação e Robótica. Máquinas.
6. Cao, M., & Wang, J. (2020). Detecção de obstáculos para veículos de
condução autônoma com fusão de sensores multi-LiDAR. Journal of
Dynamic Systems Measurement and Control - Transactions of the ASME,
142.
7. Chen, W., Li, P., & Zhao, H. (2022). MSL3D: detecção de objetos 3D a
partir de nuvem monocular, estéreo e de pontos para direção autônoma.
Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E., & Cao, E. (2023). Um
método de detecção de alvos pequenos por infravermelho baseado em
um mecanismo de comparação visual humana ponderada para
monitoramento de segurança. Sensoriamento Remoto, 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S., & BanoengYakubo,
B. (2020). New regional stratigraphic insights from a 3D
geological model of the Nasia sub-basin, Ghana, developed for
hydrogeological purposes and based on reprocessed B-field data
originally collected for mineral exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J., & GarcíaGarcía,
J. A. (2020). Robotic Process Automation: A Scientific and
Industrial Systematic Mapping Study (Automação de processos
robóticos: um estudo de mapeamento sistemático científico e industrial) 30- -
IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N., & Zhang, Z. (2023). Super
Sparse 3D Object Detection (Detecção de objetos 3D superesparsos).
IEEE Transactions on Pattern Analysis and Machine Intelligence, 45,
12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G.,
Guevara, M., Novais, P., Monteiro, J., Melo-Pinto, P., & Melo-Pinto, P.
(2021). Métodos de detecção e classificação de objetos 3D baseados em
nuvens de pontos para aplicações de condução autônoma: uma pesquisa
e taxonomia. Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. e Bennamoun (2019). Deep31- -
Aprendizagem para nuvens de pontos 3D: uma pesquisa. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 43, 4338-
4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi,
J., Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H.,
Huisman, H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R.
K., Summers, R., Suzuki, K.,
... & Armato, S. (2022). Relatório do grupo de trabalho 273 da AAPM:
Recomendações sobre práticas recomendadas para IA e aprendizado de
máquina para diagnóstico auxiliado por computador em imagens
médicas. Física médica.
15. Huang, S. (2019). Augmented reality and virtual reality: the power of
AR and VR for business (Realidade aumentada e realidade virtual: o
poder da AR e da RV para os negócios) Information Technology and
Tourism (Tecnologia da informação e turismo), 21, 457-459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S., & Kim, H.
(2021).
Automação baseada em aprendizado de montagem robótica para
manufatura inteligente. Anais do IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A., & Behl, A.
(2023). 'The persuasion effects of virtual reality (VR) and augmented
reality (AR) video advertisements: A conceptual review'. Journal of
Business Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H., & Lee, K. M. (2020).
Convolução triplanar com kernels 2D compartilhados para classificação
3D e recuperação de formas. Computer Vision and Image
Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M., & Yoo, J. (2022). Tecnologias interativas
imersivas e experiências de compras virtuais: Differences in consumer
perceptions between augmented reality (AR) and virtual reality (VR).
Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hyper-automation in manufacturing industry
(Hiperautomação no setor de manufatura), J. Intell. Manuf., 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X., & Chan, A. P. C. (2018). Uma revisão
crítica dos aplicativos de realidade virtual e aumentada (VR/AR) na
segurança da construção. Automação na construção, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P., & Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion 32- -
Based on PointRCNN. IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X., & Li, H. (2022). 3D Object Detection for
Autonomous Driving (Detecção de objetos 3D para direção autônoma): A
Comprehensive Survey, International Journal of Computer Vision, 131,
1909-1963.
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R., & Vavilov, V. (2022).
Industrial vision and automation (Visão e automação industrial).
Measurement Science and Technology, 33.
25. Mukherjee, J., Sharma, R., Dutta, P., & Bhunia, B. (2023). Artificial
intelligence in healthcare: a mastery (Inteligência artificial na área da
saúde: um domínio). Biotechnology and Genetic Engineering Reviews,
None, 1-50.
26. Nebot, E. (2018). Robótica: da automação aos sistemas inteligentes.
Engenharia.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B.
(2022). gráfico dinâmico33- -
para detecção de objetos 3D. Knowledge-Based Systems, 259, 110085.
28. Song, S., Huang, T., Zhu, Q., & Hu, H. (2023). ODSPC: detecção de
objetos 3D baseada em aprendizado profundo usando nuvem de pontos
semânticos. Visual Computer, , 1-15.
29. Wei, W. (2019). Research progress on virtual reality (VR) and
augmented reality (AR) in tourism and hospitality (Progresso da
pesquisa sobre realidade virtual (VR) e realidade aumentada (AR) em
turismo e hospitalidade) Journal of Hospitality and Tourism Technology,
10, 539-570.
30. Xue, Z., Wu, S., Li, M., & Cheng, K. (2024). Um novo método para
prospecção regional baseado em gráficos 3D modernos. Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. e Li, Y. (2020).
Previsão baseada em inteligência artificial do risco de câncer de pulmão
usando registros médicos eletrônicos sem imagem: abordagem de
aprendizagem profunda. Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Detecção e diagnóstico auxiliados por
computador/radiômica/aprendizagem de máquina/aprendizagem
profunda em imagens médicas. Física Médica.
'세미나 자료' 카테고리의 다른 글
echnologie de traitement des donnéesspatiales en 3D et ses applications Institut de recherche en IA ducomté de
Rapport de recherche : Technologie de traitement des données
spatiales en 3D et ses applications Institut de recherche en IA du
comté de 2025_01Youngho Hong
Résumés :
Cette recherche couvre le développement et l'application des technologies
de traitement des données spatiales en 3D, en particulier l'acquisition de
données de nuages de points et les technologies de détection d'objets en 3D
à l'aide de capteurs LiDAR. Elle se concentre sur les technologies de
détection d'objets en 3D VoxelNet, PointNet et PointRCNN et explique
comment ces technologies sont utilisées dans divers domaines tels que les
véhicules autonomes, les soins de santé, l'automatisation industrielle, les
systèmes de surveillance de la sécurité et la RV/AR. Les données des nuages
de points collectées par les capteurs LiDAR analysent l'espace 3D avec une
grande précision, et la technologie de détection d'objets 3D basée sur ces
données un rôle important dans la sensibilisation à l'environnement en
temps réel, les diagnostics de précision, l'optimisation des processus de
fabrication, etc. Cette étude analyse l'impact de la technologie de
traitement des données spatiales 3D sur l'industrie moderne et l'innovation
technologique, et examine le potentiel de développement futur.
Mots-clés :
Données spatiales 3D, capteurs LiDAR, nuages de points,
détection d'objets 3D, VoxelNet, PointNet, PointRCNN, véhicules
autonomes, soins de santé, automatisation industrielle, systèmes de
surveillance de la sécurité, RV/AR, apprentissage profond (Deep Learning)
2- -
1. Introduction
Elle implique le processus de collecte, de stockage, d'analyse et de
visualisation des données et utilise des technologies telles que le LiDAR, la
photogrammétrie et la numérisation 3D pour traiter les informations
spatiales tridimensionnelles. Ces technologies sont utilisées dans une
variété de plateformes logicielles, les systèmes d'information géographique
(SIG) et la conception assistée par ordinateur (CAO) principaux outils. Cela
réaliser des analyses spatiales complexes.
Le LiDAR utilise des impulsions laser pour collecter des données de
distance, tandis que la photogrammétrie utilise des photographies
aériennes pour créer des modèles 3D. Ces données sont stockées dans une
base de données et utilisées pour l'analyse et la visualisation en cas de
besoin.1)
Des recherches ont montré que les structures CNN 3D peuvent être
utilisées pour apprendre des représentations 3D, et que cela peut être fait
plus efficacement que les méthodes traditionnelles basées sur des CNN
entièrement 3D.2)
Les méthodes de visualisation 3D basées sur le GPU permettent une
délimitation spatiale plus sophistiquée et plus précise.3)
La modélisation 3D un outil essentiel dans le processus de conception et de
simulation architecturales. Elle vous permet dévaluer la sécurité des
structures et d'accroître la précision de vos conceptions.
Les données spatiales en 3D sont utilisées dans la recherche sur le
changement des écosystèmes et la gestion des catastrophes. Par exemple,
la modélisation géologique en 3D est utilisée pour l'exploration des eaux
souterraines et la recherche géologique.4)
Les données 3D utilisées pour développer des environnements immersifs
afin d'améliorer l'expérience de l'utilisateur. Cette méthode appliquée dans
divers secteurs, notamment l'éducation, les soins de santé et les
divertissements.
Les technologies de traitement des données spatiales en 3D progressent
rapidement dans divers domaines, notamment l'acquisition de données de
3- -
nuages de points et la détection d'objets dans l'espace 3D à l'aide de
capteurs LiDAR. technologies révolutionnent les véhicules autonomes, les
applications médicales, l'automatisation industrielle, les systèmes de
surveillance de la sécurité et les environnements VR/AR. Ce rapport de
recherche fournit une compréhension de base des technologies de
traitement des données spatiales en 3D et explique comment elles sont
appliquées dans diverses industries.
1) Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and visualisation.
Displays, 73, 102169.
2) Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. et Lee, K. M. (2020). Triplanar
convolution with shared 2D kernels for 3D classification and shape retrieval ",
Computer Vision and Image Understanding, 193, 102901.
3) Xue, Z., Wu, S., Li, M. et Cheng, K. (2024). A Novel Method for Regional Prospecting
Based on Modern 3D Graphics (Nouvelle méthode de prospection régionale basée
sur des graphiques 3D modernes) Minerals.
4) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo, B. (2020).
New regional stratigraphic insights from a 3D geological model of the Nasia subbasin,
Ghana, developed for hydrogeological purposes and based on reprocessed Bfield
data originally collected for mineral exploration. Solid Earth, 11, 349-361.
4- -
2. Collecte de données Point CLoud avec des capteurs LiDAR
L'acquisition de nuages de points à l'aide de capteurs LiDAR joue un rôle
important dans un large éventail d'applications et est particulièrement
adaptée à l'acquisition de données 3D à haute résolution. La technologie
LiDAR émet des impulsions laser pour recevoir les signaux réfléchis par les
objets et calcule les informations de distance sur la base de ces signaux.
Ces informations sont stockées dans un nuage de points, où chaque point
contient les coordonnées X, Y et Z et l'intensité de la réflexion.
Les nuages de points LiDAR peuvent être dans domaines, notamment l', la
'environnement et la gestion des ressources. Ils peuvent par exemple être
utiles pour l'analyse structurelle des forêts ou le levé de précision des
bâtiments. Les nuages de points sont ensuite convertis en 3D ou en
données SIG par un post-traitement de débruitage, d'alignement et de
reconstruction de surface. Divers logiciels sont utilisés dans ce processus,
en particulier des méthodes de visualisation 3D basées sur le GPU, qui
permettent une délimitation spatiale plus sophistiquée.5)
Les données LiDAR jouent également un rôle important dans les systèmes
de perception des véhicules autonomes. Le traitement des nuages de points
LiDAR et la formation dans le domaine de la conduite autonome ont
contribué à une perception précise de l'environnement routier et à la
détection d'objets.6) Ces données sont essentielles pour construire des
cartes 3D en temps réel et à haute résolution, qui véhicules autonomes de
naviguer en toute sécurité dans des conditions routières complexes.
points LiDAR peuvent également pour la Par exemple, les données
collectées par le LiDAR monté sur avion peuvent être utilisées pour
reconstruire des modèles 3D de formations géologiques, qui contribuent à
l'exploration des eaux souterraines ou à la recherche géologique.7) Cette
modélisation géologique en 3D permet de nouvelles interprétations
géologiques et aide à mieux comprendre les caractéristiques géologiques
d'une zone.
Les avantages de la technologie LiDAR comprennent l'acquisition de
données à grande vitesse et une grande précision, mais elle présente des
limites un coût relativement élevé et des performances par temps de pluie
ou de Des travaux de recherche et de développement sont en cours pour
surmonter ces limites techniques, ce qui permet dutiliser la technologie
5- -
LiDAR dans un plus grand nombre d'industries.
Un capteur LiDAR (Light Detection and Ranging) est une technologie qui
utilise des lasers pour mesurer la surface d'un objet, et les données peuvent
être utilisées pour obtenir des informations spatiales en 3D. Le nuage de
points généré par un capteur LiDAR est une collection de nombreux points
répartis dans l'espace 3D, chacun d'entre eux pouvant être décrit par une
élévation, une distance et un positionnement.
5) Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and visualisation.
Displays, 73, 102169.
6) Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J. et Chen, J. (2023). Lidar
Point Cloud Compression, Processing and Learning for Autonomous Driving
(Compression, traitement et apprentissage de nuages de points Lidar pour la
conduite autonome). IEEE Transactions on Intelligent Transportation Systems, 24,
962-979.
7) Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo, B. (2020).
New regional stratigraphic insights from a 3D geological model of the Nasia subbasin,
Ghana, developed for hydrogeological purposes and based on reprocessed Bfield
data originally collected for mineral exploration. Solid Earth, 11, 349-361.
6- -
poutres. Ces données sont essentielles pour la perception de
l'environnement par les véhicules autonomes, la modélisation architecture
et en génie civil, et la cartographie en 3D.
3. Technologie de détection d'objets en 3D
La détection d'objets en 3D est une technologie importante pour la
reconnaissance et la localisation d'objets dans l'espace 3D. Elle essentielle
dans de nombreux domaines, notamment les véhicules autonomes, la et la
réalité augmentée. Elle sappuie principalement sur des données 3D
collectées par LiDAR, des caméras RVB-D et des systèmes de vision stéréo.
Il utilise les nuages de points générés par LiDAR pour reconnaître
l'emplacement et la forme des objets. Les modèles d'apprentissage profond
tels que PointNet sont largement utilisés dans ce domaine, et ces méthodes
sont essentielles pour générer des cartes 3D haute résolution en temps
réel.8)
Il s'agit d'une technique permettant de détecter des objets en combinant
des images 2D obtenues par des caméras RVB avec des informations 3D.
Cette méthode améliore les performances de détection en ajoutant des
informations sur les couleurs et les motifs de l'objet. Des études récentes
ont proposé des méthodes telles que FusionRCNN, qui combine les images
LiDAR et les images des caméras pour améliorer la précision de la
détection.9)
Les structures d' profond telles que les réseaux neuronaux convolutifs
(CNN) et les réseaux neuronaux récurrents (RNN) sont utilisées pour et
reconnaître les caractéristiques des en 3D. Ces modèles améliorent la
précision de la classification des objets et de l'estimation de l'emplacement
sur la base d'ensembles de données, ce qui particulièrement important
pour la reconnaissance des obstacles dans les véhicules autonomes.10)
Il est utilisé pour améliorer la sécurité de la conduite en détectant les
obstacles et les piétons sur la route. Des recherches actives menées dans ce
domaine pour fusionner les nuages de points LiDAR avec les données de
vision afin d'obtenir une détection plus précise.11)
Elle aide le robot à comprendre son environnement et à interagir avec lui.
Elle particulièrement importante pour déterminer l'emplacement exact
7- -
des objets afin d'aider le robot à planifier sa trajectoire et à effectuer des
tâches.
Reconnaître les objets et y réagir en temps réel pour améliorer l'expérience
de l'utilisateur. Par exemple, dans la réalité augmentéeemplacement et la
forme des objets doivent être déterminés avec précision pour améliorer
l'interaction avec les objets virtuels.
8) Qian, R., Lai, X. et Li, X. (2021). 3D Object Detection for Autonomous Driving :
Pattern Recognition, 130, 108796.
9) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. et Li, J. (2023).
FusionRCNN : LiDAR-Camera Fusion for Two-Stage 3D Object Detection (Fusion
LiDAR-Caméra pour la détection d'objets en 3D en deux étapes). Remote Sensing, 15,
1839.
10) Fan, L., Yang, Y., Wang, F., Wang, N. et Zhang, Z. (2023). Super Sparse 3D Object
Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45,
12490-12505.
11) Xu, X., Dong, S., Xu, T., Ding, L., Wang, J., Jiang, P., Song, L. et Li, J. (2023).
FusionRCNN : LiDAR-Camera Fusion for Two-Stage 3D Object Detection (Fusion
LiDAR-Caméra pour la détection d'objets en 3D en deux étapes). Remote Sensing, 15,
1839.
8- -
Ces technologies évoluent , offrant des solutions de détection d'objets en 3D
plus précises et plus efficaces. Les progrès de la recherche et de la
technologie améliorent considérablement la précision de la reconnaissance
dans les environnements réels.
détection d'objets en 3D est l'identification et la classification précises
d'objets spécifiques dans l'espace 3D, qui s'appuient sur diverses
techniques de traitement des données spatiales en 3D. Récemment, des
techniques basées sur l'apprentissage profond ont activement appliquées à
la détection d'objets en 3D. technologies représentatives VoxelNet,
PointNet et PointRCNN.
3.1 VoxeLNet
VoxelNet est une architecture innovante d'apprentissage profond
spécialement conçue pour détecter des objets en 3D à l'aide de nuages de
points, ce qui est essentiel dans les systèmes de conduite autonome.
L'architecture adopte une approche unique en convertissant les données
brutes des nuages de points en une grille structurée de voxels 3D afin de
permettre un traitement et une extraction efficaces des caractéristiques. La
conversion en une représentation voxel est car elle permet à VoxelNet
d'utiliser efficacement la convolution 3D pour capturer les informations
spatiales tout en garantissant l'efficacité du calcul. Cette efficacité est
essentielle pour les applications en temps réel nécessaires à la conduite
autonome.
La force de VoxelNet réside dans sa capacité à intégrer une nouvelle couche
d'encodage des caractéristiques qui améliore considérablement le pouvoir
de représentation de chaque voxel. Ce résultat est obtenu en tenant compte
des caractéristiques uniques des points contenus dans chaque voxel, ce qui
améliore la capacité du réseau à détecter et à classer des objets dans des
environnements complexes.12) Cette étape d'encodage des caractéristiques
est pour résoudre les problèmes causés par la nature irrégulière et éparse
des données des nuages de points, qui sont difficiles à traiter à l'aide des
réseaux neuronaux convolutifs 2D traditionnels.
La recherche a montré que VoxelNet a apporté des contributions
significatives au domaine de la détection d'objets en 3D. Par exemplela
capacité de son architecture à fournir une grande précision tout en
9- -
conservant une efficacité de calcul en fait un choix privilégié pour les
applications entre implémentations dans les véhicules autonomes.13) En
outre, l'intégration de la représentation éparse de VoxelNet lui permet de
traiter efficacement les grandes quantités de données que l'on trouve
couramment dans les scénarios de conduite autonome.
Le développement de VoxelNet représente une avancée significative dans le
traitement des données 3D et jette les bases des futures innovations en
matière de technologie de conduite autonome. Il permet de relever des
défis majeurs dans ce domaine en combinant une voxélisation efficace avec
des techniques avancées de codage des caractéristiques.14) Cela permet non
seulement d'améliorer la précision de la détection, mais aussi de mettre en
oeuvre des mesures d'application plus sophistiquées.
12) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Deep Learning for
3D Point Clouds : A Survey, IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
13) Wang, X., Cai, M., Sohel, F., Sang, N. et Chang, Z. (2021). Adversarial point cloud
perturbations against 3D object detection in autonomous driving systems ",
Neurocomputing, 466, 27-36.
14) Chen, W., Li, P. et Zhao, H. (2022). MSL3D : 3D object detection from monocular,
stereo and point cloud for autonomous driving (détection d'objets en 3D à partir de
nuages monoculaires, stéréoscopiques et de points pour la conduite autonome).
Neurocomputing, 494, 23-32.
10- -
VoxelNet repousse les limites du développement des systèmes de
perception 3D. Grâce à ses puissantes performances et à son approche
innovante, VoxelNet continue d' la recherche et le développement en cours
dans le domaine du traitement des nuages de points 3D et des systèmes
autonomes.15)
VoxelNet est un modèle innovant de détection d'objets en 3D qui traite les
données des nuages de points en les convertissant en grilles 3D (voxels).
Chaque voxel représente un point dans le nuage de points, ce qui permet
au modèle traiter plus efficacement les informations spatiales. VoxelNet
utilise ces informations détecter des objets et faire des prédictions.
'avantage de cette approche est qu'elle est efficace et rapide pour traiter de
grandes quantités de données de nuages de points.
3.2 PointNet
PointNet est une architecture révolutionnaire d'apprentissage en
profondeur qui révolutionne le traitement des données de nuages de points
3D en consommant directement des ensembles de points non ordonnés.
Contrairement aux méthodes traditionnelles qui nécessitent des entrées
structurées, PointNet utilise des fonctions de symétrie pour assurer
l'invariance de la permutation, en les relations spatiales entre les points de
sorte que la reste soit l' points d'entrée.
La principale innovation de PointNet est l'utilisation de perceptrons (MLPet
d' mise en commun maximale. Cette architecture permet d'agréger
efficacement les caractéristiques de chaque point dans une représentation
globale, ce qui est particulièrement utile pour des tâches telles que la
classification et la segmentation. Grâce à sa capacité à et avec précision de
grands points, est un modèle fondamental dans ce domaine et a inspiré de
nombreuses architectures ultérieures basées sur ses principes.
L'impact de PointNet va au-delà de la recherche universitaire et s'étend à
des applications pratiques dans des domaines tels que la conduite
autonome et la reconnaissance des robots. Par exemple, dans les systèmes
autonomes, PointNet a été utilisé pour traiter les données LiDAR afin
d'améliorer la détection d'objets et la navigation en identifiant et en
classant les objets d'un essai à l'autre.16) La conception de PointNet lui
permet de traiter efficacement les complexités associées aux données 3D,
telles que les occlusions et les variations dans la densité des points, ce qui
11- -
en fait un outil polyvalent dans les applications de vision par ordinateur.
Les progrès réalisés par PointNet ont conduit à l'adaptation de PointNet
dans une variété de contextes innovants. Par exemple, il a été appliqué à la
classification des données LiDAR aéroportées, améliorant ainsi la précision
et l'efficacité des opérations de télédétection.17) La capacité d'adaptation de
PointNet a également conduit à son intégration avec des réseaux
neuronaux basés sur la physique pour analyser la propagation des fissures.
15) Yang, Y., Chen, F., Wu, F., Zeng, D., Ji, Y. et Jing, X. (2020). Réseau d'apprentissage
sémantique multi-vues pour la détection d'objets 3D à partir de nuages de points.
Neurocomputing, 397, 477-485.
16) Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Deep Learning for
3D Point Clouds : A Survey, IEEE Transactions on Pattern Analysis and Machine
Intelligence, 43, 4338-4364.
17) Nong, X., Bai, W. et Liu, G. (2023). Airborne LiDAR point cloud classification using
PointNet++ network with full neighbourhood features. PLOS ONE, 18.
12- -
et des simulations de la dynamique des fluides, et il a été prouvé qu'il
permettait de résoudre des problèmes industriels complexes.18)
Pointnet continue de servir de référence dans le traitement des données 3D,
en faisant progresser de manière significative la capacité des modèles
d'apprentissage profond à traiter les données des nuages de points. Son
impact est évident tant dans les avancées théoriques que dans les
applications pratiques, ce qui démontre sa pertinence et son adaptabilité
continues dans le paysage évolutif de l'intelligence artificielle et de
l'apprentissage automatique.19)
PointNet est un modèle qui traiter directement des données de nuages de
points et reconnaître des objets dans l'espace 3D, quel que soit l'ordre de
chaque point. PointNet extrait les caractéristiques des points et effectue
une classification et une segmentation sur la base de ces caractéristiques.
Ce modèle peut gérer la nature non structurée des nuages de points et peut
être utilisé dans divers domaines tels que la conduite autonome, la
robotique et l'analyse d'images médicales.
3.3 PointRCNN
PointRCNN est un cadre important dans le domaine de la détection d'objets
en 3D, en particulier pour des applications telles que la conduite autonome.
Ce cadre utilise un processus de détection en deux étapes pour améliorer la
précision et l'efficacité de la détection d'objets dans les nuages de points 3D.
La première étape consiste à générer des suggestions d'objets par le biais
d'un réseau de suggestions locales basé sur des points. Cette étape est car
elle travaille directement sur les données brutes du nuage de points,
préservant ainsi les informations spatiales détaillées qui peuvent être
perdues dans les méthodes traditionnelles qui reposent sur les projections
d'images ou la voxélisation.
Dans la deuxième étape, PointRCNN affine la proposition initiale en
effectuant une boîte englobante 3D. Cette opération permet d'ajuster la
taille et l'orientation de la afin qu'elle corresponde mieux aux objets
détectés dans les données du nuage de points. En utilisant des
caractéristiques extraites directement du nuage de points brut, PointRCNN
atteint une plus grande précision dans la détection d' en particulier dans
des environnements difficiles avec une géométrie complexe et des
occlusions.
13- -
L'un des principaux avantages de PointRCNN est sa apprendre de bout en
bout. Cette architecture facilite l'intégration transparente des étapes du
réseau, améliorant non seulement les performances de détection du
modèle mais aussi son efficacité de calcul, ce qui le rend adapté aux
applications en temps réel, telles que celles requises pour les systèmes de
conduite autonome.
La recherche a montré que les méthodes utilisant des données de nuages
de points peuvent améliorer de manière significative la compréhension et
l'interprétation des scènes 3D dans les situations de conduite autonome.
Par exemple, l'utilisation d'algorithmes de détection multi-cibles basés sur
PointRCNN et les techniques de fusion de nuages de points voxels peuvent
être utilisés dans des scénarios dynamiques en raison de leur polyvalence et
de leur capacité à s'adapter à des situations particulières.
18) Kashefi, A. et Mukerji, T. (2022). Physics-informed PointNet : A deep learning
solver for steady-state incompressible flows and thermal fields on multiple sets of
irregular geometries. Journal of Computational Physics, 468, 111510.
19) Wang, L. et Huang, Y. (2022). Une étude des nuages de points 3D et des approches
basées sur l'apprentissage profond pour la compréhension de la scène dans la
conduite autonome. IEEE Intelligent Transportation Systems Magazine, 14, 135-154.
14- -
En outre, des études dans le domaine des nuages de points 3D et des
approches d'apprentissage profond l'importance croissante de ces cadres
pour la compréhension de la scène dans la conduite autonome.20)
Dans l'ensemble, PointRCNN représente une avancée significative dans la
technologie de détection d'objets en 3D. Sa capacité à traiter directement
les données brutes des points et son processus de détection efficace en
deux étapes en font un outil puissant pour l' conduite autonome, où la
rapide et précise objets est essentielle pour la sécurité et les performances.
PointRCNN est une technologie qui utilise un réseau neuronal convolutif
(CNN) basé sur PointNet pour la détection d'objets en 3D, et qui traite
efficacement les données des nuages de points détecter les objets avec
précision. PointRCNN est une technologie qui étend la méthode existante
de détection d'objets en 2D aux environnements en 3D, et qui est appliquée
à la reconnaissance d'objets de véhicules autonomes et à la reconnaissance
de l'environnement de robots.
4. Applications
Les PointRCNN jouent un rôle essentiel dans les systèmes de conduite
autonome et sont utilisés pour reconnaître et suivre avec précision les
objets dans l'environnement. objets à l'aide de points 3D peut aider les
véhicules à obstacles routiers avec une grande précision, même dans des
situations de trafic complexes.22)
Le robot utilise la technologie de détection d'objets en 3D pour interagir
avec l'environnement. PointRCNN permet au robot de comprendre son
environnement d'une course à l'autre et d'effectuer les actions
nécessaires.24)
Afin d'insérer de manière transparente des objets virtuels dans le monde
réel dans un environnement AR, une détection précise des objets dans
l'espace 3D est nécessaire. PointRCNN un rôle important dans cette tâche.
Les drones doivent être capables de reconnaître et d'éviter divers obstacles
pendant le vol. PointRCNN peut être utilisé pour détecter des objets en
temps réel à partir des données des capteurs du drone et définir une
trajectoire de vol sûre.25)
20) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
15- -
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
21) Wang, L. et Huang, Y. (2022). A Survey of 3D Point Cloud and Deep Learning-Based
Approaches for Scene Understanding in Autonomous Driving (Étude des nuages de
points 3D et des approches basées sur l'apprentissage profond pour la
compréhension de la scène dans la conduite autonome). IEEE Intelligent
Transportation Systems Magazine, 14, 135-154.
22) Qian, R., Lai, X. et Li, X. (2021). 3D Object Detection for Autonomous Driving :
Pattern Recognition, 130, 108796.
23) Mao, J., Shi, S., Wang, X. et Li, H. (2022). 3D Object Detection for Autonomous
Driving : A Comprehensive Survey, International Journal of Computer Vision, 131,
1909-1963.
24) Wang, L. et Huang, Y. (2022). A Survey of 3D Point Cloud and Deep Learning-Based
Approaches for Scene Understanding in Autonomous Driving (Étude des nuages de
points 3D et des approches basées sur l'apprentissage profond pour la
compréhension de la scène dans la conduite autonome). IEEE Intelligent
Transportation Systems Magazine, 14, 135-154.
25) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A.
(2019).
16- -
PointRCNN est appliqué à la modélisation 3D et à l'analyse des
environnements urbains, fournissant des informations importantes pour la
planification et la gestion urbaines. Cela contribuer à améliorer l'efficacité
des transports et à renforcer la sécurité dans les villes.
Dans ces applications, les PointRCNN sont très utiles dans les situations où
une grande précision et un traitement en temps réel sont nécessaires. La
recherche montre que techniques telles que les algorithmes de détection
multicibles basés sur les PointRCNN démontrent leurs performances et
leur efficacité dans ces applications.26) Les PointRCNN contribuent à
maximiser la précision et l'efficacité de la détection d'objets en 3D, ce qui
important pour l'avancement des véhicules autonomes et d'autres systèmes
avancés.
La technologie de traitement des données spatiales en 3D utilisée dans de
nombreux secteurs d'activité. Parmi les principales applications, citons
4.1 Véhicules autonomes
Les véhicules sont des véhicules qui utilisent une technologie avancée pour
se conduire sans intervention humaine. Ces véhicules utilisent une variété
de capteurs, de caméras, de radars, de LiDAR, etc. pour obtenir une
connaissance précise de leur environnement. Ces technologies, associées
au traitement des données en temps réel, sont essentielles pour déterminer
des itinéraires de conduite sûrs.
En particulier, la technologie de détection d'objets en 3D est un élément clé
des véhicules autonomes, jouant un rôle important dans la détection et la
reconnaissance précises d'objets autour du véhicule. PointRCNN, par
exemple, exploite les données des nuages de points pour permettre une
analyse à haute résolution de l'environnement d'un véhicule. Les véhicules
autonomes ainsi reconnaître en temps réel les piétons, les autres véhicules,
les panneaux de signalisation, etc. afin de garantir une conduite sûre.27)
Les véhicules autonomes également la capacité d'apprendre des modèles
de conduite et de s'adapter à différentes situations de conduite en
appliquant des technologies d'apprentissage automatique et d'intelligence
artificielle. Ces technologies contribuent améliorer la sécurité des
véhicules, leur efficacité et l'expérience des utilisateurs. En particulier, la
17- -
technologie de fusion multi-capteurs améliore la précision de la détection
d'objets en 3D, ce qui des performances fiables dans divers
environnements.28)
Enquête sur les méthodes de détection d'objets en 3D pour les applications de
conduite autonome. IEEE Transactions on Intelligent Transportation Systems, 20,
3782-3795.
26) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
27) Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022). Dynamic
Multitarget Detection Algorithm of Voxel Point Cloud Fusion Based on PointRCNN,
IEEE Transactions on Intelligent Transportation Systems, 23, 20707-20720.
28) Wang, X., Li, K. et Chehri, A. (2024). Multi-Sensor Fusion Technology for 3D Object
Detection in Autonomous Driving : A Review, IEEE Transactions on Intelligent
Transportation Systems, 25, 1148-1165.
18- -
Les véhicules autonomes un domaine clé de l'innovation dans les futurs
systèmes de transport grâce à la convergence d'algorithmes complexes et
de technologies de capteurs. Ces technologies un impact positif sur la
société dans son ensemble en réduisant embouteillages et les accidents de
la route, et en permettant une circulation plus efficace.29)
Les véhicules autonomes utilisent des capteurs LiDAR et une technologie
de détection d'objets en 3D pour percevoir et analyser l'environnement du
véhicule en temps réel. Cela permet d'éviter les obstacles, de reconnaître
les piétons, d'analyser les intersections, etcafin de maximiser la sécurité et
l'efficacité de la conduite du véhicule.
4.2 Soins de santé
Les techniques de détection d'objets en 3D dans le domaine médical, en
particulier celles telles que PointRCNN, large éventail d'applications
potentielles. Ces technologies sont principalement utilisées dans l'imagerie
médicale, la robotique chirurgicale, les systèmes de surveillance des
patients, etc.
La technologie de détection d'objets en 3D permet détecter avec précision
les lésions dans les images de tomodensitométrie, d'IRM et d'échographie.
Elle est particulièrement importante dans des domaines tels que la
radiologie, où elle peut être associée à des systèmes de diagnostic assistés
par ordinateur utilisant l'intelligence artificielle et l'apprentissage
automatique pour améliorer la précision du diagnostic.30)
Dans les systèmes de robotique chirurgicale, la technologie de détection
d'objets en 3D permet de reconnaître avec précision les tissus et organes
environnants pendant l'opération, ce qui contribue à garantir une chirurgie
sûre et précise. Associée aux progrès de l'intelligence artificielle médicale,
cette technologie peut grandement améliorer l'efficacité et la sécurité de la
chirurgie.31)
Les capteurs 3D et la technologie de détection d'objets peuvent analyser les
mouvements et les signes vitaux d'un patient en temps réel afin de détecter
les anomalies à un stade précoce. Ces technologies associées à des systèmes
de surveillance des patients basés sur l'intelligence artificielle pour suivre
et gérer en permanence l'état d'un patient.32)
19- -
Combinée à la réalité virtuelle (VR), elle pourrait être utilisée dans
l'enseignement et la formation médicale. Technologie de détection d'objets
en 3D
29) Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., & Mouzakitis, A.
(2019). Une enquête sur les méthodes de détection d'objets 3D pour les applications
de conduite autonome. IEEE Transactions on Intelligent Transportation Systems, 20,
3782-3795.
30) Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J., Sahiner, B.,
Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman, H., Huo, Z.,
Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers, R., Suzuki, K., ... &
Armato, S. (2022). Rapport 273 du groupe de travail de l'AAPM : Recommandations
sur les meilleures pratiques en matière d'IA et d'apprentissage automatique pour le
diagnostic assisté par ordinateur en imagerie médicale. Medical physics.
31) Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial intelligence in
healthcare : a mastery", Biotechnology and Genetic Engineering Reviews, None, 1-
50.
32) Almagharbeh, W. (2024). The impact of AI-based decision support systems on
nursing workflows in critical care units ", International nursing review, None.
[8] Wang, L., Chen, X., Zhang, L., Li, L., Huang, Y., Sun, Y. et Yuan, X. (2023). Artificial
intelligence in clinical decision support systems for oncology ", International
Journal of Medical Sciences, 20, 79-86.
20- -
joue un rôle important en aidant les médecins et les professionnels de la
santé à simuler des opérations chirurgicales et des diagnostics, ce qui
permet d'apprendre dans un environnement réaliste.33)
Ces applications contribuent à précision des diagnostics et des traitements
dans le domaine médical et à améliorer la sécurité générale. En particulier
la technologie de détection d'objets en 3D combinée à l'IA accélère
l'innovation dans les soins de santé et devient un outil important pour
améliorer la santé et la sécurité des patients. Ces études offrent de
nouvelles perspectives sur les implications commerciales, réglementaires
et sociétales de l'IA médicale.34)
Dans le domaine médical, le traitement des données spatiales en 3D utilisé
pour établir des diagnostics précis et planifier des interventions
chirurgicales. Les nuages de points issus de l'imagerie médicale 3D, tels
que les résultats de tomographies ou d'IRM, sont utilisés pour visualiser le
site chirurgical et mesurer son emplacement et sa taille exacts afin
d'améliorer la précision de l'opération.
4.3 Automatisation industrielle et robotique
Les technologies de détection d'objets en 3D, en particulier les modèles tels
que PointRCNN, révolutionnent le domaine de l'automatisation industrielle
et de la robotique. Ces technologies améliorent considérablement
l'efficacité et la précision dans un large éventail d'industries et jouent un
rôle important dans les domaines spécifiques suivants
La technologie de détection d'objets en 3D est essentielle pour que les
systèmes robotiques puissent reconnaître et trier les objets dans un
entrepôt. Elle permet aux robots de reconnaître avec précision des objets
de tailles et de formes différentes, ce qui leur permet d'effectuer des tâches
de déplacement et de tri efficaces. Ces technologies augmentent l'efficacité
des processus industriels et facilitent l'automatisation des systèmes
logistiques.35)
Lorsque des robots industriels assemblent automatiquement des pièces, la
détection d'objets en 3D augmente l'efficacité de l'assemblage en
reconnaissant la position et l'orientation exactes des pièces. Cela contribue
de manière significative à l'augmentation des taux de production et à la
réduction des taux de défauts, et un rôle important dans les
21- -
environnements de fabrication intelligents.36)
Ils sont utilisés pour inspecter la géométrie et les dimensions des produits à
l'aide de la technologie de numérisation 3D et un rôle important dans la
garantie de la qualité des produits, la détection précoce des défauts et la
réduction des coûts. Ces pièces automatisées
33) Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. et Li, Y. (2020). Artificial
Intelligence- Based Prediction of Lung Cancer Risk Using Nonimaging Electronic
Medical Records : Deep Learning Approach ", Journal of Medical Internet Research,
23.
34) Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial intelligence in
healthcare : a mastery", Biotechnology and Genetic Engineering Reviews, None, 1-
50.
35) Höfer, S., Bekris, K. E., Handa, A., Gamboa, J. C., Mozifian, M., Golemo, F., Atkeson,
C.,
Fox, D., Goldberg, K., Leonard, J., Liu, C., Peters, J., Song, S., Welinder, P. et White,
M. (2021). Sim2Real in Robotics and Automation : Applications and Challenges.
IEEE Transactions on Automation Science and Engineering, 18, 398-400.
36) Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. et Kim, H. (2021).
Learning-Based Automation of Robotic Assembly for Smart Manufacturing
(Automatisation basée sur l'apprentissage de l'assemblage robotisé pour une
fabrication intelligente). Proceedings of the IEEE, 109, 423-440.
22- -
Les systèmes d'inspection de la qualité augmentent la fiabilité des produits.37)
La technologie de détection d'objets en 3D est utilisée pour accroître la
sécurité des robots et des systèmes d'automatisation. Elle permet aux de
reconnaître les ou les proximité toute sécurité. Ces mécanismes de
sécurité contribuent à réduire les accidents dans les environnements
industriels.38)
Il est essentiel pour les véhicules autonomes ou les drones de détecter les
objets et de planifier leurs itinéraires. La technologie de détection d'objets
en 3D ces systèmes de fonctionner efficacement, d'éviter les obstacles et
d'effectuer des tâches de livraison en toute sécurité.39)
Dans ces domaines les technologies de détection d'objets en 3D stimulent
l'innovation dans l'automatisation industrielle, contribuant à accroître la
productivité, à réduire les coûts et à améliorer la sécurité. À l'avenir, ces
technologies continueront à faire partie intégrante de l'évolution de la
robotique et des systèmes d'automatisation. La recherche a montré que
l'application de ces technologies contribue de significative à
l'augmentation de l'efficacité des processus industriels et à la gestion de la
complexité des systèmes automatisés.40)
Dans le domaine de l'automatisation industrielle et de la robotique, le
traitement des données spatiales en 3D est utilisé pour accroître l'efficacité
des processus de fabrication et automatiser les contrôles de qualité. Les
robots utilisent des capteurs LiDAR ou des caméras 3D reconnaître les
produits, détecter les anomalies et aider à résoudre les problèmes de
qualité.
4.4 Systèmes de surveillance de la sécurité
Dans les systèmes de surveillance de la sécurité, la technologie de détection
d'objets en 3D un rôle important en fournissant des solutions de
surveillance et de sécurité efficaces dans divers environnements. Cette
technologie particulièrement importante dans des domaines tels que la
surveillance en temps réel, la détection des intrusions, la prévention des
incidents, l'analyse des données et l'établissement de rapports, ainsi que
l'intégration de l'intelligence artificielle.
Dotés de capacités de surveillance en temps réel, les systèmes de détection
23- -
d'objets en 3D utilisent des caméras et des capteurs pour analyser
l'environnement en temps réel. Cette analyse en temps réel permet une
reconnaissance précise des personnes, des véhicules et des objets, et
fournit des avertissements immédiats en cas de situation dangereuse. Cette
fonction est essentielle pour accroître la sécurité, en particulier dans les
environnements complexes tels que les routes et les aéroports.
En matière de détection d'intrusion, la technologie de détection d'objets en
3D est efficace pour détecter des mouvements ou des comportements
inhabituels dans une zone de sécurité spécifique. Elle permet de détecter
rapidement l'approche d'un intrus et de fournir au personnel de sécurité
des informations immédiates.
37) Wang, K., Zhou, J., Li, G., Hu, Y. et Hu, F. (2024). Automatisation industrielle et
qualité des produits : le rôle de la transformation robotique de la production.
Applied Economics.
38) Salcic, Z., Atmojo, U., Park, H., Chen, A. et Wang, K. (2019). Designing Dynamic
and Collaborative Automation and Robotics Software Systems, IEEE Transactions on
Industrial Informatics, 15, 540-549.
39) Nebot, E. (2018). La robotique : de l'automatisation aux systèmes intelligents,
ingénierie.
40) Mulaveesala, R., Arora, V., Dua, G., Morello, R. et Vavilov, V. (2022). Industrial
vision and automation. Science et technologie des mesures, 33.
24- -
Empêcher l'entrée non autorisée dans les zones sécurisées en émettant des
alertes rouges.
En termes de prévention des accidents, ces systèmes préviennent les
accidents dans divers environnements, y compris les sites industriels, en
détectant les dangers à un stade précoce et en émettant des avertissements.
Par exemple, un système d'alerte automatique déclenché lorsqu'un
travailleur s'approche d'une zone dangereuse afin d'éviter un accident.
Les capacités d'analyse des données et de création de rapports vous aident
à évaluer votre situation en matière de sécurité et à identifier les problèmes
grâce à des analyses ultérieures utilisant les données 3D collectées. Ces
analyses fournissent des informations importantes pour la stratégie de
sécurité future et amélioration continue de la sécurité.
Grâce à l'intégration de l'intelligence artificielle, la technologie de détection
d'objets en 3D peut être combinée à des algorithmes d'apprentissage
automatique pour créer un système de surveillance plus intelligent. Cela
système d'apprendre des modèles et de mettre en oeuvre des mécanismes
d'alerte et de réponse plus sophistiqués.
Ainsi, la technologie de détection d'objets en 3D devient partie intégrante
des systèmes de surveillance de la sécurité, contribuant à répondre à divers
besoins en matière de sécurité et à renforcer la sécurité des installations.
Ces technologies devraient encore évoluer à l'avenir, pour aboutir à des
solutions de surveillance de la sécurité plus sophistiquées et plus efficaces.
Ces avancées technologiques traduiront par des systèmes de sécurité plus
robustes, notamment grâce à l'intégration de l'intelligence artificielle.41)
La technologie de détection d'objets en 3D également un rôle important
dans les systèmes de surveillance de la sécurité. Les capteurs LiDAR et la
technologie de détection d'objets en 3D utilisés pour détecter les intrus ou
déterminer si des personnes se trouvent à proximité. Ils également
analyser des modèles de comportement dans l'espace 3D afin de suivre et
de prévenir les activités illégales.
25- -
41) Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. et Cao, E. (2023). An Infrared Small
Target Detection Method Based on a Weighted Human Visual Comparison
Mechanism for Safety Monitoring (Méthode de détection de petites cibles
infrarouges basée sur un mécanisme de comparaison visuelle humaine pondérée
pour la surveillance de la sécurité). Remote Sens, 15, 2922.
26- -
4.5 RV/AR
Dans la réalité virtuelle (RV) et la réalité augmentée (RA), la technologie de
détection d'objets en 3D améliore considérablement l'expérience de
l'utilisateur dans une variété d'industries. La détection d'objets en 3D
permet aux utilisateurs d'interagir avec des objets du monde réel dans des
environnements virtuels, ce qui est essentiel pour que les applications de
RA reconnaissent leur environnement en temps réel afin de placer et de
manipuler avec précision les éléments virtuels. L'expérience de l'utilisateur
est ainsi plus immersive.
Dans les environnements VR, la détection d'objets en 3D est utilisée pour
créer des simulations réalistes. Cela permet de créer des scénarios de
formation dans divers domaines, notamment médical, et aéronautique,
permettant aux participants d'expérimenter et de s'exercer en toute
sécurité à des situations de la vie réelle. L'application de la RV/RA, en
particulier dans le domaine de la sécurité de la construction, sensibilise les
travailleurs à la sécurité.42)
Dans l'industrie du jeu, la détection d'objets en 3D offre une expérience en
suivant avec précision les mouvements et la position du joueur. Cela
permet d'interagir avec des personnages virtuels, ce qui accroît le réalisme
du jeu.
Dans les domaines de l'architecture et de l'ingénierie, la technologie AR
peut être utilisée pour visualiser les modèles de conception dans le monde
réel. Cela de détecter à l'avance les erreurs dans le processus de
conception et de faciliter la communication avec les clients. Ces
applications peuvent être particulièrement synergiques avec la sécurité de
la construction.43)
La technologie AR aide les consommateurs à prendre des décisions d'achat
en leur permettant d'expérimenter virtuellement les produits. Par
exempleelle leur donne la possibilité de placer des meubles dans leur
maison ou d'essayer des couleurs de cosmétiques à l'avance. L'expérience
d'achat et l'interaction avec le consommateur s'en trouvent améliorées.44)
Ainsi, la technologie de détection d'objets en 3D offre des expériences
innovantes dans la RV et la RA, et est utilisée dans une variété d'industries.
À l'avenir, ces technologies continueront d'évoluer, rendant l'interaction
27- -
entre 'utilisateur et l'environnement virtuel encore plus transparente et
naturelle. L'utilisation de la technologie VR/AR dans l'éducation, le
divertissement, le commerce et bien d'autres domaines s'en encore élargie.
Dans le même tempsles progrès de ces technologies créeront de nouvelles
opportunités dans les secteurs du tourisme et de l'hôtellerie.45)
42) Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review of virtual
and augmented reality (VR/AR) applications in construction safety, Automation in
Construction, 86, 150-162.
43) Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review of virtual
and augmented reality (VR/AR) applications in construction safety, Automation in
Construction, 86, 150-162.
44) Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A. et Behl, A. (2023). The
persuasion effects of virtual reality (VR) and augmented reality (AR) video
advertisements : A conceptual review". Journal of Business Research.
45) Wei, W. (2019). Research progress on virtual reality (VR) and augmented reality
(AR) in tourism and hospitality ", Journal of Hospitality and Tourism Technology, 10,
539-570.
28- -
Dans la virtuelle (RV) et la réalité augmentée (RA), les données spatiales 3D
jouent un rôle important interaction avec les objets du monde réel. Les
données spatiales 3D placer correctement les objets virtuels dans le monde
réel et permettent aux utilisateurs d'interagir avec eux de manière naturelle.
5. Conclusion
technologie de traitement des données spatiales en 3D révolutionne de
nombreux domaines, notamment la conduite autonome, les soins de santé,
l'industrie, la sécurité et la RV/AR. En particulier les capteurs LiDAR et les
technologies de détection d'objets en 3D jouent un rôle important dans
chacun de ces domaines, contribuant à l'analyse environnementale en
temps réel, à la précision des diagnostics et des traitements, et à l'efficacité
des systèmes d'automatisation. Ces technologies d'évoluer et d'enrichir
l'expérience des utilisateurs dans divers domaines.
29- -
Références
1. Abbasi, R., Bashir, A., Alyamani, H. J., Amin, F., Doh, J. et Chen, J. (2023).
Lidar Point Cloud Compression, Processing and Learning for Autonomous
Driving (Compression, traitement et apprentissage de nuages de points
Lidar pour la conduite autonome). IEEE Transactions on Intelligent
Transportation Systems, 24, 962-979.
2. Arnold, E., Al-Jarrah, O. Y., Dianati, M., Fallah, S., Oxtoby, D., &
Mouzakitis, A. (2019). Une enquête sur les méthodes de détection d'objets
3D pour les applications de conduite autonome. IEEE Transactions on
Intelligent Transportation Systems, 20, 3782-3795.
3. Bai, X., Zhou, J., Ning, X. et Wang, C. (2022). 3D data computation and
visualisation. Displays, 73, 102169.
4. Beam, A. L., Drazen, J. M., Kohane, I. S., Leong, T., Manrai, A. et Rubin,
E. J. (2023). Artificial Intelligence in Medicine. New England Journal of
Medicine, 388(13), 1220-1221.
5. Campilho, R., & Silva, F. J. G. (2023). Amélioration des processus
industriels par l'automatisation et la robotique, Machines.
6. Cao, M. et Wang, J. (2020). Obstacle Detection for Autonomous Driving
Vehicles With Multi-LiDAR Sensor Fusion (Détection d'obstacles pour les
véhicules à conduite autonome avec fusion de capteurs multi-LiDAR).
Journal of Dynamic Systems Measurement and Control - Transactions of
the ASME, 142.
7. Chen, W., Li, P. et Zhao, H. (2022). MSL3D : 3D object detection from
monocular, stereo and point cloud for autonomous driving (détection
d'objets en 3D à partir de nuages monoculaires, stéréoscopiques et de
points pour la conduite autonome). Neurocomputing, 494, 23-32.
8. Chen, Y., Wang, H., Pang, Y., Han, J., Mou, E. et Cao, E. (2023). An
Infrared Small Target Detection Method Based on a Weighted Human
Visual Comparison Mechanism for Safety Monitoring (Méthode de
détection de petites cibles infrarouges basée sur un mécanisme de
comparaison visuelle humaine pondérée pour la surveillance de la
sécurité). Remote Sens, 15, 2922.
9. Dzikunoo, E., Vignoli, G., Jørgensen, F., Yidana, S. et Banoeng-Yakubo,
B. (2020). New regional stratigraphic insights from a 3D geological model of
the Nasia sub-basin, Ghana, developed for hydrogeological purposes and
based on reprocessed B-field data originally collected for mineral
exploration. Solid Earth, 11, 349-361.
10. Enríquez, J. G., Ramirez, A. J., Domínguez-Mayo, F. J. et García-García,
J. A. (2020). Robotic Process Automation : A Scientific and Industrial
30- -
Systematic Mapping Study ", IEEE Access, 8, 39113-39129.
11. Fan, L., Yang, Y., Wang, F., Wang, N. et Zhang, Z. (2023). Super Sparse
3D Object Detection. IEEE Transactions on Pattern Analysis and Machine
Intelligence, 45, 12490-12505.
12. Fernandes, D., Silva, A., Névoa, R., Simões, C., Gonzalez, D. G., Guevara,
M., Novais, P., Monteiro, J., Melo-Pinto, P. et Melo-Pinto, P. (2021). Pointcloud
based 3D object detection and classification methods for self-driving
applications : A survey and taxonomy", Information Fusion, 68, 161-191.
13. Guo, Y., Wang, H., Hu, Q., Liu, H., Liu, L. et Bennamoun (2019). Profond
31- -
Learning for 3D Point Clouds : A Survey ", IEEE Transactions on Pattern
Analysis and Machine Intelligence, 43, 4338-4364.
14. Hadjiiski, L. M., Cha, K. H., Chan, H., Drukker, K., Morra, L., Näppi, J.,
Sahiner, B., Yoshida, H., Chen, Q., Deserno, T., Greenspan, H., Huisman,
H., Huo, Z., Mazurchuk, R., Petrick, N., Regge, D., Samala, R. K., Summers,
R., Suzuki, K.,
... & Armato, S. (2022). Rapport 273 du groupe de travail de l'AAPM :
Recommandations sur les meilleures pratiques pour l'IA et l'apprentissage
automatique pour le diagnostic assisté par ordinateur en imagerie médicale.
Medical physics.
15. Huang, S. (2019). Augmented reality and virtual reality : the power of
AR and VR for business ", Information Technology and Tourism, 21, 457-
459.
16. Ji, S., Lee, S., Yoo, S., Suh, I., Kwon, I., Park, F., Lee, S. et Kim, H. (2021).
Learning-Based Automation of Robotic Assembly for Smart Manufacturing
(Automatisation basée sur l'apprentissage de l'assemblage robotisé pour
une fabrication intelligente). Proceedings of the IEEE, 109, 423-440.
17. Jayawardena, N. S., Thaichon, P., Quach, S., Razzaq, A. et Behl, A.
(2023). The persuasion effects of virtual reality (VR) and augmented reality
(AR) video advertisements : A conceptual review". Journal of Business
Research.
18. Kim, E. Y., Shin, S. Y., Lee, S., Lee, K., Lee, K. H. et Lee, K. M. (2020).
Triplanar convolution with shared 2D kernels for 3D classification and
shape retrieval ", Computer Vision and Image Understanding, 193, 102901.
19. Kim, J., Kim, M., Park, M. et Yoo, J. (2022). Technologies interactives
immersives et expériences d'achat virtuelles : Differences in consumer
perceptions between augmented reality (AR) and virtual reality (VR).
Telematics and Informatics, 77, 101936.
20. Kusiak, A. (2023). Hyper-automation in manufacturing industry, J.
Intell. Manuf. 35, 1-2.
21. Li, X., Yi, W., Chi, H., Wang, X. et Chan, A. P. C. (2018). A critical review
of virtual and augmented reality (VR/AR) applications in construction
safety, Automation in Construction, 86, 150-162.
22. Luo, X., Zhou, F., Tao, C., Yang, A., Zhang, P. et Chen, Y. (2022).
Dynamic Multitarget Detection Algorithm of Voxel Point Cloud Fusion
Based on PointRCNN, IEEE Transactions on Intelligent Transportation
Systems, 23, 20707-20720.
23. Mao, J., Shi, S., Wang, X. et Li, H. (2022). 3D Object Detection for
Autonomous Driving : A Comprehensive Survey, International Journal of
Computer Vision, 131, 1909-1963.
32- -
24. Mulaveesala, R., Arora, V., Dua, G., Morello, R. et Vavilov, V. (2022).
Industrial vision and automation. Science et technologie des mesures, 33.
25. Mukherjee, J., Sharma, R., Dutta, P. et Bhunia, B. (2023). Artificial
intelligence in healthcare : a mastery", Biotechnology and Genetic
Engineering Reviews, None, 1-50.
26. Nebot, E. (2018). La robotique : de l'automatisation aux systèmes
intelligents, ingénierie.
27. Ren, S., Pan, X., Zhao, W., Nie, B., & Han, B. (2022),
Dynamic graph
33- -
pour la détection d'objets en 3D. Knowledge-Based Systems, 259, 110085.
28. Song, S., Huang, T., Zhu, Q. et Hu, H. (2023). ODSPC : deep learningbased
3D object detection using semantic point cloud", Visual Computer, ,
1-15.
29. Wei, W. (2019). Research progress on virtual reality (VR) and
augmented reality (AR) in tourism and hospitality ", Journal of Hospitality
and Tourism Technology, 10, 539-570.
30. Xue, Z., Wu, S., Li, M. et Cheng, K. (2024). A Novel Method for Regional
Prospecting Based on Modern 3D Graphics (Nouvelle méthode de
prospection régionale basée sur des graphiques 3D modernes) Minerals.
31. Yeh, M. C., Wang, Y., Yang, H., Bai, K., Wang, H. et Li, Y. (2020).
Artificial Intelligence-Based Prediction of Lung Cancer Risk Using
Nonimaging Electronic Medical Records : Deep Learning Approach ",
Journal of Medical Internet Research, 23.
32. Zhou, Q. (2022). Détection et diagnostic assistés par
ordinateur/radiomique/apprentissage machine/apprentissage profond en
imagerie médicale. Medical Physics.