Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

mean average precision
Recently Published Documents


TOTAL DOCUMENTS

48
(FIVE YEARS 33)

H-INDEX

3
(FIVE YEARS 1)

Author(s):  
Kaixuan Cui ◽  
Shuchai Su ◽  
Jiawei Cai ◽  
Fengjun Chen

To realize rapid and accurate ripeness detection for walnut on mobile terminals such as mobile phones, we propose a method based on coupling information and lightweight YOLOv4. First, we collected 50 walnuts at each ripeness (Unripe, Mid-ripe, Ripe, Over-ripe) to determine the kernel oil content. Pearson correlation analysis and one-way analysis of variance (ANOVA) prove that the division of walnut ripeness reflects the change in kernel oil content. It is feasible to estimate the kernel oil content by detecting the ripeness of walnut. Next, we achieve ripeness detection based on lightweight YOLOv4. We adopt MobileNetV3 as the backbone feature extractor and adopt depthwise separable convolution to replace the traditional convolution. We design a parallel convolution structure with depthwise convolution stacking (PCSDCS) to reduce parameters and improve feature extraction ability. To enhance the model’s detection ability for walnuts in the growth-intensive areas, we design a Gaussian Soft DIoU non-maximum suppression (GSDIoU-NMS) algorithm. The dataset used for model optimization contains 3600 images, of which 2880 images in the training set, 320 images in the validation set, and 400 images in the test set. We adopt a multi-training strategy based on dynamic learning rate and transfer learning to get training weights. The lightweight YOLOv4 model achieves 94.05%, 90.72%, 88.30%, 76.92 FPS, and 38.14 MB in mean average precision, precision, recall, average detection speed, and weight capacity, respectively. Compared with the Faster R-CNN model, EfficientDet-D1 model, YOLOv3 model, and YOLOv4 model, the lightweight YOLOv4 model improves 8.77%, 4.84%, 5.43%, and 0.06% in mean average precision, 74.60 FPS, 55.60 FPS, 38.83 FPS, and 46.63 FPS in detection speed, respectively. And the lightweight YOLOv4 is 84.4% smaller than the original YOLOv4 model in terms of weight capacity. This paper provides a theoretical reference for the rapid ripeness detection of walnut and exploration for the model’s lightweight.


2022 ◽  
Vol 14 (2) ◽  
pp. 254
Author(s):  
Minjing Shi ◽  
Pengfei He ◽  
Yuli Shi

In this paper, we propose a deep learning-based model to detect extratropical cyclones (ETCs) of the northern hemisphere, while developing a novel workflow of processing images and generating labels for ETCs. We first labeled the cyclone center by adapting an approach from Bonfanti et al. in 2017 and set up criteria of labeling ETCs of three categories: developing, mature, and declining stages. We then gave a framework of labeling and preprocessing the images in our dataset. Once the images and labels were ready to serve as inputs, an object detection model was built with Single Shot Detector (SSD) and adjusted to fit the format of the dataset. We trained and evaluated our model with our labeled dataset on two settings (binary and multiclass classifications), while keeping a record of the results. We found that the model achieves relatively high performance with detecting ETCs of mature stage (mean Average Precision is 86.64%), and an acceptable result for detecting ETCs of all three categories (mean Average Precision 79.34%). The single-shot detector model can succeed in detecting ETCs of different stages, and it has demonstrated great potential in the future applications of ETC detection in other relevant settings.


2022 ◽  
Vol 11 (01) ◽  
pp. 22-26
Author(s):  
Hui Xiang ◽  
Junyan Han ◽  
Hanqing Wang ◽  
Hao Li ◽  
Shangqing Li ◽  
...  

Aiming at the problems of low detection accuracy and poor recognition effect of small-scale targets in traditional vehicle and pedestrian detection methods, a vehicle and pedestrian detection method based on improved YOLOv4-Tiny is proposed. On the basis of YOLOv4-Tiny, the 8-fold down sampling feature layer was added for feature fusion, the PANet structure was used to perform bidirectional fusion for the deep and shallow features from the output feature layer of backbone network, and the detection head for small targets was added. The results show that the mean average precision of the improved method has reached 85.93%, and the detection performance is similar to that of YOLOv4. Compared with the YOLOv4-Tiny, the mean average precision of the improved method is increased by 24.45%, and the detection speed reaches 67.83FPS, which means that the detection effect is significantly improved and can meet the real-time requirements.


2021 ◽  
Vol 13 (22) ◽  
pp. 4675
Author(s):  
William Yamada ◽  
Wei Zhao ◽  
Matthew Digman

An automatic method of obtaining geographic coordinates of bales using monovision un-crewed aerial vehicle imagery was developed utilizing a data set of 300 images with a 20-megapixel resolution containing a total of 783 labeled bales of corn stover and soybean stubble. The relative performance of image processing with Otsu’s segmentation, you only look once version three (YOLOv3), and region-based convolutional neural networks was assessed. As a result, the best option in terms of accuracy and speed was determined to be YOLOv3, with 80% precision, 99% recall, 89% F1 score, 97% mean average precision, and a 0.38 s inference time. Next, the impact of using lower-cost cameras was evaluated by reducing image quality to one megapixel. The lower-resolution images resulted in decreased performance, with 79% precision, 97% recall, 88% F1 score, 96% mean average precision, and 0.40 s inference time. Finally, the output of the YOLOv3 trained model, density-based spatial clustering, photogrammetry, and map projection were utilized to predict the geocoordinates of the bales with a root mean squared error of 2.41 m.


Entropy ◽  
2021 ◽  
Vol 23 (11) ◽  
pp. 1507
Author(s):  
Feiyu Zhang ◽  
Luyang Zhang ◽  
Hongxiang Chen ◽  
Jiangjian Xie

Deep convolutional neural networks (DCNNs) have achieved breakthrough performance on bird species identification using a spectrogram of bird vocalization. Aiming at the imbalance of the bird vocalization dataset, a single feature identification model (SFIM) with residual blocks and modified, weighted, cross-entropy function was proposed. To further improve the identification accuracy, two multi-channel fusion methods were built with three SFIMs. One of these fused the outputs of the feature extraction parts of three SFIMs (feature fusion mode), the other fused the outputs of the classifiers of three SFIMs (result fusion mode). The SFIMs were trained with three different kinds of spectrograms, which were calculated through short-time Fourier transform, mel-frequency cepstrum transform and chirplet transform, respectively. To overcome the shortage of the huge number of trainable model parameters, transfer learning was used in the multi-channel models. Using our own vocalization dataset as a sample set, it is found that the result fusion mode model outperforms the other proposed models, the best mean average precision (MAP) reaches 0.914. Choosing three durations of spectrograms, 100 ms, 300 ms and 500 ms for comparison, the results reveal that the 300 ms duration is the best for our own dataset. The duration is suggested to be determined based on the duration distribution of bird syllables. As for the performance with the training dataset of BirdCLEF2019, the highest classification mean average precision (cmAP) reached 0.135, which means the proposed model has certain generalization ability.


2021 ◽  
Vol 1 ◽  
pp. 61-70
Author(s):  
Windra Swastika ◽  
Marcellino Agustinus Sinaga

Peran film sebagai industri budaya merupakan salah satu faktor yang dianggap penting bagi Indonesia. Film harus benar–benar diperhatikan dan dilindungi agar tidak berbalik menjadi pengaruh negatif yang tidak sesuai dan mengakibatkan kemunduran bagi negara Indonesia. Rating usia dari sebuah film merupakan solusi untuk masalah tersebut. Rating usia menunjukkan sentimen pada film tersebut negatif atau positif terutama untuk anak-anak. Pada penelitian ini akan dibuat sebuah sistem untuk mendeteksi objek pada film menggunakan You Only Look Once (YOLO). YOLO digunakan untuk mendapatkan data dari objek yang terdeteksi pada film yaitu untuk objek pistol, pisau, dan rokok dengan jumlah iterasi 50.000. Hasil dari YOLO Mean Average Precision (mAP) adalah 67,14%.


2021 ◽  
Author(s):  
Βασίλειος Κοψαχείλης

Η διάθεση των κατάλληλων εργαλείων σε επαγγελματίες, επιστήμονες και άλλους γιατην υποστήριξη της αναζήτησης γεωγραφικών δεδομένων στον ιστό και την εφαρμογήπρακτικών ενσωμάτωσής τους είναι βασική προϋπόθεση για την ολοκλήρωση πολλών εργασιών, όπως η δημιουργία χαρτών και η χωρική ανάλυση. Νέοι τρόποι δημοσίευσηςσημασιολογικά εμπλουτισμένων δεδομένων στον ιστό, σύμφωνα με τις αρχές των συνδεδεμένων δεδομένων (Linked Data), έχουν οδηγήσει στη δημιουργία ενός μοναδικού,παγκόσμιου και διασυνδεδεμένου ιστού δεδομένων (Web of Data), ο οποίος διευκολύνειτην πρόσβαση, επεξεργασία και ενσωμάτωση μεγάλων ποσοτήτων δεδομένων από διαφορετικές πηγές και παρέχει προηγμένες δυνατότητες αναζήτησης και επερωτήσεων. Σε αυτήν την έρευνα, διερευνούμε το πρόβλημα της εύρεσης σχετιζόμενων γεωγραφικών δεδομένων στον ιστό δεδομένων. Συγκεκριμένα, προτείνουμε μία μεθοδολογία αναζήτησηςσυνόλων δεδομένων για την ανακάλυψη συνδέσμων (dataset recommendation for linkdiscovery), η οποία προτείνει, σε ένα δοσμένο σύνολο δεδομένων, άλλα σύνολα δεδομένων του ιστού δεδομένων που ενδέχεται να περιέχουν σχετικές οντότητες, δηλαδήοντότητες που περιγράφουν σημασιολογικά κοντινά ή ίδια γεωγραφικά αντικείμενα τουπραγματικού κόσμου. Τα προτεινόμενα σύνολα δεδομένων μπορούν εκ των υστέρωννα χρησιμοποιηθούν ως είσοδος σε μία διαδικασία ανακάλυψης συνδέσμων (link discovery) για τη δημιουργία των συνδέσμων (π.χ. sameAs) μεταξύ των σχετικών οντοτήτων.Σε αντίθεση με τις υφιστάμενες μεθοδολογίες, οι οποίες προτείνουν σχετικά σύνολαδεδομένων με βάση την ομοιότητα των αλφαριθμητικών και της δομής τους ή την αξιοποίηση υφιστάμενων συνδέσμων μεταξύ τους, προσεγγίζουμε το πρόβλημα από μίαγεωγραφική οπτική, θεμελιώνοντας την υπόθεση ότι ‘σύνολα δεδομένων των οποίων οιοντότητες παρουσιάζουν παρόμοια χωρική κατανομή είναι πιθανό να περιέχουν σημασιολογικά σχετιζόμενες οντότητες’. Για να υποστηρίξουμε την υπόθεσή μας, υλοποιήσαμεμία πρακτική λύση, η οποία έχει εφαρμογή σε κλίμακα διαδικτύου και αρχικά δημιουργείσυνόψεις σε γεωγραφικά χαρακτηριστικά (σημειακές οντότητες) των χωρικών συνόλωνδεδομένων που παρέχονται μέσω SPARQL endpoints και στη συνέχεια εφαρμόζει μετρικέςγια τον υπολογισμό της ομοιότητάς τους. Οι συνόψεις αποτυπώνουν γεωγραφικά χαρακτηριστικά των συνόλων δεδομένων, όπως η χωρική τους έκταση και η χωρική κατανομήτων οντοτήτων τους. Διάφορες μετρικές που βασίζονται στην ομοιότητα συνόλων, στηστατιστική και στη θεωρία πληροφορίας, εφαρμόζονται στις συνόψεις των συνόλων δεδομένων για τον υπολογισμό ενός βαθμού γεωγραφικής ομοιότητας συνόλων δεδομένων.΄Ενας αλγόριθμος αναζήτησης ταξινομεί τα προτεινόμενα σύνολα δεδομένων σύμφωνα μετη γεωγραφική τους ομοιότητα, έτσι ώστε στην κορυφή της ταξινομημένης λίστας ναβρίσκονται τα σύνολα δεδομένων που είναι πιο πιθανό να περιέχουν σχετικές οντότητες με το επερωτώμενο αρχικό σύνολο δεδομένων. Διεξαγάγαμε πειράματα για την αξιολόγηση της αποτελεσματικότητας και αποδοτικότητας της μεθοδολογίας αναζήτησηςσυνόλων δεδομένων για την ανακάλυψη συνδέσμων. Σύμφωνα με τα αποτελέσματατων πειραμάτων, ο προτεινόμενος αλγόριθμος αναζήτησης παράγει ταξινομημένες λίστεςσυνόλων δεδομένων με 62% μέση ακρίβεια (Mean Average Precision), περίπου 35% υψηλότερης σε σύγκριση με απλούς εναλλακτικούς αλγόριθμους. Επίσης, μειώνει περίπουκατά 99% τον χώρο αναζήτησης για σχετικά σύνολα δεδομένων στον ιστό δεδομένων μετη χρήση αποδοτικών τεχνικών. Μία πρόσθετη συνεισφορά της εργασίας μας αφορά τηνανάπτυξη μεθόδων που παρέχουν ενιαία πρόσβαση στο σύνολο του ιστού δεδομένων καιτην παραγωγή αναφορών σχετικά με το μέγεθος και την κατάσταση του γεωγραφικούσημασιολογικού ιστού (Semantic Web) που δείχνουν ότι περίπου το 39% των συνόλωνδεδομένων του σημασιολογικού ιστού περιέχουν γεωαναφερμένη πληροφορία. Επιπλέον,προτείνουμε το GeoVoID, ένα πρότυπο μεταδεδομένων για την περιγραφή γεωγραφικώνχαρακτηριστικών των συνόλων δεδομένων όπως η χωρική τους έκταση, οι χωρικές οντολογίες που χρησιμοποιούνται και ο αριθμός των γεωγραφικών τους οντοτήτων. Το αποτέλεσμα της έρευνάς μας πραγματώνεται σε μία διαδικτυακή εφαρμογή που ονομάζεται GeoLOD και αποτελεί έναν ενδελεχή κατάλογο χωρικών συνόλων δεδομένων στον σημασιολογικό ιστό και μία online μηχανή αναζήτησης συνόλων δεδομένων για την ανακάλυψησυνδέσμων. Η GeoLOD επιτρέπει την αναζήτηση συνόλων δεδομένων μέσω χάρτη καιπαρέχει καινοτόμες λειτουργίες όπως η ζωντανή προεπισκόπηση των περιεχομένων τωνσυνόλων δεδομένων σε διαδραστικό χάρτη, η εξαγωγή αρχείων ρυθμίσεων για άμεσηχρήση από τα λογισμικά ανακάλυψης συνδέσμων Silk και LIMES και η on-the-fly πρόταση συνόλων δεδομένων για την ανακάλυψη συνδέσμων για σύνολα δεδομένων πουπαρέχονται από άγνωστα SPARQL endpoints και σε συμβατή με τα Γεωγραφικά Πληροφοριακά Συστήματα (ΓΠΣ) μορφή (π.χ. Shapefile). Η χρησιμότητα της GeoLOD για τουςεπαγγελματίες ΓΠΣ και τους ειδικούς σε θέματα συνδεδεμένων δεδομένων επιβεβαιώνεται από τα αποτελέσματα μίας διεξαχθείσας μελέτης χρηστών.


2021 ◽  
Author(s):  
Najmath Ottakath ◽  
Abdulla Al-Ali ◽  
Somaya Al Maadeed

Vehicles are a common sight on the road. Tracking and monitoring suspicious vehicles for identification due to high similarity in structure and form leads to difficulties in differentiating between them. The unique identity of a vehicle, the license plate is used here for this purpose. License plate detection is considered as an object detection task. Transfer learning on pre-trained state of art object detection models is an approach, which can perform this with better accuracy in terms of mean average precision. However, setting the right hyper-parameters needs multiple experiments. In this research, an evolutionary algorithm, genetic algorithm is used, which can optimize the hyper-parameters to achieve the best accuracy for the object detection model, YOLOv5. Further, the license plate was identified using OCR. This study concluded that hyper-parameter tuning achieved high accuracy in terms of mean average precision, achieving 98.25%, compared to 80% in initial parameter set providing an automated optimization. This license plate detected can be stored in a secure location and retrieved for re-identification. A decentralized storage or a secure cloud can be used to store the license plate. The application of this is most relevant to surveillance in high security locations where suspicious vehicles must be tracked.


2021 ◽  
Vol 72 (5-6) ◽  
pp. 285-290
Author(s):  
Susan Illing

Zusammenfassung Die in diesem Artikel vorgestellte Bachelorarbeit behandelt die Ergebnisse einer Shared Task im Bereich eHealth. Es wird untersucht, ob die Klassifikationsgenauigkeit ausgewählter klinischer Codiersysteme durch den Einsatz von Ensemble-Methoden verbessert werden kann. Entscheidend dafür sind die Werte der Evaluationsmaße Mean Average Precision und F1-Maß.


Drones ◽  
2021 ◽  
Vol 5 (3) ◽  
pp. 95
Author(s):  
Subroto Singha ◽  
Burchan Aydin

Drones are increasing in popularity and are reaching the public faster than ever before. Consequently, the chances of a drone being misused are multiplying. Automated drone detection is necessary to prevent unauthorized and unwanted drone interventions. In this research, we designed an automated drone detection system using YOLOv4. The model was trained using drone and bird datasets. We then evaluated the trained YOLOv4 model on the testing dataset, using mean average precision (mAP), frames per second (FPS), precision, recall, and F1-score as evaluation parameters. We next collected our own two types of drone videos, performed drone detections, and calculated the FPS to identify the speed of detection at three altitudes. Our methodology showed better performance than what has been found in previous similar studies, achieving a mAP of 74.36%, precision of 0.95, recall of 0.68, and F1-score of 0.79. For video detection, we achieved an FPS of 20.5 on the DJI Phantom III and an FPS of 19.0 on the DJI Mavic Pro.


Export Citation Format

Share Document