ImageNet

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

ImageNet ist eine Datenbank von Bildern, welche für Forschungsprojekte eingesetzt wird. Jedes Bild wird einem Substantiv zugeordnet. Die Substantive sind durch das WordNet-Projekt hierarchisch angeordnet. Zu jedem Substantiv gibt es im Schnitt mehr als 500 Bilder. In mehr als 14 Millionen Bildern wurde vom Projekt von Hand dokumentiert, welche Objekte abgebildet sind. In mindestens einer Million der Bilder sind diese Objekte umrahmt. ImageNet enthält mehr als 20.000 Kategorien in englischer Sprache mit einer typischen Kategorie wie z. B. „Ballon“ oder „Erdbeere“. Jede dieser Kategorien besteht jeweils aus mehreren hundert Bildern. Die Datenbank mit Anmerkungen zu Bild-URLs von Drittanbietern ist direkt über ImageNet frei zugänglich, obwohl die eigentlichen Bilder nicht im Besitz von ImageNet sind.

Seit 2010 veranstaltet das ImageNet-Projekt jährlich einen Software-Wettbewerb, den ImageNet Large Scale Visual Recognition Challenge (ILSVRC).[1][2] Hier wetteifern Softwaresysteme aus dem Bereich Deep Learning und Objekterkennung um die korrekte Klassifizierung und Erkennung von Objekten und Szenen. Die Anforderung in diesem Wettbewerb verwendet eine verkleinerte Liste von tausend nicht überlappenden Klassen.[3]

ImageNet wurde 2009 auf der IEEE Conference on Computer Vision and Pattern Recognition (CVPR) erstmals veröffentlicht und wird zum Trainieren von Convolutional Neural Networks verwendet.[4]

Wörter werden zu sog. synsets (engl. synonym sets), also Mengen von Synonymen zusammengefasst. Es gibt 21841 nicht-leere Synonymmengen. Insgesamt sind 14.197.122 Bilder in ImageNet.[5][6]

  • Jia Deng, Wei Dong, R. Socher, Li-Jia Li, Kai Li, Li Fei-Fei: ImageNet: A large-scale hierarchical image database. In: CVPR 2009 – IEEE Conference on Computer Vision and Pattern Recognition, 2009. Juni 2009, S. 248–255, doi:10.1109/CVPR.2009.5206848 (englisch).
  • Fei-Fei Li: How we're teaching computers to understand pictures. [1] Vortrag auf TED.
  • Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton: Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems 25 (2012): 1097-1105.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. ImageNet Large Scale Visual Recognition Competition (ILSVRC). Abgerufen am 29. Januar 2019 (englisch).
  2. Olga Russakovsky, Jia Deng, Hao Su, Jonathan Krause, Sanjeev Satheesh: ImageNet Large Scale Visual Recognition Challenge. In: arXiv:1409.0575 [cs]. 1. September 2014, arxiv:1409.0575 [abs].
  3. kaggle: ImageNet Object Localization Challenge. Abgerufen am 29. Januar 2019 (englisch).
  4. Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton: ImageNet Classification with Deep Convolutional Neural Networks. (PDF) Abgerufen am 29. Januar 2019 (englisch).
  5. Statistics (Memento vom 19. Oktober 2015 im Internet Archive); abgerufen am 4. März 2024.
  6. Computer schreiben Bildlegenden. Abgerufen am 25. Oktober 2015.